هوش داده افلاطون
جستجوی عمودی و هوش مصنوعی

از یادگیری ماشینی بدون نوشتن یک خط کد با Amazon SageMaker Canvas | استفاده کنید خدمات وب آمازون

تاریخ:

در گذشته نه چندان دور، استفاده از یادگیری ماشین (ML) برای پیش‌بینی، به‌ویژه برای داده‌ها در قالب متن و تصویر، به دانش گسترده ML برای ایجاد و تنظیم مدل‌های یادگیری عمیق نیاز داشت. امروزه، ML برای هر کاربری که می‌خواهد از مدل‌های ML برای ایجاد ارزش تجاری استفاده کند، در دسترس‌تر شده است. با آمازون SageMaker Canvas، می توانید پیش بینی هایی برای تعدادی از انواع داده های مختلف فراتر از داده های جدولی یا سری زمانی بدون نوشتن یک خط کد ایجاد کنید. این قابلیت ها شامل مدل های از پیش آموزش دیده برای انواع داده های تصویر، متن و سند است.

در این پست، نحوه استفاده از مدل‌های از پیش آموزش‌دیده را برای بازیابی پیش‌بینی‌های انواع داده‌های پشتیبانی شده فراتر از داده‌های جدولی مورد بحث قرار می‌دهیم.

داده های متنی

SageMaker Canvas یک محیط بصری و بدون کد برای ساخت، آموزش و استقرار مدل‌های ML فراهم می‌کند. برای وظایف پردازش زبان طبیعی (NLP)، SageMaker Canvas به طور یکپارچه با درک آمازون به شما امکان می دهد قابلیت های کلیدی NLP مانند تشخیص زبان، تشخیص موجودیت، تجزیه و تحلیل احساسات، مدل سازی موضوع و موارد دیگر را انجام دهید. این ادغام نیاز به هر گونه کدنویسی یا مهندسی داده را برای استفاده از مدل های قوی NLP Amazon Comprehend از بین می برد. شما به سادگی داده های متنی خود را ارائه می دهید و از بین چهار قابلیت رایج استفاده می کنید: تجزیه و تحلیل احساسات، تشخیص زبان، استخراج موجودیت ها و تشخیص اطلاعات شخصی. برای هر سناریو، می توانید از رابط کاربری برای آزمایش و استفاده از پیش بینی دسته ای برای انتخاب داده های ذخیره شده در سرویس ذخیره سازی ساده آمازون (Amazon S3).

تجزیه و تحلیل داده های متنی روی بوم SageMaker

تجزیه و تحلیل احساسات

با تجزیه و تحلیل احساسات، SageMaker Canvas به شما امکان می دهد احساسات متن ورودی خود را تجزیه و تحلیل کنید. همانطور که در تصویر زیر نشان داده شده است، می تواند تعیین کند که آیا احساسات کلی مثبت، منفی، مختلط یا خنثی است. این در شرایطی مانند تجزیه و تحلیل نظرات محصول مفید است. به عنوان مثال، متن "من عاشق این محصول هستم، شگفت انگیز است!" توسط SageMaker Canvas به عنوان دارای احساسات مثبت طبقه بندی می شود، در حالی که "این محصول وحشتناک است، من از خرید آن پشیمان هستم" به عنوان احساسات منفی برچسب گذاری می شود.

تجزیه و تحلیل احساسات در بوم SageMaker

استخراج موجودیت ها

SageMaker Canvas می تواند متن را تجزیه و تحلیل کند و به طور خودکار موجودیت های ذکر شده در آن را شناسایی کند. وقتی سندی برای تجزیه و تحلیل به SageMaker Canvas ارسال می‌شود، افراد، سازمان‌ها، مکان‌ها، تاریخ‌ها، مقادیر و سایر موجودات موجود در متن را شناسایی می‌کند. این قابلیت استخراج موجودیت شما را قادر می سازد تا به سرعت در مورد افراد کلیدی، مکان ها و جزئیات مورد بحث در اسناد اطلاعاتی کسب کنید. برای لیستی از موجودیت های پشتیبانی شده، مراجعه کنید اشخاص.

Entites Extraction در بوم SageMaker

تشخیص زبان

SageMaker Canvas همچنین می تواند زبان غالب متن را با استفاده از Amazon Comprehend تعیین کند. این متن را برای شناسایی زبان اصلی تجزیه و تحلیل می کند و امتیازات اطمینان را برای زبان غالب شناسایی شده ارائه می دهد، اما درصد تفکیک اسناد چند زبانه را نشان نمی دهد. برای بهترین نتایج با اسناد طولانی در چندین زبان، متن را به قطعات کوچکتر تقسیم کنید و نتایج را جمع آوری کنید تا درصد زبان را تخمین بزنید. با حداقل 20 کاراکتر متن بهترین کار را دارد.

تشخیص زبان در بوم SageMaker

تشخیص اطلاعات شخصی

همچنین می‌توانید با استفاده از شناسایی اطلاعات شخصی با SageMaker Canvas از داده‌های حساس محافظت کنید. این می تواند اسناد متنی را برای شناسایی خودکار اطلاعات شناسایی شخصی (PII) تجزیه و تحلیل کند و به شما امکان می دهد داده های حساس مانند نام، آدرس، تاریخ تولد، شماره تلفن، آدرس ایمیل و موارد دیگر را بیابید. این اسناد تا 100 کیلوبایت را تجزیه و تحلیل می‌کند و برای هر موجودیت شناسایی شده امتیاز اطمینان ارائه می‌کند تا بتوانید حساس‌ترین اطلاعات را بررسی و به‌طور انتخابی ویرایش کنید. برای لیستی از موجودیت های شناسایی شده، مراجعه کنید شناسایی موجودیت های PII.

تشخیص PII در بوم SageMaker

داده های تصویر

SageMaker Canvas یک رابط بصری و بدون کد ارائه می دهد که استفاده از قابلیت های بینایی کامپیوتر را با ادغام با شناسایی آمازون برای تجزیه و تحلیل تصویر به عنوان مثال، می‌توانید مجموعه داده‌ای از تصاویر را آپلود کنید، از شناسایی آمازون برای شناسایی اشیا و صحنه‌ها استفاده کنید، و تشخیص متن را برای رسیدگی به طیف وسیعی از موارد استفاده انجام دهید. رابط بصری و ادغام آمازون Rekognition این امکان را برای غیر توسعه دهندگان فراهم می کند تا از تکنیک های بینایی کامپیوتری پیشرفته استفاده کنند.

تجزیه و تحلیل داده های تصویر در بوم SageMaker

تشخیص اشیا در تصاویر

SageMaker Canvas از تشخیص آمازون برای شناسایی برچسب ها (اشیاء) در یک تصویر استفاده می کند. می توانید تصویر را از SageMaker Canvas UI آپلود کنید یا از آن استفاده کنید پیش بینی دسته ای برای انتخاب تصاویر ذخیره شده در سطل S3. همانطور که در مثال زیر نشان داده شده است، می تواند اشیاء موجود در تصویر مانند برج ساعت، اتوبوس، ساختمان ها و غیره را استخراج کند. می توانید از رابط برای جستجو در نتایج پیش بینی و مرتب سازی آنها استفاده کنید.

تشخیص اشیا در تصاویر روی بوم SageMaker

تشخیص متن در تصاویر

استخراج متن از تصاویر یک مورد استفاده بسیار رایج است. اکنون می‌توانید این کار را به راحتی و بدون کد در SageMaker Canvas انجام دهید. متن به عنوان آیتم های خط استخراج می شود، همانطور که در تصویر زیر نشان داده شده است. عبارات کوتاه درون تصویر با هم طبقه بندی می شوند و به عنوان یک عبارت شناسایی می شوند.

تشخیص متن در تصاویر روی بوم SageMaker

می‌توانید با آپلود مجموعه‌ای از تصاویر، پیش‌بینی‌های دسته‌ای را انجام دهید، همه تصاویر را در یک کار دسته‌ای استخراج کنید و نتایج را به‌عنوان یک فایل CSV دانلود کنید. این راه حل زمانی مفید است که می خواهید متن را در تصاویر استخراج و شناسایی کنید.

داده های سند

SageMaker Canvas انواع راه حل های آماده برای استفاده را ارائه می دهد که نیازهای روزمره شما را برای درک اسناد برطرف می کند. این راه حل ها توسط متن آمازون. برای مشاهده تمام گزینه های موجود برای اسناد، گزینه را انتخاب کنید مدل های آماده برای استفاده در قسمت ناوبری و فیلتر کردن توسط اسناد، همانطور که در تصویر زیر نشان داده شده است.

تجزیه و تحلیل داده های سند روی بوم SageMaker

تجزیه و تحلیل سند

تجزیه و تحلیل اسناد اسناد و فرم ها را برای روابط بین متن شناسایی شده تجزیه و تحلیل می کند. این عملیات چهار دسته از استخراج سند را برمی‌گرداند: متن خام، فرم‌ها، جداول و امضاها. توانایی راه حل برای درک ساختار سند به شما انعطاف بیشتری در نوع داده هایی که می خواهید از اسناد استخراج کنید می دهد. تصویر زیر نمونه ای از نحوه تشخیص جدول است.

تجزیه و تحلیل اسناد بر روی بوم SageMaker

این راه حل قادر به درک طرح بندی اسناد پیچیده است، که زمانی مفید است که شما نیاز به استخراج اطلاعات خاص در اسناد خود دارید.

تجزیه و تحلیل اسناد هویتی

این راه حل برای تجزیه و تحلیل اسنادی مانند کارت شناسایی شخصی، گواهینامه رانندگی، یا سایر اشکال مشابه طراحی شده است. همانطور که در تصویر زیر نشان داده شده است، اطلاعاتی مانند نام وسط، شهرستان و محل تولد، همراه با امتیاز اطمینان فردی آن در مورد دقت، برای هر مدرک شناسایی بازگردانده می شود.

تجزیه و تحلیل اسناد هویتی روی بوم SageMaker

گزینه ای برای انجام پیش بینی دسته ای وجود دارد که به موجب آن می توانید مجموعه ای از اسناد شناسایی را به صورت انبوه آپلود کرده و آنها را به عنوان یک کار دسته ای پردازش کنید. این یک راه سریع و بدون درز برای تبدیل جزئیات سند شناسایی به جفت های کلید-مقدار است که می تواند برای فرآیندهای پایین دستی مانند تجزیه و تحلیل داده ها استفاده شود.

تحلیل هزینه ها

تجزیه و تحلیل هزینه برای تجزیه و تحلیل اسناد هزینه مانند فاکتورها و رسیدها طراحی شده است. تصویر زیر نمونه ای از ظاهر اطلاعات استخراج شده است.

تجزیه و تحلیل هزینه در بوم SageMaker

نتایج به صورت فیلدهای خلاصه و فیلدهای مورد خط برگردانده می شوند. فیلدهای خلاصه جفت های کلید-مقدار استخراج شده از سند هستند و حاوی کلیدهایی مانند جمع کل, موعد مقررو مالیات. فیلدهای مورد خط به داده هایی اشاره دارد که به عنوان یک جدول در سند ساختار یافته است. این برای استخراج اطلاعات از سند و در عین حال حفظ طرح آن مفید است.

پرس و جوهای سند

پرس و جوهای سند برای شما طراحی شده اند تا در مورد اسناد خود سؤال بپرسید. این یک راه حل عالی برای استفاده زمانی است که اسناد چند صفحه ای دارید و می خواهید پاسخ های بسیار خاصی را از اسناد خود استخراج کنید. در زیر نمونه ای از انواع سوالاتی که می توانید بپرسید و پاسخ های استخراج شده به چه صورت است آورده شده است.

پرس و جوهای سند در بوم SageMaker

این راه حل یک رابط ساده را برای تعامل با اسناد خود فراهم می کند. این زمانی مفید است که می خواهید جزئیات خاصی را در اسناد بزرگ بدست آورید.

نتیجه

SageMaker Canvas یک محیط بدون کد برای استفاده آسان از ML در انواع مختلف داده مانند متن، تصاویر و اسناد فراهم می کند. رابط بصری و ادغام با سرویس‌های AWS مانند Amazon Comprehend، Amazon Rekognition و Amazon Texttract نیاز به کدنویسی و مهندسی داده را از بین می‌برد. می توانید متن را برای احساسات، موجودیت ها، زبان ها و PII تجزیه و تحلیل کنید. برای تصاویر، تشخیص اشیا و متن موارد استفاده از دید کامپیوتر را فعال می کند. در نهایت، تجزیه و تحلیل سند می تواند متن را استخراج کند و در عین حال طرح آن را برای فرآیندهای پایین دستی حفظ کند. راه حل های آماده استفاده در SageMaker Canvas این امکان را برای شما فراهم می کند تا از تکنیک های پیشرفته ML برای ایجاد بینش از داده های ساختاریافته و بدون ساختار استفاده کنید. اگر علاقه مند به استفاده از ابزارهای بدون کد با مدل های آماده ML هستید، امروز SageMaker Canvas را امتحان کنید. برای اطلاعات بیشتر مراجعه کنید شروع با استفاده از آمازون SageMaker Canvas.


درباره نویسندگان

جولیا آنگ یک معمار Solutions مستقر در سنگاپور است. او با مشتریان در طیف وسیعی از زمینه‌ها، از سلامت و بخش عمومی گرفته تا کسب‌وکارهای بومی دیجیتال، کار کرده است تا راه‌حل‌هایی را مطابق با نیازهای تجاری آنها اتخاذ کند. او همچنین از مشتریان در آسیای جنوب شرقی و فراتر از آن برای استفاده از هوش مصنوعی و ML در مشاغل خود حمایت می کند. خارج از کار، او از یادگیری در مورد جهان از طریق سفر و درگیر شدن در کارهای خلاقانه لذت می برد.

لوک جون کای یک معمار راه حل های تخصصی برای AI/ML مستقر در سنگاپور است. او با مشتری در سراسر ASEAN کار می کند تا راه حل های یادگیری ماشین را در مقیاس در AWS معمار کند. جون کای مدافع ابزارهای یادگیری ماشینی با کد کم بدون کد است. در اوقات فراغت از بودن در کنار طبیعت لذت می برد.

نقطه_img

جدیدترین اطلاعات

نقطه_img

چت با ما

سلام! چگونه می توانم به شما کمک کنم؟