شرکت ها به طور فزاینده ای به تصاویر و ویدیوهای تولید شده توسط کاربر برای تعامل متکی هستند. از پلتفرمهای تجارت الکترونیک که مشتریان را تشویق میکنند تا تصاویر محصول را به اشتراک بگذارند تا شرکتهای رسانههای اجتماعی که ویدیوها و تصاویر تولید شده توسط کاربر را تبلیغ میکنند، استفاده از محتوای کاربر برای تعامل یک استراتژی قدرتمند است. با این حال، اطمینان از اینکه این محتوای تولید شده توسط کاربر با خطمشیهای شما سازگار است و جامعه آنلاین امنی را برای کاربران شما ایجاد میکند، میتواند چالش برانگیز باشد.
بسیاری از شرکتها در حال حاضر به ناظران انسانی وابسته هستند یا به شکایات کاربران واکنش نشان میدهند تا محتوای نامناسب تولید شده توسط کاربر را مدیریت کنند. این رویکردها برای تعدیل موثر میلیونها تصویر و ویدیو با کیفیت یا سرعت کافی مقیاس ندارند، که منجر به تجربه کاربری ضعیف، هزینههای بالا برای دستیابی به مقیاس یا حتی آسیب احتمالی به شهرت برند میشود.
در این پست، نحوه استفاده از قابلیت Custom Moderation را مورد بحث قرار می دهیم شناسایی آمازون برای افزایش دقت API تعدیل محتوای از پیش آموزش داده شده شما.
تعدیل محتوا در آمازون Rekognition
آمازون Rekognition یک سرویس هوش مصنوعی (AI) مدیریت شده است که قابلیت های دید کامپیوتری از قبل آموزش دیده و قابل تنظیم را برای استخراج اطلاعات و بینش از تصاویر و ویدئوها ارائه می دهد. یکی از این قابلیت ها این است تعدیل محتوای شناسایی آمازون، که محتوای نامناسب یا ناخواسته را در تصاویر و ویدیوها تشخیص می دهد. آمازون Rekognition از یک طبقهبندی سلسله مراتبی برای برچسبگذاری محتوای نامناسب یا ناخواسته با 10 دستهبندی سطح بالا (مانند خشونت، صریح، الکل یا مواد مخدر) و 35 دستهبندی سطح دوم استفاده میکند. مشتریان در صنایعی مانند تجارت الکترونیک، رسانههای اجتماعی و بازیها میتوانند از تعدیل محتوا در آمازون Rekognition برای محافظت از شهرت برند خود و پرورش جوامع کاربری ایمن استفاده کنند.
با استفاده از آمازون Rekognition برای نظارت تصویر و ویدیو، ناظران انسانی باید مجموعه بسیار کوچکتری از محتوا را بررسی کنند، معمولاً 1 تا 5 درصد از حجم کل، که قبلاً توسط مدل تعدیل محتوا پرچمگذاری شده است. این امر شرکت ها را قادر می سازد تا بر فعالیت های با ارزش تر تمرکز کنند و همچنان با کسری از هزینه های موجود خود به پوشش تعدیل جامع دست یابند.
معرفی Amazon Rekognition Custom Moderation
اکنون میتوانید دقت مدل تعدیل شناسایی را برای دادههای خاص کسبوکار خود با ویژگی تعدیل سفارشی افزایش دهید. شما می توانید یک آداپتور سفارشی را با 20 تصویر حاشیه نویسی در کمتر از 1 ساعت آموزش دهید. این آداپتورها قابلیتهای مدل تعدیل را برای تشخیص تصاویر مورد استفاده برای آموزش با دقت بالاتر گسترش میدهند. برای این پست، ما از یک مجموعه داده نمونه شامل تصاویر ایمن و تصاویر حاوی مشروبات الکلی (که ناامن در نظر گرفته می شوند) استفاده می کنیم تا دقت برچسب تعدیل الکل را افزایش دهیم.
شناسه منحصر به فرد آداپتور آموزش دیده را می توان به موجود ارائه کرد DetectModerationLabels عملیات API برای پردازش تصاویر با استفاده از این آداپتور. هر آداپتور فقط می تواند توسط حساب AWS استفاده شود که برای آموزش آداپتور استفاده شده است، و اطمینان حاصل شود که داده های مورد استفاده برای آموزش در آن حساب AWS ایمن و ایمن باقی می مانند. با ویژگی تعدیل سفارشی، میتوانید مدل تعدیلشده از پیش آموزشدیده Rekognition را برای بهبود عملکرد در مورد استفاده از تعدیل خاص خود، بدون هیچگونه تخصص در یادگیری ماشین (ML) تنظیم کنید. میتوانید همچنان از مزایای یک سرویس تعدیل کاملاً مدیریت شده با مدل قیمتگذاری پرداخت به ازای استفاده برای تعدیل سفارشی لذت ببرید.
بررسی اجمالی راه حل
آموزش آداپتور تعدیل سفارشی شامل پنج مرحله است که می توانید با استفاده از آن تکمیل کنید کنسول مدیریت AWS یا رابط API:
- ایجاد یک پروژه
- داده های آموزشی را بارگذاری کنید
- برچسب های حقیقت زمینی را به تصاویر اختصاص دهید
- آداپتور را آموزش دهید
- از آداپتور استفاده کنید
بیایید با استفاده از کنسول این مراحل را با جزئیات بیشتری طی کنیم.
ایجاد یک پروژه
پروژه محفظه ای برای ذخیره آداپتورهای شما است. شما می توانید چندین آداپتور را در یک پروژه با مجموعه داده های آموزشی مختلف آموزش دهید تا ارزیابی کنید که کدام آداپتور برای مورد استفاده خاص شما بهترین عملکرد را دارد. برای ایجاد پروژه خود، مراحل زیر را انجام دهید:
- در کنسول آمازون Rekognition، را انتخاب کنید تعدیل سفارشی در صفحه ناوبری
- را انتخاب کنید ایجاد پروژه.
- برای نام پروژه، یک نام برای پروژه خود وارد کنید.
- برای نام آداپتور، یک نام برای آداپتور خود وارد کنید.
- در صورت تمایل، توضیحی برای آداپتور خود وارد کنید.
آپلود داده های آموزشی
میتوانید با حداقل 20 تصویر نمونه شروع کنید تا مدل تعدیل را برای شناسایی موارد مثبت کاذب کمتر (تصاویری که برای کسبوکار شما مناسب هستند اما توسط مدل با برچسب تعدیل علامتگذاری شدهاند) تطبیق دهید. برای کاهش نگاتیوهای کاذب (تصاویری که برای کسب و کار شما نامناسب هستند اما با برچسب اعتدال علامت گذاری نمی شوند)، باید با 50 تصویر نمونه شروع کنید.
برای ارائه مجموعه داده های تصویری برای آموزش آداپتور می توانید از گزینه های زیر انتخاب کنید:
مراحل زیر را انجام دهید:
- برای این پست، انتخاب کنید تصاویر را از سطل S3 وارد کنید و S3 URI خود را وارد کنید.
مانند هر فرآیند آموزشی ML، آموزش آداپتور Custom Moderation در Amazon Rekognition به دو مجموعه داده جداگانه نیاز دارد: یکی برای آموزش آداپتور و دیگری برای ارزیابی آداپتور. می توانید یک مجموعه داده آزمایشی جداگانه آپلود کنید یا اینکه مجموعه داده آموزشی خود را به طور خودکار برای آموزش و آزمایش تقسیم کنید.
- برای این پست، انتخاب کنید تقسیم خودکار.
- انتخاب کنید فعال کردن به روز رسانی خودکار برای اطمینان از اینکه سیستم به طور خودکار آداپتور را در هنگام راه اندازی نسخه جدیدی از مدل تعدیل محتوا بازآموزی می کند.
- را انتخاب کنید ایجاد پروژه.
برچسب های حقیقت زمینی را به تصاویر اختصاص دهید
اگر تصاویر بدون حاشیه آپلود کردهاید، میتوانید از کنسول تشخیص آمازون برای ارائه برچسبهای تصویر طبق طبقهبندی تعدیل استفاده کنید. در مثال زیر، آداپتوری را آموزش میدهیم که الکل پنهان را با دقت بالاتر تشخیص دهد و همه این تصاویر را با برچسب الکل برچسبگذاری کنیم. تصاویری که نامناسب در نظر گرفته نمی شوند را می توان به عنوان ایمن برچسب گذاری کرد.
آداپتور را آموزش دهید
بعد از اینکه همه تصاویر را برچسب زدید، انتخاب کنید آموزش را شروع کنید برای شروع فرآیند آموزشی آمازون Rekognition از مجموعه داده های تصویر آپلود شده برای آموزش یک مدل آداپتور برای دقت بیشتر در نوع خاصی از تصاویر ارائه شده برای آموزش استفاده خواهد کرد.
پس از آموزش آداپتور تعدیل سفارشی، می توانید تمام جزئیات آداپتور را مشاهده کنید (adapterID
, test
و training
فایل های مانیفست) در عملکرد آداپتور بخش.
La عملکرد آداپتور بخش بهبودهایی را در موارد مثبت کاذب و منفی کاذب در مقایسه با مدل تعدیل از قبل آموزش دیده نشان می دهد. آداپتوری که برای افزایش تشخیص برچسب الکل آموزش دادیم، نرخ منفی کاذب را در تصاویر آزمایشی تا 73 درصد کاهش میدهد. به عبارت دیگر، آداپتور اکنون به طور دقیق برچسب تعدیل الکل را برای 73٪ تصاویر بیشتر در مقایسه با مدل تعدیل از قبل آموزش دیده پیش بینی می کند. با این حال، هیچ بهبودی در موارد مثبت کاذب مشاهده نمی شود، زیرا از نمونه های مثبت کاذب برای آموزش استفاده نشد.
از آداپتور استفاده کنید
میتوانید با استفاده از آداپتور تازه آموزشدیده شده، استنباط را انجام دهید تا به دقت بالاتری دست پیدا کنید. برای انجام این کار، با آمازون Rekognition تماس بگیرید DetectModerationLabel
API با یک پارامتر اضافی، ProjectVersion
، که منحصر به فرد است AdapterID
از آداپتور در زیر یک دستور نمونه با استفاده از رابط خط فرمان AWS (AWS CLI):
در زیر یک قطعه کد نمونه با استفاده از کتابخانه Python Boto3:
بهترین روش ها برای آموزش
برای به حداکثر رساندن عملکرد آداپتور خود، بهترین روش های زیر برای آموزش آداپتور توصیه می شود:
- دادههای تصویر نمونه باید خطاهای نمایندهای را که میخواهید دقت مدل تعدیل را برای آنها بهبود ببخشید، نشان دهد
- به جای اینکه فقط تصاویر خطا را برای موارد مثبت کاذب و منفی کاذب وارد کنید، می توانید برای بهبود عملکرد، موارد مثبت و منفی واقعی را نیز ارائه دهید.
- تا حد امکان تصاویر حاشیه نویسی را برای آموزش تهیه کنید
نتیجه
در این پست، مروری عمیق از ویژگی جدید Amazon Rekognition Custom Moderation ارائه کردیم. علاوه بر این، مراحل انجام آموزش با استفاده از کنسول، از جمله بهترین شیوهها برای نتایج بهینه را به تفصیل شرح دادیم. برای اطلاعات بیشتر، از کنسول شناسایی آمازون دیدن کنید و ویژگی Custom Moderation را بررسی کنید.
تعدیل سفارشی شناسایی آمازون در حال حاضر به طور کلی در تمام مناطق AWS که شناسایی آمازون در دسترس است در دسترس است.
اطلاعات بیشتر در مورد تعدیل محتوا در AWS. اولین قدم را بردارید ساده کردن عملیات تعدیل محتوای خود با AWS.
درباره نویسنده
شیپرا کانوریا مدیر محصول اصلی در AWS است. او مشتاق کمک به مشتریان برای حل پیچیده ترین مشکلاتشان با قدرت یادگیری ماشینی و هوش مصنوعی است. قبل از پیوستن به AWS، شیپرا بیش از 4 سال را در آمازون الکسا گذراند، جایی که بسیاری از ویژگیهای مرتبط با بهرهوری را در دستیار صوتی الکسا راهاندازی کرد.
آکاش دیپ یک مدیر مهندسی توسعه نرم افزار مستقر در سیاتل است. او از کار بر روی بینایی کامپیوتر، هوش مصنوعی و سیستم های توزیع شده لذت می برد. ماموریت او این است که مشتریان را قادر سازد تا به مشکلات پیچیده رسیدگی کنند و با AWS Rekognition ارزش ایجاد کنند. در خارج از محل کار، از پیاده روی و مسافرت لذت می برد.
لانا ژانگ یک معمار ارشد راه حل در تیم خدمات هوش مصنوعی AWS WWSO است که در AI و ML برای تعدیل محتوا، بینایی رایانه، پردازش زبان طبیعی و هوش مصنوعی مولد تخصص دارد. او با تخصص خود به ترویج راه حل های AWS AI/ML و کمک به مشتریان در تغییر راه حل های تجاری خود در صنایع مختلف، از جمله رسانه های اجتماعی، بازی، تجارت الکترونیک، رسانه، تبلیغات و بازاریابی اختصاص دارد.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://aws.amazon.com/blogs/machine-learning/announcing-rekogniton-custom-moderation-enhance-accuracy-of-pre-trained-rekognition-moderation-models-with-your-data/