این یک پست مهمان است که با همکاری تامیر روبینسکی و آویاد آرانیاس از نیلسن اسپورت نوشته شده است..
ورزش نیلسن رسانه ها و محتوای جهان را به عنوان یک رهبر جهانی در بینش، داده ها و تجزیه و تحلیل مخاطبان شکل می دهد. ما از طریق درک خود از افراد و رفتارهای آنها در همه کانال ها و پلتفرم ها، مشتریان خود را با هوش مستقل و عملی توانمند می کنیم تا بتوانند با مخاطبان خود در ارتباط باشند و در حال تعامل باشند.
در Nielsen Sports، ماموریت ما این است که به مشتریان خود - مارک ها و دارندگان حقوق - توانایی اندازه گیری بازگشت سرمایه (ROI) و اثربخشی یک کمپین تبلیغاتی اسپانسر ورزشی در همه کانال ها، از جمله تلویزیون، آنلاین، رسانه های اجتماعی، و حتی روزنامه ها و برای ارائه هدف گذاری دقیق در سطوح محلی، ملی و بین المللی.
در این پست، ما توضیح میدهیم که چگونه Nielsen Sports سیستمی را که هزاران مدل مختلف یادگیری ماشین (ML) را در حال تولید با استفاده از آن مدرنسازی کرده است. آمازون SageMaker نقاط پایانی چند مدلی (MME) و کاهش هزینه عملیاتی و مالی تا 75٪.
چالشهای تقسیمبندی ویدیوی کانال
فناوری ما مبتنی بر هوش مصنوعی (AI) و بهویژه بینایی کامپیوتری (CV) است که به ما امکان میدهد قرار گرفتن در معرض نام تجاری را ردیابی کنیم و مکان آن را به طور دقیق شناسایی کنیم. به عنوان مثال، ما تشخیص می دهیم که آیا برند روی یک بنر یا یک پیراهن است. علاوه بر این، ما محل برند را روی کالا شناسایی می کنیم، مانند گوشه بالای تابلو یا آستین. شکل زیر نمونه ای از سیستم برچسب گذاری ما را نشان می دهد.
برای درک چالش های مقیاس بندی و هزینه، اجازه دهید به برخی از اعداد نماینده نگاه کنیم. هر ماه، ما بیش از 120 میلیون نشان تجاری را در کانالهای مختلف شناسایی میکنیم و سیستم باید از شناسایی بیش از 100,000 برند و انواع برندهای مختلف پشتیبانی کند. ما یکی از بزرگترین پایگاهدادههای برداشت برند در جهان را با بیش از ۶ میلیارد نقطه داده ساختهایم.
فرآیند ارزیابی رسانه ما شامل چندین مرحله است که در شکل زیر نشان داده شده است:
- اول، ما هزاران کانال را در سراسر جهان با استفاده از یک سیستم ضبط بین المللی ضبط می کنیم.
- ما محتوا را در ترکیب با برنامه زمانبندی پخش (راهنمای برنامه نویسی الکترونیکی) به مرحله بعدی که تقسیم بندی و جداسازی بین پخش خود بازی و سایر محتواها یا تبلیغات است، پخش می کنیم.
- ما نظارت رسانهای را انجام میدهیم، که در آن فرادادههای اضافی مانند امتیازات لیگ، تیمهای مرتبط و بازیکنان را به هر بخش اضافه میکنیم.
- ما یک تجزیه و تحلیل قرار گرفتن در معرض دید مارک ها را انجام می دهیم و سپس اطلاعات مخاطبان را برای محاسبه ارزش کمپین ترکیب می کنیم.
- اطلاعات توسط داشبورد یا گزارش های تحلیلگر به مشتری تحویل داده می شود. به تحلیلگر امکان دسترسی مستقیم به داده های خام یا از طریق انبار داده ما داده می شود.
از آنجایی که ما در مقیاس بیش از هزار کانال و ده ها هزار ساعت ویدیو در سال کار می کنیم، باید یک سیستم اتوماسیون مقیاس پذیر برای فرآیند تحلیل داشته باشیم. راه حل ما به طور خودکار پخش را تقسیم بندی می کند و می داند که چگونه کلیپ های ویدیویی مربوطه را از بقیه محتوا جدا کند.
ما این کار را با استفاده از الگوریتمها و مدلهای اختصاصی توسعه یافته توسط ما برای تجزیه و تحلیل ویژگیهای خاص کانالها انجام میدهیم.
در مجموع، ما هزاران مدل مختلف را در حال تولید برای پشتیبانی از این ماموریت هستیم که پرهزینه است، هزینه های عملیاتی را متحمل می شود و مستعد خطا و کند است. ماه ها طول کشید تا مدل هایی با معماری مدل جدید به تولید برسند.
اینجاست که ما میخواستیم سیستم خود را نوآوری و بازسازی کنیم.
مقیاس بندی مقرون به صرفه برای مدل های CV با استفاده از SageMaker MME
آزمایش، تغییر و نگهداری سیستم تقسیمبندی ویدیوی قدیمی ما دشوار بود. برخی از چالشها شامل کار با چارچوب قدیمی ML، وابستگیهای متقابل بین مؤلفهها، و بهینهسازی گردش کار دشوار است. این به این دلیل است که ما بر اساس RabbitMQ برای خط لوله بودیم که یک راه حل دولتی بود. برای رفع اشکال یک جزء، مانند استخراج ویژگی، باید تمام خط لوله را آزمایش میکردیم.
نمودار زیر معماری قبلی را نشان می دهد.
به عنوان بخشی از تجزیه و تحلیل خود، گلوگاههای عملکردی مانند اجرای یک مدل منفرد بر روی یک دستگاه را شناسایی کردیم که استفاده کم GPU بین 30 تا 40٪ را نشان داد. ما همچنین اجرای خط لوله ناکارآمد و الگوریتمهای زمانبندی مدلها را کشف کردیم.
بنابراین، ما تصمیم گرفتیم یک معماری چند مستاجر جدید بر اساس SageMaker بسازیم که بهبودهای بهینه سازی عملکرد را پیاده سازی کند، از اندازه های دسته پویا پشتیبانی کند و چندین مدل را به طور همزمان اجرا کند.
هر اجرای گردش کار گروهی از ویدئوها را هدف قرار می دهد. هر ویدیو بین 30 تا 90 دقیقه است و هر گروه بیش از پنج مدل برای اجرا دارد.
بیایید یک مثال را بررسی کنیم: یک ویدیو می تواند 60 دقیقه باشد که از 3,600 تصویر تشکیل شده است و هر تصویر باید توسط سه مدل مختلف ML در مرحله اول استنباط شود. با SageMaker MME، میتوانیم دستهای از 12 تصویر را به صورت موازی اجرا کنیم و دسته کامل در کمتر از 2 ثانیه کامل میشود. در یک روز معمولی، ما بیش از 20 گروه ویدیو داریم و در یک روز شلوغ آخر هفته، می توانیم بیش از 100 گروه ویدیو داشته باشیم.
نمودار زیر معماری جدید و ساده شده ما را با استفاده از SageMaker MME نشان می دهد.
نتایج
با معماری جدید، ما به بسیاری از نتایج دلخواه خود و برخی از مزیت های نادیده نسبت به معماری قدیمی دست یافتیم:
- زمان اجرا بهتر - با افزایش اندازه دسته (12 ویدیو به صورت موازی) و اجرای چندین مدل به طور همزمان (پنج مدل به صورت موازی)، زمان اجرای خط لوله خود را 33٪ کاهش داده ایم، از 1 ساعت به 40 دقیقه.
- زیرساخت های بهبود یافته – با SageMaker، زیرساختهای موجود خود را ارتقا دادیم و اکنون از نمونههای جدیدتر AWS با پردازندههای گرافیکی جدیدتر مانند g5.xlarge استفاده میکنیم. یکی از بزرگترین مزایای این تغییر، بهبود عملکرد فوری با استفاده از بهینه سازی TorchScript و CUDA است.
- استفاده از زیرساخت بهینه - با داشتن یک نقطه پایانی واحد که میتواند چندین مدل را میزبانی کند، میتوانیم تعداد نقاط پایانی و تعداد ماشینهایی را که به نگهداری نیاز داریم کاهش دهیم و همچنین استفاده از یک ماشین واحد و GPU آن را افزایش دهیم. برای یک کار خاص با پنج ویدیو، ما اکنون فقط از پنج دستگاه نمونه g5 استفاده میکنیم که 75 درصد از راهحل قبلی به ما سود میدهد. برای حجم کاری معمولی در طول روز، ما از یک نقطه پایانی واحد با یک دستگاه واحد g5.xlarge با استفاده از GPU بیش از 80% استفاده میکنیم. برای مقایسه، راه حل قبلی کمتر از 40 درصد استفاده داشت.
- افزایش چابکی و بهره وری - استفاده از SageMaker به ما این امکان را میدهد که زمان کمتری را برای مهاجرت مدلها و زمان بیشتری برای بهبود الگوریتمها و مدلهای اصلی خود صرف کنیم. این باعث افزایش بهره وری برای تیم های مهندسی و علم داده ما شده است. اکنون میتوانیم یک مدل جدید ML را بهجای بیش از ۱ ماه قبل، در کمتر از ۷ روز تحقیق و اجرا کنیم. این یک بهبود 7 درصدی در سرعت و برنامه ریزی است.
- کیفیت و اطمینان بهتر - با قابلیتهای تست SageMaker A/B، میتوانیم مدلهای خود را به صورت تدریجی اجرا کنیم و بتوانیم با خیال راحت به عقب برگردیم. چرخه عمر سریعتر تا تولید نیز دقت و نتایج مدلهای ML ما را افزایش داد.
شکل زیر استفاده از GPU ما را با معماری قبلی نشان می دهد (30-40 درصد استفاده از پردازنده گرافیکی).
شکل زیر استفاده از GPU ما را با معماری ساده شده جدید (90% استفاده از GPU) نشان می دهد.
نتیجه
در این پست به اشتراک گذاشتیم که چگونه Nielsen Sports سیستمی را که هزاران مدل مختلف را در حال تولید در حال تولید است با استفاده از SageMaker MME مدرن کرد و هزینه عملیاتی و مالی آنها را تا 75% کاهش داد.
برای مطالعه بیشتر به ادامه مطلب مراجعه کنید:
درباره نویسنده
ایتان سلا یک معمار راه حل های تخصصی هوش مصنوعی و یادگیری ماشین مولد با خدمات وب آمازون است. او با مشتریان AWS برای ارائه راهنمایی و کمک فنی کار می کند و به آنها کمک می کند تا راه حل های هوش مصنوعی و یادگیری ماشینی را در AWS بسازند و به کار گیرند. ایتان در اوقات فراغت خود از دویدن و خواندن جدیدترین مقالات یادگیری ماشین لذت می برد.
گال گلدمن یک مهندس نرم افزار ارشد و یک معمار ارشد راه حل سازمانی در AWS با اشتیاق به راه حل های پیشرفته است. او در بسیاری از خدمات و راه حل های یادگیری ماشینی توزیع شده تخصص دارد و توسعه داده است. گال همچنین بر کمک به مشتریان AWS برای تسریع و غلبه بر چالشهای مهندسی و هوش مصنوعی خود تمرکز میکند.
تال پنچک مدیر ارشد توسعه کسب و کار برای هوش مصنوعی و یادگیری ماشین با خدمات وب آمازون است. به عنوان یک متخصص BD، او مسئول افزایش پذیرش، استفاده و درآمد برای خدمات AWS است. او نیازهای مشتری و صنعت را جمع آوری می کند و با تیم های محصول AWS برای نوآوری، توسعه و ارائه راه حل های AWS شریک می شود.
تامیر روبینسکی رهبری مهندسی تحقیق و توسعه جهانی در Nielsen Sports را بر عهده دارد و تجربه گسترده ای در ساخت محصولات نوآورانه و مدیریت تیم های با عملکرد بالا به ارمغان می آورد. کار او ارزیابی رسانه اسپانسر ورزشی را از طریق راه حل های خلاقانه و مبتنی بر هوش مصنوعی متحول کرد.
آویاد آرانیاس یک رهبر تیم MLOps و معمار تجزیه و تحلیل ورزشی نیلسن است که در ساخت خطوط لوله پیچیده برای تجزیه و تحلیل ویدیوهای رویدادهای ورزشی در کانال های متعدد تخصص دارد. او در ساخت و استقرار مدلهای یادگیری عمیق برای مدیریت کارآمد دادههای مقیاس بزرگ برتر است. او در اوقات فراغت خود از پخت پیتزاهای خوشمزه ناپلی لذت می برد.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://aws.amazon.com/blogs/machine-learning/nielsen-sports-sees-75-cost-reduction-in-video-analysis-with-amazon-sagemaker-multi-model-endpoints/