هوش داده افلاطون
جستجوی عمودی و هوش مصنوعی

Nielsen Sports شاهد کاهش 75 درصدی هزینه در تجزیه و تحلیل ویدیو با نقاط پایانی چند مدل Amazon SageMaker است | خدمات وب آمازون

تاریخ:

این یک پست مهمان است که با همکاری تامیر روبینسکی و آویاد آرانیاس از نیلسن اسپورت نوشته شده است..

ورزش نیلسن رسانه ها و محتوای جهان را به عنوان یک رهبر جهانی در بینش، داده ها و تجزیه و تحلیل مخاطبان شکل می دهد. ما از طریق درک خود از افراد و رفتارهای آنها در همه کانال ها و پلتفرم ها، مشتریان خود را با هوش مستقل و عملی توانمند می کنیم تا بتوانند با مخاطبان خود در ارتباط باشند و در حال تعامل باشند.

در Nielsen Sports، ماموریت ما این است که به مشتریان خود - مارک ها و دارندگان حقوق - توانایی اندازه گیری بازگشت سرمایه (ROI) و اثربخشی یک کمپین تبلیغاتی اسپانسر ورزشی در همه کانال ها، از جمله تلویزیون، آنلاین، رسانه های اجتماعی، و حتی روزنامه ها و برای ارائه هدف گذاری دقیق در سطوح محلی، ملی و بین المللی.

در این پست، ما توضیح می‌دهیم که چگونه Nielsen Sports سیستمی را که هزاران مدل مختلف یادگیری ماشین (ML) را در حال تولید با استفاده از آن مدرن‌سازی کرده است. آمازون SageMaker نقاط پایانی چند مدلی (MME) و کاهش هزینه عملیاتی و مالی تا 75٪.

چالش‌های تقسیم‌بندی ویدیوی کانال

فناوری ما مبتنی بر هوش مصنوعی (AI) و به‌ویژه بینایی کامپیوتری (CV) است که به ما امکان می‌دهد قرار گرفتن در معرض نام تجاری را ردیابی کنیم و مکان آن را به طور دقیق شناسایی کنیم. به عنوان مثال، ما تشخیص می دهیم که آیا برند روی یک بنر یا یک پیراهن است. علاوه بر این، ما محل برند را روی کالا شناسایی می کنیم، مانند گوشه بالای تابلو یا آستین. شکل زیر نمونه ای از سیستم برچسب گذاری ما را نشان می دهد.

نمونه ای از سیستم برچسب گذاری Nielsen

برای درک چالش های مقیاس بندی و هزینه، اجازه دهید به برخی از اعداد نماینده نگاه کنیم. هر ماه، ما بیش از 120 میلیون نشان تجاری را در کانال‌های مختلف شناسایی می‌کنیم و سیستم باید از شناسایی بیش از 100,000 برند و انواع برندهای مختلف پشتیبانی کند. ما یکی از بزرگ‌ترین پایگاه‌داده‌های برداشت برند در جهان را با بیش از ۶ میلیارد نقطه داده ساخته‌ایم.

فرآیند ارزیابی رسانه ما شامل چندین مرحله است که در شکل زیر نشان داده شده است:

  1. اول، ما هزاران کانال را در سراسر جهان با استفاده از یک سیستم ضبط بین المللی ضبط می کنیم.
  2. ما محتوا را در ترکیب با برنامه زمانبندی پخش (راهنمای برنامه نویسی الکترونیکی) به مرحله بعدی که تقسیم بندی و جداسازی بین پخش خود بازی و سایر محتواها یا تبلیغات است، پخش می کنیم.
  3. ما نظارت رسانه‌ای را انجام می‌دهیم، که در آن فراداده‌های اضافی مانند امتیازات لیگ، تیم‌های مرتبط و بازیکنان را به هر بخش اضافه می‌کنیم.
  4. ما یک تجزیه و تحلیل قرار گرفتن در معرض دید مارک ها را انجام می دهیم و سپس اطلاعات مخاطبان را برای محاسبه ارزش کمپین ترکیب می کنیم.
  5. اطلاعات توسط داشبورد یا گزارش های تحلیلگر به مشتری تحویل داده می شود. به تحلیلگر امکان دسترسی مستقیم به داده های خام یا از طریق انبار داده ما داده می شود.

مراحل ارزیابی رسانه ها

از آنجایی که ما در مقیاس بیش از هزار کانال و ده ها هزار ساعت ویدیو در سال کار می کنیم، باید یک سیستم اتوماسیون مقیاس پذیر برای فرآیند تحلیل داشته باشیم. راه حل ما به طور خودکار پخش را تقسیم بندی می کند و می داند که چگونه کلیپ های ویدیویی مربوطه را از بقیه محتوا جدا کند.

ما این کار را با استفاده از الگوریتم‌ها و مدل‌های اختصاصی توسعه یافته توسط ما برای تجزیه و تحلیل ویژگی‌های خاص کانال‌ها انجام می‌دهیم.

در مجموع، ما هزاران مدل مختلف را در حال تولید برای پشتیبانی از این ماموریت هستیم که پرهزینه است، هزینه های عملیاتی را متحمل می شود و مستعد خطا و کند است. ماه ها طول کشید تا مدل هایی با معماری مدل جدید به تولید برسند.

اینجاست که ما می‌خواستیم سیستم خود را نوآوری و بازسازی کنیم.

مقیاس بندی مقرون به صرفه برای مدل های CV با استفاده از SageMaker MME

آزمایش، تغییر و نگهداری سیستم تقسیم‌بندی ویدیوی قدیمی ما دشوار بود. برخی از چالش‌ها شامل کار با چارچوب قدیمی ML، وابستگی‌های متقابل بین مؤلفه‌ها، و بهینه‌سازی گردش کار دشوار است. این به این دلیل است که ما بر اساس RabbitMQ برای خط لوله بودیم که یک راه حل دولتی بود. برای رفع اشکال یک جزء، مانند استخراج ویژگی، باید تمام خط لوله را آزمایش می‌کردیم.

نمودار زیر معماری قبلی را نشان می دهد.

معماری قبلی

به عنوان بخشی از تجزیه و تحلیل خود، گلوگاه‌های عملکردی مانند اجرای یک مدل منفرد بر روی یک دستگاه را شناسایی کردیم که استفاده کم GPU بین 30 تا 40٪ را نشان داد. ما همچنین اجرای خط لوله ناکارآمد و الگوریتم‌های زمان‌بندی مدل‌ها را کشف کردیم.

بنابراین، ما تصمیم گرفتیم یک معماری چند مستاجر جدید بر اساس SageMaker بسازیم که بهبودهای بهینه سازی عملکرد را پیاده سازی کند، از اندازه های دسته پویا پشتیبانی کند و چندین مدل را به طور همزمان اجرا کند.

هر اجرای گردش کار گروهی از ویدئوها را هدف قرار می دهد. هر ویدیو بین 30 تا 90 دقیقه است و هر گروه بیش از پنج مدل برای اجرا دارد.

بیایید یک مثال را بررسی کنیم: یک ویدیو می تواند 60 دقیقه باشد که از 3,600 تصویر تشکیل شده است و هر تصویر باید توسط سه مدل مختلف ML در مرحله اول استنباط شود. با SageMaker MME، می‌توانیم دسته‌ای از 12 تصویر را به صورت موازی اجرا کنیم و دسته کامل در کمتر از 2 ثانیه کامل می‌شود. در یک روز معمولی، ما بیش از 20 گروه ویدیو داریم و در یک روز شلوغ آخر هفته، می توانیم بیش از 100 گروه ویدیو داشته باشیم.

نمودار زیر معماری جدید و ساده شده ما را با استفاده از SageMaker MME نشان می دهد.

معماری ساده شده با استفاده از SageMaker MME

نتایج

با معماری جدید، ما به بسیاری از نتایج دلخواه خود و برخی از مزیت های نادیده نسبت به معماری قدیمی دست یافتیم:

  • زمان اجرا بهتر - با افزایش اندازه دسته (12 ویدیو به صورت موازی) و اجرای چندین مدل به طور همزمان (پنج مدل به صورت موازی)، زمان اجرای خط لوله خود را 33٪ کاهش داده ایم، از 1 ساعت به 40 دقیقه.
  • زیرساخت های بهبود یافته – با SageMaker، زیرساخت‌های موجود خود را ارتقا دادیم و اکنون از نمونه‌های جدیدتر AWS با پردازنده‌های گرافیکی جدیدتر مانند g5.xlarge استفاده می‌کنیم. یکی از بزرگترین مزایای این تغییر، بهبود عملکرد فوری با استفاده از بهینه سازی TorchScript و CUDA است.
  • استفاده از زیرساخت بهینه - با داشتن یک نقطه پایانی واحد که می‌تواند چندین مدل را میزبانی کند، می‌توانیم تعداد نقاط پایانی و تعداد ماشین‌هایی را که به نگهداری نیاز داریم کاهش دهیم و همچنین استفاده از یک ماشین واحد و GPU آن را افزایش دهیم. برای یک کار خاص با پنج ویدیو، ما اکنون فقط از پنج دستگاه نمونه g5 استفاده می‌کنیم که 75 درصد از راه‌حل قبلی به ما سود می‌دهد. برای حجم کاری معمولی در طول روز، ما از یک نقطه پایانی واحد با یک دستگاه واحد g5.xlarge با استفاده از GPU بیش از 80% استفاده می‌کنیم. برای مقایسه، راه حل قبلی کمتر از 40 درصد استفاده داشت.
  • افزایش چابکی و بهره وری - استفاده از SageMaker به ما این امکان را می‌دهد که زمان کمتری را برای مهاجرت مدل‌ها و زمان بیشتری برای بهبود الگوریتم‌ها و مدل‌های اصلی خود صرف کنیم. این باعث افزایش بهره وری برای تیم های مهندسی و علم داده ما شده است. اکنون می‌توانیم یک مدل جدید ML را به‌جای بیش از ۱ ماه قبل، در کمتر از ۷ روز تحقیق و اجرا کنیم. این یک بهبود 7 درصدی در سرعت و برنامه ریزی است.
  • کیفیت و اطمینان بهتر - با قابلیت‌های تست SageMaker A/B، می‌توانیم مدل‌های خود را به صورت تدریجی اجرا کنیم و بتوانیم با خیال راحت به عقب برگردیم. چرخه عمر سریع‌تر تا تولید نیز دقت و نتایج مدل‌های ML ما را افزایش داد.

شکل زیر استفاده از GPU ما را با معماری قبلی نشان می دهد (30-40 درصد استفاده از پردازنده گرافیکی).

استفاده از پردازنده گرافیکی با معماری قبلی

شکل زیر استفاده از GPU ما را با معماری ساده شده جدید (90% استفاده از GPU) نشان می دهد.

استفاده از GPU با معماری ساده شده جدید

نتیجه

در این پست به اشتراک گذاشتیم که چگونه Nielsen Sports سیستمی را که هزاران مدل مختلف را در حال تولید در حال تولید است با استفاده از SageMaker MME مدرن کرد و هزینه عملیاتی و مالی آنها را تا 75% کاهش داد.

برای مطالعه بیشتر به ادامه مطلب مراجعه کنید:


درباره نویسنده

ایتان سلاایتان سلا یک معمار راه حل های تخصصی هوش مصنوعی و یادگیری ماشین مولد با خدمات وب آمازون است. او با مشتریان AWS برای ارائه راهنمایی و کمک فنی کار می کند و به آنها کمک می کند تا راه حل های هوش مصنوعی و یادگیری ماشینی را در AWS بسازند و به کار گیرند. ایتان در اوقات فراغت خود از دویدن و خواندن جدیدترین مقالات یادگیری ماشین لذت می برد.

گال گلدمنگال گلدمن یک مهندس نرم افزار ارشد و یک معمار ارشد راه حل سازمانی در AWS با اشتیاق به راه حل های پیشرفته است. او در بسیاری از خدمات و راه حل های یادگیری ماشینی توزیع شده تخصص دارد و توسعه داده است. گال همچنین بر کمک به مشتریان AWS برای تسریع و غلبه بر چالش‌های مهندسی و هوش مصنوعی خود تمرکز می‌کند.

تال پنچکتال پنچک مدیر ارشد توسعه کسب و کار برای هوش مصنوعی و یادگیری ماشین با خدمات وب آمازون است. به عنوان یک متخصص BD، او مسئول افزایش پذیرش، استفاده و درآمد برای خدمات AWS است. او نیازهای مشتری و صنعت را جمع آوری می کند و با تیم های محصول AWS برای نوآوری، توسعه و ارائه راه حل های AWS شریک می شود.

تامیر روبینسکیتامیر روبینسکی رهبری مهندسی تحقیق و توسعه جهانی در Nielsen Sports را بر عهده دارد و تجربه گسترده ای در ساخت محصولات نوآورانه و مدیریت تیم های با عملکرد بالا به ارمغان می آورد. کار او ارزیابی رسانه اسپانسر ورزشی را از طریق راه حل های خلاقانه و مبتنی بر هوش مصنوعی متحول کرد.

آویاد آرانیاسآویاد آرانیاس یک رهبر تیم MLOps و معمار تجزیه و تحلیل ورزشی نیلسن است که در ساخت خطوط لوله پیچیده برای تجزیه و تحلیل ویدیوهای رویدادهای ورزشی در کانال های متعدد تخصص دارد. او در ساخت و استقرار مدل‌های یادگیری عمیق برای مدیریت کارآمد داده‌های مقیاس بزرگ برتر است. او در اوقات فراغت خود از پخت پیتزاهای خوشمزه ناپلی لذت می برد.

نقطه_img

جدیدترین اطلاعات

نقطه_img

چت با ما

سلام! چگونه می توانم به شما کمک کنم؟