هوش داده افلاطون
جستجوی عمودی و هوش مصنوعی

Databricks ادعا می کند که LLM منبع باز آن از GPT-3.5 پیشی گرفته است

تاریخ:

پلتفرم تجزیه و تحلیل Databricks یک مدل زبان بزرگ پایه منبع باز راه اندازی کرده است، امیدوار است که شرکت ها از ابزارهای آن برای پرش به LLM استفاده کنند.

بیز که حول محور آپاچی اسپارک تأسیس شد، تعداد زیادی معیار را منتشر کرد که مدعی شد LLM همه منظوره آن – با نام DBRX – رقبای متن باز در درک زبان، برنامه نویسی و ریاضیات را شکست داده است. توسعه‌دهنده همچنین ادعا کرد که GPT-3.5 اختصاصی OpenAI را در همان معیارها شکست داده است.

DBRX توسط Mosaic AI توسعه یافته است که Databricks به دست آمد 1.3 میلیارد دلار، و در Nvidia DGX Cloud آموزش دید. Databricks ادعا می کند که DBRX را برای کارایی با آنچه که معماری ترکیبی از متخصصان (MoE) می نامد بهینه کرده است - جایی که چندین شبکه متخصص یا یادگیرنده یک مشکل را تقسیم می کنند.

دیتبریکس توضیح داد که مدل دارای 132 میلیارد پارامتر است، اما تنها 36 میلیارد آن در هر ورودی فعال است.

جوئل مینیک، معاون بازاریابی Databricks، گفت ثبت نام: «این دلیل بزرگی است که چرا این مدل می‌تواند به همان اندازه کارآمد کار کند، اما همچنین به سرعت کار می‌کند. به طور عملی، اگر از هر نوع چت ربات اصلی استفاده می کنید که امروزه وجود دارد، احتمالاً عادت کرده اید منتظر بمانید و مشاهده کنید که پاسخ تولید می شود. با DBRX تقریباً آنی است."

اما عملکرد خود مدل برای Databricks مهم نیست. به هر حال، کار این است که DBRX را در دسترس قرار دهد رایگان در GitHub و در آغوش کشیدن صورت.

Databricks امیدوار است مشتریان از این مدل به عنوان پایه ای برای LLM های خود استفاده کنند. اگر این اتفاق بیفتد، ممکن است ربات‌های چت مشتری یا پاسخ‌دهی به سؤالات داخلی را بهبود بخشد، در حالی که نشان می‌دهد چگونه DBRX با استفاده از ابزارهای اختصاصی Databricks ساخته شده است.

Databricks مجموعه داده ای را که DBRX از آن با استفاده از نوت بوک های Apache Spark و Databricks برای پردازش داده ها، Unity Catalog برای مدیریت و حاکمیت داده، و MLflow برای ردیابی آزمایشی توسعه داده شده است، گرد هم می آورد.

Minnick فاش کرد که سرمایه گذاری سازمانی در LLM به دلیل ترس از مالکیت و حاکمیت شخص ثالث به تعویق افتاده است. او توضیح داد: «نیاز به انتقال داده‌ها به اشخاص ثالث، نداشتن مالکیت بر وزن‌های مدل، ناتوانی در کنترل کامل حاکمیت داده‌ها از انتها به انتها - اینها چیزهایی هستند که سرعت آنها را کاهش می‌دهند.»

«آنچه ما قصد ساختن آن را داشتیم، یک مدل بسیار کارآمد بود که شرکت‌ها می‌توانند از آن برای استفاده از برنامه‌های کاربردی خود برای موارد استفاده خاص خود استفاده کنند.»

هیون پارک، مدیر عامل و تحلیلگر ارشد Amalgam Insights، مشاهده کرد که اهمیت DBRX در این است که Databricks می‌تواند نحوه ساخت مدل را به‌عنوان فرآیندی برای سایر شرکت‌ها به‌عنوان گام به گام نشان دهد که باید آن‌ها را دنبال کنند.

"این ترکیبی از اصل و نسب، قابل مشاهده بودن، تکرارپذیری و مالکیت مدل در تنظیم، آزمایش و عملیاتی کردن مدل سرتاسر مهم است."

پارک خاطرنشان کرد که او متوجه شده است که Databricks در حال حاضر بیش از 50,000 مدل سفارشی برای مشتریان ساخته است. "این ترکیبی از تجربه ساخت مدل و توانایی انجام آن در مقیاس با یک مدل با عملکرد بالا و همتراز با بهترین تلاش‌های خصوصی و منبع باز است که این اعلامیه را از دیدگاه فناوری اطلاعات سازمانی برای من قابل توجه می‌کند."

اخبار DBRX در برابر یک پس‌زمینه رقابتی در حال تغییر برای Databricks پخش می‌شود. بیز یک همکاری استراتژیک بلندمدت با مایکروسافت دارد که منجر به Azure Databricks شد – که در آن به کاربران وعده داده می‌شود که خدمات داده یکپارچه که نزدیک به پلتفرم ابری غول ردموند باشد.

اما از زمان ارائه پیشنهاد در سال 2017، مایکروسافت به بازار Lakehouse Databricks - جایی که به کاربران در یک محیط انبار داده و دریاچه‌های داده ارائه می‌شود- نقل مکان کرد و به کاربران وعده LLM درجه سازمانی را می‌دهد. 10 میلیارد دلار آن مشارکت OpenAI در محیط فابریک آن، مایکروسافت نیز می تواند ارائه دهد "آینه سازی" از سیستم های پایگاه داده تراکنشی آن Azure Cosmos DB و Azure SQL DB، ارائه دسترسی به خدمات تحلیلی بدون جابجایی داده ها.

یک سوال باز در مورد استراتژی های Databricks و Microsoft این است که سیل سرمایه گذاری مورد انتظار در فناوری های LLM چه زمانی از راه می رسد. در ژانویه، گارتنر پیش بینی کرد هزینه های سازمانی برای این فناوری امسال انجام نخواهد شد و تأثیر کمی بر سایر سرمایه گذاری های فناوری اطلاعات خواهد داشت. ®

نقطه_img

جدیدترین اطلاعات

نقطه_img

چت با ما

سلام! چگونه می توانم به شما کمک کنم؟