پلتفرم تجزیه و تحلیل Databricks یک مدل زبان بزرگ پایه منبع باز راه اندازی کرده است، امیدوار است که شرکت ها از ابزارهای آن برای پرش به LLM استفاده کنند.
بیز که حول محور آپاچی اسپارک تأسیس شد، تعداد زیادی معیار را منتشر کرد که مدعی شد LLM همه منظوره آن – با نام DBRX – رقبای متن باز در درک زبان، برنامه نویسی و ریاضیات را شکست داده است. توسعهدهنده همچنین ادعا کرد که GPT-3.5 اختصاصی OpenAI را در همان معیارها شکست داده است.
DBRX توسط Mosaic AI توسعه یافته است که Databricks به دست آمد 1.3 میلیارد دلار، و در Nvidia DGX Cloud آموزش دید. Databricks ادعا می کند که DBRX را برای کارایی با آنچه که معماری ترکیبی از متخصصان (MoE) می نامد بهینه کرده است - جایی که چندین شبکه متخصص یا یادگیرنده یک مشکل را تقسیم می کنند.
دیتبریکس توضیح داد که مدل دارای 132 میلیارد پارامتر است، اما تنها 36 میلیارد آن در هر ورودی فعال است.
جوئل مینیک، معاون بازاریابی Databricks، گفت ثبت نام: «این دلیل بزرگی است که چرا این مدل میتواند به همان اندازه کارآمد کار کند، اما همچنین به سرعت کار میکند. به طور عملی، اگر از هر نوع چت ربات اصلی استفاده می کنید که امروزه وجود دارد، احتمالاً عادت کرده اید منتظر بمانید و مشاهده کنید که پاسخ تولید می شود. با DBRX تقریباً آنی است."
اما عملکرد خود مدل برای Databricks مهم نیست. به هر حال، کار این است که DBRX را در دسترس قرار دهد رایگان در GitHub و در آغوش کشیدن صورت.
Databricks امیدوار است مشتریان از این مدل به عنوان پایه ای برای LLM های خود استفاده کنند. اگر این اتفاق بیفتد، ممکن است رباتهای چت مشتری یا پاسخدهی به سؤالات داخلی را بهبود بخشد، در حالی که نشان میدهد چگونه DBRX با استفاده از ابزارهای اختصاصی Databricks ساخته شده است.
Databricks مجموعه داده ای را که DBRX از آن با استفاده از نوت بوک های Apache Spark و Databricks برای پردازش داده ها، Unity Catalog برای مدیریت و حاکمیت داده، و MLflow برای ردیابی آزمایشی توسعه داده شده است، گرد هم می آورد.
Minnick فاش کرد که سرمایه گذاری سازمانی در LLM به دلیل ترس از مالکیت و حاکمیت شخص ثالث به تعویق افتاده است. او توضیح داد: «نیاز به انتقال دادهها به اشخاص ثالث، نداشتن مالکیت بر وزنهای مدل، ناتوانی در کنترل کامل حاکمیت دادهها از انتها به انتها - اینها چیزهایی هستند که سرعت آنها را کاهش میدهند.»
«آنچه ما قصد ساختن آن را داشتیم، یک مدل بسیار کارآمد بود که شرکتها میتوانند از آن برای استفاده از برنامههای کاربردی خود برای موارد استفاده خاص خود استفاده کنند.»
هیون پارک، مدیر عامل و تحلیلگر ارشد Amalgam Insights، مشاهده کرد که اهمیت DBRX در این است که Databricks میتواند نحوه ساخت مدل را بهعنوان فرآیندی برای سایر شرکتها بهعنوان گام به گام نشان دهد که باید آنها را دنبال کنند.
"این ترکیبی از اصل و نسب، قابل مشاهده بودن، تکرارپذیری و مالکیت مدل در تنظیم، آزمایش و عملیاتی کردن مدل سرتاسر مهم است."
پارک خاطرنشان کرد که او متوجه شده است که Databricks در حال حاضر بیش از 50,000 مدل سفارشی برای مشتریان ساخته است. "این ترکیبی از تجربه ساخت مدل و توانایی انجام آن در مقیاس با یک مدل با عملکرد بالا و همتراز با بهترین تلاشهای خصوصی و منبع باز است که این اعلامیه را از دیدگاه فناوری اطلاعات سازمانی برای من قابل توجه میکند."
اخبار DBRX در برابر یک پسزمینه رقابتی در حال تغییر برای Databricks پخش میشود. بیز یک همکاری استراتژیک بلندمدت با مایکروسافت دارد که منجر به Azure Databricks شد – که در آن به کاربران وعده داده میشود که خدمات داده یکپارچه که نزدیک به پلتفرم ابری غول ردموند باشد.
اما از زمان ارائه پیشنهاد در سال 2017، مایکروسافت به بازار Lakehouse Databricks - جایی که به کاربران در یک محیط انبار داده و دریاچههای داده ارائه میشود- نقل مکان کرد و به کاربران وعده LLM درجه سازمانی را میدهد. 10 میلیارد دلار آن مشارکت OpenAI در محیط فابریک آن، مایکروسافت نیز می تواند ارائه دهد "آینه سازی" از سیستم های پایگاه داده تراکنشی آن Azure Cosmos DB و Azure SQL DB، ارائه دسترسی به خدمات تحلیلی بدون جابجایی داده ها.
یک سوال باز در مورد استراتژی های Databricks و Microsoft این است که سیل سرمایه گذاری مورد انتظار در فناوری های LLM چه زمانی از راه می رسد. در ژانویه، گارتنر پیش بینی کرد هزینه های سازمانی برای این فناوری امسال انجام نخواهد شد و تأثیر کمی بر سایر سرمایه گذاری های فناوری اطلاعات خواهد داشت. ®
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://go.theregister.com/feed/www.theregister.com/2024/03/28/databricks_dbrx_llm/