Platon Data Intelligence.
Vertikal sökning & Ai.

Databricks hävdar att dess open source LLM överlistar GPT-3.5

Datum:

Analytics-plattformen Databricks har lanserat en öppen källkod för grundläggande stor språkmodell, i hopp om att företag kommer att välja att använda dess verktyg för att hoppa på LLM-tåget.

Affären, som grundades kring Apache Spark, publicerade en rad riktmärken som hävdade att dess allmänna LLM – kallat DBRX – slog rivaler med öppen källkod när det gäller språkförståelse, programmering och matematik. Utvecklaren hävdade också att den slog OpenAI:s egenutvecklade GPT-3.5 över samma mått.

DBRX utvecklades av Mosaic AI, som Databricks förvärvade för 1.3 miljarder dollar och tränade på Nvidia DGX Cloud. Databricks hävdar att den optimerade DBRX för effektivitet med vad den kallar en blandning av experter (MoE) arkitektur – där flera expertnätverk eller elever delar upp ett problem.

Databricks förklarade att modellen har 132 miljarder parametrar, men endast 36 miljarder är aktiva på en ingång.

Joel Minnick, Databricks marknadschef, berättade Registret: ”Det är en stor anledning till att modellen kan köras så effektivt som den gör, men också går blixtrande snabbt. Rent praktiskt, om du använder någon form av större chatbots som finns där ute idag, är du förmodligen van vid att vänta och se svaret genereras. Med DBRX är det nästan omedelbart."

Men själva modellens prestanda är inte poängen för Databricks. Biz är trots allt att göra DBRX tillgänglig för gratis på GitHub och Kramande ansikte.

Databricks hoppas att kunderna använder modellen som grund för sina egna LLM. Om det händer kan det förbättra kundernas chatbots eller interna frågesvar, samtidigt som det visar hur DBRX byggdes med Databricks egna verktyg.

Databricks satte ihop datamängden från vilken DBRX utvecklades med Apache Spark och Databricks anteckningsböcker för databehandling, Unity Catalog för datahantering och styrning och MLflow för experimentspårning.

Minnick avslöjade att företagsinvesteringar i LLM:er försenades av rädsla för tredje parts ägande och styrning. "Att behöva flytta ut data till tredje part, inte ha äganderätt över modellvikterna, inte kunna kontrollera styrningen av data från början till slut - det här är saker som saktar ner dem", förklarade han.

"Vad vi tänkte bygga var en extremt effektiv ... modell som företag kan använda för att gå och ta till sina egna applikationer för sina egna specifika användningsfall."

Hyoun Park, VD och chefsanalytiker på Amalgam Insights, observerade att betydelsen av DBRX är att Databricks kan visa hur modellen byggdes, steg-för-steg, som en process för andra företag att följa och finjustera.

"Denna kombination av härstamning, synlighet, repeterbarhet och modellägande vid end-to-end-modelljustering, testning och operationalisering är viktig."

Park noterade att han förstod att Databricks redan hade byggt över 50,000 XNUMX anpassade modeller för kunder. "Det är den kombinationen av erfarenhet av modellbyggande och förmågan att göra det i stor skala med en högpresterande modell i nivå med de bästa insatserna för privat och öppen källkod som gör detta tillkännagivande anmärkningsvärt för mig ur ett IT-företagsperspektiv."

DBRX-nyheterna utspelar sig mot en föränderlig konkurrenskraftig bakgrund för Databricks. Biz har ett långsiktigt strategiskt partnerskap med Microsoft, vilket resulterade i Azure Databricks – där användarna utlovas integrerade datatjänster nära knutna till Redmond-jättens molnplattform.

Men sedan erbjudandet lanserades 2017 har Microsoft flyttat in på Databricks lakehouse-marknad – där användarna erbjuds datalager och datasjöar i en miljö – och lovar användarna företagsklassade LLM:er med dess 10 miljarder dollar OpenAI-partnerskap. I sin tygmiljö, Microsoft kan också erbjuda "spegling" från dess transaktionsdatabassystem Azure Cosmos DB och Azure SQL DB, vilket ger tillgång till analystjänster utan att flytta data.

En öppen fråga som hänger över strategierna för både Databricks och Microsoft är när floden av förväntade investeringar i LLM-teknologier kommer att anlända. I januari, Gartner förutspådde företagsutgifter för tekniken kommer inte att komma i år och skulle ha liten inverkan på andra IT-investeringar. ®

plats_img

Senaste intelligens

plats_img

Chatta med oss

Hallå där! Hur kan jag hjälpa dig?