Platon Data Intelligence.
Vertikal søgning & Ai.

Databricks hævder sin open source LLM overliste GPT-3.5

Dato:

Analyseplatform Databricks har lanceret en open source-grundlæggende stor sprogmodel i håb om, at virksomheder vil vælge at bruge dets værktøjer til at hoppe med på LLM-vognen.

Biz'en, der blev grundlagt omkring Apache Spark, udgav en række benchmarks, der hævdede, at dens generelle LLM - kaldet DBRX - slog open source-rivaler inden for sprogforståelse, programmering og matematik. Udvikleren hævdede også, at den slog OpenAI's proprietære GPT-3.5 på tværs af de samme mål.

DBRX er udviklet af Mosaic AI, som Databricks erhvervet for 1.3 milliarder dollars og trænet på Nvidia DGX Cloud. Databricks hævder, at det har optimeret DBRX til effektivitet med det, det kalder en blanding af eksperter (MoE) arkitektur – hvor flere ekspertnetværk eller elever deler et problem op.

Databricks forklarede, at modellen besidder 132 milliarder parametre, men kun 36 milliarder er aktive på ethvert input.

Joel Minnick, Databricks marketing vicepræsident, fortalte Registret: “Det er en stor grund til, at modellen er i stand til at køre så effektivt, som den gør, men også kører lynende hurtigt. Rent praktisk, hvis du bruger nogen form for store chatbots, der er derude i dag, er du sandsynligvis vant til at vente og se svaret blive genereret. Med DBRX er det næsten øjeblikkeligt."

Men selve modellens ydeevne er ikke pointen for Databricks. Den biz er jo at gøre DBRX tilgængelig for gratis på GitHub , Knusende ansigt.

Databricks håber, at kunderne bruger modellen som grundlag for deres egne LLM'er. Hvis det sker, kan det forbedre kundechatbots eller intern besvarelse af spørgsmål, samtidig med at det viser, hvordan DBRX blev bygget ved hjælp af Databricks' proprietære værktøjer.

Databricks sammensatte datasættet, hvorfra DBRX blev udviklet ved hjælp af Apache Spark og Databricks notebooks til databehandling, Unity Catalog til datastyring og -styring og MLflow til eksperimentsporing.

Minnick afslørede, at virksomhedsinvesteringer i LLM'er blev forsinket af frygt for tredjeparts ejerskab og ledelse. "At skulle flytte data ud til tredjeparter, ikke have ejerskab over modelvægtene, ikke være i stand til fuldt ud at kontrollere styringen af ​​dataene fra ende til anden - det er ting, der bremser dem," forklarede han.

"Det, vi satte os for at bygge, var en ekstremt effektiv ... model, som virksomheder kan bruge til at gå og bringe til deres egne applikationer til deres egne specifikke brugssager."

Hyoun Park, CEO og chefanalytiker hos Amalgam Insights, bemærkede, at betydningen af ​​DBRX er, at Databricks kan vise, hvordan modellen blev bygget, trin-for-trin, som en proces, som andre virksomheder kan følge og finjustere.

"Denne kombination af afstamning, synlighed, repeterbarhed og modelejerskab i end-to-end model tuning, test og operationalisering er vigtig."

Park bemærkede, at han forstod, at Databricks allerede havde bygget over 50,000 tilpassede modeller til kunder. "Det er den kombination af modelopbygningserfaring og evnen til at gøre det i stor skala med en højtydende model på niveau med de bedste private og open source-indsatser, der gør denne meddelelse bemærkelsesværdig for mig fra et virksomheds-it-perspektiv."

DBRX-nyhederne udspiller sig mod en skiftende konkurrencemæssig baggrund for Databricks. Biz'en har et langsigtet strategisk partnerskab med Microsoft, hvilket resulterede i Azure Databricks - hvor brugerne loves integrerede datatjenester tæt knyttet til Redmond-gigantens cloud-platform.

Men siden tilbuddet blev lanceret i 2017, har Microsoft bevæget sig ind på Databricks' lakehouse-marked – hvor brugerne tilbydes data warehousing og data lakes i ét miljø – og lover brugerne enterprise-grade LLM'er med sine 10 milliarder dollars OpenAI-partnerskab. I sit stofmiljø, Microsoft kan også tilbyde "spejling" fra dets transaktionsdatabasesystemer Azure Cosmos DB og Azure SQL DB, der giver adgang til analysetjenester uden at flytte data.

Et åbent spørgsmål, der hænger over både Databricks og Microsofts strategier, er, hvornår strømmen af ​​forventede investeringer i LLM-teknologier kommer. I januar, Gartner forudsagde virksomhedernes forbrug på teknologien kommer ikke i år og vil kun have ringe indflydelse på andre it-investeringer. ®

spot_img

Seneste efterretninger

spot_img

Chat med os

Hej! Hvordan kan jeg hjælpe dig?