Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.

Η Databricks ισχυρίζεται ότι το LLM ανοιχτού κώδικα ξεπερνά το GPT-3.5

Ημερομηνία:

Η πλατφόρμα Analytics Databricks κυκλοφόρησε ένα θεμελιώδες μοντέλο μεγάλης γλώσσας ανοιχτού κώδικα, ελπίζοντας ότι οι επιχειρήσεις θα επιλέξουν να χρησιμοποιήσουν τα εργαλεία της για να ξεκινήσουν το LLM.

Η biz, που ιδρύθηκε γύρω από το Apache Spark, δημοσίευσε μια σειρά από σημεία αναφοράς υποστηρίζοντας ότι το LLM γενικής χρήσης - με το όνομα DBRX - κέρδισε τους ανταγωνιστές ανοιχτού κώδικα στην κατανόηση γλώσσας, τον προγραμματισμό και τα μαθηματικά. Ο προγραμματιστής ισχυρίστηκε επίσης ότι κέρδισε το αποκλειστικό GPT-3.5 του OpenAI με τα ίδια μέτρα.

Το DBRX αναπτύχθηκε από τη Mosaic AI, η οποία Τούβλα δεδομένων που αποκτήθηκαν για 1.3 δισεκατομμύρια δολάρια και εκπαιδεύτηκε στο Nvidia DGX Cloud. Η Databricks ισχυρίζεται ότι βελτιστοποίησε το DBRX για αποτελεσματικότητα με αυτό που αποκαλεί αρχιτεκτονική μείγματος εμπειρογνωμόνων (MoE) – όπου πολλά δίκτυα ειδικών ή εκπαιδευόμενοι χωρίζουν ένα πρόβλημα.

Ο Databricks εξήγησε ότι το μοντέλο διαθέτει 132 δισεκατομμύρια παραμέτρους, αλλά μόνο 36 δισεκατομμύρια είναι ενεργές σε οποιαδήποτε είσοδο.

Ο Joel Minnick, αντιπρόεδρος μάρκετινγκ της Databricks είπε Το μητρώο: «Αυτός είναι ένας μεγάλος λόγος για τον οποίο το μοντέλο είναι σε θέση να λειτουργεί τόσο αποτελεσματικά όσο κάνει, αλλά και να τρέχει απίστευτα γρήγορα. Σε πρακτικούς όρους, εάν χρησιμοποιείτε οποιοδήποτε είδος σημαντικών chatbots που υπάρχουν σήμερα εκεί έξω, πιθανότατα έχετε συνηθίσει να περιμένετε και να βλέπετε την απάντηση να δημιουργείται. Με το DBRX είναι σχεδόν στιγμιαία."

Αλλά η απόδοση του ίδιου του μοντέλου δεν είναι το ζητούμενο για τα Databricks. Το θέμα είναι, σε τελική ανάλυση, η διάθεση του DBRX για δωρεάν στο GitHub και Αγκαλιάζοντας το πρόσωπο.

Η Databricks ελπίζει ότι οι πελάτες χρησιμοποιούν το μοντέλο ως βάση για τα δικά τους LLM. Εάν συμβεί αυτό, ενδέχεται να βελτιώσει τα chatbots των πελατών ή την εσωτερική απάντηση ερωτήσεων, ενώ θα δείξει επίσης πώς κατασκευάστηκε το DBRX χρησιμοποιώντας τα ιδιόκτητα εργαλεία της Databricks.

Τα Databricks συνέθεσαν το σύνολο δεδομένων από το οποίο αναπτύχθηκε το DBRX χρησιμοποιώντας σημειωματάρια Apache Spark και Databricks για επεξεργασία δεδομένων, Unity Catalog για διαχείριση και διακυβέρνηση δεδομένων και MLflow για παρακολούθηση πειράματος.

Ο Minnick αποκάλυψε ότι η επιχειρηματική επένδυση σε LLMs καθυστέρησε από φόβους σχετικά με την ιδιοκτησία και τη διακυβέρνηση τρίτων. «Το να πρέπει να μεταφέρουμε δεδομένα σε τρίτους, να μην έχουμε ιδιοκτησία στα βάρη του μοντέλου, να μην μπορούμε να ελέγξουμε πλήρως τη διακυβέρνηση των δεδομένων από άκρο σε άκρο – αυτά είναι πράγματα που τα επιβραδύνουν», εξήγησε.

«Αυτό που ξεκινήσαμε να δημιουργήσουμε ήταν ένα εξαιρετικά αποτελεσματικό… μοντέλο που μπορούν να χρησιμοποιήσουν οι επιχειρήσεις για να μεταφέρουν στις δικές τους εφαρμογές για τις δικές τους συγκεκριμένες περιπτώσεις χρήσης».

Ο Hyoun Park, Διευθύνων Σύμβουλος και επικεφαλής αναλυτής της Amalgam Insights, παρατήρησε ότι η σημασία του DBRX έγκειται στο ότι τα Databricks μπορούν να δείξουν πώς κατασκευάστηκε το μοντέλο, βήμα-βήμα, ως μια διαδικασία που πρέπει να ακολουθήσουν και να συντονιστούν άλλες επιχειρήσεις.

"Αυτός ο συνδυασμός γενεαλογίας, ορατότητας, επαναληψιμότητας και ιδιοκτησίας μοντέλου στον συντονισμό, τη δοκιμή και τη λειτουργικότητα του μοντέλου από άκρο σε άκρο είναι σημαντικός."

Ο Park σημείωσε ότι κατάλαβε ότι η Databricks είχε ήδη δημιουργήσει πάνω από 50,000 προσαρμοσμένα μοντέλα για πελάτες. «Είναι αυτός ο συνδυασμός της εμπειρίας κατασκευής μοντέλων και της ικανότητας να το κάνω σε κλίμακα με ένα μοντέλο υψηλής απόδοσης που ισοδυναμεί με τις καλύτερες προσπάθειες ιδιωτικού και ανοιχτού κώδικα που κάνει αυτή την ανακοίνωση αξιοσημείωτη για μένα από την άποψη της επιχειρηματικής πληροφορικής».

Τα νέα του DBRX διαδραματίζονται σε ένα μεταβαλλόμενο ανταγωνιστικό περιβάλλον για τα Databricks. Η biz έχει μια μακροπρόθεσμη στρατηγική συνεργασία με τη Microsoft, η οποία οδήγησε στο Azure Databricks – όπου υπόσχονται στους χρήστες ολοκληρωμένες υπηρεσίες δεδομένων στενά συνδεδεμένες με την πλατφόρμα cloud του γίγαντα του Redmond.

Ωστόσο, από τότε που ξεκίνησε η προσφορά το 2017, η Microsoft έχει μετακινηθεί στην αγορά lakehouse της Databricks – όπου στους χρήστες προσφέρεται αποθήκευση δεδομένων και λίμνες δεδομένων σε ένα περιβάλλον – και υπόσχεται στους χρήστες LLM επιχειρηματικού επιπέδου με 10 δισεκατομμύρια δολάρια Συνεργασία OpenAI. Στο Υφασμάτινο περιβάλλον του, Η Microsoft μπορεί επίσης να προσφέρει «καθρεφτίζοντας» από τα συστήματα βάσης δεδομένων συναλλαγών Azure Cosmos DB και Azure SQL DB, προσφέροντας πρόσβαση σε υπηρεσίες ανάλυσης χωρίς μετακίνηση δεδομένων.

Ένα ανοιχτό ερώτημα που κρέμεται πάνω από τις στρατηγικές τόσο της Databricks όσο και της Microsoft είναι πότε θα φτάσει η πλημμύρα των αναμενόμενων επενδύσεων σε τεχνολογίες LLM. Τον Ιανουάριο, Ο Gartner προέβλεψε Οι δαπάνες των επιχειρήσεων για την τεχνολογία δεν θα έρθουν φέτος και θα έχουν μικρό αντίκτυπο σε άλλες επενδύσεις πληροφορικής. ®

spot_img

Τελευταία Νοημοσύνη

spot_img

Συνομιλία με μας

Γεια σου! Πώς μπορώ να σε βοηθήσω?