Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.

Αυτό το εξαιρετικά ελαφρύ μοντέλο AI ταιριάζει στο τηλέφωνό σας και μπορεί να νικήσει το ChatGPT – Decrypt

Ημερομηνία:

Η Microsoft σήμερα ισχυρίστηκε ότι έχει κυκλοφορήσει «τα πιο ικανά και οικονομικά αποδοτικά μοντέλα μικρών γλωσσών (SLM) που είναι διαθέσιμα», λέγοντας Phi-3— η τρίτη επανάληψη του Phi οικογένεια μικρών γλωσσικών μοντέλων (SLMs)—υπερτερεί από μοντέλα συγκρίσιμου μεγέθους και μερικά μεγαλύτερα.

Ένα μοντέλο μικρής γλώσσας (SLM) είναι ένας τύπος μοντέλου τεχνητής νοημοσύνης που έχει σχεδιαστεί για να είναι εξαιρετικά αποτελεσματικός στην εκτέλεση συγκεκριμένων εργασιών που σχετίζονται με τη γλώσσα. Σε αντίθεση με τα μοντέλα μεγάλων γλωσσών (LLM), τα οποία είναι κατάλληλα για ένα ευρύ φάσμα γενικών εργασιών, τα SLM είναι χτισμένα σε μικρότερο σύνολο δεδομένων για να τα καθιστούν πιο αποτελεσματικά και οικονομικά αποδοτικά για συγκεκριμένες περιπτώσεις χρήσης.

Το Phi-3 έρχεται σε διαφορετικές εκδόσεις, εξήγησε η Microsoft, με το μικρότερο να είναι το Phi-3 Mini, ένα μοντέλο 3.8 δισεκατομμυρίων παραμέτρων που έχει εκπαιδευτεί σε 3.3 τρισεκατομμύρια μάρκες. Παρά το σχετικά μικρό του μέγεθος — το σώμα του Llama-3 βαραίνει 15 τρισεκατομμύρια διακριτικά δεδομένων—Το Phi-3 Mini εξακολουθεί να είναι σε θέση να χειρίζεται 128K διακριτικά περιβάλλοντος. Αυτό το καθιστά συγκρίσιμο με το GPT-4 και ξεπερνά το Llama-3 και το Mistral Large όσον αφορά την χωρητικότητα συμβολαίων.

Με άλλα λόγια, μεγαθήρια τεχνητής νοημοσύνης όπως το Llama-3 στο Meta.ai και το Mistral Large θα μπορούσαν να καταρρεύσουν μετά από μια μακρά συνομιλία ή μια προτροπή πολύ πριν αυτό το ελαφρύ μοντέλο αρχίσει να δυσκολεύεται.

Ένα από τα πιο σημαντικά πλεονεκτήματα του Phi-3 Mini είναι η ικανότητά του να ταιριάζει και να λειτουργεί σε ένα τυπικό smartphone. Η Microsoft δοκίμασε το μοντέλο σε ένα iPhone 14 και έτρεξε χωρίς προβλήματα, δημιουργώντας 14 διακριτικά ανά δευτερόλεπτο. Η εκτέλεση του Phi-3 Mini απαιτεί μόνο 1.8 GB VRAM, καθιστώντας το μια ελαφριά και αποτελεσματική εναλλακτική λύση για χρήστες με πιο εστιασμένες απαιτήσεις.

Αν και το Phi-3 Mini μπορεί να μην είναι τόσο κατάλληλο για κωδικοποιητές προηγμένης τεχνολογίας ή άτομα με ευρείες απαιτήσεις, μπορεί να είναι μια αποτελεσματική εναλλακτική λύση για χρήστες με συγκεκριμένες ανάγκες. Για παράδειγμα, οι νεοσύστατες επιχειρήσεις που χρειάζονται ένα chatbot ή άτομα που χρησιμοποιούν LLM για ανάλυση δεδομένων μπορούν να χρησιμοποιήσουν το Phi-3 Mini για εργασίες όπως οργάνωση δεδομένων, εξαγωγή πληροφοριών, μαθηματικός συλλογισμός και δημιουργία πρακτόρων. Εάν δοθεί στο μοντέλο πρόσβαση στο διαδίκτυο, μπορεί να γίνει αρκετά ισχυρό, αντισταθμίζοντας την έλλειψη δυνατοτήτων με πληροφορίες σε πραγματικό χρόνο.

Το Phi-3 Mini επιτυγχάνει υψηλές βαθμολογίες δοκιμών λόγω της εστίασης της Microsoft στην επιμέλεια των δεδομένων της με τις πιο χρήσιμες πληροφορίες. Η ευρύτερη οικογένεια Phi, στην πραγματικότητα, δεν είναι καλή για εργασίες που απαιτούν πραγματικές γνώσεις, αλλά οι υψηλές συλλογιστικές δεξιότητες τους τοποθετούν πάνω από τους μεγάλους ανταγωνιστές. Το Phi-3 Medium (ένα μοντέλο παραμέτρων 14 δισεκατομμυρίων) ξεπερνά σταθερά τα ισχυρά LLM όπως το GPT-3.5 —το LLM που τροφοδοτεί τη δωρεάν έκδοση του ChatGPT— και η έκδοση Mini ξεπερνά τα ισχυρά μοντέλα όπως το Mixtral-8x7B στην πλειονότητα των συνθετικών σημείων αναφοράς.

Αξίζει να σημειωθεί, ωστόσο, ότι το Phi-3 δεν είναι ανοιχτού κώδικα όπως ο προκάτοχός του, το Phi-2. Αντίθετα, είναι ένα ανοιχτό μοντέλο, που σημαίνει ότι είναι προσβάσιμο και διαθέσιμο για χρήση, αλλά δεν έχει την ίδια άδεια χρήσης ανοιχτού κώδικα με το Phi-2, κάτι που επιτρέπει ευρύτερη χρήση και εμπορικές εφαρμογές.

Τις επόμενες εβδομάδες, η Microsoft είπε ότι θα κυκλοφορήσει περισσότερα μοντέλα στην οικογένεια Phi-3, συμπεριλαμβανομένου του Phi-3 Small (7 δισεκατομμύρια παράμετροι) και του προαναφερθέντος Phi-3 Medium.

Η Microsoft έχει κάνει το Phi-3 Mini διαθέσιμο στα Azure AI Studio, Hugging Face και Ollama. Το μοντέλο είναι ρυθμισμένο με οδηγίες και βελτιστοποιημένο για ONNX Runtime με υποστήριξη για Windows DirectML, καθώς και υποστήριξη πολλαπλών πλατφορμών σε διαφορετικές GPU, CPU, ακόμη και υλικό για φορητές συσκευές.

Μείνετε ενημερωμένοι για τα νέα κρυπτογράφησης, λάβετε καθημερινές ενημερώσεις στα εισερχόμενά σας.

spot_img

Τελευταία Νοημοσύνη

spot_img

Συνομιλία με μας

Γεια σου! Πώς μπορώ να σε βοηθήσω?