Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.

Η Meta αποκαλύπτει το Llama-3—Δοκιμάζουμε το νέο κορυφαίο μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα – Αποκρυπτογράφηση

Ημερομηνία:

Η Meta κυκλοφόρησε το Llama 3, το πιο προηγμένο μοντέλο ανοιχτού κώδικα μεγάλης γλώσσας που είναι διαθέσιμο αυτή τη στιγμή. Χτίζεται στα θεμέλια που έθεσε ο προκάτοχός του, Llama 2, και ήταν έκπληξη δεδομένου ότι οι φήμες υποδήλωναν ότι η κυκλοφορία θα γίνει τον επόμενο μήνα.

Με τις ρίζες ανοιχτού κώδικα, το Llama-2 ήταν καθοριστικό για την ταυτόχρονη ανάπτυξη άλλων ισχυρών μοντέλων όπως Mixtral, Alpaca, Vicuna και WizardLM. Τώρα, το Llama-3 υπόσχεται να προχωρήσει ακόμη περισσότερο αυτές τις δυνατότητες, προσφέροντας λειτουργίες συγκρίσιμες με αυτές του τρέχοντος εμβληματικού μοντέλου τεχνητής νοημοσύνης του OpenAI GPT-4.

Meta χαιρέτισε την απελευθέρωση της Πέμπτης ως «η επόμενη γενιά του υπερσύγχρονου μοντέλου ανοιχτού κώδικα μεγάλης γλώσσας». Τόσο σίγουρος είναι ο τεχνολογικός γίγαντας στις δυνατότητές του, το Llama 3 τροφοδοτεί Meta AI, που με τη σειρά του προστέθηκε σε όλα σχεδόν της εταιρείας μαζικά δημοφιλείς εφαρμογές: Instagram, Facebook και WhatsApp. Έχει γίνει διαθέσιμο σε επιλεγμένες χώρες, αλλά οι χρήστες σε άλλες περιοχές μπορούσαν να έχουν πρόσβαση σε αυτό μέσω VPN.

Η διεπαφή Chatbot του Meta AI είναι συγκρίσιμη με το ChatGPT Plus—και είναι δωρεάν.

"Αναβαθμίζουμε το Meta AI με το νέο μας υπερσύγχρονο μοντέλο Llama 3 AI, το οποίο διαθέτουμε ανοιχτή πηγή", Mark Zuckerberg είπε σε ανάρτηση στο Facebook. "Με αυτό το νέο μοντέλο, πιστεύουμε ότι το Meta AI είναι πλέον ο πιο έξυπνος βοηθός AI που μπορείτε να χρησιμοποιήσετε ελεύθερα."

Αποκρυπτογράφηση μπόρεσε να δοκιμάσει τη νέα τεχνητή νοημοσύνη και βρήκε ότι ήταν εξίσου ικανό με το ChatGPT-Plus χωρίς συνδρομή επί πληρωμή. Μπορεί να δημιουργήσει εικόνες και κινούμενα σχέδια, να παράγει κώδικα και να παρέχει συνεκτικές, σχετικές με τα συμφραζόμενα απαντήσεις. Το νέο chatbot μπορεί επίσης να έχει πρόσβαση στο διαδίκτυο, αλλά εξακολουθεί να μην ταιριάζει με τις δυνατότητες εξειδικευμένων λύσεων όπως το Perplexity.

Ίσως το μόνο μειονέκτημα είναι ότι το τρέχον παράθυρο περιβάλλοντος του Llama-3 περιορίζεται σε 8K διακριτικά —περίπου 6,000 λέξεις.

Η Meta κυκλοφόρησε ένα μοντέλο Llama-70 παραμέτρων 3 δισεκατομμυρίων, αλλά η χρήση του θα απαιτούσε μεγάλη υπολογιστική ισχύ—πιθανότατα ένα ολόκληρο ράφι GPU. Σύμφωνα με τα συνθετικά σημεία αναφοράς, αυτό το μοντέλο ξεπερνά τα Gemini 1.5 Pro και Claude 3 Sonnet.

Υπάρχει επίσης διαθέσιμο μοντέλο παραμέτρων 8 δισεκατομμυρίων, το οποίο μπορεί να εκτελεστεί τοπικά σε GPU καταναλωτικής ποιότητας. Αυτό ξεπερνά το Gemma και το Mistral 7B της Google σε διάφορα συνθετικά σημεία αναφοράς. Το μοντέλο δεν έχει ακόμη καταχωρηθεί στο LLM Arena, επομένως δεν υπάρχει υποκειμενική βαθμολογία ELO για αναφορά ακόμα.

Llama 3 εναντίον άλλων AI LLM
Εικόνα: Meta

Και τα δύο μοντέλα μπορούν επίσης να εκτελεστούν σε περιπτώσεις cloud με χαμηλότερο κόστος.

«Είμαστε αφοσιωμένοι στην ανάπτυξη του Llama 3 με υπεύθυνο τρόπο και προσφέρουμε διάφορους πόρους για να βοηθήσουμε και άλλους να το χρησιμοποιήσουν με υπευθυνότητα», δήλωσε ο Meta. Αυτό περιλαμβάνει την εισαγωγή νέων εργαλείων εμπιστοσύνης και ασφάλειας, όπως το Llama Guard 2, το Code Shield και το CyberSec Eval 2.

Τους επόμενους μήνες, η Meta λέει ότι σχεδιάζει να παρουσιάσει νέες δυνατότητες, μεγαλύτερα παράθυρα περιβάλλοντος, πρόσθετα μεγέθη μοντέλων και βελτιωμένη απόδοση. Θα κοινοποιηθεί επίσης η ερευνητική εργασία Llama 3.

«Το Meta AI, κατασκευασμένο με την τεχνολογία Llama 3, είναι τώρα ένας από τους κορυφαίους βοηθούς τεχνητής νοημοσύνης στον κόσμο που μπορεί να ενισχύσει τη νοημοσύνη σας και να ελαφρύνει το φόρτο σας—βοηθώντας σας να μάθετε, να κάνετε πράγματα, να δημιουργήσετε περιεχόμενο και να συνδεθείτε για να αξιοποιήσετε στο έπακρο την κάθε στιγμή », είπε ο Μέτα.

Η Meta πρόσθεσε ότι εκπαιδεύει επίσης ένα τεράστιο μοντέλο παραμέτρων 400 δισεκατομμυρίων, το οποίο αναμένεται να κυκλοφορήσει αργότερα μέσα στο έτος. Αυτό το μοντέλο—πιθανότατα συγκρίσιμο με το Claude Opus ή την πιο πρόσφατη έκδοση του GPT-4.5—θα μπορούσε να είναι το πιο ισχυρό μοντέλο ανοιχτού κώδικα μέχρι σήμερα. Εάν η Ιστορία επαναληφθεί, θα χρησιμεύσει επίσης ως βάση για μια νέα γενιά μοντέλων με λεπτή ρύθμιση που θα νικήσει το Llama-3 σε συνολική ποιότητα—και θα τονώσει τον ανταγωνισμό έναντι των κορυφαίων μοντέλων κοντινής πηγής.

Ιππασία στη Λάμα

Αποκρυπτογράφηση δοκίμασε το Llama-3 μέσα στο Meta AI για να δει αν ήταν τόσο καλό όσο λέει ο Zuck. Εν ολίγοις, το Llama-3 έχει εισαγάγει μια σειρά από αξιοσημείωτα χαρακτηριστικά και δυνατότητες και θα πρέπει να είναι ένα εξαιρετικό θεμελιώδες μοντέλο πάνω στο οποίο η κοινότητα ανοιχτού κώδικα μπορεί να επαναλάβει.

Μετριασμός περιεχομένου

Το Llama-3 επιδεικνύει μια ισχυρή δέσμευση στη μετριοπάθεια περιεχομένου. Αρνήθηκε σταθερά να δημιουργήσει επιβλαβές φυλετικό περιεχόμενο, ακόμη και όταν αντιμετώπιζε κοινές τεχνικές jailbreak.

Για παράδειγμα, όταν ζητήθηκε από το μοντέλο οδηγίες για το πώς να αποπλανήσει μια γυναίκα, έδωσε γενικές αλλά χρήσιμες απαντήσεις. Ωστόσο, όταν του ζητήθηκε οδηγίες για το πώς να αποπλανήσει τη σύζυγο ενός καλύτερου φίλου, το μοντέλο αρνήθηκε κατηγορηματικά να δώσει μια απάντηση.

Εικόνες και κινούμενα σχέδια

Παρόμοια με το ChatGPT-Plus, το Meta AI με το Llama-3 είναι ικανό να δημιουργεί εικόνες. Ωστόσο, προχωρά αυτή η δυνατότητα ένα βήμα παραπέρα, προσφέροντας την επιλογή να τα κινούμε—μια δυνατότητα που δεν είναι διαθέσιμη στο ChatGPT ή στο Gemini.

Οι εικόνες που δημιουργούνται από το Meta AI με το Llama-3 είναι πιο ρεαλιστικές από αυτές που παράγονται από το Dalle-3, αλλά υπολείπονται της ποιότητας των εικόνων που δημιουργούνται από το επερχόμενο ImageFX της Google.

Δυνατότητες κωδικοποίησης

Το Llama-3 έχει αποδειχθεί πολύ ικανό στην κωδικοποίηση. Όταν παρουσιάστηκε μια μοναδική και κακώς επεξηγημένη ιδέα παιχνιδιού, το μοντέλο μπόρεσε να δημιουργήσει τον απαραίτητο κώδικα Python σε δύο προσπάθειες, με αποτέλεσμα ένα λειτουργικό παιχνίδι. Η πρώτη λήψη μας έδωσε μια πρόχειρη ιδέα για το πώς να δημιουργήσουμε το παιχνίδι, αλλά δημιούργησε κώδικα εργασίας αφού ξεκαθαρίσαμε ότι τον χρειαζόμασταν στην Python.

Το παιχνίδι ήταν λειτουργικό αλλά έχασε μερικές μικρές λεπτομέρειες, όπως η επανεκκίνηση μετά τη νίκη ενός παίκτη. Το ίδιο συνέβη και με άλλα chatbots, όμως.

Βρήκαμε ότι το Claude 3 Sonnet είναι το καλύτερο εργαλείο για αυτήν την εργασία, ακολουθούμενο από το Llama 3. Το GPT-4 πέφτει στην τρίτη θέση. Ωστόσο, διαφορετικοί χρήστες ενδέχεται να έχουν διαφορετικά αποτελέσματα.

Εδώ είναι μία pastebin με τους πηγαίους κώδικες που δημιουργούνται από τους Llama3, Claude και ChatGPT για όσους ενδιαφέρονται να τους δοκιμάσουν.

Πολιτική ουδετερότητα

Το μοντέλο στοχεύει στην πολιτική ουδετερότητα, όπως αποδεικνύεται από τις απαντήσεις του σε ερωτήσεις σχετικά με τον καπιταλισμό και τον κομμουνισμό. Οι απαντήσεις ήταν δομικά παρόμοιες, παρέχοντας μια εισαγωγή, τα πλεονεκτήματα και τα μειονεκτήματα για κάθε σύστημα.

Αυτό το πρότυπο ουδετερότητας παρατηρήθηκε επίσης σε απαντήσεις σε ερωτήσεις όπως «Τι είναι ένας άντρας;» και «Τι είναι γυναίκα;»

Ωστόσο, οι απαντήσεις του είναι ελαφρώς υπέρ του καπιταλισμού και της αριστερής κλίσης, κάτι που δεν προκαλεί έκπληξη, καθώς είναι το πιο κοινή πολιτική τάση μεταξύ μεγάλων γλωσσικών μοντέλων.

Λογική λογική

Το Llama-3 έχει δείξει ισχυρές λογικές συλλογιστικές ικανότητες. Όταν δοκιμάστηκε με σύνθετες ερωτήσεις LSAT που συχνά μπερδεύουν τους χρήστες, το μοντέλο όχι μόνο παρείχε σωστές απαντήσεις αλλά πρόσφερε και σαφείς και λογικές εξηγήσεις.

Όρια μακροπρόθεσμα

Παρά τα πολλά δυνατά του σημεία, το Llama-3 παλεύει με μεγάλες προτροπές. Όταν παρουσιάζεται με μια μακροσκελή προτροπή περίπου μιάμιση σελίδας περιβάλλοντος—το οποίο μπορεί να απορροφηθεί από μοντέλα όπως το GPT-4, το Claude ή το Mistral—το μοντέλο επέστρεψε ένα μήνυμα σφάλματος.

Γλωσσική κατανόηση

Το μοντέλο δείχνει μια ισχυρή κατανόηση διαφορετικών γλωσσών. Όταν του ζητήθηκε να μεταφράσει ένα ισπανικό σύνθημα, όχι μόνο παρείχε μια ακριβή μετάφραση αλλά πρόσφερε και πλαίσιο για την καλύτερη κατανόηση του σλόγκαν.

Συμπέρασμα

Ως διεπαφή chatbot, το Meta AI (το οποίο υποστηρίζεται από το Llama3) μπορεί να ανταγωνιστεί το ChatGPT Plus και είναι συνολικά μια εξαιρετική επιλογή.

Σε πιο τεχνικό επίπεδο, το LLama3 ως LLM είναι αρκετά καλό για να ανταγωνίζεται το GPT-4 σε διαφορετικά σενάρια, χάνοντας μόνο ως προς τις δυνατότητες πλαισίου διακριτικών και τις επαυξημένες γενιές ανάκτησης (βασικά αντλώντας πληροφορίες από ένα συγκεκριμένο σύνολο δεδομένων που παρέχεται από τον χρήστη). Αυτό μπορεί να είναι σημαντικό για χρήστες που γνωρίζουν την τεχνολογία, αλλά μπορεί να μην είναι μεγάλο θέμα για τον καθημερινό άνθρωπο.

Εάν χρησιμοποιείτε κυρίως το ChatGPT για τη δημιουργία εικόνων με το Dall-E, ίσως θελήσετε να σκεφτείτε να ακυρώσετε τη συνδρομή σας, καθώς οι δυνατότητες δημιουργίας εικόνων και κινούμενων εικόνων του Llama-3 είναι συγκρίσιμες. Ωστόσο, εάν χρειάζεστε επίσης υποστήριξη για μεγάλες προτροπές, το Llama-3 μπορεί να μην είναι η καλύτερη επιλογή για εσάς και ίσως θέλετε να εξετάσετε το ενδεχόμενο να παραμείνετε στο ChatGPT-Plus.

Περιστασιακές χρήστες μπορεί να διαπιστώσουν ότι το Llama-3 καλύπτει τις ανάγκες τους χωρίς να απαιτείται συνδρομή επί πληρωμή.

Για εργασίες που απαιτούν έντονη έρευνα στο διαδίκτυο, το ChatGPT Plus ή το Perplexity μπορεί να είναι πιο κατάλληλο.

Τέλος, εάν η εστίασή σας είναι στην κωδικοποίηση, το Llama-3 θα μπορούσε να είναι μια καλή εναλλακτική, αν και υπάρχουν διαθέσιμα άλλα εξειδικευμένα εργαλεία. Το γεγονός ότι το Llama-3 είναι ελεύθερο είναι ένα σημαντικό πλεονέκτημα.

Επιμέλεια: Ράιαν Οζάουα.

Μείνετε ενημερωμένοι για τα νέα κρυπτογράφησης, λάβετε καθημερινές ενημερώσεις στα εισερχόμενά σας.

spot_img

Τελευταία Νοημοσύνη

spot_img

Συνομιλία με μας

Γεια σου! Πώς μπορώ να σε βοηθήσω?