Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.

Το Naver κάνει το ντεμπούτο του HyperCLOVA X LLM

Ημερομηνία:

Ο κορεατικός γίγαντας ιστού Naver έκανε το ντεμπούτο του την περασμένη εβδομάδα μια οικογένεια μεγάλων γλωσσικών μοντέλων με το όνομα HyperCLOVA X, η οποία ισχυρίστηκε ότι έχει καλύτερη απόδοση στη διαγλωσσική συλλογιστική σε ασιατικές γλώσσες από άλλα μοντέλα - και ως εκ τούτου μπορεί να βοηθήσει την περιοχή να αναπτύξει κυρίαρχα μεγάλα γλωσσικά μοντέλα.

Naver ανακοίνωσε το ντεμπούτο του HyperCLOVA X στα κορεάτικα και έδειξε μια αγγλική γλώσσα Τεχνική αναφορά στο περιοδικό ανοιχτής πρόσβασης arXiv που ισχυρίζεται ότι «Πιστεύουμε ότι το HyperCLOVA X – με τις ανταγωνιστικές του ικανότητες στα αγγλικά και άλλες γλώσσες πέρα ​​από τα κορεατικά – μπορεί να παρέχει χρήσιμη καθοδήγηση σε περιοχές ή χώρες για την ανάπτυξη των δικών τους κυρίαρχων LLMs».

Τα LLM ήταν προεκπαιδευμένα σε δεδομένα «αποτελούμενα από κορεάτικα, πολύγλωσσα και κωδικοποιημένα τμήματα».

Το πολύγλωσσο υποσύνολο ήταν κυρίως αγγλικά, αλλά περιλάμβανε επίσης μια ποικιλία από άλλες γλώσσες – όπως τα ιαπωνικά, τα γερμανικά και τα γαλλικά.

Υλικό κορεατικής γλώσσας αποτελούσε περίπου το ένα τρίτο των δεδομένων πριν από την προπόνηση, ένδειξη ότι η Naver επέλεξε να βελτιώσει την απόδοση των μοντέλων της στη μητρική της γλώσσα. Η προεκπαιδευτική διαδικασία έλαβε επίσης υπόψη την ιδιαίτερη γραμματική της κορεατικής γλώσσας.

Το αποτέλεσμα αυτής της προσπάθειας, ισχυρίζεται ο Naver, είναι μοντέλα «με εγγενή επάρκεια τόσο στα κορεατικά όσο και στα αγγλικά».

Ακόμα καλύτερα, τα μοντέλα εμφανίζουν "πολυγλωσσία" - την ικανότητα να εργάζονται σε γλώσσες άλλες από αυτές που έχουν εκπαιδευτεί να χειρίζονται.

«Η ανάλυσή μας δείχνει ότι το HyperCLOVA X όχι μόνο είναι σε θέση να επεκτείνει την ικανότητα συλλογισμού του πέρα ​​από τις κυρίως στοχευμένες γλώσσες του, αλλά και να επιτύχει το πιο προηγμένο επίπεδο μηχανικής μετάφρασης μεταξύ κορεατικών και μη στοχευμένων γλωσσών, όπως τα ιαπωνικά και τα κινέζικα», αναφέρει η τεχνική έκθεση. «Η εντυπωσιακή πολυγλωσσική ικανότητα του HyperCLOVA X περιλαμβάνει επίσης διαγλωσσική μεταφορά μεταξύ Κορεατικών και Αγγλικών, όπου ο συντονισμός εντολών σε μια γλώσσα μπορεί να οδηγήσει στην εμφάνιση δυνατοτήτων παρακολούθησης οδηγιών στην άλλη», πρόσθεσε.

Τα αποτελέσματα των πολύγλωσσων δοκιμών οδήγησαν τον προγραμματιστή στο συμπέρασμα ότι το HyperCLOVA X «μπορεί να μεταφερθεί σε ασιατικές γλώσσες που υποεκπροσωπούνται στα δεδομένα προεκπαίδευσης».

Η κυρίαρχη τεχνητή νοημοσύνη αναδεικνύεται ως απαραίτητη εθνική ικανότητα – ως μέσο διασφάλισης της ασφάλειας δεδομένων και μείωσης της εξάρτησης από υπεράκτιους παρόχους. Η Nvidia υπερασπίστηκε την ιδέα, η οποία συμπτωματικά έχει τη δυνατότητα να δημιουργήσει μια ακόμη μεγαλύτερη αγορά για τα προϊόντα της.

Όμως, όπως επισημαίνει η τεχνική έκθεση του Naver, οι αγγλικοί και βορειοαμερικανικοί πολιτισμοί «υπερεκπροσωπούνται εξαιρετικά στα σώματα προ-κατάρτισης» για τα υπάρχοντα κύρια LLM.

«Συνεπώς, αυτά τα LLM παρουσιάζουν περιορισμούς στην ικανότητά τους να επεξεργάζονται και να κατανοούν μη αγγλικές γλώσσες όπως τα κορεάτικα, τα οποία ενσωματώνουν διακριτές πολιτισμικές αποχρώσεις, γεωπολιτικές καταστάσεις και άλλες τοπικές ιδιαιτερότητες, καθώς και μοναδικά γλωσσικά χαρακτηριστικά», εξηγεί.

Η περιφερειακή βαρέων βαρών Κίνα επιδίωξε να αναπτύξει LLM προς το εθνικό της συμφέρον –ή τουλάχιστον το συμφέρον του ΚΚΚ– για ποικίλη επιτυχία. Παρόλα αυτά, chatbots όπως το ERNIE του Baidu είχαν συλλέγονται πάνω από 100 εκατομμύρια χρήστες μέχρι το τέλος του 2023.

Ο Nak-ho-Seon, επικεφαλής της τεχνολογίας Naver Cloud Hyperscale AI, δήλωσε ότι σχεδιάζει «να δημιουργήσει εξειδικευμένη τεχνητή νοημοσύνη υπερ-κλίμακας για διάφορες περιοχές και χώρες στο μέλλον».

Εν τω μεταξύ, η τεχνική έκθεση περιλαμβάνει μια δέσμευση για «διερεύνηση της πολυτροπικότητας, με στόχο τη διεύρυνση των δυνατοτήτων του HyperCLOVA X για την απρόσκοπτη επεξεργασία και ενσωμάτωση διαφορετικών τύπων δεδομένων, όπως κείμενο, εικόνες και ήχο», ενώ επιδιώκεται να βελτιστοποιηθούν οι ικανότητες συμπερασμάτων του μοντέλου.

Ο Naver ισχυρίστηκε ότι «ερευνά ενεργά την ενοποίηση εξωτερικών εργαλείων και API για να αυξήσει τις λειτουργίες του μοντέλου» – μια προσπάθεια που πιστεύει ότι θα «επιτρέψει στο HyperCLOVA X να έχει πρόσβαση σε εξειδικευμένα σύνολα δεδομένων και υπηρεσίες». ®

spot_img

Τελευταία Νοημοσύνη

spot_img

Συνομιλία με μας

Γεια σου! Πώς μπορώ να σε βοηθήσω?