Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.

Τι είναι μια GPU; Τα τσιπ που τροφοδοτούν την έκρηξη της AI και γιατί αξίζουν τρισεκατομμύρια

Ημερομηνία:

Καθώς ο κόσμος βιάζεται να χρησιμοποιήσει το πιο πρόσφατο κύμα τεχνολογιών τεχνητής νοημοσύνης, ένα κομμάτι υλικού υψηλής τεχνολογίας έχει γίνει ένα εκπληκτικά καυτό εμπόρευμα: η μονάδα επεξεργασίας γραφικών ή GPU.

Μια κορυφαία GPU μπορεί να πωληθεί δεκάδες χιλιάδες δολάρια, και ο κορυφαίος κατασκευαστής Nvidia έχει δει την αποτίμησή του στην αγορά ξεπεράσει τα 2 τρισεκατομμύρια δολάρια καθώς η ζήτηση για τα προϊόντα της αυξάνεται.

Οι GPU δεν είναι απλώς προϊόντα τεχνητής νοημοσύνης υψηλής ποιότητας. Υπάρχουν επίσης λιγότερο ισχυρές GPU σε τηλέφωνα, φορητούς υπολογιστές και κονσόλες παιχνιδιών.

Μέχρι τώρα αναρωτιέστε πιθανώς: Τι είναι μια GPU, αλήθεια; Και τι τους κάνει τόσο ξεχωριστούς;

Τι είναι μια GPU;

Οι GPU αρχικά σχεδιάστηκαν κυρίως για τη γρήγορη δημιουργία και εμφάνιση σύνθετων τρισδιάστατων σκηνών και αντικειμένων, όπως αυτά που εμπλέκονται σε βιντεοπαιχνίδια και σχεδιασμός με υπολογιστή λογισμικό. Οι σύγχρονες GPU χειρίζονται επίσης εργασίες όπως αποσυμπίεση ροές βίντεο.

Ο «εγκέφαλος» των περισσότερων υπολογιστών είναι ένα τσιπ που ονομάζεται κεντρική μονάδα επεξεργασίας (CPU). Οι CPU μπορούν να χρησιμοποιηθούν για τη δημιουργία γραφικών σκηνών και την αποσυμπίεση βίντεο, αλλά είναι συνήθως πολύ πιο αργές και λιγότερο αποτελεσματικές σε αυτές τις εργασίες σε σύγκριση με τις GPU. Οι CPU είναι πιο κατάλληλες για γενικές εργασίες υπολογισμού, όπως η επεξεργασία κειμένου και η περιήγηση σε ιστοσελίδες.

Σε τι διαφέρουν οι GPU από τις CPU;

Μια τυπική σύγχρονη CPU αποτελείται από 8 έως 16 "πυρήνες», καθένα από τα οποία μπορεί να επεξεργαστεί σύνθετες εργασίες με διαδοχικό τρόπο.

Οι GPU, από την άλλη πλευρά, έχουν χιλιάδες σχετικά μικρούς πυρήνες, οι οποίοι έχουν σχεδιαστεί για να λειτουργούν όλοι ταυτόχρονα («παράλληλα») για να επιτυγχάνουν γρήγορη συνολική επεξεργασία. Αυτό τα καθιστά κατάλληλα για εργασίες που απαιτούν μεγάλο αριθμό απλών λειτουργιών που μπορούν να γίνουν ταυτόχρονα, και όχι η μία μετά την άλλη.

Οι παραδοσιακές GPU διατίθενται σε δύο βασικές γεύσεις.

Πρώτον, υπάρχουν αυτόνομα τσιπ, τα οποία συχνά έρχονται σε πρόσθετες κάρτες για μεγάλους επιτραπέζιους υπολογιστές. Δεύτερον είναι οι GPU που συνδυάζονται με μια CPU στο ίδιο πακέτο chip, τα οποία βρίσκονται συχνά σε φορητούς υπολογιστές και κονσόλες παιχνιδιών όπως το PlayStation 5. Και στις δύο περιπτώσεις, η CPU ελέγχει τι κάνει η GPU.

Γιατί οι GPU είναι τόσο χρήσιμες για την τεχνητή νοημοσύνη;

Αποδεικνύεται ότι οι GPU μπορούν να επαναπροσδιοριστούν για να κάνουν περισσότερα από τη δημιουργία γραφικών σκηνών.

Πολλές από τις τεχνικές μηχανικής μάθησης πίσω τεχνητή νοημοσύνη, Όπως βαθιά νευρωνικά δίκτυα, βασίζονται σε μεγάλο βαθμό σε διάφορες μορφές πολλαπλασιασμού πινάκων.

Αυτή είναι μια μαθηματική πράξη όπου πολύ μεγάλα σύνολα αριθμών πολλαπλασιάζονται και αθροίζονται μεταξύ τους. Αυτές οι λειτουργίες είναι κατάλληλες για παράλληλη επεξεργασία και ως εκ τούτου μπορούν να εκτελεστούν πολύ γρήγορα από GPU.

Τι ακολουθεί για τις GPU;

Η δυναμική των GPUs αυξάνεται σταθερά λόγω της αύξησης του αριθμού των πυρήνων και των ταχυτήτων λειτουργίας τους. Αυτές οι βελτιώσεις οφείλονται κυρίως στις βελτιώσεις στην κατασκευή chip από εταιρείες όπως π.χ TSMC στην Ταϊβάν.

Το μέγεθος των μεμονωμένων τρανζίστορ - τα βασικά στοιχεία οποιουδήποτε τσιπ υπολογιστή - μειώνεται, επιτρέποντας την τοποθέτηση περισσότερων τρανζίστορ στην ίδια ποσότητα φυσικού χώρου.

Ωστόσο, αυτή δεν είναι ολόκληρη η ιστορία. Ενώ οι παραδοσιακές GPU είναι χρήσιμες για εργασίες υπολογισμού που σχετίζονται με το AI, δεν είναι βέλτιστες.

Όπως οι GPU σχεδιάστηκαν αρχικά για να επιταχύνουν τους υπολογιστές παρέχοντας εξειδικευμένη επεξεργασία για γραφικά, υπάρχουν επιταχυντές που έχουν σχεδιαστεί για να επιταχύνουν τις εργασίες μηχανικής εκμάθησης. Αυτοί οι επιταχυντές αναφέρονται συχνά ως GPU κέντρων δεδομένων.

Μερικοί από τους πιο δημοφιλείς επιταχυντές, κατασκευασμένοι από εταιρείες όπως η AMD και η Nvidia, ξεκίνησαν ως παραδοσιακές GPU. Με την πάροδο του χρόνου, τα σχέδιά τους εξελίχθηκαν για να χειρίζονται καλύτερα διάφορες εργασίες μηχανικής μάθησης, για παράδειγμα υποστηρίζοντας την πιο αποτελεσματική "επιπλέουν εγκεφάλου"αριθμητική μορφή.

Άλλοι επιταχυντές, όπως της Google μονάδες επεξεργασίας τανυστών και του Tenstorrent Πυρήνες Tensix, σχεδιάστηκαν από την αρχή για να επιταχύνουν τα βαθιά νευρωνικά δίκτυα.

Οι GPU των κέντρων δεδομένων και άλλοι επιταχυντές τεχνητής νοημοσύνης διαθέτουν συνήθως πολύ περισσότερη μνήμη από τις παραδοσιακές πρόσθετες κάρτες GPU, κάτι που είναι ζωτικής σημασίας για την εκπαίδευση μεγάλων μοντέλων τεχνητής νοημοσύνης. Όσο μεγαλύτερο είναι το μοντέλο AI, τόσο πιο ικανό και ακριβές είναι.

Για την περαιτέρω επιτάχυνση της εκπαίδευσης και τον χειρισμό ακόμη μεγαλύτερων μοντέλων τεχνητής νοημοσύνης, όπως το ChatGPT, πολλές μονάδες GPU κέντρων δεδομένων μπορούν να συγκεντρωθούν για να σχηματίσουν έναν υπερυπολογιστή. Αυτό απαιτεί πιο πολύπλοκο λογισμικό για να αξιοποιήσει σωστά τη διαθέσιμη ισχύ σπασίματος αριθμού. Μια άλλη προσέγγιση είναι να δημιουργήστε έναν πολύ μεγάλο επιταχυντή, Όπως "επεξεργαστής σε κλίμακα γκοφρέτας” παραγωγή Cerebras.

Είναι τα εξειδικευμένα τσιπ το μέλλον;

Ούτε οι CPU έχουν μείνει ακίνητες. Οι πρόσφατες CPU από την AMD και την Intel έχουν ενσωματωμένες οδηγίες χαμηλού επιπέδου που επιταχύνουν τη σύναψη αριθμών που απαιτείται από τα βαθιά νευρωνικά δίκτυα. Αυτή η πρόσθετη λειτουργικότητα βοηθά κυρίως σε εργασίες «εξαγωγής συμπερασμάτων»—δηλαδή με τη χρήση μοντέλων τεχνητής νοημοσύνης που έχουν ήδη αναπτυχθεί αλλού.

Για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης, εξακολουθούν να χρειάζονται μεγάλοι επιταχυντές τύπου GPU.

Είναι δυνατή η δημιουργία ολοένα και πιο εξειδικευμένων επιταχυντών για συγκεκριμένους αλγόριθμους μηχανικής μάθησης. Πρόσφατα, για παράδειγμα, μια εταιρεία που ονομάζεται Groq δημιούργησε ένα «μονάδα επεξεργασίας γλώσσας” (LPU) ειδικά σχεδιασμένο για την εκτέλεση μεγάλων μοντέλων γλώσσας σύμφωνα με τις γραμμές του ChatGPT.

Ωστόσο, η δημιουργία αυτών των εξειδικευμένων επεξεργαστών απαιτεί σημαντικούς μηχανικούς πόρους. Η ιστορία δείχνει ότι η χρήση και η δημοτικότητα οποιουδήποτε δεδομένου αλγόριθμου μηχανικής εκμάθησης τείνει να κορυφώνεται και στη συνέχεια να μειώνεται—έτσι το ακριβό εξειδικευμένο υλικό μπορεί να γίνει γρήγορα ξεπερασμένο.

Για τον μέσο καταναλωτή, ωστόσο, αυτό είναι απίθανο να είναι πρόβλημα. Οι GPU και άλλα τσιπ στα προϊόντα που χρησιμοποιείτε είναι πιθανό να συνεχίσουν να γίνονται πιο γρήγορα.

Αυτό το άρθρο αναδημοσιεύθηκε από το Η Συνομιλία υπό την άδεια Creative Commons. Διαβάστε το αρχικό άρθρο.

Image Credit: Nvidia

spot_img

Τελευταία Νοημοσύνη

spot_img

Συνομιλία με μας

Γεια σου! Πώς μπορώ να σε βοηθήσω?