Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.

Παιχνίδια χειροτεχνίας Genie AI της Google από Single Images

Ημερομηνία:

Η Google ανακοίνωσε το Genie, μια εφαρμογή για την κατασκευή παιχνιδιών για κινητά, ως μέρος της συνεχιζόμενης επένδυσής της στην τεχνητή νοημοσύνη. 

Το παραγωγικό μοντέλο τεχνητής νοημοσύνης Genie, που αναπτύχθηκε από τη startup τεχνητής νοημοσύνης της Google, DeepMind, παρουσίασε μια ζωντανή επίδειξη. Το Genie μαθαίνει τη μηχανική των παιχνιδιών από εκατοντάδες χιλιάδες βίντεο παιχνιδιών και μπορεί να δημιουργήσει παιχνίδια με δυνατότητα αναπαραγωγής με ελάχιστες προτροπές.

Διαβάστε επίσης: Figure AI για συγκέντρωση 675 εκατομμυρίων δολαρίων για Εργατική Επίλυση Ανθρωποειδών Ρομποτικής

Αποκάλυψη Τζίνι

Όπως αναφέρεται στο επίσημο DeepMind της Google ανάρτηση, το Genie είναι ένα θεμελιώδες παγκόσμιο μοντέλο που εκπαιδεύεται χρησιμοποιώντας διαδικτυακά βίντεο. «Μια ατελείωτη ποικιλία κόσμων με δυνατότητα αναπαραγωγής (με έλεγχο δράσης) από συνθετικές εικόνες, φωτογραφίες, ακόμη και σκίτσα» μπορεί να παραχθεί από το μοντέλο.

Το Genie, συντομογραφία του Generative Interactive Environments, αναπτύχθηκε σε συνεργασία μεταξύ της Google και του Πανεπιστημίου της Βρετανικής Κολομβίας. Με μία μόνο εικόνα, μπορεί να δημιουργήσει 2D πλατφόρμες πλαϊνής κύλισης, όπως το Contra και το Super Mario Brothers με βάση τις προτροπές των χρηστών.

Ωστόσο, το Google DeepMind δήλωσε κατά τη διάρκεια της ανακοίνωσης ότι εισάγει ένα «νέο παράδειγμα» για τη γενετική τεχνητή νοημοσύνη (AI) με τη μορφή του Genie. Επιπλέον, η εταιρεία αναγνώρισε την εμφάνιση παραγωγικών μοντέλων τεχνητής νοημοσύνης ικανών να παράγουν νέο και δημιουργικό περιεχόμενο μέσω γλώσσας, εικόνων, ακόμη και βίντεο.

Σύμφωνα με την Google, ένα σημαντικό μέρος των 200,000 ωρών χωρίς επίβλεψη δημόσιων βίντεο τυχερών παιχνιδιών στο Διαδίκτυο στα οποία εκπαιδεύτηκε η Genie είναι 2D platformers και όχι πλήρη παιχνίδια εικονικής πραγματικότητας.

Προδιαγραφές Genie

Όσον αφορά τις διαστάσεις, το Genie έχει 11 δισεκατομμύρια παραμέτρους. Ένα χωροχρονικό tokenizer βίντεο, ένα μοντέλο αυτοπαλινδρομικής δυναμικής και ένα απλό και επεκτάσιμο μοντέλο λανθάνουσας δράσης περιλαμβάνονται επίσης στο μοντέλο. Αυτές οι προδιαγραφές επιτρέπουν στο Genie να ενεργεί σε περιβάλλοντα που δημιουργούνται καρέ-καρέ, ακόμη και χωρίς ετικέτες ή άλλες απαιτήσεις ειδικού τομέα κατά την εκπαίδευση.

Επιπλέον, το Genie μπορεί να λάβει οδηγίες να δημιουργήσει ένα ποικίλο σύνολο διαδραστικών και ελεγχόμενων περιβαλλόντων, παρά το γεγονός ότι έχει εκπαιδευτεί σε δεδομένα μόνο βίντεο. Το Genie μπορεί να δημιουργήσει περιβάλλοντα με δυνατότητα αναπαραγωγής με μία μόνο προτροπή εικόνας, σε αντίθεση με πολλά μοντέλα παραγωγής τεχνητής νοημοσύνης που μπορούν να παράγουν δημιουργικό περιεχόμενο με εικόνες γλώσσας, ακόμη και βίντεο.

Ωστόσο, ο προγραμματιστής του Google DeepMind Tim Rocktäschel είπε στο X (πρώην Twitter) ότι επικεντρώνονται στην κλίμακα αντί να προσθέτουν επαγωγικές προκαταλήψεις.

Πρόσθεσε ότι χρησιμοποιούν ένα σύνολο δεδομένων με περισσότερες από 200 χιλιάδες ώρες βίντεο από 2D platformers και εκπαιδεύουν ένα παγκόσμιο μοντέλο 11B. Με τρόπο χωρίς επίβλεψη, η Τζίνι μαθαίνει διάφορες λανθάνουσες ενέργειες που ελέγχουν με συνέπεια χαρακτήρες.

Παιχνίδια χειροτεχνίας Genie AI της Google από Single Images
Φωτογραφική πίστωση: Google

Οι δυνατότητες του Τζίνι

Σύμφωνα με Google Οι ερευνητές, το Genie καθοδηγείται από τρία μοντέλα: ένα δυναμικό μοντέλο που προβλέπει τι θα συμβεί στο επόμενο καρέ, ένα video tokenizer που μετατρέπει τα ακατέργαστα καρέ βίντεο σε διακριτά διακριτικά και ένα μοντέλο λανθάνουσας δράσης που μπορεί να συμπεράνει τις ενέργειες μεταξύ των καρέ βίντεο.

Η ικανότητα του θεμελιώδους μοντέλου του Genie να αναγνωρίζει τον κύριο χαρακτήρα ενός παιχνιδιού χωρίς να έχει εκπαιδευτεί σε σχολιασμούς δράσης ή κειμένου είναι ένα από τα μοναδικά χαρακτηριστικά του. Χάρη στα μοντέλα που το οδηγούν, ο χρήστης μπορεί να ελέγξει αβίαστα τον χαρακτήρα σε ένα Δημιουργείται AI περιβάλλον εικονικής πραγματικότητας.

Ο Rocktäschel είπε επίσης ότι το Genie θα μπορούσε να μετατρέψει άλλα μέσα σε παιχνίδια. Μπορεί να ζητηθεί από τον Genie να δημιουργήσει διάφορους εικονικούς κόσμους με έλεγχο δράσης από διάφορες εισόδους στο συνοδευτικό ερευνητικό έγγραφο του Google DeepMind.

Επιπλέον, ο Rocktäschel είπε ότι το μοντέλο μπορεί να μετατρέψει οποιαδήποτε εικόνα σε έναν κόσμο 2D με δυνατότητα αναπαραγωγής. Σύμφωνα με τον ίδιο, η Genie μπορεί να ζωντανέψει δημιουργίες που έχουν σχεδιαστεί από τον άνθρωπο, όπως σκίτσα, για παράδειγμα, όμορφα έργα τέχνης από τον Seneca και τον Caspian, δύο από τους νεότερους δημιουργούς στον κόσμο.

spot_img

Τελευταία Νοημοσύνη

spot_img

Συνομιλία με μας

Γεια σου! Πώς μπορώ να σε βοηθήσω?