Google's Genie AI Crafts Games From Single Images

Η Google ανακοίνωσε το Genie, μια εφαρμογή για την κατασκευή παιχνιδιών για κινητά, ως μέρος της συνεχιζόμενης επένδυσής της στην τεχνητή νοημοσύνη.

Το παραγωγικό μοντέλο τεχνητής νοημοσύνης Genie, που αναπτύχθηκε από τη startup τεχνητής νοημοσύνης της Google, DeepMind, παρουσίασε μια ζωντανή επίδειξη. Το Genie μαθαίνει τη μηχανική των παιχνιδιών από εκατοντάδες χιλιάδες βίντεο παιχνιδιών και μπορεί να δημιουργήσει παιχνίδια με δυνατότητα αναπαραγωγής με ελάχιστες προτροπές.

Η Google DeepMind αποκαλύπτει το AI «Genie» για να δημιουργήσει άμεσα παιχνίδια με δυνατότητα αναπαραγωγής https://t.co/9c6iMsZ1Qa $GOOG $ GOOGL

— BizTechia (@BizTechia) Φεβρουάριος 27, 2024

Διαβάστε επίσης: Figure AI για συγκέντρωση 675 εκατομμυρίων δολαρίων για Εργατική Επίλυση Ανθρωποειδών Ρομποτικής

Αποκάλυψη Τζίνι

Όπως αναφέρεται στο επίσημο DeepMind της Google ανάρτηση, το Genie είναι ένα θεμελιώδες παγκόσμιο μοντέλο που εκπαιδεύεται χρησιμοποιώντας διαδικτυακά βίντεο. «Μια ατελείωτη ποικιλία κόσμων με δυνατότητα αναπαραγωγής (με έλεγχο δράσης) από συνθετικές εικόνες, φωτογραφίες, ακόμη και σκίτσα» μπορεί να παραχθεί από το μοντέλο.

Το Genie, συντομογραφία του Generative Interactive Environments, αναπτύχθηκε σε συνεργασία μεταξύ της Google και του Πανεπιστημίου της Βρετανικής Κολομβίας. Με μία μόνο εικόνα, μπορεί να δημιουργήσει 2D πλατφόρμες πλαϊνής κύλισης, όπως το Contra και το Super Mario Brothers με βάση τις προτροπές των χρηστών.

Ωστόσο, το Google DeepMind δήλωσε κατά τη διάρκεια της ανακοίνωσης ότι εισάγει ένα «νέο παράδειγμα» για τη γενετική τεχνητή νοημοσύνη (AI) με τη μορφή του Genie. Επιπλέον, η εταιρεία αναγνώρισε την εμφάνιση παραγωγικών μοντέλων τεχνητής νοημοσύνης ικανών να παράγουν νέο και δημιουργικό περιεχόμενο μέσω γλώσσας, εικόνων, ακόμη και βίντεο.

Η Google παρουσιάζει το Genie

Δημιουργικά Διαδραστικά Περιβάλλοντα

εισάγετε το Genie, το πρώτο παραγωγικό διαδραστικό περιβάλλον που εκπαιδεύεται χωρίς επίβλεψη από βίντεο στο Διαδίκτυο χωρίς ετικέτα. Μπορεί να ζητηθεί από το μοντέλο να δημιουργήσει μια ατελείωτη ποικιλία εικονικών ελεγχόμενων από δράση… pic.twitter.com/ZO1focG7Vx

—AK (@_akhaliq) Φεβρουάριος 26, 2024

Σύμφωνα με την Google, ένα σημαντικό μέρος των 200,000 ωρών χωρίς επίβλεψη δημόσιων βίντεο τυχερών παιχνιδιών στο Διαδίκτυο στα οποία εκπαιδεύτηκε η Genie είναι 2D platformers και όχι πλήρη παιχνίδια εικονικής πραγματικότητας.

Προδιαγραφές Genie

Όσον αφορά τις διαστάσεις, το Genie έχει 11 δισεκατομμύρια παραμέτρους. Ένα χωροχρονικό tokenizer βίντεο, ένα μοντέλο αυτοπαλινδρομικής δυναμικής και ένα απλό και επεκτάσιμο μοντέλο λανθάνουσας δράσης περιλαμβάνονται επίσης στο μοντέλο. Αυτές οι προδιαγραφές επιτρέπουν στο Genie να ενεργεί σε περιβάλλοντα που δημιουργούνται καρέ-καρέ, ακόμη και χωρίς ετικέτες ή άλλες απαιτήσεις ειδικού τομέα κατά την εκπαίδευση.

Επιπλέον, το Genie μπορεί να λάβει οδηγίες να δημιουργήσει ένα ποικίλο σύνολο διαδραστικών και ελεγχόμενων περιβαλλόντων, παρά το γεγονός ότι έχει εκπαιδευτεί σε δεδομένα μόνο βίντεο. Το Genie μπορεί να δημιουργήσει περιβάλλοντα με δυνατότητα αναπαραγωγής με μία μόνο προτροπή εικόνας, σε αντίθεση με πολλά μοντέλα παραγωγής τεχνητής νοημοσύνης που μπορούν να παράγουν δημιουργικό περιεχόμενο με εικόνες γλώσσας, ακόμη και βίντεο.

Ωστόσο, ο προγραμματιστής του Google DeepMind Tim Rocktäschel είπε στο X (πρώην Twitter) ότι επικεντρώνονται στην κλίμακα αντί να προσθέτουν επαγωγικές προκαταλήψεις.

Αντί να προσθέτουμε επαγωγικές προκαταλήψεις, εστιάζουμε στην κλίμακα. Χρησιμοποιούμε ένα σύνολο δεδομένων >200 ωρών βίντεο από 2D πλατφόρμες και εκπαιδεύουμε ένα παγκόσμιο μοντέλο 11B. Με τρόπο χωρίς επίβλεψη, η Τζίνι μαθαίνει διάφορες λανθάνουσες ενέργειες που ελέγχουν τους χαρακτήρες με συνέπεια. pic.twitter.com/71a3iuAGZA

— Tim Rocktäschel (@_rockt) Φεβρουάριος 26, 2024

Πρόσθεσε ότι χρησιμοποιούν ένα σύνολο δεδομένων με περισσότερες από 200 χιλιάδες ώρες βίντεο από 2D platformers και εκπαιδεύουν ένα παγκόσμιο μοντέλο 11B. Με τρόπο χωρίς επίβλεψη, η Τζίνι μαθαίνει διάφορες λανθάνουσες ενέργειες που ελέγχουν με συνέπεια χαρακτήρες.

Παιχνίδια χειροτεχνίας Genie AI της Google από Single Images — Φωτογραφική πίστωση: Google

Οι δυνατότητες του Τζίνι

Σύμφωνα με Google Οι ερευνητές, το Genie καθοδηγείται από τρία μοντέλα: ένα δυναμικό μοντέλο που προβλέπει τι θα συμβεί στο επόμενο καρέ, ένα video tokenizer που μετατρέπει τα ακατέργαστα καρέ βίντεο σε διακριτά διακριτικά και ένα μοντέλο λανθάνουσας δράσης που μπορεί να συμπεράνει τις ενέργειες μεταξύ των καρέ βίντεο.

Η ικανότητα του θεμελιώδους μοντέλου του Genie να αναγνωρίζει τον κύριο χαρακτήρα ενός παιχνιδιού χωρίς να έχει εκπαιδευτεί σε σχολιασμούς δράσης ή κειμένου είναι ένα από τα μοναδικά χαρακτηριστικά του. Χάρη στα μοντέλα που το οδηγούν, ο χρήστης μπορεί να ελέγξει αβίαστα τον χαρακτήρα σε ένα Δημιουργείται AI περιβάλλον εικονικής πραγματικότητας.

Ο Rocktäschel είπε επίσης ότι το Genie θα μπορούσε να μετατρέψει άλλα μέσα σε παιχνίδια. Μπορεί να ζητηθεί από τον Genie να δημιουργήσει διάφορους εικονικούς κόσμους με έλεγχο δράσης από διάφορες εισόδους στο συνοδευτικό ερευνητικό έγγραφο του Google DeepMind.

Είμαι πραγματικά ενθουσιασμένος που αποκαλύπτω τι @GoogleDeepMindΗ Ομάδα Ανοιχτού Τέλους του 🚀. Παρουσιάζουμε το Genie 🧞, ένα βασικό παγκόσμιο μοντέλο που εκπαιδεύεται αποκλειστικά από βίντεο στο Διαδίκτυο που μπορεί να δημιουργήσει μια ατελείωτη ποικιλία δισδιάστατων κόσμων ελεγχόμενων από τη δράση, με προτροπές εικόνας. pic.twitter.com/TnQ8uv81wc

— Tim Rocktäschel (@_rockt) Φεβρουάριος 26, 2024

Επιπλέον, ο Rocktäschel είπε ότι το μοντέλο μπορεί να μετατρέψει οποιαδήποτε εικόνα σε έναν κόσμο 2D με δυνατότητα αναπαραγωγής. Σύμφωνα με τον ίδιο, η Genie μπορεί να ζωντανέψει δημιουργίες που έχουν σχεδιαστεί από τον άνθρωπο, όπως σκίτσα, για παράδειγμα, όμορφα έργα τέχνης από τον Seneca και τον Caspian, δύο από τους νεότερους δημιουργούς στον κόσμο.

SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
PlatoESG. Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
πηγή: https://metanews.com/googles-genie-ai-crafts-games-from-single-images/

Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.

Παιχνίδια χειροτεχνίας Genie AI της Google από Single Images

Αποκάλυψη Τζίνι

Προδιαγραφές Genie

Οι δυνατότητες του Τζίνι

Dogecoin Rival Shiba Inu (SHIB) Completes Highly Anticipated Shibarium Hard Fork – The Daily Hodl

Η τιμή του Bitcoin εκτινάσσεται προς τα 61,000 $, το ενδεχόμενο να ξεπεράσει το εύρος $67-$68

Τελευταία Νοημοσύνη

Οι εταιρείες κρυπτογράφησης άντλησαν 2.5 δισεκατομμύρια δολάρια το πρώτο τρίμηνο, αντιπροσωπεύοντας τριμηνιαία αύξηση 1%.

Οι περισσότεροι κάτοχοι Dogecoin δεν αγόρασαν το Elon Musk Top – Decrypt

Οι φάλαινες Bitfinex ενισχύουν τις κατοχές Bitcoin κατά 6% εν μέσω πρόσφατης αύξησης των τιμών

Render Network – A Compute Marketplace με υποστήριξη Blockchain για έργα γραφικών και τεχνητής νοημοσύνης

Οι ολλανδικές αρχές συνέλαβαν ύποπτο για διαδικτυακή απάτη τυχερών παιχνιδιών ZKasino

«Η κυβέρνηση των ΗΠΑ δεν μπορεί να χρεοκοπήσει γιατί μπορούμε να τυπώσουμε τα δικά μας χρήματα», λέει η κυβέρνηση Μπάιντεν

Συνομιλία με μας

Νοημοσύνη δεδομένων Πλάτωνα.Κάθετη Αναζήτηση & Αι.

Παιχνίδια χειροτεχνίας Genie AI της Google από Single Images

Αποκάλυψη Τζίνι

Προδιαγραφές Genie

Οι δυνατότητες του Τζίνι

Τελευταία Νοημοσύνη

Συνομιλία με μας

Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.