Νοημοσύνη δεδομένων Πλάτωνα.
Κάθετη Αναζήτηση & Αι.

Ο David Holz, ιδρυτής της παραγωγής τέχνης AI Midjourney, σχετικά με το μέλλον της απεικόνισης

Ημερομηνία:

συνέντευξη Το 2008, ο David Holz συνίδρυσε μια περιφερειακή εταιρεία υλικού που ονομάζεται Leap Motion. Το έτρεχε μέχρι πέρυσι όταν έφυγε για να δημιουργήσει το Midjourey.

Μεσοταξίδι στην παρούσα μορφή του είναι ένα κοινωνικό δίκτυο για τη δημιουργία τέχνης που δημιουργείται από AI από μια προτροπή κειμένου - πληκτρολογήστε μια λέξη ή φράση στη γραμμή εισόδου και θα λάβετε μια ενδιαφέρουσα ή ίσως υπέροχη εικόνα στην οθόνη μετά από περίπου ένα λεπτό υπολογισμού. Είναι παρόμοιο από ορισμένες απόψεις με του OpenAI DALL-E2.

Εικόνα του ουρανού και των νεφών στη μέση του ταξιδιού, χρησιμοποιώντας την προτροπή κειμένου "Όλη αυτή η άχρηστη ομορφιά". Πηγή: δημιουργήθηκε από Μεσοταξίδι

Και τα δύο είναι το αποτέλεσμα μεγάλων μοντέλων AI που έχουν εκπαιδευτεί σε τεράστιο αριθμό εικόνων. Αλλά το Midjourney έχει το δικό του ξεχωριστό στυλ, όπως φαίνεται από αυτό το νήμα Twitter. Και οι δύο τις τελευταίες ημέρες μπήκαν σε δημόσια δοκιμή beta (αν και η πρόσβαση στο DALL-E 2 επεκτείνεται αργά).

Η δυνατότητα δημιουργίας εικόνων υψηλής ποιότητας από μοντέλα τεχνητής νοημοσύνης με χρήση εισαγωγής κειμένου έγινε δημοφιλής δραστηριότητα πέρυσι μετά την κυκλοφορία του OpenAI CLIP (Contrastive Language–Image Pre-training), το οποίο σχεδιάστηκε για να αξιολογήσει πόσο καλά δημιουργούμενες εικόνες ευθυγραμμίζονται με τις περιγραφές κειμένου. Μετά την κυκλοφορία του, καλλιτέχνης Ryan Murdock (@advadnoun στο Twitter) διαπίστωσε ότι η διαδικασία θα μπορούσε να αντιστραφεί – παρέχοντας εισαγωγή κειμένου, θα μπορούσατε να λάβετε έξοδο εικόνας με τη βοήθεια άλλων μοντέλων τεχνητής νοημοσύνης.

Μετά από αυτό, η κοινότητα της παραγωγικής τέχνης ξεκίνησε μια περίοδο πυρετωδών εξερευνήσεων, δημοσιεύοντας κώδικα Python για τη δημιουργία εικόνων χρησιμοποιώντας μια ποικιλία μοντέλων και τεχνικών.

«Κάποια στιγμή πέρυσι, είδαμε ότι υπήρχαν ορισμένοι τομείς της τεχνητής νοημοσύνης που προχωρούσαν με πραγματικά ενδιαφέροντες τρόπους», εξήγησε ο Holz σε μια συνέντευξη με Το μητρώο. «Ένα από αυτά ήταν η ικανότητα του AI να κατανοεί τη γλώσσα».

Ο Holz επεσήμανε τις εξελίξεις όπως οι μετασχηματιστές, ένα μοντέλο βαθιάς μάθησης που ενημερώνει το CLIP και τα μοντέλα διάχυσης, μια εναλλακτική λύση στα GAN. «Αυτό που πραγματικά εντυπωσίασε το μάτι μου προσωπικά ήταν η καθοδηγούμενη από το CLIP διάχυση», είπε, που αναπτύχθηκε από την Katherine Crawson (γνωστή στο Twitter ως @RiversHaveWings).

Όχι ο στερεότυπος άνθρωπος από τη Φλόριντα

Ο Holz μεγάλωσε στη Φλόριντα και είχε μια επιχείρηση σχεδιασμού στο γυμνάσιο όπου σπούδασε μαθηματικά και φυσική. Εργαζόταν σε ένα διδακτορικό στα εφαρμοσμένα μαθηματικά και πήρε άδεια το 2008 για να ξεκινήσει το Leap Motion. Την επόμενη χρονιά, πέρασε ένα χρόνο ως φοιτητής ερευνητής στο Ινστιτούτο Max Planck, και ακολούθησε δύο χρόνια στο Ερευνητικό Κέντρο Langley της NASA ως μεταπτυχιακός φοιτητής ερευνητής που εργαζόταν στο LiDAR, τις αποστολές του Άρη και την ατμοσφαιρική επιστήμη.

«Ήμουν γιατί δουλεύω πάνω σε όλα αυτά;» αυτός εξήγησε. «Θέλω απλώς να δουλέψω σε ένα ωραίο πράγμα που με ενδιαφέρει».

Έτσι εστίασε στο Leap Motion, το οποίο ανέπτυξε μια συσκευή υλικού για να παρακολουθεί την κίνηση του χεριού και να τη χρησιμοποιεί για την είσοδο της συσκευής. Διηύθυνε την εταιρεία για δώδεκα χρόνια και όταν έφυγε απασχόλησε περίπου 100 άτομα.

Το Midjourney, είπε, είναι πολύ μικρό αυτή τη στιγμή. «Είμαστε περίπου 10 άτομα», εξήγησε. «Είμαστε αυτοχρηματοδοτούμενοι. Δεν έχουμε επενδυτές. Δεν έχουμε πραγματικά οικονομικά κίνητρα. Είμαστε απλώς εδώ για να δουλέψουμε σε πράγματα με τα οποία μας αρέσει και να διασκεδάζουμε. Και εργαζόμασταν σε πολλά διαφορετικά έργα».

Ο Holz είπε ότι η τεχνολογική πτυχή της τεχνητής νοημοσύνης και ο βαθμός στον οποίο θα βελτιωθεί είναι αρκετά εύκολο να προβλεφθεί. «Αλλά οι ανθρώπινες συνέπειες αυτού είναι τόσο δύσκολο να φανταστούμε», είπε. «Υπάρχει κάτι εδώ που βρίσκεται στη διασταύρωση ανθρωπότητας και τεχνολογίας. Για να καταλάβουμε πραγματικά τι είναι αυτό και τι πρέπει να είναι, πρέπει πραγματικά να κάνουμε πολλά πειράματα».

Ο δρόμος μπροστά

Η άστατη φύση της τεχνολογίας εικόνων AI είναι εμφανής στη διαφορά μεταξύ εργαλείων όπως το Midjourney και μιας εφαρμογής γραφικών ανοιχτού κώδικα με δυνατότητα λήψης, όπως το Blender, ή μιας τοπικά εγκατεστημένης εμπορικής εφαρμογής όπως το Adobe Photoshop (πριν γίνει υπηρεσία cloud).

Το Midjourney υπάρχει σε ένα κοινωνικό πλαίσιο. Το front-end του είναι η υπηρεσία συνομιλίας Discord. Οι νέοι χρήστες συνδέονται στον διακομιστή Midjourney του Discord και στη συνέχεια μπορούν να υποβάλουν μηνύματα κειμένου για να δημιουργήσουν εικόνες μαζί με πολλούς άλλους χρήστες σε οποιοδήποτε από τα διάφορα κανάλια αρχαρίων.

Οι εικόνες που προκύπτουν για όλους τους χρήστες σε αυτό το κανάλι εμφανίζονται σε περίπου ένα λεπτό, κάτι που βοηθά στην ενίσχυση της έννοιας της κοινότητας. Όσοι αποφασίσουν να κάνουν αναβάθμιση σε συνδρομή 10 $/μήνα ή 30 $/μήνα μπορούν να υποβάλουν κείμενο στο bot Midjourney στην εφαρμογή Discord ως ιδιωτικό Άμεσο Μήνυμα και να λαμβάνουν εικόνες ως απόκριση χωρίς τον καταρράκτη της αλληλεπίδρασης με κύλιση οθόνης από άλλους χρήστες σε δημόσιο Κανάλι. Ωστόσο, οι δημιουργημένες εικόνες παραμένουν δημόσια ορατές από προεπιλογή.

Ως κοινωνική εφαρμογή, το Midjourney υπόκειται σε κανόνες σχετικά με το επιτρεπόμενο περιεχόμενο – κάτι για το οποίο οι χρήστες του Blender ή άλλων τοπικά εγκατεστημένων εφαρμογών δεν χρειάζεται να ανησυχούν. Οι Όροι Παροχής Υπηρεσιών του Midjourney αναφέρουν: «Κανένα περιεχόμενο ή γκρίνια για ενηλίκους. Αποφύγετε να δημιουργείτε οπτικά σοκαριστικό ή ενοχλητικό περιεχόμενο. Θα αποκλείσουμε αυτόματα ορισμένες εισαγωγές κειμένου."

Το DALL-E 2 υπόκειται σε παρόμοιους αν και πιο εκτεταμένους περιορισμούς, όπως περιγράφεται σε αυτό Πολιτική περιεχομένου.

«Νομίζω ότι αν ζούσαμε σε έναν κόσμο που δεν είχε μέσα κοινωνικής δικτύωσης, τότε δεν θα χρειαζόταν να έχουμε περιορισμούς», είπε ο Χολτς. «…Όταν εφευρέθηκε το Photoshop, στην πραγματικότητα κυκλοφόρησε ο Τύπος σχετικά με αυτό, όπου είναι σαν, «ω, μπορείς να πλαστογραφήσεις οτιδήποτε και είναι λίγο τρομακτικό». [Αλλά τώρα], είναι πολύ πιο προσοδοφόρο να είσαι εντυπωσιασμένος από ό,τι πριν».

«Σήμερα, οποιοσδήποτε μπορεί να είναι εντυπωσιασμένος, και βασικά να επωφεληθεί από αυτό, ξέρετε», είπε ο Holz. «Και αυτό που κάνει είναι ότι δημιουργεί μια αγορά για το δράμα και τον εντυπωσιασμό. Γι' αυτό πιστεύω ότι πρέπει να είμαστε λίγο πιο προσεκτικοί, γιατί κάποια στιγμή, αυτό που θα κάνουν οι άνθρωποι είναι ότι θα πουν, "εντάξει, μπορώ να φτιάξω φωτογραφίες αυτού, ποιο είναι το πιο δραματικό, προσβλητικό και τρομακτικό πράγμα που έχω μπορούν να κάνουν?'"

Δεν υπάρχουν εύκολες απαντήσεις

Ο Holz επιτρέπει ότι υπάρχουν πράγματα που μπορούν να κάνουν οι κοινωνικές πλατφόρμες για να μετριάσουν αυτά τα προβλήματα, αλλά λέει ότι δεν υπάρχουν απλές απαντήσεις. «Δυστυχώς, δεν υπάρχει ξεκάθαρος τρόπος να το αντιμετωπίσουμε, παρά μόνο ως κοινωνία, να ανταμείψουμε λιγότερο τον εντυπωσιασμό», είπε. «Ωστόσο, η εντύπωσή μου είναι ότι κανείς δεν προσπαθεί πραγματικά να αλλάξει τις κοινωνικές πλατφόρμες για να μειώσει τον εντυπωσιασμό, γιατί αυτό του βγάζει χρήματα αυτή τη στιγμή».

Επιπλέον, είπε, επειδή το Midjourney στοχεύει να είναι ένας κοινωνικός χώρος για οποιονδήποτε άνω των 13 ετών, είναι απαραίτητο να υπάρχουν κανόνες ενάντια στο ακραίο ή γραφικό περιεχόμενο.

«Δεν θέλουμε πραγματικά να έχουμε τμηματικούς χώρους για ανθρώπους που τους αρέσει να φτιάχνουν πτώματα ή τους αρέσουν οι γυμνές φωτογραφίες», εξήγησε ο Holz. «Απλώς δεν θέλουμε να ασχοληθούμε με αυτό. Δεν πιστεύουμε ότι έχουμε ηθική υποχρέωση να το κάνουμε σε αυτή τη φάση. Θέλουμε έναν όμορφο κοινωνικό χώρο για τους ανθρώπους να φτιάχνουν πράγματα μαζί και να μην προσβάλλονται, βασικά, και να αισθάνονται ασφαλείς».

Για το σκοπό αυτό, η εταιρεία έχει περίπου 40 συντονιστές που παρακολουθούν τις εικόνες που δημιουργούν οι χρήστες.

Η κοινωνική πτυχή του Midjourney άρχισε πρόσφατα να βελτιώνει την ποιότητα της εικόνας. Ο Holz είπε ότι οι μηχανικοί της εταιρείας παρουσίασαν πρόσφατα την τρίτη έκδοση του λογισμικού της, η οποία για πρώτη φορά ενσωμάτωσε έναν βρόχο ανατροφοδότησης με βάση τη δραστηριότητα και την απόκριση των χρηστών.

"Αν κοιτάξετε τα στοιχεία του v3, υπάρχει αυτή η τεράστια βελτίωση", είπε. «Είναι απίστευτα καλύτερο και στην πραγματικότητα δεν βάλαμε περισσότερη τέχνη σε αυτό. Απλώς λάβαμε τα δεδομένα σχετικά με το ποιες εικόνες άρεσαν στους χρήστες και πώς τις χρησιμοποιούσαν. Και αυτό το έκανε πραγματικά καλύτερο».

Ερωτηθείς για το tech stack του Midjourney, ο Holz αποδοκιμάστηκε. «Κάποια στιγμή, πιθανότατα θα κάνουμε ένα δελτίο τύπου σχετικά με τους προμηθευτές που χρησιμοποιούμε», είπε. «Αυτό που μπορώ να πω είναι ότι έχουμε αυτά τα μεγάλα μοντέλα AI με δισεκατομμύρια παραμέτρους. Έχουν εκπαιδευτεί πάνω από δισεκατομμύρια εικόνες».

Ο Holz λέει ότι οι χρήστες κάνουν εκατομμύρια και εκατομμύρια εικόνες κάθε μέρα και το κάνουν χρησιμοποιώντας παρόχους υπολογιστών πράσινης ενέργειας – κάτι που δεν περιορίζει πραγματικά το πεδίο των μεγάλων παρόχων υπολογιστικού νέφους, καθώς όλοι ισχυρίζονται ότι είναι τουλάχιστον ουδέτεροι από άνθρακα.

«Κάθε εικόνα παίρνει petaops», είπε, ένας όρος που σημαίνει 10^15 λειτουργίες ανά δευτερόλεπτο. «Έτσι 1000 τρισεκατομμύρια πράξεων. Δεν ξέρω ακριβώς αν είναι πέντε ή 10 ή 50. Αλλά είναι 1000 τρισεκατομμύρια πράξεις για να φτιάξεις μια εικόνα. Είναι ίσως το πιο ακριβό… αν καλέσετε το Midjourney, μια υπηρεσία –όπως θα την αποκαλούσατε υπηρεσία ή προϊόν– χωρίς αμφιβολία, δεν έχει υπάρξει ποτέ υπηρεσία πριν από την οποία ένας κανονικός άνθρωπος χρησιμοποιεί τόσο πολύ υπολογιστές.”

Κρατώντας μας σε τρόφιμα και ρούχα

Ωστόσο, το Midjourney δεν βρίσκεται στον δρόμο προς την αύξηση των πωλήσεων των πελατών που προσελκύονται από μια δωρεάν υπηρεσία σε πληρωμένες βαθμίδες και στη συνέχεια να προσελκύσει καλά αμειβόμενους πελάτες επιχειρήσεων πριν εισέλθει στο χρηματιστήριο ή αποκτηθεί.

«Δεν είμαστε σαν μια startup που συγκεντρώνει πολλά χρήματα και μετά δεν είναι σίγουρος ποια είναι η επιχείρηση ή το προϊόν της και χάνει χρήματα για μεγάλο χρονικό διάστημα», είπε ο Holz. «Είμαστε σαν ένα αυτοχρηματοδοτούμενο ερευνητικό εργαστήριο. Μπορούμε να χάσουμε κάποιο χρηματικό ποσό. Δεν έχουμε 100 εκατομμύρια δολάρια από χρήματα κάποιου άλλου να χάσουμε. Για να είμαι ειλικρινής, είμαστε ήδη κερδοφόροι και είμαστε καλά».

«Είναι ένα αρκετά απλό επιχειρηματικό μοντέλο, δηλαδή, απολαμβάνουν οι άνθρωποι να το χρησιμοποιούν; Στη συνέχεια, αν το κάνουν, θα πρέπει να πληρώσουν το κόστος της χρήσης του επειδή το ακατέργαστο κόστος είναι στην πραγματικότητα αρκετά ακριβό. Και μετά προσθέτουμε ένα ποσοστό πάνω από αυτό, το οποίο ελπίζουμε να είναι αρκετό για να μας ταΐσει και να μας στεγάσει. Και λοιπόν αυτό κάνουμε».

Όσο για το μέλλον, η κλιμάκωση μπορεί να είναι πρόβλημα. Ο Holz είπε ότι το Midjourney έχει επί του παρόντος εκατοντάδες χιλιάδες άτομα που χρησιμοποιούν την υπηρεσία, η οποία απαιτεί περίπου 10,000 διακομιστές.

«Αν υπήρχαν 10 εκατομμύρια άνθρωποι που προσπαθούσαν να χρησιμοποιήσουν τεχνολογία όπως αυτή», είπε, «στην πραγματικότητα δεν υπάρχουν αρκετοί υπολογιστές. Δεν υπάρχουν ένα εκατομμύριο δωρεάν διακομιστές για να κάνουν AI στον κόσμο. Νομίζω ότι ο κόσμος θα ξεμείνει από υπολογιστές προτού η τεχνολογία φτάσει πραγματικά σε όλους όσους θέλουν να τη χρησιμοποιήσουν».

Σε τι το χρησιμοποιούν οι άνθρωποι; Λοιπόν, εάν είστε συνδεδεμένοι σε έναν λογαριασμό Midjourney, μπορείτε να δείτε τι δημιουργούν οι χρήστες μέσω του Τροφοδοσία κοινότητας σελίδα. Είναι μια συνεχής ροή από ενδιαφέρουσες, συχνά εκπληκτικές καλές εικόνες.

«Η πλειοψηφία των ανθρώπων απλώς διασκεδάζει», είπε ο Χολτζ. «Νομίζω ότι αυτό είναι το μεγαλύτερο πράγμα γιατί στην πραγματικότητα δεν αφορά την τέχνη, είναι τη φαντασία».

Το να είσαι επαγγελματίας

Αλλά για περίπου το 30 τοις εκατό των χρηστών, είναι επαγγελματικό. Ο Holz είπε ότι πολλοί γραφίστες χρησιμοποιούν το Midjourney ως μέρος της ροής εργασίας τους για την ανάπτυξη της ιδέας. Δημιουργούν μερικές παραλλαγές σε μια ιδέα και την παρουσιάζουν στους πελάτες για να δουν ποια κατεύθυνση πρέπει να ακολουθήσουν.

«Οι επαγγελματίες το χρησιμοποιούν για να ενισχύσουν τη δημιουργική ή επικοινωνιακή τους διαδικασία», εξήγησε ο Holz. «Και τότε πολλοί άνθρωποι απλώς έπαιζαν με αυτό».

Ίσως το 20 τοις εκατό των ανθρώπων χρησιμοποιούν το Midjourney για αυτό που ο Holz περιγράφει ως θεραπεία τέχνης. Για παράδειγμα, δημιουργία εικόνων σκύλων μετά το θάνατο του σκύλου τους. «Το χρησιμοποιούν ως συναισθηματικό και πνευματικό στοχαστικό εργαλείο», είπε. «Και αυτό είναι πολύ ωραίο».

Ο Holz αντιπαθεί την ιδέα της χρήσης του Midjourney για τη δημιουργία ψεύτικων φωτογραφιών. «Η χρήση του εκδοτικά για τη δημιουργία ψεύτικων φωτογραφιών είναι εξαιρετικά επικίνδυνη», είπε. «Κανείς δεν πρέπει να το κάνει αυτό». Αλλά είναι πιο ανοιχτός στο Midjourney ως πηγή εμπορικής εικονογράφησης, σημειώνοντας ότι Ο Economist παρουσίασε ένα γραφικό του Midjourney στο εξώφυλλό του τον Ιούνιο.

«Μόλις πρόσφατα επιτρέψαμε στους ανθρώπους να το χρησιμοποιούν εμπορικά», είπε ο Holz. «Για πολύ καιρό, ήταν μόνο μη εμπορική. Και έτσι ένα από τα πράγματα που κάνουμε είναι ότι απλώς το παρακολουθούμε, τι κάνουν οι άνθρωποι και μπορεί να αποφασίσουμε ότι δεν νιώθουμε άνετα με μερικά από αυτά και μετά θα βάλουμε έναν κανόνα που λέει ότι δεν μπορεί πλέον να το χρησιμοποιήσει μόνο για αυτά τα πράγματα».

Ο Holz είπε ότι βλέπει εργαλεία τεχνητής νοημοσύνης όπως το Midjourney να κάνουν τους καλλιτέχνες καλύτερους σε αυτό που κάνουν αντί να κάνουν τους πάντες επαγγελματίες καλλιτέχνες. «Ένας καλλιτέχνης που χρησιμοποιεί αυτά τα εργαλεία είναι πάντα καλύτερος από έναν κανονικό άνθρωπο που χρησιμοποιεί αυτά τα εργαλεία. Κάποια στιγμή, μπορεί να υπάρξει πίεση για χρήση αυτών των εργαλείων επειδή μπορείτε να φτιάξετε πράγματα που είναι τόσο σπουδαία; Νομίζω ναι. Αλλά αυτή τη στιγμή, δεν νομίζω ότι είναι ακόμα εκεί. Αλλά θα γίνει συγκλονιστικά καλύτερο τα επόμενα δύο χρόνια».

Το Midjourney και το DALL-E 2 έχουν επιστήσει την προσοχή στις μακροχρόνιες ανησυχίες σχετικά με το εάν τα μεγάλα μοντέλα τεχνητής νοημοσύνης, που δημιουργήθηκαν από το έργο με δικαιώματα πνευματικής ιδιοκτησίας ή συγκεκριμένες άδειες, μπορούν να συμβιβαστούν με τη νομοθεσία περί πνευματικών δικαιωμάτων και με την αίσθηση των δημιουργών περιεχομένου για το πώς πρέπει να αντιμετωπίζεται το έργο τους.

Αμερική, χώρα της αγωγής

Όσον αφορά τα αποτελέσματα Midjourney, η τρέχουσα νομολογία των ΗΠΑ αρνείται τη δυνατότητα παραχώρησης πνευματικών δικαιωμάτων σε εικόνες που δημιουργούνται από AI. Τον Φεβρουάριο, η Επιτροπή Αναθεώρησης του Γραφείου Πνευματικών Δικαιωμάτων των ΗΠΑ απορρίφθηκαν [PDF] ένα δεύτερο αίτημα για παραχώρηση πνευματικών δικαιωμάτων σε ένα τοπίο που δημιουργήθηκε από υπολογιστή με τίτλο "A Recent Entrance to Paradise" επειδή δημιουργήθηκε χωρίς ανθρώπινη δημιουργό.

Σε μια τηλεφωνική συνέντευξη, είπε ο Τάιλερ Οτσόα, καθηγητής στο τμήμα Νομικής στο Πανεπιστήμιο Σάντα Κλάρα Το μητρώο, «Το Γραφείο Πνευματικών Δικαιωμάτων των ΗΠΑ είπε ότι είναι [αποδεκτό] εάν ένας καλλιτέχνης χρησιμοποιεί τεχνητή νοημοσύνη για να τον βοηθήσει στη δημιουργία ενός έργου, εφόσον εμπλέκεται κάποια ανθρώπινη δημιουργικότητα. Εάν απλώς πληκτρολογείτε κείμενο και η τεχνητή νοημοσύνη δημιουργεί ένα έργο, αυτό σαφώς δεν υπόκειται σε προστασία πνευματικών δικαιωμάτων βάσει της ισχύουσας νομοθεσίας».

Οι Όροι Παροχής Υπηρεσιών του Midjourney αναφέρουν ότι "σας κατέχετε όλα τα περιουσιακά στοιχεία που δημιουργείτε με τις Υπηρεσίες", αλλά η εταιρεία απαιτεί άδεια πνευματικών δικαιωμάτων από τους χρήστες για την αναπαραγωγή περιεχομένου που δημιουργήθηκε με την υπηρεσία – μια απαραίτητη προφύλαξη για τη φιλοξενία των εικόνων των χρηστών, ακόμη και αν φαίνεται αμφίβολο ότι Η δημιουργία εικόνων Midjourney απλά μέσω της εισαγωγής κειμένου έχει δικαιώματα πνευματικής ιδιοκτησίας για μεταφορά ή επιβολή.

Αυτό μπορεί να μην συμβαίνει πάντα. Ο Ochoa είπε ότι πιστεύει ότι ο Steven Thaler, ο οποίος δημιούργησε το "A Recent Entrance to Paradise", μπορεί να θέλει να αμφισβητήσει την απόρριψη του Γραφείου Πνευματικών Δικαιωμάτων στο δικαστήριο της συγγραφής που βασίζεται σε AI, αν και αυτό δεν έχει συμβεί ακόμη.

Υπάρχουν επίσης πιθανές ανησυχίες σχετικά με τα πνευματικά δικαιώματα που προκύπτουν από μοντέλα τεχνητής νοημοσύνης που έχουν εκπαιδευτεί σε υλικό που προστατεύεται από πνευματικά δικαιώματα. «Το ερώτημα είναι αν θα ήταν ή όχι σωστή χρήση αυτών των εικόνων για εκπαίδευση και τεχνητή νοημοσύνη», είπε ο Ochoa. «Και νομίζω ότι η περίπτωση για δίκαιη χρήση σε αυτό το πλαίσιο είναι αρκετά ισχυρή».

Επιπλέον, υπάρχει πιθανή ευθύνη για όσους δημιουργούν εικόνες που είναι ουσιαστικά παρόμοιες με το υπάρχον υλικό που προστατεύεται από πνευματικά δικαιώματα. «Αν το σετ προπόνησής σας δεν είναι αρκετά μεγάλο, αυτό που φτύνει η τεχνητή νοημοσύνη μπορεί να μοιάζει πολύ με αυτό που κατάποσε», εξήγησε ο Ochoa, σημειώνοντας ότι το ζήτημα είναι αν πρόκειται για παραβίαση πνευματικών δικαιωμάτων. «Έμμεσα, νομίζω ότι είναι πολύ πιθανό να είναι».

Όσον αφορά τον πιθανό νομικό κίνδυνο για πελάτες που χρησιμοποιούν περιουσιακά στοιχεία που παράγονται από το Midjourney, ο Ochoa είπε ότι πιστεύει ότι είναι αρκετά χαμηλός. Αν η εκπαίδευση ενός μοντέλου τεχνητής νοημοσύνης παραβίαζε πνευματικά δικαιώματα, αυτό έγινε πριν εμπλακεί ο πελάτης, εξήγησε. «Επομένως, εάν ο πελάτης δεν υποστήριξε τη δημιουργία του AI με κάποιο τρόπο, δεν νομίζω ότι [ο πελάτης] θα είναι υπεύθυνος για οποιαδήποτε παραβίαση του εκπαιδευτικού συνόλου», είπε. «Και αυτός είναι ο ισχυρότερος ισχυρισμός εδώ. Οπότε πιστεύω ότι οι πελάτες είναι σε αρκετά σταθερό έδαφος στη χρήση αυτών των εικόνων, υποθέτοντας ότι έγινε καλά.”

Ο Holz αναγνωρίζει ότι η νομική κατάσταση δεν είναι σαφής.

«Αυτή τη στιγμή, ο νόμος δεν έχει πραγματικά τίποτα για κάτι τέτοιο», είπε. «Από όσο γνωρίζω, κάθε μεγάλο μοντέλο τεχνητής νοημοσύνης είναι βασικά εκπαιδευμένο σε πράγματα που υπάρχουν στο διαδίκτυο. Και αυτό είναι εντάξει, αυτή τη στιγμή. Δεν υπάρχουν νόμοι ειδικά για αυτό. Ίσως στο μέλλον να υπάρξει. Αλλά είναι κάτι σαν μια νέα περιοχή, όπως η GPL ήταν ένα νέο νομικό πράγμα γύρω από τον κώδικα προγραμματισμού. Και χρειάστηκαν περίπου 20 ή 30 χρόνια για να γίνει πραγματικά κάτι που το νομικό σύστημα αρχίζει να καταλαβαίνει».

Ο Holz είπε ότι πιστεύει ότι είναι πιο σημαντικό αυτή τη στιγμή να κατανοήσουμε πώς νιώθουν τα ενδιαφερόμενα μέρη για αυτήν την τεχνολογία. «Έχουμε πολλούς καλλιτέχνες που χρησιμοποιούν τα πράγματά μας και τους ελέγχουμε συνεχώς, όπως «αισθάνεσαι καλά για αυτό;» είπε.

Ο Holz είπε ότι εάν υπάρχει αρκετή δυσαρέσκεια με το status quo, ίσως αξίζει να σκεφτούμε για κάποιο είδος δομής πληρωμής στο μέλλον για καλλιτέχνες των οποίων η δουλειά πηγαίνει σε μοντέλα εκπαίδευσης. Ωστόσο, παρατήρησε ότι η αξιολόγηση της έκτασης των συνεισφορών είναι δύσκολη επί του παρόντος. «Η πρόκληση για κάτι τέτοιο αυτή τη στιγμή είναι ότι δεν είναι πραγματικά σαφές τι κάνει τα μοντέλα AI να λειτουργούν καλά», είπε. «Αν βάλω μια φωτογραφία ενός σκύλου εκεί μέσα, πόσο πραγματικά βοηθά [το μοντέλο AI] να κάνει εικόνες σκύλου. Στην πραγματικότητα δεν είναι ξεκάθαρο ποια μέρη των δεδομένων δίνουν πραγματικά [στο μοντέλο] ποιες ικανότητες».

Ερωτηθείς για το τι δίνει στο Midjourney τη χαρακτηριστική του αισθητική, ο Holz είπε ότι δεν μπορούσε πραγματικά να συγκρίνει αυτό που κάνει το Midjourney με το DALL-E 2, αλλά ότι γενικά οι ερευνητές τεχνητής νοημοσύνης τείνουν να παίρνουν αυτό για το οποίο βελτιστοποιούν. Εάν βάλουν τη λέξη "σκύλος", τότε μάλλον θέλουν μια εικόνα ενός σκύλου.

«Για εμάς, ήμασταν όταν το βελτιστοποιούσαμε, θέλαμε να φαίνεται όμορφο και όμορφο δεν σημαίνει απαραίτητα ρεαλιστικό. … Αν μη τι άλλο, στην πραγματικότητα το μεροληπτούμε λίγο μακριά από τις φωτογραφίες. … Γνωρίζω ότι αυτή η τεχνολογία μπορεί να χρησιμοποιηθεί ως μια βαθιά ψεύτικη σούπερ μηχανή. Και δεν νομίζω ότι ο κόσμος χρειάζεται περισσότερες ψεύτικες φωτογραφίες. Δεν θέλω πραγματικά να γίνω πηγή ψεύτικων φωτογραφιών στον κόσμο».

«Πραγματικά νιώθω κάπως άβολα αν τα πράγματα μας κάνουν κάτι που μοιάζει με φωτογραφία. Και αυτό δεν σημαίνει ότι δεν θα αφήσουμε ποτέ τους ανθρώπους να κάνουν πράγματα πιο ρεαλιστικά. Υπάρχουν νόμιμες περιπτώσεις χρήσης για την προσπάθεια να γίνουν πράγματα που φαίνονται πιο ρεαλιστικά. Ωστόσο, αισθάνομαι έντονα ότι, από προεπιλογή, όταν κάποιος χρησιμοποιεί το σύστημά μας, δεν πρέπει να κάνει ψεύτικη φωτογραφία.»

«Αλλά πιστεύω ότι ο κόσμος χρειάζεται περισσότερη ομορφιά. Βασικά, αν δημιουργώ κάτι που επιτρέπει στους ανθρώπους να κάνουν όμορφα πράγματα, και υπάρχουν πιο όμορφα πράγματα στον κόσμο, αυτό θέλω από προεπιλογή». ®

spot_img

Τελευταία Νοημοσύνη

spot_img

Συνομιλία με μας

Γεια σου! Πώς μπορώ να σε βοηθήσω?