Platón adatintelligencia.
Vertical Search & Ai.

Üdvözlöm Cicerót, a hódítót – a mesterséges intelligencia legyőzi az embereket a diplomáciában

Találka:

A Meta Platforms Inc, a Facebook anyavállalata azt mondta, hogy olyan mesterséges intelligencia létrehozását hozta létre, amely túlszárnyalja az emberek eszét a népszerű stratégiai játék, a Diplomácia online változatában, ahol hét játékos verseng Európa földrajzi irányításáért úgy, hogy darabokat mozgat a térképen.

A Science.com-on megjelent cikkben Meta mondta Cicero volt az első mesterséges intelligencia-ügynök, aki emberi szintű teljesítményt ért el a Diplomáciában, egy olyan játékban, amely egyaránt magában foglalja az együttműködést és a versengést, amely a természetes nyelvi tárgyalásokat és a hét játékos közötti taktikai koordinációt hangsúlyozza.

Az online Diplomácia összesen 40 névtelen játékában Meta elmondta, hogy Cicero az emberi játékosok átlagos pontszámának több mint kétszeresét érte el, és az egynél több játékot játszó résztvevők legjobb 10%-ába került.

A vezető technológiai csoport szerint ez a mesterséges intelligencia területén a stratégiai és hosszú távú céljának része, hogy olyan ügynököket építsen, amelyek természetes nyelven tudnak tervezni, koordinálni és tárgyalni az emberekkel.

Mennyire fontos Cicero?

Meta szerint a Cicero meglehetősen jelentős, mivel az AI nem ellenséges környezetekre támaszkodik.

Ellentétben a múlttal, amikor a többügynököt tartalmazó mesterséges intelligencia korábbi jelentős sikereit pusztán ellenséges környezetekben érte el, mint például a sakk (2), a go (3) és a póker (4), ahol a kommunikációnak nincs értéke, Cicero stratégiai érvelési motort alkalmaz. és vezérelhető párbeszéd modul.

Ezen okok miatt a meta szerint a diplomácia kihívást jelentő mércéként szolgált a többágenses tanulásban.

„Cicero egy irányítható párbeszédmodult kapcsol össze egy stratégiai érvelési motorral. A játék minden pontján Cicero modellezi, hogy a többi játékos valószínűleg hogyan viselkedik a játék állapota és beszélgetéseik alapján” – mondja Meta.

A mesterséges intelligencia ezután megtervezi, hogy a játékosok hogyan koordinálhatják a kölcsönös előnyöket, és ezeket a terveket természetes nyelvű üzenetekké képezi le.

Egészséges bizalmatlanság

Cicero elkerüli, hogy vakon bízzon más szereplők javaslataiban, és elutasítja azokat a terveket, amelyeknek alacsony a „becsült értéke”, és amelyek párhuzamosan futnak a saját érdekeivel.

Tekintettel arra, hogy a diplomáciában a párbeszéd a játékospárok között privát módon zajlik, Cicero megindokolja és elemzi azokat az információkat, amelyekhez a játékosok hozzáférhetnek, amikor jóslatokat készítenek.

"Például, ha Cicero egy szövetségesével koordinál egy támadást egy ellenfél ellen, akkor Cicero előrejelzésének az ellenfél politikájáról figyelembe kell vennie azt a tényt, hogy az ellenfél nincs tisztában a tervezett koordinációval" - mondta Meta.

A Meta azt mondja, hogy 40. augusztus 19. és október 13. között névtelenül bekerült Ciceróba a Diplomácia 2022 meccsén egy emberi játékosokból álló online bajnokságban.

A 72 órányi játék során, amely 5,277 üzenet küldésével járt, Cicero az egynél több játékot játszó résztvevők legjobb 10%-ába került.

A Meta azt állítja, hogy 125,261 40,408 Diplomacy játékról gyűjtött adatokat, amelyeket online játszottak a webDiplomacy.net oldalon. Ezek közül a játékok közül összesen 12,901,662 XNUMX játék tartalmazott párbeszédet, és összesen XNUMX XNUMX XNUMX üzenetet váltottak a játékosok.

Prompt: "A robot mindenkit legyőz a diplomáciai játékban"

Prompt: „A robot mindenki mást legyőz a diplomáciai játékban” (AI által generált).

Meta megjegyzi, hogy az új mesterséges intelligencia korántsem tökéletes

Cicero hibákat tartalmazó üzeneteket küldött, néha ellentmondott saját terveinek és stratégiai baklövéseket követett el.

De Meta ragaszkodik ahhoz, hogy az emberek mégis úgy döntöttek, hogy más játékosokkal szemben együttműködnek az MI-vel, anélkül, hogy észrevennék, hogy az egy bot.

„Az AI szinte minden korábbi áttörése a játékokban a kétjátékos nulla összegű (2p0s) beállításokban történt, beleértve a sakkot, a Go-t, a heads-up pókert és a StarCraftot. A véges 2p0s játékokban bizonyos megerősítő tanulási (RL) algoritmusok, amelyek önmaguk ellen játszva tanulnak – ez az úgynevezett self-play – olyan politikához fognak konvergálni, amely a kiegyensúlyozott játékokban verhetetlen elvárásokkal rendelkezik” – tette hozzá Meta a lapban. "Más szóval, bármilyen véges 2p0s játék megoldható önálló játékkal, elegendő számítási és modellkapacitással."

Meta azonban azt mondta az együttműködést magában foglaló játékokkal kapcsolatban, hogy az emberi adatok nélküli önjáték már nem garantálja, hogy olyan politikát találjon, amely jól teljesít az emberekkel, még végtelen számítási és modellkapacitás mellett sem, mert az önjátszma ágens konvergálhat egy olyan politikához, amely összeegyeztethetetlen az emberi normákkal és elvárásokkal.

Meta hozzátette, hogy Cicero a tábla állapota és a párbeszéd alapján minden játékos számára előre látja a valószínű akciókat, és ezt használja kiindulópontként a tervezési algoritmushoz, RL-vel képzett modelleket használva.

Az AI egy stratégiai érvelési modult használ a szándékok és cselekvések intelligens kiválasztására, mondja a vállalat.

Ez a modul ezután egy tervezési algoritmust futtat, amely előrejelzi az összes többi játékos szabályait a játék állapota és a párbeszéd alapján, és figyelembe veszi a különböző akciók erejét és valószínűségét az emberi játékokban. Ezen információk és a változók alapján Cicero számára a legjobb optimális intézkedést hozzuk meg.

A Meta alapítója és vezérigazgatója, Mark Zuckerberg vezetése alatt a vállalat jelentős összegeket fektet be az AI-ba és a metaverzumba, hogy kihasználja a technológia jövőjének tekintett gyorsan növekvő iparág előnyeit.

A MetaNews.

spot_img

Legújabb intelligencia

spot_img

Beszélj velünk

Szia! Miben segíthetek?