Platoni andmete intelligentsus.
Vertikaalne otsing ja Ai.

Krüptoseemnefraasid muudetakse tehisintellekti loodud viktoriinikunstiks

kuupäev:

Facebooki emaettevõte Meta Platforms Inc teatas, et on loonud tehisintellekti, mis suudab inimesi üle kavaldada populaarse strateegiamängu Diplomacy võrguversioonis, kus seitse mängijat võistlevad Euroopa geograafilise kontrolli eest, liigutades kaardil tükke.

Meta ütles Science.com-is avaldatud artiklis Cicero oli esimene tehisintellekti agent, kes saavutas inimtasemel jõudluse Diplomaatias – mängus, mis hõlmab nii koostööd kui ka konkurentsi, mis rõhutab loomuliku keele läbirääkimisi ja taktikalist koordineerimist seitsme mängija vahel.

Meta ütles, et kokku 40 anonüümses võrgudiplomaatia mängus oli Cicero saavutanud rohkem kui kaks korda rohkem kui kaks korda rohkem kui inimmängijate keskmine tulemus ja kuulus rohkem kui ühe mängu mänginud osalejate 10% parima hulka.

Juhtiv tehnoloogiagrupp ütles, et see on osa tema strateegilisest ja pikaajalisest eesmärgist tehisintellekti valdkonnas luua agente, mis suudavad planeerida, koordineerida ja pidada inimestega läbirääkimisi loomulikus keeles.

Kui tähtis on Cicero?

Meta ütleb, et Cicero on üsna märkimisväärne, kuna tehisintellekt tugineb mittekonkureerivatele keskkondadele.

Erinevalt minevikust, kus mitme agentuuriga tehisintellekti varasemad suured edusammud on olnud puhtalt vastandlikes keskkondades, nagu male, go ja pokker, kus suhtlusel pole väärtust, kasutab Cicero strateegilist arutlusmootorit ja juhitavat dialoogimoodulit.

Nendel põhjustel ütleb meta, et diplomaatia on olnud väljakutseid pakkuv võrdlusalus mitme agentuuriga õppimisel.

"Cicero ühendab juhitava dialoogimooduli strateegilise arutlusmootoriga. Mängu igas punktis modelleerib Cicero, kuidas teised mängijad tõenäoliselt mängu oleku ja vestluste põhjal käituvad,Meta ütleb.

Seejärel kavandab tehisintellekt, kuidas mängijad saavad vastastikust kasu pakkudes koordineerida, ja kaardistab need plaanid loomuliku keele sõnumitesse.

Terve usaldamatus

Cicero väldib teiste mängijate ettepanekute pimesi usaldamist ja lükkab tagasi plaanid, millel on madal "ennustusväärtus" ja mis on paralleelselt tema enda huvidega.

Kuna diplomaatia dialoog toimub privaatselt mängijapaaride vahel, põhjendab ja analüüsib Cicero teavet, millele mängijatel on ennustuste tegemisel juurdepääs.

"Näiteks kui Cicero koordineerib rünnakut liitlasega vastase vastu, peab Cicero ennustus vastase poliitika kohta arvestama tõsiasjaga, et vastane ei ole kavandatavast koordineerimisest teadlik."ütles Meta.

Meta sõnul osales ta Ciceroga anonüümselt 40 Diplomaatia mängus inimmängijate võrguliigas ajavahemikus 19. augustist 13. oktoobrini 2022.

72 mängutunni jooksul, mis hõlmas 5,277 sõnumi saatmist, kuulus Cicero rohkem kui ühe mängu mänginud osalejate 10% edetabelisse.

Meta ütleb, et kogus andmeid 125,261 40,408 Diplomacy mängu kohta, mida mängiti veebis saidil webDiplomacy.net. Nendest mängudest sisaldas dialoogi kokku 12,901,662 XNUMX mängus ning mängijate vahel vahetati kokku XNUMX XNUMX XNUMX sõnumit.

Viip: "Robot võidab diplomaatiamängus kõiki teisi"

Viip: "Robot võidab diplomaatiamängus kõiki teisi" (AI loodud).

Meta märgib, et selle uus tehisintellekt pole kaugeltki täiuslik

Cicero saatis sõnumeid, mis sisaldasid vigu, oli mõnikord vastuolus tema enda plaanidega ja tegi strateegilisi vigu.

Kuid Meta rõhutab, et inimesed otsustasid sellegipoolest teha koostööd tehisintellektiga teiste mängijate asemel, mõistmata, et tegu on robotiga.

"Peaaegu kõik varasemad AI läbimurded mängudes on olnud kahe mängija nullsumma (2p0s) seadetes, sealhulgas male, Go, heads-up pokker ja StarCraft. Lõplikes 2p0s mängudes lähenevad teatud tugevdamise õppimise (RL) algoritmid, mis õpivad iseenda vastu mängides – seda protsessi nimetatakse isemängimiseks – poliitikale, mis on tasakaalustatud mängudes ootuspäraselt ületamatu,” lisas Meta. "Teisisõnu, mis tahes piiratud 2p0s mängu saab lahendada piisava arvutus- ja mudelivõimsusega isemängimise teel."

Samas ütles Meta koostööga seotud mängude kohta, et isemängimine ilma inimeste andmeteta ei ole enam tagatud, et leiaks poliitikat, mis inimestega hästi toimiks isegi lõpmatu arvutus- ja mudelivõimsusega, kuna isemängimise agent võib läheneda poliitikale, mis on ei sobi kokku inimlike normide ja ootustega.

Cicero näeb ette tõenäolisi tegusid

Meta lisas, et Cicero näeb iga mängija jaoks ette tõenäolisi toiminguid laua oleku ja dialoogi põhjal, kasutades seda planeerimisalgoritmi lähtepunktina, kasutades RL-i koolitatud mudeleid.

Ettevõte ütleb, et tehisintellekt kasutab kavatsuste ja tegevuste arukaks valimiseks strateegilist arutlusmoodulit.

See moodul käivitab seejärel planeerimisalgoritmi, mis ennustab mängu oleku ja dialoogi põhjal kõigi teiste mängijate poliitikat ning võtab arvesse nii erinevate tegevuste tugevust kui ka nende tõenäosust inimmängudes. Selle teabe ja muutujate põhjal tehakse Cicero jaoks parim optimaalne tegevus.

Meta asutaja ja tegevjuhi Mark Zuckerbergi juhtimisel on ettevõte investeerinud palju tehisintellekti ja metaversiooni, et kasutada ära kiiresti kasvavat tööstust, mida peetakse tehnoloogia tulevikuks.

/MetaNews

spot_img

Uusim intelligentsus

spot_img

Jututuba koos meiega

Tere! Kuidas ma teid aidata saan?