Platon Data Intelligence.
Vertikal søgning & Ai.

Kryptofrøsætninger bliver transformeret til AI-genereret quizkunst

Dato:

Meta Platforms Inc, Facebooks moderselskab, sagde, at det har skabt en AI, der kan overliste mennesker i en onlineversion af det populære strategispil, Diplomacy, hvor syv spillere konkurrerer om geografisk kontrol over Europa ved at flytte brikker rundt på et kort.

I et papir offentliggjort på Science.com sagde Meta Cicero, var den første AI-agent til at opnå præstationer på menneskeligt niveau i Diplomacy, et spil, der involverer både samarbejde og konkurrence, der lægger vægt på naturlig sprogforhandling og taktisk koordinering mellem syv spillere.

I i alt 40 anonyme spil online Diplomacy sagde Meta, at Cicero havde opnået mere end det dobbelte af den gennemsnitlige score af de menneskelige spillere og rangeret i top 10% af deltagere, der spillede mere end ét spil.

Den førende teknologigruppe sagde, at dette var en del af dens strategiske og langsigtede mål inden for kunstig intelligens at bygge agenter, der kan planlægge, koordinere og forhandle med mennesker i naturligt sprog.

Hvor vigtig er Cicero?

Meta siger, at Cicero er ret betydningsfuld, fordi AI er afhængig af ikke-adversarielle miljøer.

I modsætning til tidligere, hvor tidligere store succeser for multi-agent AI har været i rent modstridende miljøer, såsom skak, Go og Poker, hvor kommunikation ikke har nogen værdi, anvender Cicero en strategisk ræsonnementmotor og kontrollerbart dialogmodul.

Af disse grunde siger meta, at diplomati har fungeret som et udfordrende benchmark for multi-agent læring.

"Cicero kobler et kontrollerbart dialogmodul med en strategisk ræsonnementmotor. På hvert tidspunkt i spillet modellerer Cicero, hvordan de andre spillere sandsynligvis vil agere baseret på spillets tilstand og deres samtaler,Meta siger.

AI'en planlægger derefter, hvordan spillerne kan koordinere til deres gensidige fordel og kortlægger disse planer i naturlige sprogbeskeder.

Sund mistillid

Cicero undgår blindt at stole på forslag fra andre spillere og afviser planer, der har lav "forudsagt værdi", og som løber parallelt med dens egne interesser.

På grund af det faktum, at dialog i Diplomacy foregår privat mellem par af spillere, begrunder og analyserer Cicero den information, spillerne har adgang til, når de laver forudsigelser.

"For eksempel, hvis Cicero koordinerer et angreb med en allieret mod en modstander, skal Ciceros forudsigelse af modstanderens politik tage højde for det faktum, at modstanderen ikke er klar over den påtænkte koordinering,"sagde Meta.

Meta siger, at det gik anonymt ind i Cicero i 40 spil Diplomacy i en online-liga af menneskelige spillere mellem den 19. august og den 13. oktober 2022.

I løbet af 72 timers spil, der involverede at sende 5,277 beskeder, rangerede Cicero blandt de bedste 10% af deltagere, der spillede mere end ét spil, hedder det.

Meta siger, at det har indsamlet data fra 125,261 spil af Diplomacy spillet online på webDiplomacy.net. Af disse spil indeholdt i alt 40,408 spil dialog, med i alt 12,901,662 beskeder udvekslet mellem spillere.

Prompt: "Robot slår alle andre i et spil diplomati"

Spørgsmål: "Robot slår alle andre i et spil Diplomacy" (AI-genereret).

Meta-noter, dens nye AI er langt fra perfekt

Cicero sendte beskeder, der indeholdt fejl, nogle gange modsagde sine egne planer og lavede strategiske bommerter.

Men Meta insisterer på, at mennesker alligevel valgte at samarbejde med AI frem for andre spillere uden at indse, at det var en Bot.

"Næsten alle tidligere AI-gennembrud i spil har været i to-spillers nulsumsindstillinger (2p0s), inklusive skak, Go, heads-up poker og StarCraft. I finite 2p0s-spil vil visse forstærkningslæringsalgoritmer (RL) der lærer ved at spille mod sig selv – en proces kendt som selvspil – konvergere til en politik, der er uovervindelig i forventninger i balancerede spil,” tilføjede Meta i avisen. "Med andre ord kan ethvert endeligt 2p0s-spil løses via selvspil med tilstrækkelig beregnings- og modelkapacitet."

Men Meta sagde angående spil, der involverer samarbejde, at selvspil uden menneskelige data ikke længere er garanteret at finde en politik, der fungerer godt med mennesker, selv med uendelig beregnings- og modelkapacitet, fordi selvspilsagenten kan konvergere til en politik, der er uforenelig med menneskelige normer og forventninger.

Cicero forudser sandsynlige handlinger

Meta tilføjede, at Cicero forventer sandsynlige handlinger for hver spiller baseret på brættets tilstand og dialog, ved at bruge det som udgangspunkt for en planlægningsalgoritme ved hjælp af RL-trænede modeller.

AI bruger et strategisk ræsonnement modul til intelligent at vælge hensigter og handlinger, siger virksomheden.

Dette modul kører derefter en planlægningsalgoritme, der forudsiger alle andre spilleres politikker baseret på spillets tilstand og dialog og tager højde for både styrken af ​​forskellige handlinger og deres sandsynlighed i menneskelige spil. Baseret på denne information og variabler tages den bedste optimale handling for Cicero.

Under Metas grundlægger og administrerende direktør Mark Zuckerberg har virksomheden investeret kraftigt i kunstig intelligens og metaverset for at drage fordel af den hurtigt voksende industri, der ses som teknologiens fremtid.

/MetaNews

spot_img

Seneste efterretninger

spot_img

Chat med os

Hej! Hvordan kan jeg hjælpe dig?