Platoni andmete intelligentsus.
Vertikaalne otsing ja Ai.

AlphaCode 2, koodi genereeriv AI, mida on uuendatud Gemini komplektiga

kuupäev:

Google'i uusim koodi genereeriv mudel - AlphaCode 2, mis töötab selle Gemini Pro süsteemil ja debüteeris kolmapäeval avalikult - saavutas väidetavalt üle 99.5 protsentiil osalejatest, kes võistlesid võrgus programmeerimisvõistlustel.

Google DeepMindi teadlased viimistlesid Kaksikud Pro andmestikul, et täiustada oma probleemide lahendamise oskusi, et luua AlphaCode 2. Andmekogum sisaldas umbes 15,000 30 probleemi, mis võeti CodeForcesist – konkurentsivõimelisest programmeerimissaidist – ja XNUMX miljonit inimeste kirjutatud koodi näidist. 

Mudelit viimistleti veelgi kõrgema kvaliteediga täiendava andmekogumi abil, kuid vastavalt mudeli nappidele üksikasjadele pole päris selge, milliseid andmeid kasutati või kui palju täpselt. tehniline aruanne [PDF]. Kui AlphaCode 2 testiti 77 probleemiga 12 CodeForcesi võistluse jooksul, kus see võistles kokku enam kui 8,000 programmeerijaga, suutis see lahendada 43 protsenti neist. AlphaCode 2 esitas oma vastused C++ keeles.

Võrdluseks eelmine Alfakood süsteem lahendas 25 protsenti erinevatest CodeForcesi seatud probleemidest.

"Võttes seda konkurentsi edetabelisse, on meie hinnangul AlphaCode 2 keskmiselt 85. protsentiili juures, st see toimib paremini kui 85 [protsent osalejatest], jäädes Codeforces'i kategooriate "Ekspert" ja "Meistrikandidaat" vahele. teadlased väitsid. 

Teie töökohad on praegu turvalised

Kahel võistlusel kaheteistkümnest, kus ta osales, ületas AlphaCode 2 99.5 protsenti osalejatest. Kuigi muljetavaldavad, olid võistlustingimused masinal ja inimesel erinevad.

AlphaCode 2 võib esitada igale probleemile kuni kümme erinevat lahendust ja koguda punkte, kui üks neist on õige – erinevalt inimkandidaatidest, kellel on üks võimalus väljakutset lahendada.

AlphaCode 2 toimib ka bioloogilistest programmeerijatest väga erinevalt. Probleemi korral genereerib see umbes miljon erinevat koodinäidist, mis seejärel filtreeritakse. Juhuslikud skriptid, mis on ebaolulised ja ei vasta probleemi kirjeldusele – või need, mis genereerivad valed näidistesti vastused või ei kompileeri üldse – eemaldatakse.

"Iga konkureeriva programmeerimise probleem sisaldab vähemalt ühte avalikku sisend-/väljundtesti, mis näitab, kuidas koodinäidised peaksid käituma. Käitame iga koodinäidise vastaval testisisendil ja filtreerime välja kõik, mis ei anna oodatud väljundit ja seetõttu ei saanud olla õiged,“ selgitasid teadlased.

Filtreerimine vabastab 95 protsendist AlphaCode 2 genereeritud koodinäidistest. Järgmisena kogub rühmitusalgoritm 50,000 XNUMX ülejäänud programmi sarnasuse alusel järjestades ja sorteerib need erinevatesse rühmadesse. Kümme suurimat klastrit hindab seejärel eraldi Gemini Pro mudel, mis on koolitatud nende täpsust ennustama. Seejärel järjestatakse kümne erineva klastri proovid parimast viimaseni ja igast rühmast esitatakse parim. 

Inimkodeerijad mõtlevad tavaliselt probleemi lahendamiseks välja erinevad strateegiad, siis otsivad välja kõige lootustandvama idee ja kirjutavad selle üles, selle asemel, et proovida miljoneid erinevaid lahendusi. Edu sõltub probleemide mõistmisest ja nende lahendamiseks nutikate matemaatiliste nippide väljamõtlemisest.

AlphaCode 2 jõhkra jõu lähenemisviis – kogu selle koodi filtreerimine ja erinevate mudelite käivitamine parimate hindamiseks ja järjestamiseks – on arvutusmahukas, seega on selle tõhusamaks muutmiseks tõenäoliselt liiga kulukas.

"Hoolimata AlphaCode 2 muljetavaldavatest tulemustest, on veel palju teha, enne kui näeme süsteeme, mis suudavad usaldusväärselt saavutada parimate inimkodeerijate jõudlust. Meie süsteem nõuab palju katse-eksitusmeetodeid ning jääb mastaapseks kasutamiseks liiga kulukaks. Lisaks sõltub see suuresti ilmselgelt halbade koodinäidiste väljafiltreerimisest, " tunnistasid teadlased. 

Sellegipoolest on AlphaCode 2 vana AlphaCode'iga võrreldes suur edasiminek ja rohkem kui 10,000 100 korda tõhusam, väidab Google. See nõuab ainult XNUMX genereeritud näidist, et saavutada sama jõudlus kui AlphaCode, mis nõudis miljonit.

Google DeepMind usub, et suudab luua veelgi parema koodikirjutamise mudeli, kasutades Gemini Ultrat – suuremat ja võimsamat suure keele mudelit kui Gemini Pro – ning ütles, et püüab proovida ja teha oma võimalused arendajatele kättesaadavaks.

"Loodame, et selline interaktiivne kodeerimine on programmeerimise tulevik, kus programmeerijad kasutavad suure võimekusega tehisintellekti mudeleid koostöövahenditena, mis aitavad neil probleeme põhjendada, koodikujundust pakkuda ja juurutada," järeldas meeskond. .

"Me töötame selle nimel, et tuua AlphaCode 2 ainulaadsed võimalused meie sihtasutuse Gemini mudelitesse esimese sammuna, et muuta see uus programmeerimisparadigma kõigile kättesaadavaks." ®

spot_img

Uusim intelligentsus

spot_img

Jututuba koos meiega

Tere! Kuidas ma teid aidata saan?