Google håper å gjeninnføre Geminis AI-bildegenererende evner i løpet av de neste par ukene, mens det løper for å fikse et problem som forhindret modellens tekst-til-bilde-tjeneste fra å avbilde hvite mennesker.
Forrige uke var Googles siste store språkmodellverktøy kritisert for å generere historisk unøyaktige bilder. Brukere la merke til at Gemini ofte ville generere bilder hvis mørkhudede mennesker ble bedt om å skildre historiske øyeblikk som er kjent for å ha omtalt hvite mennesker.
Den vil for eksempel ofte representere kvinner og menn fra ulike etnisiteter når de blir spurt om bilder av Paver or Vikings, som var typisk hvite. For å forhindre ytterligere forlegenhet, fjernet Google midlertidig Geminis evner til å generere bilder av mennesker.
På en paneldiskusjon på årets Mobile World Congress-konferanse i Barcelona, innrømmet Demis Hassabis, administrerende direktør i Google DeepMind, at modellen ikke "fungerte [på] den tiltenkte måten".
"Vi har tatt funksjonen offline mens vi fikser det. Vi håper å ha det online igjen snart i løpet av de neste par ukene, noen uker,» han la til.
AI-modeller som Gemini opprettholder ofte skjevheter og stereotypier. Bilder som portretterer leger eller administrerende direktører, for eksempel, viser ofte hvite menn. Utviklere må gjøre en bevisst innsats for å lage modeller som gir mangfoldige og rettferdige resultater, men det er ikke lett å gjøre det. Googles SVP Prabhakar Raghavan innrømmet at den ikke klarte å justere Geminis utganger effektivt.
"For det første, tuningen vår for å sikre at Gemini viste en rekke mennesker klarte ikke å redegjøre for tilfeller som tydeligvis ikke skulle vise en rekkevidde," sa han. "Og for det andre, over tid ble modellen mye mer forsiktig enn vi hadde tenkt, og nektet å svare helt på visse spørsmål – feilaktig tolket noen svært anodyne spørsmål som sensitive.
"Disse to tingene førte til at modellen overkompenserte i noen tilfeller og var overkonservativ i andre, noe som førte til bilder som var pinlige og feil."
Det er ikke klart hvordan Google finjusterte modellen sin, og om den eksplisitt ba Gemini om å generere mer varierte bilder av mennesker. En talsperson fra selskapet nektet å kommentere saken ytterligere.
Geminis tekstgenererende evner forblir imidlertid intakte. På mandag, Google annonsert nye Android-funksjoner som inkluderer den nyeste språkmodellen til mobiltelefoner og bilsystemer. Brukere vil snart kunne chatte med Gemini direkte i Google Messages for å lage tekst for å lære mer informasjon eller for å skrive utkast til e-post eller tekstmeldinger.
I mellomtiden, Android Auto vil automatisk oppsummere lange tekster eller samtaler i gruppechatter, og komme med relevante svar og handlinger automatisk for å hjelpe sjåfører med å svare raskt bak rattet. ®
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
- PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
- PlatoESG. Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
- PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
- kilde: https://go.theregister.com/feed/www.theregister.com/2024/02/27/google_gemini_return/