OpenAI har i nogle måneder haltet efter Google, når det gælder billedgenerering via AI, hvor søgegiganten fik placeret sig langt i front med sin ’Nano Banana 2’ model.
Nu er OpenAI klar med en ripost, i form af version 2.0 af sin ChatGPT Images model, som markerer sig ved at tænke sig om grundigt, før den tegner, mens den samtidig er blevet langt bedre til at håndtere tekst på forskellige sprog.
Fordi den nye model ræsonnerer, afprøver den flere resultater før den giver sit output. OpenAI kalder det derfor også en "visual thought partner" snarere end blot et rendering-værktøj. Tilstanden kan søge på nettet, lave op til otte sammenhængende billeder fra én prompt og reducere antallet af manuelle rettelser.
Kunstig intelligens har hidtil døjet meget med at få tekst til at se rigtig ud inde i billeder, eller bare overhovedet at stave. Images 2.0 levererer nu læsbar tekst i udvalgte fonte til plakater, infografikker og menuer. Den gør det også i svære alfabeter såsom japansk, koreansk, hindi, bengali og kinesisk.
Images 2.0 kan smatidig levere fotos i højere opløsning end Full HD med op til 2.000 pixels bredde, samt i valgfri billedformatter fra 3:1 til 1:3. Flere billeder kan også bevare det samme look og stil på tværs af fotos, hvilket gør det lettere at få sammenhængende resultater til reklamekampagner eller tegneserier.
Tre ugers nedtælling
Grundfunktionen er gratis for alle ChatGPT- og Codex-brugere. Den mere avancerede ’Thinking mode’ kræver dog Plus, Pro eller Business-abonnementer.
ChatGPT Images lanceres 21. april og brede
Lanceringen betyder saamtidigt et farvel til OpenAIs DALL-E-serie. Både DALL-E 2 og DALL-E 3 udfases 12. maj 2026, altså om blot tre uger.
Virksomheder med integrationer af DALL-E modeler skal derfor hasteopdatere deres API-kald for at undgå at deres integrationer vil fejle.