Denne klumme er et debatindlæg og er alene udtryk for forfatterens synspunkter.
I slutningen af marts skete der endnu et skred inden for generativ AI – og selvom skred nu optræder oftere og oftere, så var dette bemærkelsesværdigt.
ChatGPT lancerede nemlig deres længe ventede opdatering af billedgenereringen. Og på mange måder er det en lige så stor lancering som selve introduktionen af ChatGPT tilbage i december 2022.
Den påstand kan naturligvis diskuteres, men hæng lige fast i betydningen: ChatGPT har siden sin udbredelse kunne generere billeder, men de har været elendige, tilfældige og i nogle tilfælde direkte stødende.
Og det tog ikke mange minutter, før konkurrenterne præsenterede langt bedre modeller, som hurtigt vandt brugernes gunst.
Reelt set har vi i flere år kunnet skabe billeder, der ligner virkeligheden.
Vi har kunnet lave logoer, grafiske elementer og visuelle mesterværker blot ved hjælp af en enkel prompt. Bare ikke i ChatGPT. Og det gør en forskel.
Stærke men ukendte konkurrenter
Konkurrenter som Midjourney, Leonardo, Ideogram og flere andre kan skabe billeder så smukke, at de sagtens kunne hænge på væggen som kunst.
Forskellen er blot, at disse tjenester stadig lever i nicher – for dem, der ved, de findes. Ingen af dem deler deres brugerantal, men et kvalificeret gæt er, at de stadig er langt fra ChatGPTs massive udbredelse og globale tilgængelighed.
Midjourney er nok den mest kendte konkurrent. Den udkom i sin første version 14. marts 2022 og var ikke videre imponerende.
Bad man om et billede af en mand i rød jakke, fik man måske en sløret plet med noget rødt i sig – men uden arme eller hoved.
Årene forinden havde Google allerede præsenteret deres DeepMind-genererede billeder – mareridtsagtige, mangeøjede visioner, som var teknisk imponerende, men ubehagelige at kigge på.
Eksponentiel udvikling
Det smukke ved teknologiens udvikling er dens eksponentielle karakter. Moores Lov beskriver, hvordan processorkraft fordobles cirka hver 18. måned – hurtigere, bedre, mere energivenligt. Men generativ AI inden for billeder slår selv Moores Lov af banen.
Blot ét år efter Midjourneys debut kunne man bruge samme prompt – en mand i rød jakke – og få et realistisk, elegant foto.
Udviklingen er så markant, at vi kunne tale om en ny lov for eksponentiel fremdrift.
Siden er det fortsat. Ikke med de samme spring som tidligere, men stadig med imponerende forbedringer måned for måned.
Midjourney er nu i version 7.0, og selvom springet ikke er enormt, er det også svært at forbedre noget, der allerede ligner virkeligheden.
Mens Midjourney er bedst til de visuelle, drømmeagtige billeder, excellerer Ideogram i det grafiske. Det er fremragende til logoer og billeder med tekst. Version 3.0 er netop lanceret og forbedrer brugervenligheden og kvaliteten.
ChatGPT rykker mod toppen
Flere tjenester imponerer, men rammer ikke den brede brugergruppe. Det er netop her, ChatGPT skaber et nyt narrativ.
Med opdateringen i marts kan alle nu skabe naturtro billeder, infografikker eller reklamer ud fra en enkel prompt.
Det er et skifte i funktion og tilgængelighed. Nu kan langt flere skabe billeder og grafisk indhold uden teknisk viden. Det, som før krævede ekspertise, er nu tilgængeligt for alle.
Se blot på de seneste trends: Studio Ghibli-billeder, hvor almindelige fotos bliver forvandlet til Hayao Miyazakis tegnestil. Eller actionfigurer, hvor alle kunne blive til legetøjsfigurer i plastæsker. Det er store ting, må vi forstå.
Det, der gør ChatGPTs billedgenerering ekstra brugbar, er dog ikke kun de kunstneriske eller humoristiske anvendelser. Det er også det praktiske.
Har du brug for et hurtigt visuelt element til en PowerPoint, et logo til en iværksætter-idé, en infografik til at forklare en proces, en illustration til undervisning eller et mockup til en kampagne – så er det nu bare en prompt væk.
Og det hele kan skabes direkte i den samtale, du i forvejen fører med ChatGPT. Ingen behov for at hoppe mellem platforme.
Med den nyeste funktionalitet er det også muligt at redigere eksisterende billeder, genskabe visuelle stilarter, trække på detaljerede beskrivelser og skabe variationer med få klik. Det gør ChatGPTs billedgenerator til et effektivt, kreativt og tilgængeligt værktøj for alle – lige fra marketingfolk til skoleelever.
Hvad det betyder for det allerede overfyldte indholdslandskab på sociale medier og nettet generelt, er endnu uklart.
Men lige nu er det smukke, at vi alle kan være med.
Klummer er læsernes platform på Computerworld til at fortælle de bedste historier, og samtidig er det vores meget populære og meget læste forum for videndeling.
Har du en god historie, eller har du specialviden, som du synes trænger til at blive delt?
Læs vores klumme-guidelines og send os din tekst, så kontakter vi dig - måske bliver du en del af vores hurtigt voksende korps af klummeskribenter.