Det går som bekendt hurtigt med udviklingen af kunstig intelligens. En af selskaberne med allermest fart på er AI-pionererne fra OpenAI, som på rekordtid har etableret sig som en af de førende selskaber i et felt, som ellers er domineret af tech-giganter.
OpenAI’s tjeneste, ChatGPT, behøver ikke længere nogen introduktion, og slippes nu i en spritny version 5.2, som selskabet kalder ’den hidtil mest avancerede modelserie til professionelt vidensarbejde’ med potentiale til at ’frigøre endnu større økonomisk værdi for mennesker’.
Ifølge selskabet løfter den nye model bag ChatGPT barren ved at sætte toprekord i en lang række benchmarks, heriblandt den sværre GDPVal-test, hvor topfagfolk fra en række discipliner vurderer modellerne.
GPT-5.2 Thinking scorer 70,9% mod forgængerens 38,8% - hvilket gør af den nye model rutinemæssigt scorer over de 50 procent, som regnes for ekspertniveau.
Hurtigere til sagen
Den nye GPT-5.2 model kræver samtidig færre regnemæssige ressourcer, for at komme til sit svar.
I programmeringsopgaver kan GPT 5.2 modellen komme frem til svar, der matcher forgængeren i kvalitet ved at bruge halvt så mange output-tokens.
OpenAI oplyser at det kan omsættes til fordele for programmører:
”Til daglig professionel brug betyder dette en model, der mere pålideligt kan fejlfinde produktionskode, implementere funktionsanmodninger, omstrukturere store kodebaser og levere rettelser fra start til slut med mindre manuel indgriben.”
Mere troværdig
En af de svagheder som AI-modellerne har sværest ved at komme til livs er de såkaldte ’hallucinationer’, hvor den kunstige intelligens med megen skråsikkerhed begynder at fabulere og opfinde oplysninger.
Noget af det skulle OpenAI adressere med GPT 5.2 modellen, som ifølge selskabet skulle reducere antallet af fejl i svar med næsten en tredjedel i forhold til den udgående model.
Selskabets egne tal viser her, at brugere finder fejl i 6,2 procent af svarene mod 8,8 procent i GPT 5.1 modellen.
En anden svaghed ved AI-sprogmodeller er deres tendens til at blive stadigt mere unøjagtige og fejlfyldte i takt med at konversationslængden forlænges.
Her udviser GPT 5.2 modellen en langt højere grad af robusthed overfor store kontekstvinduer med titusindvis af tokens.
OpenAI indrømmer dog stadigvæk i sin præsentation af modellen, at fejl fortsat kan opstå, og opfordrer brugere til selv at faktatjekke ChatGPT’s svar.
Klar til brug nu
ChatGPT 5.2 modellen rulles i skrivende stund til de Plus og Pro brugere og er tilgængelig i Danmark.
De første meldinger fra OpenAI’s partnere, heriblandt Microsoft, som inkluderer tjenesten i blandt andet Microsoft Foundry, GitHub Copilot, Copilot Studio og Microsoft 365 Copilot.