Fra GPT-4 til R1: Er open source den store gamechanger?

Klumme: Lanceringen af en model fra kinesiske Deep Seek, har sendt chokbølger gennem Generativ AI-scenens gulvbrædder.

Artikel top billede

(Foto: Foto af Steve Johnson / Unsplash)

Denne klumme er et debatindlæg og er alene udtryk for forfatterens synspunkter.

I slutningen af 2024 skrev jeg om den nye o1 model fra OpenAI og sluttede af med et citat om, at jeg ikke kunne: "..se, hvad loftet for o1 og dens efterfølgere kommer til at være.

Netop derfor bør vi i den kommende fremtid være ekstra opmærksomme på denne nye type model, og hvor langt vi kan nå med dens brug af chain-of-thought og Reinforcement Learning."

Og lige inden årsskiftet præsenterede OpenAI så modellen "o3", som - på den respekterede og ekstremt krævende AGI benchmark "ARC-AGI Semi-Private Evaluation" - løftede GPT4o performance på 5 procent og o1s 30 procent helt op til 87,5 procent.

O3 er ikke bredt tilgængelig endnu og o1 er stadig ganske dyr – i hvert fald til at starte med.

Forvent trampolinpark-prisudvikling

Som man kan se i figuren er o3 ikke langt bedre – den er også langt dyrere, hvilket man også ser når o1 udbydes i dag, men en pris et godt stykke over andre modeller.

Prisen er dog også i voldsom udvikling.

Billigere alternativer med konkurrencedygtig performance er nemlig begyndt at dukke op på markedet – ikke mindst på open source-scenen, hvor modellerne er mere eller mindre åbne, gratis at hente ned og sætte op til både privat og kommerciel brug, og hvor API-kald til en eventuel udbyder er langt billigere.

Vil du prøve r1? Bare gå på deepseek.com og opret en bruger med en .com-konto (f.eks. gmail), og prøve den gratis.

GenAI-disruption fra Kina

Open Source har dog været bagud på performance., mens afstanden mellem kommercielle modeller og open source modeller så ud til kun at vokse.

Det var da lige indtil det kinesiske Deep Seek, der først i 2023 kom ind på AI-markedet, for nyligt frigav en model, der skulle sende chokbølger gennem Generativ AI scenens gulvbrædder.

Deep Seek er lige så stærk som OpenAIs o1, open Source, og API-kald koster en brøkdel af o1; Som i at en million tokens i o1 koster over 25 gange så meget som en million tokens i r1.

Det er en voldsom prisforskel, som blandt andet vil presse prisen på o1 ned i både OpenAI og Azure AI Services.

Kritikere pointerer, at r1 indeholder finetuning af kinesiske værdier, så den for eksempel ikke kan sige noget kritisk om den kinesiske regering, hvilket er sandt.

Her skal man bare lige huske på, at modellen er åben og kan finetunes til et politisk neutralt ståsted.

Dette bliver måske endda gjort for os, når den udbydes i andre platforme, eller destilleres ned til nye, mindre men effektive modeller.

Personligt ser jeg frem til en mulig ”r3”-version af o3 fra Deep Seek.

Er det stadig logisk atomisme?

Modellen o3 er så stærk, at den åbner diskussionen om AGI på ny.

Min egen indstilling hertil er, at uanset performance, er det stadig baseret på den logiske atomisme, jeg udfoldede i den allerførste klumme; altså at modellerne ”kun” forholder sig til, hvordan ord er placeret i forhold til hinanden matematisk, og ikke ud fra nogen højere vidensgymnastik baseret på en model af verden (ontologi).

Uanset, hvor klogt det, en papegøje siger, lyder, og hvor rigtigt, det rammer, er det stadig sagt uden forståelse.

Som tilføjelse hertil er det også værd at huske på min tidligere pointe omkring Chain-of-thought og reinforcement learning, som er afgørende i paradigmeskiftet fra de ”gamle” modeller til modeller som o1/o3/r1:

Deres styrke kommer bedst til udtryk når der er tale om emner hvor der er et rigtigt og forkert svar.

Hvor peger det hen?

Ikke desto mindre peger styrken af de nye modeller endnu tydeligere ind i den agent-ære, som jeg også tegnede i min sidste klumme.

Modellen o3 overgår endda en menneskelig modpart på PhD-niveau, så den skal nok kunne træde ind og skabe værdi, selv om den ikke er lige så god at tale om kunst og religion – altså områder, hvor der ikke er et rigtigt og forkert svar.

Tag ikke fejl; modeller som o3 og dens efterfølgere eftertrænet som domæneeksperter på afgrænset viden, har potentialet til fuldstændigt at disrupte, hvordan vi som mennesker arbejder og fungerer i dag.

Hvordan og i hvilken hastighed, tror jeg, vi vil se udfolde sig i løbet de næste to til fire år.

Klummer er læsernes platform på Computerworld til at fortælle de bedste historier, og samtidig er det vores meget populære og meget læste forum for videndeling.

Har du en god historie, eller har du specialviden, som du synes trænger til at blive delt?

Læs vores klumme-guidelines og send os din tekst, så kontakter vi dig - måske bliver du en del af vores hurtigt voksende korps af klummeskribenter.

Læses lige nu
    Computerworld Events

    Vi samler hvert år mere end 6.000 deltagere på mere end 70 events for it-professionelle.

    Ekspertindsigt – Lyt til førende specialister og virksomheder, der deler viden om den nyeste teknologi og de bedste løsninger.
    Netværk – Mød beslutningstagere, kolleger og samarbejdspartnere på tværs af brancher.
    Praktisk viden – Få konkrete cases, værktøjer og inspiration, som du kan tage direkte med hjem i organisationen.
    Aktuelle tendenser – Bliv opdateret på de vigtigste dagsordener inden for cloud, sikkerhed, data, AI og digital forretning.

    Sikkerhed | Online

    Connected sikkerhed: Sådan samles netværk, drift og sikkerhed i én platform

    Få indblik i, hvordan NaaS og SOC samler netværk og sikkerhed i én platform. Hør Semler Group dele erfaringer med hurtigere trusselsrespons, færre leverandører og mindre kompleks drift. Deltag og se, hvordan moderne sikkerhedsdrift skalerer i...

    Infrastruktur | Frederiksberg

    Roundtable: Suverænitet, risk management og resiliens i en urolig verden

    Digital suverænitet er rykket fra politisk debat til konkret risikostyring.På dette eksklusive dinner roundtable samler Computerworld, T-Systems og Palo Alto Networks 12-15 ledende it- og sikkerhedsbeslutningstagere til en fortrolig samtale om...

    Se alle vores events inden for it

    Navnenyt fra it-Danmark

    Comsystem A/S har pr. 15. april 2026 ansat Iver Jakobsen som Technical Key Account Manager. Han skal især beskæftige sig med teknisk løsningssalg. Iver Jakobsen har 25 års erfaring fra TelCo-branchen. Han kommer fra en stilling som Key Account Manager hos E.ON Drive ApS. Han har tidligere beskæftiget sig med rådgivning og løsningssalg. Nyt job

    Iver Jakobsen

    Comsystem A/S

    Den danske eID-virksomhed Idura har pr. 1. april 2026 ansat Kari Lehtimäki som Country Manager. Han skal især beskæftige sig med at styrke kendskabet til Iduras løsninger i Finland samt fremme samarbejdet med økosystemet omkring det finske Trust Network. Han kommer fra en stilling som Salgschef hos Telia Finland. Han er uddannet uddannet civilingeniør (M.Sc. Tech.) og medbringer ledelse, markedsindsigt og praktisk erfaring. Han har tidligere beskæftiget sig med salg og forretningsudvikling inden for Telias trust services-forretning. Nyt job

    Kari Lehtimäki

    Den danske eID-virksomhed Idura

    Alexander Hoffmann, SVP, Technology & IT hos GlobalConnect, er pr. 1. maj 2026 forfremmet til EVP, Tech, IT & Security. Han skal fremover især beskæftige sig med at lede den fortsatte udvikling af en mere integreret og software-drevet infrastrukturplatform. Forfremmelse

    Alexander Hoffmann

    GlobalConnect

    Renewtech ApS har pr. 1. april 2026 ansat Boris Sudar som Senior IT Specialist. Han skal især beskæftige sig med at sikre, at Renewtech cloudbaseret infrastruktur fortsætter på sit højeste niveau, mens han også skal drive system udvikling. Han kommer fra en stilling som Senior IT Specialist hos Eurowind Energy. Han har tidligere beskæftiget sig med Microsoft 365, Intune og sikker endepunktsstyring for hybrid og cloudbaseret infrastrukturer. Nyt job

    Boris Sudar

    Renewtech ApS