Her må selv de førende AI-tjenester give op: OpenAI’s hundedyre Pro-model klarer sig dårligst

Klodens førende AI-modeller dumper alle med et brag, når de sættes til at løse avancerede matematiske opgaver.

01. april 2025 kl. 16.52

Artikel top billede

(Foto: Zac Wolff/Unsplash)

Niels de Boissezon Teknologiredaktør

Selvom generativ AI-tjenester såsom OpenAI’s ChatGPT og Googles Gemini bliver stadigt bedre til at klare opgaver, er der stadigt områder, som kan give de alvidende modeller store udfordringer.

Det viser et nyt forskningsstudie fra amerikanske Cornell University, hvor klodens nyeste og mest avancerede modeller sættes til at løse opgaverne i den seneste runde af USA’s matematik olympiader, USAMO 2025.

Her viser alle modellerne at have det ualmindeligt svært ved at løse opgaverne, som kendetegnes ved at kræve logisk konsistens, kreativ tænkning og selvindsigt.

Igen af modellerne formår at levere bare fem procent rigtige svar, med DeepSeek R1 som topscoreren med 2,0 points ud af 42 mulige.

Dyrest er dårligst

Hvor avanceret og regnetung en given model er, synes ikke at forudsige hvor godt en model klarer sig i matematik-prøverne.

Undersøgelsens sværvægter Open AI’s o1-Pro model, scorer her alene 1,2 points points til trods for, at den forbruger for 203 dollar af AI-tokens.

Det er samme resultat som den kinesiske QwQ-model signeret af Alibaba, som kræver for 0,42 dollar regnekraft for at opnå en tilsvarende score.

Fælles for modellerne er, at deres evne til at vurdere egen performance og validere egne resultater er overdreven.

Den fulde undersøgelse kan granskes her.

De matematiske udfordringer og svar på disse kan findes her.

Artikel teaser billede

Pc-priserne stiger for alvor: Her er de gode køb til 5.000 kroner

Seneste nyt

|Vis seneste uge

Læses lige nu

Ny digital kæmpeorganisation får 1.600 medarbejdere: Her er holdet, der skal stå i spidsen

Artikel teaser billede

Job-og-karriere

Så fede er pensionsordningerne i landets største it-virksomheder

Artikel teaser billede

Danske software-selskaber står til at blive reddet i sidste øjeblik: Kan slippe for stort skattesmæk

Artikel teaser billede

Metoderne bag Novo-hack har været helt elementære: "Noget, jeg lærer mine studerende," siger lektor

Artikel teaser billede

Kunstig intelligens

Gartner: Pas nu på med at droppe mainframe på grund af AI - det kan gå helt galt

Annonce

Cyber Security Festival 2026

Event: Cyber Security Festival 2026

Sikkerhed | København

Mød Danmarks skrappeste it-sikkerhedseksperter og bliv klar til at planlægge og eksekvere en operationel og effektiv cybersikkerhedsstrategi, når vi åbner dørene for +1.700 it-professionelle. Du kan glæde dig til oplæg fra mere end 70 talere og møde mere end 50 leverandører over to dage.

18 & 19 november 2026 | Gratis deltagelse

Artikel teaser billede

Digital suverænitet

Frankrig investerer 97 milliarder kroner i digital suverænitet: Sådan skal pengene bruges

Artikel teaser billede

Her er 12 ledige it-stillinger, som du kan søge, før du går på sommerferie

Forsvarsministeriets Materiel- og Indkøbsstyrelse

Specialister inden for Datacenter, Core Services og Netværkssikkerhed – Network Operations & Management, Digital Backbone

Nordjylland

Forsvarsministeriets Materiel- og Indkøbsstyrelse

MLOps Engineer til opbygning af Forsvarets nye AI-platform

Nordjylland

Forsvarsministeriets Materiel- og Indkøbsstyrelse

Cyberdivisionen søger sin næste specialist i Exchange, mailflow og brugersupport

Københavnsområdet

Forsvaret

Senior AI Research & Innovation Lead til Forsvarets AI Center

Københavnsområdet

Se flere it-stillinger

Artikel teaser billede

Ingen ved, hvornår 2G lukker – og det er et problem: Derfor bør myndighederne gribe ind

Artikel teaser billede

FE opbevarer data om danskere i strid med loven: “Yderst vanskeligt” at overholde

Artikel teaser billede

Her er de: Alle jordklodens rigeste personer er it-iværksættere - otte mænd er tilsammen gode for 19.000 milliarder kroner

Navnenyt fra it-Danmark

Immeo har pr. 1. maj 2026 ansat Sofie Amalie Buur som Consultant. Hun kommer fra en stilling som Frontend Engineer & UI/UX Designer hos Valyrion. Hun er uddannet Cand.it. Softwaredesign ved ITU.

Nyt job

Sofie Amalie Buur

Immeo

Steen Marquard, Jabra, er pr. 15. juni 2026 udnævnt som Regional President for Norden og UK. Han er uddannet HD(O). Han beskæftiger sig med I sin nye rolle får Steen ansvar for at videreudvikle salget af virksomhedens professionelle lyd- og videoløsninger, samt styrke samarbejdet med channel teams og partnere på tværs af regionen.

Udnævnelse

Jabra

Netip A/S har pr. 1. juni 2026 ansat Kristina Svingel Jeppesen som bogholder ved netIP's kontor i Thisted. Hun kommer fra en stilling som Kontorassistent hos DFI Geisler.

Nyt job

Kristina Svingel Jeppesen

Netip A/S

Sharp Consumer Electronics har pr. 1. april 2026 ansat Daniel Eriksson som salgsdirektør for de nordiske lande. Han skal især beskæftige sig med at accelerere virksomhedens vækst i Norden. Han kommer fra en stilling som nordisk salgsdirektør hos Hisense. Han har tidligere beskæftiget sig med detailhandel, kommerciel strategi og markedsudvidelser med bemærkelsesværdige resultater til følge.

Nyt job

Daniel Eriksson

Sharp Consumer Electronics

Se mere fra navnenyt

Artikel teaser billede

Blodbad blandt danske VMware-partnere: Sådan har Broadcoms opkøb påvirket det danske marked

Artikel teaser billede

AI-bosserne er vor tids svar på Oraklet i Delfi

Artikel teaser billede

Kunstig intelligens

Trump trækker truslen mod Anthropic tilbage: Topchefen er både "rar" og "klog"

Artikel teaser billede

Kunstig intelligens

Forsvaret vil klippe navlestrengen til de udenlandske leverandører: Bygger sit eget AI-center

Artikel teaser billede

Morgen-briefing

Morgen-briefing: Ukontrolleret token-forbrug sendte regning på 500 millioner dollar / Estland giver kunstig intelligens et personnummer / Næsten 4.000 robottaxaer kaldt tilbage / Tænketank maler Europas AI-kollaps op

Artikel teaser billede

Ugen i tech: Microsoft slipper ny Surface-kollektion løs / Honda gør elbilen ekstra lille - og ekstra sjov

Computerworld

Opinion

Artikel teaser billede

Nørgaard: Den dødelige disciplin governance slår sjæle ihjel - især ildsjæle

Artikel teaser billede

AI-kapløbet er på afveje: Derfor får virksomheder for lidt ud af deres AI-agenter

Tech er magt - og magten er ikke vores

Hackere er ligeglade med jeres compliance – og det bør bekymre ledelsen

AI-agenterne virker fint: Det er jeres organisation, den er gal med

Artikel teaser billede

Nørgaard: Ti nu stille med al det pjank og sniksnak. Vi gider ikke høre på det

Artikel teaser billede

Danske virksomheders AI-ambitioner kan strande på noget helt basalt

Artikel teaser billede

Din dyreste medarbejder i 2027 er en AI-agent, som du har glemt at slukke

Artikel teaser billede

Vi tester Lenovos uber-laptop: Et carbon-drøn af en maskine til priser op til 55.000 kroner

Annonce

Stor kortlægning: Her er de 100 mest magtfulde it-personer i Danmark - se hele listen her

Mest læste

1 Så fede er pensionsordningerne i landets største it-virksomheder

2 Ny digital kæmpeorganisation får 1.600 medarbejdere: Her er holdet, der skal stå i spidsen

3 Ugen i tech: Microsoft slipper ny Surface-kollektion løs / Honda gør elbilen ekstra lille - og ekstra sjov

4 Morgen-briefing: Ukontrolleret token-forbrug sendte regning på 500 millioner dollar / Estland giver kunstig intelligens et personnummer / Næsten 4.000 robottaxaer kaldt tilbage / Tænketank maler Europas AI-kollaps op

5 Metoderne bag Novo-hack har været helt elementære: "Noget, jeg lærer mine studerende," siger lektor

6 Trump trækker truslen mod Anthropic tilbage: Topchefen er både "rar" og "klog"

7 Vi tester Lenovos uber-laptop: Et carbon-drøn af en maskine til priser op til 55.000 kroner

8 Disse 58 danske virksomheder står på hackernes liste over ofre for alvorlig Fortinet-sårbarhed: Se listen her