Afsløring: ChatGPT er kodet til at opfinde svar i stedet for at sige “ved ikke”

Ny rapport afslører, at ChatGPT hellere gætter end indrømmer uvidenhed – fordi den er trænet til det.

Artikel top billede

(Foto: Pexels)

Vi har nok efterhånden alle prøvet det.

At få et helt faktuelt forkert svar fra ChatGPT, som du udmærket ved er forkert, men som chatbotten overbevisende fremlægger som værende korrekt.

Og selvom OpenAI’s verdensomspændende chatbot utvivlsomt er blevet væsentligt forbedret de seneste år, hallucinerer den fortsat. Og det bliver den formentligt ved med.

For ChatGPT er programmeret på en måde, hvor den hellere skal opfinde svar end indrømme, at den tager fejl. Det konkluderer en ny rapport fra OpenAI selv.

Det fremgår af forskningsartiklen “Why Language Models Hallucinate”, der er udgivet i begyndelsen af september af tre forskere fra OpenAI.

Ifølge rapporten er problemet grundlæggende, at sprogmodeller belønnes for at gætte, og ikke for at give korrekte svar eller indrømme uvidenhed.

Det er en konsekvens af, hvordan modellerne bliver trænet og efterfølgende evalueret.

“De fleste gængse evalueringsmetoder belønner hallucinerende adfærd,” skriver forskerne i rapporten ifølge The Register.

Et forkert svar er bedre end 100 procent korrekthed

Som et konkret eksempel bad forskerne en OpenAI-model om at oplyse fødselsdagen på én af forfatterne til rapporten, Adam Tauman Kalai. Den kom med tre forskellige bud, og alle var forkerte.

Problemet er ifølge forskerne, at modellen ikke er trænet til at sige “det ved jeg ikke”. Tværtimod er den trænet til altid at give et svar, uanset hvor usikkert det måtte være.

Det skyldes dybest set, at et forkert svar en gang imellem – ifølge OpenAI – er bedre, end at chatbotten altid skal være 100 procent korrekt.

“Over tusindvis af testspørgsmål klarer den gættende model sig bedre i pointgivning end en forsigtig model, der indrømmer usikkerhed,” skriver OpenAI i et blogindlæg om rapporten.

Umuligt at træne AI på fejlfrit data

Hallucinationerne begynder allerede i prætræningen, hvor modellerne fodres med massive datamængder fra internettet og andre tekstkilder.

Hvis informationen ikke er entydig eller kun optræder én gang, vil modellen ofte forsøge sig med et gæt.

For eksempel skriver forskerne, at hvis 20 procent af alle fødselsdagsoplysninger i træningsdata kun optræder én gang, så vil modellen sandsynligvis også hallucinere på cirka 20 procent af fødselsdagsspørgsmålene.

Senere forværres problemet af den måde, sprogmodeller evalueres på. Mange benchmarks er designet som multiple choice-tests, hvor der kun gives point for rigtige svar, og ikke for at sige “det ved jeg ikke”.

Det presser modellerne til at levere et gæt frem for at melde pas.

OpenAI mener selv, at løsningen er at ændre selve incitamentet: I stedet for at belønne modeller for at give et svar, skal man belønne dem for at udvise passende usikkerhed.

“Enkle ændringer i evalueringsmetoderne kan fjerne barrierer for at undertrykke hallucinationer og åbne døren for mere nuancerede sprogmodeller,” lyder det i konklusionen.

Det ideelle ville ifølge forskerne være at træne modeller på fejlfrie datasæt, men det er i praksis umuligt. I stedet forsøger OpenAI nu at træne kommende versioner af ChatGPT til i højere grad at kunne sige “det ved jeg ikke”.

Ifølge selskabet er denne tilgang allerede implementeret i træningen af den kommende ChatGPT-5-model.

Læses lige nu
    Computerworld Events

    Vi samler hvert år mere end 6.000 deltagere på mere end 70 events for it-professionelle.

    Ekspertindsigt – Lyt til førende specialister og virksomheder, der deler viden om den nyeste teknologi og de bedste løsninger.
    Netværk – Mød beslutningstagere, kolleger og samarbejdspartnere på tværs af brancher.
    Praktisk viden – Få konkrete cases, værktøjer og inspiration, som du kan tage direkte med hjem i organisationen.
    Aktuelle tendenser – Bliv opdateret på de vigtigste dagsordener inden for cloud, sikkerhed, data, AI og digital forretning.

    Sikkerhed | København

    Cyber Security Festival 2025

    Mød Danmarks skrappeste it-sikkerhedseksperter og bliv klar til at planlægge og eksekvere en operationel og effektiv cybersikkerhedsstrategi, når vi åbner dørene for +1.200 it-professionelle. Du kan glæde dig til oplæg fra mere end 50 talere og...

    It-løsninger | Online

    ERP Insights 2025

    Få den nyeste viden om værktøjer, der kan optimere hele din virksomhed med udgangspunkt i AI og fleksibilitet.

    It-løsninger | København Ø

    Automatisering med Copilot & Agentic AI

    Høst viden og erfaringer fra andre om, hvordan Copilot og Agentic AI i praksis kan skabe værdi og fleksibilitet i din organisation.

    Se alle vores events inden for it

    En kaotisk verden kræver stærk cybersikkerhed, resiliens og digital suverænitet

    Mød David Heinemeier, Flemming Splidsboel Hansen, Casper Klynge, Rasmus Knappe, Jens Myrup Pedersen og forfattere som fhv. jægersoldat Thomas Rathsack og adfærdsforsker Henrik Tingleff.

    Computerworld afholder d. 4. og 5. november Cyber Security Festival i København - med fokus på sikkerhed, resiliens og digital suverænitet. Det er helt gratis - men reserver din plads allerede nu.

    Hele programmet er online lige nu - og du kan reservere din gratis plads lige her - jeg håber vi ses! 

    Lars Jacobsen

    Chefredaktør på Computerworld

    Se alle Lars's artikler her

    Navnenyt fra it-Danmark

    IT Confidence A/S har pr. 1. oktober 2025 ansat Henrik Thøgersen som it-konsulent med fokus på salg. Han skal især beskæftige sig med rådgivende salg, account management og udvikling af kundeporteføljer på tværs af it-drift, sikkerhed og cloud-løsninger. Han kommer fra en stilling som freelancer i eget firma og client manager hos IT Relation og IT-Afdelingen A/S. Han er uddannet elektromekaniker. Han har tidligere beskæftiget sig med salg af it-løsninger, account management, it-drift og rådgivning samt undervisning og ledelse. Nyt job

    Henrik Thøgersen

    IT Confidence A/S

    Norriq Danmark A/S har pr. 1. september 2025 ansat Alexander Bendix som Consultant. Han skal især beskæftige sig med tilføre nye, friske perspektiver og værdifuld viden til NORRIQS Data & AI-afdeling. Nyt job

    Alexander Bendix

    Norriq Danmark A/S

    Norriq Danmark A/S har pr. 1. september 2025 ansat Ahmed Yasin Mohammed Hassan som Data & AI Consultant. Han kommer fra en stilling som selvstændig gennem de seneste 3 år. Han er uddannet cand. merc. i Business Intelligence fra Aarhus Universitet. Nyt job

    Ahmed Yasin Mohammed Hassan

    Norriq Danmark A/S