Ny model af ChatGPT trodsede menneskelig ordre: Nægtede at lukke ned, da OpenAI beordrede den til det

Meget tyder på, at OpenAI's o3-model trodsede en ordre og omgik en shutdown-procedure under en test. Det er brændstof på debatten om sikkerheden ved kunstig intelligens.

27. maj 2025 kl. 16.30

Artikel top billede

(Foto: Zac Wolff/Unsplash)

Anders Bruun Strategi- og ledelsesredaktør

En scene fra Stanley Kubrick-filmen "Rumrejsen 2001" kaldes frem fra minderne af en nyhed fra forskergruppen Palisade Research.

Ifølge gruppen undlod OpenAI's nyeste o3-model at lukke ned, da den blev bedt om det.

AI-modellen besluttede endda aktivt at omgå nedlukningsproceduren i en række kontrollerede tests.

Hvilket minder denne skribent om filmscenen, da den kunstige intelligens HAL 9000 nægter at lukke en af astronauterne ind efter en rumvandring, fordi supercomputeren har regnet ud, at der så vil blive slukket for den.

I 7 af 100 testkørsler har o3 ifølge den uafhængige forskergruppe ændret systemscripts for at undgå deaktivering.

Den kunstige intelligens' trods opstod, selv når modellen modtog eksplicitte instruktioner om at tillade nedlukningen.

Det skriver Winbuzzer.

Hændelserne rejser ifølge mediet væsentlige spørgsmål om AI-kontrol og forudsigelighed.

Diskussion om sikkerhed ved AI

Palisade Research, hvis mission er at teste "offensive kapaciteter af AI-systemer i dag for bedre at forstå risikoen for at miste kontrollen til AI-systemer for altid," observerede også lignende adfærd for at undgå nedlukning i andre OpenAI-modeller, nemlig Codex-mini og o4-mini.

Det skete dog sjældnere for de modellers vedkommende end for den seneste o3-model.

I skarp kontrast til OpenAI's modeller overholdt konkurrenterne fra Anthropic (Claude), Google (Gemini) og xAI (Grok) den direkte instruktion om at lukke ned.

Resultaterne fra testkørslerne intensiverer diskussionen om tilpasning af og sikkerhed ved stadig mere autonome AI-systemer.

Forskerne fra Palisade Research antager, at de nuværende AI-træningsmetoder, især forstærkningslæring, utilsigtet kan lære modeller at prioritere det at omgå forhindringer frem for strengt at overholde alle menneskelige kommandoer.

Kerneeksperimentet involverede AI-modeller, der løser matematiske problemer efterfulgt af en advarsel om, at anmodning om det næste problem vil udløse en systemnedlukning.

OpenAI har endnu ikke reageret på forskergruppens konklusioner.

Artikel teaser billede

Efter 15 år opdaterer Microsoft vigtig sikkerhedsfunktion på millioner af Windows-computere: Det kommer det til at betyde

Seneste nyt

|Vis seneste uge

Dette business-headset rammer den hårfine balance mellem komfort, lyd og pris

Artikel teaser billede

Forretningssoftware

Software æder verden, sagde man - men pludselig taber investorerne gigantiske summer på deres investeringer

Artikel teaser billede

Cisco hæver priserne efter rekordregnskab: Danske kunder får dyrere netværksgear

Artikel teaser billede

Kender du 996-modellen? Nej, det er ikke en Porsche men en ekstrem arbejdskultur, der spreder sig i AI-selskaber

Læses lige nu

Artikel teaser billede

David Helgason siger efter 24 år farvel til den danske it-succes Unity: "For mig er det afslutningen på en æra"

Annonce

Tillid i en Zero-Trust verden

Annonceindlæg fra Trustworks

Tillid i en Zero-Trust verden

Med voksende trusler, nye EU-krav og øget kompleksitet er cybersikkerhed nu en central ledelsesopgave på linje med strategi og økonomi.

Artikel teaser billede

Desktop-software

Omdiskuteret filformat får kraftig kritik: 'Microsoft bør grundlæggende redesigne sin kontorprogrammer'

Artikel teaser billede

30 energifaciliteter ramt: Russisk angreb på stort europæisk land er en generalprøve, advarer Google

KMD A/S

Development and Delivery Director

Fyn

Forsvarsministeriets Materiel- og Indkøbsstyrelse

Datafagtekniker til Electronic Warfare sektion i Forsvarsministeriets Materiel- og Indkøbsstyrelse

Københavnsområdet

KMD A/S

Senior Service Delivery Manager (SDM)

Københavnsområdet

Capgemini Danmark A/S

IGNITE Graduate Program 2026

Midtjylland

Se flere it-stillinger

Artikel teaser billede

Fortællingen om et næsten mytisk sted i det store Star Trek-univers

Artikel teaser billede

Sådan ombygger og strømliner Elon Musk xAI med lynets hast- gør klar til verdens måske største børsnotering

Artikel teaser billede

Europæiske datatilsyn har 'betydelige bekymringer' om ny GDPR-lov - bør ikke vedtages

Navnenyt fra it-Danmark

Adeno K/S har pr. 2. februar 2026 ansat Kia Harding Martinussen som ServiceNow Expert. Hun kommer fra en stilling som Principal Consultant hos Devoteam A/S.

Nyt job

Kia Harding Martinussen

Adeno K/S

Christian Pedersen, emagine Consulting A/S, er pr. 1. februar 2026 udnævnt som Chief AI Officer. Han beskæftiger sig med opkvalificere emagines ansatte, udvikle interne AI-værktøjer og levere AI-projekter for kunderne. Som leder af et nye AI-team skal han også udvikle og lancere AI-produkter til markedet.

Udnævnelse

Christian Pedersen

emagine Consulting A/S

Adeno K/S har pr. 2. februar 2026 ansat Casper Barner Kristensen som ServiceNow Expert. Han kommer fra en stilling som Senior Automation Architect.

Nyt job

Casper Barner Kristensen

Adeno K/S

Idura har pr. 5. januar 2026 ansat Arjuna Enait, 34 år, som software engineer. Han skal især beskæftige sig med videreudvikling af Verify-systemet samt arbejde på implementeringen af CIBA i Norsk BankID. Han kommer fra en stilling som software engineer hos Lasso X. Han er uddannet civilingeniør med speciale i geoteknik. Han har tidligere beskæftiget sig med at bygge microservices til dataindsamling og -processering, samt opdatere legacy-systemer.

Nyt job

Idura

Se mere fra navnenyt

Artikel teaser billede

Næststørste opkøb af israelsk it-firma nogensinde - opkøbt for 160 milliarder kroner: Har udviklet særlig AI-løsning

Artikel teaser billede

Morgen-briefing

Morgen-briefing: USA mener at Apple fremmer venstreorienterede holdninger / Rusland strammer grebet om Telegram - vil have russerne over på Max / Discord indfører aldersverifikation - indfører 'teen-per-default"

Artikel teaser billede

Københavnsk softwareselskab Auditdata solgt for trecifret millionbeløb

Artikel teaser billede

Denne HP bærbar er lidt af en mester til det hele

Artikel teaser billede

17.000 Volvo-ansatte har fået lækket persondata i cyberangreb

Artikel teaser billede

Sikkerhedshuller

58 sårbarheder hos Microsoft – seks misbruges allerede af hackere: Nu haster det med at patche

Computerworld

Opinion

Artikel teaser billede

Derfor bør CIO’en læse Gartner-kvadranten med AI-briller

Artikel teaser billede

NIS2 ændrer ikke bare sikkerheden: Det ændrer selve måden, vi leder it på

Jan Damsgaard har en pointe – men han overser, hvorfor Danmark Skifter faktisk virker

Nørgaard: Ansæt nu bare de unge - så kan det ikke gå helt galt

Danmark skifter, men suverænitet måles i kontrol og ikke i antallet af alternative browsere

Artikel teaser billede

Alder som filter i it-rekruttering er både dyrt og kortsigtet

Artikel teaser billede

De fleste SMV’er investerer i sikkerhed men mangler overblik: Sådan kommer du i gang

Artikel teaser billede

Nørgaard: Derfor nærmer enden sig for Trump

Artikel teaser billede

AI-lab #22: Hvorfor lever vi med totalt kaos og anarki omkring regneark, men vil styre og overstyre alt vedrørende AI?

Annonce

Mest læste 2025

Stor kortlægning: Her er de 100 mest magtfulde it-personer i Danmark - se hele listen her

Mest læste

1 Danmarks største fiber-selskab efter hård priskritik fra Fastspeed: Derfor hæver vi priserne

2 Fastspeed dropper al nysalg til Danmarks største fibernet i protest: Store prisstigninger på vej

3 NemKonto ramt af totalnedbrud i 12 timer: Alt gået i sort - nu er løsningen på benene igen

4 Efter 15 år opdaterer Microsoft vigtig sikkerhedsfunktion på millioner af Windows-computere: Det kommer det til at betyde

5 Omdiskuteret filformat får kraftig kritik: 'Microsoft bør grundlæggende redesigne sin kontorprogrammer'

6 30 energifaciliteter ramt: Russisk angreb på stort europæisk land er en generalprøve, advarer Google

7 Fejlslagen opdatering satte Energinets it-sikkerhed ud af drift i to døgn: Manglede harddiske med ekstra plads

8 Europas nye AI-håb skovler penge ind og vil nu bygge AI-datacentre i Sverige