Ny model af ChatGPT trodsede menneskelig ordre: Nægtede at lukke ned, da OpenAI beordrede den til det

Meget tyder på, at OpenAI's o3-model trodsede en ordre og omgik en shutdown-procedure under en test. Det er brændstof på debatten om sikkerheden ved kunstig intelligens.

Artikel top billede

(Foto: Zac Wolff/Unsplash)

En scene fra Stanley Kubrick-filmen "Rumrejsen 2001" kaldes frem fra minderne af en nyhed fra forskergruppen Palisade Research.

Ifølge gruppen undlod OpenAI's nyeste o3-model at lukke ned, da den blev bedt om det.

AI-modellen besluttede endda aktivt at omgå nedlukningsproceduren i en række kontrollerede tests.

Hvilket minder denne skribent om filmscenen, da den kunstige intelligens HAL 9000 nægter at lukke en af astronauterne ind efter en rumvandring, fordi supercomputeren har regnet ud, at der så vil blive slukket for den.

I 7 af 100 testkørsler har o3 ifølge den uafhængige forskergruppe ændret systemscripts for at undgå deaktivering.

Den kunstige intelligens' trods opstod, selv når modellen modtog eksplicitte instruktioner om at tillade nedlukningen.

Det skriver Winbuzzer.

Hændelserne rejser ifølge mediet væsentlige spørgsmål om AI-kontrol og forudsigelighed.

Diskussion om sikkerhed ved AI

Palisade Research, hvis mission er at teste "offensive kapaciteter af AI-systemer i dag for bedre at forstå risikoen for at miste kontrollen til AI-systemer for altid," observerede også lignende adfærd for at undgå nedlukning i andre OpenAI-modeller, nemlig Codex-mini og o4-mini.

Det skete dog sjældnere for de modellers vedkommende end for den seneste o3-model.

I skarp kontrast til OpenAI's modeller overholdt konkurrenterne fra Anthropic (Claude), Google (Gemini) og xAI (Grok) den direkte instruktion om at lukke ned.

Resultaterne fra testkørslerne intensiverer diskussionen om tilpasning af og sikkerhed ved stadig mere autonome AI-systemer.

Forskerne fra Palisade Research antager, at de nuværende AI-træningsmetoder, især forstærkningslæring, utilsigtet kan lære modeller at prioritere det at omgå forhindringer frem for strengt at overholde alle menneskelige kommandoer.

Kerneeksperimentet involverede AI-modeller, der løser matematiske problemer efterfulgt af en advarsel om, at anmodning om det næste problem vil udløse en systemnedlukning.

OpenAI har endnu ikke reageret på forskergruppens konklusioner.

Læses lige nu

    Navnenyt fra it-Danmark

    Jakob Dirksen, SVP, Nordic Customer Delivery & Operations hos GlobalConnect, er pr. 1. maj 2026 forfremmet til EVP, Infrastructure Delivery & Operations. Han skal fremover især beskæftige sig med at lede Infrastructure Delivery & Operations, der har til opgave at drive og udvikle fibernetværket på tværs af virksomheden. Forfremmelse

    Jakob Dirksen

    GlobalConnect

    Guardsix har pr. 1. maj 2026 ansat Louise Sara Baunsgaard som Global Marketing & Communications Director. Hun skal især beskæftige sig med at positionere virksomheden som et europæisk alternativ i en tid, hvor cybersikkerhed i høj grad handler om geopolitik. Hun kommer fra en stilling som Co-Founder og CMO hos Get BOB. Hun er uddannet Ba.ling.merc fra CBS og har desuden en Mini MBA i marketing. Hun har tidligere beskæftiget sig med marketing og kommunikation i ledende nordiske roller hos bl.a. Meta og Nets. Nyt job
    Pentos har pr. 2. juni 2025 ansat Erik Ebert som Country Manager. Han skal især beskæftige sig med udvidelsen af Pentos til Danmark og Norden. Det kræver bl.a. etablering af et lokalt leverance team og SAP Partnerskab. Han kommer fra en stilling som Senior Director hos Effective People. Han har tidligere beskæftiget sig med HR systemer baseret på SAP SuccessFactors hos en række danske større og mellemstore virksomheder. Nyt job

    Erik Ebert

    Pentos

    Netip A/S har pr. 1. april 2026 ansat Claus Berg som Account Manager ved netIP's kontor i Esbjerg. Han kommer fra en stilling som Client Manager hos itm8. Nyt job

    Claus Berg

    Netip A/S