Ny model af ChatGPT trodsede menneskelig ordre: Nægtede at lukke ned, da OpenAI beordrede den til det

Meget tyder på, at OpenAI's o3-model trodsede en ordre og omgik en shutdown-procedure under en test. Det er brændstof på debatten om sikkerheden ved kunstig intelligens.

Artikel top billede

(Foto: Zac Wolff/Unsplash)

En scene fra Stanley Kubrick-filmen "Rumrejsen 2001" kaldes frem fra minderne af en nyhed fra forskergruppen Palisade Research.

Ifølge gruppen undlod OpenAI's nyeste o3-model at lukke ned, da den blev bedt om det.

AI-modellen besluttede endda aktivt at omgå nedlukningsproceduren i en række kontrollerede tests.

Hvilket minder denne skribent om filmscenen, da den kunstige intelligens HAL 9000 nægter at lukke en af astronauterne ind efter en rumvandring, fordi supercomputeren har regnet ud, at der så vil blive slukket for den.

I 7 af 100 testkørsler har o3 ifølge den uafhængige forskergruppe ændret systemscripts for at undgå deaktivering.

Den kunstige intelligens' trods opstod, selv når modellen modtog eksplicitte instruktioner om at tillade nedlukningen.

Det skriver Winbuzzer.

Hændelserne rejser ifølge mediet væsentlige spørgsmål om AI-kontrol og forudsigelighed.

Diskussion om sikkerhed ved AI

Palisade Research, hvis mission er at teste "offensive kapaciteter af AI-systemer i dag for bedre at forstå risikoen for at miste kontrollen til AI-systemer for altid," observerede også lignende adfærd for at undgå nedlukning i andre OpenAI-modeller, nemlig Codex-mini og o4-mini.

Det skete dog sjældnere for de modellers vedkommende end for den seneste o3-model.

I skarp kontrast til OpenAI's modeller overholdt konkurrenterne fra Anthropic (Claude), Google (Gemini) og xAI (Grok) den direkte instruktion om at lukke ned.

Resultaterne fra testkørslerne intensiverer diskussionen om tilpasning af og sikkerhed ved stadig mere autonome AI-systemer.

Forskerne fra Palisade Research antager, at de nuværende AI-træningsmetoder, især forstærkningslæring, utilsigtet kan lære modeller at prioritere det at omgå forhindringer frem for strengt at overholde alle menneskelige kommandoer.

Kerneeksperimentet involverede AI-modeller, der løser matematiske problemer efterfulgt af en advarsel om, at anmodning om det næste problem vil udløse en systemnedlukning.

OpenAI har endnu ikke reageret på forskergruppens konklusioner.

Annonceindlæg fra Conscia

Få en hurtigere, billigere og mere sikker AI-rejse

Slip for uforudsigelige omkostninger i skyen og opnå fuld datakontrol med en AI-pod, der samler al nødvendig infrastruktur i dit eget datacenter.

Navnenyt fra it-Danmark

Netip A/S har pr. 15. september 2025 ansat Jimmi Overgaard som Key Account Manager ved netIP's kontor i Viborg. Han kommer fra en stilling som Sales Executive hos Globalconnect A/S. Nyt job

Jimmi Overgaard

Netip A/S

Danske Spil har pr. 1. oktober 2025 ansat Jesper Krogh Heitmann som Brand Manager for Oddset. Han skal især beskæftige sig med at udvikle og drive brandets strategi og sikre en rød tråd på tværs af alle platforme og aktiviteter. Han kommer fra en stilling som Marketing & Communications Manager hos Intellishore. Nyt job

Jesper Krogh Heitmann

Danske Spil

Norriq Danmark A/S har pr. 1. oktober 2025 ansat Huy Duc Nguyen som Developer ERP. Han skal især beskæftige sig med at bidrage til at udvikle, bygge og skræddersy IT-løsninger, der skaber vækst og succes i vores kunders forretninger. Han kommer fra en stilling som Software Developer hos Navtilus. Han er uddannet i bioteknologi på Aalborg University. Nyt job

Huy Duc Nguyen

Norriq Danmark A/S