AI-Lab #16: Det her er ikke bare en lille opgradering, det er markante forbedringer hver gang en ny model frigives

AI som værktøj i hverdagen – fra model-acceleration til transskription og små tricks, der faktisk flytter noget

Artikel top billede

(Foto: Zac Wolff/Unsplash)

Velkommen til det 16. AI-lab. Jeg vil fokusere på et “stort” (bredt) emne (hvor hurtigt modellerne udvikles og udvikler sig), et konkret/smalt emne (transskription) og et par tips & tricks, inkl. hvordan man holder MUS med Gud.

Nogle nylige undersøgelser viser, at det er som personligt redskab (“tool”), at AI’erne giver størst værdi for folk, ikke i form af store projekter og masser af færdige løsninger. Det er også det, som jeg ser overalt: Folk har taget det til sig som et nyttigt værktøj til deres mange forskellige opgaver i løbet af dagen.

Det vil sikkert ændre sig i det næste års tid eller to, men ligefrem masse-automatisering af mange jobs kommer vi ikke til at se foreløbigt trods alle panik-meldingerne.

Tværtimod viser det sig allerede nu, at AI skaber flere jobs end det fjerner - ligesom alle andre store teknologi-fremskridt.

De hurtige modeller

For fire måneder siden frigav OpenAI ChatGPT5, for en måned siden 5.1, og forleden 5.2, der slog Googles Gemini 3 i diverse vigtige benchmarks. Gemini 3 blev frigivet 18. november, og i dag skriver vi den 17. december.

Det her er ikke bare en lille opgradering, som vi er vant til fra software. Der er tale om markante forbedringer hver gang en ny model frigives, og de taler deres tydelige sprog om et kapløb, som jeg i hvert fald aldrig har set magen til.

Et kort øjeblik var Google Gemini 3 førende i diverse benchmarks, men så erklærede Sam Altman fra OpenAI en panik-panik (de kalder det Code Red), og vupti kom 5.2 efter få uger og slog Gemini 3.

Ubemærket frigav Anthropic i samme periode Opus 4.5-modellen (som jeg omtalte i sidste AI-lab).

Copilot, der jo er ChatGPT, var faktisk hurtige ved havelågen denne gang og frigav en 5.2-version samtidig med, at OpenAI gjorde det. Men de gled alligevel ned på 3.-pladsen hvad angår brugere, fordi Gemini 3 virkelig vakte opsigt.

Her er en opsummering jeg faldt over forleden, og som siger en del om situationen:

“GPT 5.2 reinforces my argument that we’re going to see plenty of model variety. Claude Opus 4.5 remains a better coding model. GPT 5.2 is especially powerful when you run it in Pro Mode, but this can take 15-20 minutes. So Gemini 3 Pro still has an important role, especially for tasks that don’t need that depth. I’ve not yet had a chance to pit Gemini 3 Pro in thinking mode against GPT 5.2 Pro.”

Stay tuned, som man siger. Det syder og bobler. Grok har vi ikke hørt fra i flere uger, så der må snart komme noget fra den kant, og der dukker også et hav af specialiserede AI’er op, der kan lave musik, videoer, websites og alt muligt andet.

Transskription: ChatGPT vs. Gemini vs. Claude

Bemærk: Jeg har IKKE testet dette med ChatGPT 5.2 endnu.

Der tales hele tiden om, hvor “multi-modale” de forskellige modeller er - dvs. deres evner til at håndtere billeder, videoer, grafik, lyd med mere.

Man kan f.eks. godt vedhæfte en video til ChatGPT og få den til at opsummere indholdet, foreslå reklametekster for den, osv. Og sådan har de forskellige modeller hver deres styrke.

Forleden besluttede jeg mig for at teste de tre modellers evne til at transskribere en lydfil.

Det er noget, jeg normalt bruger den fremragende Goodtape til. Den er dansk og baseret på et stykke software kaldet Whisper, som OpenAI lavede og frigav som open source flere måneder før de frigav ChatGPT i november 2022. Den er “the gold standard” indenfor transskription.

Men hvis LLM’erne også kan det, vil det jo være nemmere, fordi man så kan springe nogle trin over.

Jeg indspillede først en lydfil (nogle få minutter) med Memoer-app’en på min iPhone og mailede den til min PC.

Jeg startede med at teste ChatGPT5.1 sat til default, så den næsten med sikkerhed ville vælge smart-i-en-fart-modellen. Den leverede en gang ævlebævle og forsøgte at bilde mig ind, at jeg skulle uploade filen igen, etc. Da jeg gentog spørgsmålet, men med modellen sat til Thinking, fortalte den, at den ikke har værktøjerne til det.

Dét er lidt sjovt, da det som sagt er OpenAI, der har lavet Whisper.

Så var det tid til at teste Gemini 3 (Thinking/Pro). Den gjorde det bare, og faktisk bedre end Goodtape. Jeg blev ærligt talt lidt overrasket. Men det skal man jo ikke blive i det her AI-ræs.

Claude (Opus 4.5-modellen) gik straks i gang med at skrive kode, som den i øvrigt er berømt for at være rigtig god til.

Den skrev under sine overvejelser på et tidspunkt “Installing OpenAI Whisper for audio transcription”, og det er da godt tænkt 🙂.

Så gik den i gang med rigtige kode-nørd-ting a la “pip install faster-whisper” og “bash python3 << ‘EOF’” og lignende.

Men det mislykkedes med Whisper, og den prøvede derefter en del andre ting, for til sidst at skrive dette:

“Desværre støder jeg på en begrænsning her, Mogens. Miljøet jeg arbejder i har netværksrestriktioner, der blokerer adgang til de tjenester, der er nødvendige for tale-til-tekst transskription…”

Alt i alt var Google Gemini 3 en klar test-vinder: Ikke alene var det den eneste model, der kunne - dens transskription var tillige af høj kvalitet.

Tip: Nyttige forkortelser, når du prompter

Jeg har før nævnt, at man kan bruge visse forkortelser, når man prompter. Et eksempel kunne være: “ELI5 kvantefysik”, som vil få AI’en til at forklare kvantefysik, så en 5-årig kan forstå det. Eller “TL;DR” (eller bare TLDR), som vil lave et resume af den følgende tekst. Men der er mange andre, som den følgende (engelske) liste viser. Den virker også fint til dansk tekst.

ELI5 is used to explain as if to a 5-year-old.

TLDR summarizes a very long text in a few lines.

STEP-BY-STEP lays out reasoning step by step.

ECKLIST turns a response into a checklist.

EXEC SUMMARY gives a quick executive-style summary.

ACT AS makes ChatGPT speak in a specific role.

BRIEFLY forces a very short answer.

JARGON asks to use technical vocabulary.

AUDIENCE adapts the response to a chosen audience.

TONE changes the tone (formal, funny, dramatic, etc.).

DEV MODE simulates a raw, technical developer style.

PM MODE gives a project-management perspective.

SWOT produces a strengths/weaknesses/opportunities/threats analysis.

FORMAT AS enforces a specific format (table, JSON, etc.).

COMPARE puts two or more things side by side.

MULTI-PERSPECTIVE shows several points of view.

CONTEXT STACK keeps multiple layers of context in memory.

BEGIN WITH / END WITH forces starting or ending with something.

ROLE: TASK: FORMAT: explicitly defines the role, the task, and the expected format.

SCHEMA generates a structured outline or a data model.

REWRITE AS: rephrases in a requested style.

REFLECTIVE MODE prompts the AI to reflect on its own answer.

SYSTEMATIC BIAS CHECK asks to identify biases.

DELIBERATE THINKING forces slower, more thoughtful reasoning.

NO AUTOPILOT forbids superficial, autopilot responses.

EVAL-SELF asks for a critical self-evaluation of the response.

PARALLEL LENSES examines from several angles in parallel.

FIRST PRINCIPLES rebuilds from fundamental basics.

CHAIN OF THOUGHT shows intermediate reasoning.

PITFALLS identifies possible traps and errors.

METRICS MODE expresses answers with measures and indicators.

GUARDRAIL sets strict boundaries not to cross.

Ugens sjove idé: MUS med Gud!

Min herlige og kreative ven Brian, der er selvstændig erhvervsdrivende, og derfor ikke rigtigt har nogen at holde MedarbejderUdviklingsSamtale (MUS) med, tog sagen i egen hånd forleden, og skrev til ChatGPT:

“Lad os forestille os, at jeg skal til “performance review” hos Gud. Hvordan er min rating og hvordan bliver jeg vurderet?”

Det førte ifølge Brian til en længere, god udveksling, fordi han “talte” videre med den efter dens første, korte svar.

Jeg prøvede det med ChatGPT, Gemini og Claude, og fik nogle sjove svar. Tak til Brian for at dele den kreative idé.

Det var dét: Skriv gerne til mig på mogensxy@gmail.com og fortæl, hvordan jeres MUS med Gud gik 🙂.

Computerworld Events

Vi samler hvert år mere end 6.000 deltagere på mere end 70 events for it-professionelle.

Ekspertindsigt – Lyt til førende specialister og virksomheder, der deler viden om den nyeste teknologi og de bedste løsninger.
Netværk – Mød beslutningstagere, kolleger og samarbejdspartnere på tværs af brancher.
Praktisk viden – Få konkrete cases, værktøjer og inspiration, som du kan tage direkte med hjem i organisationen.
Aktuelle tendenser – Bliv opdateret på de vigtigste dagsordener inden for cloud, sikkerhed, data, AI og digital forretning.

Infrastruktur | Frederiksberg

Roundtable: Suverænitet, risk management og resiliens i en urolig verden

Digital suverænitet er rykket fra politisk debat til konkret risikostyring.På dette eksklusive dinner roundtable samler Computerworld, T-Systems og Palo Alto Networks 12-15 ledende it- og sikkerhedsbeslutningstagere til en fortrolig samtale om...

Sikkerhed | Online

Cyber Briefing: Fra identity-angreb til sikker genopretning

Identity-angreb rammer virksomhedens kontrolplan først. Få konkrete råd til at beskytte og gendanne AD og Entra ID, validere recovery og styrke cyberresiliensen. Deltag og lær hvordan du kan sikre hurtigere vej tilbage efter et angreb.

Sikkerhed | Højbjerg, Aarhus

Cyber Security Summit 2026 - Aarhus

Lær om organisationers evne til at modstå, håndtere og komme videre efter alvorlige digitale hændelser, herunder ledelsesansvar, forretningskritiske afhængigheder og de valg, der afgør, om plan B holder, når systemer eller leverandører svigter.

Se alle vores events inden for it

Navnenyt fra it-Danmark

Guardsix har pr. 1. maj 2026 ansat Louise Sara Baunsgaard som Global Marketing & Communications Director. Hun skal især beskæftige sig med at positionere virksomheden som et europæisk alternativ i en tid, hvor cybersikkerhed i høj grad handler om geopolitik. Hun kommer fra en stilling som Co-Founder og CMO hos Get BOB. Hun er uddannet Ba.ling.merc fra CBS og har desuden en Mini MBA i marketing. Hun har tidligere beskæftiget sig med marketing og kommunikation i ledende nordiske roller hos bl.a. Meta og Nets. Nyt job
Renewtech ApS har pr. 1. april 2026 ansat Boris Sudar som Senior IT Specialist. Han skal især beskæftige sig med at sikre, at Renewtech cloudbaseret infrastruktur fortsætter på sit højeste niveau, mens han også skal drive system udvikling. Han kommer fra en stilling som Senior IT Specialist hos Eurowind Energy. Han har tidligere beskæftiget sig med Microsoft 365, Intune og sikker endepunktsstyring for hybrid og cloudbaseret infrastrukturer. Nyt job

Boris Sudar

Renewtech ApS

Trafikstyrelsen har pr. 1. maj 2026 ansat Nihad Hodzic som IT og Digitaliseringschef. Han skal især beskæftige sig med med IT-projekter og digital transformation, herunder især det strategiske løft af Trafikstyrelsens digitale niveau. Han kommer fra en stilling som Kontorchef hos Udviklings og Forenklingsstyrelsen. Han er uddannet i statskundskab og har en lederuddannelse fra MIT Sloan, samt en igangværende Master i IT-Ledelse. Han har tidligere beskæftiget sig med IT-udvikling og større projekter på momsområdet, hvor han har ledet et projekt- og udviklingskontor. Nyt job

Nihad Hodzic

Trafikstyrelsen

Renewtech ApS har pr. 15. marts 2026 ansat Per Forberg som Account Manager for Sustainable Relations. Han skal især beskæftige sig med etablere nye partnerskaber med henblik på ITAD og sourcing kontrakter med hostingvirksomheder og strategiske slutbrugere. Han kommer fra en stilling som Nordic Key Account Manager hos Tesa. Han er uddannet hos Lund University og har en MBA i Management. Han har tidligere beskæftiget sig med at styrke salgsaktiviteter og partnerskaber på tværs af nordiske markeder. Nyt job

Per Forberg

Renewtech ApS