AI-Lab #16: Det her er ikke bare en lille opgradering, det er markante forbedringer hver gang en ny model frigives

AI som værktøj i hverdagen – fra model-acceleration til transskription og små tricks, der faktisk flytter noget

Artikel top billede

(Foto: Zac Wolff/Unsplash)

Velkommen til det 16. AI-lab. Jeg vil fokusere på et “stort” (bredt) emne (hvor hurtigt modellerne udvikles og udvikler sig), et konkret/smalt emne (transskription) og et par tips & tricks, inkl. hvordan man holder MUS med Gud.

Nogle nylige undersøgelser viser, at det er som personligt redskab (“tool”), at AI’erne giver størst værdi for folk, ikke i form af store projekter og masser af færdige løsninger. Det er også det, som jeg ser overalt: Folk har taget det til sig som et nyttigt værktøj til deres mange forskellige opgaver i løbet af dagen.

Det vil sikkert ændre sig i det næste års tid eller to, men ligefrem masse-automatisering af mange jobs kommer vi ikke til at se foreløbigt trods alle panik-meldingerne.

Tværtimod viser det sig allerede nu, at AI skaber flere jobs end det fjerner - ligesom alle andre store teknologi-fremskridt.

De hurtige modeller

For fire måneder siden frigav OpenAI ChatGPT5, for en måned siden 5.1, og forleden 5.2, der slog Googles Gemini 3 i diverse vigtige benchmarks. Gemini 3 blev frigivet 18. november, og i dag skriver vi den 17. december.

Det her er ikke bare en lille opgradering, som vi er vant til fra software. Der er tale om markante forbedringer hver gang en ny model frigives, og de taler deres tydelige sprog om et kapløb, som jeg i hvert fald aldrig har set magen til.

Et kort øjeblik var Google Gemini 3 førende i diverse benchmarks, men så erklærede Sam Altman fra OpenAI en panik-panik (de kalder det Code Red), og vupti kom 5.2 efter få uger og slog Gemini 3.

Ubemærket frigav Anthropic i samme periode Opus 4.5-modellen (som jeg omtalte i sidste AI-lab).

Copilot, der jo er ChatGPT, var faktisk hurtige ved havelågen denne gang og frigav en 5.2-version samtidig med, at OpenAI gjorde det. Men de gled alligevel ned på 3.-pladsen hvad angår brugere, fordi Gemini 3 virkelig vakte opsigt.

Her er en opsummering jeg faldt over forleden, og som siger en del om situationen:

“GPT 5.2 reinforces my argument that we’re going to see plenty of model variety. Claude Opus 4.5 remains a better coding model. GPT 5.2 is especially powerful when you run it in Pro Mode, but this can take 15-20 minutes. So Gemini 3 Pro still has an important role, especially for tasks that don’t need that depth. I’ve not yet had a chance to pit Gemini 3 Pro in thinking mode against GPT 5.2 Pro.”

Stay tuned, som man siger. Det syder og bobler. Grok har vi ikke hørt fra i flere uger, så der må snart komme noget fra den kant, og der dukker også et hav af specialiserede AI’er op, der kan lave musik, videoer, websites og alt muligt andet.

Transskription: ChatGPT vs. Gemini vs. Claude

Bemærk: Jeg har IKKE testet dette med ChatGPT 5.2 endnu.

Der tales hele tiden om, hvor “multi-modale” de forskellige modeller er - dvs. deres evner til at håndtere billeder, videoer, grafik, lyd med mere.

Man kan f.eks. godt vedhæfte en video til ChatGPT og få den til at opsummere indholdet, foreslå reklametekster for den, osv. Og sådan har de forskellige modeller hver deres styrke.

Forleden besluttede jeg mig for at teste de tre modellers evne til at transskribere en lydfil.

Det er noget, jeg normalt bruger den fremragende Goodtape til. Den er dansk og baseret på et stykke software kaldet Whisper, som OpenAI lavede og frigav som open source flere måneder før de frigav ChatGPT i november 2022. Den er “the gold standard” indenfor transskription.

Men hvis LLM’erne også kan det, vil det jo være nemmere, fordi man så kan springe nogle trin over.

Jeg indspillede først en lydfil (nogle få minutter) med Memoer-app’en på min iPhone og mailede den til min PC.

Jeg startede med at teste ChatGPT5.1 sat til default, så den næsten med sikkerhed ville vælge smart-i-en-fart-modellen. Den leverede en gang ævlebævle og forsøgte at bilde mig ind, at jeg skulle uploade filen igen, etc. Da jeg gentog spørgsmålet, men med modellen sat til Thinking, fortalte den, at den ikke har værktøjerne til det.

Dét er lidt sjovt, da det som sagt er OpenAI, der har lavet Whisper.

Så var det tid til at teste Gemini 3 (Thinking/Pro). Den gjorde det bare, og faktisk bedre end Goodtape. Jeg blev ærligt talt lidt overrasket. Men det skal man jo ikke blive i det her AI-ræs.

Claude (Opus 4.5-modellen) gik straks i gang med at skrive kode, som den i øvrigt er berømt for at være rigtig god til.

Den skrev under sine overvejelser på et tidspunkt “Installing OpenAI Whisper for audio transcription”, og det er da godt tænkt 🙂.

Så gik den i gang med rigtige kode-nørd-ting a la “pip install faster-whisper” og “bash python3 << ‘EOF’” og lignende.

Men det mislykkedes med Whisper, og den prøvede derefter en del andre ting, for til sidst at skrive dette:

“Desværre støder jeg på en begrænsning her, Mogens. Miljøet jeg arbejder i har netværksrestriktioner, der blokerer adgang til de tjenester, der er nødvendige for tale-til-tekst transskription…”

Alt i alt var Google Gemini 3 en klar test-vinder: Ikke alene var det den eneste model, der kunne - dens transskription var tillige af høj kvalitet.

Tip: Nyttige forkortelser, når du prompter

Jeg har før nævnt, at man kan bruge visse forkortelser, når man prompter. Et eksempel kunne være: “ELI5 kvantefysik”, som vil få AI’en til at forklare kvantefysik, så en 5-årig kan forstå det. Eller “TL;DR” (eller bare TLDR), som vil lave et resume af den følgende tekst. Men der er mange andre, som den følgende (engelske) liste viser. Den virker også fint til dansk tekst.

ELI5 is used to explain as if to a 5-year-old.

TLDR summarizes a very long text in a few lines.

STEP-BY-STEP lays out reasoning step by step.

ECKLIST turns a response into a checklist.

EXEC SUMMARY gives a quick executive-style summary.

ACT AS makes ChatGPT speak in a specific role.

BRIEFLY forces a very short answer.

JARGON asks to use technical vocabulary.

AUDIENCE adapts the response to a chosen audience.

TONE changes the tone (formal, funny, dramatic, etc.).

DEV MODE simulates a raw, technical developer style.

PM MODE gives a project-management perspective.

SWOT produces a strengths/weaknesses/opportunities/threats analysis.

FORMAT AS enforces a specific format (table, JSON, etc.).

COMPARE puts two or more things side by side.

MULTI-PERSPECTIVE shows several points of view.

CONTEXT STACK keeps multiple layers of context in memory.

BEGIN WITH / END WITH forces starting or ending with something.

ROLE: TASK: FORMAT: explicitly defines the role, the task, and the expected format.

SCHEMA generates a structured outline or a data model.

REWRITE AS: rephrases in a requested style.

REFLECTIVE MODE prompts the AI to reflect on its own answer.

SYSTEMATIC BIAS CHECK asks to identify biases.

DELIBERATE THINKING forces slower, more thoughtful reasoning.

NO AUTOPILOT forbids superficial, autopilot responses.

EVAL-SELF asks for a critical self-evaluation of the response.

PARALLEL LENSES examines from several angles in parallel.

FIRST PRINCIPLES rebuilds from fundamental basics.

CHAIN OF THOUGHT shows intermediate reasoning.

PITFALLS identifies possible traps and errors.

METRICS MODE expresses answers with measures and indicators.

GUARDRAIL sets strict boundaries not to cross.

Ugens sjove idé: MUS med Gud!

Min herlige og kreative ven Brian, der er selvstændig erhvervsdrivende, og derfor ikke rigtigt har nogen at holde MedarbejderUdviklingsSamtale (MUS) med, tog sagen i egen hånd forleden, og skrev til ChatGPT:

“Lad os forestille os, at jeg skal til “performance review” hos Gud. Hvordan er min rating og hvordan bliver jeg vurderet?”

Det førte ifølge Brian til en længere, god udveksling, fordi han “talte” videre med den efter dens første, korte svar.

Jeg prøvede det med ChatGPT, Gemini og Claude, og fik nogle sjove svar. Tak til Brian for at dele den kreative idé.

Det var dét: Skriv gerne til mig på mogensxy@gmail.com og fortæl, hvordan jeres MUS med Gud gik 🙂.

Annonceindlæg fra Trustworks

Tillid i en Zero-Trust verden

Med voksende trusler, nye EU-krav og øget kompleksitet er cybersikkerhed nu en central ledelsesopgave på linje med strategi og økonomi.

Navnenyt fra it-Danmark

Netip A/S har pr. 15. september 2025 ansat Peter Holst Ring Madsen som Systemkonsulent ved netIP's kontor i Holstebro. Han kommer fra en stilling som Team Lead hos Thise Mejeri. Nyt job
IT Confidence A/S har pr. 1. oktober 2025 ansat Henrik Thøgersen som it-konsulent med fokus på salg. Han skal især beskæftige sig med rådgivende salg, account management og udvikling af kundeporteføljer på tværs af it-drift, sikkerhed og cloud-løsninger. Han kommer fra en stilling som freelancer i eget firma og client manager hos IT Relation og IT-Afdelingen A/S. Han er uddannet elektromekaniker. Han har tidligere beskæftiget sig med salg af it-løsninger, account management, it-drift og rådgivning samt undervisning og ledelse. Nyt job

Henrik Thøgersen

IT Confidence A/S

Norriq Danmark A/S har pr. 1. september 2025 ansat Katrine Køpke Rasmussen som Consultant. Hun skal især beskæftige sig med sikre vækst i NORRIQS kunders forretninger gennem hendes skarpe rapporteringer. Nyt job

Katrine Køpke Rasmussen

Norriq Danmark A/S