Velkommen til AI-lab #13, hvor hovedtemaerne er: Hvad er RAG-løsninger egentlig? Og hvordan laver du et heftigt, virtuelt AI-team til at løse komplekse problemer?
Derudover lidt tips & tricks, sidste nyt om Google Gemini 3 og Copilot, samt lidt panik, panik og aflivning af en hårdnakket myte. Plus et PS om en virkelig fed, ny feature i Gemini.
Men først…
Tillykke med fødselsdagen, ChatGPT
På fredag 30. november er det tre år siden OpenAI smed ChatGPT ud til verdens befolkning.
De var under 1.000 ansatte og alle på jorden kunne øjeblikkeligt bruge dette nye, revolutionerende værktøj.
Det anvendes i dag af over 800 millioner mennesker rundt om på jorden. Vildt, vildt, vildt.
Det fik dengang chefen for Google til at erklære “Code Red”, det vil sige en alvorlig nødsituation.
Siden har Google virkelig gjort alt, hvad de kan for at indhente OpenAI, inklusive noget de altid har været gode til, nemlig at kopiere alt, hvad OpenAI gør (deres chat ligner ChatGPT SÅ meget), men de har også lanceret geniale ting som NotebookLM.
Og som I kan læse længere nede, så er den nye Google Gemini 3 meget, meget imponerende.
Hvem overlever?
OpenAI har i den grad været “first movers," der tog de store, gamle, halvt sovende kæmpe-bikse på sengen.
Men samtidig er Google og Meta også de gamle oligopoler med masser af penge, dybe lommer og dermed tid og kræfter til at tryne dem.
Perplexity, Grok og alle kineserne er også fine og har mange penge i ryggen, men slet, slet ikke i den liga, som vi taler om her.
Meta kan ikke rigtigt få det til at virke - mest fordi de rigtigt dygtige folk ikke synes, at det er særligt cool at arbejde for dem.
Sådan er det ikke med Google.
Deres egne chips (TPU’er) kombineret med deres enorme R&D-budget, mange års erfaring med brug af AI i blandt andet Google Maps, plus opkøbet af DeepMind allerede i 2014, er en meget stærk opstilling.
Det bliver spændende at følge udviklingen.
Tillykke med fødselsdagen, ChatGPT! Og tak! Du kom lige i rette tid, for vi var mange, der var aldeles overvældede over al den lovgivning, der væltede ned over os fra EU. Nu kan vi håndtere det. God timing.
RAG-løsninger
Som man plejer at sige: Hvis du har sovet i nogle år under en sten, har du nok ikke hørt om RAG. Ellers har du.
RAG står for Retrieval Augmented Generation.
Det betyder, at løsningen kan hente data (retrieve), forbedre det (augment) og lave et svar (generate).
Det vigtigste her er “augment," som betyder, at data, der hentes, bliver indekseret (reelt lavet til såkaldte tokens).
Oprindeligt var det meget vanskeligt at lave RAG-løsninger. Der skulle kodes en masse, og hvert af skridtene (R, A, G) krævede en masse af udviklerne.
Derfor var ChatGPT så revolutionerende.
Masser af forskere og andre lærde på de højere læreanstalter brugte skam AI, men de skulle kode og træne og alt muligt andet i vildskab for at få det til at virke.
Og de fik alle et kæmpechok oppe i deres elfenbenstårne. Sådan er det jo med demokratiserende ting, der kommer på markedet.
Der findes hos alle AI-leverandørerne nogle indbyggede funktioner, der gør det nemt at lave en RAG-løsning - i ChatGPT for eksempel GPT’er og Projekter - men de har begrænsninger.
En GPT kan max have 20 dokumenter, et projekt max 40.
Dokumenterne kan hver især være ret store, man kan inkludere zip-filer, og man kan slå flere, mindre filer sammen til én. Men det er lidt mere besværligt.
Hvis man skal kunne hente data fra for eksempel tusindvis af dokumenter, skal man til at kode og lave API-kald mv. Det er lige dér, at en nem løsning bliver til et it- eller AI-projekt, og de kan nemt gå galt.
Det anslås, at 95 proccent af AI-projekter fejler, og jeg er sikker på, at hvis de nemme RAG-løsninger kunne håndtere rigtigt mange dokumenter, ville mange være fuldt tilfredse med det. Måske ikke konsulenthusene - men kunderne 🙂.
Når det er sagt, så kan GPT’er og projekter (i ChatGPT), og lignende fra de andre leverandører, løse MANGE problemer og lette arbejdet mange steder.
Man kan give instrukser om, hvordan den skal opføre sig, hvordan den skal svare på bestemte typer henvendelser, mmm.
Man kan med andre ord komme langt uden at skulle kode.
Vigtigt! Microsoft kalder den slags løsninger for “agenter” i Copilot.
Det er misvisende, fordi vi har lært, at agenter er nogle autonome størrelser, der kan forhandle med hotellet om prisen og vende tilbage med bookningen ordnet og betalt.
På den nylige Ignite-konference forudså Microsoft, at der i Copilot ville blive udviklet milliardvis af agenter. Det kan lyde skræmmende. Men det er altså bare RAG-løsninger a la GPT’er og projekter i ChatGPT.
Jeg sidder bare og venter på, at disse nemme RAG-løsninger kommer i stadigt bedre udgaver, der kan håndtere flere og flere dokumenter mv. uden at man skal til at kode og dermed risikere alle de sædvanlige ting ved it-projekter. Og vi er tæt på.
Google har med lanceringen af Gemini 3 forleden taget et kæmpe skridt derhen imod.
De lancerede noget, som de kalder File Search, der gør det MEGET nemmere at “stikke snablen ned” i for eksempel et fællesdrev eller et andet repository med dokumenter og lignende.
De vil dog stadig have, at man koder lidt - ikke meget, men lidt.
Faktisk så lidt, at de fleste nok ville kunne finde ud af det - om ikke andet kan de vel få lavet koden af Gemini! Jeg vender tilbage med eksempler i en kommende klumme.
Googles officielle blog om File Search kan I læse her, og her er en god video om det.
Skriv gerne til mig på mogensxy@gmail.com, hvis I laver en fed løsning med File Search.
Lav et virtuelt team
En kollega fik for et års tid siden den idé at lave personaer (beskrivelser af imaginære, virtuelle personer, der kan hidkaldes i AI-sammenhænge) på den måde, at han lavede et helt, fagligt team bestående af en et par chefer, en journalist, en jurist og hvad der ellers var relevant.
Det kunne for eksempel bruges til at lave virtuelle debatter om vigtige emner, så man fik en masse synspunkter fra forskellige vinkler.
Han fik (selvfølgelig) hjælp af ChatGPT til at lave detaljerede beskrivelser af personernes baggrunde, uddannelser, erfaringer, mv. Så kunne han eksempelvis bede tre-fire af dem lave en SWOT-analyse af et presserende problem.
Det virker, fordi man får givet AI’en meget mere detaljerede prompts på den måde. Og det føles mere “naturligt” for os.
Man kunne jo også finde sin chef på LinkedIn, trykke “More” og “Save to PDF” - så har man en pdf med al den information, som personen har skrevet om sig selv på LinkedIn - den vedhæfter man så i ChatGPT og beder den lave en persona ud af det.
Så kan man få den til at skrive til chefen i hans egen stil.
Jeg har siden brugt team-tricket i ny og næ til specifikke opgaver, eksempelvis da jeg ville have løst opgaverne til DM i programmering, og da jeg ville have forslag til forbedringer af en AI-børnebog, som jeg forsøgte at skrive.
Og lige om lidt vil jeg lave et læge-fagligt team til at kigge på en masse sundhedsdata for en ven.
Sådan vandt mit team DM i programmering
Først satte jeg ChatGPT i Thinking-mode og bad den lave en god, detaljeret prompt, gerne med et team, hvis det var relevant, som kunne bruges som input til Deep Research med henblik på at få løst opgaverne.
Dernæst fyrede jeg den kæmpe-prompt, som den lavede, af i Deep Research. Folk bruger i øvrigt Deep Research alt, alt for lidt. Man har 25 af dem om måneden, og det er fantastisk, hvad man kan få lavet.
Tilbage til DM: ChatGPT valgte at lave et tre-mands-team bestående af d’Herrer Djikstra og Knuth, samt Ada (som var en kvinde),
Navnene er godt valgt af den, for disse tre personer er virkelig nogle fyrtårne inden for udviklingen af algoritmer mv. i computer science gennem tiden. God karma & lidt morfar-humor, må man sige.
De tre startede løsningen af hver opgave med nogle korte konstateringer fra hver deres virtuelle synsvinkel, før de tog fat på selve løsningen.
Her er to eksempler:
Problem A – Arithmetic Adaptation
Ada: The sum $s$ can be split into two nonzero parts easily.
Knuth: A simple case distinction works. If $s=0$, we choose $1$ and $-1$.
Dijkstra: For $s \neq 0$, one of $a$ or $b$ can be $1$ or $-1$ to ensure both are nonzero.
Problem B – Bohemian Bookshelf
Ada: We model which books stand upright vs in the stack. This is like partitioning books.
Dijkstra: Use dynamic programming: we decide which books to stack to fit height $H$ and meet width $W$.
Knuth: We ensure at least one upright and one stacked. Try a subset that maximizes thickness in stack (vertical) without exceeding $H$ and leaves width for upright.
Og så løste de ellers alle opgaverne på 23 minutter (de menneskelige deltagere havde fem timer til det), det vil sige, at den skrev Python-kode, der kunne løse dem.
Det brugte jeg så til gengæld til at bede den efterfølgende (igen i Deep Research) om at skrive noget generel kode, som man kan bruge til at løse tilsvarende problemer en anden gang - for det er tilladt til DM i programmering at medbringe programmer, der kører på pc’en, men ikke tilladt at bruge AI.
Jeg håber, at jeg får chancen for at være med igen næste år.
AI-børnebogen og forlaget
Det andet eksempel var den børnebog om AI, som jeg forsøgte at skrive, og som fik hård kritik af min hustru, min datter og en kollega fra vores kommunikationsafdeling.
Jeg samlede deres (skriftlige) kritik, satte det ind i ChatGPT, bad den lave et team fra et børnebogsforlag, der kunne diskutere på et møde, hvad der skulle gøres - og satte det i gang.
Den satte en redaktør, en illustrator og flere andre sammen til et møde, lavede en fin og relevant dagsorden, og kom efter en lang og nyttig diskussion mellem parterne frem til, at der skulle satses på forskellige måder at lave bøgerne, afhængig af børnenes alder, mv.
Det var detaljeret og særdeles brugbart - og så var det jo bare at sætte den i gang med at føre det ud i livet, så jeg endte med flere, gode børnebøger om AI.
Mit helt eget lægeteam
Jeg vil også prøve at få fat på så mange sundhedsdata og dokumenter og akter fra borger.dk mm. som muligt, og så sætte et læge-fagligt team til at gennemgå det hele og komme med observationer, konklusioner og måske endda forslag til, hvad jeg bør gøre.
Jeg har ikke besluttet mig til, om der også skal være en psykiater med i teamet 🙂.
Det er både sjovt og nyttigt at lave sådanne AI-teams. Lad mig høre på mogensxy@gmail.com, hvad I finder på.
Nyhed! Gemini 3 er ankommet
å kom Google med deres nye topmodel. Den ser meget fin ud, og slår de andre top-modeller på nogle områder.
Det er i øvrigt fedt med den konstante konkurrence for os brugere. Om få uger kommer der sikkert en model, der slår Gemini 3. Sådan er det.
Men det er også bare imponerende at se, hvor hurtigt ting udvikler sig og bliver bedre, når der konkurreres på den måde globalt.
En sjov/smart detalje: Gemini 3 er gratis i et år for alle amerikanske universitetsstuderende. Man får jo helt lyst til at læse igen.
Og den ER også vild på nogle områder. Den har for eksempel fået et nyt punkt i “værktøjer” kaldet “dynamisk visning” (dynamic view), der laver en slags “apps” i stedet for bare at svare med en blok tekst.
Det slog jeg straks til og bad den vise mig, hvordan man kommer i gang med at bruge Google Gemini. Resultatet var en komplet, velkomponeret begynderguide:
Jeg spurgte Gemini, hvad “dynamisk visning” er for noget, og jeg har lagt dens (interessante) svar ned i mit PS til sidst i klummen. Det er værd at læse.
Microsoft Ignite 2025 keynote - +to timers video gennemgået på 42 sekunder
Microsofts store, årlige Ignite-konference handlede mest om…tadahh… Copilot!
En venlig sjæl henviste mig til keynoten, men det er jo en video på over to timer!
“Jeg orker det ikke, Hans Christian - jeg går op og lægger mig," som Maude i øvrigt aldrig sagde (det er en hallucination fra den virkelige verden).
Tilbage til den meget lange og kedelige video: Jeg lavede mit kome.ai- & ChatGPT-tl;dr-trick på den, hvilket gør det muligt at få at vide, hvad en lang video handler om, på få sekunder.
Det er nu min favoritmåde at “se” lange videoer på. Her er opskriften:
- Kopier linket for YouTube-videoen.
- Kopier linket ind i https://kome.ai/tools/youtube-transcript-generator
- Tryk på copy-knappen (og en irriterende “OK”-knap bagefter).
- Gå ind i ChatGPT og skriv “TL;DR: ” (too long; didn’t read), tryk ctrl/v og tryk retur.
Voila! På få sekunder har du et glimrende resumé af en meget lang video. Husk at stille den til “Thinking” som model, hvis det skal være ekstra godt.
Sundhedsplatformen med AI? Right…
En af de MANGE ting, der blev sagt i Ignite-videoen, var: “Sundhed (Epic Systems): Læger bruger Copilot til at generere journalnotater og håndtere recepter, hvilket reducerer tidsforbruget med 30–40 procent.”
Ha! Det skal de nok blive begejstrede for i Region Øst, hvor de bruger Sundhedsplatformen (Epic), og hvor lægerne i forvejen hårdnakket nægter at bruge den indbyggede, smarte tale-funktion, fordi… ja, fordi!
Talefunktionen aktiveres ved at klikke på et mikrofon-symbol på skærmen og så tale. Det er da nemt.
Den sparer lægerne for enormt meget tid og minder endda lidt om deres oldnordiske diktafoner, som de elskede at mumle uforståelige ting ind i, for så at smide den i hovedet på skrivemaskinedamerne.
Men nej, i stedet for at få en masse nyttig information indtalt nemt og hurtigt vælger de at skrive alt (for lidt) ind i journalerne med langsom, manuel indtastning (politifingersystemet, I ved, aka Search & Destroy). Det er sådan noget, der forringer hele datagrundlaget over tid.
I alle andre lande, hvor man bruger Epic, kan lægerne sagtens bruge tale-funktionen. Ikke i Danmark.
Vi ER klogere og har helt unikke problemstillinger indenfor sygdomme, så det duer selvfølgelig ikke her.
Og nu kommer der så AI fra Microsoft?!? Det er vist noget værre noget. “Jeg hørte om en læge, der engang fik et helt forkert svar fra ChatGPT…” Nå, vi må jo kollektivt håbe på det bedste.
Prøv at erstat “AI” med “data”
Jeg faldt også over dette skønne citat fra Ignite-videoen:
"Computing gjorde arbejdet personligt. Cloud gjorde det forbundet. AI gør det altomfattende. AI er ikke længere et værktøj – det er en partner, der frigør menneskelig kreativitet og driver næste fase af vækst.”
Snøft. Hvor ER det smukt.
Jeg prøvede for sjov at erstatte ordet “AI” med ordet “data” i teksten, og det var ret interessant. Prøv det selv.
Her er tre eksempler I kan øve jer på, også fra Ignite:
1) “AI er en ny æra, ikke bare hurtigere værktøjer, men evnen til at gøre ting, mennesker ikke kunne før.”
2) ”Frontier firms(de mest innovative virksomheder) udnytter AI strategisk på tværs af organisationen – med fokus på medarbejderoplevelse, kundeengagement, procesinnovation og styring.
3) “Microsofts mission: at demokratisere intelligens — AI skal være tilgængelig for alle og øge menneskelig kreativitet.”
Når det så er sagt: Alle Office-brugere vil blive berørt af Copilot, og der kan laves SÅ mange fede ting med den. Måske kan en masse møder ENDELIG blive til emails nu…
Fun fact: Home-edition af Office/Windows-halløjet fra Microsoft fornys for mit vedkommende 14. december, med mindre jeg gør noget. Prisen stiger fra 550 kroner sidste år til 780 kroner i år. Gæt en begrundelse 🙂.
Vær bange. Vær meget bange. Men lav det
Panik! Kinesiske hackere har brugt Anthropics AI til at hjælpe med hacking! Panik! … Siger Anthropic i en pressemeddelelse.
Og det kan man jo reagere på på forskellig vis i Danmark og i USA:
DR’s Prompt-podcast sagde (parafraseret): “Det er meget farligt - og - interessant - specielt i forhold til open source-AI-modeller, hvor man jo bare kan slå al sikkerhed fra og køre løs. Nu dør vi.”
Amerikansk analytiker: “Anthropic hævder, at kinesiske hackere har brugt Claude til at udvikle og udføre et cyberangreb mod "omkring 30" mål, og at "et lille antal" af angrebene lykkedes.
Det kan være alvorligt, men det passer også ind i et mønster, hvor Anthropic kommer med skræmmende påstande, der ikke altid holder til nærmere efterprøvning.
Yann LeCun (fra Meta) mener, at de siger det for at få indført regulering (og dermed lukke konkurrenter ude), men det kan også skyldes selvselektion – det ER trods alt virksomheden, der siger: "kom og arbejd her, hvis du er bange for AI, men stadig gerne vil bygge det.” Under alle omstændigheder er sikkerhedseksperter ret skeptiske.”
Nej, AI’en gemmer IKKE dine data
Den gode professor Claus Nygaard har skrevet om den vedholdende myte, der handler om, at AI’en gemmer vores data. Det er noget af det, som man hører mest som AI-underviser og -foredragsholder, skulle jeg hilse og sige.
Men nej, det kan jeg garantere jer for, at den ikke gør. Og tænk, hvis den gjorde - den ville jo blive ubrugelig i løbet af meget kort tid, og måske udvise nazistiske pædofili-tendenser, eller hvad ved jeg.
Claus Nygaard forklarer pædagogisk og grundigt, hvorfor det er sådan. Læs det her.
Det var det Skriv gerne på mogensxy@gmail.com med kommentarer, rettelser, forslag og vilde idéer 🙂.
PS: Hvad er Google Gemini Dynamisk Visning?
Jeg opdagede en ny ting man kan trykke på, der hedder "Dynamisk visning".
Jeg skrev så: "Vis mig, hvordan man kommer i gang med Google Gemini", og så lavede den en meget fin begynderguide med grafik, knapper man kunne trykke på, etc. Helt vildt.
Så spurgte jeg den, hvad det der dynamisk visning egentlig er for noget, og så skrev den:
Dynamisk visning (eller Dynamic View på engelsk) er en ret ny og avanceret funktion i Google Gemini, som ændrer måden, du modtager svar på.
I stedet for blot at give dig tekst, skaber Gemini en interaktiv brugergrænseflade skræddersyet til netop dit spørgsmål.
Kort fortalt: Gemini programmerer en lille "mini-app" eller en interaktiv hjemmeside til dig på et splitsekund, så du bedre kan overskue informationen.
Her er et dybere dyk ned i, hvad det er, og hvad det kan:
Hvad er Dynamisk Visning helt præcist?
Det er en form for Generativ UI (Generative User Interface). Normalt, når du spørger en AI om noget, får du en lang tekstblok.
Med dynamisk visning analyserer Gemini din forespørgsel og tænker: "Ville dette svar være bedre som en tidslinje, et interaktivt kort eller en tabel med faner?" – og så bygger den det.
Hvad kan den lave? (Eksempler)Funktionen er særligt god til komplekse opgaver, hvor overblik er vigtigt.
Her er hvad du kan bruge det til:
Rejseplanlægning:
Prompt: "Lav en tre-dages rejseplan for Rom."
Resultat: I stedet for en liste, får du en visuel tidslinje eller et kort, hvor du kan klikke på hver dag for at se detaljer, billeder af attraktionerne og ruter, uden at miste overblikket.
Produkt-sammenligning:
Prompt: "Hvilken ny smartphone skal jeg købe? Sammenlign de bedste modeller."
Resultat: Den kan generere en interaktiv tabel eller et dashboard, hvor du kan filtrere på pris, kamera-kvalitet eller batteritid for at finde den rette telefon.
Læring og undervisning:
Prompt: "Forklar hvordan et sort hul fungerer."
- Resultat: Den kan lave en visuel guide med faner (tabs), du kan klikke dig igennem, måske med interaktive diagrammer, der gør det nemmere at forstå end ren tekst.
Beslutningstagning:
Den kan hjælpe med at organisere fordele og ulemper i et layout, du kan sortere i.
Hvordan virker det teknisk?
Bag kulisserne bruger Gemini sine kode-evner ("agentic coding capabilities"). Den skriver faktisk kode (typisk HTML/CSS/JavaScript) i realtid for at vise dig svaret, men du ser kun det færdige, flotte resultat.
Vigtigt at vide
Tilgængelighed Det er en funktion, der rulles ud gradvist (ofte markeret som "Labs" eller eksperimentel). Det er ikke sikkert, den er aktiv på alle dine enheder endnu.
Krav
Du skal typisk være over 18 år og bruge en personlig Google-konto (ikke altid tilgængeligt på arbejds-konti endnu).
Visuelt layout
Nogle gange vil du se en funktion kaldet "Visuelt layout" – det minder om dynamisk visning, men fokuserer mere på at præsentere svaret flot som et magasin med billeder, frem for at være dybt interaktivt.