Velkommen til den 39. udgave af AI-lab.
Det går som altid hurtigt i AI-verdenen, og samtidig breder der sig en vis mismodighed blandt brugerne/kunderne, fordi det både går stærkt og bliver mere kaotisk - og der sker nye udviklinger, der gør det næsten umuligt at planlægge noget som helst for en virksomhed på området.
Gartner - et rådgivningsfirma - lancerede deres “hype-cycle” i 1995, og det var fantastisk godt set: Alt muligt gennemgår nogle faser: Stor begejstring, stor tristesse og endelig almindelig accept af det.
Afhængig af, hvad vi taler om, kan hele den cycle tage dage, uger, måneder eller år.
Her er et eksempel på det, hvor alt muligt AI-relateret placeres på et passende sted på kurven:
Kurven stammer fra 2025, og den vil sikkert se anderledes ud, hvis Gartner skulle lave den i dag på grund af hastigheden, som det hele udvikler sig med.
Generativ AI, som er det næsten alle beskæftiger sig med, befinder sig på den store nedturs-del af kurven, og det passer meget godt med den generelle stemning rundt omkring:
Folk har fundet ud af, at det ikke er ALT, man bare kan få til at ske med AI, at det kan blive prohibitivt dyrt at bruge AI og så videre.
Så samtidig med, at vi stadig er midt i en eksponentiel udvikling, hvor tingene går hurtigere og hurtigere, så er der flere kræfter, der gør os skeptiske, får os til at tøve, og ikke mindst får os til at stå og klø os lidt i håret over, hvad vi dog skal gøre.
Én ting er, at firmaerne bag AI’erne nu begynder at tage rigtigt mange penge for brugen - det gør jo, at de glade hvedebrødsdage, hvor vi bare brugte løs, er slut, og vi nu skal overveje, hvad vi har råd til, hvad vi gider bruge dem til og så videre.
En anden ting er USA’s klodsede stats-indgriben med hensyn til hvilke modeller, der må bruges af hvem.
Først blokerede de for brugen af Anthropic’s modeller Mythos og Fable, så truede de med at gøre det for OpenAI’s nye 5.6-model, og i går frigav de så Mythos og Fable.
Og sådan er det jo, når folk uden indsigt, men med stor magt, synes, at de skal gøre ét eller andet.
Her er en særdeles rammende kommentar fra et nyhedsbrev, som jeg faldt over (oversat til dansk af ChatGPT):
“Det her er noget rod, hvor tilfældige embedsmænd uden den nødvendige faglige ekspertise forbyder og ophæver forbud mod produkter uden nogen egentlig proces eller gennemsigtighed.
Man kan ikke lade være med at trække på smilebåndet ad Anthropic og de såkaldte "sikkerhedsaktivister", som i årevis har sagt, at de ønskede begrænsninger, men da de så kom, lød det: "Nej! Ikke på den måde!"
Man kunne også rette en kritisk pegefinger mod de teknologiprofiler, der mente, at man burde stemme på Trump, fordi Biden stod for vilkårlig regulering af kunstig intelligens.
På den anden side er denne politik ganske vist usammenhængende (ligesom så meget andet, der kommer fra denne regering), men cybertrusler bliver taget meget alvorligt af folk, der arbejder seriøst med området, og derfor er det rimeligt, at der bliver gjort noget.”
En af mine venner, en AI-konsulent, havde brugt Fable i tre dage og havde gang i noget vigtigt (og det fungerede fantastisk), da den pludselig blev lukket for ikke-amerikanere.
Det var ret frustrerende, fortalte han. Men nu kan han så bruge den igen.
Omvendt er den nye 5.6-model fra OpenAI lige nu ikke frigivet til andre end nogle få, amerikanske bikse, fordi de førnævnte embedsmænd lige vil se, om den nu også er farlig eller ej.
Det går jo som regel galt, når stater forsøger at styre den slags ting, men de kan ikke lade være.
De skal jo ligesom “gøre noget”, så pressen ikke hele tiden spørger, hvorfor de ikke gør noget.
Så vi skal nok vænne os til det. Forestil jer, at vores eget statsapparat skulle regulere noget, som det ikke har forstand på…
Nu vil taler om OpenAI, så har de lavet en masse ting om, og kommer med tre “lag” af modeller, nemlig sol, jord og måne (ingen stjerner endnu 🙂):
Jeg elsker benchmarks
Surprise! I nogle benchmarks er den Sol hurtigere end Anthropic’s Fable og Mythos.
Og ja, i overmorgen kommer Google måske med noget, der er endnu hurtigere.
Sådan er det med et rigtigt teknologi-ræs.
Jeg har set det tæt på, da alt handlede om databaser.
Dengang i 1980’erne og 1990’erne, hvor databaser var vigtige ting, og vi database-folk var konger, kom der jævnligt en ny udgave af DB2 (IBM), Oracle, eller noget helt tredje, og så var det vigtigt, at lige netop den database var den hurtigste i hele verden.
Derfor lavede man benchmarks, og dem med flest fysiske diske i deres laboratorier vandt.
Indtil den næste leverandør smed en ny udgave af deres database på markedet.
Vi brugte dengang tid på at læse Full Disclosure Reports om disse benchmarks, men til syvende og sidst var det komplet ligegyldigt.
Alle databaserne kunne meget mere end kunderne nogensinde fik brug for. Men sjovt var det da.
Man kan roligt kigge på AI-benchmarks på samme måde. Der kommer altid én til, og 99 procent af os har ikke brug for alt det, som de kan.
Er destillation en god ting?
Well, som tidligere ejer af et mikrobryggeri betragter jeg selvfølgelig destillation som en stor opfindelse for menneskeheden, men ordet har fået en ny betydning, ligesom andre ord har fået det i forbindelse med AI-udviklingen (for eksempel hallucinationer og prompts).
Et destillations-angreb er et slags cyber-angreb, hvor man prøver at få en AI-model til at afsløre, hvordan den løser forskellige typer af problemer, så man kan kopiere det i sin egen model.
Man kaster en masse prompts afsted og kigger på det, som man får tilbage, for på den måde at kunne regne ud, hvordan den arbejder.
Konkurrenter vil typisk sidde og rode med andres modeller for at få gode idéer, og det er der jo intet ulovligt i.
Men kineserne ser som altid anderledes på tingene.
De skal have indhentet amerikanerne, og alle kneb gælder. Det var åbenbart årsagen til, at man trak stikket i forhold til Mythos og Fable fra regeringens side.
Alibaba kan være skyld i fjolleriet omkring forbud mod visse modeller.
Deres destillations-angreb på Mythos/Fable var så massivt, at det blev for meget.
I stedet for deres sædvanlige tyveri og hacking på et moderat, diskret plan, som vi vel efterhånden har vænnet os til, så skulle de absolut forsøge at stjæle teknikker og hemmeligheder på en så massiv skala, at alle blev irriteret.
De er jo også under pres, fordi tingene udvikler sig så hurtigt som de gør, så de gjorde det til en virkelig massiv hacker-øvelse med tusindvis af AI-jobs, der hamrede løs på konkurrenternes modeller i ugevis.
Til sidst råbte en gut fra Amazon vagt i gevær, og Trump-regeringen lukkede for adgangen.
Er kineserne ved at indhente os? Ja og nej.
Kineserne prøver som sædvanlig med DeepSeek - og senest GLM 5.2 - at stjæle fra os for at indhente os.
Men når man ikke selv har skrevet koden og kun forsøger at stjæle funktionalitet og idéer, har man rigtigt svært ved at effektivisere koden, så de ender med at bruge 25 gange flere tokens til et avanceret/tungt job end de modeller, som de stjæler fra.
Så de gør typisk deres tokens meget billigere at købe for at virke mere attraktive, men det kan stadig betale sig finansielt at bruge de amerikanske, fordi de er mange gange mere effektive.
Et eksempel: Deepseek tager 18 cents for en million tokens, mens Fable/Mythos tager 50 dollars for samme antal tokens.
Det er bare ligegyldigt, hvis Fable er 25 gange mere effektiv, og det er et punkt, hvor amerikanerne virkelig har effektiviseret massivt i de sidste 12-18 måneder.
Google anslog for eksempel, at de havde reduceret compute-forbruget for en prompt med 99 procent alene i 2025.
Det bliver i sandhed sjovt at se, hvordan denne udvikling med hensyn til kvalitet og pris udvikler sig i de kommende måneder. Nu skal vi både betale en masse for det, tage stilling til kapløbet mellem Kina og USA OG forsøge at følge med i den tekniske udvikling. Skriv gerne på mogensxy@gmail.com og fortæl, hvad I gør i den anledning. Hvad bruger I, og hvor mange penge bruger I og/eller jeres firma på AI efterhånden?