Google er klar med den open source-baserede AI-model DiffusionGemma, der med sin nye tilgang til data-behandling står til at kunne analysere og besvare prompts hurtigere end selv stærke AI-modeller.
Selv de stærkeste AI-modeller fungerer i dag ved at processere workloads en bid af gangen - lidt ligesom når vi skriver på et tastatur med et bogstav og et ord ad gangen, som så hen ad vejen bliver til et sammenhængende hele.
Med DiffusionGemma sigter Google efter en ny tilgang. AI-modellen kan nemlig generere hele tekst-blokke på een gang - lidt ligesom en gammeldags trykpresse, som stempler store tekstblokke på een gang. Ifølge Google går det fire gange hurtigere end i klassiske LLM'ere.
Som navnet antyder, anvender DiffusionGemma såkaldt diffusions-teknologi, som vi i dag kender fra de AI-modeller, som genererer billeder. Det sker nemlig også på een gang og altså ikke bid for bid.
Modellen starter med en digital struktur af tilfældig støj – en slags visuelt rod – som den forfiner til konkret tekst over flere omgange. Da den kan kigge både frem og tilbage i teksten på samme tid, kan den overskue hele tekstblokken og rette sine egne fejl undervejs.
Løsningen er baseret på Googles Gemma-4, som vi fornylig skrev om.
DiffusionGemma er dog ikke et universalværktøj. Den leverer en lavere tekstkvalitet end standardmodellerne, og den falder fuldstændig igennem i store cloud-miljøer med masser af trafik. Her forsvinder den hurtige gevinst, og det kan reelt ende med at gøre cloud-regningen dyrere.
Fokus er lokale opgaver, hvor hastigheden er altafgørende – som for eksempel interaktiv programmering og hurtig tekstredigering. Modellen er open source og kan hentes frit på platforme som Hugging Face og GitHub.
Læs mere om DiffusionGemma hos Google her.