Google hævder at selskabets nye AI-model både kan slå ChatGPT og menneskelige eksperter i test

AI-modellen Gemini, som Google præsenterede onsdag, er både mennesker og andre chatbots overlegen, lyder det fra det søgegiganten.

Artikel top billede

(Foto: Pawel Czerwinski)

Onsdag aften lancerede Google den helt nye sprogmodel Gemini, og den er ifølge søgegiganten både konkurrenten ChatGPT samt menneskelige eksperter overlegen i de fleste tests.

Det skriver den britiske avis The Guardian.

Ifølge Google er Gemini i stand til det, som selskabet kalder for “avanceret ræsonnering” på tværs af flere forskellige formater. Eksempelvis er den i stand til at løse en studerendes fysik-opgaver.

Google har lanceret tre udgave af Gemini-sprogmodellen, hvor Gemini Nano er den mindste og hurtigste udgave, mens Gemini Ultra er den største version med flest funktioner, men også den langsomste.

Mens Gemini Pro, placerer midt i mellem Ultra og Nano, hvilket vil sige, at den både skulle være relativ hurtig og udstyret med relativt gode evner.

Slår GPT-4 i 30 ud af 30 test

Google hævder eksempelvis, at Gemini Ultra er i stand til at sætte de mest moderne kunstig intelligens-modeller – inklusiv OpenAI GPT-4 – til vægs på 30 ud af 32 test-områder. Herunder når det gælder billede forståelse og ræsonnering.

Samtidig hævder Google også, at Gemini Pro er CPT 3,5 overlegen.

Ifølge Google er Gemini Ultra også den første ai-model, der også er menneskelige eksperter overlegen.

Således er Gemini i en multitasking-test med navnet MMLU, der består af 57 forskellige emner inklusiv matematik, fysik, jura, medicin og etik i stand til at slå 90 procent af de mennesker, som tog testen.

Bedre end menneskelige programmører

Samtidig er Gemini Ultra udstyret med et nyt programmeringsværktøj ved navn Alphacode2, som Google hævder klarer sig med bedre end 85 procent af alle “konkurrencedygtige menneskelige programmører.”

Ifølge Google vil Gemini i fremtiden kommer til at indgå i en lang række af selskabets produkter, og chatbotten Bard er allerede opdateret, så den nu baserer sig på Gemini. Det gælder dog ikke i EU og Storbritannien, hvor Google stadigvæk venter på at Gemini får grønt lys fra myndighederne.

Læses lige nu

    Navnenyt fra it-Danmark

    Adeno K/S har pr. 2. februar 2026 ansat Casper Barner Kristensen som ServiceNow Expert. Han kommer fra en stilling som Senior Automation Architect. Nyt job
    Idura har pr. 15. januar 2026 ansat Mark-Oliver Junge, 26 år,  som software engineer. Han skal især beskæftige sig med at udvikle nye extensions, der gør godkendelsesprocesser mere fleksible, samt bygge infrastruktur til caller authentication. Han kommer fra en stilling som fullstack engineer hos Wayfare.ai. Han er uddannet Fachinformatiker für Anwendungsentwicklung, der betyder “ekspert i softwareudvikling”. Han har tidligere beskæftiget sig med udvikling af softwarearkitektur, DevOps og rammeværk til analyse + orkestrering af SQL-datapipelines. Nyt job
    Thomas Morville Helmert, chefkonsulent hos Rigspolitiet, har pr. 28. januar 2026 fuldført uddannelsen Master i it, linjen i organisation på Aarhus Universitet via It-vest-samarbejdet. Færdiggjort uddannelse
    netIP har pr. 1. januar 2026 ansat Michael Kjøgx som Systemkonsulent ved netIP's kontor i Esbjerg. Han kommer fra en stilling som Konsulent hos Blue Byte og før da ATEA og XPconsult. Nyt job