Elon Musks nye AI-model Grok 4 er hundedyr – men den fejer alle konkurrentere af banen i ny analyse

Elon Musk og xAI's helt nye AI-model Grok 4 er ifølge en ny analyse dem mest avancerede store sprogmodel i verden.

Artikel top billede

(Foto: Twitter / X)

Den helt nye version af Elon Musks AI-model, Grok 4, blev lanceret onsdag, og den lader til at være særdeles imponerende.

Analysefirmaet Artificial Analysis har haft tidlig adgang til modellen, som er udviklet af Musks AI-firma xAI, og mulighed for at gennemføre en omfattende analysen af Grok 4.

En analyse som viser, at Grok fejer konkurrenterne af banen.

Således får Grok 4 i analysen en index-score på 73, hvilket betyder, at den både slår OpenAI o3 og Google Gemini 2.5 Pro, der begge havde en score på 70 og hidtil var de førende modeller i Artificial Analysis løbende undersøgelser af AI-modeller.

Med andre ord peger undersøgelsen på, at Grok 4 i øjeblikket er den mest avancerede store sprogmodel i verden.

Imponerer med sin logik

Den klarer sig især godt inden for programmering, matematik og såkaldt ”avanceret menneskelig ræsonnering.”

Sidstnævnte område vurderes via en test, som også kaldes for ”Humanity’s Last Exam.”

Her bliver modellerne testet på blandt andet logik, problemløsning og andre evner, som forbindes med menneskelig intelligens. Der indgår blandt andet spørgsmål om filosofi, avanceret matematik samt etik og moral.

På dette parameter fik Grok 4 den højeste score, der nogensinde er blevet målt i Artificial Analysis’ undersøgelse. Her svarede Grok 4 korrekt på 24 procent af spørgsmålene, mens Gemini 2.5 Pro og OpenAI o3 svarede rigtigt på 21 procent.

Langsommere end konkurrenterne

Grok 4 er dog ikke lige imponerende på alle områder.

Ifølge analysen fra Artificial Analysis er Grok langsommere end de fleste af konkurrenterne.

Således bliver Grok 4 målt til en hastighed på 75 output tokens i sekundet, mens OpenAI o3 måles til 188, Gemini 2.5 Pro til 142 og Claude 4 Sonnet til 85.

Dyreste model

Det er samtidig værd at notere sig, at Grok 4 er med en månedlig abonnementspris på 300 dollar, eller cirka 1.900 kroner, også betragteligt dyrere end konkurrenterne.

Det gælder også, hvis man sammenligner prisen med ydeevnen.

Onsdag skabte det skandale, da det kom frem at Grok-botten på det sociale medie X har ytret sig racistisk, antisemitisk og endda hyldet Adolf Hitler.

Men i testen fra Artificial Analysis understreges det, at Grok er testet via xAI’s API, men at den model, som er tilgængelig via X kan være anderledes.

Event: SAP Excellence Day 2026

It-løsninger | Nordhavn

Få konkrete erfaringer med S/4HANA, automatisering og AI i praksis. Hør hvordan danske virksomheder realiserer gevinster og etablerer effektive SAP-løsninger. Vælg fysisk deltagelse hos SAP eller deltag digitalt.

24. februar 2026 | Gratis deltagelse

Navnenyt fra it-Danmark

Netip A/S har pr. 15. september 2025 ansat Jimmi Overgaard som Key Account Manager ved netIP's kontor i Viborg. Han kommer fra en stilling som Sales Executive hos Globalconnect A/S. Nyt job

Jimmi Overgaard

Netip A/S

Signifly har pr. 1. august 2025 ansat Anders Kirk Madsen som Tech Lead. Anders skal især beskæftige sig med at hjælpe Signiflys offentlige og private kunder med at styrke forretningen gennem teknisk solide løsninger. Anders kommer fra en stilling som Business Architect hos SOS International. Nyt job
Norriq Danmark A/S har pr. 1. september 2025 ansat Niels Bjørndal Nygaard som Digital Product Lead. Han skal især beskæftige sig med designe og implementere effektive IT-løsninger. Han har tidligere beskæftiget sig med at være digital consultant og project Manager hos Peytz & Co. Nyt job

Niels Bjørndal Nygaard

Norriq Danmark A/S