(Foto: Twitter / X)

Elon Musks nye AI-model Grok 4 er hundedyr – men den fejer alle konkurrentere af banen i ny analyse

Elon Musk og xAI's helt nye AI-model Grok 4 er ifølge en ny analyse dem mest avancerede store sprogmodel i verden.

11. juli 2025 kl. 08.45

Jacob Ø. Wittorff Redaktør for digital forretningsudvikling og innovation

Den helt nye version af Elon Musks AI-model, Grok 4, blev lanceret onsdag, og den lader til at være særdeles imponerende.

Analysefirmaet Artificial Analysis har haft tidlig adgang til modellen, som er udviklet af Musks AI-firma xAI, og mulighed for at gennemføre en omfattende analysen af Grok 4.

En analyse som viser, at Grok fejer konkurrenterne af banen.

Således får Grok 4 i analysen en index-score på 73, hvilket betyder, at den både slår OpenAI o3 og Google Gemini 2.5 Pro, der begge havde en score på 70 og hidtil var de førende modeller i Artificial Analysis løbende undersøgelser af AI-modeller.

Med andre ord peger undersøgelsen på, at Grok 4 i øjeblikket er den mest avancerede store sprogmodel i verden.

Imponerer med sin logik

Den klarer sig især godt inden for programmering, matematik og såkaldt ”avanceret menneskelig ræsonnering.”

Sidstnævnte område vurderes via en test, som også kaldes for ”Humanity’s Last Exam.”

Her bliver modellerne testet på blandt andet logik, problemløsning og andre evner, som forbindes med menneskelig intelligens. Der indgår blandt andet spørgsmål om filosofi, avanceret matematik samt etik og moral.

På dette parameter fik Grok 4 den højeste score, der nogensinde er blevet målt i Artificial Analysis’ undersøgelse. Her svarede Grok 4 korrekt på 24 procent af spørgsmålene, mens Gemini 2.5 Pro og OpenAI o3 svarede rigtigt på 21 procent.

Langsommere end konkurrenterne

Grok 4 er dog ikke lige imponerende på alle områder.

Ifølge analysen fra Artificial Analysis er Grok langsommere end de fleste af konkurrenterne.

Således bliver Grok 4 målt til en hastighed på 75 output tokens i sekundet, mens OpenAI o3 måles til 188, Gemini 2.5 Pro til 142 og Claude 4 Sonnet til 85.

Dyreste model

Det er samtidig værd at notere sig, at Grok 4 er med en månedlig abonnementspris på 300 dollar, eller cirka 1.900 kroner, også betragteligt dyrere end konkurrenterne.

Det gælder også, hvis man sammenligner prisen med ydeevnen.

Onsdag skabte det skandale, da det kom frem at Grok-botten på det sociale medie X har ytret sig racistisk, antisemitisk og endda hyldet Adolf Hitler.

Men i testen fra Artificial Analysis understreges det, at Grok er testet via xAI’s API, men at den model, som er tilgængelig via X kan være anderledes.

Har du en kommentar til artiklen eller en idé til Computerworld? Send en mail til journalisten bag artiklen.

Flere dybdegående Computerworld artikler

Test – med overvågningsduel: Hvad tiltrækker dig mest – højeste billedkvalitet eller PTZ-funktionalitet?

TP-Link har taget sig god tid til at udvikle helt trådløse overvågningskameraer med 4K-billedopløsning. Nu er der nye produkter i handelen, og de byder på meget høj billedkvalitet, smarte features og mulighed for solcelle-strømforsyning – til priser hvor de fleste kan være med.