Den helt nye version af Elon Musks AI-model, Grok 4, blev lanceret onsdag, og den lader til at være særdeles imponerende.
Analysefirmaet Artificial Analysis har haft tidlig adgang til modellen, som er udviklet af Musks AI-firma xAI, og mulighed for at gennemføre en omfattende analysen af Grok 4.
En analyse som viser, at Grok fejer konkurrenterne af banen.
Således får Grok 4 i analysen en index-score på 73, hvilket betyder, at den både slår OpenAI o3 og Google Gemini 2.5 Pro, der begge havde en score på 70 og hidtil var de førende modeller i Artificial Analysis løbende undersøgelser af AI-modeller.
Med andre ord peger undersøgelsen på, at Grok 4 i øjeblikket er den mest avancerede store sprogmodel i verden.
Imponerer med sin logik
Den klarer sig især godt inden for programmering, matematik og såkaldt ”avanceret menneskelig ræsonnering.”
Sidstnævnte område vurderes via en test, som også kaldes for ”Humanity’s Last Exam.”
Her bliver modellerne testet på blandt andet logik, problemløsning og andre evner, som forbindes med menneskelig intelligens. Der indgår blandt andet spørgsmål om filosofi, avanceret matematik samt etik og moral.
På dette parameter fik Grok 4 den højeste score, der nogensinde er blevet målt i Artificial Analysis’ undersøgelse. Her svarede Grok 4 korrekt på 24 procent af spørgsmålene, mens Gemini 2.5 Pro og OpenAI o3 svarede rigtigt på 21 procent.
Langsommere end konkurrenterne
Grok 4 er dog ikke lige imponerende på alle områder.
Ifølge analysen fra Artificial Analysis er Grok langsommere end de fleste af konkurrenterne.
Således bliver Grok 4 målt til en hastighed på 75 output tokens i sekundet, mens OpenAI o3 måles til 188, Gemini 2.5 Pro til 142 og Claude 4 Sonnet til 85.
Dyreste model
Det er samtidig værd at notere sig, at Grok 4 er med en månedlig abonnementspris på 300 dollar, eller cirka 1.900 kroner, også betragteligt dyrere end konkurrenterne.
Det gælder også, hvis man sammenligner prisen med ydeevnen.
Onsdag skabte det skandale, da det kom frem at Grok-botten på det sociale medie X har ytret sig racistisk, antisemitisk og endda hyldet Adolf Hitler.
Men i testen fra Artificial Analysis understreges det, at Grok er testet via xAI’s API, men at den model, som er tilgængelig via X kan være anderledes.