Det er nok ikke gået nogens næse forbi, at det går rigtig stærkt med udviklingen af kunstig intelligens.
Det er dog ikke kun hos tech-tenorerne som OpenAI, Google og Anthropic at guldfeberen raser – det samme gør sig gældende ude i edgen, hvor open-source AI-modeller og ny hardware gør det muligt selv at blive herre over, hvordan kunstig intelligens skal bruges og arbejde for en.
Midt i guldfeberen begynder det at pible frem med ny klasse af computere, med enorme mængder hukommelse og masser af båndbredde til at udnytte netop den store hukommelse.
I det felt lander Nvidia og HP med ZGX nano station – en tilsyneladende beskeden enhed, men med evner og muligheder, som der tidligere krævede en sværvægter af en workstation at opnå.
En supercomputer i madkasseformat
HP ZGX Nano G1n AI Station er en blandt en lille klasse af enheder, som er bygget omkring AI-giganten Nvidias særlige GB10-chip, som er en miniaturiseret version af selskabets Blackwell-chips.
Men i stedet for altså kræve en dedikeret workstation, som en GB300 er skabt til, er GB10-systemet skabt til alene at trække 140 watt, hvorfor den kan klemmes ned i en mini-pc, der blot fylder 15 gange 15 centimeter og en halv snes centimeter i højden.
Den mere ydmyge chip betyder dog, at der er noget mindre med AI-muskler ombord.
Her er eksempelvis ’kun’ 20 regnekerner ombord, 6.144 CUDA-kerner samt 128 gigabyte hukommelse med 273 gbps båndbredde, hvor hver GB200 chip her har 72 kerner, 37888 CUDA-kerner og 288gb med svimlende 8000 gbps båndbredde at trække på.
Til gengæld kræver B300-kortene alene en 1800 watts strømforsyning af systemet.
ZGX Nano er derfor lidt af en letvægter i det lys, men leverer ikke desto mindre adgang til hele Nvidias software-stack.
Det du kører på den lille station, kan du afvikle på det tunge jern i serverrummet elle datacenteret med ingen eller minimale tilpasninger.
Det betyder derfor også, at det er Nvidia software og hardware der præger enheden, selvom det er et HP-logo, der pryder den udenpå.
Andre GB10-baserede enheder fra andre producenter, heriblandt Nvidias egen DGX Spark, er også nærmest identiske hvad angår hardware og software - dog med nogle variationer hvad angår design og køleløsninger samt her HP's ZGX Toolkit til at implementere enterprise-workflows.
En kontor-mus
Hvor Nvidia har valgt at give sin DGX Station et flashy, guldbelagt look bringer HP sine brugere helt ned på jorden med designet, som er i tråd med selskabets øvrige desktop-pc’er: Man får en lille boks i sort plast, som på ingen måde indikerer at her er hardware i 40.000 kroners klassen.
Maskinen vejer godt et kilo og byder på fire almindelig USB-C porte, som dog hurtigt får ben at gå på, når tastatur, mus og USB-C Strømforsyningen er sluttet til. Så er det kun en enkel USB-C tilslutning til overs samt et 10gb Ethernet stik.
Ved siden af disse er der dog to indicer på, at det ikke er en almindelig maskine, vi har med at gøre. Her finder du nemlig to af Nvidias kostbare ConnectX-7 netværksstik, der tillader hele 200 GbE netværksforbindelse.
Armeret med disse, kan flere enheder sættes til at arbejde i serie, så endnu større og tungere AI-modeller kan tages i brug og fordeles over flere af ZGX-stationer.
GB10-muskler
Selvom GB10 chippen på papiret ikke når GB300-hardwaren til sokkeholderne er det en potent omgang hardware, der diskes op med.
Selve chippen er fremstillet med TSMC’s nyeste 3nm litografi og Nvidias seneste Blackwell arkitektur.
Her er 20 ARM-baserede regnekerner, der føder 6144 CUDA-cores, samme antal som man finder i Nvidias RTX 5070 grafikkort – men med den essentielle forskel, at de her fødes af otte gange mere hukommelse via de 128 gigabyte hukommelse, som deles med processoren.
Båndbredden er dog her begrænset til 273 gbps, mens det dedikerede grafikkort får over det dobbelte til disposition. Det er dog fortsat en til to ligaer over, det man finder i almindelige kontorsystemer.
Nvidias særlige stack
GB10-processoren lander i et marked, hvor andre er begyndt at tilbyde et samspil mellem kraftige, men strømbesparende processorer med enorme mængder hukommelse igennem masser af båndbredde.
På papiret minder GB10 en del om AMD’s Strix Halo-processorer, som også er kendetegnet ved at kunne tilbyde masser af rå kraft forenet med enorme mængder af lynhurtig ram.
Nvidia har dog den fordel af at være den altdominerende og dermed toneangivende virksomhed indenfor udvikling af AI-hardware.
GB10 har native understøttelse af CUDA (som Nvidia også står bag), som store dele af AI-softwaren er optimeret til.
Dertil byder GB10 på indbyggede Tensor-kerner med FP4 understøttelse – hvilket giver en lavere præcision i udregningerne, men samtidig tillader langt højere ydelse: Op til 1 peta-FLOP kan opnås – noget som hidtil har været
Det giver kontante fordele i en række scenarier, hvor det at koden er optimeret til hardware giver langt højere ydelse i praksis.
Nvidias legeplads
Inden vi måler ydelsen på enheden, skal der jeg berøre, hvad der faktisk kan udrettes. Den er nemlig væsensforskellig fra den bærbar eller arbejdsstation, som du nok arbejder ved.
Den er for det første bygget drevet af frem af Nvidias egen DGX OS 7 – en afart af Ubuntu Linux – som er den selvsamme performance-optimerede Linux-distribution, som anvendes på selskabets DGX-hardware.
Du skal altså være fortrolig med Linux-miljøer, hvilket afspejler sig i de omtrent 30 ’playbooks’, som Nvidia har udviklet til platformen, som gør det let at udnytte hardwaren til at løse opgaver såsom afvikling og fintuning af AI-sprogmodeller, udrulning af lokal AI-agenter eller data-science opgaver i en række videnskabelige eller økonomiske felter.
Fordi Nvidia her er så dominerende indenfor AI-økosystemets udvikling, tilbydes her løsninger som alene kan afvikles på CUDA-hardware.
Et eksempel er et optimeret ’Single-cell RNA sekvenserings-workflow, som udnytter RAPIDS-økosystemet som er bygget omkring CUDA-accelererede biblioteker (cuML, cuGraph og cuDF), hvis lige ikke findes på andre platforme.
Det er en niche-præget opgave, men jo snævrere nichen er, jo mere synes Nvidias CUDA-løsninger at være de eneste tilgængelige.
Man skal dog være opmærksom på, at jo mere niche-præget en løsning er, jo mindre brugervenlig er den oftest.
Linux har i sig selv en stejl indlæringskurve, og HP/Nvidias egen tilpasning er ikke altid lige logisk og ligetil. Jeg har da også skulle prøve kræfter med at genetablere systemet efter en systemopdatering slog fejl.
GPT derhjemme
Selvom HP ZGX Station er mikroskopisk for en workstation af være, er den potent.
De 20 processor-kerner leverer på niveau omkring 10-20 procent over den 16-kernede Strix Halo, som vel er det tætteste vi kommer på en direkte konkurrent til enheden.
Hovedattraktionen er dog grafikkortet og de hurtige 128 gigabyte ram denne har til rådighed sammen med Nvidias CUDA-stack.
Her lykkedes det blandt andet at afvikle halvstore AI-modeller såsom kinesiske Step Flash 3.5 (197 milliarder parametre) og Qwen 3.5 (122 milliarder parametre) med omkring 20 tokens per sekund, svarende til cirka 15 ord per sekund.
Det er begge modeller, der ifølge Artificial analysis yder på niveau med de førende AI-modeller for bare seks til 12 måneder siden, såsom Claude Sonnet 4.5 og ChatGPT o3.
Mindre modeller såsom Qwen 3.5 med 35 milliarder parametre ræser derimod afsted med 70 tokens per sekund.
Grafikdelen i GB10-chippen er samtidig mere muskuløs og bedre optimeret, hvilket afspejler sig i en bedre evne til at bearbejde prompts inden der svares, den såkaldte ’prompt processing’.
Her indlæses Qwen 3.5 122B og Step Flash 197B med eksempelvis 626 og 456 token per sekund – hvor der kun indlæses med omtrent det halve på den AMD baserede Framework Desktop.
En lille mirakel-maskine for de indviede
I en tid hvor OpenAI, Google, Anthropic, Microsoft, Meta og alle de andre AI-storspillere kæmper om at få udvidet deres massive datacentre i al fart, er det interessant at se, hvordan den udvikling smitter af på det man kan udrette med en lille, men dedikeret enhed som HP’s ZGX nano.
Og det er i sandhed ret meget, der kan udrettes, hvis man ellers har behov og evnerne til at opsætte det lille vidunder til det man ønsker.
Priserne debuter omkring de 50.000 kroner herhjemme for en version med fire terabyte lager, om end jeg i stedet vil råde enhver mod at søge efter enheden i den tyske nethandel hvor en en terabyte version er til at få til godt 30.000 kroner.
Det placerer den prismæssigt midt imellem 128gb versionerne af AMD Strix Halo baserede enheder såsom GMKtec EVO-X2 og Framework Desktop som debuterer til henholdsvis 20.500 og 23.300 kroner og den billigste udgave af Apples mægtige Macbook Studio med Ultra processor, hvor 96 gigabyte versionen debuterer ved 35.999 kroner.
Mulighederne synes dog uudtømmelige med ZGX Station – og andre GB10 baserede versioner – hvorfor den ender med at være en varm anbefaling værd til de indviede, der har behov for at forsøge sig med udvikling af lokale AI-løsninger.