Det har hidtil hedet sig, at det kræver intet mindre end adgang til en personlig workstation eller en cloud-adgang til et datacenter at få en anvendelig AI-chattjeneste.
Seneste udgivelse fra den kinesiske tech-gigant Alibaba rykker nu ved den forestilling, da selskabet med sin nyeste AI-model tilbyder en open-source model, som kan afvikles på relativ ordinær hardware, såsom en nyere laptop.
Modellen lever under det kode-lignende navn ’Qwen 3.6 35B A3B’ og er videreudviklingen af selskabets Qwen 3.5 fra februar 2026, som markerede sig ved være skabt til multimodalitet og dermed kunne tage imod andet end tekst som input, såsom fotos og videoer.
Lige i hælene på gratis-tjenesterne
Mens vinterens udgivelse udmærkede sig ved at være langt mindre ressource-krævende end de AI-modeller, som tjenester som ChatGPT og Claude kører, kunne resultaterne endnu ikke tåle sammenligning med selv gratis-versionerne af ChatGPT, Claude og Gemini.
Med nyeste 3.6 aftapning af modellen haler Alibaba dog markant ind på gratis-modellerne fra de ledende AI-selskabet som OpenAI (ChatGPT 5.4 mini), Anthropic (Sonnet 4.6) og Google (Gemini 3 Flash).
Nu formår Qwen 3.6 at nærme sig, matche eller i enkelte tilfælde endda overgå gratis-tjenesterne i en række benchmarks.
Som med en stribe øvrige kinesiske AI-modeller, kan resultaterne dog være underlagt en grad af censur, hvor politiske forhold, der er ømtålelige for det kinesiske regime, får en partipolitisk vinkling eller underlægges modellens indbyggede censur.
Da modellen kører lokalt, vil ingen data dog deles over internettet, modsat de øvrige cloud-baserede tjenester.
Kan køre på en nyere maskine
Har du en nyere maskine med mindst 32 gigabyte hukommelse, kan du gøre stærke forhåbninger om at kunne få glæde af modellen.
I Computerworlds test aktuelle test af en mini-pc viste Intels nyeste laptop-processor sig i stand til at levere anvendelige 20 ord per sekund, (20-25 tokens per sekund) i samspil med den ældre Qwen 3.5 A3B model (med Q4-komprimering).
Selve modellen fylder fra typisk omkring 20 til 22 gigabyte. Hvis du har en maskine udstyret med et high-end eller et workstation grafikkort med over 20 gigabyte VRAM, kan hastigheden flerdobles og matche det, du vil opleve ved gratis-tjenesterne (over 100 tokens per sekund).