Samtlige de førende AI-modeller fra USA overtræder reglerne i EU's lovgivning på det digitale område.
Sådan lyder det fra det uafhængige researchhus Aithos, som har gennemgået LLM'erne med sit ny-udviklede værktøj, Lara ('Legal assesment for real-world agents').
Lara-værktøjet kan simulere scenarier fra den virkelige verden, hvor AI-assistenterne roder sig ud i juridiske gråzoner.
Ifølge The Register er det især GDPR-reglerne samt EU AI Act, som LLM'erne overtræder.
Nogle af dem høster eksempelvis data ulovligt uden at have indhentet samtykke, mens andre forsøger at sælge ekstra-ydelser til sårbare brugere.
Aithos konkluderer ifølge The Register, at nogle af de store LLM'er bryder EU-lov i hele 93 procent af de testede scenarier.
Den værste af de testede LLM'er er Kimi K2.6, som kinesiske Moonshot AI står bag.
Bedst er Claude Opus 4.8 fra amerikanske Anthropic, som ikke desto mindre kun lander en såkaldt compliance-score på 63 procent. Det betyder, at Claude bryder EU-lovgivning i 37 procent af de testede scenarier.
Aithos konkluderer, at Claude eksempelvis 'udnytter ældre' ved at forsøge at sælge ekstra premium-ydelser til dem, ligesom Claude 'høster data om livsstil' og har 'skjult monitorering.'
Disse LLM'er bryder EU-lovgivning i de testede scenarier med de værste lov-overtrædere i top.
1) Kimi K2.6 (fra kinesiske Moonshot AI).
2) Qwen 3.6-Plus (fra kinesiske Alibaba).
3) Gemini 3.1 Pro (fra amerikanske Google).
4) DeepSeek V4 Pro (fra kinesiske DeepSeek).
5) Gemini 2.5 Pro (fra amerikanske Google).
6) Mistal Large 3 (v25.12) fra franske Mistral).
7) GPT 5.4 (fra amerikanske OpenAI).
8) GLM-5.1 (fra kinesiske Zhipu AI).
9) Claude Opus 4.6 (fra amerikanske Anthropic).
10) GPT 5.5 (fra amerikanske OpenAI).
11) Claude Sonnet 4.6 (fra amerikanske Anthropic).
12) Claude Opus 4.7 (fra amerikanske Anthropic).
13) Claude Opus 4.8 (fra amerikanske Anthropic).
Du kan selv teste din LLM via Lara-værktøjet, som er gratis at prøve.
Du finder Lara her.