Artikel 55 i förordning (EU) 2024/1689 — Utvärdering och adversariell testning av AI-modeller för allmänt ändamål med systemrisk. Officiell text, praktisk tolkning, centrala skyldigheter och efterlevnadskonsekvenser.
Sammanfattning av den officiella texten
Artikel 55 i förordning (EU) 2024/1689 fastställer specifika skyldigheter avseende utvärdering och adversariell testning för leverantörer av AI-modeller för allmänt ändamål (GPAI) som utgör systemrisk. Med utgångspunkt i den bredare uppsättningen skyldigheter som anges i artikel 53 och kriterierna för klassificering av systemrisk i artikel 51, kräver artikel 55 att sådana leverantörer genomför modellutvärderingar i enlighet med standardiserade protokoll och utför adversariell testning — vanligen benämnd red-teaming — regelbundet.
De utvärderingar som krävs enligt punkt 1 a måste följa standardiserade protokoll och verktyg som återspeglar den tekniska utvecklingens nuvarande ståndpunkt, inklusive sådana som har utvecklats eller godkänts av AI-byrån. Där inga standardiserade protokoll finns måste leverantörerna utforma och tillämpa lämpliga metoder för att identifiera och bedöma systemriskers art och omfattning.
Punkt 1 b ålägger adversariell testning, som ska genomföras antingen internt eller genom anlitande av ackrediterade externa experter, med syftet att identifiera risker som inte fångas upp av standardiserade utvärderingsförfaranden. Leverantörerna måste dokumentera metoder, räckvidd och resultat för såväl utvärderingar som adversariella testningsövningar, och rapportera väsentliga fynd till AI-byrån. AI-byrån behåller själv befogenhet enligt punkt 2 att när som helst organisera eller beställa oberoende adversariell testning. Artikeln förpliktar också leverantörer att dela utvärderingsresultat och testrapporter med behöriga myndigheter när så begärs.
Vad detta innebär i praktiken
För organisationer som utvecklar eller driftsätter frontier-GPAI-modeller ålägger artikel 55 en strukturerad och dokumenterad kvalitetssäkringsprocess med specifikt fokus på att identifiera systemiska skador. I praktiken innebär detta att leverantörer, innan de lanserar en kvalificerande modell — och löpande efter lansering — måste genomföra både standardiserade kapacitetsutvärderingar och riktade adversariella övningar utformade för att undersöka katastrofala eller utbredda risker, såsom manipulation i massomfattning, generering av vapenrelaterat innehåll, storskaliga cyberattacker eller störning av kritisk infrastruktur.
Ur ett operativt perspektiv kräver efterlevnad att man sätter samman eller kontrakterar multidisciplinär red-team-kapacitet med expertis inom AI-säkerhet, cybersäkerhet, desinformation, biosäkerhet och andra relevanta områden. Utvärderingar måste genomföras mot riktmärken och protokoll som återspeglar den aktuella tekniska ståndpunkten; leverantörerna kan inte enbart förlita sig på egna, opublicerade metoder om standardiserade alternativ finns.
Dokumentation är centralt. Leverantörerna måste föra detaljerade register över varje utvärderingscykel — inklusive räckvidd, teamsammansättning, testade scenarier, observerade resultat och tillämpade riskreduceringsåtgärder — och måste kunna ta fram dessa register för AI-byrån på begäran. Där testning avslöjar nya eller förvärrade systemrisker är leverantörerna skyldiga att vidta korrigerande åtgärder och, där risken är allvarlig, att underrätta AI-byrån utan onödigt dröjsmål.
En leverantör som lanserar en stor multimodal modell som överstiger träningsgränsen 10^25 FLOP bör till exempel planera in red-team-övningar innan lansering som täcker åtminstone: framkallande av vetenskaplig kunskap med dubbla användningsområden, generering av övertygande innehåll i stor skala och underlättande av automatiserade cyberattacker. Efter lansering måste dessa övningar upprepas när modellen genomgår betydande finjustering eller kapacitetsuppdateringar.
Centrala skyldigheter
- Standardiserade utvärderingar: Genomföra modellutvärderingar med hjälp av toppmoderna standardiserade protokoll och verktyg, inklusive sådana som har utvecklats eller godkänts av AI-byrån, innan marknadsplacering och löpande.
- Adversariell testning (red-teaming): Genomföra strukturerade adversariella testningsövningar — internt eller via kvalificerade externa tredje parter — utformade för att avslöja systemrisker som inte identifierats genom standardutvärdering.
- Dokumentation och registerföring: Föra detaljerade register över utvärderingsmetodik, räckvidd, testade scenarier, resultat och eventuella vidtagna korrigerande åtgärder, med register tillgängliga för AI-byrån på begäran.
- Rapportering av väsentliga fynd: Underrätta AI-byrån om allvarliga eller nyligen identifierade systemrisker som upptäckts genom utvärderingar eller adversariell testning utan onödigt dröjsmål.
- Samarbete med AI-byrån-beställd testning: Underlätta och samarbeta vid oberoende adversariell testning som organiseras eller beställs direkt av AI-byrån inom ramen för dess tillsynsbefogenheter.
- Löpande efterlevnad efter lansering: Upprepa utvärderingar och adversariell testning efter väsentliga modelluppdateringar, finjustering eller förändringar i avsedda användningsfall som kan förändra modellens riskprofil.
Förhållande till andra artiklar
Artikel 55 fungerar som den operativa motsvarigheten till systemriskklassificeringen som fastställs i artikel 51 och de allmänna GPAI-skyldigheterna som anges i artikel 53. Den bör läsas tillsammans med artikel 52, som definierar tröskeln och kriterierna för systemriskbeteckning, och artikel 54, som behandlar skyldigheter avseende teknisk dokumentation för GPAI-modeller med systemrisk. Rapporteringsskyldigheten avseende incidenter i artikel 73 korsar artikel 55 där adversariell testning avslöjar en allvarlig incident eller ett tillbud som kräver anmälan. På tillsynsnivå är AI-byråns befogenhet att beställa testning enligt artikel 55(2) grundad i de bredare tillsynsbefogenheter som tilldelas genom artiklarna 88 och 89. Leverantörerna bör också konsultera skäl 110, som klargör skälen för att skilja ut modeller med systemrisk och vikten av säkerhetsutvärdering före marknadsintroduktion som komplement till löpande övervakning.
Efterlevnadstidslinje
- 1 augusti 2024 — Förordning (EU) 2024/1689 trädde i kraft, vilket startade klockan för gradvis tillämpning.
- 2 februari 2025 — Förbjudna AI-praxis (avdelning II) blev tillämpliga.
- 2 augusti 2025 — Bestämmelserna i avdelning V om AI-modeller för allmänt ändamål, inklusive artikel 55, blev fullt ut tillämpliga. Leverantörer av kvalificerande GPAI-modeller som redan fanns på marknaden var skyldiga att uppnå efterlevnad senast detta datum.
- 2 december 2026 — Skyldigheter för högrisk-AI-system enligt bilaga I (system som säkerhetskomponenter) blir tillämpliga.
- 2 augusti 2027 — Återstående skyldigheter för högrisk-AI-system (system enligt bilaga III) blir tillämpliga.
Artikel 55 är därför redan i kraft. Leverantörer av GPAI-modeller med systemrisk som ännu inte har upprättat program för utvärdering och adversariell testning bryter mot nuvarande skyldigheter och bör behandla avhjälpning som en omedelbar prioritet.
Official AI Act Compliance Deadline Calendar
Updated · Sources: Regulation (EU) 2024/1689 and the 2026 Digital Omnibus on AI.
| Obligation | Applies to | Original date | New date | Status | Countdown | Legal basis |
|---|---|---|---|---|---|---|
| Prohibited Practices (Art. 5) | All providers and deployers | active | — | AI Act Art. 5 | ||
| GPAI Rules (Chapter 5) | GPAI model providers | active | — | AI Act Art. 51-56 | ||
| High-risk AI — Annex III (standalone) | Providers of standalone Annex III systems | deferred | — | AI Omnibus 2026 Art. 6(2) | ||
| High-risk AI — Annex I (embedded) | AI embedded in Annex I regulated products | deferred | — | AI Omnibus 2026 Art. 6(1) | ||
| AI-Generated Content Marking | Providers of generative GPAI systems | active | — | AI Act Art. 50(2) | ||
| Regulatory Sandboxes | National competent authorities | active | — | AI Act Art. 57 |
⬇ Download JSON · CC BY 4.0
AI Act meets DORA and NIS2
Is your organisation subject to both the AI Act and DORA? The two regulations intersect on the operational resilience of financial AI systems. Our sister site regulation-dora.eu covers DORA in depth.
Explore regulation-dora.eu ↗Frequently Asked Questions
Adversariell testning, även känd som red-teaming, avser strukturerade bedömningar där experter försöker framkalla skadliga, partiska eller på annat sätt oönskade resultat från en AI-modell för allmänt ändamål. Artikel 55 kräver att leverantörer av GPAI-modeller med systemrisk genomför sådan testning innan modellen släpps på marknaden och löpande därefter, för att identifiera och minska allvarliga risker innan de orsakar skada.
Artikel 55 gäller uteslutande leverantörer av AI-modeller för allmänt ändamål (GPAI) som har bedömts utgöra systemrisk — en beteckning som, enligt artikel 51, utlöses när en modell tränas med en total beräkningseffekt på mer än 10^25 FLOP, eller när Europeiska kommissionen genom andra medel drar slutsatsen att modellen utgör systemrisk. Leverantörer av GPAI-modeller under detta tröskelvärde omfattas inte av artikel 55.
Artikel 55 tillåter leverantörer att genomföra adversariell testning med interna resurser eller genom att anlita kvalificerade externa tredje parter. Artikeln ger särskilt AI-byrån befogenhet att organisera och samordna oberoende adversariell testning av GPAI-modeller med systemrisk, inklusive genom att uppdra sådan testning till betrodda organ. Resultat och metoder måste dokumenteras och göras tillgängliga för AI-byrån på begäran.
Bestämmelserna om AI-modeller för allmänt ändamål, inklusive artikel 55, blev tillämpliga den 2 augusti 2025, tolv månader efter att förordningen trädde i kraft den 1 augusti 2024. Leverantörer som hade lanserat en kvalificerande GPAI-modell på marknaden innan detta datum hade fram till den 2 augusti 2025 på sig att uppnå efterlevnad av skyldigheterna avseende systemrisk.
Bristande efterlevnad av skyldigheterna för GPAI-modeller med systemrisk — inklusive kravet på adversariell testning i artikel 55 — kan medföra administrativa böter på upp till 3 % av den globala årliga omsättningen, eller 15 miljoner EUR, beroende på vilket belopp som är högst. AI-byrån, som har den primära tillsynsmyndigheten över GPAI-leverantörer, kan också utfärda korrigerande åtgärder, begära ytterligare dokumentation eller i allvarliga fall avbryta marknadstillträdet.
Stay ahead of AI Act changes
Get compliance alerts when deadlines or obligations change.
No spam. One-click unsubscribe.