Artikel 55 van Verordening (EU) 2024/1689 — Evaluatie en adversarieel testen van general-purpose AI-modellen met systeemrisico. Officiële tekst, praktische interpretatie, belangrijkste verplichtingen en nalevingsimplicaties.
Samenvatting van de officiële tekst
Artikel 55 van Verordening (EU) 2024/1689 stelt specifieke evaluatie- en adversarieel testverplichtingen vast voor aanbieders van general-purpose AI (GPAI)-modellen die een systeemrisico vormen. Voortbouwend op de bredere reeks verplichtingen uit artikel 53 en de criteria voor de systeemrisicoklassificatie in artikel 51, verplicht artikel 55 dergelijke aanbieders om modelevaluaties uit te voeren in overeenstemming met gestandaardiseerde protocollen, en om adversarieel testen — doorgaans aangeduid als red-teaming — op regelmatige basis uit te voeren.
De evaluaties die vereist zijn op grond van lid 1, onder a), moeten volgen gestandaardiseerde protocollen en hulpmiddelen die de stand van de techniek weerspiegelen, met inbegrip van die welke zijn ontwikkeld of onderschreven door het AI-bureau. Waar geen gestandaardiseerde protocollen bestaan, moeten aanbieders passende methodologieën ontwerpen en toepassen om de aard en omvang van systeemrisico's te identificeren en te beoordelen.
Lid 1, onder b), verplicht tot adversarieel testen, dat intern of door het inschakelen van geaccrediteerde externe experts moet worden uitgevoerd, met als doel het identificeren van risico's die niet worden ondervangen door standaard evaluatieprocedures. Aanbieders moeten de methodologie, reikwijdte en resultaten van zowel evaluaties als adversarieel testen documenteren en significante bevindingen aan het AI-bureau rapporteren. Het AI-bureau zelf behoudt op grond van lid 2 de bevoegdheid om te allen tijde onafhankelijk adversarieel testen te organiseren of op te dragen. Het artikel verplicht aanbieders ook om evaluatieresultaten en testrapporten op verzoek te delen met bevoegde autoriteiten.
Wat dit in de praktijk betekent
Voor organisaties die frontier GPAI-modellen ontwikkelen of inzetten, legt artikel 55 een gestructureerd en gedocumenteerd kwaliteitsboringsproces op dat specifiek gericht is op het identificeren van systeemschade. In de praktijk betekent dit dat aanbieders vóór het uitbrengen van een kwalificerend model — en op doorlopende basis na de uitbrenging — zowel gestandaardiseerde capaciteitsevaluaties als gerichte adversariële oefeningen moeten uitvoeren die zijn ontworpen om te testen op catastrofale of wijdverbreide risico's, zoals manipulatie op massaschaal, het genereren van wapengerelateerde inhoud, grootschalige cyberaanvallen of verstoring van kritieke infrastructuur.
Vanuit operationeel oogpunt vereist naleving het samenstellen of contracteren van multidisciplinaire red-teamcapaciteit met expertise op het gebied van AI-veiligheid, cyberbeveiliging, desinformatie, bioveiligheid en andere relevante domeinen. Evaluaties moeten worden uitgevoerd aan de hand van benchmarks en protocollen die de huidige stand van de techniek weerspiegelen; aanbieders kunnen niet uitsluitend vertrouwen op eigen, niet-gepubliceerde methodologieën als er gestandaardiseerde alternatieven bestaan.
Documentatie is centraal. Aanbieders moeten gedetailleerde verslagen bijhouden van elke evaluatiecyclus — waaronder reikwijdte, teamsamenstelling, geteste scenario's, waargenomen uitvoer en toegepaste risicobeperkingsmaatregelen — en moeten deze verslagen op verzoek aan het AI-bureau kunnen overleggen. Wanneer tests nieuwe of verergerde systeemrisico's aan het licht brengen, zijn aanbieders verplicht corrigerende maatregelen te nemen en, indien het risico ernstig is, het AI-bureau onverwijld te informeren.
Zo moet een aanbieder die een groot multimodaal model uitbrengt dat de trainingsdrempel van 10^25 FLOP overschrijdt, vóór de lancering red-team oefeningen inplannen die minimaal betrekking hebben op: het ontlokken van tweeërlei gebruik van wetenschappelijke kennis, het op grote schaal genereren van overtuigende inhoud, en het faciliteren van geautomatiseerde cyberaanvallen. Na de lancering moeten deze oefeningen worden herhaald wanneer het model significante fine-tuning of capaciteitsupdates ondergaat.
Belangrijkste verplichtingen
- Gestandaardiseerde evaluaties: Voer modelevaluaties uit met behulp van state-of-the-art gestandaardiseerde protocollen en hulpmiddelen, waaronder die welke zijn ontwikkeld of onderschreven door het AI-bureau, vóór marktplaatsing en op doorlopende basis.
- Adversarieel testen (red-teaming): Voer gestructureerde adversariële testen uit — intern of via gekwalificeerde externe derden — die zijn ontworpen om systeemrisico's aan het licht te brengen die niet worden geïdentificeerd door standaardevaluatie.
- Documentatie en registratie: Houd gedetailleerde verslagen bij van de evaluatiemethodologie, reikwijdte, geteste scenario's, uitkomsten en eventuele genomen corrigerende maatregelen, met verslagen beschikbaar voor het AI-bureau op verzoek.
- Rapportage van significante bevindingen: Stel het AI-bureau onverwijld op de hoogte van ernstige of nieuw geïdentificeerde systeemrisico's die zijn ontdekt via evaluaties of adversarieel testen.
- Samenwerking met door het AI-bureau opgedragen testen: Faciliteer en werk mee aan onafhankelijk adversarieel testen dat direct door het AI-bureau wordt georganiseerd of opgedragen in het kader van zijn toezichtsbevoegdheden.
- Doorlopende naleving na de uitbrenging: Herhaal evaluaties en adversarieel testen na significante modelupdates, fine-tuning of wijzigingen in beoogde gebruiksscenario's die het risicoprofiel van het model kunnen veranderen.
Relatie tot andere artikelen
Artikel 55 fungeert als de operationele tegenhanger van de systeemrisicoklassificatie die is vastgesteld in artikel 51 en de algemene GPAI-verplichtingen die zijn uiteengezet in artikel 53. Het moet worden gelezen in samenhang met artikel 52, dat de drempelwaarde en criteria voor de aanwijzing als systeemrisico definieert, en artikel 54, dat betrekking heeft op verplichtingen inzake technische documentatie voor GPAI-modellen met systeemrisico. De incidentmeldingsplicht in artikel 73 kruist artikel 55 waar adversarieel testen een ernstig incident of bijna-incident aan het licht brengt dat melding vereist. Op toezichtsniveau is de bevoegdheid van het AI-bureau om testen op te dragen op grond van artikel 55, lid 2, gegrond in de bredere toezichtsbevoegdheden die zijn verleend door artikelen 88 en 89. Aanbieders dienen ook overweging 110 te raadplegen, waarin de rationale voor het onderscheid tussen systeemrisicomodellen wordt verduidelijkt en het belang van pre-marktveiligheidsevaluatie als aanvulling op doorlopend toezicht.
Nalevingstijdlijn
- 1 augustus 2024 — Verordening (EU) 2024/1689 is in werking getreden, waarmee de gefaseerde toepassingsklok is gestart.
- 2 februari 2025 — Verboden AI-praktijken (Titel II) zijn van toepassing geworden.
- 2 augustus 2025 — Titel V-bepalingen inzake general-purpose AI-modellen, waaronder artikel 55, zijn volledig van toepassing geworden. Aanbieders van kwalificerende GPAI-modellen die al op de markt waren, waren verplicht om op deze datum aan de nalevingsvereisten te voldoen.
- 2 december 2026 — Verplichtingen voor hoog-risico AI-systemen op grond van bijlage I (veiligheidscomponentsystemen) worden van toepassing.
- 2 augustus 2027 — Resterende verplichtingen voor hoog-risico AI-systemen (bijlage III-systemen) worden van toepassing.
Artikel 55 is derhalve reeds van kracht. Aanbieders van GPAI-modellen met systeemrisico die nog geen evaluatie- en adversarieel testprogramma's hebben opgezet, handelen in strijd met de huidige verplichtingen en dienen de sanering als een onmiddellijke prioriteit te behandelen.
Official AI Act Compliance Deadline Calendar
Updated · Sources: Regulation (EU) 2024/1689 and the 2026 Digital Omnibus on AI.
| Obligation | Applies to | Original date | New date | Status | Countdown | Legal basis |
|---|---|---|---|---|---|---|
| Prohibited Practices (Art. 5) | All providers and deployers | active | — | AI Act Art. 5 | ||
| GPAI Rules (Chapter 5) | GPAI model providers | active | — | AI Act Art. 51-56 | ||
| High-risk AI — Annex III (standalone) | Providers of standalone Annex III systems | deferred | — | AI Omnibus 2026 Art. 6(2) | ||
| High-risk AI — Annex I (embedded) | AI embedded in Annex I regulated products | deferred | — | AI Omnibus 2026 Art. 6(1) | ||
| AI-Generated Content Marking | Providers of generative GPAI systems | active | — | AI Act Art. 50(2) | ||
| Regulatory Sandboxes | National competent authorities | active | — | AI Act Art. 57 |
⬇ Download JSON · CC BY 4.0
AI Act meets DORA and NIS2
Is your organisation subject to both the AI Act and DORA? The two regulations intersect on the operational resilience of financial AI systems. Our sister site regulation-dora.eu covers DORA in depth.
Explore regulation-dora.eu ↗Frequently Asked Questions
Adversarieel testen, ook bekend als red-teaming, verwijst naar gestructureerde beoordelingen waarbij experts proberen schadelijke, bevooroordeelde of anderszins ongewenste uitvoer uit een general-purpose AI-model te ontlokken. Artikel 55 verplicht aanbieders van GPAI-modellen met systeemrisico om dergelijke tests uit te voeren vóór het op de markt brengen van het model en daarna op doorlopende basis, om ernstige risico's te identificeren en te beperken voordat ze schade veroorzaken.
Artikel 55 is uitsluitend van toepassing op aanbieders van general-purpose AI (GPAI)-modellen waarvan is vastgesteld dat zij een systeemrisico vormen — een aanduiding die, op grond van artikel 51, wordt getriggerd wanneer een model is getraind met een totale rekenkracht van meer dan 10^25 FLOP's, of wanneer de Europese Commissie via andere middelen concludeert dat het model een systeemrisico vormt. Aanbieders van GPAI-modellen onder deze drempelwaarde zijn niet onderworpen aan artikel 55.
Artikel 55 staat aanbieders toe om adversarieel testen uit te voeren met interne middelen of door het inschakelen van gekwalificeerde externe derden. Met name geeft het artikel het AI-bureau de bevoegdheid om onafhankelijk adversarieel testen van GPAI-modellen met systeemrisico te organiseren en te coördineren, ook door dergelijke tests te laten uitvoeren door vertrouwde instanties. Resultaten en methodologieën moeten worden gedocumenteerd en op verzoek beschikbaar worden gesteld aan het AI-bureau.
De bepalingen inzake general-purpose AI-modellen, waaronder artikel 55, zijn van toepassing geworden op 2 augustus 2025, twaalf maanden nadat de Verordening op 1 augustus 2024 in werking is getreden. Aanbieders die vóór die datum een kwalificerend GPAI-model op de markt hadden gebracht, hadden tot 2 augustus 2025 de tijd om te voldoen aan de verplichtingen inzake systeemrisico.
Niet-naleving van de verplichtingen voor GPAI-modellen met systeemrisico — waaronder de vereiste voor adversarieel testen in artikel 55 — kan leiden tot administratieve boetes van maximaal 3% van de wereldwijde jaarlijkse omzet, of EUR 15 miljoen, afhankelijk van welk bedrag hoger is. Het AI-bureau, dat de primaire toezichtsbevoegdheid heeft over GPAI-aanbieders, kan ook corrigerende maatregelen opleggen, aanvullende documentatie opvragen of in ernstige gevallen de markttoegang opschorten.
Stay ahead of AI Act changes
Get compliance alerts when deadlines or obligations change.
No spam. One-click unsubscribe.