Artikel 55 van Verordening (EU) 2024/1689 — Evaluatie en adversarieel testen van general-purpose AI-modellen met systeemrisico. Officiële tekst, praktische interpretatie, belangrijkste verplichtingen en nalevingsimplicaties.

Samenvatting van de officiële tekst

Artikel 55 van Verordening (EU) 2024/1689 stelt specifieke evaluatie- en adversarieel testverplichtingen vast voor aanbieders van general-purpose AI (GPAI)-modellen die een systeemrisico vormen. Voortbouwend op de bredere reeks verplichtingen uit artikel 53 en de criteria voor de systeemrisicoklassificatie in artikel 51, verplicht artikel 55 dergelijke aanbieders om modelevaluaties uit te voeren in overeenstemming met gestandaardiseerde protocollen, en om adversarieel testen — doorgaans aangeduid als red-teaming — op regelmatige basis uit te voeren.

De evaluaties die vereist zijn op grond van lid 1, onder a), moeten volgen gestandaardiseerde protocollen en hulpmiddelen die de stand van de techniek weerspiegelen, met inbegrip van die welke zijn ontwikkeld of onderschreven door het AI-bureau. Waar geen gestandaardiseerde protocollen bestaan, moeten aanbieders passende methodologieën ontwerpen en toepassen om de aard en omvang van systeemrisico's te identificeren en te beoordelen.

Lid 1, onder b), verplicht tot adversarieel testen, dat intern of door het inschakelen van geaccrediteerde externe experts moet worden uitgevoerd, met als doel het identificeren van risico's die niet worden ondervangen door standaard evaluatieprocedures. Aanbieders moeten de methodologie, reikwijdte en resultaten van zowel evaluaties als adversarieel testen documenteren en significante bevindingen aan het AI-bureau rapporteren. Het AI-bureau zelf behoudt op grond van lid 2 de bevoegdheid om te allen tijde onafhankelijk adversarieel testen te organiseren of op te dragen. Het artikel verplicht aanbieders ook om evaluatieresultaten en testrapporten op verzoek te delen met bevoegde autoriteiten.

Wat dit in de praktijk betekent

Voor organisaties die frontier GPAI-modellen ontwikkelen of inzetten, legt artikel 55 een gestructureerd en gedocumenteerd kwaliteitsboringsproces op dat specifiek gericht is op het identificeren van systeemschade. In de praktijk betekent dit dat aanbieders vóór het uitbrengen van een kwalificerend model — en op doorlopende basis na de uitbrenging — zowel gestandaardiseerde capaciteitsevaluaties als gerichte adversariële oefeningen moeten uitvoeren die zijn ontworpen om te testen op catastrofale of wijdverbreide risico's, zoals manipulatie op massaschaal, het genereren van wapengerelateerde inhoud, grootschalige cyberaanvallen of verstoring van kritieke infrastructuur.

Vanuit operationeel oogpunt vereist naleving het samenstellen of contracteren van multidisciplinaire red-teamcapaciteit met expertise op het gebied van AI-veiligheid, cyberbeveiliging, desinformatie, bioveiligheid en andere relevante domeinen. Evaluaties moeten worden uitgevoerd aan de hand van benchmarks en protocollen die de huidige stand van de techniek weerspiegelen; aanbieders kunnen niet uitsluitend vertrouwen op eigen, niet-gepubliceerde methodologieën als er gestandaardiseerde alternatieven bestaan.

Documentatie is centraal. Aanbieders moeten gedetailleerde verslagen bijhouden van elke evaluatiecyclus — waaronder reikwijdte, teamsamenstelling, geteste scenario's, waargenomen uitvoer en toegepaste risicobeperkingsmaatregelen — en moeten deze verslagen op verzoek aan het AI-bureau kunnen overleggen. Wanneer tests nieuwe of verergerde systeemrisico's aan het licht brengen, zijn aanbieders verplicht corrigerende maatregelen te nemen en, indien het risico ernstig is, het AI-bureau onverwijld te informeren.

Zo moet een aanbieder die een groot multimodaal model uitbrengt dat de trainingsdrempel van 10^25 FLOP overschrijdt, vóór de lancering red-team oefeningen inplannen die minimaal betrekking hebben op: het ontlokken van tweeërlei gebruik van wetenschappelijke kennis, het op grote schaal genereren van overtuigende inhoud, en het faciliteren van geautomatiseerde cyberaanvallen. Na de lancering moeten deze oefeningen worden herhaald wanneer het model significante fine-tuning of capaciteitsupdates ondergaat.

Belangrijkste verplichtingen

Relatie tot andere artikelen

Artikel 55 fungeert als de operationele tegenhanger van de systeemrisicoklassificatie die is vastgesteld in artikel 51 en de algemene GPAI-verplichtingen die zijn uiteengezet in artikel 53. Het moet worden gelezen in samenhang met artikel 52, dat de drempelwaarde en criteria voor de aanwijzing als systeemrisico definieert, en artikel 54, dat betrekking heeft op verplichtingen inzake technische documentatie voor GPAI-modellen met systeemrisico. De incidentmeldingsplicht in artikel 73 kruist artikel 55 waar adversarieel testen een ernstig incident of bijna-incident aan het licht brengt dat melding vereist. Op toezichtsniveau is de bevoegdheid van het AI-bureau om testen op te dragen op grond van artikel 55, lid 2, gegrond in de bredere toezichtsbevoegdheden die zijn verleend door artikelen 88 en 89. Aanbieders dienen ook overweging 110 te raadplegen, waarin de rationale voor het onderscheid tussen systeemrisicomodellen wordt verduidelijkt en het belang van pre-marktveiligheidsevaluatie als aanvulling op doorlopend toezicht.

Nalevingstijdlijn

Artikel 55 is derhalve reeds van kracht. Aanbieders van GPAI-modellen met systeemrisico die nog geen evaluatie- en adversarieel testprogramma's hebben opgezet, handelen in strijd met de huidige verplichtingen en dienen de sanering als een onmiddellijke prioriteit te behandelen.

Official AI Act Compliance Deadline Calendar

Updated · Sources: Regulation (EU) 2024/1689 and the 2026 Digital Omnibus on AI.

Obligation Applies to Original date New date Status Countdown Legal basis
Prohibited Practices (Art. 5) All providers and deployers active AI Act Art. 5
GPAI Rules (Chapter 5) GPAI model providers active AI Act Art. 51-56
High-risk AI — Annex III (standalone) Providers of standalone Annex III systems deferred AI Omnibus 2026 Art. 6(2)
High-risk AI — Annex I (embedded) AI embedded in Annex I regulated products deferred AI Omnibus 2026 Art. 6(1)
AI-Generated Content Marking Providers of generative GPAI systems active AI Act Art. 50(2)
Regulatory Sandboxes National competent authorities active AI Act Art. 57

Download JSON · CC BY 4.0

Frequently Asked Questions

Adversarieel testen, ook bekend als red-teaming, verwijst naar gestructureerde beoordelingen waarbij experts proberen schadelijke, bevooroordeelde of anderszins ongewenste uitvoer uit een general-purpose AI-model te ontlokken. Artikel 55 verplicht aanbieders van GPAI-modellen met systeemrisico om dergelijke tests uit te voeren vóór het op de markt brengen van het model en daarna op doorlopende basis, om ernstige risico's te identificeren en te beperken voordat ze schade veroorzaken.

Artikel 55 is uitsluitend van toepassing op aanbieders van general-purpose AI (GPAI)-modellen waarvan is vastgesteld dat zij een systeemrisico vormen — een aanduiding die, op grond van artikel 51, wordt getriggerd wanneer een model is getraind met een totale rekenkracht van meer dan 10^25 FLOP's, of wanneer de Europese Commissie via andere middelen concludeert dat het model een systeemrisico vormt. Aanbieders van GPAI-modellen onder deze drempelwaarde zijn niet onderworpen aan artikel 55.

Artikel 55 staat aanbieders toe om adversarieel testen uit te voeren met interne middelen of door het inschakelen van gekwalificeerde externe derden. Met name geeft het artikel het AI-bureau de bevoegdheid om onafhankelijk adversarieel testen van GPAI-modellen met systeemrisico te organiseren en te coördineren, ook door dergelijke tests te laten uitvoeren door vertrouwde instanties. Resultaten en methodologieën moeten worden gedocumenteerd en op verzoek beschikbaar worden gesteld aan het AI-bureau.

De bepalingen inzake general-purpose AI-modellen, waaronder artikel 55, zijn van toepassing geworden op 2 augustus 2025, twaalf maanden nadat de Verordening op 1 augustus 2024 in werking is getreden. Aanbieders die vóór die datum een kwalificerend GPAI-model op de markt hadden gebracht, hadden tot 2 augustus 2025 de tijd om te voldoen aan de verplichtingen inzake systeemrisico.

Niet-naleving van de verplichtingen voor GPAI-modellen met systeemrisico — waaronder de vereiste voor adversarieel testen in artikel 55 — kan leiden tot administratieve boetes van maximaal 3% van de wereldwijde jaarlijkse omzet, of EUR 15 miljoen, afhankelijk van welk bedrag hoger is. Het AI-bureau, dat de primaire toezichtsbevoegdheid heeft over GPAI-aanbieders, kan ook corrigerende maatregelen opleggen, aanvullende documentatie opvragen of in ernstige gevallen de markttoegang opschorten.

Stay ahead of AI Act changes

Get compliance alerts when deadlines or obligations change.

No spam. One-click unsubscribe.