Articolo 55 del Regolamento (UE) 2024/1689 — Valutazione e test avversariali dei modelli di IA per uso generale con rischio sistemico. Testo ufficiale, interpretazione pratica, obblighi fondamentali e implicazioni per la conformità.
Sintesi del testo ufficiale
L'articolo 55 del Regolamento (UE) 2024/1689 stabilisce obblighi specifici di valutazione e test avversariali per i fornitori di modelli di IA per uso generale (GPAI) che presentano un rischio sistemico. Basandosi sull'insieme più ampio di obblighi previsti dall'articolo 53 e sui criteri di classificazione del rischio sistemico dell'articolo 51, l'articolo 55 richiede a tali fornitori di eseguire valutazioni dei modelli in conformità con protocolli standardizzati e di condurre test avversariali — comunemente denominati red-teaming — su base regolare.
Le valutazioni richieste ai sensi del paragrafo 1, lettera a), devono seguire protocolli e strumenti standardizzati che riflettono lo stato dell'arte, inclusi quelli sviluppati o approvati dall'Ufficio per l'IA. Laddove non esistano protocolli standardizzati, i fornitori devono progettare e applicare metodologie appropriate per identificare e valutare la natura e la portata dei rischi sistemici.
Il paragrafo 1, lettera b), impone test avversariali da eseguire internamente o coinvolgendo esperti esterni accreditati, con l'obiettivo di identificare rischi non rilevati dalle procedure di valutazione standard. I fornitori devono documentare la metodologia, la portata e i risultati sia delle valutazioni che degli esercizi di test avversariali, e segnalare i risultati significativi all'Ufficio per l'IA. L'Ufficio per l'IA stesso mantiene l'autorità ai sensi del paragrafo 2 di organizzare o commissionare test avversariali indipendenti in qualsiasi momento. L'articolo obbliga inoltre i fornitori a condividere i risultati delle valutazioni e i rapporti di test con le autorità competenti su richiesta.
Cosa significa in pratica
Per le organizzazioni che sviluppano o implementano modelli GPAI di frontiera, l'articolo 55 impone un processo di garanzia della qualità strutturato e documentato incentrato specificamente sull'identificazione dei danni sistemici. In pratica, ciò significa che prima di rilasciare un modello qualificante — e su base continuativa dopo il rilascio — i fornitori devono eseguire sia valutazioni standardizzate delle capacità che esercizi avversariali mirati progettati per individuare rischi catastrofici o diffusi come la manipolazione su larga scala, la generazione di contenuti legati alle armi, gli attacchi informatici su larga scala o l'interruzione delle infrastrutture critiche.
Dal punto di vista operativo, la conformità richiede di assemblare o contrattare una capacità red-team multidisciplinare con competenze che spaziano dalla sicurezza dell'IA, alla cybersicurezza, alla disinformazione, alla biosicurezza e ad altri domini pertinenti. Le valutazioni devono essere condotte rispetto a benchmark e protocolli che riflettono lo stato attuale dell'arte; i fornitori non possono fare affidamento esclusivamente su metodologie proprietarie e non pubblicate se esistono alternative standardizzate.
La documentazione è centrale. I fornitori devono mantenere registri dettagliati di ogni ciclo di valutazione — inclusi portata, composizione del team, scenari testati, output osservati e misure di mitigazione applicate — e devono essere in grado di produrre tali registri per l'Ufficio per l'IA su richiesta. Laddove il test riveli rischi sistemici nuovi o aggravati, i fornitori sono obbligati ad attuare misure correttive e, laddove il rischio sia grave, a notificare l'Ufficio per l'IA senza ingiustificato ritardo.
Ad esempio, un fornitore che rilascia un grande modello multimodale che supera la soglia di addestramento di 10^25 FLOPs dovrebbe pianificare esercizi di red-team prima del lancio che coprano come minimo: l'elicitazione di conoscenze scientifiche a doppio uso, la generazione di contenuti persuasivi su larga scala e la facilitazione di attacchi informatici automatizzati. Dopo il lancio, questi esercizi devono ripetersi ogni volta che il modello subisce un fine-tuning significativo o aggiornamenti delle capacità.
Obblighi principali
- Valutazioni standardizzate: Condurre valutazioni dei modelli utilizzando protocolli e strumenti standardizzati all'avanguardia, inclusi quelli sviluppati o approvati dall'Ufficio per l'IA, prima dell'immissione sul mercato e su base continuativa.
- Test avversariali (red-teaming): Eseguire esercizi di test avversariali strutturati — internamente o tramite terze parti esterne qualificate — progettati per far emergere rischi sistemici non identificati attraverso la valutazione standard.
- Documentazione e tenuta dei registri: Mantenere registri dettagliati della metodologia di valutazione, della portata, degli scenari testati, dei risultati e di eventuali misure correttive adottate, con i registri disponibili all'Ufficio per l'IA su richiesta.
- Segnalazione di risultati significativi: Notificare all'Ufficio per l'IA i rischi sistemici gravi o di nuova identificazione scoperti attraverso valutazioni o test avversariali senza ingiustificato ritardo.
- Cooperazione con i test commissionati dall'Ufficio per l'IA: Facilitare e cooperare con i test avversariali indipendenti organizzati o commissionati direttamente dall'Ufficio per l'IA nell'ambito dei suoi poteri di vigilanza.
- Conformità continuativa post-rilascio: Ripetere valutazioni e test avversariali a seguito di aggiornamenti significativi del modello, fine-tuning o modifiche ai casi d'uso previsti che possono alterare il profilo di rischio del modello.
Relazione con altri articoli
L'articolo 55 opera come il corrispettivo operativo della classificazione del rischio sistemico stabilita nell'articolo 51 e degli obblighi generali GPAI previsti dall'articolo 53. Deve essere letto insieme all'articolo 52, che definisce la soglia e i criteri per la designazione del rischio sistemico, e all'articolo 54, che riguarda gli obblighi relativi alla documentazione tecnica per i modelli GPAI con rischio sistemico. L'obbligo di segnalazione degli incidenti dell'articolo 73 si interseca con l'articolo 55 laddove il test avversariale scopre un incidente grave o un quasi-incidente che richiede notifica. A livello di vigilanza, l'autorità dell'Ufficio per l'IA di commissionare test ai sensi dell'articolo 55, paragrafo 2, è fondata sugli ampi poteri di vigilanza conferiti dagli articoli 88 e 89. I fornitori dovrebbero anche consultare il Considerando 110, che chiarisce la logica della distinzione dei modelli a rischio sistemico e l'importanza della valutazione della sicurezza prima dell'immissione sul mercato come complemento al monitoraggio continuativo.
Cronologia della conformità
- 1° agosto 2024 — Il Regolamento (UE) 2024/1689 è entrato in vigore, avviando il calendario di applicazione graduale.
- 2 febbraio 2025 — Le pratiche di IA vietate (Titolo II) sono diventate applicabili.
- 2 agosto 2025 — Le disposizioni del Titolo V che disciplinano i modelli di IA per uso generale, incluso l'articolo 55, sono diventate pienamente applicabili. I fornitori di modelli GPAI qualificanti già sul mercato erano tenuti a raggiungere la conformità entro questa data.
- 2 dicembre 2026 — Gli obblighi per i sistemi di IA ad alto rischio ai sensi dell'Allegato I (sistemi di componenti di sicurezza) diventano applicabili.
- 2 agosto 2027 — I restanti obblighi per i sistemi di IA ad alto rischio (sistemi dell'Allegato III) diventano applicabili.
L'articolo 55 è quindi già in vigore. I fornitori di modelli GPAI con rischio sistemico che non hanno ancora stabilito programmi di valutazione e test avversariali sono in violazione degli obblighi attuali e devono trattare la remediation come una priorità immediata.
Official AI Act Compliance Deadline Calendar
Updated · Sources: Regulation (EU) 2024/1689 and the 2026 Digital Omnibus on AI.
| Obligation | Applies to | Original date | New date | Status | Countdown | Legal basis |
|---|---|---|---|---|---|---|
| Prohibited Practices (Art. 5) | All providers and deployers | active | — | AI Act Art. 5 | ||
| GPAI Rules (Chapter 5) | GPAI model providers | active | — | AI Act Art. 51-56 | ||
| High-risk AI — Annex III (standalone) | Providers of standalone Annex III systems | deferred | — | AI Omnibus 2026 Art. 6(2) | ||
| High-risk AI — Annex I (embedded) | AI embedded in Annex I regulated products | deferred | — | AI Omnibus 2026 Art. 6(1) | ||
| AI-Generated Content Marking | Providers of generative GPAI systems | active | — | AI Act Art. 50(2) | ||
| Regulatory Sandboxes | National competent authorities | active | — | AI Act Art. 57 |
⬇ Download JSON · CC BY 4.0
AI Act meets DORA and NIS2
Is your organisation subject to both the AI Act and DORA? The two regulations intersect on the operational resilience of financial AI systems. Our sister site regulation-dora.eu covers DORA in depth.
Explore regulation-dora.eu ↗Frequently Asked Questions
Il test avversariale, noto anche come red-teaming, si riferisce a valutazioni strutturate in cui esperti tentano di ottenere output dannosi, distorti o altrimenti indesiderabili da un modello di IA per uso generale. L'articolo 55 richiede ai fornitori di modelli GPAI con rischio sistemico di condurre tali test prima di immettere il modello sul mercato e su base continuativa in seguito, al fine di identificare e mitigare rischi gravi prima che causino danni.
L'articolo 55 si applica esclusivamente ai fornitori di modelli di IA per uso generale (GPAI) che sono stati determinati come presentanti un rischio sistemico — una designazione attivata, ai sensi dell'articolo 51, quando un modello viene addestrato utilizzando un calcolo totale superiore a 10^25 FLOPs, o quando la Commissione europea conclude tramite altri mezzi che il modello presenta un rischio sistemico. I fornitori di modelli GPAI al di sotto di questa soglia non sono soggetti all'articolo 55.
L'articolo 55 consente ai fornitori di condurre test avversariali utilizzando risorse interne o coinvolgendo terze parti esterne qualificate. In particolare, l'articolo conferisce all'Ufficio per l'IA il potere di organizzare e coordinare test avversariali indipendenti dei modelli GPAI con rischio sistemico, incluso il commissioning di tali test da organismi fidati. I risultati e le metodologie devono essere documentati e resi disponibili all'Ufficio per l'IA su richiesta.
Le disposizioni che disciplinano i modelli di IA per uso generale, incluso l'articolo 55, sono diventate applicabili il 2 agosto 2025, dodici mesi dopo che il Regolamento è entrato in vigore il 1° agosto 2024. I fornitori che avevano immesso un modello GPAI qualificante sul mercato prima di quella data erano tenuti a raggiungere la conformità con gli obblighi di rischio sistemico entro il 2 agosto 2025.
La non conformità agli obblighi per i modelli GPAI con rischio sistemico — incluso il requisito di test avversariale dell'articolo 55 — può comportare sanzioni amministrative fino al 3% del fatturato annuo globale, o 15 milioni di EUR, a seconda di quale sia maggiore. L'Ufficio per l'IA, che ha la principale autorità di vigilanza sui fornitori GPAI, può anche emettere misure correttive, richiedere documentazione aggiuntiva o sospendere l'accesso al mercato nei casi gravi.
Stay ahead of AI Act changes
Get compliance alerts when deadlines or obligations change.
No spam. One-click unsubscribe.