Articolo 55 del Regolamento (UE) 2024/1689 — Valutazione e test avversariali dei modelli di IA per uso generale con rischio sistemico. Testo ufficiale, interpretazione pratica, obblighi fondamentali e implicazioni per la conformità.

Sintesi del testo ufficiale

L'articolo 55 del Regolamento (UE) 2024/1689 stabilisce obblighi specifici di valutazione e test avversariali per i fornitori di modelli di IA per uso generale (GPAI) che presentano un rischio sistemico. Basandosi sull'insieme più ampio di obblighi previsti dall'articolo 53 e sui criteri di classificazione del rischio sistemico dell'articolo 51, l'articolo 55 richiede a tali fornitori di eseguire valutazioni dei modelli in conformità con protocolli standardizzati e di condurre test avversariali — comunemente denominati red-teaming — su base regolare.

Le valutazioni richieste ai sensi del paragrafo 1, lettera a), devono seguire protocolli e strumenti standardizzati che riflettono lo stato dell'arte, inclusi quelli sviluppati o approvati dall'Ufficio per l'IA. Laddove non esistano protocolli standardizzati, i fornitori devono progettare e applicare metodologie appropriate per identificare e valutare la natura e la portata dei rischi sistemici.

Il paragrafo 1, lettera b), impone test avversariali da eseguire internamente o coinvolgendo esperti esterni accreditati, con l'obiettivo di identificare rischi non rilevati dalle procedure di valutazione standard. I fornitori devono documentare la metodologia, la portata e i risultati sia delle valutazioni che degli esercizi di test avversariali, e segnalare i risultati significativi all'Ufficio per l'IA. L'Ufficio per l'IA stesso mantiene l'autorità ai sensi del paragrafo 2 di organizzare o commissionare test avversariali indipendenti in qualsiasi momento. L'articolo obbliga inoltre i fornitori a condividere i risultati delle valutazioni e i rapporti di test con le autorità competenti su richiesta.

Cosa significa in pratica

Per le organizzazioni che sviluppano o implementano modelli GPAI di frontiera, l'articolo 55 impone un processo di garanzia della qualità strutturato e documentato incentrato specificamente sull'identificazione dei danni sistemici. In pratica, ciò significa che prima di rilasciare un modello qualificante — e su base continuativa dopo il rilascio — i fornitori devono eseguire sia valutazioni standardizzate delle capacità che esercizi avversariali mirati progettati per individuare rischi catastrofici o diffusi come la manipolazione su larga scala, la generazione di contenuti legati alle armi, gli attacchi informatici su larga scala o l'interruzione delle infrastrutture critiche.

Dal punto di vista operativo, la conformità richiede di assemblare o contrattare una capacità red-team multidisciplinare con competenze che spaziano dalla sicurezza dell'IA, alla cybersicurezza, alla disinformazione, alla biosicurezza e ad altri domini pertinenti. Le valutazioni devono essere condotte rispetto a benchmark e protocolli che riflettono lo stato attuale dell'arte; i fornitori non possono fare affidamento esclusivamente su metodologie proprietarie e non pubblicate se esistono alternative standardizzate.

La documentazione è centrale. I fornitori devono mantenere registri dettagliati di ogni ciclo di valutazione — inclusi portata, composizione del team, scenari testati, output osservati e misure di mitigazione applicate — e devono essere in grado di produrre tali registri per l'Ufficio per l'IA su richiesta. Laddove il test riveli rischi sistemici nuovi o aggravati, i fornitori sono obbligati ad attuare misure correttive e, laddove il rischio sia grave, a notificare l'Ufficio per l'IA senza ingiustificato ritardo.

Ad esempio, un fornitore che rilascia un grande modello multimodale che supera la soglia di addestramento di 10^25 FLOPs dovrebbe pianificare esercizi di red-team prima del lancio che coprano come minimo: l'elicitazione di conoscenze scientifiche a doppio uso, la generazione di contenuti persuasivi su larga scala e la facilitazione di attacchi informatici automatizzati. Dopo il lancio, questi esercizi devono ripetersi ogni volta che il modello subisce un fine-tuning significativo o aggiornamenti delle capacità.

Obblighi principali

Relazione con altri articoli

L'articolo 55 opera come il corrispettivo operativo della classificazione del rischio sistemico stabilita nell'articolo 51 e degli obblighi generali GPAI previsti dall'articolo 53. Deve essere letto insieme all'articolo 52, che definisce la soglia e i criteri per la designazione del rischio sistemico, e all'articolo 54, che riguarda gli obblighi relativi alla documentazione tecnica per i modelli GPAI con rischio sistemico. L'obbligo di segnalazione degli incidenti dell'articolo 73 si interseca con l'articolo 55 laddove il test avversariale scopre un incidente grave o un quasi-incidente che richiede notifica. A livello di vigilanza, l'autorità dell'Ufficio per l'IA di commissionare test ai sensi dell'articolo 55, paragrafo 2, è fondata sugli ampi poteri di vigilanza conferiti dagli articoli 88 e 89. I fornitori dovrebbero anche consultare il Considerando 110, che chiarisce la logica della distinzione dei modelli a rischio sistemico e l'importanza della valutazione della sicurezza prima dell'immissione sul mercato come complemento al monitoraggio continuativo.

Cronologia della conformità

L'articolo 55 è quindi già in vigore. I fornitori di modelli GPAI con rischio sistemico che non hanno ancora stabilito programmi di valutazione e test avversariali sono in violazione degli obblighi attuali e devono trattare la remediation come una priorità immediata.

Official AI Act Compliance Deadline Calendar

Updated · Sources: Regulation (EU) 2024/1689 and the 2026 Digital Omnibus on AI.

Obligation Applies to Original date New date Status Countdown Legal basis
Prohibited Practices (Art. 5) All providers and deployers active AI Act Art. 5
GPAI Rules (Chapter 5) GPAI model providers active AI Act Art. 51-56
High-risk AI — Annex III (standalone) Providers of standalone Annex III systems deferred AI Omnibus 2026 Art. 6(2)
High-risk AI — Annex I (embedded) AI embedded in Annex I regulated products deferred AI Omnibus 2026 Art. 6(1)
AI-Generated Content Marking Providers of generative GPAI systems active AI Act Art. 50(2)
Regulatory Sandboxes National competent authorities active AI Act Art. 57

Download JSON · CC BY 4.0

Frequently Asked Questions

Il test avversariale, noto anche come red-teaming, si riferisce a valutazioni strutturate in cui esperti tentano di ottenere output dannosi, distorti o altrimenti indesiderabili da un modello di IA per uso generale. L'articolo 55 richiede ai fornitori di modelli GPAI con rischio sistemico di condurre tali test prima di immettere il modello sul mercato e su base continuativa in seguito, al fine di identificare e mitigare rischi gravi prima che causino danni.

L'articolo 55 si applica esclusivamente ai fornitori di modelli di IA per uso generale (GPAI) che sono stati determinati come presentanti un rischio sistemico — una designazione attivata, ai sensi dell'articolo 51, quando un modello viene addestrato utilizzando un calcolo totale superiore a 10^25 FLOPs, o quando la Commissione europea conclude tramite altri mezzi che il modello presenta un rischio sistemico. I fornitori di modelli GPAI al di sotto di questa soglia non sono soggetti all'articolo 55.

L'articolo 55 consente ai fornitori di condurre test avversariali utilizzando risorse interne o coinvolgendo terze parti esterne qualificate. In particolare, l'articolo conferisce all'Ufficio per l'IA il potere di organizzare e coordinare test avversariali indipendenti dei modelli GPAI con rischio sistemico, incluso il commissioning di tali test da organismi fidati. I risultati e le metodologie devono essere documentati e resi disponibili all'Ufficio per l'IA su richiesta.

Le disposizioni che disciplinano i modelli di IA per uso generale, incluso l'articolo 55, sono diventate applicabili il 2 agosto 2025, dodici mesi dopo che il Regolamento è entrato in vigore il 1° agosto 2024. I fornitori che avevano immesso un modello GPAI qualificante sul mercato prima di quella data erano tenuti a raggiungere la conformità con gli obblighi di rischio sistemico entro il 2 agosto 2025.

La non conformità agli obblighi per i modelli GPAI con rischio sistemico — incluso il requisito di test avversariale dell'articolo 55 — può comportare sanzioni amministrative fino al 3% del fatturato annuo globale, o 15 milioni di EUR, a seconda di quale sia maggiore. L'Ufficio per l'IA, che ha la principale autorità di vigilanza sui fornitori GPAI, può anche emettere misure correttive, richiedere documentazione aggiuntiva o sospendere l'accesso al mercato nei casi gravi.

Stay ahead of AI Act changes

Get compliance alerts when deadlines or obligations change.

No spam. One-click unsubscribe.