Člen 55 Uredbe (EU) 2024/1689 — Vrednotenje in adversarialno testiranje modelov umetne inteligence splošnega namena s sistemskim tveganjem. Uradno besedilo, praktična razlaga, ključne obveznosti in posledice za skladnost.

Povzetek uradnega besedila

Člen 55 Uredbe (EU) 2024/1689 določa posebne obveznosti vrednotenja in adversarialnega testiranja za ponudnike modelov umetne inteligence splošnega namena (GPAI), ki predstavljajo sistemsko tveganje. Nadgrajuje širši nabor obveznosti iz člena 53 in merila za klasifikacijo sistemskega tveganja iz člena 51, člen 55 pa od takšnih ponudnikov zahteva, da izvajajo vrednotenja modelov v skladu s standardiziranimi protokoli ter redno izvajajo adversarialno testiranje — ki se pogosto imenuje red-teaming.

Vrednotenja, ki se zahtevajo v skladu z odstavkom 1(a), morajo upoštevati standardizirane protokole in orodja, ki odražajo stanje tehnike, vključno s tistimi, ki jih je razvil ali potrdil Urad za umetno inteligenco. Kadar standardizirani protokoli ne obstajajo, morajo ponudniki oblikovati in uporabljati ustrezne metodologije za ugotavljanje in ocenjevanje narave ter obsega sistemskih tveganj.

Odstavek 1(b) nalaga adversarialno testiranje, ki ga je treba izvajati interno ali z angažiranjem akreditiranih zunanjih strokovnjakov, z namenom ugotavljanja tveganj, ki jih standardni postopki vrednotenja ne zajamejo. Ponudniki morajo dokumentirati metodologijo, obseg in rezultate vrednotenj ter vaj adversarialnega testiranja ter poročati o pomembnih ugotovitvah Uradu za umetno inteligenco. Urad za umetno inteligenco sam ohranja pooblastilo v skladu z odstavkom 2, da kadar koli organizira ali naroči neodvisno adversarialno testiranje. Člen ponudnike tudi zavezuje, da delijo rezultate vrednotenj in poročila o testiranju s pristojnimi organi na zahtevo.

Kaj to pomeni v praksi

Za organizacije, ki razvijajo ali uvajajo mejne modele GPAI, člen 55 nalaga strukturiran in dokumentiran proces zagotavljanja kakovosti, ki je osredotočen posebej na ugotavljanje sistemskih škod. V praksi to pomeni, da morajo ponudniki pred izdajo modela, ki izpolnjuje pogoje — in na tekoči osnovi po izdaji — izvajati tako standardizirana vrednotenja zmogljivosti kot usmerjene adversarialne vaje, zasnovane za sondiranje katastrofalnih ali razširjenih tveganj, kot so manipulacija v masovnem merilu, ustvarjanje vsebine v zvezi z orožjem, obsežni kibernetski napadi ali motnje kritične infrastrukture.

Z operativnega vidika je za skladnost potrebno sestaviti ali pogodbeno zagotoviti multidisciplinarno zmogljivost red-team s strokovnim znanjem s področij varnosti umetne inteligence, kibernetske varnosti, dezinformacij, biološke varnosti in drugih ustreznih področij. Vrednotenja morajo biti izvedena v skladu z merili in protokoli, ki odražajo trenutno stanje tehnike; ponudniki se ne smejo zanašati izključno na lastniške, neobjavljene metodologije, če obstajajo standardizirane alternative.

Dokumentacija je osrednjega pomena. Ponudniki morajo voditi podrobne evidence vsakega cikla vrednotenja — vključno z obsegom, sestavo ekipe, testiranimi scenariji, opaženimi rezultati in uporabljenimi blažitvenimi ukrepi — in morajo biti sposobni predložiti te evidence Uradu za umetno inteligenco na zahtevo. Kadar testiranje razkrije nova ali poslabšana sistemska tveganja, so ponudniki dolžni izvesti korektivne ukrepe in, kadar je tveganje resno, brez nepotrebnega odlašanja obvestiti Urad za umetno inteligenco.

Na primer, ponudnik, ki izdaja velik multimodalni model, ki presega prag 10^25 FLOP usposabljanja, bi moral pred lansiranjem načrtovati vaje red-team, ki pokrivajo vsaj: pridobivanje znanstvenega znanja z dvojno rabo, ustvarjanje prepričljivih vsebin v obsegu in olajšanje avtomatiziranih kibernetskih napadov. Po lansiranju se morajo te vaje ponavljati vsakič, ko model doživi pomembno fino nastavljanje ali posodobitve zmogljivosti.

Ključne obveznosti

Razmerje z drugimi členi

Člen 55 deluje kot operativni dvojnik klasifikacije sistemskega tveganja, določene v členu 51, in splošnih obveznosti GPAI, določenih v členu 53. Brati ga je treba skupaj s členom 52, ki določa prag in merila za določitev sistemskega tveganja, in členom 54, ki obravnava obveznosti v zvezi s tehnično dokumentacijo za modele GPAI s sistemskim tveganjem. Dolžnost poročanja o incidentih iz člena 73 se prepleta s členom 55, kadar adversarialno testiranje odkrije resen incident ali skorajšnji incident, ki zahteva uradno obvestilo. Na nadzorni ravni je pooblastilo Urada za umetno inteligenco za naročanje testiranja v skladu s členom 55(2) utemeljeno na širših nadzornih pooblastilih, podeljenih z členoma 88 in 89. Ponudniki bi morali prav tako pregledati uvodno izjavo 110, ki pojasnjuje razloge za razlikovanje modelov s sistemskim tveganjem in pomen predtržne varnostne ocene kot dopolnila tekočemu nadzoru.

Časovnica skladnosti

Člen 55 je torej že v veljavi. Ponudniki modelov GPAI s sistemskim tveganjem, ki še niso vzpostavili programov vrednotenja in adversarialnega testiranja, kršijo veljavne obveznosti in bi morali sanacijo obravnavati kot takojšnjo prednostno nalogo.

Official AI Act Compliance Deadline Calendar

Updated · Sources: Regulation (EU) 2024/1689 and the 2026 Digital Omnibus on AI.

Obligation Applies to Original date New date Status Countdown Legal basis
Prohibited Practices (Art. 5) All providers and deployers active AI Act Art. 5
GPAI Rules (Chapter 5) GPAI model providers active AI Act Art. 51-56
High-risk AI — Annex III (standalone) Providers of standalone Annex III systems deferred AI Omnibus 2026 Art. 6(2)
High-risk AI — Annex I (embedded) AI embedded in Annex I regulated products deferred AI Omnibus 2026 Art. 6(1)
AI-Generated Content Marking Providers of generative GPAI systems active AI Act Art. 50(2)
Regulatory Sandboxes National competent authorities active AI Act Art. 57

Download JSON · CC BY 4.0

Frequently Asked Questions

Adversarialno testiranje, znano tudi kot red-teaming, se nanaša na strukturirana ocenjevanja, pri katerih strokovnjaki poskušajo iz modela umetne inteligence splošnega namena izvabiti škodljive, pristranske ali drugače nezaželene rezultate. Člen 55 zahteva, da ponudniki modelov GPAI s sistemskim tveganjem izvajajo takšno testiranje pred vnosom modela na trg in na tekoči osnovi po tem, z namenom identifikacije in blažitve resnih tveganj, preden povzročijo škodo.

Člen 55 se nanaša izključno na ponudnike modelov umetne inteligence splošnega namena (GPAI), za katere je bilo ugotovljeno, da predstavljajo sistemsko tveganje — oznaka, ki se v skladu s členom 51 sproži, ko je model usposobljen z uporabo skupne računalniške zmogljivosti več kot 10^25 FLOP, ali ko Evropska komisija z drugimi sredstvi ugotovi, da model predstavlja sistemsko tveganje. Ponudniki modelov GPAI pod tem pragom ne spadajo v področje uporabe člena 55.

Člen 55 ponudnikom dovoljuje izvajanje adversarialnega testiranja z notranjimi viri ali z angažiranjem usposobljenih zunanjih tretjih oseb. Člen zlasti pooblašča Urad za umetno inteligenco, da organizira in usklajuje neodvisno adversarialno testiranje modelov GPAI s sistemskim tveganjem, vključno z naročanjem takšnega testiranja pri zaupanja vrednih organih. Rezultati in metodologije morajo biti dokumentirani in na voljo Uradu za umetno inteligenco na zahtevo.

Določbe, ki urejajo modele umetne inteligence splošnega namena, vključno s členom 55, so postale uporabne 2. avgusta 2025, dvanajst mesecev po tem, ko je Uredba začela veljati 1. avgusta 2024. Ponudniki, ki so pred tem datumom dali na trg model GPAI, ki izpolnjuje pogoje, so imeli čas do 2. avgusta 2025, da dosežejo skladnost z obveznostmi glede sistemskega tveganja.

Neskladnost z obveznostmi za modele GPAI s sistemskim tveganjem — vključno z zahtevo po adversarialnem testiranju iz člena 55 — lahko privede do upravnih glob v višini do 3 % skupnega letnega prometa ali 15 milijonov EUR, kar je višje. Urad za umetno inteligenco, ki ima primarno nadzorno pristojnost nad ponudniki GPAI, lahko izda tudi korektivne ukrepe, zahteva dodatno dokumentacijo ali v resnih primerih začasno ustavi dostop do trga.

Stay ahead of AI Act changes

Get compliance alerts when deadlines or obligations change.

No spam. One-click unsubscribe.