Artykuł 55 Rozporządzenia (UE) 2024/1689 — Ocena i testy z negatywnym nastawieniem modeli AI ogólnego przeznaczenia o ryzyku systemowym. Oficjalny tekst, praktyczna interpretacja, kluczowe obowiązki i implikacje dotyczące zgodności.

Podsumowanie oficjalnego tekstu

Artykuł 55 Rozporządzenia (UE) 2024/1689 ustanawia szczegółowe obowiązki dotyczące oceny i testów z negatywnym nastawieniem dla dostawców modeli AI ogólnego przeznaczenia (GPAI), które stwarzają ryzyko systemowe. Bazując na szerszym zbiorze obowiązków określonych w artykule 53 i kryteriach klasyfikacji ryzyka systemowego w artykule 51, artykuł 55 wymaga od takich dostawców przeprowadzania ocen modeli zgodnie ze znormalizowanymi protokołami oraz regularnego przeprowadzania testów z negatywnym nastawieniem — powszechnie określanych jako red-teaming.

Oceny wymagane na podstawie ustępu 1 lit. a) muszą być zgodne ze znormalizowanymi protokołami i narzędziami odzwierciedlającymi stan techniki, w tym tymi opracowanymi lub zatwierdzonymi przez Urząd ds. AI. W przypadku braku znormalizowanych protokołów dostawcy muszą opracować i zastosować odpowiednie metodologie w celu identyfikacji i oceny charakteru oraz zakresu ryzyk systemowych.

Ustęp 1 lit. b) nakazuje przeprowadzanie testów z negatywnym nastawieniem, realizowanych wewnętrznie lub poprzez zaangażowanie akredytowanych zewnętrznych ekspertów, w celu identyfikacji ryzyk nieuwzględnionych przez standardowe procedury oceny. Dostawcy muszą dokumentować metodologię, zakres i wyniki zarówno ocen, jak i ćwiczeń z testami z negatywnym nastawieniem, oraz zgłaszać znaczące wyniki Urzędowi ds. AI. Sam Urząd ds. AI zachowuje na podstawie ustępu 2 uprawnienia do organizowania lub zlecania niezależnych testów z negatywnym nastawieniem w dowolnym czasie. Artykuł zobowiązuje również dostawców do udostępniania wyników ocen i sprawozdań z testów właściwym organom na żądanie.

Co to oznacza w praktyce

Dla organizacji rozwijających lub wdrażających graniczne modele GPAI artykuł 55 nakłada ustrukturyzowany i udokumentowany proces zapewnienia jakości skupiony specjalnie na identyfikacji szkód systemowych. W praktyce oznacza to, że przed udostępnieniem kwalifikującego modelu — i na bieżąco po jego udostępnieniu — dostawcy muszą przeprowadzać zarówno znormalizowane oceny zdolności, jak i ukierunkowane ćwiczenia z negatywnym nastawieniem, zaprojektowane w celu badania katastroficznych lub rozległych ryzyk, takich jak manipulacja na masową skalę, generowanie treści związanych z bronią, wielkoskalowe cyberataki lub zakłócenie infrastruktury krytycznej.

Z operacyjnego punktu widzenia zgodność wymaga zebrania lub zakontraktowania wielodyscyplinarnego potencjału red-team z wiedzą specjalistyczną obejmującą bezpieczeństwo AI, cyberbezpieczeństwo, dezinformację, biobezpieczeństwo i inne odpowiednie dziedziny. Oceny muszą być przeprowadzane w oparciu o benchmarki i protokoły odzwierciedlające aktualny stan techniki; dostawcy nie mogą opierać się wyłącznie na własnych, niepublikowanych metodologiach, jeżeli istnieją znormalizowane alternatywy.

Dokumentacja jest kluczowa. Dostawcy muszą prowadzić szczegółowe rejestry każdego cyklu oceny — w tym zakresu, składu zespołu, testowanych scenariuszy, zaobserwowanych wyników i zastosowanych środków ograniczających — i muszą być w stanie przedstawić te rejestry Urzędowi ds. AI na żądanie. W przypadku gdy testy ujawnią nowe lub zaaostrzone ryzyka systemowe, dostawcy są zobowiązani do wdrożenia środków naprawczych i, jeżeli ryzyko jest poważne, do niezwłocznego powiadomienia Urzędu ds. AI.

Na przykład dostawca udostępniający duży model multimodalny przekraczający próg 10^25 FLOP szkolenia powinien zaplanować ćwiczenia red-team przed uruchomieniem obejmujące co najmniej: wywoływanie wiedzy naukowej o podwójnym zastosowaniu, generowanie perswazyjnych treści na dużą skalę oraz ułatwianie zautomatyzowanych cyberataków. Po uruchomieniu ćwiczenia te muszą być powtarzane za każdym razem, gdy model poddawany jest znaczącemu dostrajaniu lub aktualizacjom zdolności.

Kluczowe obowiązki

Relacja z innymi artykułami

Artykuł 55 funkcjonuje jako operacyjny odpowiednik klasyfikacji ryzyka systemowego ustanowionej w artykule 51 i ogólnych obowiązków GPAI określonych w artykule 53. Należy go czytać łącznie z artykułem 52, który definiuje próg i kryteria wyznaczenia ryzyka systemowego, oraz artykułem 54, który dotyczy obowiązków związanych z dokumentacją techniczną modeli GPAI o ryzyku systemowym. Obowiązek zgłaszania incydentów w artykule 73 przecina się z artykułem 55 tam, gdzie testy z negatywnym nastawieniem ujawniają poważny incydent lub prawie-incydent wymagający powiadomienia. Na poziomie nadzoru uprawnienie Urzędu ds. AI do zlecania testów na podstawie artykułu 55 ust. 2 opiera się na szerszych uprawnieniach nadzorczych przyznanych przez artykuły 88 i 89. Dostawcy powinni również zapoznać się z motywem 110, który wyjaśnia uzasadnienie dla rozróżnienia modeli o ryzyku systemowym i znaczenie oceny bezpieczeństwa przed wprowadzeniem na rynek jako uzupełnienie bieżącego monitorowania.

Harmonogram zgodności

Artykuł 55 jest zatem już w mocy. Dostawcy modeli GPAI o ryzyku systemowym, którzy nie ustanowili jeszcze programów oceny i testów z negatywnym nastawieniem, naruszają bieżące obowiązki i powinni traktować naprawę jako natychmiastowy priorytet.

Official AI Act Compliance Deadline Calendar

Updated · Sources: Regulation (EU) 2024/1689 and the 2026 Digital Omnibus on AI.

Obligation Applies to Original date New date Status Countdown Legal basis
Prohibited Practices (Art. 5) All providers and deployers active AI Act Art. 5
GPAI Rules (Chapter 5) GPAI model providers active AI Act Art. 51-56
High-risk AI — Annex III (standalone) Providers of standalone Annex III systems deferred AI Omnibus 2026 Art. 6(2)
High-risk AI — Annex I (embedded) AI embedded in Annex I regulated products deferred AI Omnibus 2026 Art. 6(1)
AI-Generated Content Marking Providers of generative GPAI systems active AI Act Art. 50(2)
Regulatory Sandboxes National competent authorities active AI Act Art. 57

Download JSON · CC BY 4.0

Frequently Asked Questions

Testy z negatywnym nastawieniem, znane również jako red-teaming, odnoszą się do ustrukturyzowanych ocen, w których eksperci próbują wywołać szkodliwe, stronnicze lub w inny sposób niepożądane wyniki z modelu AI ogólnego przeznaczenia. Artykuł 55 wymaga od dostawców modeli GPAI o ryzyku systemowym przeprowadzania takich testów przed wprowadzeniem modelu na rynek i na bieżąco po jego wprowadzeniu, w celu identyfikacji i ograniczenia poważnych zagrożeń, zanim spowodują szkodę.

Artykuł 55 ma zastosowanie wyłącznie do dostawców modeli AI ogólnego przeznaczenia (GPAI), które zostały uznane za stwarzające ryzyko systemowe — oznaczenie to jest wyzwalane, zgodnie z artykułem 51, gdy model jest trenowany z użyciem łącznej mocy obliczeniowej przekraczającej 10^25 FLOP, lub gdy Komisja Europejska stwierdzi innymi środkami, że model stwarza ryzyko systemowe. Dostawcy modeli GPAI poniżej tego progu nie podlegają artykułowi 55.

Artykuł 55 zezwala dostawcom na przeprowadzanie testów z negatywnym nastawieniem przy użyciu zasobów wewnętrznych lub poprzez zaangażowanie wykwalifikowanych zewnętrznych podmiotów trzecich. Co istotne, artykuł ten uprawnia Urząd ds. AI do organizowania i koordynowania niezależnych testów z negatywnym nastawieniem modeli GPAI o ryzyku systemowym, w tym poprzez zlecanie takich testów zaufanym podmiotom. Wyniki i metodologie muszą być udokumentowane i udostępnione Urzędowi ds. AI na żądanie.

Przepisy regulujące modele AI ogólnego przeznaczenia, w tym artykuł 55, stały się obowiązujące 2 sierpnia 2025 r., dwanaście miesięcy po wejściu Rozporządzenia w życie 1 sierpnia 2024 r. Dostawcy, którzy wprowadzili kwalifikujący model GPAI na rynek przed tą datą, mieli czas do 2 sierpnia 2025 r. na osiągnięcie zgodności z obowiązkami dotyczącymi ryzyka systemowego.

Nieprzestrzeganie obowiązków dotyczących modeli GPAI o ryzyku systemowym — w tym wymogu testów z negatywnym nastawieniem określonego w artykule 55 — może skutkować administracyjnymi karami pieniężnymi w wysokości do 3% globalnego rocznego obrotu lub 15 milionów EUR, w zależności od tego, która kwota jest wyższa. Urząd ds. AI, który sprawuje pierwotny nadzór nad dostawcami GPAI, może również wydawać środki naprawcze, żądać dodatkowej dokumentacji lub zawieszać dostęp do rynku w poważnych przypadkach.

Stay ahead of AI Act changes

Get compliance alerts when deadlines or obligations change.

No spam. One-click unsubscribe.