k0nsult.cloud / ai-truth / ipIII / ai-risk-map

AI Risk Map

Katalog ryzyk warstwy 2 modelu K0NSULT: incydenty AI i agentowe. Każde ryzyko opisane z priorytetem reakcji, właściwą flagą AI Act, statusem nadzoru człowieka (human oversight, AI Act art. 14) oraz odnośnikiem do playbooka. Poniżej szybki test kwalifikacji systemu jako high-risk.

Executive Overview Cyber Map AI Risk Map Evidence Board Legal Board Response Board

UWAGA — DANE DEMONSTRACYJNE. Liczby i przykłady incydentów są oznaczone SYMULACJA. Odwołania do AI Act (art. 6/annex III — high-risk, art. 14 — nadzór człowieka, art. 50 — transparentność, art. 73 — zgłaszanie poważnych incydentów) opisują publicznie znaną treść regulacji jako ramkę metodyczną, nie jako ocenę konkretnego podmiotu.

Klas ryzyka AI

warstwa 2 modelu

Zdarzeń AI (7 dni)

SYMULACJA

Z flagą AI_SERIOUS_INCIDENT

potencjalny art. 73

Z wyłączonym/słabym nadzorem

human oversight = ryzyko

Katalog ryzyk AI/agentowych SYMULACJA

Prompt injection

P1AI_ACT_RELEVANT

Wstrzyknięcie instrukcji w dane wejściowe (bezpośrednie lub pośrednie — z dokumentu/strony), które nadpisuje politykę modelu, wyprowadza dane lub wywołuje niepożądane akcje agenta.

Nadzór człowieka: wymagany dla akcji z efektem zewnętrznym (payment, e-mail, zmiana konfiguracji).

→ Playbook: prompt injection

Agent hijack

P0AI_SERIOUS_INCIDENTAI_HIGH_RISK

Przejęcie kontroli nad autonomicznym agentem — nadużycie jego uprawnień (API, tokeny, dostęp do systemów) do działań w imieniu organizacji poza intencją operatora.

Nadzór człowieka: KRYTYCZNY — natychmiastowe odcięcie agenta (kill-switch) wymaga zatwierdzenia AI Safety Officer.

→ Playbook: agent hijack

Data poisoning

P1AI_HIGH_RISK

Zatruwanie danych treningowych / fine-tuningu / bazy RAG w celu wprowadzenia backdoora, biasu lub degradacji jakości modelu. Efekt często ujawnia się z opóźnieniem.

Nadzór człowieka: walidacja źródeł danych i wersjonowanie datasetów (data provenance).

→ AI/Agent Security

Model extraction

P2AI_ACT_RELEVANT

Kradzież modelu przez masowe odpytywanie (query-based extraction) lub wyprowadzenie wag/parametrów — utrata własności intelektualnej i wektor do dalszych ataków offline.

Nadzór człowieka: monitoring wzorców odpytań, rate-limiting, detekcja anomalii.

→ AI/Agent Security

False claim / halucynacja

P1AI_ACT_RELEVANT

Model generuje nieprawdziwą, zmyśloną lub niezweryfikowaną informację prezentowaną jako fakt — ryzyko decyzji na błędnej podstawie, szczególnie w usługach finansowych i doradczych.

Nadzór człowieka: doktryna claim ≤ proof — twierdzenie bez dowodu = status GAP, nie publikacja.

→ Playbook: halucynacja

Deepfake

P1AI_ACT_RELEVANT (art.50)

Syntetyczny głos / wideo / dokument użyty do fraudu (np. „telefon od prezesa"), obejścia weryfikacji tożsamości lub dezinformacji. Art. 50 AI Act: obowiązek oznaczania treści generowanych.

Nadzór człowieka: weryfikacja out-of-band (drugi kanał) przy poleceniach finansowych.

→ Playbook: deepfake

Serious AI incident

P0AI_SERIOUS_INCIDENT

Zdarzenie z udziałem systemu AI powodujące (lub grożące) poważną szkodą: dla zdrowia, praw podstawowych, infrastruktury krytycznej lub mienia. AI Act art. 73 — obowiązek zgłoszenia.

Nadzór człowieka: decyzja Legal/DPO + AI Safety Officer o zgłoszeniu do organu w terminie.

→ Playbook: AI Act / raportowanie

Agent identity risk

P1AI_ACT_RELEVANT

Fałszywa lub niezweryfikowana tożsamość agenta: podszywanie się pod usługę, brak uwierzytelnienia agent-to-agent, agent działający bez przypisanego właściciela/rozliczalności.

Nadzór człowieka: rejestr agentów, przypisany właściciel, uwierzytelnianie (DID/PKI, warstwa PQC).

→ AI/Agent Security

Rozkład zdarzeń AI wg klasy SYMULACJA

Klasa ryzyka	Zdarzeń (demo)	Priorytet bazowy	Flaga AI Act	Nadzór człowieka
Prompt injection	18	P1	AI_ACT_RELEVANT	Wymagany
Agent hijack	9	P0	AI_SERIOUS_INCIDENT	Krytyczny
Halucynacja / false claim	8	P1	AI_ACT_RELEVANT	Wymagany
Deepfake	7	P1	AI_ACT_RELEVANT (art.50)	Wymagany
Data poisoning	5	P1	AI_HIGH_RISK	Wymagany
Model extraction	4	P2	AI_ACT_RELEVANT	Zalecany
Agent identity risk	3	P1	AI_ACT_RELEVANT	Wymagany

Szybki test: czy system jest „high-risk"? ramka AI Act

Wstępny, orientacyjny test kwalifikacji wg logiki AI Act (art. 6 + Aneks III). Nie zastępuje oceny prawnej. Jeśli system spełnia którekolwiek z poniższych i nie mieści się w wyłączeniach — traktuj wstępnie jako high-risk i przejdź do Compliance.

Czy system AI wpływa na którekolwiek z poniższych obszarów?

ocena / scoring osób fizycznych wpływający na ich prawa lub dostęp do usług (np. kredyt, ubezpieczenie),
decyzje o zatrudnieniu, rekrutacji, awansie lub zwolnieniu,
dostęp do edukacji lub ocena kształcenia,
przyznawanie / odmowa świadczeń publicznych i socjalnych,
identyfikacja biometryczna lub kategoryzacja osób,
zarządzanie infrastrukturą krytyczną (energetyka, transport, woda),
zastosowania w organach ścigania, migracji lub wymiarze sprawiedliwości.

Jeśli TAK dla ≥1 pozycji → wstępna klasyfikacja AI_HIGH_RISK. Uruchom obowiązki: zarządzanie ryzykiem, jakość danych, dokumentacja techniczna, logowanie, nadzór człowieka (art. 14), cyberbezpieczeństwo i odporność (art. 15). Terminy i zakres — zweryfikuj z Legal/DPO.

Nadzór człowieka jako miara ryzyka SYMULACJA

System K0NSULT traktuje brak lub osłabienie nadzoru człowieka jako samodzielny czynnik ryzyka — niezależnie od typu zagrożenia. Agent z uprawnieniami do działań nieodwracalnych bez punktu zatwierdzenia = eskalacja priorytetu.

Nadzór aktywny

Człowiek zatwierdza akcje o efekcie zewnętrznym. stan pożądany

Nadzór pasywny

Człowiek widzi log post-factum, nie blokuje. ryzyko średnie

Nadzór wyłączony

Agent działa w pełni autonomicznie na produkcji. ryzyko wysokie

Kill-switch

Możliwość natychmiastowego odcięcia agenta. wymóg dla P0/P1

Zasada. AI Risk Map (warstwa 2) łączy się z Cyber Map (warstwa 1) w Threat Map. Zdarzenie AI z flagą AI_SERIOUS_INCIDENT automatycznie trafia do Legal Board z zegarem art. 73. Klasyfikacja high-risk uruchamia checklistę w Compliance.

Zgłoś incydent AI→Intake→Klasyfikacja + flagi→Playbook AI→Legal (art.73?)