k0nsult.cloud / ai-truth / ipIII / playbook-halucynacja

Playbook I — Halucynacja operacyjna i luka dowodowa

Reagowanie na twierdzenia AI bez pokrycia: halucynacja operacyjna, fałszywy claim, luka dowodowa (GAP). Poziom 2 (incydenty AI/agentowe). To rdzeń doktryny AI Truth — mechanizm, który oddziela fakt od hipotezy, symulacji, narracji i twierdzenia medialnego, i nie pozwala niepotwierdzonemu twierdzeniu awansować do statusu CONFIRMED.

Index A · Phishing B · Ransomware C · DDoS D · Podatności E · Wyciek F · Supply chain G · Prompt injection H · Agent hijack I · Halucynacja J · Deepfake K · AI Act L · Ciągłość

Twierdzenie bez źródła nie jest faktem — jest luką dowodową (GAP). Doktryna: claim ≤ proof.

Halucynacja operacyjna to nie „błąd modelu" w oderwaniu, lecz ryzyko decyzyjne: raport AI wchodzi do procesu bezpieczeństwa jako pewnik, mimo że nie ma pod sobą dowodu. Mechanizm I nie próbuje „uczynić modelu nieomylnym" — wymusza jawne oznaczenie czego nie wiemy i blokuje eskalację niepotwierdzonego twierdzenia.

Problem — pomieszanie warstw twierdzenia

Źródłem incydentu I jest zatarcie różnicy między różnymi rodzajami wypowiedzi, które w surowym tekście wyglądają identycznie. System AI Truth wymusza rozłączność:

Rodzaj	Definicja	Status dowodowy
Fakt	Twierdzenie z powiązanym dowodem pierwotnym	CONFIRMED
Hipoteza	Przypuszczenie, jeszcze nieudowodnione	GAP
Symulacja	Dane demonstracyjne / model, nie zdarzenie realne	SYMULACJA
Narracja	Interpretacja, opis, „historyjka" bez pomiaru	INTERNAL
Twierdzenie medialne	Doniesienie prasowe/publiczne, niezweryfikowane	MEDIA SIGNAL / PUBLIC CLAIM
Sporne	Źródła w konflikcie	DISPUTED

Halucynacja pojawia się, gdy hipoteza, symulacja albo narracja zostaje zaprezentowana jako fakt — a proces bezpieczeństwa podejmuje na jej podstawie decyzję (eskalacja, zamknięcie incydentu, raport do organu).

Rozwiązania — reguły dowodowe AI Truth

Każdy claim ma źródło

Twierdzenie faktowe bez wskazanego źródła nie jest publikowane jako fakt. Źródło = obiekt w Evidence Layer (hash, znacznik czasu).

Brak źródła = GAP

Domyślny status twierdzenia bez dowodu to GAP — czerwony, widoczny, policzalny. Nie „prawdopodobnie prawda".

Źródło pierwotne > wtórne

Log, artefakt, podpis biją cytat z raportu, który cytuje inny raport. Łańcuch źródeł prowadzi do pierwotnego dowodu.

Dashboard % GAP

Odsetek twierdzeń bez pokrycia to wskaźnik ryzyka jakości. Rosnący % GAP = alarm dla Analyst/AI Safety Officer.

Sekcja „czego nie wiemy"

Każdy raport AI zawiera jawną listę luk dowodowych i założeń. Brak tej sekcji = raport odrzucony.

Brak zamknięcia bez dowodu naprawy

Incydentu nie można oznaczyć jako zamknięty bez artefaktu potwierdzającego skuteczną remediację.

Playbook — 7 kroków reakcji

WYKRYJ→GAP→BLOKUJ CONFIRMED→POPROŚ O ŹRÓDŁO→DOWÓD?→STATUS / GAP→WSKAŹNIK RYZYKA

Krok 1 — Wykryj twierdzenie bez dowodu. W raporcie AI, wpisie agenta lub zgłoszeniu pojawia się twierdzenie faktowe (liczba, incydent, przyczyna, „naprawiono") bez powiązanego źródła. Detekcja ręczna (Analyst) lub automatyczna (parser claim ↔ evidence).

Krok 2 — Nadaj status GAP. Twierdzenie otrzymuje status GAP i zostaje jawnie oznaczone w rekordzie. Nie znika, nie jest „miękko" akceptowane — staje się widoczną luką.

Krok 3 — Zablokuj eskalację do CONFIRMED. System uniemożliwia awans GAP → CONFIRMED oraz użycie tego twierdzenia jako podstawy decyzji P0/P1, raportu do organu lub zamknięcia incydentu.

Krok 4 — Poproś o źródło. Do autora (agent / analityk / reporter) kierowane jest żądanie dowodu pierwotnego: log, artefakt, dokument, podpis. Termin zależny od priorytetu twierdzenia.

Krok 5 — Dowód przyszedł? Rozstrzygnij. Jeśli dostarczono dowód pierwotny i przechodzi weryfikację → zmień status na CONFIRMED (lub PUBLIC CLAIM / MEDIA SIGNAL wg rangi źródła). Jeśli źródło jest wtórne lub sprzeczne → odpowiednio niżej / DISPUTED.

Krok 6 — Dowód nie przyszedł? Zostaw GAP. Brak źródła w terminie = twierdzenie pozostaje GAP. Nie usuwamy go i nie „domykamy z rozsądku" — luka jest utrwalona jako element rzetelnego obrazu sytuacji.

Krok 7 — GAP jako wskaźnik ryzyka. Suma i trend GAP zasilają dashboard % GAP oraz ocenę jakości źródła (np. trust score agenta w Playbooku H). Wzrost GAP w obszarze = sygnał, że decyzje opierają się na przypuszczeniach, nie faktach.

Sprzężenia z resztą systemu

Obszar	Rola mechanizmu I
Agent hijack (H)	Raport agenta bez dowodu → GAP → obniżenie trust score; zapora „symulacja → fakt"
Evidence Board	Każdy CONFIRMED musi wskazywać obiekt dowodowy z hashem i znacznikiem czasu
Legal Board / AI Act (K)	Raport do organu nie może zawierać GAP przebranego za fakt; sekcja „czego nie wiemy" obowiązkowa
Response Board	Zamknięcie incydentu wymaga dowodu naprawy — bez niego status pozostaje otwarty

Dlaczego to rdzeń AI Truth: cały portal opiera się na doktrynie claim ≤ proof — żadne twierdzenie nie może być „większe" niż stojący za nim dowód. Playbook I jest wykonawczą realizacją tej doktryny: to on operacyjnie odmawia awansu twierdzeniom bez pokrycia. Szczegóły założeń — patrz Doktryna evidence-first.

Metryki jakości dowodowej SYMULACJA

Dane demonstracyjne (demo). Wartości ilustrują format panelu, nie są rzeczywistymi pomiarami środowiska odbiorcy.

11%

Udział GAP w twierdzeniach SYMULACJA

trend malejący

Awansów GAP → CONFIRMED bez źródła SYMULACJA

zapora szczelna

100%

Raportów z sekcją „czego nie wiemy" SYMULACJA

wymóg formalny

87%

CONFIRMED opartych o źródło pierwotne SYMULACJA

cel ≥ 90%

Powiązane strony

Doktryna evidence-first

Fundament claim ≤ proof i statusy dowodowe. → Doktryna

Evidence Board

Warstwa dowodów: hash, znacznik czasu, źródło. → Evidence Board

Agent hijack

Raporty bez dowodów obniżają trust score agenta. → Playbook H

AI Act

Raport do organu bez GAP przebranego za fakt. → Playbook K

Uwaga metodyczna: reguły dowodowe opisano jako ramkę doktrynalną K0NSULT (INTERNAL), a statusy (CONFIRMED/GAP/SYMULACJA/…) są narzędziem porządkującym, nie orzeczeniem o cudzej wiarygodności. Metryki oznaczone SYMULACJA są przykładowe.