k0nsult.cloud / ai-truth / ipIII / playbook-halucynacja
Playbook I — Halucynacja operacyjna i luka dowodowa
Reagowanie na twierdzenia AI bez pokrycia: halucynacja operacyjna, fałszywy claim, luka dowodowa (GAP). Poziom 2 (incydenty AI/agentowe). To rdzeń doktryny AI Truth — mechanizm, który oddziela fakt od hipotezy, symulacji, narracji i twierdzenia medialnego, i nie pozwala niepotwierdzonemu twierdzeniu awansować do statusu CONFIRMED.
Twierdzenie bez źródła nie jest faktem — jest luką dowodową (GAP). Doktryna: claim ≤ proof.
Halucynacja operacyjna to nie „błąd modelu" w oderwaniu, lecz ryzyko decyzyjne: raport AI wchodzi do procesu bezpieczeństwa jako pewnik, mimo że nie ma pod sobą dowodu. Mechanizm I nie próbuje „uczynić modelu nieomylnym" — wymusza jawne oznaczenie czego nie wiemy i blokuje eskalację niepotwierdzonego twierdzenia.
Problem — pomieszanie warstw twierdzenia
Źródłem incydentu I jest zatarcie różnicy między różnymi rodzajami wypowiedzi, które w surowym tekście wyglądają identycznie. System AI Truth wymusza rozłączność:
| Rodzaj | Definicja | Status dowodowy |
| Fakt | Twierdzenie z powiązanym dowodem pierwotnym | CONFIRMED |
| Hipoteza | Przypuszczenie, jeszcze nieudowodnione | GAP |
| Symulacja | Dane demonstracyjne / model, nie zdarzenie realne | SYMULACJA |
| Narracja | Interpretacja, opis, „historyjka" bez pomiaru | INTERNAL |
| Twierdzenie medialne | Doniesienie prasowe/publiczne, niezweryfikowane | MEDIA SIGNAL / PUBLIC CLAIM |
| Sporne | Źródła w konflikcie | DISPUTED |
Halucynacja pojawia się, gdy hipoteza, symulacja albo narracja zostaje zaprezentowana jako fakt — a proces bezpieczeństwa podejmuje na jej podstawie decyzję (eskalacja, zamknięcie incydentu, raport do organu).
Rozwiązania — reguły dowodowe AI Truth
Każdy claim ma źródło
Twierdzenie faktowe bez wskazanego źródła nie jest publikowane jako fakt. Źródło = obiekt w Evidence Layer (hash, znacznik czasu).
Brak źródła = GAP
Domyślny status twierdzenia bez dowodu to GAP — czerwony, widoczny, policzalny. Nie „prawdopodobnie prawda".
Źródło pierwotne > wtórne
Log, artefakt, podpis biją cytat z raportu, który cytuje inny raport. Łańcuch źródeł prowadzi do pierwotnego dowodu.
Dashboard % GAP
Odsetek twierdzeń bez pokrycia to wskaźnik ryzyka jakości. Rosnący % GAP = alarm dla Analyst/AI Safety Officer.
Sekcja „czego nie wiemy"
Każdy raport AI zawiera jawną listę luk dowodowych i założeń. Brak tej sekcji = raport odrzucony.
Brak zamknięcia bez dowodu naprawy
Incydentu nie można oznaczyć jako zamknięty bez artefaktu potwierdzającego skuteczną remediację.
Playbook — 7 kroków reakcji
WYKRYJ→GAP→BLOKUJ CONFIRMED→POPROŚ O ŹRÓDŁO→DOWÓD?→STATUS / GAP→WSKAŹNIK RYZYKA
Krok 1 — Wykryj twierdzenie bez dowodu. W raporcie AI, wpisie agenta lub zgłoszeniu pojawia się twierdzenie faktowe (liczba, incydent, przyczyna, „naprawiono") bez powiązanego źródła. Detekcja ręczna (Analyst) lub automatyczna (parser claim ↔ evidence).
Krok 2 — Nadaj status GAP. Twierdzenie otrzymuje status GAP i zostaje jawnie oznaczone w rekordzie. Nie znika, nie jest „miękko" akceptowane — staje się widoczną luką.
Krok 3 — Zablokuj eskalację do CONFIRMED. System uniemożliwia awans GAP → CONFIRMED oraz użycie tego twierdzenia jako podstawy decyzji P0/P1, raportu do organu lub zamknięcia incydentu.
Krok 4 — Poproś o źródło. Do autora (agent / analityk / reporter) kierowane jest żądanie dowodu pierwotnego: log, artefakt, dokument, podpis. Termin zależny od priorytetu twierdzenia.
Krok 5 — Dowód przyszedł? Rozstrzygnij. Jeśli dostarczono dowód pierwotny i przechodzi weryfikację → zmień status na CONFIRMED (lub PUBLIC CLAIM / MEDIA SIGNAL wg rangi źródła). Jeśli źródło jest wtórne lub sprzeczne → odpowiednio niżej / DISPUTED.
Krok 6 — Dowód nie przyszedł? Zostaw GAP. Brak źródła w terminie = twierdzenie pozostaje GAP. Nie usuwamy go i nie „domykamy z rozsądku" — luka jest utrwalona jako element rzetelnego obrazu sytuacji.
Krok 7 — GAP jako wskaźnik ryzyka. Suma i trend GAP zasilają dashboard % GAP oraz ocenę jakości źródła (np. trust score agenta w
Playbooku H). Wzrost GAP w obszarze = sygnał, że decyzje opierają się na przypuszczeniach, nie faktach.
Sprzężenia z resztą systemu
| Obszar | Rola mechanizmu I |
| Agent hijack (H) | Raport agenta bez dowodu → GAP → obniżenie trust score; zapora „symulacja → fakt" |
| Evidence Board | Każdy CONFIRMED musi wskazywać obiekt dowodowy z hashem i znacznikiem czasu |
| Legal Board / AI Act (K) | Raport do organu nie może zawierać GAP przebranego za fakt; sekcja „czego nie wiemy" obowiązkowa |
| Response Board | Zamknięcie incydentu wymaga dowodu naprawy — bez niego status pozostaje otwarty |
Dlaczego to rdzeń AI Truth: cały portal opiera się na doktrynie
claim ≤ proof — żadne twierdzenie nie może być „większe" niż stojący za nim dowód. Playbook I jest wykonawczą realizacją tej doktryny: to on operacyjnie odmawia awansu twierdzeniom bez pokrycia. Szczegóły założeń — patrz
Doktryna evidence-first.
Metryki jakości dowodowej SYMULACJA
Dane demonstracyjne (demo). Wartości ilustrują format panelu, nie są rzeczywistymi pomiarami środowiska odbiorcy.
11%
Udział GAP w twierdzeniach SYMULACJA
trend malejący
0
Awansów GAP → CONFIRMED bez źródła SYMULACJA
zapora szczelna
100%
Raportów z sekcją „czego nie wiemy" SYMULACJA
wymóg formalny
87%
CONFIRMED opartych o źródło pierwotne SYMULACJA
cel ≥ 90%
Powiązane strony
Doktryna evidence-first
Fundament claim ≤ proof i statusy dowodowe. → Doktryna
Agent hijack
Raporty bez dowodów obniżają trust score agenta. → Playbook H
AI Act
Raport do organu bez GAP przebranego za fakt. → Playbook K
Uwaga metodyczna: reguły dowodowe opisano jako ramkę doktrynalną K0NSULT (INTERNAL), a statusy (CONFIRMED/GAP/SYMULACJA/…) są narzędziem porządkującym, nie orzeczeniem o cudzej wiarygodności. Metryki oznaczone SYMULACJA są przykładowe.