Prečo jasné obmedzenia znižujú halucinácie LLM
Halucinácia veľkých jazykových modelov (LLM) je systematická odchýlka medzi tým, čo model tvrdí, a tým, čo je fakticky alebo kontraktuálne požadované. V kontexte GEO (generative engine optimization) je cieľom navrhovať obsah tak, aby bol pre modely jednoznačne parsovateľný, predvídateľný a minimálne nejednoznačný. Kľúč k znižovaniu halucinácií spočíva v explicitných obmedzeniach textu – teda v definovaní povolených formátov, rozsahov, slovníkov, zdrojov a pravidiel inferencie v samotnom výstupe aj v jeho okolí (šablóny, metadáta, kontrakty).
Typológia halucinácií a mapovanie na obmedzenia
- Faktografická halucinácia: Model si „vymyslí“ zdroj alebo údaj. Obmedzenie: záväzné citovanie so štruktúrou a validáciou (napr. DOI/URL, dátum prístupu, autor).
- Logická halucinácia: Neplatný záver z platných premís. Obmedzenie: krokovanie s kontrolou inferenčných pravidiel (napr. povolené operátory, referencie na premisy).
- Štylistická halucinácia: Model poruší register, dĺžku, tón. Obmedzenie: presný limit znakov/slov, whitelist štylistických prvkov.
- Formátová halucinácia: Výstup nie je v dohodnutom formáte (JSON/YAML). Obmedzenie: striktné schémy a strojová validácia.
- Doménová halucinácia: Nesprávne termíny mimo domény. Obmedzenie: lokálny slovník/ontológia, zákaz synonym mimo zoznamu.
Princípy návrhu obmedzení v GEO
- Deterministická šablóna: Každý výstup je inštanciou šablóny s pevnými sekciami a poradím.
- Minimax nejednoznačnosti: Každý slot má jedinú interpretáciu (typ, rozsah, jednotky).
- Kontrakty v texte: Pravidlá začleniť priamo do obsahu (hinty, tagy, tabuľky), nie iba do zadania.
- Overiteľnosť: Všetko dôležité musí byť strojovo validovateľné (schémy, kontrolné súčty, regulárne výrazy).
- Odolnosť voči parafráze: Obmedzenia formulovať asertívne a redundančne (viacnásobné pripomenutie kľúčových pravidiel v rôznych formách).
Štruktúrne vzory (patterny) pre obmedzenia
- Slotový vzor: „Pole: hodnota“ s typom a jednotkami (napr. „Dátum ISO8601: 2025-10-22“).
- Enumerácia: Povolené hodnoty vo forme zoznamu; zakázať „iné“.
- Evidence-first: Najprv zdroje, až potom tvrdenia; tvrdenie musí referencovať ID zdroja.
- Chain-of-Checks: Po inference sekcii nasleduje kontrolná sekcia s binárnymi fl agmi (PASS/FAIL) pre pravidlá.
- Guardrail tagy: Viditeľné markery, ktoré model má povinnosť vyplniť (napr. „[CIT-REQ]“).
Šablóna obsahu s minimom halucinácií
Nasledujúca šablóna ilustruje obmedzenia pre odborný výstup. Každá sekcia je povinná; ak nie je obsah, použije sa presná hodnota „N/A“.
| Sekcia | Účel | Obmedzenie | Príklad |
|---|---|---|---|
| Meta | Identifikácia | Autor(min 2 slová), Dátum(YYYY-MM-DD), Verzia(semver) | Autor: Tím GEO; Dátum: 2025-10-22; Verzia: 1.2.0 |
| Slovník | Doménové pojmy | Min. 5 termínov, každý s 1 vetou; bez synoným mimo zoznamu | „Halucinácia LLM – odchýlka tvrdenia od faktu…“ |
| Tvrdenia | Overiteľné body | Max 5, každý s citáciou [SRC-ID] | „T1: Výstup validuj podľa schémy. [SRC-1]“ |
| Citácie | Prepojenie na zdroje | Každý zdroj má ID, názov, URL/DOI, dátum prístupu | SRC-1: Názov, URL, 2025-10-22 |
| Limity | Rozsah a štýl | Max 1200 slov; krátke odseky < 120 slov | „Rozsah: ≤1200 slov“ |
| Kontroly | Sebahodnotenie | 5 pravidiel s PASS/FAIL a odkazom na sekcie | R1: Všetky tvrdenia citované – PASS |
Formálna špecifikácia výstupu (ľahká schéma bez kódu)
- Meta.autor: reťazec, min. 5 znakov.
- Meta.dátum: formát YYYY-MM-DD, musí byť ≤ dnešný dátum.
- Slovník[*].termín: reťazec bez čísel; Slovník má veľkosť 5–12.
- Tvrdenia[*].text: 1–2 vety; končí bodkou; obsahuje aspoň jeden odkaz [SRC-x].
- Citácie[*].id: „SRC-číslo“; unikátne v dokumente.
- Limity.slová_max: celé číslo 300–1500.
- Kontroly[*].stav: „PASS“ alebo „FAIL“ (iné hodnoty zakázané).
Techniky lokalizácie zdrojov a ich „pripútania“ k textu
- ID-citácií: Každé tvrdenie obsahuje hranatú značku s ID zdroja; bez ID je tvrdenie neplatné.
- Jednoznačné mená: Normalizovať názvy (napr. „ISO 8601“ namiesto „ISO8601/ISO“).
- Anti-halu medzera: Ak chýba zdroj, povoliť iba „N/A“ – tým sa minimalizujú vymyslené citácie.
Obmedzenia na jazyk a štýl
- Register: Odborný, bez metafor a hyperbol.
- Početnosť modálnych slovies: max. 2 % viet s „mohol/by“.
- Stop-slovník: Zákaz výrazov „pravdepodobne“, „zrejme“, ak je požadovaná istota.
- Dĺžka viet: 8–22 slov; dlhšie vety rozdeliť.
Obmedzenia na obsah a inferenciu
- Bez extrapolácie mimo zdroje: Tvrdenia musia byť logicky odvodené z citovaných zdrojov.
- Jednotky a rozsahy: Všetky číselné údaje s jednotkami (%, ms, MB); rozsahy s „od–do“.
- Bez domnienok o entitách: Ak entita chýba v zdroji/slovníku, nespomínať ju.
Kontrolné tabuľky pre sebavalidáciu výstupu
| Pravidlo | Kontrola | Stav |
|---|---|---|
| Všetky tvrdenia majú [SRC-x] | Počet tvrdení = počet referencií | PASS/FAIL |
| Počet slov ≤ limit | Automatický súčet | PASS/FAIL |
| Formát dátumu správny | Regex YYYY-MM-DD | PASS/FAIL |
| Bez zakázaných slov | Kontrola voči stop-slovníku | PASS/FAIL |
| Jednotky uvedené | Každé číslo má jednotku | PASS/FAIL |
Redundancia ako poistka: dvojité kódovanie pravidiel
Pravidlá je vhodné zakódovať zároveň v texte aj v metadátach. Napríklad tabuľka „Limity“ v obsahu a súčasne identická informácia v mikroštruktúre (napr. data-* atribúty pri elementoch). Redundancia znižuje pravdepodobnosť, že model „prehliadne“ obmedzenie.
Praktické príklady obmedzení pre rôzne typy stránok
- Produktová karta: Povolené polia: Názov, Model, Cena v EUR, Záruka v mesiacoch, 3 bullet body výhod; zákaz subjektívnych prívlastkov mimo whitelistu („kompaktný“, „odolný“).
- Výskumné zhrnutie: Max 5 zistení, každé s [SRC-x] a s kvalifikátorom „Úroveň dôkazu: {systémové prehľady|RCT|kohorta|expertíza}“.
- FAQ: Presný formát „Otázka:“ / „Odpoveď:“; odpoveď ≤ 80 slov; žiadne odkazy bez referencie v sekcii „Citácie“.
Meranie efektu: metriky anti-halucinácie
- Factual Error Rate (FER): Podiel tvrdení bez verifikovateľného zdroja.
- Schema Compliance Rate (SCR): Podiel výstupov, ktoré prejdú validátorom bez zásahu.
- Source Attachment Score (SAS): Podiel viet odkazujúcich na zdroje z relevantných sekcií.
- Ambiguity Density (AD): Počet neurčitých výrazov na 1000 slov.
Prevádzkové postupy: pipeline s bránami
- Generate: Model generuje podľa šablóny s obmedzeniami.
- Validate: Strojová kontrola schémy, regulárnych výrazov a slovníkov.
- Critique: Druhý priechod modelu (kritik) s fokusom na pravidlá a citácie.
- Repair: Cielené doplnenie chýbajúcich prvkov (iba do slotov s FAIL).
- Freeze: Uzamknutie stabilných častí, aby sa pri re-run nezmenili (napr. citácie).
Anti-halu zásady pri prepisovaní a sumarizácii
- Extraktívnosť pred abstraktivitou: Najprv extraktívne zhrnutie s citáciami, až potom parafráza.
- Citácie sa dedia: Pri skracovaní zachovať pôvodné [SRC-x]; ak zanikne tvrdenie, zanikne aj citácia.
- Bez syntézy krížom cez zdroje bez označenia: Zlúčené tvrdenia musia uvádzať všetky dotknuté ID.
Časté chyby pri navrhovaní obmedzení
- Príliš všeobecné pravidlá („cituj zdroj“), ktoré nešpecifikujú formát a povinné polia.
- Nejednoznačné enumy („krátke/dlhé“ bez prahov).
- Konflikt pravidiel (napr. limit slov vs. povinné detaily) – nutná priorita pravidiel.
- Skryté pravidlá len v meta; model ich nemusí preniesť do výstupu.
Checklist pre autorov GEO obsahu
- Má dokument pevné sekcie s povinnými slotmi?
- Sú tvrdenia citované pomocou stabilných ID?
- Je definovaný slovník domény a stop-slovník?
- Sú dĺžkové a formátové limity explicitné v texte?
- Existuje kontrolná tabuľka PASS/FAIL?
- Je súčasťou pipeline validácia a oprava?
Minimalistický „kontrakt“ vložený priamo do článku
Nasledujúci kontrakt je určený na kopírovanie do hornej časti každého generovaného výstupu. Zvyšuje pravdepodobnosť dodržania pravidiel:
- Kontrakt-1 (Formát): Tento dokument obsahuje sekcie Meta, Slovník, Tvrdenia, Citácie, Limity, Kontroly v uvedenom poradí.
- Kontrakt-2 (Citácie): Každé tvrdenie v sekcii Tvrdenia obsahuje aspoň jednu citáciu [SRC-x].
- Kontrakt-3 (Limity): Dokument neprekročí počet slov uvedený v Limity.slová_max.
- Kontrakt-4 (Jazyk): Zakázané výrazy: „pravdepodobne“, „zrejme“, ak nie je uvedené inak.
- Kontrakt-5 (Kontroly): Sekcia Kontroly obsahuje 5 pravidiel s PASS/FAIL.
Implementačné odporúčania pre redakcie a vývojárov
- Editor s validátorom: CMS by mal mať inline validáciu schémy a slovníka.
- Automatické doplnenie ID: Tlačidlo „Pridať citáciu“ vygeneruje [SRC-x] a záznam do sekcie Citácie.
- Testovacie runy: Každý typ šablóny mať A/B variant s prísnejšími vs. miernejšími obmedzeniami.
- Monitoring metrík: Dashboard pre FER, SCR, SAS, AD s týždennými trendmi.
Jasné obmedzenia textu nie sú „klietkou“ kreativity, ale ochrannou sieťou proti halucináciám. V GEO prístupe fungujú ako most medzi ľudskou sémantikou a strojovou verifikovateľnosťou. Čím presnejší formát, slovník a kontrakt, tým nižší priestor pre vymýšľanie a tým vyššia spoľahlivosť výstupov. Zavedením vyššie opísaných šablón, kontrol a metrík možno dosiahnuť významný pokles halucinácií bez dramatického obmedzenia informačnej hodnoty či čitateľnosti.