Agent na overovanie faktov: odhaľte halucinácie pred publikovaním
Agent na overovanie faktov je systém umelej inteligencie, ktorý automatizovane verifikuje obsah pred publikovaním: rozloží text na jednotlivé tvrdenia (claims), každé porovná s dôveryhodnými zdrojmi a označí nepodložené, protirečivé alebo vymyslené výroky. Cieľom je odhaliť halucinácie, nesprávne čísla a chybné citácie skôr, než sa zverejnia.
Key Takeaways
- ✓Halucinácie nie sú okrajový jav: aj pri obyčajnom sumarizovaní zadaných dokumentov sa miery chybovosti podľa modelu pohybujú od niekoľkých percent až do dvojciferného pásma (Vectara Hallucination Leaderboard, merané pomocou HHEM-2.3 na viac než 7 700 dokumentoch). Žiadny model nie je bezchybný.
- ✓Agent na overovanie faktov pracuje v štyroch krokoch: extrakcia tvrdení, porovnanie so zdrojmi cez retrieval alebo web, označenie problematických výrokov a skórovanie konfidencie pre každé tvrdenie.
- ✓Čísla, citáty a vlastné mená sú najvýdatnejšie zdroje halucinácií: vymyslené číslo v podkladoch pre predstavenstvo (board pack) poškodí dôveryhodnosť finančného riaditeľa na roky, vymyslená súdna citácia môže spustiť sankcie (Mata v. Avianca, USA 2023).
- ✓Živé vyhľadávanie na webe problém nerieši, iba ho presúva: podľa auditu NewsGuard zopakovalo desať popredných AI nástrojov v auguste 2025 v 35 % prípadov nepravdivé informácie k aktuálnym témam (august 2024: 18 %), pričom miera odmietnutia odpovede klesla z 31 % na 0 %.
- ✓Agent znižuje riziko, no nenahrádza redakčnú zodpovednosť. Rozhodnutie o schválení zostáva ľudské, agent dodáva len prioritizované, podložené upozornenia.
- ✓V regulovaných kontextoch DACH musia byť samotné retrieval zdroje dôveryhodné a právne prípustné (DSGVO, pre nositeľov profesijného tajomstva navyše paragraf 203 StGB) — znečistený fond zdrojov produkuje verifikované nepravdy.
Agent na overovanie faktov je systém umelej inteligencie, ktorý automatizovane verifikuje obsah pred publikovaním: rozloží text na jednotlivé tvrdenia (claims), každé porovná s dôveryhodnými zdrojmi a označí nepodložené, protirečivé alebo vymyslené výroky. Cieľom je odhaliť halucinácie, nesprávne čísla a chybné citácie skôr, než sa zverejnia. Je kontrolnou inštanciou medzi konceptom a schválením — nie náhradou za redakčnú záverečnú zodpovednosť.
- Čo robí: štyri kroky — extrakcia tvrdení, porovnanie so zdrojmi (retrieval/web), označenie problematických výrokov, skórovanie konfidencie pre každé tvrdenie.
- Prečo je potrebný: jazykové modely halucinujú aj pri kontrolovaných úlohách. Pri sumarizovaní zadaných dokumentov sa miery chybovosti podľa modelu pohybujú od niekoľkých percent až do dvojciferného pásma (Vectara Hallucination Leaderboard, merané pomocou HHEM-2.3 na viac než 7 700 dokumentoch).
- Kde je jeho hranica: agent znižuje riziko, no nenahrádza ľudské schválenie. Overí len to, čo pokrývajú jeho zdroje.
Prečo sú halucinácie pred publikovaním obchodným rizikom
Faktické halucinácie v thought-leadership obsahu sú v realite DACH B2B nápadné — a to rýchlo. Engineering buyers v priemyselných stredne veľkých firmách rozpoznajú nesprávny technický výrok okamžite a vyvodzujú závery o starostlivosti odosielateľa. Vo finančnom kontexte je jediné halucinované číslo v podkladoch pre predstavenstvo (board pack) katastrofálne a poškodzuje dôveryhodnosť zodpovednej osoby na roky. V právnom prostredí spúšťajú vymyslené súdne citácie reálne sankcie: prípad Mata v. Avianca (USA, 2023) je kanonickým precedensom a porovnateľné prípady sa medzičasom vyskytli aj v nemeckých advokátskych kanceláriách.
Integrácia živého vyhľadávania na webe problém nevyriešila, ale presunula. Podľa auditu NewsGuard zopakovalo desať popredných AI nástrojov v auguste 2025 v 35 % prípadov nepravdivé informácie k aktuálnym témam — oproti 18 % v auguste 2024. Zároveň miera odmietnutia odpovede klesla z 31 % na 0 %. Modely teda odpovedajú častejšie a rozhodnejšie, no svoje doklady čerpajú zo sčasti znečisteného informačného ekosystému. Pre automatizované content pipelines to znamená: bez vlastnej verifikačnej úrovne prejdú chyby nebrzdene až k zverejneniu.
Štyri kroky agenta na overovanie faktov
Spoľahlivý agent na overovanie faktov nepracuje ako nepriehľadné celkové posúdenie („text pôsobí správne"), ale rozloží úlohu na pochopiteľné, jednotlivo overiteľné kroky.
1. Extrakcia tvrdení
Agent rozloží text na atomárne, overiteľné tvrdenia. Z „Firma v roku 2025 zvýšila tržby o 30 % a otvorila kanceláriu vo Viedni" vzniknú dve samostatné tvrdenia, ktoré sa overujú oddelene. Čisté názorové vyjadrenia, jasne označené prognózy a štylistické pasáže sa označia ako neoveriteľné a nepovažujú sa za faktické chyby. Dobrá extrakcia je základom celého procesu: ak sa tvrdenie nesprávne izoluje, buď sa stratí kontext, alebo vzniknú zdanlivé chyby.
2. Porovnanie so zdrojmi (retrieval/web)
Ku každému tvrdeniu agent vyhľadá doklady. Bežné sú dva typy zdrojov: interný, kurátorovaný korpus cez retrieval (briefing, výskumné dokumenty, produktové dáta, schválená znalostná databáza) a — ak je to povolené — otvorené vyhľadávanie na webe pre aktuálne alebo externé fakty. Interný korpus býva spravidla spoľahlivejší, pretože je kurátorovaný; vyhľadávanie na webe je širšie, no rizikovejšie. Náročné tímy tu pracujú podľa rovnakého vzoru, ktorý sa v praxi DACH už osvedčil: namiesto dôvery v surový model sa overuje voči doménovo špecifickému korpusu zdrojov cez retrieval — analogicky k advokátskym kanceláriám, ktoré svoje modely RAG-augmentujú voči nemeckým právnym korpusom, namiesto spoliehania sa na pamäť modelu.
3. Označenie tvrdení
Pri každom tvrdení agent rozhodne, či nájdený zdroj výrok podporuje, vyvracia alebo nepokrýva (nepodložené). Technicky ide o entailment posúdenie: vyplýva tvrdenie logicky z dokladu? Protirečivé a nepodložené výroky sa pre redakciu viditeľne označia — nepodložené pritom výslovne neznamená „nesprávne", ale „neoveriteľné dostupnými zdrojmi", a teda vyžadujúce vysvetlenie.
4. Skórovanie konfidencie
Každý nález dostane skóre konfidencie, ktoré vyjadruje, ako veľmi si je agent svojím posúdením istý. Častým a robustným postupom je self-consistency: tvrdenie sa overuje viackrát, respektíve voči viacerým dokladom; ak sa posúdenia zhodujú, konfidencia stúpa, ak sa rozchádzajú, klesá a prípad sa eskaluje na ľudské overenie. Skóre riadi prioritizáciu: vysoká konfidencia „vyvrátené" patrí navrch do fronty pre recenzenta, nízka konfidencia signalizuje, že si agent sám nie je istý.
Tabuľka: typ tvrdenia, metóda overenia, akcia
Typ tvrdenia | Metóda overenia | Akcia pri probléme |
|---|---|---|
Číslo / štatistika / peňažná suma | Presné porovnanie s primárnym zdrojom; overiť jednotky, referenčný rok a rád veličiny | Blokovať, kým nie je doklad; doplniť zdroj a stav |
Doslovný citát | Porovnanie reťazca s pôvodným dokumentom; overiť rečníka a kontext | Pri odchýlke označiť ako chybnú citáciu, neparafrázovať bez označenia |
Dátum / termín / verzia | Porovnanie s autoritatívnym zdrojom; označiť „stav 2026" | Opraviť alebo opatriť výhradou k dátumu |
Vlastné meno / entita | Retrieval voči znalostnej databáze; vylúčiť zámenu rovnomenných entít | Vynútiť jednoznačné priradenie alebo miesto eskalovať |
Právny / compliance výrok | Porovnanie s overeným právnym zdrojom; informatívne, nie právne poradenstvo | Eskalovať na odbornú kontrolu/legal, neschvaľovať autonómne |
Všeobecné faktické tvrdenie | Entailment voči retrieval/web; uprednostniť viacnásobný doklad | Pri „nepodložené" alebo „vyvrátené" označiť a zdôvodniť |
Názor / prognóza / hodnotenie | Klasifikovať ako neoveriteľné | Nepovažovať za faktickú chybu; prípadne označiť ako názor |
Príklad: odhalená halucinácia
Automaticky vytvorený koncept blogu o adopcii AI v stredne veľkých firmách obsahuje vetu: „Podľa Bitkom využívalo v roku 2026 už 57 % nemeckých firiem aktívne AI v účtovníctve." Agent na overovanie faktov túto vetu spracuje takto:
```
Extrahované tvrdenie: "57 % nemeckých firiem využíva v roku 2026 aktívne AI v účtovníctve (zdroj: Bitkom)"
Typ tvrdenia: Číslo/štatistika s uvedením zdroja
Retrieval: Zhoda vo výskumnom korpuse (Bitkom 2026, n=604)
Text dokladu: "41 % firiem využíva aktívne AI; marketing/komunikácia 57 %,
controlling/účtovníctvo 17 %"
Entailment: PROTIREČENIE
Nález: Číslo 57 % patrí k marketingu/komunikácii, nie k účtovníctvu;
aktívne využívanie celkovo je na úrovni 41 %, účtovníctvo na 17 %
Konfidencia: 0,93 (jednoznačný doklad zo zdroja, viackrát potvrdený)
Akcia: BLOKOVAŤ — pred publikovaním opraviť
```
Ide tu o typický vzor konfabulácie: číslo 57 % je reálne, no priradené nesprávnej kategórii — vierohodne znejúce, no fakticky nesprávne prepojenie, ktoré ľudský čitateľ bez zdroja sotva zaznamená. Agent ho zachytí, pretože neoveruje vierohodnosť, ale konkrétny doklad. Práve takéto zámeny — správne číslo, nesprávny vzťah — sú v obsahu generovanom AI časté a obzvlášť záludné, pretože sa čítajú seriózne.
Hranica: zníženie rizika, nie odovzdanie zodpovednosti
Agent na overovanie faktov merateľne znižuje riziko — no nenahrádza redakčnú zodpovednosť. Obmedzujú ho tri štrukturálne dôvody. Po prvé overuje len to, čo pokrývajú jeho zdroje: výrok, ku ktorému v korpuse neexistuje doklad, zostáva „nepodložený", nie „overený". Po druhé agent sám používa jazykový model a môže sa v entailment posúdení mýliť — aj Google AI Overviews boli podľa analýzy zverejnenej v roku 2026 podľa verzie modelu ešte v približne 9 až 15 % prípadov nesprávne. Po tretie, a v DACH obzvlášť relevantné: výsledok verifikácie je len taký dobrý ako fond zdrojov. Ak je znečistený alebo zastaraný, agent produkuje verifikované nepravdy.
Tým sa presúva aj zodpovednosť za governance zdrojov. V regulovaných kontextoch musia byť samotné retrieval zdroje prípustné: v súlade s DSGVO a pre nositeľov profesijného tajomstva, ako sú daňoví poradcovia či advokáti, navyše zabezpečené podľa paragrafu 203 StGB — bod, ktorý presahuje štandardné spracovanie na základe poverenia. Transparenčná povinnosť EÚ podľa čl. 50 AI Act (uplatniteľná od 2. augusta 2026) navyše vyžaduje označovanie obsahu generovaného AI; agent na overovanie faktov toto označovanie nenahrádza, ale ho dopĺňa. Toto všetko je informatívne a nie je to právne poradenstvo.
Spoľahlivým referenčným bodom pre hospodárnosť zostáva konzervatívny údaj: recenzovaná štúdia Brynjolfssona, Liho a Raymonda (Science Advances 2024) vykazuje 14 % nárast produktivity v priemere, 34 % pre neskúsených pracovníkov. To je realistická spodná hranica — nie „10×" strop z predajných slajdov dodávateľov. Agent na overovanie faktov sa primárne nepretavuje do rýchlosti, ale do odvrátenej škody: nezverejnený nepravdivý výrok, nepoškodená dôvera. Viac o príčinách a bezpečnostnom rámci halucinácií rozoberá samostatná téma o halucináciách a bezpečnosti AI v tomto klastri.
Pre agentúry a B2B tímy
Kto automatizuje obsah, potrebuje verifikačnú úroveň ako pevný krok pipeline — nie ako následnú vzorkovú kontrolu. Pre agentúry je agent na overovanie faktov konkrétnym argumentom kvality a zodpovednosti voči klientom: pochopiteľné zoznamy tvrdení, zdokumentované zdroje a jasná eskalačná cesta pre nepodložené výroky. B2B tímom sa odporúča začať tam, kde je škoda najväčšia: najprv pri tvrdeniach o číslach, citátoch a compliance, s povinným ľudským schválením pre všetko, čo je právne záväzné. Blck Alpaca navrhuje takéto verifikačné workflows pre content pipelines v DACH — od governance zdrojov cez architektúru agenta až po začlenenie do existujúceho redakčného procesu, bez rozriedenia ľudskej zodpovednosti za schválenie.
Často kladené otázky
Čo presne robí agent na overovanie faktov?
Dokáže agent na overovanie faktov úplne zabrániť halucináciám?
Čím sa líši agent na overovanie faktov od RAG?
Ktoré výroky by mal agent na overovanie faktov prioritizovať?
Stačí agent na overovanie faktov na právne bezpečný obsah?
Ísť hlbšie?
Získajte nové analýzy priamo do schránky – alebo sa pozrite, ako tieto poznatky nasadzujeme pre firmy.