Preskočiť na obsah
6.27Pokročilý7 min

Agent na overovanie faktov: odhaľte halucinácie pred publikovaním

Blck Alpaca·
Definition

Agent na overovanie faktov je systém umelej inteligencie, ktorý automatizovane verifikuje obsah pred publikovaním: rozloží text na jednotlivé tvrdenia (claims), každé porovná s dôveryhodnými zdrojmi a označí nepodložené, protirečivé alebo vymyslené výroky. Cieľom je odhaliť halucinácie, nesprávne čísla a chybné citácie skôr, než sa zverejnia.

Key Takeaways

  • Halucinácie nie sú okrajový jav: aj pri obyčajnom sumarizovaní zadaných dokumentov sa miery chybovosti podľa modelu pohybujú od niekoľkých percent až do dvojciferného pásma (Vectara Hallucination Leaderboard, merané pomocou HHEM-2.3 na viac než 7 700 dokumentoch). Žiadny model nie je bezchybný.
  • Agent na overovanie faktov pracuje v štyroch krokoch: extrakcia tvrdení, porovnanie so zdrojmi cez retrieval alebo web, označenie problematických výrokov a skórovanie konfidencie pre každé tvrdenie.
  • Čísla, citáty a vlastné mená sú najvýdatnejšie zdroje halucinácií: vymyslené číslo v podkladoch pre predstavenstvo (board pack) poškodí dôveryhodnosť finančného riaditeľa na roky, vymyslená súdna citácia môže spustiť sankcie (Mata v. Avianca, USA 2023).
  • Živé vyhľadávanie na webe problém nerieši, iba ho presúva: podľa auditu NewsGuard zopakovalo desať popredných AI nástrojov v auguste 2025 v 35 % prípadov nepravdivé informácie k aktuálnym témam (august 2024: 18 %), pričom miera odmietnutia odpovede klesla z 31 % na 0 %.
  • Agent znižuje riziko, no nenahrádza redakčnú zodpovednosť. Rozhodnutie o schválení zostáva ľudské, agent dodáva len prioritizované, podložené upozornenia.
  • V regulovaných kontextoch DACH musia byť samotné retrieval zdroje dôveryhodné a právne prípustné (DSGVO, pre nositeľov profesijného tajomstva navyše paragraf 203 StGB) — znečistený fond zdrojov produkuje verifikované nepravdy.

Agent na overovanie faktov je systém umelej inteligencie, ktorý automatizovane verifikuje obsah pred publikovaním: rozloží text na jednotlivé tvrdenia (claims), každé porovná s dôveryhodnými zdrojmi a označí nepodložené, protirečivé alebo vymyslené výroky. Cieľom je odhaliť halucinácie, nesprávne čísla a chybné citácie skôr, než sa zverejnia. Je kontrolnou inštanciou medzi konceptom a schválením — nie náhradou za redakčnú záverečnú zodpovednosť.

  • Čo robí: štyri kroky — extrakcia tvrdení, porovnanie so zdrojmi (retrieval/web), označenie problematických výrokov, skórovanie konfidencie pre každé tvrdenie.
  • Prečo je potrebný: jazykové modely halucinujú aj pri kontrolovaných úlohách. Pri sumarizovaní zadaných dokumentov sa miery chybovosti podľa modelu pohybujú od niekoľkých percent až do dvojciferného pásma (Vectara Hallucination Leaderboard, merané pomocou HHEM-2.3 na viac než 7 700 dokumentoch).
  • Kde je jeho hranica: agent znižuje riziko, no nenahrádza ľudské schválenie. Overí len to, čo pokrývajú jeho zdroje.

Prečo sú halucinácie pred publikovaním obchodným rizikom

Faktické halucinácie v thought-leadership obsahu sú v realite DACH B2B nápadné — a to rýchlo. Engineering buyers v priemyselných stredne veľkých firmách rozpoznajú nesprávny technický výrok okamžite a vyvodzujú závery o starostlivosti odosielateľa. Vo finančnom kontexte je jediné halucinované číslo v podkladoch pre predstavenstvo (board pack) katastrofálne a poškodzuje dôveryhodnosť zodpovednej osoby na roky. V právnom prostredí spúšťajú vymyslené súdne citácie reálne sankcie: prípad Mata v. Avianca (USA, 2023) je kanonickým precedensom a porovnateľné prípady sa medzičasom vyskytli aj v nemeckých advokátskych kanceláriách.

Integrácia živého vyhľadávania na webe problém nevyriešila, ale presunula. Podľa auditu NewsGuard zopakovalo desať popredných AI nástrojov v auguste 2025 v 35 % prípadov nepravdivé informácie k aktuálnym témam — oproti 18 % v auguste 2024. Zároveň miera odmietnutia odpovede klesla z 31 % na 0 %. Modely teda odpovedajú častejšie a rozhodnejšie, no svoje doklady čerpajú zo sčasti znečisteného informačného ekosystému. Pre automatizované content pipelines to znamená: bez vlastnej verifikačnej úrovne prejdú chyby nebrzdene až k zverejneniu.

Štyri kroky agenta na overovanie faktov

Spoľahlivý agent na overovanie faktov nepracuje ako nepriehľadné celkové posúdenie („text pôsobí správne"), ale rozloží úlohu na pochopiteľné, jednotlivo overiteľné kroky.

1. Extrakcia tvrdení

Agent rozloží text na atomárne, overiteľné tvrdenia. Z „Firma v roku 2025 zvýšila tržby o 30 % a otvorila kanceláriu vo Viedni" vzniknú dve samostatné tvrdenia, ktoré sa overujú oddelene. Čisté názorové vyjadrenia, jasne označené prognózy a štylistické pasáže sa označia ako neoveriteľné a nepovažujú sa za faktické chyby. Dobrá extrakcia je základom celého procesu: ak sa tvrdenie nesprávne izoluje, buď sa stratí kontext, alebo vzniknú zdanlivé chyby.

2. Porovnanie so zdrojmi (retrieval/web)

Ku každému tvrdeniu agent vyhľadá doklady. Bežné sú dva typy zdrojov: interný, kurátorovaný korpus cez retrieval (briefing, výskumné dokumenty, produktové dáta, schválená znalostná databáza) a — ak je to povolené — otvorené vyhľadávanie na webe pre aktuálne alebo externé fakty. Interný korpus býva spravidla spoľahlivejší, pretože je kurátorovaný; vyhľadávanie na webe je širšie, no rizikovejšie. Náročné tímy tu pracujú podľa rovnakého vzoru, ktorý sa v praxi DACH už osvedčil: namiesto dôvery v surový model sa overuje voči doménovo špecifickému korpusu zdrojov cez retrieval — analogicky k advokátskym kanceláriám, ktoré svoje modely RAG-augmentujú voči nemeckým právnym korpusom, namiesto spoliehania sa na pamäť modelu.

3. Označenie tvrdení

Pri každom tvrdení agent rozhodne, či nájdený zdroj výrok podporuje, vyvracia alebo nepokrýva (nepodložené). Technicky ide o entailment posúdenie: vyplýva tvrdenie logicky z dokladu? Protirečivé a nepodložené výroky sa pre redakciu viditeľne označia — nepodložené pritom výslovne neznamená „nesprávne", ale „neoveriteľné dostupnými zdrojmi", a teda vyžadujúce vysvetlenie.

4. Skórovanie konfidencie

Každý nález dostane skóre konfidencie, ktoré vyjadruje, ako veľmi si je agent svojím posúdením istý. Častým a robustným postupom je self-consistency: tvrdenie sa overuje viackrát, respektíve voči viacerým dokladom; ak sa posúdenia zhodujú, konfidencia stúpa, ak sa rozchádzajú, klesá a prípad sa eskaluje na ľudské overenie. Skóre riadi prioritizáciu: vysoká konfidencia „vyvrátené" patrí navrch do fronty pre recenzenta, nízka konfidencia signalizuje, že si agent sám nie je istý.

Tabuľka: typ tvrdenia, metóda overenia, akcia

Typ tvrdenia

Metóda overenia

Akcia pri probléme

Číslo / štatistika / peňažná suma

Presné porovnanie s primárnym zdrojom; overiť jednotky, referenčný rok a rád veličiny

Blokovať, kým nie je doklad; doplniť zdroj a stav

Doslovný citát

Porovnanie reťazca s pôvodným dokumentom; overiť rečníka a kontext

Pri odchýlke označiť ako chybnú citáciu, neparafrázovať bez označenia

Dátum / termín / verzia

Porovnanie s autoritatívnym zdrojom; označiť „stav 2026"

Opraviť alebo opatriť výhradou k dátumu

Vlastné meno / entita

Retrieval voči znalostnej databáze; vylúčiť zámenu rovnomenných entít

Vynútiť jednoznačné priradenie alebo miesto eskalovať

Právny / compliance výrok

Porovnanie s overeným právnym zdrojom; informatívne, nie právne poradenstvo

Eskalovať na odbornú kontrolu/legal, neschvaľovať autonómne

Všeobecné faktické tvrdenie

Entailment voči retrieval/web; uprednostniť viacnásobný doklad

Pri „nepodložené" alebo „vyvrátené" označiť a zdôvodniť

Názor / prognóza / hodnotenie

Klasifikovať ako neoveriteľné

Nepovažovať za faktickú chybu; prípadne označiť ako názor

Príklad: odhalená halucinácia

Automaticky vytvorený koncept blogu o adopcii AI v stredne veľkých firmách obsahuje vetu: „Podľa Bitkom využívalo v roku 2026 už 57 % nemeckých firiem aktívne AI v účtovníctve." Agent na overovanie faktov túto vetu spracuje takto:

```
Extrahované tvrdenie: "57 % nemeckých firiem využíva v roku 2026 aktívne AI v účtovníctve (zdroj: Bitkom)"
Typ tvrdenia: Číslo/štatistika s uvedením zdroja
Retrieval: Zhoda vo výskumnom korpuse (Bitkom 2026, n=604)
Text dokladu: "41 % firiem využíva aktívne AI; marketing/komunikácia 57 %,
controlling/účtovníctvo 17 %"
Entailment: PROTIREČENIE
Nález: Číslo 57 % patrí k marketingu/komunikácii, nie k účtovníctvu;
aktívne využívanie celkovo je na úrovni 41 %, účtovníctvo na 17 %
Konfidencia: 0,93 (jednoznačný doklad zo zdroja, viackrát potvrdený)
Akcia: BLOKOVAŤ — pred publikovaním opraviť
```

Ide tu o typický vzor konfabulácie: číslo 57 % je reálne, no priradené nesprávnej kategórii — vierohodne znejúce, no fakticky nesprávne prepojenie, ktoré ľudský čitateľ bez zdroja sotva zaznamená. Agent ho zachytí, pretože neoveruje vierohodnosť, ale konkrétny doklad. Práve takéto zámeny — správne číslo, nesprávny vzťah — sú v obsahu generovanom AI časté a obzvlášť záludné, pretože sa čítajú seriózne.

Hranica: zníženie rizika, nie odovzdanie zodpovednosti

Agent na overovanie faktov merateľne znižuje riziko — no nenahrádza redakčnú zodpovednosť. Obmedzujú ho tri štrukturálne dôvody. Po prvé overuje len to, čo pokrývajú jeho zdroje: výrok, ku ktorému v korpuse neexistuje doklad, zostáva „nepodložený", nie „overený". Po druhé agent sám používa jazykový model a môže sa v entailment posúdení mýliť — aj Google AI Overviews boli podľa analýzy zverejnenej v roku 2026 podľa verzie modelu ešte v približne 9 až 15 % prípadov nesprávne. Po tretie, a v DACH obzvlášť relevantné: výsledok verifikácie je len taký dobrý ako fond zdrojov. Ak je znečistený alebo zastaraný, agent produkuje verifikované nepravdy.

Tým sa presúva aj zodpovednosť za governance zdrojov. V regulovaných kontextoch musia byť samotné retrieval zdroje prípustné: v súlade s DSGVO a pre nositeľov profesijného tajomstva, ako sú daňoví poradcovia či advokáti, navyše zabezpečené podľa paragrafu 203 StGB — bod, ktorý presahuje štandardné spracovanie na základe poverenia. Transparenčná povinnosť EÚ podľa čl. 50 AI Act (uplatniteľná od 2. augusta 2026) navyše vyžaduje označovanie obsahu generovaného AI; agent na overovanie faktov toto označovanie nenahrádza, ale ho dopĺňa. Toto všetko je informatívne a nie je to právne poradenstvo.

Spoľahlivým referenčným bodom pre hospodárnosť zostáva konzervatívny údaj: recenzovaná štúdia Brynjolfssona, Liho a Raymonda (Science Advances 2024) vykazuje 14 % nárast produktivity v priemere, 34 % pre neskúsených pracovníkov. To je realistická spodná hranica — nie „10×" strop z predajných slajdov dodávateľov. Agent na overovanie faktov sa primárne nepretavuje do rýchlosti, ale do odvrátenej škody: nezverejnený nepravdivý výrok, nepoškodená dôvera. Viac o príčinách a bezpečnostnom rámci halucinácií rozoberá samostatná téma o halucináciách a bezpečnosti AI v tomto klastri.

Pre agentúry a B2B tímy

Kto automatizuje obsah, potrebuje verifikačnú úroveň ako pevný krok pipeline — nie ako následnú vzorkovú kontrolu. Pre agentúry je agent na overovanie faktov konkrétnym argumentom kvality a zodpovednosti voči klientom: pochopiteľné zoznamy tvrdení, zdokumentované zdroje a jasná eskalačná cesta pre nepodložené výroky. B2B tímom sa odporúča začať tam, kde je škoda najväčšia: najprv pri tvrdeniach o číslach, citátoch a compliance, s povinným ľudským schválením pre všetko, čo je právne záväzné. Blck Alpaca navrhuje takéto verifikačné workflows pre content pipelines v DACH — od governance zdrojov cez architektúru agenta až po začlenenie do existujúceho redakčného procesu, bez rozriedenia ľudskej zodpovednosti za schválenie.

Často kladené otázky

Čo presne robí agent na overovanie faktov?
Agent na overovanie faktov rozloží hotový text na jednotlivé overiteľné tvrdenia, ku každému tvrdeniu vyhľadá doklady v dôveryhodných zdrojoch (interná znalostná databáza cez retrieval alebo web), posúdi, či zdroj výrok podporuje, vyvracia alebo nepokrýva, a problematické miesta označí so skóre konfidencie. Redakcii dodá prioritizovaný zoznam — rozhodnutie o schválení naďalej robí človek.
Dokáže agent na overovanie faktov úplne zabrániť halucináciám?
Nie. Riziko výrazne znižuje, no neeliminuje ho. Agent dokáže overiť len to, čo pokrývajú jeho zdroje, a sám používa jazykový model, ktorý môže posúdiť chybne. Doklady môžu byť zastarané, fond zdrojov znečistený. Dokonca aj Google AI Overviews boli podľa analýzy zverejnenej v roku 2026 podľa verzie modelu ešte v približne 9 až 15 % prípadov nesprávne. Agent preto nenahrádza redakčnú záverečnú kontrolu.
Čím sa líši agent na overovanie faktov od RAG?
RAG (Retrieval-Augmented Generation) obohacuje tvorbu obsahu o zdroje, aby halucinácie zredukoval už v zárodku. Agent na overovanie faktov nadväzuje až potom: adversariálne preverí už hotový text voči zdrojom, aj keď ten vznikol bez RAG. Oba prístupy sa dopĺňajú — RAG ako prevencia, agent na overovanie faktov ako nezávislá kontrolná inštancia pred publikovaním.
Ktoré výroky by mal agent na overovanie faktov prioritizovať?
Čísla, štatistiky, peňažné sumy, dátumy, doslovné citáty, vlastné mená a právne alebo regulačné tvrdenia. To sú typy tvrdení s najvyšším potenciálom škody a najvyššou mierou halucinácií. Subjektívne hodnotenia alebo jasne označené názory sa naopak nepovažujú za faktické chyby.
Stačí agent na overovanie faktov na právne bezpečný obsah?
Nie a nemal by sa chápať ako právne poradenstvo. V regulovaných kontextoch DACH musia byť samotné zdroje prípustné: v súlade s DSGVO a pre nositeľov profesijného tajomstva, ako sú daňoví poradcovia či advokáti, navyše zabezpečené podľa paragrafu 203 StGB. Agent podporuje overovanie, no nenahrádza ani odbornú kontrolu, ani právne schválenie.

Ísť hlbšie?

Získajte nové analýzy priamo do schránky – alebo sa pozrite, ako tieto poznatky nasadzujeme pre firmy.