Reaktívni vs. deliberatívni agenti
Reaktívni agenti reagujú na podnety priamo na základe pravidiel a bez plánovania (podnet-reakcia), zatiaľ čo deliberatívni agenti sledujú cieľ, plánujú viacúrovňovo a svoj plán iteratívne prispôsobujú. V praxi AI Agentov označuje „reaktívny" jednoduché, predvídateľné cesty (stupne zrelosti L1–L2), naproti tomu „deliberatívny" označuje dynamických agentov riadených LLM so skutočným plánovacím loopom (L4–L5).
Key Takeaways
- ✓Reaktívni agenti sa riadia pevnými pravidlami typu ak-tak bez vlastného plánovania; deliberatívni agenti si stanovujú čiastkové ciele, plánujú viacúrovňovo a svoj plán iteratívne prispôsobujú na základe pozorovaní.
- ✓Os reaktívny–deliberatívny možno priradiť k stupňom zrelosti: L1–L2 sú prevažne reaktívne, L3 mieša obe v pevných pipeline, L4–L5 sú plne deliberatívne.
- ✓Technickým základom deliberatívneho správania je reasoning-loop Perceive→Reason→Act→Observe, koncepčne nadväzujúci na ReAct (Yao et al. 2022).
- ✓Praktické pravidlo: ak je cestu k riešeniu možné naplánovať vopred, postačuje reaktívny/deterministický prístup; ak nie, oplatí sa deliberatívny agent.
- ✓Deliberatívna autonómia zvyšuje flexibilitu, ale aj náklady (token/reasoning), náročnosť údržby a požiadavky na compliance — Guardrails a Human-in-the-Loop sú povinnosťou.
- ✓Prakticky sa architektúry najčastejšie stavajú hybridne: deliberatívne jadro pre plánovanie, reaktívne komponenty pre jasne definované, opakujúce sa kroky.
Reaktívni agenti reagujú na podnety priamo na základe pravidiel a bez plánovania (podnet-reakcia), zatiaľ čo deliberatívni agenti sledujú cieľ, plánujú viacúrovňovo a svoj plán iteratívne prispôsobujú. V praxi AI Agentov označuje „reaktívny" jednoduché, predvídateľné cesty (stupne zrelosti L1–L2), naproti tomu „deliberatívny" označuje dynamických agentov riadených LLM so skutočným plánovacím loopom (L4–L5).
Toto rozlíšenie pochádza pôvodne z klasickej teórie agentov, no pre dnešné hodnotenie AI Agentov je kľúčové: pomáha rozhodovateľom zvoliť k úlohe vhodný typ architektúry — a rozpoznať „agent washing", pri ktorom sa reaktívne systémy predávajú ako autonómni agenti.
Kľúčové rozdiely na prvý pohľad
- Reaktívny znamená: pevná logika ak-tak, žiadna interná reprezentácia cieľov ani plánov, žiadne uvažovanie o budúcich krokoch. Systém priraďuje podnet priamo k reakcii.
- Deliberatívny znamená: systém reprezentuje cieľ, rozkladá ho na čiastkové kroky (Planner), vykonáva ich cez tool-cally (Executor) a pozoruje výsledky, aby plán prispôsobil.
- Rozhodovacie kritérium: ak možno cestu k riešeniu vopred úplne stanoviť, je reaktívny/deterministický prístup robustnejší a lacnejší. Ak cestu nemožno naplánovať vopred, oplatí sa až deliberatívna autonómia.
Konkrétny príklad
Predstavte si support use-case. Reaktívny agent (L1) je FAQ-bot: keď rozpozná kľúčové slovo „faktúra", poskytne uloženú odpoveď — vždy tú istú, nezávisle od kontextu. Rozšírený o jeden tool-call (L2) napríklad vyhľadá stav objednávky cez API. Obe varianty sledujú pevne zadrôtovanú cestu.
Deliberatívny agent (L4) namiesto toho dostane cieľ „Úplne vyrieš požiadavku zákazníka". Prečíta požiadavku, sám rozhodne, že najprv potrebuje históriu objednávok, potom zavolá systém pre vrátenie tovaru, zistí, že je potrebný dobropis, overí oprávnenie a sformuluje riešenie — pričom poradie a voľbu nástrojov určuje dynamicky. Ak nastane neočakávaný výsledok (napr. chýbajúce oprávnenie), plán prispôsobí namiesto toho, aby ho prerušil.
Zaradenie do stupňov zrelosti L1–L5
Os reaktívny–deliberatívny prechádza naprieč bežným modelom stupňov zrelosti:
Stupeň zrelosti | Typ | Charakteristika | Príklad |
|---|---|---|---|
L1 Reflex | čisto reaktívny | založený na pravidlách, LLM nie je potrebné | FAQ-bot, termostat |
L2 Augmented LLM | prevažne reaktívny | LLM + jeden tool-call, reaktívny | ChatGPT s web-search |
L3 Workflow-agent | hybridný | LLM v deterministickej pipeline (prompt-chaining, routing) | štruktúrovaný spracovateľský workflow |
L4 Autonómny agent | plne deliberatívny | LLM dynamicky riadi poradie + voľbu nástrojov, plný loop | Claude Code, Deep Research |
L5 Multi-agent systém | deliberatívny, koordinovaný | viacero autonómnych agentov sa koordinuje cez A2A | Orchestrator + špecialisti |
Dôležité: L3 je zmiešaná zóna. Hoci v pipeline je LLM, postupnosť je predpísaná vývojárom — systém si „neplánuje" sám, ale vypĺňa deterministické kroky. Skutočné deliberatívne správanie sa začína na L4, kde agent poradie krokov a voľbu nástrojov určuje sám.
Ako deliberatívni agenti technicky „uvažujú"
Deliberatívne správanie sa opiera o reasoning-loop Perceive → Reason → Act → Observe, ktorý sa prechádza iteratívne, kým sa cieľ nedosiahne alebo neprerušia. Koncepčným základom je vzor ReAct (Yao et al. 2022, arXiv:2210.03629), ktorý spája reasoning a acting v rámci toho istého LLM-loopu: model premyslí krok dopredu, koná cez nástroj, prečíta výsledok a z neho usúdi ďalší krok.
Umožňuje to päť komponentov: LLM-Core (reasoning), Memory (krátkodobá = context, dlhodobá = vektor/RAG/files), Tools (function-cally, API, MCP-servery, browser, code-sandbox), Planner (cieľ → čiastkové kroky) a Executor (tool-cally, turns, loop-limity, Guardrails). Reaktívni agenti z toho potrebujú len zlomok — typicky bázu pravidiel a nanajvýš jediný konektor.
Zvažovanie výhod a nevýhod
Deliberatívna autonómia nie je samoúčelná. Flexibilitu kupuje za cenu vyšších nákladov a vyššej prevádzkovej náročnosti:
- Náklady: viacúrovňový reasoning a množstvo tool-callov ženú spotrebu tokenov nahor. Routing (jednoduché požiadavky na menšie modely) a caching to tlmia, ale neeliminujú.
- Údržba: reaktívne workflow sú lacné na údržbu; deliberatívni agenti potrebujú observability, loop-limity a kontinuálny monitoring, pretože ich správanie nie je deterministické.
- Compliance: vyššia autonómia znamená vyššie požiadavky — EU AI Act (povinnosti transparentnosti čl. 50 od 02.08.2026; KI-kompetencia podľa čl. 4 od 02.02.2025), témy GDPR (čl. 22/28/35) a spolurozhodovanie (BetrVG §87 v DE, ArbVG §96 v AT). Tieto údaje sú informačné a nie sú právnym poradenstvom.
Že je táto náročnosť reálna, ukazujú trhové dáta: podľa Gartner (jún 2025) bude pravdepodobne vyše 40 % projektov agentickej AI do konca roka 2027 zrušených — často preto, že bol zvolený deliberatívny agent tam, kde by postačoval reaktívny alebo workflow prístup. Súčasne podľa McKinsey State of AI 2025 škáluje aspoň jeden agentický use case zatiaľ len 23 % firiem, 39 % experimentuje.
Kedy ktorý typ — rozhodovacie pravidlo
Pragmatické praktické pravidlo znie: Deliberatívny agent sa oplatí až vtedy, keď cestu k riešeniu nemožno naplánovať vopred.
- Reaktívny/workflow zvoľte, keď sú kroky pevne dané, vstupy sú štruktúrované a determinizmus je žiaduci (napr. validácia dát, routing, jasne definované štandardné procesy). Reaktívne systémy sú lacnejšie, predvídateľnejšie a ľahšie auditovateľné.
- Deliberatívny zvoľte, keď je úloha otvorená, potrebné kroky závisia od kontextu a cesta sa vyjasní až za behu (napr. rešerš, viacúrovňová diagnostika chýb, komplexné spracovanie prípadov).
V praxi je väčšina produktívnych systémov hybridná: deliberatívne jadro preberá plánovanie a dynamické rozhodnutia, zatiaľ čo reaktívne komponenty spoľahlivo a nákladovo efektívne spracúvajú jasne definované, opakujúce sa čiastkové kroky. Tak sa kombinuje robustnosť reaktívnej logiky s flexibilitou deliberatívneho plánovania — a vyhne sa nasadeniu drahej autonómie tam, kde neprináša pridanú hodnotu.
Často kladené otázky
Aký je hlavný rozdiel medzi reaktívnymi a deliberatívnymi agentmi?
Ktorému stupňu zrelosti zodpovedajú reaktívni resp. deliberatívni agenti?
Je L3 workflow-agent reaktívny alebo deliberatívny?
Kedy by som mal nasadiť reaktívneho namiesto deliberatívneho agenta?
Prečo sú deliberatívni agenti drahší v prevádzke?
Aký súvis má prístup ReAct s deliberatívnymi agentmi?
Ísť hlbšie?
Získajte nové analýzy priamo do schránky – alebo sa pozrite, ako tieto poznatky nasadzujeme pre firmy.