Preskočiť na obsah
1.7Pokročilý6 min

Reaktívni vs. deliberatívni agenti

Blck Alpaca·
Definition

Reaktívni agenti reagujú na podnety priamo na základe pravidiel a bez plánovania (podnet-reakcia), zatiaľ čo deliberatívni agenti sledujú cieľ, plánujú viacúrovňovo a svoj plán iteratívne prispôsobujú. V praxi AI Agentov označuje „reaktívny" jednoduché, predvídateľné cesty (stupne zrelosti L1–L2), naproti tomu „deliberatívny" označuje dynamických agentov riadených LLM so skutočným plánovacím loopom (L4–L5).

Key Takeaways

  • Reaktívni agenti sa riadia pevnými pravidlami typu ak-tak bez vlastného plánovania; deliberatívni agenti si stanovujú čiastkové ciele, plánujú viacúrovňovo a svoj plán iteratívne prispôsobujú na základe pozorovaní.
  • Os reaktívny–deliberatívny možno priradiť k stupňom zrelosti: L1–L2 sú prevažne reaktívne, L3 mieša obe v pevných pipeline, L4–L5 sú plne deliberatívne.
  • Technickým základom deliberatívneho správania je reasoning-loop Perceive→Reason→Act→Observe, koncepčne nadväzujúci na ReAct (Yao et al. 2022).
  • Praktické pravidlo: ak je cestu k riešeniu možné naplánovať vopred, postačuje reaktívny/deterministický prístup; ak nie, oplatí sa deliberatívny agent.
  • Deliberatívna autonómia zvyšuje flexibilitu, ale aj náklady (token/reasoning), náročnosť údržby a požiadavky na compliance — Guardrails a Human-in-the-Loop sú povinnosťou.
  • Prakticky sa architektúry najčastejšie stavajú hybridne: deliberatívne jadro pre plánovanie, reaktívne komponenty pre jasne definované, opakujúce sa kroky.

Reaktívni agenti reagujú na podnety priamo na základe pravidiel a bez plánovania (podnet-reakcia), zatiaľ čo deliberatívni agenti sledujú cieľ, plánujú viacúrovňovo a svoj plán iteratívne prispôsobujú. V praxi AI Agentov označuje „reaktívny" jednoduché, predvídateľné cesty (stupne zrelosti L1–L2), naproti tomu „deliberatívny" označuje dynamických agentov riadených LLM so skutočným plánovacím loopom (L4–L5).

Toto rozlíšenie pochádza pôvodne z klasickej teórie agentov, no pre dnešné hodnotenie AI Agentov je kľúčové: pomáha rozhodovateľom zvoliť k úlohe vhodný typ architektúry — a rozpoznať „agent washing", pri ktorom sa reaktívne systémy predávajú ako autonómni agenti.

Kľúčové rozdiely na prvý pohľad

  • Reaktívny znamená: pevná logika ak-tak, žiadna interná reprezentácia cieľov ani plánov, žiadne uvažovanie o budúcich krokoch. Systém priraďuje podnet priamo k reakcii.
  • Deliberatívny znamená: systém reprezentuje cieľ, rozkladá ho na čiastkové kroky (Planner), vykonáva ich cez tool-cally (Executor) a pozoruje výsledky, aby plán prispôsobil.
  • Rozhodovacie kritérium: ak možno cestu k riešeniu vopred úplne stanoviť, je reaktívny/deterministický prístup robustnejší a lacnejší. Ak cestu nemožno naplánovať vopred, oplatí sa až deliberatívna autonómia.

Konkrétny príklad

Predstavte si support use-case. Reaktívny agent (L1) je FAQ-bot: keď rozpozná kľúčové slovo „faktúra", poskytne uloženú odpoveď — vždy tú istú, nezávisle od kontextu. Rozšírený o jeden tool-call (L2) napríklad vyhľadá stav objednávky cez API. Obe varianty sledujú pevne zadrôtovanú cestu.

Deliberatívny agent (L4) namiesto toho dostane cieľ „Úplne vyrieš požiadavku zákazníka". Prečíta požiadavku, sám rozhodne, že najprv potrebuje históriu objednávok, potom zavolá systém pre vrátenie tovaru, zistí, že je potrebný dobropis, overí oprávnenie a sformuluje riešenie — pričom poradie a voľbu nástrojov určuje dynamicky. Ak nastane neočakávaný výsledok (napr. chýbajúce oprávnenie), plán prispôsobí namiesto toho, aby ho prerušil.

Zaradenie do stupňov zrelosti L1–L5

Os reaktívny–deliberatívny prechádza naprieč bežným modelom stupňov zrelosti:

Stupeň zrelosti

Typ

Charakteristika

Príklad

L1 Reflex

čisto reaktívny

založený na pravidlách, LLM nie je potrebné

FAQ-bot, termostat

L2 Augmented LLM

prevažne reaktívny

LLM + jeden tool-call, reaktívny

ChatGPT s web-search

L3 Workflow-agent

hybridný

LLM v deterministickej pipeline (prompt-chaining, routing)

štruktúrovaný spracovateľský workflow

L4 Autonómny agent

plne deliberatívny

LLM dynamicky riadi poradie + voľbu nástrojov, plný loop

Claude Code, Deep Research

L5 Multi-agent systém

deliberatívny, koordinovaný

viacero autonómnych agentov sa koordinuje cez A2A

Orchestrator + špecialisti

Dôležité: L3 je zmiešaná zóna. Hoci v pipeline je LLM, postupnosť je predpísaná vývojárom — systém si „neplánuje" sám, ale vypĺňa deterministické kroky. Skutočné deliberatívne správanie sa začína na L4, kde agent poradie krokov a voľbu nástrojov určuje sám.

Ako deliberatívni agenti technicky „uvažujú"

Deliberatívne správanie sa opiera o reasoning-loop Perceive → Reason → Act → Observe, ktorý sa prechádza iteratívne, kým sa cieľ nedosiahne alebo neprerušia. Koncepčným základom je vzor ReAct (Yao et al. 2022, arXiv:2210.03629), ktorý spája reasoning a acting v rámci toho istého LLM-loopu: model premyslí krok dopredu, koná cez nástroj, prečíta výsledok a z neho usúdi ďalší krok.

Umožňuje to päť komponentov: LLM-Core (reasoning), Memory (krátkodobá = context, dlhodobá = vektor/RAG/files), Tools (function-cally, API, MCP-servery, browser, code-sandbox), Planner (cieľ → čiastkové kroky) a Executor (tool-cally, turns, loop-limity, Guardrails). Reaktívni agenti z toho potrebujú len zlomok — typicky bázu pravidiel a nanajvýš jediný konektor.

Zvažovanie výhod a nevýhod

Deliberatívna autonómia nie je samoúčelná. Flexibilitu kupuje za cenu vyšších nákladov a vyššej prevádzkovej náročnosti:

  • Náklady: viacúrovňový reasoning a množstvo tool-callov ženú spotrebu tokenov nahor. Routing (jednoduché požiadavky na menšie modely) a caching to tlmia, ale neeliminujú.
  • Údržba: reaktívne workflow sú lacné na údržbu; deliberatívni agenti potrebujú observability, loop-limity a kontinuálny monitoring, pretože ich správanie nie je deterministické.
  • Compliance: vyššia autonómia znamená vyššie požiadavky — EU AI Act (povinnosti transparentnosti čl. 50 od 02.08.2026; KI-kompetencia podľa čl. 4 od 02.02.2025), témy GDPR (čl. 22/28/35) a spolurozhodovanie (BetrVG §87 v DE, ArbVG §96 v AT). Tieto údaje sú informačné a nie sú právnym poradenstvom.

Že je táto náročnosť reálna, ukazujú trhové dáta: podľa Gartner (jún 2025) bude pravdepodobne vyše 40 % projektov agentickej AI do konca roka 2027 zrušených — často preto, že bol zvolený deliberatívny agent tam, kde by postačoval reaktívny alebo workflow prístup. Súčasne podľa McKinsey State of AI 2025 škáluje aspoň jeden agentický use case zatiaľ len 23 % firiem, 39 % experimentuje.

Kedy ktorý typ — rozhodovacie pravidlo

Pragmatické praktické pravidlo znie: Deliberatívny agent sa oplatí až vtedy, keď cestu k riešeniu nemožno naplánovať vopred.

  • Reaktívny/workflow zvoľte, keď sú kroky pevne dané, vstupy sú štruktúrované a determinizmus je žiaduci (napr. validácia dát, routing, jasne definované štandardné procesy). Reaktívne systémy sú lacnejšie, predvídateľnejšie a ľahšie auditovateľné.
  • Deliberatívny zvoľte, keď je úloha otvorená, potrebné kroky závisia od kontextu a cesta sa vyjasní až za behu (napr. rešerš, viacúrovňová diagnostika chýb, komplexné spracovanie prípadov).

V praxi je väčšina produktívnych systémov hybridná: deliberatívne jadro preberá plánovanie a dynamické rozhodnutia, zatiaľ čo reaktívne komponenty spoľahlivo a nákladovo efektívne spracúvajú jasne definované, opakujúce sa čiastkové kroky. Tak sa kombinuje robustnosť reaktívnej logiky s flexibilitou deliberatívneho plánovania — a vyhne sa nasadeniu drahej autonómie tam, kde neprináša pridanú hodnotu.

Často kladené otázky

Aký je hlavný rozdiel medzi reaktívnymi a deliberatívnymi agentmi?
Reaktívni agenti priraďujú podnet priamo k reakcii na základe pevných pravidiel, bez plánovania. Deliberatívni agenti sledujú cieľ, rozkladajú ho na čiastkové kroky, vykonávajú ich a svoj plán iteratívne prispôsobujú na základe výsledkov.
Ktorému stupňu zrelosti zodpovedajú reaktívni resp. deliberatívni agenti?
Reaktívni agenti sa nachádzajú prevažne na úrovni L1 (reflex/založené na pravidlách) a L2 (augmented LLM s jedným tool-callom). L3 je hybridná zmiešaná zóna s deterministickou pipeline. Plne deliberatívne správanie sa začína na L4 (autonómny agent) a L5 (multi-agent systém).
Je L3 workflow-agent reaktívny alebo deliberatívny?
L3 je hybridný. Využíva LLM, ale postupnosť krokov je daná vývojárom (prompt-chaining, routing). Systém si poradie krokov sám neplánuje — skutočné deliberatívne plánovanie sa začína až na L4.
Kedy by som mal nasadiť reaktívneho namiesto deliberatívneho agenta?
Keď je cestu k riešeniu možné naplánovať vopred, vstupy sú štruktúrované a determinizmus je žiaduci. Reaktívne resp. workflow prístupy sú potom lacnejšie, predvídateľnejšie a ľahšie auditovateľné ako deliberatívny agent.
Prečo sú deliberatívni agenti drahší v prevádzke?
Viacúrovňový reasoning a množstvo dynamických tool-callov zvyšuje spotrebu tokenov a nedeterministické správanie si vyžaduje observability, loop-limity a priebežný monitoring. Routing a caching náklady tlmia, ale neodstraňujú ich.
Aký súvis má prístup ReAct s deliberatívnymi agentmi?
ReAct (Yao et al. 2022, arXiv:2210.03629) spája reasoning a acting v rámci toho istého LLM-loopu a je koncepčným základom deliberatívneho správania. Realizuje iteratívny loop Perceive→Reason→Act→Observe, ktorým agent plánuje, koná a prispôsobuje svoj plán.

Ísť hlbšie?

Získajte nové analýzy priamo do schránky – alebo sa pozrite, ako tieto poznatky nasadzujeme pre firmy.