Preskočiť na obsah
5.4Pokročilý7 min

Agent-Handoffs: odovzdávanie kontextu a stavu medzi agentmi

Blck Alpaca·
Definition

Agent-handoff je riadené odovzdanie úlohy spolu s kontextom a stavom z jedného AI agenta inému. Namiesto toho, aby na otázku odpovedal sám, agent posunie dialóg špecializovanému agentovi. Rozhodujúce je, aký kontext sa odovzdáva: celá história, zhrnutie alebo štruktúrovaný stav.

Key Takeaways

  • Handoff neodovzdáva len úlohu, ale aj kontext a stav - práve to, ako prebehne odovzdanie, rozhoduje o úspechu alebo zlyhaní multi-agentového systému.
  • Tri stratégie: celá konverzačná história (najvyššia vernosť, drahá), komprimované zhrnutie (vzor Anthropic research agenta, token-efektívne) a štruktúrovaný stav (typovaná schéma, najrobustnejší).
  • V OpenAI Agents SDK (marec 2025) sú handoffy explicitným first-class konceptom: ťah jedného agenta sa končí, iný preberá s odovzdanou históriou - vychádza z frameworku Swarm (október 2024).
  • Hlavnými zdrojmi chýb sú fragmentácia kontextu pri prílišnej kompresii, nekonečné handoffy (resource-deadlock) a cascading failures, pri ktorých sa nesprávny fakt šíri celou reťazou.
  • Best practice (stav 2026): zápisovú cestu udržiavať single-threaded, výstupy sub-agentov vynútiť do typovanej schémy, pred vrátením komprimovať a každému handoffu pridať trace-ID plus timeout.

Agent-handoff je riadené odovzdanie úlohy spolu s kontextom a stavom z jedného AI agenta inému. Namiesto toho, aby požiadavku dokončil sám, agent posunie prebiehajúci dialóg špecializovanému agentovi. Centrálna otázka návrhu neznie či, ale čo sa odovzdáva: celá konverzačná história, komprimované zhrnutie alebo štruktúrovaný stav. Toto rozhodnutie určuje viac než ktorékoľvek iné, či multi-agentový systém funguje, alebo zlyháva na strate kontextu.

  • Čo sa odovzdáva? Kontext (doterajší dialóg, rozhodnutia, medzivýsledky) a stav (štruktúrované dáta, status úlohy, premenné) - v jednom z troch stupňov vernosti.
  • Kto preberá kontrolu? Na rozdiel od tool-callu po handoffe preberajúci agent vedie dialóg ďalej; odovzdávajúci agent sa vzdáva svojho ťahu.
  • Čo sa môže pokaziť? Strata kontextu pri prílišnej kompresii, nekonečné handoffy (resource-deadlock) a cascading failures, pri ktorých nesprávny fakt putuje celou reťazou.

Tri handoff stratégie: celá história, zhrnutie, štruktúrovaný stav

Voľba stratégie odovzdania je v jadre kompromisom medzi informačnou vernosťou a nákladmi na tokeny - a závisí od previazanosti stavu (state coupling) medzi čiastkovými úlohami.

1. Celá konverzačná história. Preberajúci agent dostane kompletný doterajší trace - všetky správy, tool-cally a medzirozhodnutia. Cognition.ai zastáva pre úzko previazanú prácu (v ktorej každá akcia ovplyvňuje nadväzujúce rozhodnutia) presne tento postoj: zdieľať kompletné agent-trace, nielen jednotlivé správy. Odôvodnenie je tvrdé: Zdanlivé nezhody medzi agentmi sú zvyčajne symptómami fragmentácie kontextu, nie skutočného nesúhlasu. Implicitné rozhodnutia, ktoré sa neodovzdajú spolu s ostatným, vedú k nekompatibilným nadväzujúcim rozhodnutiam. Cena: vysoká spotreba tokenov, ktorá rastie s každým handoffom.

2. Komprimované zhrnutie. Odovzdávajúci agent zhustí svoj kontext do summary, skôr než odovzdá. To je referenčný vzor Anthropic Research Agenta (zdokumentovaný v „How we built our multi-agent research system", 13. jún 2025): Každý sub-agent pracuje vo svojom vlastnom kontextovom okne s cca 200k tokenmi a vracia lead-agentovi komprimované zhrnutie - nikdy nie celý prepis. Lead z neho syntetizuje odpoveď. Jeho kontextové okno tak ostáva rezervované pre plán, výsledky sub-agentov a syntézu namiesto surových vyhľadávacích snippetov. Token-efektívne a paralelizovateľné, no s rizikom straty kontextu, ak sa zhusťuje príliš silno.

3. Štruktúrovaný stav. Namiesto voľného textu sa odovzdáva typovaná schéma (Pydantic model, JSON-schéma alebo A2A-artifact). To je najrobustnejší variant pre jasne definované odovzdania, pretože formát vynucuje úplnosť a nič sa implicitne nestratí. LangGraph posúva typovaný state-objekt cez svoje uzly a durabilne ho checkpointuje - prerušený workflow po reštarte servera pokračuje od posledného checkpointu.

Stratégia

Informačná vernosť

Náklady na tokeny

Vhodné pre

Hlavné riziko

Celá história

Najvyššia

Vysoké, rastú s každým handoffom

Úzko previazané, sekvenčné úlohy

Kontext-bloat, explózia nákladov

Komprimované zhrnutie

Stredná

Nízke

Paralelizovateľné read-mostly úlohy

Strata kontextu pri prílišnej kompresii

Štruktúrovaný stav

Vysoká (pre definované polia)

Nízke–stredné

Pipeline, jasné kontrakty

Strata nemodelovaných informácií

Handoffy v OpenAI Agents SDK a v modeli Swarm

OpenAI Agents SDK (marec 2025) zavádza handoffy ako explicitný first-class koncept. Je to premenovaná a rozšírená verzia OpenAI Swarm (október 2024), referenčného frameworku pre peer-to-peer/swarm vzor. Sémantika podľa research zdroja: Ťah jedného agenta sa končí, začína ťah iného agenta - konverzačná história sa odovzdáva ďalej. Triage-agent teda rozhodne, že požiadavka patrí billing-agentovi, a odovzdá; odvtedy dialóg vedie billing-agent.

To ostro odlišuje handoffy od tool-callu: pri tool-calle si ten istý agent ponecháva kontrolu a dostane späť len výsledok. Pri handoffe sa mení zodpovednosť. Pre porovnanie sémantika message-passingu najdôležitejších stackov:

Stack

Sémantika handoffu/odovzdania

OpenAI Agents SDK

Explicitné handoffy; výmena ťahu, história sa odovzdáva ďalej

AutoGen

Group-chat so striedaním ťahov; zdieľaná história; adresovanie cez mentions

LangGraph

Typovaný state-objekt cez uzly; checkpointovaný; durabilný cez reštarty

Anthropic Claude Agent SDK

Lead spawnuje sub-agentov cez Task-Tool; vrátenie komprimovaných štruktúrovaných výstupov

A2A (naprieč poskytovateľmi)

Task-lifecycle submitted → working → input-required → completed/failed/canceled; multi-part správy; artifacty ako výstup; interná logika agentov ostáva opaktná

Pre odovzdania naprieč hranicami poskytovateľov (napríklad Salesforce-agent, ktorý volá SAP-Joule-agenta) nie je kontraktom SDK-handoff, ale protokol A2A. Tam task-lifecycle definuje stavy, cieľový agent publikuje AgentCard so svojimi schopnosťami a výsledok sa vracia ako artifact - interné prompty a modely pritom ostávajú zámerne skryté.

Zdroje chýb: strata kontextu a nekonečné handoffy

Handoffy vytvárajú triedy chýb, ktoré single-agentový systém nepozná. Štyri z nich sú priamo relevantné pre handoffy:

  • Fragmentácia kontextu. Sub-agenti robia nekompatibilné implicitné rozhodnutia, pretože pri odovzdávaní sa stratil kontext. Protiopatrenie: zdieľať celé trace tam, kde je previazanosť vysoká; explicitné rozhodovacie kontrakty.
  • Cascading failures. Jeden agent halucinuje fakt; ďalší ho preberá ako pravdu; downstream konajú ďalší agenti na nesprávnom základe. Protiopatrenie: verifier-judge agent, podložené retrieval zdroje, povinné citácie.
  • Resource-deadlock / nekonečné handoffy. Agenti na seba čakajú v kruhu (A čaká na výsledok od B, B na spätnú otázku od A) alebo opakovane posúvajú úlohu sem a tam. Protiopatrenie: timeout na každú úlohu, explicitný stav input-required (A2A), tvrdý limit na handoff kroky na beh.
  • Authority-confusion. Sub-agent prepíše inštrukcie leada, alebo lead stratí autoritu nad dialógom. Protiopatrenie: jasné hierarchie rolí a silné AgentCard/task kontrakty.

Dodatočný bezpečnostný aspekt: Každé nové kontextové okno agenta je novou plochou pre útok. Amplifikácia prompt-injection škáluje lineárne s počtom agentov, ktorí prijímajú nedôveryhodný obsah - trieda EchoLeak (CVE-2025-32711, ktorú Aim Labs v júni 2025 zverejnili voči Microsoft 365 Copilot) je tu zdokumentovaným referenčným prípadom.

Best practices pre robustné handoffy

Z návrhu Anthropic research agenta a syntézy Cognition (stav 2026) možno odvodiť praktický checklist:

  1. Zápisovú cestu udržiavať single-threaded. Mnoho agentov smie čítať, rešeršovať a navrhovať - ale commituje len jeden agent alebo jeden stupeň pipeline. Aktualizovaný postoj Cognition (apríl 2026): Viacerí agenti prispievajú inteligenciou, kým zápisové operácie ostávajú single-threaded. Paralelné zápisové swarmy rozbíjajú kontext.
  2. Výstupy vynútiť do typovanej schémy. Výsledky sub-agentov ako Pydantic model, JSON-schéma alebo A2A-artifact, nie ako voľný text.
  3. Pred vrátením komprimovať. Nikdy nepipovať celý prepis sub-agenta späť leadovi.
  4. Delegovanie učiť explicitne. Každý sub-agent dostane cieľ, výstupný formát, pokyny k toolom/zdrojom a jasné hranice úlohy. U Anthropic vágne delegovania spôsobovali dvojitú prácu a medzery v pokrytí.
  5. Token-budget na sub-agenta obmedziť a každému handoffu pridať trace-ID plus timeout - pre dohľadateľnosť a proti nekonečným slučkám.

Príklad: spracovanie škôd so siedmimi agentmi (Allianz Project Nemo)

Allianz Project Nemo spracúva škody zo skazenia potravín po prírodných katastrofách so siedmimi špecializovanými agentmi: Planner, Cyber, Coverage, Weather, Fraud, Payout, Audit. Workflow beží ako hierarchická reťaz handoffov - Planner rozloží prípad, odovzdá Coverage a Weather na preverenie, Fraud na kontrolu podvodu a napokon Payout. Dedikovaný Audit-agent vytvára kompletné zhrnutie všetkých rozhodnutí agentov a ich zdôvodnení, a tým zabudováva audit-trail priamo do topológie agentov, nie až do loggingu.

Konkrétne čísla (nasadené v Austrálii, júl 2025, live za menej ako 100 dní): Celý sedem-agentový workflow je dokončený za menej ako päť minút, čas spracovania a vybavenia oprávnených škôd pod AUD 500 klesol o 80 percent. Rozhodujúce: Finálny payout ostáva human-in-the-loop - referent preverí audit-zhrnutie. To je single-threaded write v čistej podobe: Šesť agentov prispieva inteligenciou, jeden (plus človek) rozhoduje.

Pseudokód jadra handoffu:

```
planner.handoff(coverage, state={fall_id, police, schadenshöhe})
coverage.handoff(fraud, state + {deckung_ok: true})
fraud.handoff(payout, state + {betrugsscore: 0.04})
payout.handoff(audit, state + {empfehlung: "auszahlen", betrag: 480})
audit -> human_review(zusammenfassung) # einziger Write-Commit
```

Pre agentúry a B2B rozhodovateľov

Kto produkčne plánuje multi-agentové workflowy - či už ako stredne veľký podnik v regióne DACH s jedným či dvomi use-casmi, alebo ako agentúra, ktorá produktizuje agentické služby -, mal by spraviť z handoff stratégie prvé architektonické rozhodnutie. Pravidlo palca: default na štruktúrovaný stav alebo komprimované zhrnutie, celá história len pri vysokej previazanosti; zápisová cesta single-threaded; každý handoff s timeoutom, limitom krokov a trace-ID. Ako agentúre sa oplatí spraviť vlastných agentov A2A-schopnými s publikovanými AgentCardmi, aby ich systémy klientov (Agentforce, Joule, Copilot Studio) mohli osloviť bez custom integrácie. Blck Alpaca sprevádza DACH B2B tímy pri návrhu takýchto handoff architektúr - od výberu vzoru až po observabilitu naprieč celou reťazou agentov.

Často kladené otázky

Aký je rozdiel medzi handoffom a bežným tool-callom?
Tool-call zavolá funkciu alebo dátový zdroj a vráti výsledok späť tomu istému agentovi, ktorý si ďalej ponecháva kontrolu. Pri handoffe agent naopak odovzdáva konverzáciu a vedenie úlohy inému agentovi - preberajúci agent pokračuje v dialógu. V OpenAI Agents SDK je práve toto sémantika handoffu: ťah jedného agenta sa končí, ďalší začína s odovzdanou históriou.
Celá história alebo zhrnutie - ktorá handoff stratégia je lepšia?
Závisí to od previazanosti stavu (state coupling). Pri vysokej previazanosti, kde každé rozhodnutie ovplyvňuje nadväzujúce rozhodnutia, Cognition odporúča zdieľať kompletné agent-trace namiesto len jednotlivých správ, pretože fragmentovaný kontext je hlavnou príčinou kaskádových chýb. Pri nízkej previazanosti a paralelizovateľných úlohách vzor Anthropic research agenta využíva komprimované zhrnutia na úsporu tokenov. Štruktúrovaný stav je najrobustnejší variant pre jasne definované odovzdania.
Ako zabrániť nekonečným handoffom medzi agentmi?
Nekonečné handoffy sa vyskytujú ako resource-deadlock (agent A čaká na výsledok od B, B na spätnú otázku od A) alebo ako opakované posúvanie úlohy sem a tam. Protiopatreniami sú: timeout na každú úlohu, explicitný stav input-required ako v protokole A2A, maximum handoff krokov na beh a jasné hierarchie rolí, aby si jeden agent ponechal autoritu.
Čo je strata kontextu pri handoffe a prečo je nebezpečná?
Strata kontextu nastáva, keď pri odovzdávaní vypadnú relevantné informácie - napríklad preto, že sa zhrnulo príliš silno alebo sa odovzdali len jednotlivé správy namiesto celého trace. Cognition opisuje, že zdanlivé nezhody medzi agentmi sú zvyčajne symptómami fragmentácie kontextu. Preberajúci agent potom robí nekompatibilné implicitné rozhodnutia, ktoré vedú k chybným výsledkom.
Ktoré frameworky natívne podporujú agent-handoffy?
OpenAI Agents SDK (marec 2025, vychádza zo Swarm) využíva explicitné handoffy ako základný koncept. LangGraph posúva typovaný state-objekt cez uzly a durabilne ho checkpointuje. AutoGen pracuje s group-chatom a striedaním ťahov spolu so zdieľanou históriou. Anthropic Claude Agent SDK spawnuje sub-agentov cez Task-Tool, ktorí vracajú komprimované štruktúrované výstupy. Naprieč poskytovateľmi prebieha odovzdanie cez protokol A2A s jeho task-lifecycle.

Ísť hlbšie?

Získajte nové analýzy priamo do schránky – alebo sa pozrite, ako tieto poznatky nasadzujeme pre firmy.