Agent-Handoffs: odovzdávanie kontextu a stavu medzi agentmi
Agent-handoff je riadené odovzdanie úlohy spolu s kontextom a stavom z jedného AI agenta inému. Namiesto toho, aby na otázku odpovedal sám, agent posunie dialóg špecializovanému agentovi. Rozhodujúce je, aký kontext sa odovzdáva: celá história, zhrnutie alebo štruktúrovaný stav.
Key Takeaways
- ✓Handoff neodovzdáva len úlohu, ale aj kontext a stav - práve to, ako prebehne odovzdanie, rozhoduje o úspechu alebo zlyhaní multi-agentového systému.
- ✓Tri stratégie: celá konverzačná história (najvyššia vernosť, drahá), komprimované zhrnutie (vzor Anthropic research agenta, token-efektívne) a štruktúrovaný stav (typovaná schéma, najrobustnejší).
- ✓V OpenAI Agents SDK (marec 2025) sú handoffy explicitným first-class konceptom: ťah jedného agenta sa končí, iný preberá s odovzdanou históriou - vychádza z frameworku Swarm (október 2024).
- ✓Hlavnými zdrojmi chýb sú fragmentácia kontextu pri prílišnej kompresii, nekonečné handoffy (resource-deadlock) a cascading failures, pri ktorých sa nesprávny fakt šíri celou reťazou.
- ✓Best practice (stav 2026): zápisovú cestu udržiavať single-threaded, výstupy sub-agentov vynútiť do typovanej schémy, pred vrátením komprimovať a každému handoffu pridať trace-ID plus timeout.
Agent-handoff je riadené odovzdanie úlohy spolu s kontextom a stavom z jedného AI agenta inému. Namiesto toho, aby požiadavku dokončil sám, agent posunie prebiehajúci dialóg špecializovanému agentovi. Centrálna otázka návrhu neznie či, ale čo sa odovzdáva: celá konverzačná história, komprimované zhrnutie alebo štruktúrovaný stav. Toto rozhodnutie určuje viac než ktorékoľvek iné, či multi-agentový systém funguje, alebo zlyháva na strate kontextu.
- Čo sa odovzdáva? Kontext (doterajší dialóg, rozhodnutia, medzivýsledky) a stav (štruktúrované dáta, status úlohy, premenné) - v jednom z troch stupňov vernosti.
- Kto preberá kontrolu? Na rozdiel od tool-callu po handoffe preberajúci agent vedie dialóg ďalej; odovzdávajúci agent sa vzdáva svojho ťahu.
- Čo sa môže pokaziť? Strata kontextu pri prílišnej kompresii, nekonečné handoffy (resource-deadlock) a cascading failures, pri ktorých nesprávny fakt putuje celou reťazou.
Tri handoff stratégie: celá história, zhrnutie, štruktúrovaný stav
Voľba stratégie odovzdania je v jadre kompromisom medzi informačnou vernosťou a nákladmi na tokeny - a závisí od previazanosti stavu (state coupling) medzi čiastkovými úlohami.
1. Celá konverzačná história. Preberajúci agent dostane kompletný doterajší trace - všetky správy, tool-cally a medzirozhodnutia. Cognition.ai zastáva pre úzko previazanú prácu (v ktorej každá akcia ovplyvňuje nadväzujúce rozhodnutia) presne tento postoj: zdieľať kompletné agent-trace, nielen jednotlivé správy. Odôvodnenie je tvrdé: Zdanlivé nezhody medzi agentmi sú zvyčajne symptómami fragmentácie kontextu, nie skutočného nesúhlasu. Implicitné rozhodnutia, ktoré sa neodovzdajú spolu s ostatným, vedú k nekompatibilným nadväzujúcim rozhodnutiam. Cena: vysoká spotreba tokenov, ktorá rastie s každým handoffom.
2. Komprimované zhrnutie. Odovzdávajúci agent zhustí svoj kontext do summary, skôr než odovzdá. To je referenčný vzor Anthropic Research Agenta (zdokumentovaný v „How we built our multi-agent research system", 13. jún 2025): Každý sub-agent pracuje vo svojom vlastnom kontextovom okne s cca 200k tokenmi a vracia lead-agentovi komprimované zhrnutie - nikdy nie celý prepis. Lead z neho syntetizuje odpoveď. Jeho kontextové okno tak ostáva rezervované pre plán, výsledky sub-agentov a syntézu namiesto surových vyhľadávacích snippetov. Token-efektívne a paralelizovateľné, no s rizikom straty kontextu, ak sa zhusťuje príliš silno.
3. Štruktúrovaný stav. Namiesto voľného textu sa odovzdáva typovaná schéma (Pydantic model, JSON-schéma alebo A2A-artifact). To je najrobustnejší variant pre jasne definované odovzdania, pretože formát vynucuje úplnosť a nič sa implicitne nestratí. LangGraph posúva typovaný state-objekt cez svoje uzly a durabilne ho checkpointuje - prerušený workflow po reštarte servera pokračuje od posledného checkpointu.
Stratégia | Informačná vernosť | Náklady na tokeny | Vhodné pre | Hlavné riziko |
|---|---|---|---|---|
Celá história | Najvyššia | Vysoké, rastú s každým handoffom | Úzko previazané, sekvenčné úlohy | Kontext-bloat, explózia nákladov |
Komprimované zhrnutie | Stredná | Nízke | Paralelizovateľné read-mostly úlohy | Strata kontextu pri prílišnej kompresii |
Štruktúrovaný stav | Vysoká (pre definované polia) | Nízke–stredné | Pipeline, jasné kontrakty | Strata nemodelovaných informácií |
Handoffy v OpenAI Agents SDK a v modeli Swarm
OpenAI Agents SDK (marec 2025) zavádza handoffy ako explicitný first-class koncept. Je to premenovaná a rozšírená verzia OpenAI Swarm (október 2024), referenčného frameworku pre peer-to-peer/swarm vzor. Sémantika podľa research zdroja: Ťah jedného agenta sa končí, začína ťah iného agenta - konverzačná história sa odovzdáva ďalej. Triage-agent teda rozhodne, že požiadavka patrí billing-agentovi, a odovzdá; odvtedy dialóg vedie billing-agent.
To ostro odlišuje handoffy od tool-callu: pri tool-calle si ten istý agent ponecháva kontrolu a dostane späť len výsledok. Pri handoffe sa mení zodpovednosť. Pre porovnanie sémantika message-passingu najdôležitejších stackov:
Stack | Sémantika handoffu/odovzdania |
|---|---|
OpenAI Agents SDK | Explicitné handoffy; výmena ťahu, história sa odovzdáva ďalej |
AutoGen | Group-chat so striedaním ťahov; zdieľaná história; adresovanie cez mentions |
LangGraph | Typovaný state-objekt cez uzly; checkpointovaný; durabilný cez reštarty |
Anthropic Claude Agent SDK | Lead spawnuje sub-agentov cez Task-Tool; vrátenie komprimovaných štruktúrovaných výstupov |
A2A (naprieč poskytovateľmi) | Task-lifecycle |
Pre odovzdania naprieč hranicami poskytovateľov (napríklad Salesforce-agent, ktorý volá SAP-Joule-agenta) nie je kontraktom SDK-handoff, ale protokol A2A. Tam task-lifecycle definuje stavy, cieľový agent publikuje AgentCard so svojimi schopnosťami a výsledok sa vracia ako artifact - interné prompty a modely pritom ostávajú zámerne skryté.
Zdroje chýb: strata kontextu a nekonečné handoffy
Handoffy vytvárajú triedy chýb, ktoré single-agentový systém nepozná. Štyri z nich sú priamo relevantné pre handoffy:
- Fragmentácia kontextu. Sub-agenti robia nekompatibilné implicitné rozhodnutia, pretože pri odovzdávaní sa stratil kontext. Protiopatrenie: zdieľať celé trace tam, kde je previazanosť vysoká; explicitné rozhodovacie kontrakty.
- Cascading failures. Jeden agent halucinuje fakt; ďalší ho preberá ako pravdu; downstream konajú ďalší agenti na nesprávnom základe. Protiopatrenie: verifier-judge agent, podložené retrieval zdroje, povinné citácie.
- Resource-deadlock / nekonečné handoffy. Agenti na seba čakajú v kruhu (A čaká na výsledok od B, B na spätnú otázku od A) alebo opakovane posúvajú úlohu sem a tam. Protiopatrenie: timeout na každú úlohu, explicitný stav
input-required(A2A), tvrdý limit na handoff kroky na beh. - Authority-confusion. Sub-agent prepíše inštrukcie leada, alebo lead stratí autoritu nad dialógom. Protiopatrenie: jasné hierarchie rolí a silné AgentCard/task kontrakty.
Dodatočný bezpečnostný aspekt: Každé nové kontextové okno agenta je novou plochou pre útok. Amplifikácia prompt-injection škáluje lineárne s počtom agentov, ktorí prijímajú nedôveryhodný obsah - trieda EchoLeak (CVE-2025-32711, ktorú Aim Labs v júni 2025 zverejnili voči Microsoft 365 Copilot) je tu zdokumentovaným referenčným prípadom.
Best practices pre robustné handoffy
Z návrhu Anthropic research agenta a syntézy Cognition (stav 2026) možno odvodiť praktický checklist:
- Zápisovú cestu udržiavať single-threaded. Mnoho agentov smie čítať, rešeršovať a navrhovať - ale commituje len jeden agent alebo jeden stupeň pipeline. Aktualizovaný postoj Cognition (apríl 2026): Viacerí agenti prispievajú inteligenciou, kým zápisové operácie ostávajú single-threaded. Paralelné zápisové swarmy rozbíjajú kontext.
- Výstupy vynútiť do typovanej schémy. Výsledky sub-agentov ako Pydantic model, JSON-schéma alebo A2A-artifact, nie ako voľný text.
- Pred vrátením komprimovať. Nikdy nepipovať celý prepis sub-agenta späť leadovi.
- Delegovanie učiť explicitne. Každý sub-agent dostane cieľ, výstupný formát, pokyny k toolom/zdrojom a jasné hranice úlohy. U Anthropic vágne delegovania spôsobovali dvojitú prácu a medzery v pokrytí.
- Token-budget na sub-agenta obmedziť a každému handoffu pridať trace-ID plus timeout - pre dohľadateľnosť a proti nekonečným slučkám.
Príklad: spracovanie škôd so siedmimi agentmi (Allianz Project Nemo)
Allianz Project Nemo spracúva škody zo skazenia potravín po prírodných katastrofách so siedmimi špecializovanými agentmi: Planner, Cyber, Coverage, Weather, Fraud, Payout, Audit. Workflow beží ako hierarchická reťaz handoffov - Planner rozloží prípad, odovzdá Coverage a Weather na preverenie, Fraud na kontrolu podvodu a napokon Payout. Dedikovaný Audit-agent vytvára kompletné zhrnutie všetkých rozhodnutí agentov a ich zdôvodnení, a tým zabudováva audit-trail priamo do topológie agentov, nie až do loggingu.
Konkrétne čísla (nasadené v Austrálii, júl 2025, live za menej ako 100 dní): Celý sedem-agentový workflow je dokončený za menej ako päť minút, čas spracovania a vybavenia oprávnených škôd pod AUD 500 klesol o 80 percent. Rozhodujúce: Finálny payout ostáva human-in-the-loop - referent preverí audit-zhrnutie. To je single-threaded write v čistej podobe: Šesť agentov prispieva inteligenciou, jeden (plus človek) rozhoduje.
Pseudokód jadra handoffu:
```
planner.handoff(coverage, state={fall_id, police, schadenshöhe})
coverage.handoff(fraud, state + {deckung_ok: true})
fraud.handoff(payout, state + {betrugsscore: 0.04})
payout.handoff(audit, state + {empfehlung: "auszahlen", betrag: 480})
audit -> human_review(zusammenfassung) # einziger Write-Commit
```
Pre agentúry a B2B rozhodovateľov
Kto produkčne plánuje multi-agentové workflowy - či už ako stredne veľký podnik v regióne DACH s jedným či dvomi use-casmi, alebo ako agentúra, ktorá produktizuje agentické služby -, mal by spraviť z handoff stratégie prvé architektonické rozhodnutie. Pravidlo palca: default na štruktúrovaný stav alebo komprimované zhrnutie, celá história len pri vysokej previazanosti; zápisová cesta single-threaded; každý handoff s timeoutom, limitom krokov a trace-ID. Ako agentúre sa oplatí spraviť vlastných agentov A2A-schopnými s publikovanými AgentCardmi, aby ich systémy klientov (Agentforce, Joule, Copilot Studio) mohli osloviť bez custom integrácie. Blck Alpaca sprevádza DACH B2B tímy pri návrhu takýchto handoff architektúr - od výberu vzoru až po observabilitu naprieč celou reťazou agentov.
Často kladené otázky
Aký je rozdiel medzi handoffom a bežným tool-callom?
Celá história alebo zhrnutie - ktorá handoff stratégia je lepšia?
Ako zabrániť nekonečným handoffom medzi agentmi?
Čo je strata kontextu pri handoffe a prečo je nebezpečná?
Ktoré frameworky natívne podporujú agent-handoffy?
Ísť hlbšie?
Získajte nové analýzy priamo do schránky – alebo sa pozrite, ako tieto poznatky nasadzujeme pre firmy.