Agent-Handoffs: Kontext und State zwischen Agenten übergeben
Ein Agent-Handoff ist die kontrollierte Übergabe einer Aufgabe samt Kontext und State von einem KI-Agenten an einen anderen. Statt eine Frage selbst zu beantworten, reicht ein Agent den Dialog an einen spezialisierten Agenten weiter. Entscheidend ist, welcher Kontext übergeben wird: volle Historie, Zusammenfassung oder strukturierter State.
Auf einen Blick
- ✓Ein Handoff übergibt nicht nur die Aufgabe, sondern auch Kontext und State - das Wie der Übergabe entscheidet über Erfolg oder Scheitern des Multi-Agent-Systems.
- ✓Drei Strategien: volle Konversationshistorie (höchste Treue, teuer), komprimierte Zusammenfassung (Anthropic-Research-Agent-Muster, token-effizient) und strukturierter State (typisiertes Schema, am robustesten).
- ✓Im OpenAI Agents SDK (März 2025) sind Handoffs ein explizites First-Class-Konzept: Der Turn eines Agenten endet, ein anderer übernimmt mit weitergereichter Historie - hervorgegangen aus dem Swarm-Framework (Oktober 2024).
- ✓Hauptfehlerquellen sind Kontextfragmentierung durch zu starke Kompression, Endlos-Handoffs (Resource-Deadlock) und Cascading Failures, bei denen ein falscher Fakt durch die Kette propagiert.
- ✓Best Practice (Stand 2026): Schreibpfad single-threaded halten, Sub-Agent-Ausgaben in ein typisiertes Schema zwingen, vor Rückgabe komprimieren und jedem Handoff eine Trace-ID plus Timeout mitgeben.
Ein Agent-Handoff ist die kontrollierte Übergabe einer Aufgabe samt Kontext und State von einem KI-Agenten an einen anderen. Statt eine Anfrage selbst zu Ende zu bearbeiten, reicht ein Agent den laufenden Dialog an einen spezialisierten Agenten weiter. Die zentrale Designfrage lautet nicht ob, sondern was übergeben wird: die volle Konversationshistorie, eine komprimierte Zusammenfassung oder ein strukturierter State. Diese Entscheidung bestimmt mehr als jede andere, ob ein Multi-Agent-System funktioniert oder an Kontextverlust scheitert.
- Was wird übergeben? Kontext (bisheriger Dialog, Entscheidungen, Zwischenergebnisse) und State (strukturierte Daten, Aufgabenstatus, Variablen) - in einer von drei Treuestufen.
- Wer übernimmt die Kontrolle? Anders als beim Tool-Call führt nach einem Handoff der übernehmende Agent den Dialog weiter; der abgebende Agent gibt seinen Turn ab.
- Was geht schief? Kontextverlust durch Überkompression, Endlos-Handoffs (Resource-Deadlock) und Cascading Failures, bei denen ein falscher Fakt durch die Kette wandert.
Drei Handoff-Strategien: volle Historie, Zusammenfassung, strukturierter State
Die Wahl der Übergabestrategie ist im Kern eine Abwägung zwischen Informationstreue und Token-Kosten - und sie hängt von der State-Kopplung zwischen den Teilaufgaben ab.
1. Volle Konversationshistorie. Der übernehmende Agent erhält die komplette bisherige Trace - alle Nachrichten, Tool-Calls und Zwischenentscheidungen. Cognition.ai vertritt für eng gekoppelte Arbeit (in der jede Aktion Folgeentscheidungen prägt) genau diese Position: vollständige Agent-Traces teilen, nicht nur einzelne Nachrichten. Die Begründung ist hart: Scheinbare Meinungsverschiedenheiten zwischen Agenten sind meist Symptome von Kontextfragmentierung, nicht echter Uneinigkeit. Implizite Entscheidungen, die nicht mit übergeben werden, führen zu inkompatiblen Folgeentscheidungen. Preis: hoher Token-Verbrauch, der mit jedem Handoff wächst.
2. Komprimierte Zusammenfassung. Der abgebende Agent verdichtet seinen Kontext zu einer Summary, bevor er übergibt. Das ist das Referenzmuster des Anthropic Research Agent (dokumentiert in „How we built our multi-agent research system", 13. Juni 2025): Jeder Sub-Agent arbeitet in seinem eigenen Kontextfenster von rund 200k Token und gibt eine komprimierte Zusammenfassung an den Lead-Agenten zurück - nie das volle Transkript. Der Lead synthetisiert daraus die Antwort. So bleibt sein Kontextfenster für Plan, Sub-Agent-Ergebnisse und Synthese reserviert statt für rohe Such-Snippets. Token-effizient und parallelisierbar, aber mit Risiko des Kontextverlusts, wenn zu stark verdichtet wird.
3. Strukturierter State. Statt Freitext wird ein typisiertes Schema übergeben (Pydantic-Modell, JSON-Schema oder ein A2A-Artifact). Das ist die robusteste Variante für klar definierte Übergaben, weil das Format Vollständigkeit erzwingt und nichts implizit verloren geht. LangGraph reicht ein typisiertes State-Objekt durch seine Knoten und checkpointet es durabel - ein unterbrochener Workflow nimmt nach einem Server-Neustart am letzten Checkpoint wieder auf.
Strategie | Informationstreue | Token-Kosten | Geeignet für | Hauptrisiko |
|---|---|---|---|---|
Volle Historie | Höchste | Hoch, wächst pro Handoff | Eng gekoppelte, sequenzielle Aufgaben | Kontext-Bloat, Kostenexplosion |
Komprimierte Zusammenfassung | Mittel | Niedrig | Parallelisierbare Read-mostly-Aufgaben | Kontextverlust durch Überkompression |
Strukturierter State | Hoch (für definierte Felder) | Niedrig–mittel | Pipelines, klare Verträge | Verlust nicht-modellierter Information |
Handoffs im OpenAI Agents SDK und im Swarm-Modell
Das OpenAI Agents SDK (März 2025) führt Handoffs als explizites First-Class-Konzept. Es ist die umbenannte und erweiterte Fassung von OpenAI Swarm (Oktober 2024), dem Referenz-Framework für das Peer-to-Peer-/Swarm-Muster. Die Semantik laut Research-Quelle: Der Turn eines Agenten endet, der Turn eines anderen Agenten beginnt - die Konversationshistorie wird weitergereicht. Ein Triage-Agent entscheidet also, dass eine Anfrage zum Billing-Agenten gehört, und übergibt; ab da führt der Billing-Agent den Dialog.
Das unterscheidet Handoffs scharf vom Tool-Call: Beim Tool-Call behält derselbe Agent die Kontrolle und bekommt nur ein Ergebnis zurück. Beim Handoff wechselt die Verantwortung. Zum Vergleich die Message-Passing-Semantik der wichtigsten Stacks:
Stack | Handoff-/Übergabe-Semantik |
|---|---|
OpenAI Agents SDK | Explizite Handoffs; Turn-Wechsel, Historie wird weitergereicht |
AutoGen | Group-Chat mit Turn-Taking; geteilte Historie; Adressierung per Mentions |
LangGraph | Typisiertes State-Objekt durch Knoten; gecheckpointet; durabel über Neustarts |
Anthropic Claude Agent SDK | Lead spawnt Sub-Agenten via Task-Tool; Rückgabe komprimierter strukturierter Ausgaben |
A2A (anbieterübergreifend) | Task-Lifecycle |
Für Übergaben über Anbietergrenzen hinweg (etwa ein Salesforce-Agent, der einen SAP-Joule-Agenten ruft) ist nicht das SDK-Handoff, sondern das A2A-Protokoll der Vertrag. Dort definiert der Task-Lifecycle die Zustände, der Zielagent veröffentlicht eine AgentCard mit seinen Fähigkeiten, und das Ergebnis kommt als Artifact zurück - die internen Prompts und Modelle bleiben dabei bewusst verborgen.
Fehlerquellen: Kontextverlust und Endlos-Handoffs
Handoffs erzeugen Fehlerklassen, die ein Single-Agent-System nicht kennt. Vier davon sind direkt handoff-relevant:
- Kontextfragmentierung. Sub-Agenten treffen inkompatible implizite Entscheidungen, weil beim Übergeben Kontext verloren ging. Gegenmittel: volle Traces teilen, wo die Kopplung hoch ist; explizite Entscheidungs-Verträge.
- Cascading Failures. Ein Agent halluziniert einen Fakt; der nächste übernimmt ihn als Wahrheit; downstream agieren weitere Agenten auf der falschen Grundlage. Gegenmittel: ein Verifier-Judge-Agent, fundierte Retrieval-Quellen, verpflichtende Zitate.
- Resource-Deadlock / Endlos-Handoffs. Agenten warten zirkulär aufeinander (A wartet auf das Ergebnis von B, B auf eine Rückfrage von A) oder schieben eine Aufgabe wiederholt hin und her. Gegenmittel: Timeout auf jeden Task, expliziter
input-required-Zustand (A2A), ein Hard-Limit für Handoff-Schritte pro Lauf. - Authority-Confusion. Ein Sub-Agent überschreibt Anweisungen des Lead, oder der Lead verliert die Autorität über den Dialog. Gegenmittel: klare Rollenhierarchien und starke AgentCard-/Task-Verträge.
Ein zusätzlicher Sicherheitsaspekt: Jedes neue Agenten-Kontextfenster ist eine neue Angriffsfläche. Die Prompt-Injection-Amplifikation skaliert linear mit der Zahl der Agenten, die nicht vertrauenswürdige Inhalte aufnehmen - die EchoLeak-Klasse (CVE-2025-32711, von Aim Labs im Juni 2025 an Microsoft 365 Copilot offengelegt) ist hier der dokumentierte Referenzfall.
Best Practices für robuste Handoffs
Aus dem Anthropic-Research-Agent-Design und der Cognition-Synthese (Stand 2026) lässt sich eine praktikable Checkliste ableiten:
- Schreibpfad single-threaded halten. Viele Agenten dürfen lesen, recherchieren und vorschlagen - aber nur ein Agent oder eine Pipeline-Stufe committet. Cognitions aktualisierte Position (April 2026): Mehrere Agenten tragen Intelligenz bei, während die Schreibvorgänge single-threaded bleiben. Parallele Schreib-Schwärme zerbrechen den Kontext.
- Ausgaben in ein typisiertes Schema zwingen. Sub-Agent-Ergebnisse als Pydantic-Modell, JSON-Schema oder A2A-Artifact, nicht als Freitext.
- Vor der Rückgabe komprimieren. Nie ein volles Sub-Agent-Transkript an den Lead zurückpipen.
- Delegation explizit lehren. Jeder Sub-Agent erhält Ziel, Ausgabeformat, Tool-/Quellen-Hinweise und klare Aufgabengrenzen. Bei Anthropic verursachten vage Delegationen Doppelarbeit und Lücken in der Abdeckung.
- Token-Budget je Sub-Agent kappen und jedem Handoff eine Trace-ID plus Timeout mitgeben - für Nachvollziehbarkeit und gegen Endlosschleifen.
Beispiel: Schadensbearbeitung mit sieben Agenten (Allianz Project Nemo)
Allianz Project Nemo bearbeitet Lebensmittelverderb-Schäden nach Naturkatastrophen mit sieben spezialisierten Agenten: Planner, Cyber, Coverage, Weather, Fraud, Payout, Audit. Der Workflow läuft als hierarchische Kette von Handoffs - der Planner zerlegt den Fall, übergibt an Coverage und Weather zur Prüfung, an Fraud zur Betrugskontrolle und schließlich an Payout. Der dedizierte Audit-Agent erzeugt eine vollständige Zusammenfassung aller Agent-Entscheidungen und Begründungen und baut so den Audit-Trail in die Agent-Topologie ein, nicht erst ins Logging.
Konkrete Zahlen (in Australien deployt, Juli 2025, in unter 100 Tagen live): Der gesamte Sieben-Agenten-Workflow ist in unter fünf Minuten abgeschlossen, die Bearbeitungs- und Abwicklungszeit für berechtigte Schäden unter AUD 500 sank um 80 Prozent. Entscheidend: Der finale Payout bleibt Mensch-im-Prozess - ein Sachbearbeiter prüft die Audit-Zusammenfassung. Das ist single-threaded Write in Reinform: Sechs Agenten liefern Intelligenz zu, einer (plus Mensch) entscheidet.
Pseudocode des Handoff-Kerns:
```
planner.handoff(coverage, state={fall_id, police, schadenshöhe})
coverage.handoff(fraud, state + {deckung_ok: true})
fraud.handoff(payout, state + {betrugsscore: 0.04})
payout.handoff(audit, state + {empfehlung: "auszahlen", betrag: 480})
audit -> human_review(zusammenfassung) # einziger Write-Commit
```
Für Agenturen und B2B-Entscheider
Wer Multi-Agent-Workflows produktiv plant - ob als DACH-Mittelständler mit ein, zwei Use-Cases oder als Agentur, die agentische Services produktisiert -, sollte die Handoff-Strategie zur ersten Architekturentscheidung machen. Die Faustregel: Default auf strukturierten State oder komprimierte Zusammenfassung, volle Historie nur bei hoher Kopplung; Schreibpfad single-threaded; jeder Handoff mit Timeout, Schritt-Limit und Trace-ID. Als Agentur lohnt es sich, eigene Agenten mit veröffentlichten AgentCards A2A-fähig zu machen, damit Kund:innen-Systeme (Agentforce, Joule, Copilot Studio) sie ohne Custom-Integration ansprechen können. Blck Alpaca begleitet DACH-B2B-Teams beim Design solcher Handoff-Architekturen - von der Pattern-Auswahl bis zur Observability über die gesamte Agentenkette.
Häufig gestellte Fragen
Was ist der Unterschied zwischen einem Handoff und einem normalen Tool-Call?
Volle Historie oder Zusammenfassung - welche Handoff-Strategie ist besser?
Wie verhindert man Endlos-Handoffs zwischen Agenten?
Was ist Kontextverlust bei einem Handoff und warum ist er gefährlich?
Welche Frameworks unterstützen Agent-Handoffs nativ?
Tiefer einsteigen?
Erhalte neue Analysen direkt ins Postfach – oder sieh dir an, wie wir dieses Wissen für Unternehmen umsetzen.