Zum Inhalt springen
5.4Fortgeschritten7 min

Agent-Handoffs: Kontext und State zwischen Agenten übergeben

Blck Alpaca·
Definition

Ein Agent-Handoff ist die kontrollierte Übergabe einer Aufgabe samt Kontext und State von einem KI-Agenten an einen anderen. Statt eine Frage selbst zu beantworten, reicht ein Agent den Dialog an einen spezialisierten Agenten weiter. Entscheidend ist, welcher Kontext übergeben wird: volle Historie, Zusammenfassung oder strukturierter State.

Auf einen Blick

  • Ein Handoff übergibt nicht nur die Aufgabe, sondern auch Kontext und State - das Wie der Übergabe entscheidet über Erfolg oder Scheitern des Multi-Agent-Systems.
  • Drei Strategien: volle Konversationshistorie (höchste Treue, teuer), komprimierte Zusammenfassung (Anthropic-Research-Agent-Muster, token-effizient) und strukturierter State (typisiertes Schema, am robustesten).
  • Im OpenAI Agents SDK (März 2025) sind Handoffs ein explizites First-Class-Konzept: Der Turn eines Agenten endet, ein anderer übernimmt mit weitergereichter Historie - hervorgegangen aus dem Swarm-Framework (Oktober 2024).
  • Hauptfehlerquellen sind Kontextfragmentierung durch zu starke Kompression, Endlos-Handoffs (Resource-Deadlock) und Cascading Failures, bei denen ein falscher Fakt durch die Kette propagiert.
  • Best Practice (Stand 2026): Schreibpfad single-threaded halten, Sub-Agent-Ausgaben in ein typisiertes Schema zwingen, vor Rückgabe komprimieren und jedem Handoff eine Trace-ID plus Timeout mitgeben.

Ein Agent-Handoff ist die kontrollierte Übergabe einer Aufgabe samt Kontext und State von einem KI-Agenten an einen anderen. Statt eine Anfrage selbst zu Ende zu bearbeiten, reicht ein Agent den laufenden Dialog an einen spezialisierten Agenten weiter. Die zentrale Designfrage lautet nicht ob, sondern was übergeben wird: die volle Konversationshistorie, eine komprimierte Zusammenfassung oder ein strukturierter State. Diese Entscheidung bestimmt mehr als jede andere, ob ein Multi-Agent-System funktioniert oder an Kontextverlust scheitert.

  • Was wird übergeben? Kontext (bisheriger Dialog, Entscheidungen, Zwischenergebnisse) und State (strukturierte Daten, Aufgabenstatus, Variablen) - in einer von drei Treuestufen.
  • Wer übernimmt die Kontrolle? Anders als beim Tool-Call führt nach einem Handoff der übernehmende Agent den Dialog weiter; der abgebende Agent gibt seinen Turn ab.
  • Was geht schief? Kontextverlust durch Überkompression, Endlos-Handoffs (Resource-Deadlock) und Cascading Failures, bei denen ein falscher Fakt durch die Kette wandert.

Drei Handoff-Strategien: volle Historie, Zusammenfassung, strukturierter State

Die Wahl der Übergabestrategie ist im Kern eine Abwägung zwischen Informationstreue und Token-Kosten - und sie hängt von der State-Kopplung zwischen den Teilaufgaben ab.

1. Volle Konversationshistorie. Der übernehmende Agent erhält die komplette bisherige Trace - alle Nachrichten, Tool-Calls und Zwischenentscheidungen. Cognition.ai vertritt für eng gekoppelte Arbeit (in der jede Aktion Folgeentscheidungen prägt) genau diese Position: vollständige Agent-Traces teilen, nicht nur einzelne Nachrichten. Die Begründung ist hart: Scheinbare Meinungsverschiedenheiten zwischen Agenten sind meist Symptome von Kontextfragmentierung, nicht echter Uneinigkeit. Implizite Entscheidungen, die nicht mit übergeben werden, führen zu inkompatiblen Folgeentscheidungen. Preis: hoher Token-Verbrauch, der mit jedem Handoff wächst.

2. Komprimierte Zusammenfassung. Der abgebende Agent verdichtet seinen Kontext zu einer Summary, bevor er übergibt. Das ist das Referenzmuster des Anthropic Research Agent (dokumentiert in „How we built our multi-agent research system", 13. Juni 2025): Jeder Sub-Agent arbeitet in seinem eigenen Kontextfenster von rund 200k Token und gibt eine komprimierte Zusammenfassung an den Lead-Agenten zurück - nie das volle Transkript. Der Lead synthetisiert daraus die Antwort. So bleibt sein Kontextfenster für Plan, Sub-Agent-Ergebnisse und Synthese reserviert statt für rohe Such-Snippets. Token-effizient und parallelisierbar, aber mit Risiko des Kontextverlusts, wenn zu stark verdichtet wird.

3. Strukturierter State. Statt Freitext wird ein typisiertes Schema übergeben (Pydantic-Modell, JSON-Schema oder ein A2A-Artifact). Das ist die robusteste Variante für klar definierte Übergaben, weil das Format Vollständigkeit erzwingt und nichts implizit verloren geht. LangGraph reicht ein typisiertes State-Objekt durch seine Knoten und checkpointet es durabel - ein unterbrochener Workflow nimmt nach einem Server-Neustart am letzten Checkpoint wieder auf.

Strategie

Informationstreue

Token-Kosten

Geeignet für

Hauptrisiko

Volle Historie

Höchste

Hoch, wächst pro Handoff

Eng gekoppelte, sequenzielle Aufgaben

Kontext-Bloat, Kostenexplosion

Komprimierte Zusammenfassung

Mittel

Niedrig

Parallelisierbare Read-mostly-Aufgaben

Kontextverlust durch Überkompression

Strukturierter State

Hoch (für definierte Felder)

Niedrig–mittel

Pipelines, klare Verträge

Verlust nicht-modellierter Information

Handoffs im OpenAI Agents SDK und im Swarm-Modell

Das OpenAI Agents SDK (März 2025) führt Handoffs als explizites First-Class-Konzept. Es ist die umbenannte und erweiterte Fassung von OpenAI Swarm (Oktober 2024), dem Referenz-Framework für das Peer-to-Peer-/Swarm-Muster. Die Semantik laut Research-Quelle: Der Turn eines Agenten endet, der Turn eines anderen Agenten beginnt - die Konversationshistorie wird weitergereicht. Ein Triage-Agent entscheidet also, dass eine Anfrage zum Billing-Agenten gehört, und übergibt; ab da führt der Billing-Agent den Dialog.

Das unterscheidet Handoffs scharf vom Tool-Call: Beim Tool-Call behält derselbe Agent die Kontrolle und bekommt nur ein Ergebnis zurück. Beim Handoff wechselt die Verantwortung. Zum Vergleich die Message-Passing-Semantik der wichtigsten Stacks:

Stack

Handoff-/Übergabe-Semantik

OpenAI Agents SDK

Explizite Handoffs; Turn-Wechsel, Historie wird weitergereicht

AutoGen

Group-Chat mit Turn-Taking; geteilte Historie; Adressierung per Mentions

LangGraph

Typisiertes State-Objekt durch Knoten; gecheckpointet; durabel über Neustarts

Anthropic Claude Agent SDK

Lead spawnt Sub-Agenten via Task-Tool; Rückgabe komprimierter strukturierter Ausgaben

A2A (anbieterübergreifend)

Task-Lifecycle submitted → working → input-required → completed/failed/canceled; Multi-Part-Messages; Artifacts als Output; Interna der Agenten bleiben opak

Für Übergaben über Anbietergrenzen hinweg (etwa ein Salesforce-Agent, der einen SAP-Joule-Agenten ruft) ist nicht das SDK-Handoff, sondern das A2A-Protokoll der Vertrag. Dort definiert der Task-Lifecycle die Zustände, der Zielagent veröffentlicht eine AgentCard mit seinen Fähigkeiten, und das Ergebnis kommt als Artifact zurück - die internen Prompts und Modelle bleiben dabei bewusst verborgen.

Fehlerquellen: Kontextverlust und Endlos-Handoffs

Handoffs erzeugen Fehlerklassen, die ein Single-Agent-System nicht kennt. Vier davon sind direkt handoff-relevant:

  • Kontextfragmentierung. Sub-Agenten treffen inkompatible implizite Entscheidungen, weil beim Übergeben Kontext verloren ging. Gegenmittel: volle Traces teilen, wo die Kopplung hoch ist; explizite Entscheidungs-Verträge.
  • Cascading Failures. Ein Agent halluziniert einen Fakt; der nächste übernimmt ihn als Wahrheit; downstream agieren weitere Agenten auf der falschen Grundlage. Gegenmittel: ein Verifier-Judge-Agent, fundierte Retrieval-Quellen, verpflichtende Zitate.
  • Resource-Deadlock / Endlos-Handoffs. Agenten warten zirkulär aufeinander (A wartet auf das Ergebnis von B, B auf eine Rückfrage von A) oder schieben eine Aufgabe wiederholt hin und her. Gegenmittel: Timeout auf jeden Task, expliziter input-required-Zustand (A2A), ein Hard-Limit für Handoff-Schritte pro Lauf.
  • Authority-Confusion. Ein Sub-Agent überschreibt Anweisungen des Lead, oder der Lead verliert die Autorität über den Dialog. Gegenmittel: klare Rollenhierarchien und starke AgentCard-/Task-Verträge.

Ein zusätzlicher Sicherheitsaspekt: Jedes neue Agenten-Kontextfenster ist eine neue Angriffsfläche. Die Prompt-Injection-Amplifikation skaliert linear mit der Zahl der Agenten, die nicht vertrauenswürdige Inhalte aufnehmen - die EchoLeak-Klasse (CVE-2025-32711, von Aim Labs im Juni 2025 an Microsoft 365 Copilot offengelegt) ist hier der dokumentierte Referenzfall.

Best Practices für robuste Handoffs

Aus dem Anthropic-Research-Agent-Design und der Cognition-Synthese (Stand 2026) lässt sich eine praktikable Checkliste ableiten:

  1. Schreibpfad single-threaded halten. Viele Agenten dürfen lesen, recherchieren und vorschlagen - aber nur ein Agent oder eine Pipeline-Stufe committet. Cognitions aktualisierte Position (April 2026): Mehrere Agenten tragen Intelligenz bei, während die Schreibvorgänge single-threaded bleiben. Parallele Schreib-Schwärme zerbrechen den Kontext.
  2. Ausgaben in ein typisiertes Schema zwingen. Sub-Agent-Ergebnisse als Pydantic-Modell, JSON-Schema oder A2A-Artifact, nicht als Freitext.
  3. Vor der Rückgabe komprimieren. Nie ein volles Sub-Agent-Transkript an den Lead zurückpipen.
  4. Delegation explizit lehren. Jeder Sub-Agent erhält Ziel, Ausgabeformat, Tool-/Quellen-Hinweise und klare Aufgabengrenzen. Bei Anthropic verursachten vage Delegationen Doppelarbeit und Lücken in der Abdeckung.
  5. Token-Budget je Sub-Agent kappen und jedem Handoff eine Trace-ID plus Timeout mitgeben - für Nachvollziehbarkeit und gegen Endlosschleifen.

Beispiel: Schadensbearbeitung mit sieben Agenten (Allianz Project Nemo)

Allianz Project Nemo bearbeitet Lebensmittelverderb-Schäden nach Naturkatastrophen mit sieben spezialisierten Agenten: Planner, Cyber, Coverage, Weather, Fraud, Payout, Audit. Der Workflow läuft als hierarchische Kette von Handoffs - der Planner zerlegt den Fall, übergibt an Coverage und Weather zur Prüfung, an Fraud zur Betrugskontrolle und schließlich an Payout. Der dedizierte Audit-Agent erzeugt eine vollständige Zusammenfassung aller Agent-Entscheidungen und Begründungen und baut so den Audit-Trail in die Agent-Topologie ein, nicht erst ins Logging.

Konkrete Zahlen (in Australien deployt, Juli 2025, in unter 100 Tagen live): Der gesamte Sieben-Agenten-Workflow ist in unter fünf Minuten abgeschlossen, die Bearbeitungs- und Abwicklungszeit für berechtigte Schäden unter AUD 500 sank um 80 Prozent. Entscheidend: Der finale Payout bleibt Mensch-im-Prozess - ein Sachbearbeiter prüft die Audit-Zusammenfassung. Das ist single-threaded Write in Reinform: Sechs Agenten liefern Intelligenz zu, einer (plus Mensch) entscheidet.

Pseudocode des Handoff-Kerns:

```
planner.handoff(coverage, state={fall_id, police, schadenshöhe})
coverage.handoff(fraud, state + {deckung_ok: true})
fraud.handoff(payout, state + {betrugsscore: 0.04})
payout.handoff(audit, state + {empfehlung: "auszahlen", betrag: 480})
audit -> human_review(zusammenfassung) # einziger Write-Commit
```

Für Agenturen und B2B-Entscheider

Wer Multi-Agent-Workflows produktiv plant - ob als DACH-Mittelständler mit ein, zwei Use-Cases oder als Agentur, die agentische Services produktisiert -, sollte die Handoff-Strategie zur ersten Architekturentscheidung machen. Die Faustregel: Default auf strukturierten State oder komprimierte Zusammenfassung, volle Historie nur bei hoher Kopplung; Schreibpfad single-threaded; jeder Handoff mit Timeout, Schritt-Limit und Trace-ID. Als Agentur lohnt es sich, eigene Agenten mit veröffentlichten AgentCards A2A-fähig zu machen, damit Kund:innen-Systeme (Agentforce, Joule, Copilot Studio) sie ohne Custom-Integration ansprechen können. Blck Alpaca begleitet DACH-B2B-Teams beim Design solcher Handoff-Architekturen - von der Pattern-Auswahl bis zur Observability über die gesamte Agentenkette.

Häufig gestellte Fragen

Was ist der Unterschied zwischen einem Handoff und einem normalen Tool-Call?
Ein Tool-Call ruft eine Funktion oder Datenquelle auf und liefert ein Ergebnis zurück an denselben Agenten, der weiter die Kontrolle behält. Bei einem Handoff übergibt der Agent dagegen die Konversation und Aufgabenführung an einen anderen Agenten - der übernehmende Agent setzt den Dialog fort. Im OpenAI Agents SDK ist genau das die Handoff-Semantik: Der Turn eines Agenten endet, der nächste beginnt mit weitergereichter Historie.
Volle Historie oder Zusammenfassung - welche Handoff-Strategie ist besser?
Das hängt von der State-Kopplung ab. Bei hoher Kopplung, wo jede Entscheidung Folgeentscheidungen prägt, empfiehlt Cognition, vollständige Agent-Traces zu teilen statt nur einzelner Nachrichten, weil fragmentierter Kontext die Hauptursache kaskadierender Fehler ist. Bei niedriger Kopplung und parallelisierbaren Aufgaben nutzt das Anthropic-Research-Agent-Muster komprimierte Zusammenfassungen, um Token zu sparen. Strukturierter State ist die robusteste Variante für klar definierte Übergaben.
Wie verhindert man Endlos-Handoffs zwischen Agenten?
Endlos-Handoffs treten als Resource-Deadlock auf (Agent A wartet auf das Ergebnis von B, B auf eine Rückfrage von A) oder als wiederholtes Hin- und Herschieben einer Aufgabe. Gegenmittel sind: ein Timeout auf jeden Task, ein expliziter input-required-Zustand wie im A2A-Protokoll, ein Maximum an Handoff-Schritten pro Lauf und klare Rollenhierarchien, damit ein Agent die Autorität behält.
Was ist Kontextverlust bei einem Handoff und warum ist er gefährlich?
Kontextverlust tritt auf, wenn beim Übergeben relevante Informationen wegfallen - etwa weil zu stark zusammengefasst wurde oder nur einzelne Nachrichten statt der vollen Trace weitergereicht wurden. Cognition beschreibt, dass scheinbare Meinungsverschiedenheiten zwischen Agenten meist Symptome von Kontextfragmentierung sind. Der übernehmende Agent trifft dann inkompatible implizite Entscheidungen, die zu fehlerhaften Ergebnissen führen.
Welche Frameworks unterstützen Agent-Handoffs nativ?
Das OpenAI Agents SDK (März 2025, hervorgegangen aus Swarm) nutzt explizite Handoffs als Kernkonzept. LangGraph reicht ein typisiertes State-Objekt durch Knoten und checkpointet es durabel. AutoGen arbeitet mit Group-Chat und Turn-Taking samt geteilter Historie. Das Anthropic Claude Agent SDK spawnt Sub-Agenten über das Task-Tool, die komprimierte strukturierte Ausgaben zurückgeben. Anbieterübergreifend läuft die Übergabe über das A2A-Protokoll mit seinem Task-Lifecycle.

Tiefer einsteigen?

Erhalte neue Analysen direkt ins Postfach – oder sieh dir an, wie wir dieses Wissen für Unternehmen umsetzen.