5.3Fortgeschritten6 min

Supervisor-Pattern: Einen Agenten zum Boss machen

Blck Alpaca·9. Juni 2026

Definition

Das Supervisor-Pattern ist eine Multi-Agent-Architektur, bei der ein zentraler Supervisor-Agent entscheidet, welcher spezialisierte Sub-Agent als Nächstes handelt. Der Supervisor empfängt die Anfrage, routet sie an passende Worker-Agents, sammelt deren Ergebnisse und steuert den Ablauf, bis die Aufgabe gelöst ist. Er denkt nicht selbst fachlich, sondern delegiert und koordiniert.

Auf einen Blick

✓Ein Supervisor-Agent routet zwischen spezialisierten Sub-Agents und entscheidet nach jedem Schritt, wer als Nächstes handelt, die Sub-Agents kommunizieren nicht direkt miteinander.
✓AWS Bedrock AgentCore (Supervisor + Collaborator, GA März 2025) und LangGraph 1.0 (Hierarchical-Supervisor-Template, 22. Oktober 2025) sind die produktionsreifen Referenz-Implementierungen Stand 2026.
✓Das Supervisor-Pattern eignet sich für parallelisierbare, gering gekoppelte Aufgaben mit klarer fachlicher Zerlegung; bei eng gekoppelten Schreib-Workflows (z. B. Code) wird es fragil.
✓Die zentrale Grenze ist der Supervisor selbst: Single Point of Failure, Latenz-Bottleneck und Plan-Drift bei langen Läufen.
✓Allianz Project Nemo (sieben Agents, 80 % weniger Bearbeitungs- und Regulierungszeit bei berechtigten Schäden unter AUD 500, Human-in-the-Loop) ist die am besten dokumentierte DACH-Referenz für ein hierarchisches Supervisor-System.

Das Supervisor-Pattern ist eine Multi-Agent-Architektur, bei der ein zentraler Supervisor-Agent entscheidet, welcher spezialisierte Sub-Agent als Nächstes handelt. Der Supervisor empfängt die Anfrage, routet sie an passende Worker-Agents, sammelt deren Ergebnisse und steuert den Ablauf, bis die Aufgabe gelöst ist. Er denkt nicht selbst fachlich, sondern delegiert und koordiniert. Damit wird ein Agent buchstäblich zum Boss über ein Team aus Spezialisten.

Schnellantworten:

Was tut der Supervisor? Er routet zwischen Sub-Agents und entscheidet nach jedem Schritt, wer dran ist. Die Sub-Agents reden nicht direkt miteinander.
Womit baut man es? Stand 2026 mit LangGraph 1.0 (Open Source) oder AWS Bedrock AgentCore (Supervisor + Collaborator); A2A für Cross-Vendor, MCP für Tools.
Wann passt es? Bei parallelisierbaren, gering gekoppelten Aufgaben mit klarer fachlicher Zerlegung, nicht bei eng gekoppelten Schreib-Workflows wie Code-Generierung.

Wie das Supervisor-Pattern funktioniert

Der Grundgedanke ist eine sternförmige Topologie (Hub-and-Spoke): In der Mitte sitzt der Supervisor, außen die spezialisierten Worker-Agents. Jeder Worker hat seinen eigenen Prompt, sein eigenes Tool-Set und oft sein eigenes Kontextfenster. Der entscheidende Punkt: Die Worker kommunizieren nicht untereinander, sondern ausschließlich über den Supervisor. Dieser entscheidet nach jedem Zwischenergebnis erneut, welcher Agent als Nächstes handeln soll, oder ob die Aufgabe abgeschlossen ist.

Ein typischer Lauf folgt diesem Muster:

Der Supervisor empfängt die Nutzeranfrage und klassifiziert, um welche Art von Aufgabe es sich handelt.
Er wählt einen passenden Spezialagenten und übergibt ihm einen klar umrissenen Auftrag.
Der Worker erledigt seine Teilaufgabe und gibt ein, idealerweise komprimiertes, Ergebnis zurück.
Der Supervisor bewertet das Ergebnis und entscheidet: nächster Worker, Wiederholung oder finale Synthese.

Diese zentrale Routing-Logik unterscheidet das Supervisor-Pattern von einem Swarm (gleichrangige Agents ohne festen Koordinator) und von einer Pipeline (feste, deterministische Reihenfolge). Der Supervisor bringt Steuerung und, wichtig für DACH-B2B, eine klare Verantwortlichkeitslinie für die Frage "Wer hat was entschieden?".

Abgrenzung: Supervisor vs. Orchestrator-Worker

In der Praxis werden die Begriffe oft synonym verwendet, und das ist nicht falsch, aber es gibt einen Akzentunterschied, der für die Architekturentscheidung zählt.

Beim Orchestrator-Worker-Pattern (kanonisches Multi-Agent-Muster nach Anthropics Taxonomie) zerlegt ein Lead-Agent die Aufgabe und spawnt dynamisch Sub-Agents, also so viele, wie der Plan gerade erfordert. Referenzfall ist der Anthropic Research Agent (Juni 2025): Ein Lead Claude Opus 4 läuft im Extended-Thinking-Modus, zerlegt die Anfrage und startet N parallele Sonnet-4-Sub-Agents über das Task-Tool. Jeder Sub-Agent besitzt sein eigenes Kontextfenster (rund 200k Token), recherchiert eigenständig und liefert eine komprimierte Zusammenfassung, nicht das volle Transkript, zurück. Anthropics interne Evaluierung: +90,2 % auf Recherche-Breitenmetriken gegenüber einem Single-Agent-Opus-4, allerdings bei rund 15-fachem Token-Verbrauch.

Das Supervisor-Pattern betont stärker das Routing-Element: Der Supervisor entscheidet, welcher aus einer Menge feststehender Spezialagenten als Nächstes handelt. AWS nutzt für sein Supervisor-Modell das Label "Multi-Agent Collaboration". Im Kern ist das ein Hub-and-Spoke-Supervisor-Muster, nicht mehr und nicht weniger. Bei dreistufigen Varianten (Supervisor → Planner → Worker) spricht man von hierarchischem Multi-Agent: Der Supervisor entscheidet, welche Art Job das ist, ein Planner baut den Sub-Task-Graphen, die Worker führen aus.

Merkmal	Supervisor-Pattern	Orchestrator-Worker
Steuerung	Zentraler Router entscheidet pro Schritt	Lead plant und delegiert
Sub-Agents	Meist feststehende Spezialisten	Dynamisch gespawnt nach Bedarf
Typische Aufgabe	Routing über bekannte Domänen	Breitenrecherche, Fan-out
Referenz Stand 2026	AWS Bedrock AgentCore, LangGraph	Anthropic Research Agent
Token-Faktor vs. Single Agent	ca. 3–20x (je nach Hierarchie-Tiefe)	ca. 5–15x

Praktisch gilt: Jeder Orchestrator ist ein Supervisor, aber nicht jeder Supervisor spawnt dynamisch. Für die meisten Enterprise-Workflows mit bekannten Domänen ist die statische Supervisor-Variante leichter zu evaluieren und zu auditieren.

Umsetzung: LangGraph und AWS Bedrock

Stand 2026 gibt es zwei produktionsreife Referenzwege.

LangGraph (LangChain). Die graphbasierte Orchestrierungs-Runtime erreichte mit LangGraph 1.0 am 22. Oktober 2025 die erste stabile Major-Version im Bereich durabler Agent-Frameworks. Sie bietet ein Hierarchical-Supervisor-Template, durable State mit Checkpointing (ein unterbrochener Lauf nimmt nach Server-Neustart am letzten Checkpoint wieder auf), Human-in-the-Loop-Pause/Resume und Streamable-HTTP-Support für entfernte MCP-Server. Lizenz: MIT. LangGraph ist 2026 die häufigste Open-Source-Orchestrierungs-Runtime in DACH-AI-Engineering-Teams.

Vereinfachter Pseudocode für einen LangGraph-Supervisor:

```
supervisor = create_supervisor(
agents=[recherche_agent, vertrags_agent, freigabe_agent],
model="reasoning-model",
prompt="Route die Anfrage an den passenden Spezialisten. "
"Klarer Auftrag pro Agent: Ziel, Output-Format, Grenzen. "
"Beende, wenn die Aufgabe vollständig gelöst ist."
)

Zustand fliesst als typisiertes State-Objekt durch die Knoten,

wird gecheckpointet und ist nach Neustart wiederherstellbar.

```

AWS Bedrock AgentCore Multi-Agent Collaboration. GA seit März 2025. Das Modell besteht aus einem Supervisor-Agenten plus Collaborator-Agents, mit Inline-Agent-Runtime, einem optimierten "Supervisor-with-Routing"-Modus (schnelleres reines Routing) versus vollem Orchestrierungs-Modus sowie integrierter Trace- und Debug-Konsole. AgentCore liefert Runtime, Gateway, Memory, Identity und Observability und unterstützt MCP.

Für die agentenübergreifende Kommunikation, besonders über Vendor-Grenzen, nutzt man das A2A-Protokoll (Linux Foundation seit Juni 2025). A2A definiert einen Task-Lebenszyklus (submitted → working → input-required → completed | failed | canceled), bei dem die interne Logik des entfernten Agenten opak bleibt. Der Supervisor sieht nur Auftrag und Ergebnis. Für den Tool-Zugriff der einzelnen Agents ist MCP der Standard. Die Faustregel der Anbieter lautet: MCP für Agent-zu-Tool, A2A für Agent-zu-Agent.

Wann es passt und wann nicht

Das Supervisor-Pattern spielt seine Stärken bei parallelisierbaren Problemen mit geringer Zustandskopplung zwischen den Teilaufgaben aus und wenn der Schreibpfad single-threaded oder trivial zusammenführbar ist. Gute Kandidaten: Recherche, breite Suche, Dokument-Fan-out, Multi-Dokument-Review, Schadens-Triage, Betrugsprüfung mit unabhängigen Checks.

Es versagt bei eng gekoppelten, sequenziellen Aufgaben, bei denen jeder Schritt die impliziten Entscheidungen aller folgenden prägt. Cognition.ai zeigte 2025 ("Don't Build Multi-Agents"), dass parallele Writer-Swarms durch Kontext-Fragmentierung unvereinbare Stil- und Edge-Case-Entscheidungen treffen und nicht mergebare Diffs produzieren. Das saubere Gegenbeispiel bleibt Code-Generierung über mehrere Dateien. Das aktualisierte Cognition-Fazit (April 2026) ist pragmatisch: Multi-Agent funktioniert für read-mostly Fan-out, sofern die Schreibvorgänge single-threaded bleiben.

Grenzen: Der Supervisor als Bottleneck

Die zentrale Schwäche steckt im Namen: Alles läuft über den Supervisor.

Single Point of Failure. Fällt der Supervisor aus oder verirrt sich, steht das ganze System.
Latenz-Engstelle. Schritte gehen seriell durch den Supervisor; bei drei Hierarchie-Stufen kaskadiert die Latenz und kann den Mehrwert auffressen.
Plan-Drift. Bei langen Läufen verliert der Supervisor seinen Plan und spawnt Sub-Tasks erneut, die bereits erledigt sind.
Vage Delegation. Unklare Aufträge führen zu Doppelarbeit und Lücken. Anthropic beobachtete genau das in frühen Experimenten. Gegenmittel: Jeder Worker erhält Ziel, Output-Format, Tool-Hinweise und klare Aufgabengrenzen.
Prompt-Injection-Verstärkung. Jedes neue Sub-Agent-Kontextfenster ist eine neue Angriffsfläche über nicht vertrauenswürdige Inhalte.

Beispiel: Allianz Project Nemo

Die am besten dokumentierte DACH-Referenz ist Allianz Project Nemo, ein hierarchisches Supervisor-System für Lebensmittelverderb-Schäden nach Naturkatastrophen. Sieben spezialisierte Agents arbeiten zusammen: Planner, Cyber, Coverage, Weather, Fraud, Payout und Audit. Der vollständige Sieben-Agenten-Workflow läuft in unter fünf Minuten durch; ein menschlicher Sachbearbeiter prüft die Audit-Zusammenfassung und trifft die finale Auszahlungsentscheidung. Human-in-the-Loop ist hier explizite Policy.

Die Zahlen: gestartet in Australien im Juli 2025, in unter 100 Tagen deployt, mit 80 % Reduktion der Bearbeitungs- und Regulierungszeit für berechtigte Schäden unter AUD 500. Allianz ist ein deutscher Versicherer und prüft die Replikation der modularen Architektur über das globale P&C-Portfolio.

Architektonisch lehrreich ist der dedizierte Audit-Agent: Er erzeugt eine vollständige Zusammenfassung aller Agenten-Entscheidungen und damit einen lückenlosen Audit-Trail für Compliance und menschliche Prüfung. Die Lehre für DACH: Auditierbarkeit gehört in die Agenten-Topologie eingebaut, nicht nur in die Logging-Pipeline.

Für Agenturen und B2B-Entscheider

Wer ein Multi-Agent-Projekt im DACH-Mittelstand startet, fährt mit LangGraph oder n8n als Orchestrierung, MCP für Tools und A2A für jeden Cross-Platform-Handshake rational. Für Konzerne mit dominanter SaaS-Landschaft ist die plattformeigene Orchestrierung (Agentforce, SAP Joule Studio, Copilot Studio) die naheliegende Basis, mit A2A als Bindeglied. Wichtig für Agenturen, die Kunden beraten: Beginne mit einem klar abgegrenzten, parallelisierbaren Use Case, halte den Schreibpfad single-threaded, baue Human-in-the-Loop an den kritischen Stellen ein und beachte die längere AVV-Kette nach DSGVO Art. 28 sowie Transfer Impact Assessments pro grenzüberschreitendem A2A-Hop. Der Allianz-Nemo-Benchmark (unter 100 Tage bis live) ist für eng gescopte Projekte erreichbar.

Häufig gestellte Fragen

Was ist der Unterschied zwischen Supervisor-Pattern und Orchestrator-Worker?

Beide haben einen zentralen, steuernden Agenten. Beim Orchestrator-Worker zerlegt ein Lead-Agent die Aufgabe und spawnt dynamisch Sub-Agents mit eigenem Kontextfenster, die parallel arbeiten und komprimierte Ergebnisse zurückliefern (Anthropic Research Agent). Das Supervisor-Pattern beschreibt enger das Routing-Element: Der Supervisor entscheidet nach jedem Schritt, welcher feststehende Spezialagent als Nächstes handelt. In der Praxis überlappen sich beide Begriffe stark; AWS nutzt für sein Supervisor-Modell sogar das Label Multi-Agent Collaboration.

Womit setze ich ein Supervisor-Pattern um?

Stand 2026 sind die zwei produktionsreifen Wege LangGraph 1.0 (Open Source, MIT, Hierarchical-Supervisor-Template, durable State, seit 22. Oktober 2025) für eigene Stacks sowie AWS Bedrock AgentCore Multi-Agent Collaboration (Supervisor + Collaborator, GA März 2025) für AWS-Umgebungen. Für Cross-Vendor-Handshakes nutzt man das A2A-Protokoll, für Tool-Zugriff MCP.

Warum wird der Supervisor zum Bottleneck?

Jede Entscheidung läuft über den Supervisor: Er routet, wartet auf Worker-Ergebnisse, entscheidet erneut. Das macht ihn zum Single Point of Failure und zur Latenz-Engstelle, weil Schritte seriell durch ihn hindurchgehen. Bei langen Läufen kommt Plan-Drift hinzu, der Supervisor verliert seinen Plan und ruft bereits erledigte Sub-Tasks erneut auf.

Wann sollte ich das Supervisor-Pattern nicht einsetzen?

Bei eng gekoppelten, sequenziellen Schreib-Aufgaben, bei denen jeder Schritt die Entscheidungen aller folgenden Schritte prägt, das klassische Beispiel ist Code-Generierung über mehrere Dateien. Cognition.ai zeigte 2025, dass parallele Writer-Swarms durch Kontext-Fragmentierung unvereinbare Entscheidungen treffen. Für kurze, klar definierte Workflows ist außerdem ein einzelner Agent mit Tools oder eine deterministische Pipeline günstiger und besser debugbar.

Eignet sich das Supervisor-Pattern für regulierte DACH-Branchen?

Ja, wenn Auditierbarkeit und Human-in-the-Loop in die Agenten-Topologie eingebaut sind. Allianz Project Nemo nutzt einen dedizierten Audit-Agenten, der alle Agenten-Entscheidungen zusammenfasst und einen vollständigen Audit-Trail erzeugt; der finale Beschluss bleibt beim Menschen. Zu beachten sind die längere AVV-Kette nach DSGVO Art. 28 und, bei Cross-Border-A2A-Hops, Transfer Impact Assessments pro Grenzübertritt.

Tiefer einsteigen?

Erhalte neue Analysen direkt ins Postfach, oder sieh dir an, wie wir dieses Wissen für Unternehmen umsetzen.

Newsletter abonnieren →Unsere Services

Vorheriger← Orchestrator–Worker: Das robusteste Multi-Agent-Pattern NächsterAgent-Handoffs: Kontext und State zwischen Agenten übergeben →