Hierarchische Agenten: Supervisor und Sub-Agents
Hierarchische Agenten sind eine Multi-Agent-Architektur, in der ein Supervisor-Agent eine komplexe Aufgabe zerlegt, Teilaufgaben an spezialisierte Sub-Agents delegiert und deren Ergebnisse zusammenführt. Statt eines einzelnen Agenten koordiniert eine übergeordnete Steuerungsinstanz mehrere untergeordnete Worker und aggregiert deren Output zu einer Gesamtlösung.
Auf einen Blick
- ✓Ein Supervisor-Agent (auch Orchestrator oder Manager) plant, zerlegt und delegiert; spezialisierte Sub-Agents führen Teilaufgaben aus und liefern Ergebnisse zurück zur Aggregation.
- ✓Hierarchie skaliert dort, wo Aufgaben klar zerlegbar und parallelisierbar sind, der Lese-Anteil groß und der Schreib-/Zustands-Anteil klein ist.
- ✓Hauptvorteile sind Spezialisierung und Modularität; der zentrale Preis ist Koordinations-Overhead durch zusätzliche LLM-Aufrufe, Kontext-Weitergabe und mögliche widersprüchliche Entscheidungen.
- ✓Cognition empfiehlt (Stand 2026) das Muster „read-parallel, write-single-threaded“: Sub-Agents nur zur parallelen Informationsbeschaffung, Schreibvorgänge zentral beim Supervisor.
- ✓Anthropics „Orchestrator-Workers“-Muster und CrewAIs Hierarchical Process mit manager_agent sind die etablierten produktiven Umsetzungen (Stand 2026).
- ✓Vor der Eskalation zu Hierarchie zuerst das einfachste Muster (meist ein einzelner ReAct-Agent) messen — Mehragenten nur, wenn messbare Fehlermodi es erzwingen.
Hierarchische Agenten sind eine Multi-Agent-Architektur, in der ein Supervisor-Agent eine komplexe Aufgabe zerlegt, Teilaufgaben an spezialisierte Sub-Agents delegiert und deren Ergebnisse zusammenführt. Statt eines einzelnen Agenten, der alles selbst erledigt, koordiniert eine übergeordnete Steuerungsinstanz mehrere untergeordnete Worker und aggregiert deren Output zu einer Gesamtlösung. Das Muster entspricht dem, was Anthropic „Orchestrator-Workers“ nennt und CrewAI als „Hierarchical Process“ implementiert.
- Supervisor: plant, zerlegt, delegiert, aggregiert — führt selbst keine fachliche Detailarbeit aus.
- Sub-Agents: eng spezialisierte Worker mit eigenem Prompt und eigenen Tools, die je eine Teilaufgabe lösen.
- Skalierung: lohnt sich, wenn Aufgaben klar zerlegbar und parallelisierbar sind — sonst ist ein einzelner Agent günstiger.
Wie eine hierarchische Architektur funktioniert
Im Kern ist die Hierarchie eine Erweiterung der Orchestrator-Worker-Logik, bei der ein koordinierendes LLM eine Aufgabe dynamisch in Teilaufgaben zerlegt und diese an untergeordnete Einheiten verteilt. Anthropic beschreibt das zugehörige Muster in „Building Effective Agents“ (Dezember 2024) unter dem Namen „Orchestrator-Workers“ als eines von fünf kanonischen Workflow-Mustern und ordnet es derselben Familie zu wie Plan-and-Execute: ein koordinierendes LLM zerlegt und delegiert dynamisch. Das Muster steckt unter anderem in Claudes Coding-Agenten.
Der Ablauf folgt einer wiederkehrenden Schleife:
- Der Supervisor erhält die Aufgabe und erstellt einen Plan beziehungsweise eine Zerlegung in Teilaufgaben.
- Er wählt für jede Teilaufgabe einen passenden Sub-Agent aus und delegiert mit dem nötigen Kontext.
- Die Sub-Agents führen ihre Teilaufgabe aus — typischerweise als eigenständige ReAct-Agenten mit eigenen Tools — und melden ein Teilergebnis zurück.
- Der Supervisor aggregiert die Teilergebnisse, prüft auf Vollständigkeit und entscheidet: weitere Delegation oder finale Antwort.
Wichtig ist die Rollentrennung. Der Supervisor trifft Planungs- und Koordinationsentscheidungen; er führt die fachliche Detailarbeit nicht selbst aus. Genau diese Entkopplung erlaubt eine kosteneffiziente Modellwahl — eine Einsicht, die direkt aus dem Plan-and-Execute-Muster stammt: ein großes Modell für die schwierige Planungsaufgabe, kleinere und günstigere Modelle für die per-Schritt-Ausführung in den Sub-Agents.
Diagramm in Worten
Man stelle sich einen Baum mit drei Ebenen vor. An der Wurzel sitzt die Nutzeranfrage. Eine Ebene tiefer steht der Supervisor-Knoten, der die Anfrage in mehrere Äste aufspaltet. Jeder Ast endet in einem Sub-Agent-Knoten — etwa „Rechercheur“, „Datenanalyst“, „Texter“ —, der wiederum eine eigene kleine ReAct-Schleife (Thought → Action → Observation) mit seinen Tools durchläuft. Die Ergebnisse fließen entlang der Äste zurück zum Supervisor, der sie zu einer Antwort an der Wurzel zusammenführt. Genau dieses Bild beschreibt auch das Forschungsmuster ReAcTree (Choi et al., arXiv:2511.02424, AAMAS 2026), das ReAct zu einem hierarchischen Agentenbaum erweitert und auf dem Benchmark WAH-NL rund +30 Prozentpunkte gegenüber einfachem ReAct erreicht.
Wann Hierarchie skaliert
Hierarchie ist kein Selbstzweck. Sie zahlt sich aus, wenn die Aufgabenstruktur sie hergibt:
- Zerlegbarkeit: Die Aufgabe zerfällt in mehr als drei weitgehend unabhängige Teilschritte.
- Spezialisierung: Die Teilschritte erfordern unterschiedliches Domänenwissen oder verschiedene Tools.
- Langer Horizont: Ein einzelner Agent würde über viele Schritte das ursprüngliche Ziel aus dem Kontext verlieren (in der Praxis liegt die Grenze einer ReAct-Schleife oft bei 10 bis 25 Schritten, bevor Kontextverlust oder „reasoning drift“ dominieren).
- Parallelität: Mehrere Teilaufgaben lassen sich gleichzeitig erledigen.
Die wichtigste produktive Leitlinie liefert Cognition (das Team hinter Devin). In „Don't Build Multi-Agents“ (Juni 2025) warnte das Team, dass parallele Agenten implizit widersprüchliche Entscheidungen treffen und das Ergebnis fragil wird; Devin startete bewusst einsträngig mit ausschließlich lesenden Sub-Agents. In „Multi-Agents: What's Actually Working“ (April 2026) wurde die Position präzisiert: Mehragenten sind tragfähig für read-parallel, write-single-threaded-Aufbauten. Konkret nutzt Devin heute einen Manager-Devin, der über ein internes MCP Kind-Devins erzeugt. Übersetzt für die Praxis: ein starker Agent mit Tools als Standard, parallele Sub-Agents nur zur Informationsbeschaffung — niemals für Schreibvorgänge oder Zustandsänderungen.
Vorteile und Risiken
Dimension | Vorteil | Risiko / Kosten |
|---|---|---|
Spezialisierung | Jeder Sub-Agent hat schlanken Prompt, klare Tools, hohe Trefferquote | Falsche Aufgabenzerlegung führt Sub-Agents ins Leere |
Modularität | Sub-Agents sind einzeln testbar, austauschbar, wiederverwendbar | Mehr bewegliche Teile, höhere Architektur-Komplexität |
Kosten | Günstiges Modell für Worker, teures nur für Supervisor (40–70 % Ersparnis bei Modell-Tiering, Stand 2026) | Jede Delegation und Aggregation kostet zusätzliche LLM-Aufrufe |
Latenz | Parallele Sub-Agents verkürzen die Gesamtdauer | Sequenzielle Delegation addiert Koordinations-Latenz |
Robustheit | Verantwortung gebündelt beim Supervisor | Kontextverlust bei der Übergabe; widersprüchliche Annahmen paralleler Worker |
Auditierbarkeit | Klare, nachvollziehbare Delegations- und Planungsspuren (wichtig für DSGVO / EU AI Act) | Vollständige Trace-Persistenz über alle Sub-Agents nötig |
Der dominierende Nachteil ist der Koordinations-Overhead. Jeder zusätzliche Agent bedeutet zusätzliche LLM-Aufrufe für Planung, Delegation und Aggregation sowie das Risiko, dass beim Weiterreichen von Kontext Informationen verloren gehen. Deshalb gilt die übergeordnete Faustregel aus Anthropics Essay und Cognitions Blog: mit dem einfachsten Muster starten, das funktioniert (meist ein einzelner ReAct-Agent), und erst dann zu Planung, Reflexion oder Hierarchie eskalieren, wenn gemessene Fehlermodi es erzwingen. Unnötige Framework-Abstraktion ist laut Anthropic das zentrale Anti-Muster.
Abgrenzung zu flachen Multi-Agent-Systemen
In einem flachen Multi-Agent-System kommunizieren gleichrangige Agenten direkt miteinander — es gibt keine zentrale Steuerinstanz, die delegiert und aggregiert. Das ist flexibel, aber genau hier liegt das von Cognition beschriebene Problem: ohne koordinierende Instanz treffen die Agenten leicht implizit widersprüchliche Entscheidungen, weil keiner den Gesamtkontext besitzt.
Im hierarchischen System bündelt der Supervisor die Verantwortung. Er ist der einzige Akteur mit Gesamtüberblick, vergibt klare Teilaufträge und integriert die Ergebnisse. Das reduziert das Risiko widersprüchlicher Entscheidungen — auf Kosten eines zentralen Engpasses und zusätzlicher Koordinationsschritte. Für die meisten DACH-B2B-Szenarien mit Compliance-Anforderungen ist die hierarchische Variante die berechenbarere, weil der Delegationspfad auditierbar bleibt.
Frameworks und Umsetzung (Stand 2026)
- CrewAI: direkter Treffer.
Process.hierarchicalaktiviert einen Manager (manager_agentodermanager_llm), der Aufgaben an die Crew delegiert und eine managerielle Replanungsebene hinzufügt. MitCrew(planning=True)erzeugt einAgentPlannerzusätzlich vor jeder Iteration einen Schritt-für-Schritt-Plan. CrewAI ist im DACH-Marketing-Automation-Umfeld stark verbreitet. - LangGraph: als State-Graph mit einem Supervisor-Knoten und mehreren ReAct-Sub-Agents (
create_react_agent, in der 2026er-API zunehmendlangchain.agents.create_agentmit Middleware). Die Plan-and-Execute- und ReWOO-Tutorials liefern die Bausteine für Planung und delegierte Ausführung. - Microsoft Agent Framework: Group Chat mit dediziertem Planner-Agent und Worker-Agenten; der produktivierte SPAR-Zyklus (Sense → Plan → Act → Reflect) verbindet ReAct und Reflexion. AutoGen befindet sich im Wartungsmodus; neue Projekte werden auf das Microsoft Agent Framework verwiesen.
- n8n: realistisch für orchestrierte Batch-Workflows (Planner-Agent plus per Sub-Workflow exponierte Worker als Tools), aber ohne stateful Schleifen über Ausführungen hinweg nur mit externem Speicher.
Praxisbeispiel: Wettbewerbsanalyse als Agentur-Workflow
Eine Agentur soll eine Wettbewerbsanalyse für einen B2B-Kunden erstellen. Ein einzelner Agent würde über viele Tool-Aufrufe das Ziel verlieren. Hierarchisch sieht der Ablauf so aus (Pseudocode):
```
Supervisor.plan("Wettbewerbsanalyse für Kunde X"):
-> Teilaufgabe 1: research_agent("Top-5-Wettbewerber + Positionierung")
-> Teilaufgabe 2: pricing_agent("öffentliche Preismodelle erfassen")
-> Teilaufgabe 3: seo_agent("organische Sichtbarkeit der Wettbewerber")
# 1-3 laufen parallel (read-only)
results = gather(1, 2, 3) # parallele Lese-Sub-Agents
Supervisor.aggregate(results) # einziger schreibender Schritt
-> writer_agent("Management-Summary aus den Evidenzen") # single-threaded
```
Drei lesende Sub-Agents arbeiten parallel und liefern Evidenzen; der Supervisor führt sie zusammen, und genau ein schreibender Schritt (das Texten der Summary) bleibt einsträngig. Damit folgt der Workflow exakt dem von Cognition empfohlenen „read-parallel, write-single-threaded“-Prinzip. Durch Modell-Tiering — großes Modell für Supervisor und Texter, günstigeres für die Lese-Worker — sind über mehrstufige Workflows hinweg rund 40–70 % Kostenersparnis gegenüber einer durchgehend teuren Variante realistisch (Größenordnung, Stand 2026; auf der eigenen Last messen).
Für Agenturen und B2B
Hierarchische Agenten sind kein Default, sondern eine bewusste Eskalation. Für Agenturen heißt das: zerlegbare, wiederkehrende Liefergegenstände — Recherche-Briefings, Reportings, Content-Pipelines — eignen sich für einen Supervisor mit spezialisierten Lese-Sub-Agents, während der finale, zustandsverändernde Schritt zentral bleibt. Für DACH-B2B-Entscheider ist die Auditierbarkeit des Delegationspfads (vollständige Trace-Persistenz mit PII-Bereinigung) im Hinblick auf DSGVO und EU AI Act ein konkreter Mehrwert. Wer einen hierarchischen Agenten-Workflow für Marketing oder Operations evaluieren will, sollte mit einem messbaren Einzelfall starten, das einfachste funktionierende Muster als Baseline halten und erst bei nachgewiesenem Nutzen auf Hierarchie umstellen. Blck Alpaca begleitet diese Architekturentscheidung von der Aufgaben-Zerlegung bis zur produktiven, compliance-konformen Umsetzung.
Häufig gestellte Fragen
Was ist der Unterschied zwischen einem Supervisor-Agent und einem Sub-Agent?
Wann lohnt sich eine hierarchische Architektur statt eines einzelnen Agenten?
Worin unterscheiden sich hierarchische von flachen Multi-Agent-Systemen?
Was ist das größte Risiko hierarchischer Agenten?
Welche Frameworks unterstützen hierarchische Agenten produktiv?
Tiefer einsteigen?
Erhalte neue Analysen direkt ins Postfach – oder sieh dir an, wie wir dieses Wissen für Unternehmen umsetzen.