2.7Experte7 min

Hierarchische Agenten: Supervisor und Sub-Agents

Blck Alpaca·9. Juni 2026

Definition

Hierarchische Agenten sind eine Multi-Agent-Architektur, in der ein Supervisor-Agent eine komplexe Aufgabe zerlegt, Teilaufgaben an spezialisierte Sub-Agents delegiert und deren Ergebnisse zusammenführt. Statt eines einzelnen Agenten koordiniert eine übergeordnete Steuerungsinstanz mehrere untergeordnete Worker und aggregiert deren Output zu einer Gesamtlösung.

Auf einen Blick

✓Ein Supervisor-Agent (auch Orchestrator oder Manager) plant, zerlegt und delegiert; spezialisierte Sub-Agents führen Teilaufgaben aus und liefern Ergebnisse zurück zur Aggregation.
✓Hierarchie skaliert dort, wo Aufgaben klar zerlegbar und parallelisierbar sind, der Lese-Anteil groß und der Schreib-/Zustands-Anteil klein ist.
✓Hauptvorteile sind Spezialisierung und Modularität; der zentrale Preis ist Koordinations-Overhead durch zusätzliche LLM-Aufrufe, Kontext-Weitergabe und mögliche widersprüchliche Entscheidungen.
✓Cognition empfiehlt (Stand 2026) das Muster „read-parallel, write-single-threaded“: Sub-Agents nur zur parallelen Informationsbeschaffung, Schreibvorgänge zentral beim Supervisor.
✓Anthropics „Orchestrator-Workers“-Muster und CrewAIs Hierarchical Process mit manager_agent sind die etablierten produktiven Umsetzungen (Stand 2026).
✓Vor der Eskalation zu Hierarchie zuerst das einfachste Muster (meist ein einzelner ReAct-Agent) messen: Mehragenten nur, wenn messbare Fehlermodi es erzwingen.

Hierarchische Agenten sind eine Multi-Agent-Architektur, in der ein Supervisor-Agent eine komplexe Aufgabe zerlegt, Teilaufgaben an spezialisierte Sub-Agents delegiert und deren Ergebnisse zusammenführt. Statt eines einzelnen Agenten, der alles selbst erledigt, koordiniert eine übergeordnete Steuerungsinstanz mehrere untergeordnete Worker und aggregiert deren Output zu einer Gesamtlösung. Das Muster entspricht dem, was Anthropic „Orchestrator-Workers“ nennt und CrewAI als „Hierarchical Process“ implementiert.

Supervisor: plant, zerlegt, delegiert, aggregiert, führt selbst aber keine fachliche Detailarbeit aus.
Sub-Agents: eng spezialisierte Worker mit eigenem Prompt und eigenen Tools, die je eine Teilaufgabe lösen.
Skalierung: lohnt sich, wenn Aufgaben klar zerlegbar und parallelisierbar sind, sonst ist ein einzelner Agent günstiger.

Wie eine hierarchische Architektur funktioniert

Im Kern ist die Hierarchie eine Erweiterung der Orchestrator-Worker-Logik, bei der ein koordinierendes LLM eine Aufgabe dynamisch in Teilaufgaben zerlegt und diese an untergeordnete Einheiten verteilt. Anthropic beschreibt das zugehörige Muster in „Building Effective Agents“ (Dezember 2024) unter dem Namen „Orchestrator-Workers“ als eines von fünf kanonischen Workflow-Mustern und ordnet es derselben Familie zu wie Plan-and-Execute: ein koordinierendes LLM zerlegt und delegiert dynamisch. Das Muster steckt unter anderem in Claudes Coding-Agenten.

Der Ablauf folgt einer wiederkehrenden Schleife:

Der Supervisor erhält die Aufgabe und erstellt einen Plan beziehungsweise eine Zerlegung in Teilaufgaben.
Er wählt für jede Teilaufgabe einen passenden Sub-Agent aus und delegiert mit dem nötigen Kontext.
Die Sub-Agents führen ihre Teilaufgabe aus, typischerweise als eigenständige ReAct-Agenten mit eigenen Tools, und melden ein Teilergebnis zurück.
Der Supervisor aggregiert die Teilergebnisse, prüft auf Vollständigkeit und entscheidet: weitere Delegation oder finale Antwort.

Wichtig ist die Rollentrennung. Der Supervisor trifft Planungs- und Koordinationsentscheidungen; er führt die fachliche Detailarbeit nicht selbst aus. Genau diese Entkopplung erlaubt eine kosteneffiziente Modellwahl, eine Einsicht, die direkt aus dem Plan-and-Execute-Muster stammt: ein großes Modell für die schwierige Planungsaufgabe, kleinere und günstigere Modelle für die per-Schritt-Ausführung in den Sub-Agents.

Diagramm in Worten

Man stelle sich einen Baum mit drei Ebenen vor. An der Wurzel sitzt die Nutzeranfrage. Eine Ebene tiefer steht der Supervisor-Knoten, der die Anfrage in mehrere Äste aufspaltet. Jeder Ast endet in einem Sub-Agent-Knoten, etwa „Rechercheur“, „Datenanalyst“, „Texter“, der wiederum eine eigene kleine ReAct-Schleife (Thought → Action → Observation) mit seinen Tools durchläuft. Die Ergebnisse fließen entlang der Äste zurück zum Supervisor, der sie zu einer Antwort an der Wurzel zusammenführt. Genau dieses Bild beschreibt auch das Forschungsmuster ReAcTree (Choi et al., arXiv:2511.02424, AAMAS 2026), das ReAct zu einem hierarchischen Agentenbaum erweitert und auf dem Benchmark WAH-NL rund +30 Prozentpunkte gegenüber einfachem ReAct erreicht.

Wann Hierarchie skaliert

Hierarchie ist kein Selbstzweck. Sie zahlt sich aus, wenn die Aufgabenstruktur sie hergibt:

Zerlegbarkeit: Die Aufgabe zerfällt in mehr als drei weitgehend unabhängige Teilschritte.
Spezialisierung: Die Teilschritte erfordern unterschiedliches Domänenwissen oder verschiedene Tools.
Langer Horizont: Ein einzelner Agent würde über viele Schritte das ursprüngliche Ziel aus dem Kontext verlieren (in der Praxis liegt die Grenze einer ReAct-Schleife oft bei 10 bis 25 Schritten, bevor Kontextverlust oder „reasoning drift“ dominieren).
Parallelität: Mehrere Teilaufgaben lassen sich gleichzeitig erledigen.

Die wichtigste produktive Leitlinie liefert Cognition (das Team hinter Devin). In „Don't Build Multi-Agents“ (Juni 2025) warnte das Team, dass parallele Agenten implizit widersprüchliche Entscheidungen treffen und das Ergebnis fragil wird; Devin startete bewusst einsträngig mit ausschließlich lesenden Sub-Agents. In „Multi-Agents: What's Actually Working“ (April 2026) wurde die Position präzisiert: Mehragenten sind tragfähig für read-parallel, write-single-threaded-Aufbauten. Konkret nutzt Devin heute einen Manager-Devin, der über ein internes MCP Kind-Devins erzeugt. Übersetzt für die Praxis: ein starker Agent mit Tools als Standard, parallele Sub-Agents nur zur Informationsbeschaffung, niemals für Schreibvorgänge oder Zustandsänderungen.

Vorteile und Risiken

Dimension	Vorteil	Risiko / Kosten
Spezialisierung	Jeder Sub-Agent hat schlanken Prompt, klare Tools, hohe Trefferquote	Falsche Aufgabenzerlegung führt Sub-Agents ins Leere
Modularität	Sub-Agents sind einzeln testbar, austauschbar, wiederverwendbar	Mehr bewegliche Teile, höhere Architektur-Komplexität
Kosten	Günstiges Modell für Worker, teures nur für Supervisor (40–70 % Ersparnis bei Modell-Tiering, Stand 2026)	Jede Delegation und Aggregation kostet zusätzliche LLM-Aufrufe
Latenz	Parallele Sub-Agents verkürzen die Gesamtdauer	Sequenzielle Delegation addiert Koordinations-Latenz
Robustheit	Verantwortung gebündelt beim Supervisor	Kontextverlust bei der Übergabe; widersprüchliche Annahmen paralleler Worker
Auditierbarkeit	Klare, nachvollziehbare Delegations- und Planungsspuren (wichtig für DSGVO / EU AI Act)	Vollständige Trace-Persistenz über alle Sub-Agents nötig

Der dominierende Nachteil ist der Koordinations-Overhead. Jeder zusätzliche Agent bedeutet zusätzliche LLM-Aufrufe für Planung, Delegation und Aggregation sowie das Risiko, dass beim Weiterreichen von Kontext Informationen verloren gehen. Deshalb gilt die übergeordnete Faustregel aus Anthropics Essay und Cognitions Blog: mit dem einfachsten Muster starten, das funktioniert (meist ein einzelner ReAct-Agent), und erst dann zu Planung, Reflexion oder Hierarchie eskalieren, wenn gemessene Fehlermodi es erzwingen. Unnötige Framework-Abstraktion ist laut Anthropic das zentrale Anti-Muster.

Abgrenzung zu flachen Multi-Agent-Systemen

In einem flachen Multi-Agent-System kommunizieren gleichrangige Agenten direkt miteinander, es gibt keine zentrale Steuerinstanz, die delegiert und aggregiert. Das ist flexibel, aber genau hier liegt das von Cognition beschriebene Problem: ohne koordinierende Instanz treffen die Agenten leicht implizit widersprüchliche Entscheidungen, weil keiner den Gesamtkontext besitzt.

Im hierarchischen System bündelt der Supervisor die Verantwortung. Er ist der einzige Akteur mit Gesamtüberblick, vergibt klare Teilaufträge und integriert die Ergebnisse. Das reduziert das Risiko widersprüchlicher Entscheidungen, allerdings auf Kosten eines zentralen Engpasses und zusätzlicher Koordinationsschritte. Für die meisten DACH-B2B-Szenarien mit Compliance-Anforderungen ist die hierarchische Variante die berechenbarere, weil der Delegationspfad auditierbar bleibt.

Frameworks und Umsetzung (Stand 2026)

CrewAI: direkter Treffer. Process.hierarchical aktiviert einen Manager (manager_agent oder manager_llm), der Aufgaben an die Crew delegiert und eine managerielle Replanungsebene hinzufügt. Mit Crew(planning=True) erzeugt ein AgentPlanner zusätzlich vor jeder Iteration einen Schritt-für-Schritt-Plan. CrewAI ist im DACH-Marketing-Automation-Umfeld stark verbreitet.
LangGraph: als State-Graph mit einem Supervisor-Knoten und mehreren ReAct-Sub-Agents (create_react_agent, in der 2026er-API zunehmend langchain.agents.create_agent mit Middleware). Die Plan-and-Execute- und ReWOO-Tutorials liefern die Bausteine für Planung und delegierte Ausführung.
Microsoft Agent Framework: Group Chat mit dediziertem Planner-Agent und Worker-Agenten; der produktivierte SPAR-Zyklus (Sense → Plan → Act → Reflect) verbindet ReAct und Reflexion. AutoGen befindet sich im Wartungsmodus; neue Projekte werden auf das Microsoft Agent Framework verwiesen.
n8n: realistisch für orchestrierte Batch-Workflows (Planner-Agent plus per Sub-Workflow exponierte Worker als Tools), aber ohne stateful Schleifen über Ausführungen hinweg nur mit externem Speicher.

Praxisbeispiel: Wettbewerbsanalyse als Agentur-Workflow

Eine Agentur soll eine Wettbewerbsanalyse für einen B2B-Kunden erstellen. Ein einzelner Agent würde über viele Tool-Aufrufe das Ziel verlieren. Hierarchisch sieht der Ablauf so aus (Pseudocode):

```
Supervisor.plan("Wettbewerbsanalyse für Kunde X"):
-> Teilaufgabe 1: research_agent("Top-5-Wettbewerber + Positionierung")
-> Teilaufgabe 2: pricing_agent("öffentliche Preismodelle erfassen")
-> Teilaufgabe 3: seo_agent("organische Sichtbarkeit der Wettbewerber")
# 1-3 laufen parallel (read-only)

results = gather(1, 2, 3) # parallele Lese-Sub-Agents
Supervisor.aggregate(results) # einziger schreibender Schritt
-> writer_agent("Management-Summary aus den Evidenzen") # single-threaded
```

Drei lesende Sub-Agents arbeiten parallel und liefern Evidenzen; der Supervisor führt sie zusammen, und genau ein schreibender Schritt (das Texten der Summary) bleibt einsträngig. Damit folgt der Workflow exakt dem von Cognition empfohlenen „read-parallel, write-single-threaded“-Prinzip. Durch Modell-Tiering (großes Modell für Supervisor und Texter, günstigeres für die Lese-Worker) sind über mehrstufige Workflows hinweg rund 40 bis 70 % Kostenersparnis gegenüber einer durchgehend teuren Variante realistisch (Größenordnung, Stand 2026; auf der eigenen Last messen).

Für Agenturen und B2B

Hierarchische Agenten sind kein Default, sondern eine bewusste Eskalation. Für Agenturen heißt das: zerlegbare, wiederkehrende Liefergegenstände, etwa Recherche-Briefings, Reportings, Content-Pipelines, eignen sich für einen Supervisor mit spezialisierten Lese-Sub-Agents, während der finale, zustandsverändernde Schritt zentral bleibt. Für DACH-B2B-Entscheider ist die Auditierbarkeit des Delegationspfads (vollständige Trace-Persistenz mit PII-Bereinigung) im Hinblick auf DSGVO und EU AI Act ein konkreter Mehrwert. Wer einen hierarchischen Agenten-Workflow für Marketing oder Operations evaluieren will, sollte mit einem messbaren Einzelfall starten, das einfachste funktionierende Muster als Baseline halten und erst bei nachgewiesenem Nutzen auf Hierarchie umstellen. Blck Alpaca begleitet diese Architekturentscheidung von der Aufgaben-Zerlegung bis zur produktiven, compliance-konformen Umsetzung.

Häufig gestellte Fragen

Was ist der Unterschied zwischen einem Supervisor-Agent und einem Sub-Agent?

Der Supervisor-Agent (auch Orchestrator oder Manager) übernimmt keine fachliche Detailarbeit, sondern zerlegt die Gesamtaufgabe, wählt passende Sub-Agents aus, delegiert Teilaufgaben und aggregiert die Ergebnisse. Sub-Agents sind spezialisierte Worker mit eng umrissenem Aufgabenbereich, eigenem Prompt und meist eigenen Tools, die ihr Teilergebnis an den Supervisor zurückmelden.

Wann lohnt sich eine hierarchische Architektur statt eines einzelnen Agenten?

Wenn eine Aufgabe in mehr als drei weitgehend unabhängige Teilschritte zerfällt, diese Schritte unterschiedliche Spezialisierung oder Tools brauchen und ein langer Planungshorizont vorliegt. Bei einfachen, reaktiven Aufgaben mit niedriger Latenzanforderung ist ein einzelner ReAct-Agent in der Regel günstiger und robuster.

Worin unterscheiden sich hierarchische von flachen Multi-Agent-Systemen?

In flachen Systemen kommunizieren gleichrangige Agenten direkt miteinander, ohne zentrale Steuerung. In hierarchischen Systemen läuft die Koordination über einen Supervisor, der delegiert und aggregiert. Flache Systeme treffen laut Cognition leicht implizit widersprüchliche Entscheidungen; Hierarchie bündelt Verantwortung, kostet aber Koordinations-Overhead.

Was ist das größte Risiko hierarchischer Agenten?

Koordinations-Overhead und Kontextverlust. Jede Delegation kostet zusätzliche LLM-Aufrufe und Latenz, und Informationen können beim Übergeben zwischen Supervisor und Sub-Agents verloren gehen. Parallele Sub-Agents können zudem widersprüchliche Annahmen treffen, was zu einem fragilen Gesamtergebnis führt.

Welche Frameworks unterstützen hierarchische Agenten produktiv?

Stand 2026 unterstützen CrewAI (Process.hierarchical mit manager_agent/manager_llm), LangGraph (State-Graph mit Supervisor-Knoten und ReAct-Sub-Agents) sowie das Microsoft Agent Framework (Group Chat mit Planner-Agent, SPAR-Zyklus) hierarchische Muster. Anthropics Orchestrator-Workers-Muster ist die konzeptionelle Referenz.

Tiefer einsteigen?

Erhalte neue Analysen direkt ins Postfach, oder sieh dir an, wie wir dieses Wissen für Unternehmen umsetzen.

Newsletter abonnieren →Unsere Services

Vorheriger← Plan-and-Execute: Wenn Planung von Ausführung getrennt wird NächsterEvent-driven Agenten: AutoGen v0.4 / AG2 Architektur erklärt →