Die Geschichte der AI Agents
Die Geschichte der AI Agents reicht vom klassischen Agentenbegriff der KI-Forschung (ein System, das seine Umgebung wahrnimmt und darauf mit Aktionen reagiert) über das ReAct-Muster (2022), das Reasoning und Acting im selben LLM-Loop verbindet, bis zu heutigen Frontier-LLM-Agenten. Offene Standards wie MCP (2025) und A2A (2025) verbinden Agenten mit Tools und untereinander.
Auf einen Blick
- ✓Der klassische Agentenbegriff (Wahrnehmung-Aktion-Schleife) ist Jahrzehnte alt; neu ist die LLM-gestuetzte, mehrstufige Planung als Steuerungskern.
- ✓ReAct (Yao et al. 2022, arXiv:2210.03629) verband erstmals Reasoning und Acting im selben LLM-Loop und legte das konzeptionelle Fundament moderner Agenten.
- ✓Frontier-LLM-Agenten steuern Reihenfolge und Tool-Wahl dynamisch (Maturity L4) und koordinieren als Multi-Agent-Systeme (L5).
- ✓MCP (Spec 2025-11-25, >10.000 MCP-Server) standardisiert die Verbindung Agent zu Tool; A2A (Linux Foundation seit Juni 2025, 150+ Organisationen) die Verbindung Agent zu Agent.
- ✓Trotz Hype bleibt der Reifegrad niedrig: laut McKinsey skalieren 2025 erst 23 Prozent mindestens einen agentischen Use Case, Gartner erwartet ueber 40 Prozent Projektabbrueche bis Ende 2027.
- ✓Standardisierung und Realismus statt Agent-Washing praegen die aktuelle Phase: offene Protokolle und Outcome-KPIs entscheiden ueber den produktiven Einsatz.
Die Geschichte der AI Agents reicht vom klassischen Agentenbegriff der KI-Forschung (ein System, das seine Umgebung wahrnimmt und darauf mit Aktionen reagiert) über das ReAct-Muster (2022), das Reasoning und Acting im selben LLM-Loop verbindet, bis zu heutigen Frontier-LLM-Agenten. Offene Standards wie MCP (2025) und A2A (2025) verbinden Agenten mit Tools und untereinander.
Die wichtigsten Meilensteine auf einen Blick:
- Klassischer Agentenbegriff: Ein Agent nimmt seine Umgebung wahr und handelt zielgerichtet darauf (Perceive-Act). Dieses Grundprinzip ist alt; neu ist der LLM-Core als Steuerung.
- ReAct (2022): Reasoning und Acting verschmelzen im selben LLM-Loop. Das Muster Perceive-Reason-Act-Observe wird zum Bauplan moderner Agenten.
- Standardisierung (2025): MCP verbindet Agenten mit Tools, A2A verbindet Agenten untereinander. Beide werden zu offenen Protokollen unter dem Dach der Linux Foundation.
Der klassische Agentenbegriff: Wahrnehmung und Aktion
Das Konzept des Agenten ist deutlich älter als die heutige LLM-Welle. In der klassischen KI bezeichnet ein Agent ein System, das seine Umgebung wahrnimmt und mit Aktionen darauf reagiert, um ein Ziel zu verfolgen. Die einfachste Form ist der Reflex-Agent: regelbasiert, reaktiv, ohne echtes Modell der Welt. In der heutigen Maturity-Einordnung entspricht das der Stufe L1 (Reflex), etwa ein FAQ-Bot oder ein Thermostat.
Diese frühen Agenten hatten zwei der vier Eigenschaften moderner AI Agents bereits im Ansatz: die Wahrnehmung der Umgebung und die zielorientierte Aktion. Was fehlte, war ein leistungsfähiger Reasoning-Kern, der mehrstufig planen und Werkzeuge dynamisch auswählen konnte. Genau diese Lücke schließen Large Language Models.
Der Wendepunkt: ReAct (2022)
Der konzeptionelle Bruch kam mit dem ReAct-Muster (Yao et al. 2022, arXiv:2210.03629). ReAct steht für Reasoning und Acting im selben LLM-Loop: Das Modell denkt nicht nur über eine Aufgabe nach, sondern verschränkt diese Überlegungen direkt mit Aktionen, etwa Tool-Calls, und beobachtet die Ergebnisse, bevor es weiterplant.
Damit entsteht der Reasoning-Loop, der bis heute den Kern eines Agenten bildet: Perceive → Reason → Act → Observe, iterativ wiederholt, bis das Ziel erreicht oder der Lauf abgebrochen wird. ReAct lieferte das Bindeglied zwischen dem alten Agentenbegriff (Wahrnehmung-Aktion) und der neuen Welt der Sprachmodelle. Erst jetzt waren alle vier Pflicht-Eigenschaften eines AI Agents beisammen: LLM-gestützte Steuerung, mehrschrittige Planung, Tool-Use und zielorientierte Autonomie in Guardrails.
Von Augmented LLMs zu autonomen Agenten
Nach ReAct entwickelte sich die Agentenlandschaft entlang eines Reifegradmodells weiter, das die zunehmende Autonomie gut abbildet:
Stufe | Bezeichnung | Charakteristik | Beispiel |
|---|---|---|---|
L1 | Reflex | Regelbasiert, reaktiv | FAQ-Bot, Thermostat |
L2 | Augmented LLM | LLM plus einzelner Tool-Call, reaktiv | ChatGPT mit Web-Search |
L3 | Workflow-Agent | LLM in deterministischer Pipeline (Prompt-Chaining, Routing) | strukturierte Verarbeitungskette |
L4 | Autonomer Agent | LLM steuert Reihenfolge und Tool-Wahl dynamisch, voller Loop | Claude Code, Deep Research |
L5 | Multi-Agent-System | Mehrere autonome Agenten koordinieren via A2A | Orchestrator plus Spezialisten |
Der entscheidende Sprung liegt zwischen L3 und L4. Bei einem Workflow-Agenten ist der Pfad vorab definiert; das LLM füllt nur Lücken in einer deterministischen Pipeline. Ein autonomer Agent (L4) entscheidet dagegen selbst, welche Tools er in welcher Reihenfolge nutzt, und passt seinen Plan iterativ an. Genau hier zahlt sich ein Agent aus: wenn der Lösungsweg nicht im Voraus planbar ist.
Ein konkretes Beispiel für L4 ist ein Coding-Agent wie Claude Code. Er erhält ein Ziel (etwa einen Bug beheben), liest dafür selbstständig Dateien, führt Tests aus, beobachtet die Ergebnisse und entscheidet auf dieser Basis, welche Datei er als Nächstes ändert. Die Reihenfolge der Schritte steht nicht in einem Skript, sondern entsteht im Loop. Das ist der praktische Unterschied zwischen einem klassischen Workflow und einem echten Agenten.
Frontier-LLMs als neuer Agentenkern
Mit den Frontier-LLMs der jüngeren Generation wurde der Reasoning-Loop belastbar genug für produktive Aufgaben. Fünf Komponenten bilden heute einen Agenten: der LLM-Core für das Reasoning, der Memory (Kurzzeit als Context, Langzeit über Vektor, RAG oder Dateien), die Tools (Function-Calls, APIs, MCP-Server, Browser, Code-Sandbox), der Planner, der ein Ziel in Teilschritte zerlegt, und der Executor, der die Tool-Calls ausführt und dabei Turns, Loop-Limits und Guardrails überwacht.
Diese Architektur erklärt auch, warum kein eigenes, selbst trainiertes Modell nötig ist: API-LLMs liefern den Reasoning-Kern, die Agentenlogik entsteht in der Schicht darüber.
2025: Das Jahr der Standardisierung (MCP und A2A)
Bis 2024 war jede Tool-Anbindung weitgehend proprietär. 2025 brachte die entscheidende Standardisierung, und zwar in zwei Dimensionen.
MCP (Model Context Protocol) standardisiert die Verbindung zwischen Agent und Tool. Die Spezifikation trägt die Version 2025-11-25; im Dezember 2025 wurde MCP an die Linux Foundation beziehungsweise die Agentic AI Foundation übergeben. Inzwischen existieren über 10.000 MCP-Server. MCP beantwortet damit die Frage, wie ein Agent herstellerneutral auf externe Werkzeuge zugreift.
A2A (Agent-to-Agent) standardisiert die Verbindung zwischen Agenten untereinander und bildet damit die technische Grundlage für Multi-Agent-Systeme (L5). A2A liegt seit Juni 2025 bei der Linux Foundation und wird von über 150 Organisationen getragen. Damit wird die Koordination mehrerer spezialisierter Agenten, etwa Orchestrator plus Fachagenten, anschlussfähig über Herstellergrenzen hinweg.
Diese beiden Protokolle markieren den Übergang von isolierten Einzelagenten zu einem offenen Ökosystem.
Wo wir heute stehen: Hype trifft Realität
Der historische Bogen endet vorerst in einer Phase der Ernüchterung und Konsolidierung. Die Verbreitung steigt klar, der produktive Reifegrad bleibt aber niedrig.
Laut McKinsey State of AI 2025 skalieren erst 23 Prozent der Unternehmen mindestens einen agentischen Use Case, weitere 39 Prozent experimentieren; in keiner Geschäftsfunktion liegt der Anteil skalierter Use Cases über 10 Prozent. Gartner erwartet (Stand Juni 2025), dass über 40 Prozent der agentischen KI-Projekte bis Ende 2027 abgebrochen werden. Begleitet wird das von Agent-Washing: Laut Gartner verfügen nur etwa 130 Anbieter über echte Agent-Fähigkeiten.
Die Lehre aus dieser jüngsten Geschichte ist pragmatisch: nicht das Framework, sondern der Use Case entscheidet. Ein Agent lohnt sich dort, wo der Lösungsweg nicht vorab planbar ist; überall sonst sind ein Workflow oder klassische RPA günstiger und robuster. Offene Standards wie MCP und A2A senken dabei die Bindung an einzelne Hersteller und machen Architekturen zukunftsfähiger.
Hinweis: Die genannten regulatorischen und rechtlichen Aspekte sind informational und stellen keine Rechtsberatung dar.
Häufig gestellte Fragen
Wann beginnt die Geschichte der AI Agents?
Was ist das ReAct-Muster und warum ist es ein Meilenstein?
Was unterscheidet einen autonomen Agenten von einem Workflow?
Was sind MCP und A2A und warum waren 2025 so wichtig?
Brauche ich ein eigenes, selbst trainiertes LLM fuer einen Agenten?
Wie reif sind AI Agents aktuell wirklich?
Tiefer einsteigen?
Erhalte neue Analysen direkt ins Postfach – oder sieh dir an, wie wir dieses Wissen für Unternehmen umsetzen.