1.9Einsteiger7 min

Die Geschichte der AI Agents

Blck Alpaca·8. Juni 2026

Definition

Die Geschichte der AI Agents reicht vom klassischen Agentenbegriff der KI-Forschung (ein System, das seine Umgebung wahrnimmt und darauf mit Aktionen reagiert) über das ReAct-Muster (2022), das Reasoning und Acting im selben LLM-Loop verbindet, bis zu heutigen Frontier-LLM-Agenten. Offene Standards wie MCP (2025) und A2A (2025) verbinden Agenten mit Tools und untereinander.

Auf einen Blick

✓Der klassische Agentenbegriff (Wahrnehmung-Aktion-Schleife) ist Jahrzehnte alt; neu ist die LLM-gestützte, mehrstufige Planung als Steuerungskern.
✓ReAct (Yao et al. 2022, arXiv:2210.03629) verband erstmals Reasoning und Acting im selben LLM-Loop und legte das konzeptionelle Fundament moderner Agenten.
✓Frontier-LLM-Agenten steuern Reihenfolge und Tool-Wahl dynamisch (Maturity L4) und koordinieren als Multi-Agent-Systeme (L5).
✓MCP (Spec 2025-11-25, >10.000 MCP-Server) standardisiert die Verbindung Agent zu Tool; A2A (Linux Foundation seit Juni 2025, 150+ Organisationen) die Verbindung Agent zu Agent.
✓Trotz Hype bleibt der Reifegrad niedrig: laut McKinsey skalieren 2025 erst 23 Prozent mindestens einen agentischen Use Case, Gartner erwartet über 40 Prozent Projektabbrüche bis Ende 2027.
✓Standardisierung und Realismus statt Agent-Washing prägen die aktuelle Phase: offene Protokolle und Outcome-KPIs entscheiden über den produktiven Einsatz.

Die Geschichte der AI Agents reicht vom klassischen Agentenbegriff der KI-Forschung (ein System, das seine Umgebung wahrnimmt und darauf mit Aktionen reagiert) über das ReAct-Muster (2022), das Reasoning und Acting im selben LLM-Loop verbindet, bis zu heutigen Frontier-LLM-Agenten. Offene Standards wie MCP (2025) und A2A (2025) verbinden Agenten mit Tools und untereinander.

Die wichtigsten Meilensteine auf einen Blick:

Klassischer Agentenbegriff: Ein Agent nimmt seine Umgebung wahr und handelt zielgerichtet darauf (Perceive-Act). Dieses Grundprinzip ist alt; neu ist der LLM-Core als Steuerung.
ReAct (2022): Reasoning und Acting verschmelzen im selben LLM-Loop. Das Muster Perceive-Reason-Act-Observe wird zum Bauplan moderner Agenten.
Standardisierung (2025): MCP verbindet Agenten mit Tools, A2A verbindet Agenten untereinander. Beide werden zu offenen Protokollen unter dem Dach der Linux Foundation.

Der klassische Agentenbegriff: Wahrnehmung und Aktion

Das Konzept des Agenten ist deutlich älter als die heutige LLM-Welle. In der klassischen KI bezeichnet ein Agent ein System, das seine Umgebung wahrnimmt und mit Aktionen darauf reagiert, um ein Ziel zu verfolgen. Die einfachste Form ist der Reflex-Agent: regelbasiert, reaktiv, ohne echtes Modell der Welt. In der heutigen Maturity-Einordnung entspricht das der Stufe L1 (Reflex), etwa ein FAQ-Bot oder ein Thermostat.

Diese frühen Agenten hatten zwei der vier Eigenschaften moderner AI Agents bereits im Ansatz: die Wahrnehmung der Umgebung und die zielorientierte Aktion. Was fehlte, war ein leistungsfähiger Reasoning-Kern, der mehrstufig planen und Werkzeuge dynamisch auswählen konnte. Genau diese Lücke schließen Large Language Models.

Der Wendepunkt: ReAct (2022)

Der konzeptionelle Bruch kam mit dem ReAct-Muster (Yao et al. 2022, arXiv:2210.03629). ReAct steht für Reasoning und Acting im selben LLM-Loop: Das Modell denkt nicht nur über eine Aufgabe nach, sondern verschränkt diese Überlegungen direkt mit Aktionen, etwa Tool-Calls, und beobachtet die Ergebnisse, bevor es weiterplant.

Damit entsteht der Reasoning-Loop, der bis heute den Kern eines Agenten bildet: Perceive → Reason → Act → Observe, iterativ wiederholt, bis das Ziel erreicht oder der Lauf abgebrochen wird. ReAct lieferte das Bindeglied zwischen dem alten Agentenbegriff (Wahrnehmung-Aktion) und der neuen Welt der Sprachmodelle. Erst jetzt waren alle vier Pflicht-Eigenschaften eines AI Agents beisammen: LLM-gestützte Steuerung, mehrschrittige Planung, Tool-Use und zielorientierte Autonomie in Guardrails.

Von Augmented LLMs zu autonomen Agenten

Nach ReAct entwickelte sich die Agentenlandschaft entlang eines Reifegradmodells weiter, das die zunehmende Autonomie gut abbildet:

Stufe	Bezeichnung	Charakteristik	Beispiel
L1	Reflex	Regelbasiert, reaktiv	FAQ-Bot, Thermostat
L2	Augmented LLM	LLM plus einzelner Tool-Call, reaktiv	ChatGPT mit Web-Search
L3	Workflow-Agent	LLM in deterministischer Pipeline (Prompt-Chaining, Routing)	strukturierte Verarbeitungskette
L4	Autonomer Agent	LLM steuert Reihenfolge und Tool-Wahl dynamisch, voller Loop	Claude Code, Deep Research
L5	Multi-Agent-System	Mehrere autonome Agenten koordinieren via A2A	Orchestrator plus Spezialisten

Der entscheidende Sprung liegt zwischen L3 und L4. Bei einem Workflow-Agenten ist der Pfad vorab definiert; das LLM füllt nur Lücken in einer deterministischen Pipeline. Ein autonomer Agent (L4) entscheidet dagegen selbst, welche Tools er in welcher Reihenfolge nutzt, und passt seinen Plan iterativ an. Genau hier zahlt sich ein Agent aus: wenn der Lösungsweg nicht im Voraus planbar ist.

Ein konkretes Beispiel für L4 ist ein Coding-Agent wie Claude Code. Er erhält ein Ziel (etwa einen Bug beheben), liest dafür selbstständig Dateien, führt Tests aus, beobachtet die Ergebnisse und entscheidet auf dieser Basis, welche Datei er als Nächstes ändert. Die Reihenfolge der Schritte steht nicht in einem Skript, sondern entsteht im Loop. Das ist der praktische Unterschied zwischen einem klassischen Workflow und einem echten Agenten.

Frontier-LLMs als neuer Agentenkern

Mit den Frontier-LLMs der jüngeren Generation wurde der Reasoning-Loop belastbar genug für produktive Aufgaben. Fünf Komponenten bilden heute einen Agenten: der LLM-Core für das Reasoning, der Memory (Kurzzeit als Context, Langzeit über Vektor, RAG oder Dateien), die Tools (Function-Calls, APIs, MCP-Server, Browser, Code-Sandbox), der Planner, der ein Ziel in Teilschritte zerlegt, und der Executor, der die Tool-Calls ausführt und dabei Turns, Loop-Limits und Guardrails überwacht.

Diese Architektur erklärt auch, warum kein eigenes, selbst trainiertes Modell nötig ist: API-LLMs liefern den Reasoning-Kern, die Agentenlogik entsteht in der Schicht darüber.

2025: Das Jahr der Standardisierung (MCP und A2A)

Bis 2024 war jede Tool-Anbindung weitgehend proprietär. 2025 brachte die entscheidende Standardisierung, und zwar in zwei Dimensionen.

MCP (Model Context Protocol) standardisiert die Verbindung zwischen Agent und Tool. Die Spezifikation trägt die Version 2025-11-25; im Dezember 2025 wurde MCP an die Linux Foundation beziehungsweise die Agentic AI Foundation übergeben. Inzwischen existieren über 10.000 MCP-Server. MCP beantwortet damit die Frage, wie ein Agent herstellerneutral auf externe Werkzeuge zugreift.

A2A (Agent-to-Agent) standardisiert die Verbindung zwischen Agenten untereinander und bildet damit die technische Grundlage für Multi-Agent-Systeme (L5). A2A liegt seit Juni 2025 bei der Linux Foundation und wird von über 150 Organisationen getragen. Damit wird die Koordination mehrerer spezialisierter Agenten, etwa Orchestrator plus Fachagenten, anschlussfähig über Herstellergrenzen hinweg.

Diese beiden Protokolle markieren den Übergang von isolierten Einzelagenten zu einem offenen Ökosystem.

Wo wir heute stehen: Hype trifft Realität

Der historische Bogen endet vorerst in einer Phase der Ernüchterung und Konsolidierung. Die Verbreitung steigt klar, der produktive Reifegrad bleibt aber niedrig.

Laut McKinsey State of AI 2025 skalieren erst 23 Prozent der Unternehmen mindestens einen agentischen Use Case, weitere 39 Prozent experimentieren; in keiner Geschäftsfunktion liegt der Anteil skalierter Use Cases über 10 Prozent. Gartner erwartet (Stand Juni 2025), dass über 40 Prozent der agentischen KI-Projekte bis Ende 2027 abgebrochen werden. Begleitet wird das von Agent-Washing: Laut Gartner verfügen nur etwa 130 Anbieter über echte Agent-Fähigkeiten.

Die Lehre aus dieser jüngsten Geschichte ist pragmatisch: nicht das Framework, sondern der Use Case entscheidet. Ein Agent lohnt sich dort, wo der Lösungsweg nicht vorab planbar ist; überall sonst sind ein Workflow oder klassische RPA günstiger und robuster. Offene Standards wie MCP und A2A senken dabei die Bindung an einzelne Hersteller und machen Architekturen zukunftsfähiger.

Hinweis: Die genannten regulatorischen und rechtlichen Aspekte sind informational und stellen keine Rechtsberatung dar.

Häufig gestellte Fragen

Wann beginnt die Geschichte der AI Agents?

Der Agentenbegriff selbst ist alt: In der klassischen KI ist ein Agent ein System, das seine Umgebung wahrnimmt und zielgerichtet handelt. Die moderne, LLM-gestützte Generation beginnt konzeptionell 2022 mit dem ReAct-Muster (Yao et al., arXiv:2210.03629).

Was ist das ReAct-Muster und warum ist es ein Meilenstein?

ReAct (2022) verbindet Reasoning und Acting im selben LLM-Loop. Das Modell verschränkt seine Überlegungen direkt mit Aktionen wie Tool-Calls und beobachtet die Ergebnisse. Daraus entsteht der Loop Perceive-Reason-Act-Observe, der bis heute den Kern moderner Agenten bildet.

Was unterscheidet einen autonomen Agenten von einem Workflow?

Ein Workflow folgt einem vorab definierten, deterministischen Pfad; das LLM füllt nur Lücken. Ein autonomer Agent (Maturity L4) entscheidet dagegen selbst über Reihenfolge und Tool-Wahl und passt seinen Plan iterativ an. Ein Agent lohnt sich erst, wenn der Lösungsweg nicht vorab planbar ist.

Was sind MCP und A2A und warum waren 2025 so wichtig?

MCP (Model Context Protocol, Spec 2025-11-25, über 10.000 Server) standardisiert die Verbindung Agent zu Tool. A2A (Agent-to-Agent, Linux Foundation seit Juni 2025, über 150 Organisationen) standardisiert die Verbindung Agent zu Agent. Beide markieren den Übergang von isolierten Einzelagenten zu einem offenen Ökosystem.

Brauche ich ein eigenes, selbst trainiertes LLM für einen Agenten?

Nein. API-LLMs liefern den Reasoning-Kern als LLM-Core. Die Agentenlogik (Memory, Tools, Planner, Executor) entsteht in der Schicht darüber. Ein eigenes Modelltraining ist für den Betrieb eines Agenten nicht erforderlich.

Wie reif sind AI Agents aktuell wirklich?

Die Verbreitung steigt, der produktive Reifegrad bleibt niedrig. Laut McKinsey State of AI 2025 skalieren erst 23 Prozent der Unternehmen mindestens einen agentischen Use Case. Gartner erwartet (Stand Juni 2025), dass über 40 Prozent der agentischen KI-Projekte bis Ende 2027 abgebrochen werden.

Tiefer einsteigen?

Erhalte neue Analysen direkt ins Postfach, oder sieh dir an, wie wir dieses Wissen für Unternehmen umsetzen.

Newsletter abonnieren →Unsere Services

Vorheriger← Tool Calling: Wie AI Agents Werkzeuge nutzen NächsterAI Agents: FAQ für Entscheider →