Zum Inhalt springen
1.9Einsteiger7 min

Die Geschichte der AI Agents

Blck Alpaca·
Definition

Die Geschichte der AI Agents reicht vom klassischen Agentenbegriff der KI-Forschung (ein System, das seine Umgebung wahrnimmt und darauf mit Aktionen reagiert) über das ReAct-Muster (2022), das Reasoning und Acting im selben LLM-Loop verbindet, bis zu heutigen Frontier-LLM-Agenten. Offene Standards wie MCP (2025) und A2A (2025) verbinden Agenten mit Tools und untereinander.

Auf einen Blick

  • Der klassische Agentenbegriff (Wahrnehmung-Aktion-Schleife) ist Jahrzehnte alt; neu ist die LLM-gestuetzte, mehrstufige Planung als Steuerungskern.
  • ReAct (Yao et al. 2022, arXiv:2210.03629) verband erstmals Reasoning und Acting im selben LLM-Loop und legte das konzeptionelle Fundament moderner Agenten.
  • Frontier-LLM-Agenten steuern Reihenfolge und Tool-Wahl dynamisch (Maturity L4) und koordinieren als Multi-Agent-Systeme (L5).
  • MCP (Spec 2025-11-25, >10.000 MCP-Server) standardisiert die Verbindung Agent zu Tool; A2A (Linux Foundation seit Juni 2025, 150+ Organisationen) die Verbindung Agent zu Agent.
  • Trotz Hype bleibt der Reifegrad niedrig: laut McKinsey skalieren 2025 erst 23 Prozent mindestens einen agentischen Use Case, Gartner erwartet ueber 40 Prozent Projektabbrueche bis Ende 2027.
  • Standardisierung und Realismus statt Agent-Washing praegen die aktuelle Phase: offene Protokolle und Outcome-KPIs entscheiden ueber den produktiven Einsatz.

Die Geschichte der AI Agents reicht vom klassischen Agentenbegriff der KI-Forschung (ein System, das seine Umgebung wahrnimmt und darauf mit Aktionen reagiert) über das ReAct-Muster (2022), das Reasoning und Acting im selben LLM-Loop verbindet, bis zu heutigen Frontier-LLM-Agenten. Offene Standards wie MCP (2025) und A2A (2025) verbinden Agenten mit Tools und untereinander.

Die wichtigsten Meilensteine auf einen Blick:

  • Klassischer Agentenbegriff: Ein Agent nimmt seine Umgebung wahr und handelt zielgerichtet darauf (Perceive-Act). Dieses Grundprinzip ist alt; neu ist der LLM-Core als Steuerung.
  • ReAct (2022): Reasoning und Acting verschmelzen im selben LLM-Loop. Das Muster Perceive-Reason-Act-Observe wird zum Bauplan moderner Agenten.
  • Standardisierung (2025): MCP verbindet Agenten mit Tools, A2A verbindet Agenten untereinander. Beide werden zu offenen Protokollen unter dem Dach der Linux Foundation.

Der klassische Agentenbegriff: Wahrnehmung und Aktion

Das Konzept des Agenten ist deutlich älter als die heutige LLM-Welle. In der klassischen KI bezeichnet ein Agent ein System, das seine Umgebung wahrnimmt und mit Aktionen darauf reagiert, um ein Ziel zu verfolgen. Die einfachste Form ist der Reflex-Agent: regelbasiert, reaktiv, ohne echtes Modell der Welt. In der heutigen Maturity-Einordnung entspricht das der Stufe L1 (Reflex), etwa ein FAQ-Bot oder ein Thermostat.

Diese frühen Agenten hatten zwei der vier Eigenschaften moderner AI Agents bereits im Ansatz: die Wahrnehmung der Umgebung und die zielorientierte Aktion. Was fehlte, war ein leistungsfähiger Reasoning-Kern, der mehrstufig planen und Werkzeuge dynamisch auswählen konnte. Genau diese Lücke schließen Large Language Models.

Der Wendepunkt: ReAct (2022)

Der konzeptionelle Bruch kam mit dem ReAct-Muster (Yao et al. 2022, arXiv:2210.03629). ReAct steht für Reasoning und Acting im selben LLM-Loop: Das Modell denkt nicht nur über eine Aufgabe nach, sondern verschränkt diese Überlegungen direkt mit Aktionen, etwa Tool-Calls, und beobachtet die Ergebnisse, bevor es weiterplant.

Damit entsteht der Reasoning-Loop, der bis heute den Kern eines Agenten bildet: Perceive → Reason → Act → Observe, iterativ wiederholt, bis das Ziel erreicht oder der Lauf abgebrochen wird. ReAct lieferte das Bindeglied zwischen dem alten Agentenbegriff (Wahrnehmung-Aktion) und der neuen Welt der Sprachmodelle. Erst jetzt waren alle vier Pflicht-Eigenschaften eines AI Agents beisammen: LLM-gestützte Steuerung, mehrschrittige Planung, Tool-Use und zielorientierte Autonomie in Guardrails.

Von Augmented LLMs zu autonomen Agenten

Nach ReAct entwickelte sich die Agentenlandschaft entlang eines Reifegradmodells weiter, das die zunehmende Autonomie gut abbildet:

Stufe

Bezeichnung

Charakteristik

Beispiel

L1

Reflex

Regelbasiert, reaktiv

FAQ-Bot, Thermostat

L2

Augmented LLM

LLM plus einzelner Tool-Call, reaktiv

ChatGPT mit Web-Search

L3

Workflow-Agent

LLM in deterministischer Pipeline (Prompt-Chaining, Routing)

strukturierte Verarbeitungskette

L4

Autonomer Agent

LLM steuert Reihenfolge und Tool-Wahl dynamisch, voller Loop

Claude Code, Deep Research

L5

Multi-Agent-System

Mehrere autonome Agenten koordinieren via A2A

Orchestrator plus Spezialisten

Der entscheidende Sprung liegt zwischen L3 und L4. Bei einem Workflow-Agenten ist der Pfad vorab definiert; das LLM füllt nur Lücken in einer deterministischen Pipeline. Ein autonomer Agent (L4) entscheidet dagegen selbst, welche Tools er in welcher Reihenfolge nutzt, und passt seinen Plan iterativ an. Genau hier zahlt sich ein Agent aus: wenn der Lösungsweg nicht im Voraus planbar ist.

Ein konkretes Beispiel für L4 ist ein Coding-Agent wie Claude Code. Er erhält ein Ziel (etwa einen Bug beheben), liest dafür selbstständig Dateien, führt Tests aus, beobachtet die Ergebnisse und entscheidet auf dieser Basis, welche Datei er als Nächstes ändert. Die Reihenfolge der Schritte steht nicht in einem Skript, sondern entsteht im Loop. Das ist der praktische Unterschied zwischen einem klassischen Workflow und einem echten Agenten.

Frontier-LLMs als neuer Agentenkern

Mit den Frontier-LLMs der jüngeren Generation wurde der Reasoning-Loop belastbar genug für produktive Aufgaben. Fünf Komponenten bilden heute einen Agenten: der LLM-Core für das Reasoning, der Memory (Kurzzeit als Context, Langzeit über Vektor, RAG oder Dateien), die Tools (Function-Calls, APIs, MCP-Server, Browser, Code-Sandbox), der Planner, der ein Ziel in Teilschritte zerlegt, und der Executor, der die Tool-Calls ausführt und dabei Turns, Loop-Limits und Guardrails überwacht.

Diese Architektur erklärt auch, warum kein eigenes, selbst trainiertes Modell nötig ist: API-LLMs liefern den Reasoning-Kern, die Agentenlogik entsteht in der Schicht darüber.

2025: Das Jahr der Standardisierung (MCP und A2A)

Bis 2024 war jede Tool-Anbindung weitgehend proprietär. 2025 brachte die entscheidende Standardisierung, und zwar in zwei Dimensionen.

MCP (Model Context Protocol) standardisiert die Verbindung zwischen Agent und Tool. Die Spezifikation trägt die Version 2025-11-25; im Dezember 2025 wurde MCP an die Linux Foundation beziehungsweise die Agentic AI Foundation übergeben. Inzwischen existieren über 10.000 MCP-Server. MCP beantwortet damit die Frage, wie ein Agent herstellerneutral auf externe Werkzeuge zugreift.

A2A (Agent-to-Agent) standardisiert die Verbindung zwischen Agenten untereinander und bildet damit die technische Grundlage für Multi-Agent-Systeme (L5). A2A liegt seit Juni 2025 bei der Linux Foundation und wird von über 150 Organisationen getragen. Damit wird die Koordination mehrerer spezialisierter Agenten, etwa Orchestrator plus Fachagenten, anschlussfähig über Herstellergrenzen hinweg.

Diese beiden Protokolle markieren den Übergang von isolierten Einzelagenten zu einem offenen Ökosystem.

Wo wir heute stehen: Hype trifft Realität

Der historische Bogen endet vorerst in einer Phase der Ernüchterung und Konsolidierung. Die Verbreitung steigt klar, der produktive Reifegrad bleibt aber niedrig.

Laut McKinsey State of AI 2025 skalieren erst 23 Prozent der Unternehmen mindestens einen agentischen Use Case, weitere 39 Prozent experimentieren; in keiner Geschäftsfunktion liegt der Anteil skalierter Use Cases über 10 Prozent. Gartner erwartet (Stand Juni 2025), dass über 40 Prozent der agentischen KI-Projekte bis Ende 2027 abgebrochen werden. Begleitet wird das von Agent-Washing: Laut Gartner verfügen nur etwa 130 Anbieter über echte Agent-Fähigkeiten.

Die Lehre aus dieser jüngsten Geschichte ist pragmatisch: nicht das Framework, sondern der Use Case entscheidet. Ein Agent lohnt sich dort, wo der Lösungsweg nicht vorab planbar ist; überall sonst sind ein Workflow oder klassische RPA günstiger und robuster. Offene Standards wie MCP und A2A senken dabei die Bindung an einzelne Hersteller und machen Architekturen zukunftsfähiger.

Hinweis: Die genannten regulatorischen und rechtlichen Aspekte sind informational und stellen keine Rechtsberatung dar.

Häufig gestellte Fragen

Wann beginnt die Geschichte der AI Agents?
Der Agentenbegriff selbst ist alt: In der klassischen KI ist ein Agent ein System, das seine Umgebung wahrnimmt und zielgerichtet handelt. Die moderne, LLM-gestuetzte Generation beginnt konzeptionell 2022 mit dem ReAct-Muster (Yao et al., arXiv:2210.03629).
Was ist das ReAct-Muster und warum ist es ein Meilenstein?
ReAct (2022) verbindet Reasoning und Acting im selben LLM-Loop. Das Modell verschraenkt seine Ueberlegungen direkt mit Aktionen wie Tool-Calls und beobachtet die Ergebnisse. Daraus entsteht der Loop Perceive-Reason-Act-Observe, der bis heute den Kern moderner Agenten bildet.
Was unterscheidet einen autonomen Agenten von einem Workflow?
Ein Workflow folgt einem vorab definierten, deterministischen Pfad; das LLM fuellt nur Luecken. Ein autonomer Agent (Maturity L4) entscheidet dagegen selbst ueber Reihenfolge und Tool-Wahl und passt seinen Plan iterativ an. Ein Agent lohnt sich erst, wenn der Loesungsweg nicht vorab planbar ist.
Was sind MCP und A2A und warum waren 2025 so wichtig?
MCP (Model Context Protocol, Spec 2025-11-25, ueber 10.000 Server) standardisiert die Verbindung Agent zu Tool. A2A (Agent-to-Agent, Linux Foundation seit Juni 2025, ueber 150 Organisationen) standardisiert die Verbindung Agent zu Agent. Beide markieren den Uebergang von isolierten Einzelagenten zu einem offenen Oekosystem.
Brauche ich ein eigenes, selbst trainiertes LLM fuer einen Agenten?
Nein. API-LLMs liefern den Reasoning-Kern als LLM-Core. Die Agentenlogik (Memory, Tools, Planner, Executor) entsteht in der Schicht darueber. Ein eigenes Modelltraining ist fuer den Betrieb eines Agenten nicht erforderlich.
Wie reif sind AI Agents aktuell wirklich?
Die Verbreitung steigt, der produktive Reifegrad bleibt niedrig. Laut McKinsey State of AI 2025 skalieren erst 23 Prozent der Unternehmen mindestens einen agentischen Use Case. Gartner erwartet (Stand Juni 2025), dass ueber 40 Prozent der agentischen KI-Projekte bis Ende 2027 abgebrochen werden.

Tiefer einsteigen?

Erhalte neue Analysen direkt ins Postfach – oder sieh dir an, wie wir dieses Wissen für Unternehmen umsetzen.