Was sind AI Agents?
Was AI Agents sind, wie sie autonom Aufgaben planen und ausführen und worin sie sich von einfachen Chatbots unterscheiden.
Ein KI-Agent (AI Agent) ist ein softwarebasiertes System auf Basis eines (Large) Language Models, das ein vorgegebenes Ziel autonom verfolgt: Es nimmt seine Umgebung wahr, plant mehrstufig, wählt und nutzt externe Werkzeuge (Tools, APIs, Datenquellen) eigenständig, beobachtet die Ergebnisse und passt seinen Plan iterativ an — bis das Ziel erreicht oder abgebrochen ist. Der entscheidende Unterschied zu einem Chatbot oder einer Automatisierung: Nicht ein fest programmierter Code, sondern das LLM steuert dynamisch, welcher Schritt als Nächstes kommt.
Auf einen Blick
- ✓Ein AI Agent erfüllt vier Pflicht-Eigenschaften gleichzeitig: LLM-gestützte Steuerung, mehrschrittige Planung, eigenständiger Tool-Use und zielorientierte Autonomie innerhalb von Guardrails — fehlt eine davon, handelt es sich um einen Chatbot, Workflow oder Assistant.
- ✓Anthropic grenzt Agenten klar von Workflows ab: Bei Agenten steuert das LLM Pfad und Tool-Use dynamisch, bei Workflows folgen vordefinierte Code-Pfade.
- ✓Technisch besteht ein Agent aus fünf Kernkomponenten: LLM-Core (Reasoning), Memory (Kurz- und Langzeit), Tools, Planner und Executor.
- ✓Der Reasoning-Loop folgt dem Muster Perceive → Reason → Act → Observe und wird iterativ durchlaufen, bis das Ziel erreicht ist (Konzeptbasis: ReAct, Yao et al. 2022).
- ✓Laut McKinsey State of AI 2025 skalieren 23 % der Unternehmen mindestens einen agentischen Use Case, weitere 39 % experimentieren — in keiner Unternehmensfunktion sind jedoch mehr als 10 % skalierte Agenten erreicht.
- ✓Gartner (Juni 2025) prognostiziert, dass über 40 % der agentischen KI-Projekte bis Ende 2027 abgebrochen werden — meist wegen unklarer Use Cases und unterschätzter Kosten.
- ✓Im DACH-Raum sind beim Agenten-Einsatz EU AI Act (Art. 50 Transparenz ab 02.08.2026), DSGVO (Art. 22/28/35) sowie Mitbestimmung (BetrVG §87 in DE, ArbVG §96 in AT) relevant — informational, keine Rechtsberatung.
- ✓Ein Agent lohnt sich erst, wenn der Lösungspfad nicht vorab planbar ist und eine LLM-Entscheidung gebraucht wird; bei festen Abläufen sind Workflow-Automation oder ein Copilot günstiger und robuster.
Definition: Was ist ein AI Agent?
Ein KI-Agent (AI Agent) ist ein softwarebasiertes System auf Basis eines (Large) Language Models, das ein vorgegebenes Ziel autonom verfolgt: Es nimmt seine Umgebung wahr, plant mehrstufig, wählt und nutzt externe Werkzeuge (Tools, APIs, Datenquellen) eigenständig, beobachtet die Ergebnisse und passt seinen Plan iterativ an — bis das Ziel erreicht oder abgebrochen ist.
Diese Definition deckt sich mit den kanonischen Beschreibungen der führenden Anbieter. Anthropic trennt architektonisch zwischen Agenten (das LLM steuert Pfad und Tool-Use dynamisch) und Workflows (vordefinierte Code-Pfade). OpenAI beschreibt Agenten als „systems that independently accomplish tasks on behalf of users". IBM betont das autonome Erledigen von Aufgaben durch den Entwurf von Workflows mit Tools, Microsoft ergänzt den Aspekt der „context awareness".
Die vier Pflicht-Eigenschaften
Ein System ist nur dann ein echter Agent, wenn es alle vier der folgenden Eigenschaften erfüllt. Fehlt eine, handelt es sich um einen Chatbot, einen Workflow oder einen Assistant:
- LLM-gestützte Steuerung — Das Language Model trifft die Steuerungsentscheidungen, nicht deterministischer Code als primäre Kontrollinstanz.
- Mehrschrittige Planung — Der Ablauf folgt dem Muster Perceive → Reason → Act → Observe, oft über mehrere Iterationen.
- Tool-Use — Der Agent nutzt eigenständig externe Funktionen, APIs oder Datenbanken.
- Zielorientierte Autonomie — Der Agent verfolgt ein Ziel selbstständig, aber innerhalb definierter Guardrails.
Genau dieser Punkt sorgt in der Praxis für „Agent washing": Viele als „Agent" vermarktete Produkte sind in Wahrheit Chatbots mit einem einzelnen Tool-Call oder klassische RPA-Skripte.
Abgrenzung: Agent vs. Chatbot vs. RPA vs. Workflow vs. Assistant
Die folgende Matrix zeigt, worin sich ein Agent von verwandten Konzepten unterscheidet. Die Spalten beschreiben jeweils das typische Verhalten — Übergänge sind in der Praxis fließend.
Kriterium | AI Agent | Chatbot | RPA | Workflow-Automation | Assistant / Copilot |
|---|---|---|---|---|---|
Trigger | Ziel / Auftrag / Event | Nutzer-Nachricht | Zeit / Regel | Event | Prompt |
Reasoning | LLM, mehrstufig | Intent-Matching / einfaches LLM | keines (Regelskript) | bedingte, deterministische Logik | LLM, einstufig |
Tool-Use | dynamisch, viele Tools / APIs / MCP | meist keine | UI-Bots / Screen-Scraping | vorgefertigte Konnektoren | begrenzt |
Memory | Kurz- + Langzeit (RAG / Files) | Session | keine | Workflow-State | Session |
Autonomie | hoch (in Guardrails) | sehr niedrig | mittel (skriptiert) | niedrig | niedrig–mittel |
Wartung | hoch (Prompt + Tools + Evals + Modelle) | niedrig–mittel | mittel–hoch (UI-Brüche) | niedrig | niedrig |
Compliance-Aufwand | hoch (Art. 50, ggf. High-Risk, Art. 22, DSFA, BetrVG) | niedriger | niedriger | niedriger | niedriger |
Die wichtigste Trennlinie: Ein Workflow oder RPA-Bot folgt einem vordefinierten Pfad, während ein Agent die Reihenfolge der Schritte und die Tool-Wahl dynamisch entscheidet. Ein Chatbot reagiert primär mit Text; ein Agent handelt mehrstufig und autonom.
Die 5 Komponenten eines AI Agents
Technisch betrachtet besteht ein Agent aus fünf Kernkomponenten, die zusammenspielen:
- LLM-Core — die Reasoning-Engine. Sie wählt den nächsten Schritt und steuert das Function-Calling. Hier wird entschieden, ob überhaupt ein Tool genutzt wird und welches.
- Memory — das Gedächtnis. Das Kurzzeitgedächtnis ist der Konversations-Context des aktuellen Laufs; das Langzeitgedächtnis wird über Vektordatenbanken, RAG (Retrieval-Augmented Generation) oder Dateien realisiert.
- Tools — die Hände des Agenten. Dazu zählen Function-Calls, APIs, MCP-Server, Browser oder Code-Sandboxes.
- Planner — zerlegt das Ziel in Teilschritte. Die Planung kann implizit im LLM ablaufen oder explizit als Graph modelliert sein.
- Executor — führt die Tool-Calls aus, managt die einzelnen Turns sowie Loop-Limits und setzt die Guardrails durch.
Der Reasoning-Loop: Perceive → Reason → Act → Observe
Das Herzstück jedes Agenten ist ein iterativer Schleifenmechanismus. Konzeptionell geht er auf das ReAct-Muster (Yao et al. 2022) zurück, das Reasoning und Acting verbindet:
- Perceive — Der Agent nimmt Input und Ziel, den aktuellen Context und sein Memory wahr.
- Reason — Das LLM plant: Welches Tool oder welcher Schritt ist als Nächstes sinnvoll?
- Act — Der Agent führt die Aktion aus (Tool-Call, API-Aufruf, Code-Ausführung).
- Observe — Der Agent liest das Ergebnis aus und schreibt es ins Memory.
Danach prüft der Agent: Ist das Ziel erreicht? Wenn nicht, beginnt der Loop erneut bei Perceive. Genau diese dynamische Wiederholung — und nicht ein fest verdrahteter Ablauf — macht den Unterschied zu klassischer Automatisierung aus. Sicherheitsmechanismen wie Loop-Limits, Token-Budgets und Human-in-the-Loop-Punkte verhindern dabei endloses Schleifen oder irreversible Fehlhandlungen.
Reifegrade: L1 bis L5
Nicht jedes System, das LLMs nutzt, ist gleich autonom. Ein nützliches Reifegradmodell unterscheidet fünf Stufen:
- L1 — Reflex-Agent: Regelbasiert, ohne echtes Reasoning (z. B. ein FAQ-Bot).
- L2 — Augmented LLM: Ein LLM mit einem einzelnen Tool-Call, rein reaktiv.
- L3 — Workflow-Agent: Das LLM agiert innerhalb einer deterministischen Pipeline (Prompt-Chaining, Routing). Der Pfad ist weitgehend vorgegeben.
- L4 — Autonomer Agent: Das LLM steuert Reihenfolge und Tool-Wahl dynamisch und durchläuft den vollen Loop (z. B. Coding-Agenten wie Claude Code oder Deep-Research-Systeme).
- L5 — Multi-Agent-System: Mehrere autonome Agenten koordinieren sich, etwa über A2A-Protokolle (Agent-to-Agent), mit einem Orchestrator und Spezialisten-Agenten.
Für die meisten produktiven B2B-Anwendungen liegt der „Sweet Spot" heute zwischen L3 und L4. L5-Systeme sind mächtig, aber anfällig für Compounding Errors — kleine Fehler einzelner Agenten, die sich über die Kette aufschaukeln.
Framework-Überblick
Für den Bau von Agenten hat sich ein vielfältiges, herstellerneutrales Ökosystem etabliert. Die folgende Auswahl deckt die gängigsten Optionen ab:
- LangGraph — Graph- bzw. State-Machine-Ansatz, geeignet für komplexe, kontrollierte Workflows.
- CrewAI — auf Multi-Agent-Systeme mit definierten Rollen ausgerichtet.
- OpenAI Agents SDK — minimalistisch, mit Tools, Handoffs, Guardrails und Tracing.
- Anthropic Claude Agent SDK — Toolkit zum Bau von Agenten auf Basis der Claude-Modelle.
- Microsoft Agent Framework — vereint AutoGen und Semantic Kernel, mit nativer MCP- und A2A-Unterstützung.
- n8n — Low-Code-Plattform, besonders im DACH-KMU-Umfeld verbreitet.
- Pydantic AI — Fokus auf Typensicherheit für robuste, gut testbare Agenten.
Wichtig: Die Framework-Wahl sollte nach der Use-Case-Klärung erfolgen — nicht davor.
AI Agents im DACH-Kontext: Compliance und Souveränität
Wer Agenten im DACH-Raum produktiv einsetzt, sollte mehrere Regelwerke früh einplanen:
- EU AI Act, Art. 50 (Transparenz): Die Offenlegungspflicht gegenüber Nutzern (z. B. dass sie mit einem KI-System interagieren) gilt unverändert ab dem 02.08.2026.
- High-Risk (Annex III): Laut der Digital-Omnibus-Einigung vom 07.05.2026 könnten die Pflichten ggf. erst ab dem 02.12.2027 greifen — bis zur formalen Annahme gilt rechtlich jedoch weiterhin der 02.08.2026.
- EU AI Act, Art. 4 (KI-Kompetenz): Die Schulungspflicht für Personal gilt bereits seit dem 02.02.2025.
- DSGVO, Art. 22: Bei automatisierten Einzelentscheidungen muss ein menschlicher Override möglich sein.
- DSGVO, Art. 28: Mit LLM-Anbietern ist eine Auftragsverarbeitungsvereinbarung (AVV) erforderlich.
- DSGVO, Art. 35: Bei neuer Technologie oder systematischer Verarbeitung ist in der Regel eine Datenschutz-Folgenabschätzung (DSFA) nötig — bei der Agenten-Einführung ist sie meist erforderlich.
- Mitbestimmung: In Deutschland greift BetrVG §87 Abs. 1 Nr. 6, in Österreich ArbVG §96. Der Betriebsrat ist also früh einzubinden.
Für Organisationen mit hohen Anforderungen an digitale Souveränität existieren EU-basierte Optionen, etwa Aleph Alpha Pharia (auf STACKIT), Mistral, IONOS oder OVHcloud.
Typische Fehler (Pitfalls)
In der Praxis scheitern Agenten-Projekte selten an der Technik allein. Die häufigsten Fallstricke:
- Agent washing: Ein Chatbot oder RPA-Bot wird als „Agent" verkauft.
- Framework-Wahl vor Use-Case-Klarheit: Führt ins „Pilot Purgatory" — rund zwei Drittel der Piloten erreichen keine Skalierung.
- Unterschätzte Datenaufbereitung und eine übersprungene DSFA.
- Ignorierte Mitbestimmung (BetrVG / ArbVG).
- Token-Kosten-Explosion durch unkontrollierte Reasoning- und Tool-Loops.
- Agenten als deterministisch behandeln, obwohl sie probabilistisch arbeiten.
- Fehlende Observability und kein Audit-Trail.
- Vendor-Lock-in sowie der Einsatz eines „Agenten" für simples Retrieval, wo ein Workflow oder Assistant besser passt.
- Kein Human-in-the-Loop bei irreversiblen Aktionen und Compounding Errors in Multi-Agent-Systemen.
Dass diese Risiken real sind, zeigen die Marktdaten: Laut Gartner (Juni 2025) werden über 40 % der agentischen KI-Projekte bis Ende 2027 abgebrochen. Gleichzeitig melden laut Bitkom (2026) 33 % der Unternehmen höhere Kosten als erwartet.
Wann lohnt sich ein Agent?
Die zentrale Entscheidungsregel lautet: Ein Agent lohnt sich erst, wenn der Lösungspfad nicht vorab planbar ist und eine LLM-Entscheidung gebraucht wird. Lässt sich der Ablauf vollständig vorab modellieren, sind eine Workflow-Automation oder ein Copilot günstiger, schneller und robuster.
Ein pragmatischer Einstieg sieht so aus:
- 1 bis 3 Use Cases mit klarem, messbarem ROI auswählen.
- Mit einem Low-Risk- bzw. Read-only-Piloten starten.
- Human-in-the-Loop für alle irreversiblen Aktionen vorsehen.
- DSFA und Betriebsrat ab Tag 1 mitdenken.
- Auf einen vendor-agnostischen Stack setzen, um Lock-in zu vermeiden.
Der Reifegrad des Marktes unterstreicht diese Vorsicht: Laut McKinsey State of AI 2025 skalieren erst 23 % der Unternehmen mindestens einen agentischen Use Case, weitere 39 % experimentieren — zusammen also 62 %. In keiner einzelnen Funktion liegt der Anteil skalierter Agenten jedoch über 10 %.
Ausblick
Agentic AI entwickelt sich rasch von der Experimentier- in die Standardisierungsphase. Zwei Protokolle treiben die Interoperabilität voran: Das Model Context Protocol (MCP) wurde in der Spec-Version 2025-11-25 weiterentwickelt und im Dezember 2025 an die Linux Foundation bzw. die Agentic AI Foundation gespendet; es zählt bereits über 10.000 aktive MCP-Server. Das A2A-Protokoll (Agent-to-Agent) liegt seit Juni 2025 ebenfalls bei der Linux Foundation und wird von über 150 Organisationen unterstützt.
Diese Standardisierung senkt die Hürden für Multi-Agent-Systeme und vendor-agnostische Architekturen. Gleichzeitig steigt der regulatorische Reifegrad — gerade im DACH-Raum mit EU AI Act und DSGVO. Für Entscheider bedeutet das: Wer heute mit klar abgegrenzten, gut governten Piloten startet, schafft die Grundlage, um beim nächsten Reifegradsprung nicht im „Pilot Purgatory" stecken zu bleiben.
Alle Artikel in diesem Topic
10 ArtikelAI Agent vs. Chatbot: Wo der Unterschied liegt
Ein Chatbot reagiert auf eine Nutzer-Nachricht mit einer Text-Antwort. Ein AI Agent verfolgt dagegen ein Ziel autonom: Er plant mehrstufig, nutzt eigenständig externe Tools und APIs, beobachtet Ergebnisse und passt seinen Plan an, bis das Ziel erreicht ist. Der Unterschied ist nicht graduell, sondern strukturell – ein Agent handelt, ein Chatbot antwortet.
Die 5 Komponenten eines AI Agents erklärt
Ein AI Agent besteht aus fünf Kernkomponenten: einem LLM-Core als Reasoning-Engine, Memory (Kurz- und Langzeit), Tools (APIs, MCP-Server, Code-Sandbox), einem Planner zur Zielzerlegung und einem Executor, der Tool-Calls ausführt und Guardrails durchsetzt. Diese Komponenten arbeiten in einem iterativen Loop – Perceive, Reason, Act, Observe –, um ein vorgegebenes Ziel autonom zu verfolgen.
AI Agent vs. RPA: Wann Bots, wann Agenten?
RPA (Robotic Process Automation) automatisiert regelbasierte, immer gleiche Abläufe über UI-Bots und feste Skripte – deterministisch und ohne Verständnis. Ein AI Agent nutzt ein LLM, um ein Ziel autonom zu verfolgen: Er plant mehrstufig, wählt Tools dynamisch und passt sein Vorgehen an. Faustregel: RPA für planbare Pfade, Agent für Aufgaben, deren Weg sich nicht vorab festlegen lässt.
AI Agent vs. Workflow-Automation (n8n, Zapier)
Workflow-Automation (etwa mit n8n oder Zapier) führt einen vordefinierten, deterministischen Pfad aus: Trigger, Bedingungen und Schritte sind vorab festgelegt. Ein AI Agent verfolgt stattdessen ein Ziel und wählt Reihenfolge und Tools dynamisch zur Laufzeit über einen LLM-gesteuerten Reasoning-Loop. Faustregel: Ist der Lösungsweg vorab planbar, genügt Workflow-Automation; nur wenn der Pfad nicht im Voraus festlegbar ist, lohnt ein Agent.
Autonomiestufen von AI Agents (L1–L5)
Die Autonomiestufen von AI Agents beschreiben in fünf Reifegraden (L1–L5), wie eigenständig ein KI-System Entscheidungen trifft: von regelbasierten Reflex-Bots (L1) über LLMs mit einzelnem Tool-Call (L2) und Workflow-Agenten in deterministischen Pipelines (L3) bis zu voll autonomen Agenten (L4) und koordinierten Multi-Agent-Systemen (L5). Mit jeder Stufe wächst die dynamische Steuerung durch das LLM — und damit Nutzen, Komplexität und Governance-Aufwand.
Reasoning und Planning bei AI Agents
Reasoning und Planning bei AI Agents beschreiben, wie ein KI-Agent denkt und handelt: Er durchläuft iterativ den Loop Perceive → Reason → Act → Observe — nimmt seine Umgebung wahr, schlussfolgert mit dem LLM, wählt eigenständig einen nächsten Schritt oder ein Tool, führt ihn aus, beobachtet das Ergebnis und passt seinen Plan an, bis das Ziel erreicht ist. Konzeptionelle Grundlage ist das ReAct-Muster (Yao et al. 2022), das Reasoning und Acting im selben LLM-Loop verbindet. Weil die LLM-Ausgabe probabilistisch ist, sind Tracing und Evals zwingend.
Reaktive vs. deliberative Agenten
Reaktive Agenten reagieren regelbasiert und ohne Planung direkt auf Reize (Reiz-Reaktion), während deliberative Agenten ein Ziel verfolgen, mehrstufig planen und ihren Plan iterativ anpassen. In der AI-Agent-Praxis bezeichnet „reaktiv" einfache, vorhersehbare Pfade (Reifegrade L1–L2), „deliberativ" hingegen LLM-gesteuerte, dynamische Agenten mit echtem Planungs-Loop (L4–L5).
Tool Calling: Wie AI Agents Werkzeuge nutzen
Tool Calling (auch Function Calling) ist die Kernfähigkeit, mit der ein AI Agent über das reine Textgenerieren hinausgeht: Das LLM erhält maschinenlesbare Beschreibungen von Werkzeugen (Tools, APIs, Datenquellen) und erzeugt bei Bedarf einen strukturierten Aufruf mit Parametern, den die Anwendung ausführt. Das Ergebnis fließt zurück ins Modell, das daraufhin den nächsten Schritt plant. So wird das LLM vom Text-Generator zum handelnden Akteur, der wahrnimmt, entscheidet und Aktionen in echten Systemen auslöst.
Die Geschichte der AI Agents
Die Geschichte der AI Agents reicht vom klassischen Agentenbegriff der KI-Forschung (ein System, das seine Umgebung wahrnimmt und darauf mit Aktionen reagiert) über das ReAct-Muster (2022), das Reasoning und Acting im selben LLM-Loop verbindet, bis zu heutigen Frontier-LLM-Agenten. Offene Standards wie MCP (2025) und A2A (2025) verbinden Agenten mit Tools und untereinander.
AI Agents: FAQ für Entscheider
Ein KI-Agent (AI Agent) ist ein softwarebasiertes System auf Basis eines (Large) Language Models, das ein vorgegebenes Ziel autonom verfolgt: Es nimmt seine Umgebung wahr, plant mehrstufig, wählt und nutzt eigenständig externe Werkzeuge (Tools, APIs, Datenquellen), beobachtet die Ergebnisse und passt seinen Plan iterativ an, bis das Ziel erreicht oder abgebrochen ist. Für Entscheider zentral: Ein Agent lohnt sich erst, wenn der Lösungsweg nicht vorab planbar ist.