4.9Experte7 min

Graph RAG: Wenn Beziehungen wichtiger sind als Ähnlichkeit

Blck Alpaca·9. Juni 2026

Definition

Graph RAG ist ein Retrieval-Augmented-Generation-Ansatz, der Wissen nicht (nur) als Vektoren, sondern als Knowledge Graph aus Entitäten und ihren Beziehungen speichert. Statt rein semantischer Ähnlichkeit nutzt das System die Graph-Struktur, um Multi-Hop-Fragen zu beantworten und Zusammenhänge über viele Dokumente hinweg zu verknüpfen.

Auf einen Blick

✓Graph RAG extrahiert Entitäten und Beziehungen aus Dokumenten und baut daraus einen Knowledge Graph, der Vektor-RAG ergänzt oder ersetzt.
✓Microsofts GraphRAG-Ansatz nutzt zusätzlich Community-Detection und vorab generierte Community-Summaries, um auch globale Übersichtsfragen über das gesamte Korpus zu beantworten.
✓Der Mehrwert entsteht bei Multi-Hop-Fragen und Beziehungsfragen, bei denen reine Vektor-Ähnlichkeit (top-k) die nötigen Verbindungen nicht herstellt.
✓Graph RAG ist teurer und komplexer: Die LLM-gestützte Graph-Extraktion verursacht hohe einmalige Indexierungskosten und laufenden Pflegeaufwand.
✓Für die meisten Standard-RAG-Use-Cases bleibt Vektor- bzw. Hybrid-RAG mit Re-Ranking die kostenrationale Wahl; Graph RAG ist ein gezielter Aufsatz für beziehungsintensive Domänen.
✓In DACH-Kontexten gelten dieselben DSGVO-Pflichten wie bei klassischem RAG: Entitäten im Graph sind als adressierbare, löschbare Records zu behandeln (Stand 2026, informativ, keine Rechtsberatung).

Graph RAG ist ein Retrieval-Augmented-Generation-Ansatz, der Wissen nicht (nur) als Vektoren, sondern als Knowledge Graph aus Entitäten und ihren Beziehungen ablegt. Während klassisches RAG eine Frage über semantische Ähnlichkeit beantwortet, indem es die zur Anfrage am nächsten liegenden Textpassagen sucht, folgt Graph RAG den expliziten Verbindungen zwischen Entitäten. Das macht es stark, wo Beziehungen und mehrstufige Schlüsse (Multi-Hop) wichtiger sind als reine Textähnlichkeit.

Was es ist: RAG-Variante, die einen Knowledge Graph (Entitäten plus Relationen) als Wissensquelle nutzt, allein oder zusätzlich zum Vektor-Index.
Wann es hilft: Bei Multi-Hop-Fragen, Beziehungsfragen und globalen Übersichtsfragen über ein ganzes Korpus.
Was es kostet: Höhere Indexierungs- und Pflegekosten als Vektor-RAG, weil die Graph-Extraktion LLM-gestützt erfolgt.

Warum reine Ähnlichkeit an Grenzen stößt

Klassisches RAG arbeitet zweistufig: Im Indexing-Pfad werden Dokumente geparst, in Chunks zerlegt, per Embedding-Modell in Vektoren überführt und in eine Vektordatenbank geschrieben. Im Query-Pfad wird die Frage ebenfalls eingebettet, die ähnlichsten Chunks (top-k) werden abgerufen, optional per Hybrid Search mit BM25 kombiniert und per Re-Ranker präzisiert, und schließlich landet alles im Prompt des Generators. Dieses Muster ist robust und für die meisten Wissensfragen ausreichend. Anthropics Contextual Retrieval zeigt etwa, dass sich Retrieval-Fehler durch chunk-spezifische Kontext-Header und Reranking um bis zu 67 % senken lassen (Anthropic, Stand 09/2024).

Der blinde Fleck entsteht bei zwei Fragetypen:

Multi-Hop-Fragen: "Welche Lieferanten unseres größten Kunden sind selbst von Sanktionen betroffen?" erfordert eine Kette von Schlüssen (Kunde -> Lieferanten -> Sanktionsstatus), die in keinem einzelnen Chunk steht. Top-k-Ähnlichkeit liefert hier oft nur Fragmente, ohne die Verbindung herzustellen.
Globale Übersichtsfragen: "Was sind die fünf zentralen Themen über alle 2.000 Support-Tickets hinweg?" lässt sich nicht beantworten, indem man fünf bis zehn ähnliche Chunks abruft. Die Antwort verlangt eine Aggregation über das gesamte Korpus.

Genau hier setzt Graph RAG an: Statt isolierte Textstücke zu finden, navigiert es eine explizite Wissensstruktur.

Aufbau eines Knowledge Graph statt (oder zusätzlich zu) einem Vektor-Index

Der Kern von Graph RAG ist die Indexierung. Aus den Quelldokumenten wird mithilfe eines LLM ein Graph extrahiert:

Entity-Extraktion: Das LLM identifiziert Entitäten (Personen, Organisationen, Produkte, Orte, Konzepte) und beschreibt sie.
Relationship-Extraktion: Es erkennt Beziehungen zwischen diesen Entitäten ("liefert an", "ist Tochter von", "verursacht") inklusive Beschreibung und ggf. Gewicht.
Graph-Konstruktion: Entitäten werden zu Knoten, Beziehungen zu Kanten. Mehrfach erwähnte Entitäten werden zusammengeführt.

Microsofts quelloffener GraphRAG-Ansatz (Microsoft Research) erweitert dieses Grundmuster um zwei zentrale Schritte (Stand 2026):

Community-Detection: Über Graph-Clustering (etwa Leiden-Algorithmus) werden eng verbundene Knoten zu hierarchischen "Communities" gruppiert, thematischen Teilgraphen.
Community-Summaries: Für jede Community erzeugt ein LLM bereits zur Indexzeit eine Zusammenfassung. Diese Summaries sind der Schlüssel für globale Fragen: Bei einer Übersichtsfrage werden nicht einzelne Chunks, sondern Community-Summaries als Bausteine einer Map-Reduce-Antwort genutzt.

Daraus ergeben sich zwei Abfragemodi: Local Search beantwortet fokussierte Fragen über eine bestimmte Entität und ihre Nachbarschaft im Graph; Global Search beantwortet korpusweite Themenfragen über die Community-Summaries.

Pseudocode: Indexierung und Abfrage

```text

Indexierung (offline, LLM-intensiv)

for dokument in korpus:
entitäten, beziehungen = LLM_extrahiere(dokument)
graph.merge(entitäten, beziehungen)

communities = cluster(graph) # z. B. Leiden
for c in communities:
c.summary = LLM_fasse_zusammen(c) # Community-Summary

Abfrage (online)

if frage_ist_global(frage):
teilantworten = [LLM(frage, c.summary) for c in relevante_communities]
antwort = LLM_reduce(frage, teilantworten) # Global Search
else:
subgraph = graph.traversiere(start=entitäten_aus(frage), hops=2)
antwort = LLM(frage, subgraph + zugehörige_chunks) # Local Search
```

Graph RAG vs. Vektor-RAG im direkten Vergleich

Die Entscheidung ist keine Entweder-oder-Frage, sondern eine Frage des Fragetyps und des Budgets. Die folgende Matrix fasst die Unterschiede zusammen.

Dimension	Vektor- / Hybrid-RAG	Graph RAG
Retrieval-Prinzip	Semantische Ähnlichkeit (top-k), optional BM25	Traversierung von Entitäten und Beziehungen
Stärke	Faktensuche, breite Abdeckung, schneller Roll-out	Multi-Hop-Reasoning, Beziehungsfragen, globale Übersichten
Schwäche	Verknüpft Fakten über Dokumente hinweg schlecht	Overkill für einfache Lookups
Indexierungskosten	Niedrig–mittel (Embedding pro Chunk)	Hoch (LLM-Extraktion + Community-Summaries)
Pflege bei Updates	Inkrementelle Upserts, einfach	Graph-Re-Konstruktion teils nötig, aufwendiger
Latenz	Mittel (~100–800 ms Hybrid + Rerank)	Höher, besonders bei Global Search (Map-Reduce)
Reifegrad	Sehr ausgereift, breite Tool-Landschaft	Jünger, in Bewegung (Stand 2026)
Quellenangabe	Nativ über Chunk-IDs	Über Entitäten, Beziehungen und Quell-Chunks

Die Latenz- und Hybrid-Werte für klassisches RAG stammen aus der Blck-Alpaca-Recherchebasis (Vergleichsmatrix RAG-Architekturen). Die Graph-RAG-Charakteristik basiert auf gesichertem Allgemeinwissen zum GraphRAG-Projekt und zu Knowledge-Graph-Indizes in Frameworks wie LlamaIndex.

Kosten und Komplexität ehrlich kalkuliert

Der größte Unterschied liegt im Indexing. Bei Vektor-RAG ist die teuerste einmalige Operation das Embedding pro Chunk: Als Größenordnung nennt die Recherchebasis Indexierungskosten von rund 0,02 bis 0,13 US-Dollar pro einer Million Tokens, mit Anthropic-Prompt-Caching für Contextual Retrieval etwa 1,02 US-Dollar pro Million Document-Tokens (Stand 09/2024). Graph RAG verlangt darüber hinaus mehrere LLM-Durchläufe pro Dokument: Entity-Extraktion, Relationship-Extraktion und Community-Summaries. Das vervielfacht die Indexierungskosten und die Indexierungsdauer.

Konkretes Rechenbeispiel

Angenommen, eine Agentur indexiert für einen Kunden ein Wissenskorpus von 50.000 Dokumenten:

Vektor-RAG: Einmaliges Embedding plus Hybrid-Index. Hauptkosten sind Embedding-API und Vektor-DB-Hosting. Updates erfolgen inkrementell über stabile Doc-IDs.
Graph RAG: Pro Dokument fallen mehrere LLM-Aufrufe für die Extraktion an, danach LLM-Aufrufe pro Community für die Summaries. Schon bei mittlerer Korpusgröße entsteht so ein Vielfaches der Indexierungskosten von Vektor-RAG, zuzüglich zusätzlichem Betriebsaufwand für Graph-Schema, Deduplizierung von Entitäten und Re-Indexierung bei größeren Änderungen.

Die Faustregel: Graph RAG zahlt sich aus, wenn der Mehrwert beziehungsbasierter Antworten den Mehraufwand rechtfertigt, nicht als Default. Die Blck-Alpaca-Recherche warnt generell vor dem Anti-Pattern "RAG als Silver Bullet"; das gilt für Graph RAG in verschärfter Form, weil hier die Total Cost of Ownership deutlich höher liegt.

Wann Graph RAG, wann nicht

Geeignet, wenn:

Antworten Informationen über viele Dokumente verknüpfen müssen (Lieferketten, Org-Strukturen, Compliance-Netze, Forschungs- und Patentlandschaften).
explizite Beziehungen zwischen Entitäten fachlich zentral sind.
globale Übersichts- und Themenfragen über ein ganzes Korpus beantwortet werden sollen.

Eher nicht, wenn:

die Fragen überwiegend einzelne Fakten oder eng umrissene Passagen betreffen, hier reicht Hybrid-RAG mit Re-Ranking.
das Korpus klein ist oder häufig komplett umgeschrieben wird (Graph-Pflege wird zum Engpass).
das Budget eine LLM-intensive Indexierung nicht trägt.

In der Praxis ist die hybride Architektur am tragfähigsten: Vektor- bzw. Hybrid-Retrieval liefert breite semantische Abdeckung, der Knowledge Graph wird gezielt für Beziehungs- und Multi-Hop-Fragen zugeschaltet. So bleibt Graph RAG ein präziser Aufsatz statt eines teuren Komplettersatzes.

DACH-Hinweis: Datenschutz gilt auch im Graph

Für DACH-Unternehmen ändert Graph RAG nichts an den DSGVO-Grundsätzen. Entitäten und Beziehungen mit Personenbezug sind, wie Embeddings und Chunks bei klassischem RAG, als adressierbare, löschbare Records zu behandeln. Es gelten Zweckbindung und Datenminimierung (Art. 5), eine Rechtsgrundlage für die Verarbeitung (Art. 6) und das Recht auf Löschung (Art. 17). Mandantentrennung, ein Rollen-/Rechtekonzept und EU-Region-Hosting bleiben Pflicht. Die Datenschutzkonferenz adressiert diese Anforderungen in ihrer Orientierungshilfe zu RAG (Stand 2024/2025). Diese Angaben sind informativ und stellen keine Rechtsberatung dar.

Für Agenturen und B2B-Entscheider

Graph RAG ist kein Hype-Ersatz für Vektor-RAG, sondern ein spezialisiertes Werkzeug für beziehungsintensives Wissen. Für Agenturen heißt das: Beginne mit Hybrid-RAG plus Re-Ranking als solider Standardbasis und führe Graph RAG nur dort ein, wo Multi-Hop- oder Übersichtsfragen den nachweisbaren Geschäftswert liefern. Für B2B-Entscheider ist die zentrale Frage nicht "Welche Technik ist neuer?", sondern "Welche Fragen stellen unsere Nutzer wirklich, und brauchen diese Antworten Beziehungen oder nur Ähnlichkeit?". Blck Alpaca unterstützt bei dieser Abgrenzung, kalkuliert die TCO ehrlich und baut DSGVO-konforme RAG-Architekturen, die mit dem tatsächlichen Bedarf wachsen, vom schlanken Vektor-Index bis zum hybriden Knowledge-Graph-System.

Häufig gestellte Fragen

Was ist der Unterschied zwischen Graph RAG und klassischem Vektor-RAG?

Vektor-RAG findet Textpassagen über semantische Ähnlichkeit (Embeddings, top-k) und übergibt sie dem LLM. Graph RAG baut zusätzlich einen Knowledge Graph aus Entitäten und Beziehungen auf und ruft Wissen entlang dieser Verbindungen ab. Dadurch beantwortet es Multi-Hop- und Beziehungsfragen besser, ist aber teurer und komplexer im Aufbau.

Was ist GraphRAG von Microsoft?

GraphRAG ist ein von Microsoft Research veröffentlichter, quelloffener Ansatz, der mit einem LLM Entitäten und Beziehungen aus Dokumenten extrahiert, daraus einen Knowledge Graph baut, per Community-Detection thematische Cluster bildet und für diese Cluster vorab Summaries erzeugt. Diese erlauben sowohl lokale Detailfragen als auch globale Übersichtsfragen über das gesamte Korpus (Stand 2026).

Wann lohnt sich Graph RAG gegenüber Vektor-RAG?

Graph RAG lohnt sich, wenn Antworten Informationen über mehrere Dokumente verknüpfen müssen (Multi-Hop), wenn explizite Beziehungen zwischen Entitäten zentral sind (z. B. Lieferketten, Organigramme, Compliance-Netze) oder wenn globale Übersichtsfragen über ein ganzes Korpus gestellt werden. Für eng umrissene Faktensuche reicht meist Hybrid-RAG mit Re-Ranking.

Ist Graph RAG teurer als Vektor-RAG?

Ja. Die Indexierung ist deutlich teurer, weil pro Dokument LLM-Aufrufe zur Entity- und Relationship-Extraktion sowie zur Erzeugung von Community-Summaries nötig sind. Auch die laufende Pflege (Graph-Updates bei neuen Dokumenten) und das Betriebs-Know-how sind aufwendiger als bei einer reinen Vektor-Pipeline.

Kann man Graph RAG und Vektor-RAG kombinieren?

Ja, das ist der häufigste Praxiseinsatz. Hybride Architekturen nutzen Vektor- bzw. Hybrid-Retrieval für breite semantische Abdeckung und den Knowledge Graph gezielt für Beziehungs- und Multi-Hop-Fragen. Frameworks wie LlamaIndex bieten Knowledge-Graph-Indizes, die sich mit klassischem RAG kombinieren lassen.

Wie verhält sich Graph RAG zu DSGVO und DACH-Anforderungen?

Es gelten dieselben Grundsätze wie bei jedem RAG-System: Entitäten und Beziehungen mit Personenbezug sind als adressierbare Records zu behandeln, die löschbar (Art. 17), zweckgebunden und mandantengetrennt sein müssen. EU-Region-Hosting und ein Rollen-/Rechtekonzept sind empfehlenswert. Dies ist ein informativer Hinweis, keine Rechtsberatung (Stand 2026).

Tiefer einsteigen?

Erhalte neue Analysen direkt ins Postfach, oder sieh dir an, wie wir dieses Wissen für Unternehmen umsetzen.

Newsletter abonnieren →Unsere Services

Vorheriger← Reranking in RAG: Cross-Encoder vs. Bi-Encoder NächsterAgentic RAG vs. klassisches RAG: Was ist der Unterschied? →