1.4Fortgeschritten8 min

Indexierung: Wie Google Seiten speichert und versteht

Lucas Blochberger·7. April 2026·Aktualisiert 10. Juni 2026

Definition

Indexierung ist der Prozess, bei dem Google die gecrawlten Webseiten analysiert, deren Inhalte versteht und in einer durchsuchbaren Datenbank (dem Google-Index) speichert, um sie bei relevanten Suchanfragen als Ergebnis anzeigen zu können. Sie ist die zweite der drei Phasen der Google-Suche (nach dem Crawling, vor dem Ranking) und die Grundvoraussetzung für jede organische Sichtbarkeit: Was nicht indexiert ist, kann nicht ranken.

Auf einen Blick

✓Indexierung ist die zweite von drei Phasen der Google-Suche (Crawling, Indexierung, Ranking) und Grundvoraussetzung für jede Sichtbarkeit. Google garantiert jedoch nicht, dass eine gecrawlte Seite auch indexiert wird.
✓Nicht jede gecrawlte Seite wird indexiert: Eine Seite kann besucht und trotzdem bewusst aus dem Index ausgeschlossen werden, meist wegen geringer Qualität oder fehlendem Mehrwert.
✓Die Google Search Console ist das zentrale Werkzeug: Das URL-Prüfungstool und der Indexierungsbericht zeigen für jede URL den Status und den Grund für einen Ausschluss.
✓Das noindex-Tag verhindert gezielt die Indexierung einzelner Seiten, während das Canonical-Tag Google die bevorzugte URL-Version bei ähnlichen Inhalten signalisiert. robots.txt steuert dagegen nur das Crawling, nicht die Indexierung.
✓Duplicate Content ist einer der häufigsten Indexierungs-Blocker, gefolgt von Soft-404, versehentlichen noindex-Blockaden nach Relaunches und Qualitätsmängeln.
✓Indexierung ist notwendig, aber keine Garantie für Traffic: International erhalten 96,55 Prozent aller Seiten null organischen Google-Traffic. Sichtbarkeit entsteht erst im Zusammenspiel mit Ranking-Faktoren und E-E-A-T.
✓In Österreich ist Google-Indexierung mit 81,87 Prozent Marktanteil praktisch alternativlos. Indexierte Inhalte sind zudem die Basis für Google AI Overviews und generative Engines wie ChatGPT.

Die meisten Gespräche über Suchmaschinenoptimierung drehen sich um Rankings. Bevor eine Seite aber auf Platz 1 oder Platz 50 stehen kann, muss sie eine Hürde nehmen: Sie muss im Google-Index sein. Ohne Indexierung gibt es kein Ranking, keine Klicks und keine Sichtbarkeit. Für B2B-Unternehmen im DACH-Raum ist das keine technische Randnotiz, sondern die Grundvoraussetzung dafür, dass eine Website überhaupt Geschäft über die organische Suche generiert.

Warum Indexierung für B2B-Sichtbarkeit entscheidend ist

In Österreich führt an Google praktisch kein Weg vorbei. Der Marktanteil liegt bei 81,87 Prozent, weit vor Bing mit 9,01 Prozent und DuckDuckGo mit 2,75 Prozent. Wer hierzulande organische Sichtbarkeit aufbauen will, optimiert also faktisch für eine einzige Suchmaschine. Damit wird die Google-Indexierung praktisch alternativlos: Eine Seite, die nicht im Google-Index steht, existiert für den größten Teil des österreichischen Suchmarktes nicht.

Die Reichweite ist beträchtlich. In Österreich gab es Anfang 2025 8,69 Millionen Internetnutzer bei einer Penetrationsrate von 95,3 Prozent. Diese Menschen recherchieren Anbieter, Lösungen und Fachbegriffe über Google. Im B2B-Bereich, wo Kaufentscheidungen lang sind und auf vorheriger Recherche beruhen, entscheidet die Auffindbarkeit in der Suche mit darüber, ob ein Unternehmen überhaupt in die engere Auswahl kommt.

Wichtig ist die richtige Erwartung: Indexierung ist die Eintrittskarte, nicht der Gewinn. Sie sorgt dafür, dass eine Seite überhaupt als Suchergebnis erscheinen kann. Ob sie dann auch Besucher bekommt, entscheidet das Ranking. Wie groß diese Lücke ist, zeigt eine Analyse von rund 14 Milliarden Seiten: 96,55 Prozent aller Seiten erhalten null organischen Traffic von Google, weitere 1,94 Prozent nur eine bis zehn Besuche im Monat (internationale Studie, Ahrefs). Indexiert zu sein ist also notwendig, aber bei Weitem nicht hinreichend.

Wie Google Seiten indexiert: Crawling, Indexierung, Ranking

Die Google-Suche besteht aus drei klar getrennten Phasen. Google selbst betont diese Trennung und stellt klar: Google garantiert nicht, dass eine Seite gecrawlt, indexiert oder ausgeliefert wird. Jede Phase ist eine eigene Hürde.

Crawling: Zuerst muss Google von einer URL erfahren. Da es kein zentrales Register aller Webseiten gibt, sucht Google laufend nach neuen und aktualisierten Seiten, ein Prozess namens URL-Discovery. Neue URLs findet Google über interne Links, Sitemaps oder externe Verweise. Anschließend ruft der Googlebot, das Abrufprogramm, Milliarden von Seiten im Web ab. Crawling bedeutet nur: Google hat die Seite besucht und ihren Code geladen.

Indexierung: Erst danach beginnt das eigentliche Verstehen. Nachdem eine Seite gecrawlt wurde, versucht Google zu verstehen, worum es auf der Seite geht. Diese Phase heißt Indexierung und umfasst die Verarbeitung und Analyse der Textinhalte sowie zentraler Content-Tags und -Attribute. Google rendert die Seite dabei wie ein Browser, führt also auch JavaScript aus, um zu sehen, was Nutzer tatsächlich angezeigt bekommen. Es analysiert Texte, Bilder und Überschriften und erkennt Entitäten, also Personen, Orte, Produkte oder Konzepte und deren Beziehungen. Auf dieser semantischen Basis ordnet Google die Seite Themen und möglichen Suchanfragen zu und speichert das Ergebnis im Google-Index, einer riesigen Datenbank. Wie groß diese ist, wurde durch eine Zeugenaussage im US-Kartellverfahren gegen Google bekannt: Der Index umfasste rund 400 Milliarden Dokumente (Stand 2020, Aussage von Google-Vizepräsident Pandu Nayak) (US-Quelle).

Ranking: Erst wenn eine Seite im Index liegt, kann sie bei einer Suchanfrage abgerufen, nach Relevanz und Qualität bewertet und in den Suchergebnissen (SERP) sortiert werden. Hier kommen Ranking-Faktoren und Qualitätssignale wie E-E-A-T ins Spiel.

Entscheidend ist: Indexierung ist nicht garantiert, nicht jede Seite, die Google verarbeitet, wird indexiert. Eine Seite kann also gecrawlt werden und trotzdem nie im Index landen.

Indexierung steuern: Best Practices für die Praxis

Google indexiert nicht alles automatisch und nicht alles sofort. Mit den richtigen Werkzeugen lenken Sie, welche Seiten in den Index gelangen, und beschleunigen den Prozess.

Google Search Console nutzen: Die Search Console ist das zentrale Steuerinstrument. Das URL-Prüfungstool zeigt für jede einzelne URL, ob sie indexiert ist und warum nicht. Der Indexierungsbericht (Seiten) listet alle URLs nach Status auf und benennt konkrete Gründe für Ausschlüsse. Über die Funktion Indexierung beantragen melden Sie neue oder aktualisierte Seiten direkt zur Prüfung an.

Eine XML-Sitemap einreichen: Die Sitemap ist Ihre Empfehlungsliste an Google. Sie listet alle wichtigen URLs auf und hilft besonders bei großen oder schlecht verlinkten Websites, dass Google neue Seiten schneller entdeckt. Reichen Sie die Sitemap in der Search Console ein und halten Sie sie aktuell.

robots.txt bewusst einsetzen: Die robots.txt steuert das Crawling, nicht die Indexierung. Eine per robots.txt blockierte Seite kann in Ausnahmefällen trotzdem im Index landen, etwa wenn viele externe Links auf sie zeigen, aber Google kann ihren Inhalt dann nicht lesen. Wer eine Seite sicher aus dem Index halten will, blockiert sie nicht per robots.txt, sondern setzt ein noindex-Tag.

Meta-Robots- und Canonical-Tags richtig setzen: Mit dem noindex-Tag schließen Sie einzelne Seiten gezielt aus dem Index aus, etwa interne Suchergebnisseiten, Danke-Seiten oder dünne Filterseiten. Das Canonical-Tag signalisiert Google bei mehreren ähnlichen URLs die bevorzugte Version und bündelt so die Signale auf einer Seite. Beide Tags sind im Web Standard: Laut der Auswertung des Web Almanac 2024 nutzen 69 Prozent der Desktop-Seiten Canonical-Tags und 45,5 Prozent Meta-Robots-Tags, wobei 4,7 Prozent eine noindex-Anweisung setzen (internationale Datenbasis, HTTP Archive).

Interne Verlinkung und technische Hygiene sichern: Eine starke interne Verlinkung führt den Googlebot zu neuen Seiten und signalisiert deren Wichtigkeit. Verwaiste Seiten ohne interne Links werden oft gar nicht erst gefunden. Hinzu kommen Hygiene-Faktoren: HTTPS, eine saubere Seitenstruktur und solide Core Web Vitals erleichtern Crawling und Indexierung, auch wenn sie keine Indexierung erzwingen.

Häufige Fehler: Warum Seiten nicht indexiert werden

Viele Indexierungsprobleme sind hausgemacht. Diese Ursachen treten in der Praxis am häufigsten auf.

Duplicate Content: Gleiche oder sehr ähnliche Inhalte unter mehreren URLs sind einer der häufigsten Blocker. Google wählt dann meist nur eine Version aus und ignoriert die übrigen. In der Search Console erscheinen solche Fälle als Duplikat, Google hat eine andere Seite als kanonisch ausgewählt als der Nutzer oder als Duplikat ohne vom Nutzer ausgewähltes Canonical. Lösung: konsistente Canonical-Tags und das Vermeiden vermeidbarer URL-Varianten.

Gecrawlt, zurzeit nicht indexiert: Diese Meldung bedeutet, dass Google die Seite besucht, aber bewusst nicht in den Index aufgenommen hat. Häufige Ursache ist mangelnde Qualität oder fehlender Mehrwert: Die Seite ist Google den Indexplatz schlicht nicht wert. Abhilfe schaffen substanziellere Inhalte, ein klarer Suchintent und bessere interne Verlinkung.

Erkannt, zurzeit nicht indexiert: Hier kennt Google die URL, hat sie aber noch nicht gecrawlt. Das deutet oft auf ein Crawl-Budget-Thema bei sehr großen Seiten oder auf Qualitätszweifel hin. Crawl-Budget ist allerdings nur für wenige relevant: Google nennt es vor allem ein Thema für große Websites ab einer Million einzigartiger Seiten oder ab 10.000 Seiten mit sehr häufig wechselndem Inhalt. Für typische B2B-Websites ist Crawl-Budget selten das eigentliche Problem.

Soft-404: Eine Seite liefert technisch den Statuscode 200 (OK), wirkt für Google inhaltlich aber wie eine Fehlerseite, etwa leere Kategorien oder Platzhalter ohne Inhalt. Solche Seiten werden nicht indexiert. Geben Sie echten Fehlerseiten den korrekten Statuscode 404 und füllen Sie sinnvolle Seiten mit echtem Inhalt.

Versehentliche Blockaden: Ein nach einem Relaunch vergessenes noindex-Tag aus der Testumgebung oder eine fehlerhafte robots.txt kann ganze Bereiche aus dem Index werfen. Prüfen Sie nach jedem Relaunch systematisch Meta-Robots, robots.txt und Canonical-Tags.

Indexierung messen und überwachen

Indexierung ist kein einmaliger Status, sondern ein laufender Zustand. Diese Kennzahlen und Werkzeuge halten ihn im Blick.

Indexabdeckung in der Search Console: Der Bericht Seiten ist die wichtigste Quelle. Beobachten Sie das Verhältnis von indexierten zu nicht indexierten URLs und vor allem dessen Entwicklung. Ein plötzlicher Einbruch der indexierten Seiten ist ein Alarmsignal und verlangt sofortige Ursachenanalyse.

URL-Prüfung im Einzelfall: Für einzelne strategisch wichtige Seiten liefert das URL-Prüfungstool den genauen Status, das von Google gewählte Canonical und etwaige Probleme. Nutzen Sie es immer dann, wenn eine zentrale Seite partout nicht ranken will.

Stichprobe per site-Abfrage: Eine schnelle, grobe Kontrolle liefert die Suche site:ihredomain.at in Google. Sie zeigt näherungsweise, welche Seiten im Index sind. Die Search Console bleibt aber die verlässlichere Quelle, da die site-Abfrage nur eine Schätzung ist.

Verhältnis zu Ranking-Signalen einordnen: Indexierte, aber traffic-lose Seiten sind normal, wie die genannten 96,55 Prozent ohne Traffic zeigen. Messen Sie Indexierung daher nie isoliert, sondern immer im Zusammenhang mit Rankings, Impressionen und Klicks. Eine Seite, die zwar indexiert ist, aber keine Impressionen erzielt, hat ein Relevanz- oder Qualitätsproblem, kein Indexierungsproblem.

GEO und KI-Suche: die neue Ebene der Indexierung

Indexierung gewinnt durch KI-gestützte Suche zusätzliche Bedeutung. Google blendet zunehmend AI Overviews ein, also KI-generierte Antwortboxen über den klassischen Ergebnissen. Laut einer Analyse von über 10 Millionen Keywords erschienen AI Overviews 2025 im Januar bei 6,49 Prozent der Suchanfragen, im Juli auf dem Höhepunkt bei 24,61 Prozent und im November stabilisiert bei rund 16 Prozent (internationale Studie, Semrush). Diese Antworten speisen sich aus indexierten Inhalten. Was nicht im Index ist, kann auch nicht in einer AI Overview zitiert werden.

Parallel etablieren sich generative Engines als eigener Recherchekanal. ChatGPT erreichte nach Angaben von OpenAI 800 Millionen wöchentliche aktive Nutzer (US-Quelle). Hier setzt Generative Engine Optimization (GEO) an, die Optimierung von Inhalten für die Ausspielung in KI-Antworten. Eine wissenschaftliche Untersuchung zeigt, dass GEO die Sichtbarkeit in generativen Engine-Antworten um bis zu 40 Prozent steigern kann (Forschungspaper, KDD 2024).

Für die Praxis bleibt die Grundlogik gleich: Indexierbarkeit und technische Sauberkeit sind die Basis. Inhalte müssen abrufbar, eindeutig und gut strukturiert sein, damit klassische Suche, AI Overviews und generative Engines sie überhaupt erfassen können. Wer hier nachlässig ist, fällt in allen Kanälen gleichzeitig durch.

Praxis-Checkliste: Eine neue B2B-Seite indexieren lassen

Diese Schritte bringen eine neue Seite zuverlässig in den Index und halten ihn stabil.

1. Indexierbarkeit prüfen: Stellen Sie sicher, dass kein noindex-Tag gesetzt ist und die robots.txt die Seite nicht blockiert. Prüfen Sie das Canonical-Tag, es sollte auf die Seite selbst zeigen.

2. Intern verlinken: Verlinken Sie die neue Seite von relevanten, bereits indexierten Seiten aus. So findet der Googlebot sie schnell und erkennt ihre Bedeutung.

3. Sitemap aktualisieren: Nehmen Sie die URL in die XML-Sitemap auf und reichen Sie diese in der Search Console ein.

4. Indexierung beantragen: Prüfen Sie die URL im URL-Prüfungstool und klicken Sie auf Indexierung beantragen. Das stößt eine priorisierte Prüfung an.

5. Qualität sicherstellen: Bieten Sie substanziellen, eigenständigen Inhalt mit klarem Suchintent. Dies ist der wirksamste Hebel gegen die Meldung Gecrawlt, zurzeit nicht indexiert.

6. Dauerhaft überwachen: Kontrollieren Sie den Indexierungsbericht regelmäßig, reagieren Sie auf Einbrüche und prüfen Sie nach jedem Relaunch Robots-Anweisungen und Canonicals systematisch.

Weiterführendes

Indexierung ist der Kern davon, wie Suchmaschinen funktionieren, und damit eng mit den weiteren SEO-Grundlagen verzahnt. Wer Indexierung verstanden hat, sollte sich als Nächstes mit Crawling-Steuerung, mit Ranking-Faktoren und Qualitätssignalen wie E-E-A-T sowie mit dem Unterschied zwischen SEO und SEA befassen. Für technisch komplexe oder große B2B-Websites lohnt zudem ein tieferer Blick in Crawl-Budget-Management und in die Logfile-Analyse, um zu sehen, was der Googlebot tatsächlich abruft. Mit dem Aufkommen von AI Overviews und generativen Engines kommt GEO als ergänzende Disziplin hinzu, die auf derselben indexierbaren technischen Basis aufsetzt.

Daten & Statistiken

Google hält in Österreich 81,87 Prozent Suchmaschinen-Marktanteil, vor Bing (9,01 Prozent) und DuckDuckGo (2,75 Prozent).

StatCounter Global Stats - Search Engine Market Share Austria (2026)

In Österreich gab es Anfang 2025 8,69 Millionen Internetnutzer bei einer Internet-Penetrationsrate von 95,3 Prozent.

DataReportal - Digital 2025: Austria (2025)

96,55 Prozent aller Seiten erhalten null organischen Traffic von Google, weitere 1,94 Prozent nur eine bis zehn Besuche pro Monat (Analyse von rund 14 Milliarden Seiten).

Ahrefs Blog - Search Traffic Study (2023)

Indexierung ist nicht garantiert: Nicht jede Seite, die Google verarbeitet, wird indexiert. Es gibt kein zentrales Register aller Webseiten, der Googlebot crawlt Milliarden von Seiten.

Google Search Central - In-Depth Guide to How Google Search Works (2025)

Googles Index umfasste rund 400 Milliarden Dokumente (Stand 2020, laut Zeugenaussage von Google-Vizepräsident Pandu Nayak im US-Kartellverfahren).

Zyppy SEO - How Big is Google's Index? (Aussage Pandu Nayak, US v. Google) (2023)

Crawl-Budget ist vor allem ein Thema für große Websites ab einer Million einzigartiger Seiten oder ab 10.000 Seiten mit sehr häufig wechselndem Inhalt.

Google Search Central - Managing crawl budget for large sites (2025)

69 Prozent der Desktop-Seiten nutzen Canonical-Tags und 45,5 Prozent Meta-Robots-Tags; 4,7 Prozent setzen eine noindex-Anweisung.

Web Almanac 2024 (HTTP Archive) - SEO Chapter (2024)

AI Overviews wurden 2025 bei 6,49 Prozent der Suchanfragen im Januar, beim Höhepunkt im Juli bei 24,61 Prozent und im November stabilisiert bei rund 16 Prozent ausgespielt (über 10 Millionen Keywords).

Semrush Blog - AI Overviews Study (2025)

ChatGPT erreichte 800 Millionen wöchentliche aktive Nutzer (Angabe OpenAI-CEO Sam Altman, Oktober 2025).

TechCrunch - Sam Altman says ChatGPT has hit 800M weekly active users (2025)

Generative Engine Optimization (GEO) kann die Sichtbarkeit in generativen Engine-Antworten um bis zu 40 Prozent steigern.

arXiv:2311.09735 - Aggarwal et al., GEO: Generative Engine Optimization (KDD 2024) (2024)

Häufig gestellte Fragen

Was ist der Unterschied zwischen Crawling und Indexierung?

Crawling und Indexierung sind zwei getrennte Phasen. Beim Crawling besucht der Googlebot eine URL und lädt ihren Code. Bei der Indexierung versucht Google anschließend zu verstehen, worum es auf der Seite geht, analysiert Inhalte und Tags und speichert das Ergebnis im Google-Index. Eine Seite kann gecrawlt werden, ohne jemals indexiert zu werden. Google garantiert nicht, dass eine gecrawlte Seite auch in den Index aufgenommen wird.

Wie prüfe ich, ob meine Seite bei Google indexiert ist?

Am verlässlichsten über die Google Search Console: Das URL-Prüfungstool zeigt für jede einzelne URL, ob sie indexiert ist und welche Probleme bestehen. Der Indexierungsbericht (Seiten) listet alle URLs nach Status auf. Eine schnelle, aber ungenaue Stichprobe liefert die Google-Suche site:ihredomain.at, die näherungsweise zeigt, welche Seiten im Index sind.

Warum wird meine Seite nicht indexiert?

Die häufigsten Ursachen sind: Duplicate Content (Google wählt nur eine Version aus), ein gesetztes noindex-Tag, eine Blockade durch die robots.txt, Soft-404-Seiten ohne echten Inhalt sowie mangelnde Qualität. Bei der Meldung Gecrawlt, zurzeit nicht indexiert hat Google die Seite besucht, aber bewusst nicht aufgenommen, meist weil sie als zu wenig wertvoll eingestuft wurde.

Wie lange dauert es, bis Google eine neue Seite indexiert?

Eine feste Dauer gibt es nicht; sie reicht von wenigen Stunden bis zu mehreren Wochen. Beschleunigen lässt sich der Prozess durch eine starke interne Verlinkung, das Einreichen der XML-Sitemap in der Search Console und die Funktion Indexierung beantragen im URL-Prüfungstool. Eine Garantie für eine schnelle oder überhaupt erfolgte Indexierung gibt es dabei nicht.

Was bedeutet die Meldung Gecrawlt, zurzeit nicht indexiert in der Search Console?

Sie bedeutet, dass Google die Seite besucht, aber entschieden hat, sie nicht in den Index aufzunehmen. Die häufigste Ursache ist mangelnde Qualität oder fehlender Mehrwert. Abhilfe schaffen substanziellere, eigenständige Inhalte mit klarem Suchintent und eine bessere interne Verlinkung der betroffenen Seite.

Verhindert die robots.txt die Indexierung einer Seite?

Nein, das ist ein verbreiteter Irrtum. Die robots.txt steuert nur das Crawling. Eine per robots.txt blockierte Seite kann trotzdem im Index landen, etwa wenn viele externe Links auf sie verweisen, Google kann ihren Inhalt dann aber nicht lesen. Um eine Seite sicher aus dem Index zu halten, verwenden Sie das noindex-Tag und blockieren die Seite nicht per robots.txt, damit Google das noindex-Tag auch lesen kann.

Reicht Indexierung aus, um bei Google sichtbar zu sein?

Nein. Indexierung ist die Voraussetzung, aber keine Garantie für Sichtbarkeit. International erhalten 96,55 Prozent aller Seiten null organischen Traffic von Google. Ob eine indexierte Seite auch Besucher bekommt, entscheidet das Ranking, das von Relevanz, Qualität und Signalen wie E-E-A-T abhängt. Indexierte Inhalte sind zudem die Basis dafür, in Google AI Overviews oder in generativen Engines wie ChatGPT und Perplexity überhaupt erscheinen zu können.

Wie schneidet deine Website ab?

Erhalte einen kostenlosen, KI-gestützten SEO-Report deiner Website per E-Mail: technische SEO, On-Page, Keywords & Wettbewerber. Unverbindlich.

Kostenlosen SEO-Audit anfordern →

Vorheriger← Googlebot und Crawling: Wie Google das Web durchsucht NächsterRanking-Faktoren: Wie Google die Reihenfolge bestimmt →