Information Gain Score: Warum nur einzigartiger Content zählt
Der Information Gain Score ist ein in einem Google-Patent beschriebenes Maß dafür, wie viel neue Information ein Dokument über das hinaus liefert, was zu einem Thema bereits bekannt ist. Ein trainiertes Machine-Learning-Modell bewertet Dokumente anhand semantischer Feature-Vektoren relativ zu bereits gesehenen Inhalten. Reine Wiederholung oder Synthese bestehender Inhalte erzielt einen Score nahe null.
Auf einen Blick
- ✓Das Google-Patent US20200349181A1 (Contextual estimation of link information gain) beschreibt ein ML-Modell, das den Neuigkeitswert von Content relativ zu bereits gesehenen Dokumenten bewertet
- ✓Proprietäre Daten, First-Hand-Experience, Experteninterviews und Originalframeworks sind der wirksamste Hebel für Information Gain, weil sie nicht synthetisierbar sind
- ✓Die Skyscraper-Technik (eine längere Version bestehender Inhalte) erzeugt keinen Gain und ist als Strategie überholt
- ✓Google bestraft KI-Content nicht aktiv (Korrelation 0,011), aber menschlicher Content steht in 80 Prozent der Fälle auf Position 1 gegenüber 9 Prozent für reinen KI-Output
- ✓Reiner KI-Output ohne menschliche Veredelung erzeugt typischerweise einen Score nahe null, weil er bestehenden Corpus rekombiniert statt Neues hinzuzufügen
- ✓Einzigartige Information wird in AI Overviews zitiert statt nur paraphrasiert und ist damit die zentrale Währung gegen den Zero-Click-Effekt (minus 58 Prozent CTR bei AI Overviews)
- ✓Im DACH-Raum nutzt rund die Hälfte der Content-Marketer bereits KI; Differenzierung entsteht nur noch durch das, was die KI nicht liefern kann
Zwei Artikel zum selben Thema, beide korrekt, beide gut geschrieben. Der eine fasst zusammen, was zehn andere Seiten schon sagen. Der andere bringt eine eigene Umfrage, ein konkretes Praxisbeispiel und eine Zahl, die nirgends sonst steht. Genau diesen Unterschied versucht Google seit Jahren maschinell zu messen. Der Information Gain Score beschreibt, wie viel neue Information ein Dokument über das hinaus liefert, was zum Thema bereits bekannt ist. Wer den Score versteht, versteht, warum reine Content-Synthese im Jahr 2026 nicht mehr rankt und warum eigene Daten zum wichtigsten Asset einer Content-Strategie werden.
Warum der Information Gain Score über Sichtbarkeit entscheidet
Klassisches SEO drehte sich um zwei Größen: Relevanz (passt der Inhalt zur Suchanfrage?) und Autorität (ist die Quelle vertrauenswürdig?). Der Information Gain Score fügt eine dritte Dimension hinzu: Neuigkeitswert. Die Frage lautet nicht mehr nur, ob ein Dokument zum Thema passt, sondern ob es dem bereits vorhandenen Wissen etwas hinzufügt.
Die Idee stammt aus einem Google-Patent. Die Anmeldung "Contextual estimation of link information gain" wurde am 18. Oktober 2018 eingereicht und am 5. November 2020 veröffentlicht. Der Kern laut Abstract: Ein Information Gain Score für ein gegebenes Dokument zeigt an, welche zusätzliche Information es über die Information hinaus enthält, die in zuvor betrachteten Dokumenten bereits vorhanden war. Damit verschiebt sich die Bewertungslogik. Ein Inhalt konkurriert nicht isoliert um ein Keyword, sondern gegen den Wissensstand, den die Suchmaschine zum Thema bereits hat.
Für B2B-Unternehmen im DACH-Raum hat das harte Konsequenzen. Die sogenannte Skyscraper-Technik, also das Erstellen einer längeren Version eines bereits gut rankenden Artikels, adressiert genau das, was der Information Gain Score abstraft: mehr vom Gleichen, ohne echten Mehrwert. Eine längere Zusammenfassung erzeugt keinen Information Gain. Sie erzeugt nur mehr Text.
Wie Google Information Gain technisch misst
Das Patent beschreibt kein Bauchgefühl, sondern ein maschinelles Verfahren. Laut der Patentbeschreibung werden Daten zu bereits präsentierten Dokumenten gemeinsam mit Daten zu neuen, noch nicht gezeigten Dokumenten als Eingabe in ein trainiertes Machine-Learning-Modell gegeben. Aus den extrahierten Informationen wird ein semantischer Feature-Vektor erzeugt. Die Suchergebnisse werden anschließend zumindest teilweise auf Basis ihrer jeweiligen Information-Gain-Scores sortiert.
Drei Aspekte sind dabei entscheidend.
Semantik statt Stringvergleich: Das System arbeitet mit Embeddings, also semantischen Vektoren, nicht mit reinem Textabgleich. Es erkennt, dass zwei Absätze dasselbe aussagen, auch wenn sie unterschiedliche Wörter verwenden. Synonyme, Umformulierungen und das Austauschen einzelner Begriffe erzeugen deshalb keinen Information Gain. Die Maschine misst die Bedeutung, nicht die Oberfläche.
Reihenfolge der gesehenen Dokumente: Der Score ist kontextabhängig. Er bewertet ein Dokument relativ zu den Dokumenten, die zuvor betrachtet wurden. Das bedeutet: Wer als Zehnter dasselbe sagt wie die ersten neun, hat einen Score nahe null. Wer als Erster eine bestimmte Information liefert, hat den höchsten Gain. Frühzeitigkeit und Originalität zahlen sich aus.
Bewertung gegen den Corpus, nicht nur gegen die Historie: In der allgemeinen Lesart kann der Score gegen den gesamten thematischen Content-Bestand operieren, nicht nur gegen die individuelle Browsing-Historie eines einzelnen Nutzers. Das macht ihn von einem Personalisierungsmechanismus zu einem potenziellen Qualitätssignal für die gesamte Themenlandschaft.
Wichtig ist die saubere Einordnung: Ein Patent beschreibt, was Google schützen lassen wollte, nicht den produktiven Einsatz im Ranking. Der Information Gain Score ist daher kein offiziell bestätigter Faktor, sondern ein dokumentiertes Konzept, dessen Logik sich im beobachtbaren Verhalten der Suche wiederfindet.
Patent versus Realität: Hilft Information Gain wirklich beim Ranking?
Ob der Score exakt so im Live-System läuft, ist von außen nicht beweisbar. Die Wirkungsrichtung lässt sich aber an benachbarten Systemen ablesen, deren Stoßrichtung identisch ist.
Das Helpful-Content-System und die Core Updates der Jahre 2024 bis 2026 belohnen Inhalte, die für Menschen geschrieben sind und einen eigenständigen Beitrag leisten. E-E-A-T, also Experience, Expertise, Authoritativeness und Trust, hebt insbesondere die erste Komponente hervor: Erfahrung aus erster Hand. Beide Rahmenwerke zielen auf dasselbe wie der Information Gain Score, nur aus anderer Richtung. Sie fragen, ob ein Inhalt etwas beiträgt, das nicht schon überall steht.
Ein handfester Beleg für die Richtung kommt aus der generativen Suche. Eine internationale Studie zur Generative Engine Optimization zeigt, dass sich die Sichtbarkeit in KI-Antworten um bis zu 40 Prozent steigern lässt, wenn Inhalte gezielt angereichert werden. Die wirksamsten Methoden im Test waren das Hinzufügen von Zitaten, von Statistiken und von Quellenangaben. Reines Keyword-Stuffing brachte dagegen keinen Vorteil: Die entsprechende Variante lag mit 17,8 gegenüber einem Ausgangswert von 19,5 sogar unter der Baseline. Die Botschaft deckt sich mit dem Information-Gain-Prinzip: Maschinen belohnen überprüfbare, eigenständige Substanz, nicht die Wiederholung von Schlüsselwörtern.
Information Gain praktisch erzeugen
Wenn die Synthese fremder Inhalte keinen Gain erzeugt, stellt sich die Frage, was es tut. Die Antwort ist konsequent: alles, was die Maschine nicht aus anderen Quellen zusammenkopieren kann.
Eigene Daten und Umfragen: Proprietäre Zahlen sind der wirksamste Information-Gain-Hebel überhaupt. Eine eigene Branchenumfrage, anonymisierte Auswertungen aus dem eigenen Produkt oder eine Analyse interner Projektdaten liefern Information, die per Definition nirgends sonst existiert. Genau deshalb sind eigene Daten der nachhaltigste Content-Graben gegenüber Wettbewerbern und KI-Synthese.
First-Hand-Experience: Ein selbst durchgeführter Test, ein dokumentiertes Implementierungsprojekt oder ein Erfahrungsbericht aus der eigenen Praxis erzeugt Gain, weil die Beobachtung original ist. Das ist die Experience-Komponente von E-E-A-T in operativer Form.
Experteninterviews: Ein Originalzitat einer Fachperson existiert vor der Veröffentlichung nicht im Corpus. Interviews bringen sowohl Information Gain als auch ein Autoritätssignal und lassen sich nicht durch Paraphrase reproduzieren.
Originalframeworks: Eine eigene Systematik, ein benanntes Modell oder eine strukturierte Entscheidungshilfe ordnet bekanntes Wissen neu. Auch das ist Gain, weil die Struktur selbst neu ist, selbst wenn die Einzelteile bekannt sind.
Lokale AT- und DACH-Insights: Rechtliche Besonderheiten Österreichs, regionale Marktdaten oder Fallstudien aus dem DACH-Raum sind ein unterschätzter Gain-Hebel. Internationaler Content deckt diese Spezifika selten ab. Wer den österreichischen Kontext präzise bedient, liefert Information, die im global dominierten Corpus fehlt.
KI-gestützte Content-Erstellung ohne Strafe
Die naheliegende Sorge lautet: Bestraft Google KI-generierten Content? Die Datenlage gibt eine klarere Antwort, als die Schlagzeilen vermuten lassen, und sie ist differenziert.
Die Verbreitung ist längst Realität. Laut einer Ahrefs-Analyse enthalten 74,2 Prozent neuer Webseiten KI-Inhalte, nur 25,8 Prozent sind rein menschlich, 71,7 Prozent eine Mischung aus Mensch und KI und 2,5 Prozent reiner KI-Output (Stichprobe 900.000 Seiten, internationale Daten). KI ist also keine Randerscheinung mehr, sondern Normalfall.
Bestraft Google das? Im Mittel nein. Eine zweite Ahrefs-Untersuchung über 600.000 Seiten ergab eine Korrelation zwischen KI-Anteil und Ranking von 0,011, also praktisch null (internationale Daten). In derselben Stichprobe enthielten 86,5 Prozent der Top-20-Seiten einen KI-Anteil, 13,5 Prozent waren rein menschlich und 4,6 Prozent reiner KI-Output. Google bestraft die Herkunft also nicht aktiv. Es bewertet, ob Nutzer den Inhalt hilfreich finden.
Gleichzeitig gewinnt menschlicher Content an der Spitze. Eine internationale Semrush-Auswertung von 42.000 Blog-Seiten über 20.000 Keywords zeigt, dass menschlich geschriebener Content in 80 Prozent der Fälle auf Position 1 steht, reiner KI-Output nur in 9 Prozent (internationale Daten). Auf dem ersten Platz war menschlicher Content damit achtmal so wahrscheinlich wie KI-Content. Interessant ist die Selbsteinschätzung der Branche: 72 Prozent der befragten SEOs glauben, KI-Content schneide gleich gut oder besser ab als menschlicher.
Wie passt das zusammen? Über die Brille des Information Gain Score ergibt sich ein stimmiges Bild. KI bestraft Google nicht. Aber reiner KI-Output ohne menschliche Veredelung produziert in der Regel genau das, was einen Score nahe null erzeugt: eine Rekombination dessen, was das Modell aus dem bestehenden Corpus gelernt hat. Das Modell kennt keine proprietären Daten, keine First-Hand-Experience und kein Originalframework. Es synthetisiert. Was funktioniert, ist KI als Assistent, dem ein Mensch eigene Daten, Erfahrung und Urteil hinzufügt. Was scheitert, ist KI als Ersatz für eigenständige Substanz.
Thin Content, Duplicate Content und Differenzierung
Thin Content und Duplicate Content sind die klassischen Negativbeispiele für fehlenden Information Gain. Thin Content ist Inhalt ohne substanziellen Eigenwert, etwa eine dünne Kategorieseite oder ein generischer Ratgeber, der nichts Neues sagt. Duplicate Content wiederholt vorhandene Information, intern oder von Dritten übernommen.
Der Information Gain Score macht die Verbindung explizit: Beide Phänomene haben einen niedrigen Score, weil sie dem Corpus nichts hinzufügen. Entscheidend ist die Verschiebung der Schwelle. Früher reichte es, nicht doppelt zu sein. Heute reicht es nicht mehr, eigenständig formuliert zu sein. Ein Artikel kann zu 100 Prozent original geschrieben und trotzdem ohne Gain sein, wenn er inhaltlich nur das wiedergibt, was zehn andere Seiten ebenfalls sagen. Differenzierung findet nicht auf der Formulierungsebene statt, sondern auf der Informationsebene.
Information Gain als Treiber von GEO, AEO und Zero-Click
Die eigentliche Brisanz entfaltet der Information Gain Score in der generativen Suche. AI Overviews und KI-Assistenten beantworten Fragen direkt im Ergebnis. Das verändert das Spiel grundlegend.
Die Folge ist messbar. Laut Ahrefs reduziert das Erscheinen einer AI Overview die organische Klickrate für Inhalte auf Position 1 um 58 Prozent (Stand Dezember 2025, internationale Daten). Die durchschnittliche Position-1-Klickrate für informationelle Suchanfragen fiel von 0,076 im Dezember 2023 auf 0,039 im Dezember 2025. Wer nur paraphrasiert, wird paraphrasiert: Die KI fasst den Inhalt zusammen, der Nutzer klickt nicht.
Hier kehrt sich der Information Gain Score in einen Vorteil um. Inhalte mit einzigartiger Information werden in AI Overviews nicht nur verarbeitet, sondern als Quelle zitiert. Eine eigene Statistik, ein konkretes Zitat oder ein Originaldatum lässt sich nicht wegparaphrasieren. Die KI muss die Quelle benennen, weil die Information ohne sie nicht existiert. Das deckt sich mit der GEO-Studie: Die wirksamsten Hebel für Sichtbarkeit in KI-Antworten waren das Hinzufügen von Zitaten, Statistiken und Quellen. Information Gain ist damit kein reines Google-Thema, sondern die zentrale Währung der Zitierfähigkeit in generativen Systemen.
Messung und Operationalisierung
Information Gain lässt sich nicht direkt aus einem Tool ablesen, aber annähern. Mehrere Plattformen helfen, die thematische Abdeckung und die Lücken im Corpus sichtbar zu machen.
Content-Tools nutzen: Werkzeuge wie InLinks, MarketMuse oder Semrush analysieren, welche Subthemen und Entitäten ein Thema umfasst und welche Wettbewerber bereits abdecken. Das zeigt indirekt, wo der Corpus bereits gesättigt ist und wo eine Lücke besteht. Die Lücke ist der Ort des höchsten potenziellen Gains.
Content-Audit-Prozess: Ein strukturiertes Audit prüft jeden bestehenden Artikel auf eine einfache Frage: Was steht hier, das nicht auf den Top-Ergebnissen für dasselbe Keyword steht? Inhalte ohne eindeutige Antwort sind Kandidaten für Konsolidierung, Anreicherung mit eigenen Daten oder Löschung.
KPIs für Einzigartigkeit: Sinnvolle Messgrößen sind der Anteil an Originaldaten pro Artikel, die Zahl der Zitate in AI Overviews und generativen Antworten, die Sichtbarkeit für Long-Tail-Fragen, die nur die eigene Information beantwortet, sowie die Verweildauer als indirektes Signal für echten Mehrwert. Reine Wortzahl ist kein KPI für Gain. Sie war das Maß der Skyscraper-Logik und führt in die Irre.
Geleakte interne Google-Dokumente nennen Attribute, deren Namen in dieselbe Richtung deuten, etwa ein Maß für den investierten Aufwand und einen Hinweis auf Originalität. Solche Attributnamen sind ein Indiz, kein Beweis für die exakte Funktionsweise. Die praktische Konsequenz bleibt unabhängig davon dieselbe: Aufwand und Originalität sind die Stellschrauben.
Strukturierte Daten und semantische Keywords
Einzigartige Information nützt nur, wenn Such- und KI-Systeme sie auch als solche erkennen. Hier kommen strukturierte Daten und semantische Auszeichnung ins Spiel.
Schema-Markup: Strukturierte Daten in Formaten wie JSON-LD machen Aussagen maschinenlesbar. Wer eine eigene Statistik, einen Datensatz, eine FAQ oder ein Originalzitat per Schema auszeichnet, erleichtert es Such- und KI-Systemen, die Information präzise zu extrahieren und zu attribuieren. Eine ausgezeichnete Originalzahl ist für eine AI Overview leichter zitierbar als dieselbe Zahl im Fließtext.
Semantische Keywords und LSI: Begriffe aus dem semantischen Umfeld eines Themas helfen der Maschine, den Kontext sicher zu erfassen. Sie ersetzen keinen Information Gain, denn das Verfahren arbeitet ohnehin mit Embeddings. Aber sie stellen sicher, dass die eigenständige Information dem richtigen Thema zugeordnet wird und nicht im semantischen Niemandsland landet. Semantische Vollständigkeit ist die Voraussetzung dafür, dass der Gain überhaupt im richtigen Kontext zählt.
DACH-B2B-Strategie und EU AI Act
Für österreichische und DACH-B2B-Unternehmen verbindet sich der Information Gain Score mit dem regulatorischen Rahmen zu einer klaren strategischen Linie.
KI ist im DACH-Marketing fest etabliert. Laut Statista nutzt rund die Hälfte der befragten Content-Marketing-Profis KI-Tools für die Content-Erstellung und 43 Prozent für Analyse, Reporting und Performance-Messung (Befragung von 330 Profis im DACH-Raum, in den USA und im Vereinigten Königreich). Auch in der Breite der Wirtschaft steigt die Adoption rasch: In Österreich nutzten laut Statistik Austria 30 Prozent der Unternehmen mit mindestens 10 Beschäftigten 2025 KI-Technologien, nach 20 Prozent im Jahr 2024. Die Adoption ist damit binnen eines Jahres um die Hälfte gestiegen.
Damit wird der Wettbewerbsvorteil knapper. Wenn die Hälfte der Marketer KI für Content nutzt, ist KI-Unterstützung kein Differenzierungsmerkmal mehr. Differenzierung entsteht nur noch durch das, was die KI nicht liefern kann: eigene Daten, Erfahrung und Urteil. Der Information Gain Score formalisiert genau diese Logik.
Parallel schafft der EU AI Act Transparenzpflichten. Künstlich erzeugte oder manipulierte Inhalte müssen unter bestimmten Bedingungen als solche kenntlich gemacht werden. Für eine Content-Strategie heißt das: Transparenz über den KI-Einsatz wird zur Compliance-Aufgabe, nicht zur Option. Diese Pflicht passt strategisch gut zur Gain-Logik. Wer ohnehin auf menschliche Veredelung, eigene Daten und nachvollziehbare Quellen setzt, hat mit Transparenzanforderungen kein Problem, sondern macht aus ihnen ein Vertrauenssignal. Eine zukunftssichere, also predictive ausgerichtete SEO-Strategie im DACH-Raum baut deshalb nicht auf Masse, sondern auf einzigartige, transparent gekennzeichnete Substanz.
Weiterführendes
Der Information Gain Score verschiebt die Frage von "Wie decke ich ein Keyword ab?" zu "Was füge ich dem vorhandenen Wissen hinzu?". Die praktische Konsequenz ist eindeutig: Eigene Daten, First-Hand-Experience, Experteninterviews und lokale DACH-Insights sind kein Nice-to-have, sondern der Kern jeder rankenden und zitierfähigen Content-Strategie. KI bleibt ein wertvoller Assistent, ersetzt aber keine eigenständige Substanz. Im nächsten Schritt empfiehlt sich ein Content-Audit des bestehenden Bestands auf Gain, der konsequente Einsatz strukturierter Daten zur Auszeichnung eigener Information sowie die Abstimmung mit einer GEO- und Zero-Click-Strategie, damit einzigartige Inhalte in AI Overviews zitiert und nicht nur paraphrasiert werden.
Daten & Statistiken
Patent Contextual estimation of link information gain (US20200349181A1): eingereicht 18.10.2018, veröffentlicht 05.11.2020; ein Information Gain Score misst zusätzliche Information über zuvor betrachtete Dokumente hinaus, berechnet durch ein trainiertes ML-Modell aus semantischen Feature-Vektoren, genutzt zur Sortierung von Dokumenten
Google Patents / USPTO (2020)Bis zu 40 Prozent mehr Sichtbarkeit in generativen Suchantworten durch gezielte Anreicherung; wirksamste Methoden Zitate, Statistiken und Quellen; Keyword-Stuffing wirkungslos (17,8 gegenüber Baseline 19,5)
Aggarwal et al., GEO: Generative Engine Optimization (arXiv:2311.09735v3), ACM SIGKDD KDD 2024 (2024)Menschlicher Content steht in 80 Prozent der Fälle auf Position 1 gegenüber 9 Prozent für reinen KI-Output (achtmal wahrscheinlicher); 72 Prozent der befragten SEOs glauben, KI-Content schneide gleich gut oder besser ab; Semrush-Analyse von 42.000 Blog-Seiten über 20.000 Keywords
Search Engine Land (2026)Korrelation zwischen KI-Anteil und Ranking 0,011 (praktisch null); 600.000 Seiten analysiert; 86,5 Prozent der Top-20-Seiten mit KI-Anteil, 13,5 Prozent rein menschlich, 4,6 Prozent reiner KI-Output
Ahrefs Blog (2025)74,2 Prozent neuer Webseiten enthalten KI-Inhalte (25,8 Prozent rein menschlich, 71,7 Prozent Mischung Mensch/KI, 2,5 Prozent reiner KI-Output); Stichprobe 900.000 Seiten, April 2025
Ahrefs Blog (2025)Minus 58 Prozent organische Klickrate für Position-1-Inhalte, wenn eine AI Overview erscheint; durchschnittliche Position-1-CTR für informationelle Anfragen fiel von 0,076 (Dezember 2023) auf 0,039 (Dezember 2025)
Ahrefs Blog (2026)Rund die Hälfte der Content-Marketer nutzt KI-Tools für die Content-Erstellung, 43 Prozent für Analyse, Reporting und Performance-Messung; Befragung von 330 Profis im DACH-Raum, USA und UK
Statista (Infografik 35964), Content Marketing Trendstudie 2026 (2026)30 Prozent der österreichischen Unternehmen mit mindestens 10 Beschäftigten nutzten 2025 KI-Technologien, nach 20 Prozent im Jahr 2024
STATISTIK AUSTRIA, IKT-Einsatz in Unternehmen 2025 (2025)Häufig gestellte Fragen
Was ist der Information Gain Score?
Ist der Information Gain Score ein bestätigter Google-Rankingfaktor?
Bestraft Google KI-generierten Content?
Wie erzeuge ich praktisch Information Gain?
Warum rankt die Skyscraper-Technik nicht mehr?
Wie hängt Information Gain mit AI Overviews und Zero-Click zusammen?
Was bedeutet der EU AI Act für KI-gestützte Content-Erstellung im DACH-Raum?
Wie schneidet deine Website ab?
Erhalte einen kostenlosen, KI-gestützten SEO-Report deiner Website per E-Mail – technische SEO, On-Page, Keywords & Wettbewerber. Unverbindlich.
Kostenlosen SEO-Audit anfordern →