Content-Kriterien für KI-Zitierbarkeit

Inhalt

Wie sieht Content aus, der von ChatGPT, AI Overviews und Co. zitiert wird?

Inzwischen gibt es einige Studien, die dieser Frage auf den Grund gehen. Sie legen nahe, dass es eine ganze Reihe von Kriterien gibt – von technischer Erreichbarkeit über externe Signale bis zur Content-Struktur.

Ich habe die Erkenntnisse ausgewählter Studien hier zusammengetragen. Darin wurden die Antworten verschiedener KI-Systeme analysiert und ausgewertet, inwiefern Faktoren rund um Website, Marke und Content mit der Häufigkeit korrelieren, mit der Inhalte für die Antworten genutzt wurden. 

Disclaimer:

Für definitive Annahmen und pauschale Handlungsempfehlungen ist die Datenbasis noch immer zu klein. Außerdem untersuchen die meisten Studien nur einzelne oder eine Auswahl an KI-Systemen. Auf welche(s) sich die jeweilige Aussage bezieht, ist den Texten und Quellen zu entnehmen.

Und was heißt das nun für uns Marketingverantwortliche?

Die Erkenntnisse können sehr wohl eine Orientierung bieten, um die eigene Content-Strategie für GEO anzupassen. Schließlich müssen wir uns dem Ganzen ja irgendwie annähern – und zwar mit Daten. Wichtig ist, zusätzlich ein grundlegendes Verständnis zu entwickeln, wie LLMs funktionieren, den User in den Fokus zu stellen und klassische SEO nicht aus den Augen zu verlieren (sondern je nach Geschäftsmodell und Zielgruppe sogar zu priorisieren).

Grafik klicken, um sie in voller Größe anzuzeigen und herunterzuladen

Technische Basis

🤖 Crawlability

robots.txt auf Disallow-Einträge prüfen: KI-Crawler (GPTBot, Googlebot, Bingbot, PerplexityBot …) dürfen nicht ausgeschlossen werden.

⌨️ Kein JavaScript-only Content

Rein JS-basierte Seiten (und Navigationen!) können nicht von Crawlern abgerufen werden. Sauberes HTML ist die Basis für KI-Sichtbarkeit.

⚡ Schnelle Ladezeiten

Schnelle Seiten können besser gecrawlt werden. Eine hohe Ladegeschwindigkeit korreliert positiv mit Zitierhäufigkeit in ChatGPT.

 📑 LLMs.txt & Schema-Markup: Einfluss zweifelhaft

LLMs.txt zeigte keinen, Schema wenig Einfluss auf ChatGPT-Zitate. Gut implementiertes Schema könnte Sichtbarkeit in AIO erhöhen.

Autorität

🔗 Backlinks & Domain Authority & Traffic

Alle drei Faktoren korrelieren positiv mit der Zitierhäufigkeit in ChatGPT, AI Mode und AI Overviews. (Digitale) PR, klassische SEO und andere Marketingmaßnahmen helfen dabei, die Markenautorität zu stärken.

🏷️ Brand Mentions

Erwähnungen der Marke auf externen Websites und in sozialen Medien erhöhen die Autorität. Besonders relevant sind Erwähnungen in Youtube-Videos (in Titel, Transkript und/oder Beschreibung), Quora und Reddit.

Content

🧠 Position im ersten Drittel

44,2 % aller Zitate in ChatGPT stammen aus den ersten 30 % eines Dokuments. Dort sollten die wichtigsten Informationen platziert werden.

  • Do: „Künstliche Intelligenz (KI) bezeichnet Systeme, die menschliche Entscheidungsprozesse simulieren.“
  • Don’t: „Bevor wir verstehen, was KI heute bedeutet, lohnt sich ein Blick in die Geschichte der Informatik …“

🧬 Hohe Entity-Dichte

Texte mit hoher „Entity Richness“ (Eigennamen, Marken, Tools) zeigten signifikant höhere Zitierwahrscheinlichkeit in ChatGPT.

  • Do: „OpenAI entwickelte ChatGPT auf Basis der GPT-4-Architektur.“
  • Don’t: „Das Unternehmen entwickelte das System auf Basis eines neuen Modells.“

🎓 College-Level-Schreibstil

ChatGPT zitiert Texte auf mittlerem akademischem Niveau häufiger als sehr einfache oder hochwissenschaftliche Inhalte.

  • Do: „Die Implementierung generativer Modelle erfordert robuste Trainingsdaten.“
  • Don’t: „KI ist voll cool und macht richtig krasse Sachen.“

❓ Nutzerfragen im Content

Fragebasierte Struktur (Q&A) korreliert positiv mit Zitierhäufigkeit in ChatGPT, vor allem mit Fragen in den Headlines (H2).

  • Do: „Was ist Retrieval-Augmented Generation (RAG)?“
  • Don’t: „Im folgenden Abschnitt beschäftigen wir uns mit …“

📊 Präzise Zahlen & Daten

Seiten mit konkreten Datenpunkten werden überproportional referenziert.

  • Do: „86 % der AI-Zitate stammen aus markenkontrollierten Quellen.“
  • Don’t: „Die meisten Zitate kommen von Marken.“

⚖️ Ausgewogenes Sentiment

In der ChatGPT-Analyse zeigen Inhalte mit mittlerem Sentiment (weder extrem positiv noch negativ) höhere Zitierwahrscheinlichkeit.

  • Do: „KI steigert Effizienz, aber birgt regulatorische Herausforderungen.“
  • Don’t: „KI wird die Welt zerstören.“

🗂️ Subtopic-Cluster (ca. 120–180 Wörter)

Strukturierte Abschnitte mit klaren Zwischenüberschriften erhöhen die Extrahierbarkeit.

📋 Listen & Tabellen

Strukturierte Formate (Listen/Tabellen) werden in ChatGPT Search, Google AI Mode, Perplexity überdurchschnittlich häufig referenziert.

🕐 Content-Freshness

Content, der in den letzten 3 Monaten aktualisiert wurde, wird von ChatGPT mit höherer Wahrscheinlichkeit zitiert.

🔍 Ausführlichkeit

Längere, ausführliche Inhalte produzierten mehr Zitate sowohl in ChatGPT als auch AI Mode.

 

Inhalt