So messen wir KI-Sichtbarkeit

Drei Messungen, eine Methodik — vollständig offengelegt, damit jedes Ergebnis nachvollziehbar ist.

Die drei Messungen im Überblick

Messung	Beantwortet die Frage	Für
Betriebscheck	Wird mein Betrieb von KIs gekannt und empfohlen?	Einzelbetriebe
Region-Audit	Welche Betriebe der Region empfehlen KIs — und wie viele bleiben unsichtbar?	DMOs
Destination-Vergleich	Wird die Region selbst empfohlen — im Vergleich zum Wettbewerb?	DMOs

Welche KI-Systeme wir befragen (alle Messungen)

Jede Frage geht an sechs Systeme: ChatGPT (API, gpt-5-chat-latest), das echte Consumer-ChatGPT (per Scraping, jede Antwort mit nachprüfbarem Link), Claude (claude-sonnet-4-6), Gemini (gemini-2.5-flash), Perplexity (sonar) und Google AI Overviews. Alle Abfragen laufen mit aktivierter Web-Suche über denselben neutralen Datenanbieter (DataForSEO), Standort Deutschland bzw. Österreich, Sprache Deutsch. Google AI Overviews erscheinen nicht bei jeder Suchanfrage — solche Checks fließen nicht in die Bewertung ein.

Wiederholungen: warum jede Frage 3× gestellt wird

KI-Antworten sind nicht deterministisch — dieselbe Frage kann unterschiedliche Empfehlungen liefern. Deshalb stellen wir jede Frage dreimal pro System und unterscheiden: stabil (in ≥ 2 Wiederholungen genannt), vereinzelt (in genau einer) und nie. Erst diese Unterscheidung trennt belastbare Sichtbarkeit von Zufallstreffern. Ergebnisse aus älteren Läufen mit nur einem Durchlauf zeigen die Ampel bewusst nicht.

Messung 1: Der Betriebscheck

8 Fragen, angepasst an Kategorie und Ort — 144 Einzelmessungen (8 × 6 Systeme × 3 Wiederholungen):

5 Empfehlungs-Fragen, in denen der Betriebsname NICHT vorkommt („Welche Hotels in … sind empfehlenswert?", „Was ist das beste …?", Familien-Frage, Aufenthalts- und Wochenend-Planung) — nur eine echte, unbeeinflusste Nennung zählt
2 Wissens-Fragen („Was weißt du über [Betrieb]?", „Was sagen Bewertungen?")
1 Vergleichs-Frage — fließt nicht in den Score ein (der Name steht in der Frage), dient als Beleg

Score (0–100): Bekanntheit max. 30 Punkte (Anteil der Systeme mit substanzieller Antwort auf die Wissens-Fragen) + Empfehlungs-Sichtbarkeit max. 70 Punkte (Anteil der Empfehlungs-Antworten mit Nennung). Antworten ohne verwertbaren Inhalt zählen nicht in den Nenner.

Diagnose: Nach dem Scoring prüft das System automatisch die häufigsten Ursachen fehlender Sichtbarkeit — Website-Auffindbarkeit über die Google-Suche, strukturierte Daten (schema.org/JSON-LD) und llms.txt auf der Betriebs-Website, Google-Bewertungslage im Vergleich zum meistempfohlenen Wettbewerber sowie die Quellen, die die KIs tatsächlich zitieren.

Messung 2: Das Region-Audit (DMO)

25 typische Reisefragen mit eingesetztem Regionsnamen, in 11 Themenfeldern: Unterkunft (Familie, Wellness, Hund, Pension/Ferienwohnung, günstig, gehoben), Gastronomie (regional, Familie, Café), Aktivitäten (Wandern, Rad, Regenwetter, Baden, Winter), Anlässe (Wochenende, Romantik, Gruppen), Barrierefreiheit, Camping, Sehenswürdigkeiten, Geheimtipps und Veranstaltungen — 450 Einzelmessungen (25 × 6 × 3). Ein erweitertes Set mit 40 Fragen ist optional.

Die Bezugsgröße („X von Y Betrieben"): alle benannten touristischen Objekte der Region aus OpenStreetMap — Hotels, Pensionen, Ferienwohnungen, Hostels, Campingplätze, Restaurants, Cafés, Attraktionen, Museen, Thermen. Diese vollständige Betriebsbasis unterscheidet das Audit von Stichproben: Auch wer nie genannt wird, ist erfasst — als KI-unsichtbar.

Auswertung: Ein Sprachmodell (gpt-5.4-mini) zerlegt jede KI-Antwort in konkret empfohlene Betriebe; beim echten ChatGPT kommen die mitgelieferten Geschäfts-Entitäten hinzu. Jede Nennung wird gegen die Betriebsbasis abgeglichen — in dieser Reihenfolge: exakter Namens-Treffer, Website-Domain-Treffer, vollständige Namens-Enthaltung, Wort-Überlappung. Schutzregeln: Wort-Treffer brauchen mindestens ein unterscheidungskräftiges Wort (≥ 4 Zeichen, kein Ortsname) — Betriebe wie „Hotel [Ortsname]" oder „Café am See" werden nicht durch bloße Orts- oder Allerweltswörter gematcht. Pro KI-Antwort zählt jeder Betrieb höchstens einmal. Nicht zuordenbare Nennungen werden separat ausgewiesen.

Ergebnis: Abdeckung in Prozent, Ampel-Karte aller Betriebe (stabil/vereinzelt/unsichtbar), Sichtbarkeit je Kategorie und je KI-System, die sichtbarsten Betriebe samt der Fragen, bei denen sie genannt wurden, und das Ranking der Quellen, die das KI-Bild der Region prägen.

Messung 3: Der Destination-Vergleich (DMO)

10 Urlaubsziel-Fragen, in denen die Region NICHT vorkommt („Welche Region in Deutschland eignet sich am besten für einen Familienurlaub / zum Wandern / für Urlaub am Wasser / für einen Kurztrip ab Berlin …?") an dieselben 6 Systeme, ebenfalls 3× wiederholt — 180 Einzelmessungen. Gemessen wird, in wie vielen Antworten die eigene Region genannt wird — im direkten Vergleich zu 2–4 Wettbewerbs-Destinationen (Share of Voice).

Narrativ-Analyse: Aus den Antworten, in denen die Region vorkommt, extrahiert ein Sprachmodell die Themen und Attribute, die die KIs der Region zuschreiben — mit wörtlichen Belegen. So sieht eine DMO nicht nur ob, sondern als was sie empfohlen wird, und kann das mit ihrer Soll-Positionierung abgleichen.

Grenzen der Messung — ehrlich benannt

KI-Antworten bleiben eine Stichprobe. Die 3× Wiederholung und die Breite (144 bzw. 450 Messungen) machen Aussagen belastbar; echte Trends entstehen durch wiederholte Messung (Monitoring).
Die Betriebsbasis basiert aktuell auf OpenStreetMap und ist so vollständig wie die OSM-Datenpflege der Region. Das Messgebiet ist ein Rechteck um die Region und kann Randgebiete enthalten. Für DMOs lassen sich stattdessen reale touristische Datenbestände anbinden — Open Data / Knowledge Graph der DZT, destination.one-Daten oder das eigene Mitgliederverzeichnis. Dann ist die Bezugsgröße exakt die offizielle Betriebsbasis der Destination.
API-Antworten entsprechen nicht jeder persönlichen ChatGPT-Sitzung (Personalisierung). Als Anker dient das echte Consumer-ChatGPT per Scraping — jede dieser Antworten hat einen nachprüfbaren Link.
Der Namens-Abgleich kann in Einzelfällen Schwesterbetriebe mit gemeinsamer Website verbinden; auffällige Fälle werden im Report stichprobenartig geprüft.
Das Region-Audit misst die Sichtbarkeit auf Destinations-Ebene. Reisende fragen auch kleinräumiger (Orte, Täler, Teilregionen) — diese lokale Sichtbarkeit erfordert eine eigene Tiefenmessung je Teilregion und ist als Erweiterung verfügbar. Bei sehr großen Regionen (z. B. ganzen Bundesländern) bildet das Audit daher die „Markenspitze" ab, nicht jeden Einzelbetrieb.
Gemessen wird die deutschsprachige Suche; andere Quellmärkte (EN/NL/…) sind als eigene Messung verfügbar.

Für DMOs: Vom Messen zum Handeln

Dieser Check zeigt, wo Ihre Destination in der KI-Suche steht. Der KI-Sichtbarkeits-Monitor macht daraus ein laufendes System für Ihre DMO: monatliche Messungen statt Momentaufnahme, der vollständige Betriebs-Index Ihrer Region mit Ampel-Karte, der Destination-Vergleich gegen Ihre Wettbewerber — und die Daten-Pipelines, die Sichtbarkeit tatsächlich herstellen: strukturierte Daten für Ihre Betriebe, Anbindung an Knowledge Graph und Open-Data-Strukturen, gepflegte Basisdaten, auf die sich KIs verlassen können.

Das System läuft auf Ihrer eigenen Infrastruktur — DSGVO-konform, ohne SaaS-Abo bei einem US-Anbieter, erweiterbar durch Ihr Team.

Mehr auf friedemann-schuetz.de Gespräch anfragen