Schema.org für GenAI: Was wirklich gemessen wird

Zusammenfassung. Schema.org existiert seit 2011. Der Fehler, den die meisten Teams 2026 machen, ist, AI-Engine-Optimierung so zu behandeln, als bräuchte sie ein neues Vokabular. Tut sie nicht. Sie braucht das vorhandene Schema-Vokabular, angewandt auf die sieben Typen, die zählen, verbunden mit dem @graph-Muster, ausgeliefert als JSON-LD mit den richtigen @id-Referenzen. In den sechs Brand-Audits, die ich vor zwei Wochen besprochen habe, wurde die Lücke zwischen Seiten, die AI-Engines parsen können, und Seiten, die AI-Engines raten müssen, fast vollständig dadurch erklärt, ob diese sieben Typen vorhanden und richtig verlinkt waren. Dieser Beitrag ist die technische Version dieses Befunds — was zu liefern ist, wie man es validiert, und welche Kaninchenlöcher nicht die Zeit wert sind.

Das ist der dritte Beitrag einer kurzen Serie zu AI-Visibility. Der erste hat erklärt, warum die meisten Mittelstandsseiten für ChatGPT unsichtbar sind. Der zweite hat den Tool-Markt in ehrliche Kategorien sortiert. Dieser hier ist das technische Playbook für den wirkungsvollsten Einzel-Fix auf den meisten Seiten.

Die sieben Typen, die die Nadel bewegen

Schema.org hat mehr als 800 Typen. Die volle Hierarchie zu lesen, ist Zeitverschwendung. Für AI-Engine-Lesbarkeit ist das Arbeitsset klein: Organization, WebSite, WebPage, Article, Product oder Service, FAQPage, BreadcrumbList. Wenn Sie ein lokales Geschäft haben, fügen Sie LocalBusiness mit geo- und address-Block hinzu, und Sie sind fertig.

Das Muster, das fast keine agentur-gebaute Seite richtig hinbekommt, ist der @graph-Umschlag. Die meisten Seiten liefern einen JSON-LD-Block pro Seite, der die Seite selbst beschreibt, und das war's. Das @graph-Muster erlaubt es, die Site, die Seite, den Breadcrumb und die primäre Entität in einer strukturierten Payload zu beschreiben, mit @id-Referenzen, die sie verbinden. AI-Engines, die JSON-LD parsen, laufen dann den Graphen ab, statt Entity-Extraktion aus Fließtext zu machen. Einen Graphen ablaufen ist billig und eindeutig; Entitäten aus Fließtext extrahieren ist teuer und verlustbehaftet. Modelle bevorzugen den billigen, eindeutigen Pfad. Sie zitieren, was sie mit Vertrauen parsen können.

Hier ist die minimale brauchbare Form für eine B2B-Mittelstand-Startseite. Kopieren, anpassen, ausliefern.

{
  "@context": "https://schema.org",
  "@graph": [
    {
      "@type": "Organization",
      "@id": "https://example.com/#organization",
      "name": "Example GmbH",
      "url": "https://example.com",
      "logo": "https://example.com/logo.png",
      "sameAs": [
        "https://www.linkedin.com/company/example",
        "https://www.wikidata.org/wiki/Q123456"
      ],
      "description": "Industrieautomation für den Mittelstand."
    },
    {
      "@type": "WebSite",
      "@id": "https://example.com/#website",
      "url": "https://example.com",
      "name": "Example",
      "publisher": { "@id": "https://example.com/#organization" }
    },
    {
      "@type": "WebPage",
      "@id": "https://example.com/#webpage",
      "url": "https://example.com",
      "name": "Industrieautomation — Example GmbH",
      "isPartOf": { "@id": "https://example.com/#website" },
      "about": { "@id": "https://example.com/#organization" }
    }
  ]
}

Die @id-Referenzen sind die tragende Wand. Ohne sie haben Sie drei unverbundene Schemas. Mit ihnen haben Sie einen Graphen, der sagt: "Diese Seite handelt von dieser Organisation, die diese Website betreibt." Eine AI-Engine, die die Seite zusammenfassen will, hat jetzt eine getypte Entität, auf die sie zeigen kann, statt eines Fließtext-Blobs, den sie interpretieren muss.

Was wir in den sechs Audits tatsächlich gesehen haben

Carwow hatte Vehicle- und Product-Schema fast überall, weil das Marketplace-Geschäft das verlangt — ohne Produkt-Strukturdaten kann das Inventar nicht in Google Shopping oder Rich Results erscheinen, also hat das Unternehmen Schema früh ausgeliefert. Die anderen fünf Marken stießen gegen dieselbe Wand: technisch sauberes HTML, modernes responsives Design, und fast kein JSON-LD über die implizite WebSite-Form hinaus, die manche CMS-Plugins per Default emittieren. Keine hatte einen Organization-Block mit sameAs-Referenzen auf Wikidata oder LinkedIn. Keine hatte BreadcrumbList. Die HDBW hatte EducationalOrganization-Referenzen in HTML-Attributen, aber nicht in einem JSON-LD-Block — was das Schlechteste aus beiden Welten ist: für einen menschlichen Leser sichtbar, der den Quelltext inspiziert, für einen Maschinenleser unsichtbar, der das Standardformat erwartet.

Der Fix war in jedem Fall derselbe Fünf-Tage-Workstream: einen zentral injizierten @graph-Block ins Layout-Template einbauen, ihn aus den vorhandenen CMS-Feldern befüllen, BreadcrumbList auf Innenseiten ergänzen, FAQPage in den Kundenfragen-Sektionen ergänzen, wo es welche gab. Keine dieser Seiten brauchte neuen Content. Sie brauchten den Content, den sie schon hatten, in einer parsbaren Form ausgeliefert. Der Schema-Score in einem Re-Scan acht Wochen später bewegte sich von 11 % auf 70-80 % bei den Marken, die den Fix ausgeliefert haben.

Die andere Lehre aus den Audits ist, dass Schema-Markup zerfällt. Carwow hatte sauberes Produkt-Schema und dann eine CMS-Migration vor zwei Jahren, die die Hälfte davon kaputt gemacht hat. Das Team ist gut. Das System ist gut. Niemand hatte eine quartalsweise Prüfung, ob das Schema noch korrekt emittiert wird, und so wuchs die Regression still. Die Gegenmaßnahme dafür ist kein schwereres Tool; es ist ein Kalendereintrag pro Quartal, der sagt: "Schema auf den Top-Zehn-Seiten validieren." Die billigste Mess-Routine schlägt den teuersten Einmal-Fix.

Wie man validiert

Drei Tools, in dieser Reihenfolge. Googles Rich Results Test für den Per-Seite-Sanity-Check — bestätigt, dass das JSON-LD parst und der Typ einer ist, den Google erkennt. Der Validator von Schema.org für den strikten Spec-Konformitäts-Check — fängt subtile Fehler wie ein fehlendes @context oder einen falsch geschriebenen Typnamen. Dann ein Crawler mit Strukturdaten-Extraktion (wir nutzen die @type-Extraktion in unserer eigenen AI Visibility Engine; Screaming Frog hat ebenfalls eine JSON-LD-Spalte), um die Abdeckung über die ganze Site zu sehen, nicht nur auf einer URL. Die meisten Teams hören nach dem Per-Seite-Check auf, übersehen, dass das Staging-Template Schema ausliefert, das Production-Template aber nicht, und merken es erst Wochen später, wenn ein Re-Audit die Lücke zeigt.

Der Validierungs-Schritt, der mehr zählt als jedes Tool, ist der Roundtrip-Test gegen eine echte AI-Engine. Öffnen Sie ChatGPT, Claude oder Perplexity in einem privaten Fenster, fragen Sie "Fasse zusammen, was [Firmenname] macht", und lesen Sie die Antwort. Wenn das Modell die Kategorie Ihres Wettbewerbers benennt und Ihre Startseite als Quelle zitiert, leistet das Schema Arbeit. Wenn das Modell Ihre Kategorie in drei Sätzen zusammenfasst, ohne Ihre Marke zu erwähnen, ist das Schema unsichtbar. Das ist eindeutig, kostenlos und reproduzierbar — und es ist der Test, der den Loop schließt, für den die SaaS-Dashboards Geld nehmen.

Drei Kaninchenlöcher, die nicht die Zeit wert sind

JSON-LD-Generatoren, die zwanzig Typen pro Seite emittieren. Manche Tools generieren Schemas für Person, ContactPoint, Place, OpeningHoursSpecification und ein Dutzend weitere auf jeder Seite. Mehr ist nicht besser. AI-Engines bevorzugen einen sauberen Graphen mit den sieben Typen oben gegenüber einem rauschigen Graphen mit zwanzig Typen und kaputten @id-Referenzen. Das Signal-Rausch-Verhältnis zählt mehr als das absolute Volumen.

Custom-Schema-Typen unter eigenem Namespace. Schema.org erlaubt Erweiterung über Custom-Typen. AI-Engines ignorieren in der Praxis alles außerhalb des öffentlichen Vokabulars. Bleiben Sie bei den Standard-Typen. Wenn Ihr Geschäft wirklich einen Typ braucht, der nicht existiert, schreiben Sie einen Schema.org-Erweiterungs-Vorschlag — aber liefern Sie die Standard-Typen in der Zwischenzeit aus, damit das Modell etwas zu zitieren hat.

Microdata oder RDFa statt JSON-LD. Alle drei Formate sind weiterhin gültig. JSON-LD ist das, was jede große AI-Engine mit der besten Genauigkeit liest. Microdata und RDFa sind Legacy-Formate, die manche CMSe per Default ausliefern. Sie zu migrieren ist ein Ein-Tages-Job und eine dauerhafte Verbesserung.

Die nächsten acht Wochen

Die Arbeit, sortiert nach Hebel: einen @graph-Block ins seitenweite Layout-Template einbauen mit Organization, WebSite, WebPage (ein Tag). BreadcrumbList auf Produkt-, Service- oder Insight-Seiten ergänzen (halber Tag). LocalBusiness ergänzen, wenn anwendbar, mit geo und address (halber Tag). FAQPage auf jede Seite mit Q&A-Sektion (halber Tag). Validatoren laufen lassen. Acht Wochen warten. Re-Scan. Wenn der Schema-Score sich bewegt hat und der Roundtrip-ChatGPT-Test anfängt, Ihre Startseite zu zitieren, liefern Sie dasselbe Muster auf den Rest der Site aus. Wenn nicht, ist das Problem nicht Schema; es ist einer der anderen zwei strukturellen Gründe aus dem ersten Beitrag — Crawler-Konfiguration oder Quellen-Abwesenheit. Diagnostizieren Sie entsprechend.

Der Audit-Run, den wir auf sechs Marken gemacht haben, ist gegen Ihre eigene Domain auf produktentdecker.com/ai-visibility reproduzierbar. Der Schema-Abschnitt des Reports zeigt genau, welche der sieben Typen vorhanden sind, welche fehlen und welche Seiten kaputtes JSON-LD ausliefern. Dieser Report ist der Input. Der Fünf-Tage-Workstream oben ist der Output. Der Re-Scan acht Wochen später ist der Beweis.