Habt ihr euch schon einmal gefragt, wieso Google manche organische Suchergebnisse nicht nur besser, sondern auch auffälliger platziert und interpretieren kann? Wer das Prinzip dahinter verstehen will, sollte sich mit schema.org beschäftigen.

Schema.org – wichtig für Suchmaschinenoptimierung

Im Studiengang Content-Strategie haben wir von Martin Höllinger viel darüber gehört, wie wir unsere Seiten bei Google besser platzieren können. Und Ursula Kronenberger hat uns gelehrt, wie wir ansprechende suchmaschinenoptimierte Texte für die richtige Zielgruppe schreiben.

Das alles reicht aber nicht, um unseren Text so suchmaschinenfreundlich wie möglich zu machen. Denn Suchmaschinen können – obwohl sie sehr gut darin sind, Content zu lesen – diesen nicht von selbst im Detail interpretieren. Man kann ihnen aber dabei helfen und ihnen semantische Informationen zu den Inhalten übergeben, sodass sie die passenden Ergebnisse besser finden und nutzerfreundlicher darstellen, also z.B. ein Rezept als Rezept erkennen und anzeigen.

Dazu haben Google, Yahoo, Microsoft und Yandex 2011 schema.org aus Eigeninitiative ins Leben gerufen und sponsern es auch. Damit könnt ihr Content mit strukturierten Daten maschinenlesbar auszeichnen. Schema.org funktioniert nach dem Prinzip Geben und Nehmen: Die Suchmaschinenbetreiber erhalten Daten und als “Belohnung” bekommen die Webmaster exklusive Platzierungen.

Auch wenn schema.org längst kein Geheimtipp mehr ist, nutzen nicht alle Webseitenbetreiber diese Möglichkeit; dabei wäre die Verwendung laut SEO-Experten mittlerweile obligatorisch. Grund genug, um auch die Content-Strategen dafür zu sensibilisieren. Daher befassen wir uns im Studiengang Content-Strategie in Lehrveranstaltungen wie XML and Content Management mit diesen und anderen technischen Aspekten.

Microdaten, RDFa und JSON

Die gute Nachricht für alle Content-Strategen, die nicht programmieren können: Um schema.org zu verwenden, sind keine speziellen Programmierkenntnisse nötig. Es ist aber von Vorteil, das Prinzip dahinter zu verstehen – insbesondere für Content-Strategen, die sich intensiver mit Suchmaschinenoptimierung beschäftigen. Leider ist das in der Praxis (noch) zu selten der Fall. Dabei sind SEO-Kenntnisse für den Erfolg einer Content-Strategie unentbehrlich.

Durch die korrekte Verwendung von HTML erkennen die Suchmaschinen zwar Überschriften, Bilder, Listen und andere Elemente, jedoch nicht, um welche Art von Inhalten es geht. Ein Foto eines Produkts ist für die Suchmaschine nur ein Foto; ohne schema.org-Auszeichnungen kann die Suchmaschine keine Beziehung zu einem bestimmten Produkt herstellen. Oder die Firmenadresse: Hier erkennt die Suchmaschine aufgrund des bloßen Textes nicht, dass sie sich auf einer Karte lokalisieren lässt.

Auf schema.org findet man standardisierte Vokabulare für verschiedene Inhaltstypen wie Personen, Produkte und Events. Um HTML-Dokumente mit diesen Vokabularen auszuzeichnen, gibt es verschiedene technische Optionen: Mikrodaten, RDFa und JSON. Google empfiehlt inzwischen, JSON zu verwenden.

Microdata sind eine einfache und gut lesbare Methode, HTML-Inhalte ohne großen Aufwand semantisch auszuzeichnen und zu strukturieren. Sie sind ein Bestandteil von HTML5 und eine Erweiterung von HTML.

Anders als Microdata sind RDF-Daten erweiterbar und kombinierbar. Dieser Vorteil geht allerdings zu Lasten der Einfachheit. RDF ist ein Standard für jede Art von semantischer Information, die dabei nach dem Muster Subjekt/Prädikat/Objekt in Tripeln organisiert wird. RDF kann mit XML ausgedrückt werden, ist aber in HTML integrierbar.

Das Datenformat JSON (= JavaScript Object Notation) ist eine Alternative zu XML, um strukturierte Daten auszutauschen. Python und andere Programmiersprachen können JSON lesen. JSON-LD (JSON Linked-Data) steht für verlinkte, also strukturierte Daten. Um strukturierte Informationen auf diesem Weg in eine Website zu integrieren, gibt es zum Beispiel den JSON-LD Schema Generator For SEO.

Bei schema.org findet man für die verschiedenen Schemas, z.B. Product, Beispiele in allen drei syntaktischen Versionen, also als Microdata, RDFa und JSON-LD. Von den Suchmaschinen werden alle drei verstanden.

Microformats waren die Vorgänger der Microdata und sind eine Alternative zu den bei schema.org definierten Inhaltstypen und zu ihrer Syntax. Microformats legen also sowohl eine Syntax (wie werden die Informationen im HTML dargestellt?) als auch die Vokabulare bzw. Inhaltstypen (welche Informationen werden dargestellt?) selbst fest, die mit dieser Syntax erfasst werden. Die schema.org-Vokabulare zu verwenden und Dokumente mit Microdata, JSON oder RDFa auszuzeichnen, hat gegenüber Mikroformaten einige Vorteile, wie die Integration in HTML5, größere Aktualität und Vielfalt von Inhaltstypen. Einige Microformats sind aber weit verbreitet, und gelten oft auch als einfacher als die bei schema.org festgelegten Vokabulare.

Google und andere Suchmaschinen interpretieren die strukturierten Inhalte in allen diesen Formaten und zeigen Suchergebnisse entsprechend geordnet z.B. in Form von Rich Snippets oder Rich Cards an. Die semantische Auszeichnung ermöglicht es, dass zusätzlich auch noch Daten aus anderen Quellen dargestellt werden, etwa die Bewertungen eines Hotels mit Sternen. Google bietet das Structured Data Testing Tool an, um strukturierte Daten einer Website zu optimieren.

Welche Daten kann man auszeichnen?

Für Webseitenbetreiber ist es in jedem Fall ratsam, über das eigene Unternehmen mit strukturierten Daten zu informieren. Dazu zählen etwa Name und Kurzbeschreibung des Unternehmens, Adresse und Telefonnummer. Für diese Informationen gibt es die Schemas Organization, Corporation und LocalBusiness.

Darüber hinaus können Publisher unter anderem folgende Daten auszeichnen:

Diese Mikrodaten haben die Suchmaschinenbetreiber teilweise nochmals unterteilt und weiter spezifiziert. So gibt es für den Bereich Organisation die Unterkategorien Airline, Corporation, EducationalOrganization, GovernmentOrganization, LocalBusiness, MedicalOrganization, NGO, PerformingGroup, SportsOrganization. Davon könnt ihr manche noch detaillierter definieren; beispielsweise können EducationalOrganizations aufgeliedert werden in CollegeOrUniversity, ElementarySchool, HighSchool, MiddleSchool und Preschool School.

Die vollständigen Schemas findet ihr hier.

Praxisbeispiele für den Einsatz von Schema.org

Ein klassisches Beispiel für den Einsatz von schema.org ist die Semantik für Events. Der Vorteil: Google und andere Suchmaschinen können dank der Markups diese Events, wie oben beschrieben, klassifizieren, d.h. sie erkennen nicht nur einen x-beliebigen Text, sondern wissen, dass es sich dabei um die Darstellung einer Veranstaltung handelt. Die Suchmaschinen interpretieren den Inhalt und heben ihn in den Ergebnissen entsprechend hervor – zum Beispiel im Bereich “Kommende Veranstaltungen”.

Arenavie.com-Events erstellt mit einem Plug-in

Arena Veranstaltungen im Juli 2016: http://arenavie.com/web/events/ – umgesetzt mit espresso-calendar Plugin für WordPress.

Prinzipiell ist es immer möglich, manuell oder mit einem Tool wie dem Schema-Creator passenden Code für strukturierte Daten zu generieren und ihn in den HTML-Quellcode der eigenen Website zu integrieren. In der Praxis bedienen sich Webmaster jedoch häufiger Plug-Ins, die für Drupal, WordPress und andere Content-Management-Systeme zur Verfügung stehen.

Wie sieht der dazugehörige Code konkret aus und aus welchen Teilen besteht er? Um das zu veranschaulichen, habe ich mit Schema Creator einen Code für ein Event der FH Joanneum erstellt. Ich habe Name, Beschreibung, Datum, Uhrzeit und Adresse eingetragen. Herausgekommen ist ein Code mit den Elementen itemscope, itemtype und itemprop. Diese drei Elemente kommen in jedem schema.org Code vor.

<div itemscope itemtype=“http://schema.org/EducationEvent”>
<a itemprop=“url” href=“www.fh-joanneum.at”><div itemprop=“name”><strong>E-Learning Tag an der FH JOANNEUM Graz</strong></div>
</a>
<div itemprop=“description”>E-Learning: Warum nicht? Eine kritische Auseinandersetzung.</div>
<div><meta itemprop=“startDate” content=“2016–09–15T08:30”>Starts: 09/15/2016 08:30AM</div>
</div>
<div itemprop=“location” itemscope itemtype=“http://schema.org/PostalAddress”>
<div itemprop=“streetAddress”>Alte Poststraße 149</div>
<div><span itemprop=“addressLocality”>Graz</span>, <span itemprop=“addressRegion”>Styria</span></div><div itemprop=“postalCode”>8020</div>
<div itemprop=“addressCountry”>Austria</div>
</div>

itemscope definiert ein neues Item für Mikrodaten. Nach dem itemscope folgt immer der Typ mittels itemtype. Und itemprop steht für Properity (=Eigenschaft). Dahinter folgt der Bezeichnername, also z.B. “location” oder “streetAddress”.

Neuste Entwicklungen im Bereich strukturierte Daten

Das Magazin The SEM Post berichtete Ende Juni 2016 , dass Google Tabellen im <table>-Format auch ohne strukturierte Daten auslesen kann, wenn dieser Tabelle Javascript zugrunde liegt. Jedoch empfehlen SEO-Experten, div-Elemente und CSS statt Tabellen für die Strukturierung zu verwenden. Zudem ist man mit schema.org auf der sicheren Seite.

Schema.org für mobile-Versionen: Google Rich Cards

Google Rich Cards im Vergleich zu Standard–Ergebnissen und Rich Snippets. Originalquelle: Google, https://webmasters.googleblog.com/2016/05/introducing-rich-cards.html

Mit Rich Cards kündigte Google im Mai 2016 den mobilen Nachfolger der Rich Snippets an. Der Vorteil: Suchergebnisse werden auf Smartphones attraktiver dargestellt – siehe Bild oben. Vorerst gibt es Rich Cards für Rezept- und Film-Content.

Neu ist auch, dass Google die Accelerated Mobile Pages im News Carousel anzeigen lässt. Das ist speziell für Publisher interessant, die es bisher noch nicht geschafft haben, in den Google News zu erscheinen. Denn mit AMP-Seiten sind sie eventuell trotzdem vertreten – allerdings nur dann, wenn die Content-Verantwortlichen die Daten zuvor korrekt ausgezeichnet haben, wie es hier beschrieben wird. User erkennen AMP-Seiten, die übrigens deutlich schneller laden als normale mobile Seiten, an dem Blitz-Symbol.

Weiterführende Quellen

Bradley, A. (2016, Juni). What’s New With Markup and Structured Data. Seattle, Washington.
Bradley, A. (2013, November 5). Basic Vocabulary for schema.org and Structured Data
Guha, R. V. (2013, Oktober). ▶ Light at the End of the Tunnel. Gehalten auf der 12th International Semantic Web Conference (ISWC), Sydney 2013.

Header-Bild: Copyright: https://www.flickr.com/photos/derstulle/6221524830/

Merken

Related Posts