wake-up-neo.com

Microdata, RDFa oder JSON-LD Angemessener oder bester Gebrauch?

Ich habe mich gefragt, welches dieser Formate "am besten" ist. Schema.org, Microdata und RDFa sind etwas schwierig zu implementieren. Sie können die Validierung brechen und erfordern einen erheblichen Aufwand, um Dokumente zu erstellen.

JSON-LD ist endlich für mich ein Weg, strukturierte Daten besser zu implementieren. Aber geht das? Welches Support-Level gibt es dafür (zumindest von Google)?

60
Grzegorz

Schema.org ist ein Vokabular, das wie jedes andere Vokabular in vielen Formen verwendet werden kann. Die Website http://schema.org/ enthält Beispiele für die Verwendung von Mikrodaten und RDF = Syntax RDFa und JSON-LD , aber dies sind nicht die einzigen Syntax, mit der es verwendet werden kann. Sie können es beispielsweise mit jedem anderen verwenden RDF Syntax wie Turtle oder RDF/XML .

Es gibt keine am besten Syntax. Sie alle haben Vor- und Nachteile. Siehe zum Beispiel meine Antwort zu nterschiede zwischen Mikrodaten und RDFa . Beachten Sie, dass Sie können verschiedene Syntaxen (und Vokabulare) verwenden im selben Dokument.

Wenn Sie nun einen bestimmten Verbraucher im Sinn haben, sollten Sie dessen Dokumentation zu Rate ziehen. Die Unterstützung von Syntaxen kommt und geht, und nicht alles, was sie möglicherweise unterstützen, muss dokumentiert sein, und nicht alles, was dokumentiert ist, muss funktionieren.

Im Falle von Google interessieren Sie sich wahrscheinlich für Rich Snippets. Ihr Dokumentation zu Rich Snippets erwähnt Microdata, Microformats und RDFa. Beachten Sie jedoch, dass nicht alle verknüpften Beispiele das Schema.org-Vokabular verwenden, sondern das ältere Data-vocabulary.org oder Mikroformate (da Sie Vokabulare wie Schema.org oder Data-vocabulary.org nicht mit Mikroformaten verwenden können). Es gibt auch einige Rich Snippets, die auf dieser Seite nicht aufgeführt sind, wie das Sitelinks-Suchfeld , für das sie sogar die JSON-LD-Syntax empfehlen.

Allgemeiner Hinweis: Suchmaschinen bevorzugen in der Regel sichtbare Inhalte gegenüber verborgenen Metadaten. Wenn beispielsweise Keywords als versteckte Metadaten vorliegen, können Autoren leicht behaupten, dass ihre Dokumente von etwas anderem handeln als sie wirklich sind (entweder, weil versucht wurde, die Suchmaschine auszutricksen, oder weil Autoren vergessen haben, den Inhalt in both Orte). Wenn Sie also die Metadaten vom Inhalt entkoppeln, wie dies bei JSON-LD der Fall ist, kann könnte (möglicherweise!) Zu denselben Problemen führen, die aktuelle Suchmaschinen mit ausgeblendeten Metadaten haben. (Wenn oder welche Suchmaschinen tatsächlich so damit umgehen, ist eine Frage, die bei Stack Overflow nicht zum Thema gehört.)

Ein weiterer möglicher Vorteil für die Kopplung der Metadaten mit dem Inhalt (z. B. mit RDFa) besteht darin, dass Sie in JSON-LD, Turtle usw. einfach und automatisch dieselben Informationen generieren können, da alles nur RDF ist. Analysieren Sie einfach das RDFa, konvertieren Sie es in ein von Ihnen gewünschtes Format und binden Sie es (in script) oder verknüpfen Sie es (mit rel-alternate), wenn es sinnvoll ist.

Ja, das Hinzufügen von RDFa ist häufig komplexer als das Hinzufügen eines JSON-LD-Blobs, da Sie es an das vorhandene Markup anpassen müssen. (Es sollte jedoch nicht "die Validierung unterbrechen", es sei denn, Sie machen Fehler.)

49
unor

Die Zeilen zwischen Microdata, RDFa und JSON-LD sind derzeit tatsächlich sehr verschwommen und es gibt immer noch kein weithin akzeptiertes de facto unter den dreien. Das muss jetzt warten. Vielleicht ein paar oder mehr Jahre.

Mittlerweile sollte Microdata nicht, wie Sie erwähnt haben, mit Schema.org gekennzeichnet werden, da sich diese beiden Dinge unterscheiden. Schema.org ist ein Vokabular, das für Microdata, RDFa und JSON-LD verwendet werden kann.

Die Verwendung von Schema.org als -Vokabular und die Verwendung von JSON-LD als Datenrepräsentation ist wahrscheinlich das am meisten erwartete Paar aufgrund zweier allgemeiner Aspekte:

  1. Für Menschen leicht lesbar; und
  2. Leicht maschinenlesbar

trotzdem gibt es immer noch Trennungen zwischen den beiden wie diesem Beispiel .

Bezüglich der JSON-LD-Unterstützung, da Bing, Google, Yahoo! und Yandex die Verwendung von schema.org anerkennen, ist es vielleicht sicher, dass sie es auch unterstützen, wie in diesem Beispiel .

2017 Update

Google war sehr aktiv bei der Werbung für JSON-LD-schema.org in den letzten paar oder drei Jahren.

16
Abel Callejo

Es sieht so aus, als ob sich Google auf die Verwendung von JSON-LD stützt, es jedoch nicht für jeden Anwendungsfall implementiert hat! 

Google ist dabei, JSON-LD-Unterstützung zu mehr .__ hinzuzufügen. Markup-Funktionen. Bisher wird JSON-LD für alle .__ unterstützt. Knowledge Graph-Funktionen, Sitelink-Suchfelder, Ereignis-Rich-Snippets, und Rezept-Rich-Snippets; Google empfiehlt die Verwendung von JSON-LD für diese Funktionen. Für die verbleibenden Rich Snippets-Typen und Breadcrumbs gilt Google empfiehlt die Verwendung von Mikrodaten oder RDFa.

http://developers.google.com/structured-data/schema-org

9
JeroenVdb

Google verwendet JSON-LD als Referenzbeispiel für Structured Data SEO für seinen Knowledge Graph (Unternehmen und Personen) . Siehe https://developers.google.com/structured-data/customize/overview

Ich persönlich verwende (vorerst) eine Kombination aus JSON-LD und Microdata für meine Websites.

Ich würde sagen, dass sie andere Möglichkeiten haben, um zu ermitteln, ob die Informationen, die Sie über JSON-LD bereitstellen, für ihre Suchmaschine relevant sind (z. B. wenn Ihre Seite tatsächlich darüber spricht, worüber sie angeblich spricht).

6
Arnaud Leyder

(Aktualisierung der Antworten!)

Über "Beliebtheit" siehe diese Frage/Antworten

Microdata ist heute das populärste: In einem Universum von 34 Millionen Domänen verwenden 5,63 Millionen (~ 17%) "Content Markup" (ich werde die Jargon markup) von RDFa (0,9 Millionen) verwenden, Microdata (2,5 Millionen) oder Microformats und weniger als die Hälfte verwenden getrennte Semantikdeskriptoren, wobei mit 2,12 Millionen (6%) der beliebteste JSON-LD ist.
PS: Wir bevorzugen "Statistiken pro Domäne" (statt Statistiken pro Seite), da Seiten in derselben Domäne im Allgemeinen die gleichen Vorlagen und andere Durchsetzungsmaßnahmen für lokale Behörden haben.

In einem Universum von "Domänen mit Semantik" (7,75 Millionen) lautet das statistische Profil:

  • 73% Markup semantisch
  • 27% getrennt semantisch 
  • (... Schnittpunkt als Mischung "Separate + Markup" kann zur Vereinfachung Null sein ...)

Faustregel im Jahr 2017

Verwenden Sie markup semantic mit Microdata und danach. Wenn Sie Maschinen etwas mehr ausdrücken möchten, use JSON-LD


Verwenden Sie markup semantic, weil es das beliebteste ist und weil markierte Inhalte von Menschen und Maschinen gleichzeitig überprüfbar/überprüfbar sind.

Wichtig: Denken Sie daran, dass Microdata, RDFa (ein W3C-Standard) und JSON-LD (ein W3C-Standard) (leicht) in RDF übersetzt werden können, sodass alle diese Formate kompatibel sind.


PS: Für HTML-Tabellen siehe auch W3Cs tabellarische Metadaten . Verwenden Sie für offene Nicht-HTML-Ressourcen als CSV-Dateien das RDF-kompatible Tabellendatenmodell von W3C und/oder Reibungslose Daten/Spezifikationen

5
Peter Krauss

Von Grund auf wäre JSON-LD der Weg zu gehen. Lassen Sie uns einen der Hauptschöpfer von JSON-LD , Manu Sporny, wiegen:

Der Wunsch nach besseren Web-APIs motivierte die Erstellung von JSON-LD, nicht das Semantic Web. Wenn Sie das Semantic Web zu einer .__ machen möchten. Realität, hör auf, den Fall dafür zu machen und verbringe deine Zeit damit etwas nützlicheres, wie zum Beispiel Maschinen intelligenter machen oder Menschen dabei helfen, Daten auf eine für sie nützliche Weise zu veröffentlichen.

Bei JSON-LD geht es darum, Daten auf eine Weise zu veröffentlichen, die nützlich/einfach zu implementieren ist, weil ...

es basiert auf Technologien, die heute von den meisten Webentwicklern verwendet werden.

0
Mac