Konsortium plant Herkunftsinformationen für Webdaten

Metadaten sollen künftig Auskunft darüber geben, woher welche Informationen stemmen oder wie sie zustande gekommen sind. Dazu hat das W3C in den letzten Monaten nach und nach sechs Entwürfe vorgelegt.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 1 Min.
Von
  • Henning Behme

Auf insgesamt acht Spezifikationen hat eine Arbeitsgruppe des World Wide Web Consortium (W3C) seine Arbeit an der sogenannten Provenance (Herkunft) angesetzt, von denen jetzt sechs vorliegen. Das Konsortium will damit Metadaten für das Einordnen von Informationen vorgeben beziehungsweise ermöglichen – vor allem für solche, die in zusammengesetzten Dokumenten auftauchen.

Herkunftsdatensätze sollen beschreiben, wie Dokumententeile entstanden sind (Autor, Bildquelle et cetera), sodass künftig Webtools beispielsweise ermitteln können, wer ein Bild fotografiert hat und welche Zeitschrift es druckt oder ins Web stellt. Andere Perspektiven wären, die Bestandteile einer aus Datenbanken, einem Artikel sowie Zitate aus Interviews oder Statistiken zu belegen. Im Open-Data-Umfeld hieße das beispielsweise, dass nachvollziehbar wäre, aus welchen öffentlichen Daten jemand seine Webseiten zusammenstellt.

Im Herbst vorigen Jahres waren erste Entwürfe veröffentlicht worden: das Datenmodell (PROV-DM) und die Ontologie (PROV-O), später außerdem die Einführung (PROV-PRIMER). Hinzugekommen sind bis jetzt die Einschränkungen, das Datenmodell betreffend (DM-CONSTRAINTS) sowie eine fürs Lesen durch Menschen geeignete Notation (PROV-N). Außerdem liegt seit Januar ein Entwurf dafür vor, wie Webtools solche Herkunftsdaten erfragen können (PROV-AQ). Und in der Planung befinden sich noch die formale Semantik sowie ein XML-Schema des Datenmodells. (hb)