Aggregieren verknüpfter Daten
Verknüpfte Daten sind eine Möglichkeit, strukturierte Daten im Web zu veröffentlichen, mit denen Metadaten verbunden und angereichert werden können. This ensures that different representations of the same content can be found, and links made between related resources. Die Aggregierung verknüpfter Daten hat das Potenzial, Kostenvorteile zu bringen und die Dateninteroperabilität auf globaler Ebene zu verbessern, und im Rahmen des Projekts Europeana Common Culture wurde die Durchführbarkeit der Verwendung solcher verknüpften Daten für die Aggregation untersucht.
Europeana betreibt bereits ein skalierbares und nachhaltiges Metadatenaggregationsmodell für den Kulturerbesektor. Die Aggregierung verknüpfter Daten würde bedeuten, dass Datenanbieter ihre Metadaten leichter mit Aggregatoren des Kulturerbes teilen könnten, die verknüpfte Daten nutzten. Für Anbieter, die noch keine verknüpften Daten veröffentlichen, würde die Umsetzung für die Teilnahme an Europeana ihnen auch den Vorteil bieten, dass sie ihre verknüpften Daten für andere Anwendungen und andere Bereiche neben dem kulturellen Erbe wie Internet-Suchmaschinen verwenden können.
Zusammenarbeit mit Datenanbietern
Dieses Pilotprojekt lief von Mai 2019 bis Juni 2020. Es wurde vom Netherlands Institute for Sound and Vision (NISV) koordiniert und in enger Zusammenarbeit mit dem Dutch Digital Heritage Network (NDE) durchgeführt, das das Projekt durch die Bereitstellung von Wissen, Software und Infrastruktur für die Durchführung der Tests unterstützte. An dem Pilotprojekt nahmen drei Arten von Teilnehmern am Europeana-Ökosystem teil: Datenanbieter, Aggregatoren und die Europeana Foundation. Zwölf Datenanbieter schlossen sich dem Pilotprojekt an, aber nicht alle waren sich der technischen Herausforderungen bewusst, die dieser neuartige Ansatz mit sich bringen würde. Vier der Anbieter waren nicht in der Lage, einen Datensatz als verknüpfte Daten zu liefern, und zwei andere Anbieter lieferten Datensätze mit unzureichenden Daten für die Aggregation in Europeana.
In den sechs erfolgreichen Fällen verfügten fünf Anbieter bereits über internes Wissen oder eine bestehende Implementierung verknüpfter Daten, und zum einen war es ihr erster Versuch, verknüpfte Daten zu veröffentlichen. Unsere Schlussfolgerung ist, dass ein großes Interesse an der Implementierung verknüpfter Daten zwischen Datenanbietern besteht. Es erfordert jedoch ein erhebliches Maß an Ressourcen, wenn eine Organisation keine vorherige Erfahrung hat.
Pilotergebnisse
Bei dem Pilotprojekt wurde ein Ansatz für die Aggregation verknüpfter Daten angewandt, der auf zwei Spezifikationen für die Bereitstellung eines verknüpften Datensatzes für Europeana beruhte. Diese waren zuvor im Rahmen eines kleinen Pilotprojekts im Rahmen des Projekts „Aufstieg der Alphabetisierung“ erfolgreich gewesen.
Die erste Spezifikation ist, dass Metadaten auf Datensatzebene unter Verwendung bekannter Vokabulare bereitgestellt werden sollten. Es enthält die Arten von Datensatzverteilungen, die Datenanbieter verwenden können, und die erforderlichen Metadaten für jeden.
Eine zweite Spezifikation befasst sich mit der Verwendung von mit Schema.org verknüpften Daten zur Beschreibung von Kulturerbeobjekten gemäß den Anforderungen von Europeana und dem Europeana Data Model (EDM). Derzeit unterstützt Europeana nur die Aufnahme von Metadaten in EDM. Experimente zur Anwendung von Schema.org auf Metadatenbeschreibungen von Kulturerbeobjekten haben jedoch gezeigt, dass es qualitativ hochwertige Daten liefern kann, die in der Lage sind, die Anforderungen von Europeana zu erfüllen. Diese Spezifikation bietet eine allgemeine Anleitung für die Verwendung von Schema.org-Metadaten, die nach der Konvertierung in EDM zu Metadaten führen, die für die Aggregation durch Europeana geeignet sind.
Dieses Pilotprojekt führte auch zu einem Toolset für die verknüpfte Datenaggregation, das für die Verwendung durch Europeana-Aggregatoren und Aggregatoren anderer ähnlicher Netze entwickelt wurde. Obwohl die Toolset-Funktionalität auf das EDM zugeschnitten ist, können Aggregatoren, die andere Datenmodelle verwenden, ihre eigenen Konvertierungen und Validierungen hinzufügen, indem sie die vom Toolset implementierten Standards verwenden. Das Toolset basiert auf Docker-Containern, die die technische Unabhängigkeit seiner Tools bewahren, die Lösung für verschiedene Umgebungen portabel und skalierbar machen und die Möglichkeit bieten, das Toolset auf kleine oder große Sammlungen anzuwenden. Das Toolset und sein Quellcode sind in Github verfügbar.
Künftige Arbeiten
Es wurden eine Reihe von Bereichen für künftige Arbeiten ermittelt. Datenanbieter würden von Instrumenten zur Aufbereitung ihrer verknüpften Daten profitieren. Die im Toolset implementierten Validierungstools können auch bei der Erstellung von Diensten für Datenanbieter verwendet werden, die es ihnen ermöglichen, die Gültigkeit ihrer Daten in früheren Phasen der verknüpften Datenveröffentlichung zu überprüfen. Ein erster Schritt in diese Richtung wurde unternommen, indem die aggregierten verknüpften Daten mit der Europeana Metis Sandbox getestet wurden. Ein zweiter Arbeitsbereich, der 2021 beginnt, wird sich auf Komponenten für die Interoperabilität und die Integration des Toolset in die Systeme der Aggregatoren konzentrieren. Koordiniert wird diese Arbeit vom Niederländischen Institut für Klang und Vision im niederländischen Nationalprojekt Digitale Collectie.
Um mehr über verknüpfte Daten zu erfahren, schauen Sie sich unser Webinar vom Oktober 2020 über LODA - den Linked Open Data Aggregator an, und wenn Sie sich für das Thema interessieren und mehr Möglichkeiten wünschen, es zu diskutieren, treten Sie der EuropeanaTech-Community bei.
Dieser Beitrag wurde am 21. Januar 2021 bearbeitet, um Einzelheiten zu künftigen geplanten Arbeiten in diesem Bereich zu aktualisieren.
