Wir möchten, dass die Menschen in der Lage sind, Kulturgut online zu suchen, zu finden und zu nutzen. Das ist einfacher – und für alle viel reibungsloser –, wenn die Inhaltsdateien (Bilder, Textdokumente oder Audio-/Videoclips) und die dazugehörigen Metadaten (Informationen darüber, was das Element ist und woher es kommt) von guter Qualität sind.
Im Rahmen der Strategie Europeana 2020-2025 werden wir weiterhin mit Aggregatoren und Datenanbietern zusammenarbeiten, um in Ressourcen, Aktivitäten und Technologien - wie maschinelles Lernen und andere Anreicherungsdienste - zu investieren, um unsere Metadaten und Inhalte zu verbessern.
Fokus auf Qualität
In Zusammenarbeit mit bestehenden Aggregatorennetzen und mit Unterstützung der EU-Mitgliedstaaten werden wir daran arbeiten, die Institutionen dabei zu unterstützen, zu verstehen, warum gute Daten wichtig sind, und wir werden sie dabei unterstützen, qualitativ hochwertigere Inhalte und Metadaten zu erstellen. Wir werden den Europeana Publishing Framework entwickeln und nutzen, um zu unterstützen, wie Institutionen mit dem Material, das sie mit uns teilen, arbeiten, es produzieren und verbessern.
Wir werden hochwertige Inhalte über die Leitartikel und Kampagnen von Europeana präsentieren und die Plattform selbst entwickeln, um unseren Partnerinstitutionen mehr Gewicht zu verleihen und sicherzustellen, dass gute Ergebnisse für alle sichtbar sind.
Cosmina Berta von der Deutschen Digitalen Bibliothek und Mitglied des Data Quality Committee von Europeana sagt: „Die größten Herausforderungen für Metadaten-Praktiker sind die Definition der Datenqualität und die Implementierung von Datenqualitätsmetriken, insbesondere weil sich die Datennutzungsszenarien im Laufe der Zeit ändern. Ich hoffe, dass wir durch diese Strategie mehr Konsens über die Definition und Messung der Datenqualität erreichen und ein klareres Konzept für deren Umsetzung definieren können. Ich bin ein großer Fan von Standardisierung und in meiner idealen Welt wird Standardisierung eine größere Rolle bei der Definition und Erreichung der Datenqualität spielen.
„Wenn wir die Ziele definieren, die wir erreichen wollen – das „Was“ und das „Zu welchem Zweck“ –, kann das „Wie“ leichter skizziert, umgesetzt und standardisiert werden. Aggregatoren sind hier wichtig. Die Einrichtungen können dann ihr Publikum besser erreichen und ihre allgemeinen Forschungs- und Bildungszwecke vorantreiben.“
Bessere Vernetzung
Wenn kulturelle Inhalte und Metadaten auf standardisierte Weise erstellt werden, unabhängig davon, welche Institution sie erstellt, können sie in und über eine Vielzahl von Systemen hinweg verwendet werden, nicht nur auf der Europeana-Plattform. Einrichtungen des Kulturerbes können beispielsweise von der Interoperabilität mit Sammlungen anderer Einrichtungen oder Verbindungen zu internationalen Initiativen wie Wikidata profitieren.
Hier wird die Verwendung standardisierter verknüpfter Datenformate in Verbindung mit Verbesserungen der Mehrsprachigkeit zu einer besseren Verbindung der Sammlungen von Europeana mit anderen Plattformen und Diensten führen.
Henning Scholz, Partner und Operations Manager der Europeana Foundation, sagt: „Mit der Veröffentlichung der Metadatenkomponente Europeana Publishing Framework im Sommer 2019 haben wir die Mehrsprachigkeit zu einem integralen Bestandteil unseres Konzepts der Datenqualität gemacht. Wenn klargestellt wird, in welcher Sprache die Metadaten bereitgestellt werden, wird die maschinelle Übersetzung von Metadaten erleichtert und unser Erbe in allen EU-Sprachen zugänglich gemacht. Wir haben noch einen langen Weg vor uns, aber wenn wir uns darauf konzentrieren können, wichtige Metadatenfelder mit der richtigen Sprache zu versehen, können wir in den nächsten zwei Jahren gute Fortschritte machen.“
Nutzung von Technologie - und People Power - zur Anreicherung von Daten
Die manuelle Verbesserung der Metadatenqualität von Millionen von Datensätzen aus verschiedenen Quellen erfordert viel Zeit und Ressourcen. Die Anwendung von Instrumenten der künstlichen Intelligenz und des maschinellen Lernens in Kombination mit menschlichem Wissen, das sowohl von Domänenexperten als auch von Crowdsourcing-Kampagnen bereitgestellt wird (denken Sie an EnrichEuropeana und CrowdHeritage),bietet eine bemerkenswerte Gelegenheit, die Qualität von Metadaten zu verbessern.
Wir werden an Möglichkeiten arbeiten, Metadaten anzureichern und datenbezogene Aufgaben automatisch, halbautomatisch oder mithilfe der Stärke der Menge auszuführen.
