Chcemy, aby ludzie mogli wyszukiwać, znajdować i wykorzystywać w internecie materiały związane z dziedzictwem kulturowym. Jest to łatwiejsze – i znacznie płynniejsze dla wszystkich – gdy pliki treści (zdjęcia, dokumenty tekstowe lub klipy audio/wideo) i towarzyszące im metadane (informacje o tym, czym jest przedmiot i skąd pochodzi) są dobrej jakości.
W ramach strategii Europeana na lata 2020–2025 będziemy nadal współpracować z agregatorami i dostawcami danych, aby inwestować w zasoby, działania i technologie - takie jak uczenie maszynowe i inne usługi wzbogacania - w celu poprawy jakości naszych metadanych i treści.
Nacisk na jakość
Pracując za pośrednictwem istniejących sieci agregatorów i przy wsparciu państw członkowskich UE, będziemy pracować nad tym, aby pomóc instytucjom zrozumieć, dlaczego dobre dane są ważne, i będziemy wspierać je w tworzeniu treści i metadanych o wyższej jakości. Opracujemy i wykorzystamy ramy wydawnicze Europeana, aby wspierać sposób, w jaki instytucje współpracują z nami, produkują i ulepszają materiały, którymi się z nami dzielą.
Będziemy prezentować wysokiej jakości treści za pośrednictwem redakcji i kampanii Europeany, a także opracujemy samą platformę, aby położyć większy nacisk na nasze instytucje partnerskie i zapewnić, aby dobre wyniki były widoczne dla wszystkich.
Cosmina Berta z Niemieckiej Biblioteki Cyfrowej i członkini Komitetu ds. Jakości Danych Europeany mówi: „Największym wyzwaniem dla praktyków metadanych jest zdefiniowanie jakości danych i wdrożenie wskaźników jakości danych, zwłaszcza że scenariusze wykorzystania danych zmieniają się w czasie. Mam nadzieję, że dzięki tej strategii uda nam się osiągnąć większy konsensus w zakresie definiowania i pomiaru jakości danych oraz zdefiniować jaśniejszą koncepcję ich wdrażania. Jestem wielkim fanem normalizacji i w moim idealnym świecie normalizacja odegra większą rolę w definiowaniu i osiąganiu jakości danych.
„Jeżeli zdefiniujemy cele, które chcemy osiągnąć – „co” i „do czego” – wówczas „jak” można łatwiej określić, wdrożyć i znormalizować. Agregatory są tutaj ważne. Instytucje mogą wówczas lepiej docierać do swoich odbiorców i realizować ogólne cele badawcze i edukacyjne”.
Lepsze połączenie
Gdy treści kulturowe i metadane są przygotowywane w znormalizowany sposób, bez względu na to, która instytucja je tworzy, mogą być wykorzystywane w wielu różnych systemach, a nie tylko na platformie Europeana. Instytucje dziedzictwa kulturowego mogą korzystać na przykład z interoperacyjności ze zbiorami pochodzącymi z innych instytucji lub powiązań z inicjatywami międzynarodowymi, takimi jak Wikidata.
W tym przypadku stosowanie standardowych powiązanych formatów danych w połączeniu z poprawą wielojęzyczności doprowadzi do lepszego połączenia zbiorów Europeany z innymi platformami i usługami.
Henning Scholz, partner i kierownik operacyjny Fundacji Europeana, mówi: „Dzięki wydaniu komponentu metadanych Europeana Publishing Framework latem 2019 r. wielojęzyczność stała się integralną częścią naszej koncepcji jakości danych. Wyjaśnienie, w jakim języku dostarczane są metadane, ułatwi tłumaczenie maszynowe metadanych, dzięki czemu nasze dziedzictwo będzie dostępne we wszystkich językach UE. Przed nami jeszcze długa droga, ale jeśli będziemy mogli skupić się na oznaczaniu kluczowych pól metadanych odpowiednim językiem, możemy poczynić znaczne postępy w ciągu najbliższych dwóch lat”.
Wykorzystanie technologii - i siły ludzi - do wzbogacania danych
Ręczna poprawa jakości metadanych milionów rekordów z różnych źródeł wymaga ogromnej ilości czasu i zasobów. Zastosowanie narzędzi sztucznej inteligencji i uczenia maszynowego w połączeniu z wiedzą ludzką dostarczaną zarówno przez ekspertów w danej dziedzinie, jak i kampaniami crowdsourcingowymi (np. EnrichEuropeana i CrowdHeritage)stanowi niezwykłą okazję do poprawy jakości metadanych.
Będziemy pracować nad sposobami wzbogacania metadanych i wykonywania zadań związanych z danymi automatycznie, półautomatycznie lub przy użyciu siły tłumu.
