Agregace propojených údajů
Propojená data jsou způsob publikování strukturovaných dat na webu, který umožňuje propojení a obohacení metadat. Tím je zajištěno, že lze nalézt různá zobrazení stejného obsahu a odkazy mezi souvisejícími zdroji. Agregace propojených dat má potenciál přinést nákladové přínosy a zlepšit interoperabilitu dat v celosvětovém měřítku a projekt společné kultury Europeana zkoumal proveditelnost použití těchto propojených dat pro agregaci.
Europeana již provozuje škálovatelný a udržitelný model agregace metadat pro odvětví kulturního dědictví. Agregace propojených dat by znamenala, že poskytovatelé dat by mohli snadněji sdílet svá metadata s agregátory kulturního dědictví, kteří propojená data využili. Poskytovatelům, kteří dosud nezveřejňují propojené údaje, by jejich zavedení pro účast v Europeaně rovněž poskytlo výhodu v tom, že by mohli používat své propojené údaje pro jiné aplikace a s jinými oblastmi kromě kulturního dědictví, jako jsou internetové vyhledávače.
Spolupráce s poskytovateli dat
Tento pilotní projekt probíhal od května 2019 do června 2020. Projekt byl koordinován Nizozemským institutem pro zvuk a vize (NISV) a realizován v úzké spolupráci s nizozemskou sítí pro digitální dědictví (NDE), která projekt podpořila poskytnutím znalostí, softwaru a infrastruktury pro provádění testů. Pilotní projekt zahrnoval tři typy účastníků ekosystému Europeany: poskytovatelé údajů, agregátoři a nadace Europeana. Do pilotního projektu se zapojilo dvanáct poskytovatelů údajů, ale ne všichni si byli plně vědomi technických problémů, které tento nový přístup přinese. Čtyři z poskytovatelů nebyli schopni dodat datový soubor jako propojené údaje a dva další poskytovatelé dodali datové soubory s nedostatečnými údaji pro agregaci do Europeany.
V šesti úspěšných případech již pět poskytovatelů mělo interní znalosti nebo stávající implementaci propojených dat a v jednom případě se jednalo o první snahu o zveřejnění propojených dat. Náš závěr je, že existuje velký zájem o implementaci propojených dat mezi poskytovateli dat. Vyžaduje však značnou úroveň zdrojů, pokud organizace nemá žádné předchozí zkušenosti.
Výsledky pilotního projektu
Pilotní projekt uplatnil přístup k agregaci propojených údajů založený na dvou specifikacích pro vytvoření propojeného datového souboru pro Europeanu. Ty byly dříve úspěšné pro pilotní projekt malého rozsahu v rámci projektu Rise of Literacy.
První specifikace spočívá v tom, že metadata na úrovni datových souborů by měla být poskytována pomocí dobře známých slovníků. Zahrnuje druhy distribucí datových souborů, které mohou poskytovatelé dat používat, a požadovaná metadata pro každou z nich.
Druhá specifikace se zabývá použitím propojených dat Schema.org pro popis předmětů kulturního dědictví podle požadavků Europeany a datového modelu Europeany (EDM). V současné době Europeana podporuje pouze požití metadat v EDM. Experimenty s aplikací Schema.org na popisy metadat objektů kulturního dědictví však ukázaly, že může poskytnout kvalitní údaje, které jsou schopny splnit požadavky Europeany. Tato specifikace poskytuje obecnou úroveň pokynů pro použití metadat Schema.org, která po konverzi na EDM povedou k metadatům vhodným pro agregaci Europeanou.
Výsledkem tohoto pilotního projektu byl rovněž soubor nástrojů pro propojenou agregaci dat, který je navržen pro použití agregátory Europeany a agregátory jiných podobných sítí. Ačkoli je funkce sady nástrojů přizpůsobena pro EDM, agregátory používající jiné datové modely mohou přidávat své vlastní konverze a validace pomocí standardů zavedených sadou nástrojů. Sada nástrojů je založena na kontejnerech Docker, které zachovávají technickou nezávislost svých nástrojů, díky čemuž je řešení přenositelné do různých prostředí a škálovatelné, což umožňuje aplikovat sadu nástrojů na malé nebo velké sbírky. Sada nástrojů a její zdrojový kód jsou k dispozici v databázi Github.
Budoucí práce
Byla určena řada oblastí pro budoucí práci. Poskytovatelé údajů by měli prospěch z nástrojů pro přípravu svých propojených údajů. Validační nástroje zavedené v souboru nástrojů lze rovněž použít při vytváření služeb pro poskytovatele dat, což jim umožní kontrolovat platnost jejich dat v dřívějších fázích zveřejňování propojených dat. První krok tímto směrem byl proveden testováním agregovaných propojených údajů pomocí pískoviště Europeana Metis. Druhá oblast činnosti zahájená v roce 2021 se zaměří na složky pro interoperabilitu a integraci souboru nástrojů do systémů agregátorů. Tato práce bude koordinována Nizozemským institutem pro zvuk a vizi v nizozemském národním projektu Digitale Collectie.
Chcete-li se dozvědět více o propojených datech, sledujte náš webinář z října 2020 o LODA - agregátoru propojených otevřených dat, a pokud vás téma zajímá a chcete mít více příležitostí o něm diskutovat, připojte se ke komunitě EuropeanaTech.
Tento příspěvek byl dne 21. ledna 2021 upraven za účelem aktualizace podrobností o budoucích plánovaných pracích v této oblasti.
