Összekapcsolt adatok összesítése
A kapcsolt adatok a strukturált adatok interneten történő közzétételének olyan módja, amely lehetővé teszi a metaadatok összekapcsolását és gazdagítását. Ez biztosítja, hogy ugyanazon tartalom különböző reprezentációi megtalálhatók legyenek, és linkek legyenek a kapcsolódó erőforrások között. Az összekapcsolt adatok összesítése költségelőnyökkel járhat és javíthatja az adatok globális szintű interoperabilitását, és az Europeana Közös Kultúra projekt megvizsgálta az ilyen összekapcsolt adatok összesítésre való felhasználásának megvalósíthatóságát.
Az Europeana már most is skálázható és fenntartható metaadat-összevonási modellt működtet a kulturális örökség ágazatában. Az összekapcsolt adatok összesítése azt jelentené, hogy az adatszolgáltatók könnyebben megoszthatnák metaadataikat az összekapcsolt adatokat felhasználó kulturális örökségi aggregátorokkal. Azon szolgáltatók számára, amelyek még nem tesznek közzé összekapcsolt adatokat, az Europeanában való részvétel céljából történő végrehajtás azzal az előnnyel is járna, hogy összekapcsolt adataikat más alkalmazásokban és a kulturális örökség mellett más területeken, például internetes keresőprogramokban is felhasználhatnák.
Együttműködés az adatszolgáltatókkal
Ez a kísérleti projekt 2019 májusától 2020 júniusáig tartott. A projektet a Netherlands Institute for Sound and Vision (NISV) koordinálta, és a Holland Digitális Örökség Hálózattal (NDE) szoros együttműködésben valósították meg, amely a tesztek elvégzéséhez szükséges tudás, szoftver és infrastruktúra biztosításával támogatta a projektet. A kísérleti projektben háromféle résztvevő vett részt az Europeana ökoszisztémájában: adatszolgáltatók, aggregátorok és az Europeana Alapítvány. Tizenkét adatszolgáltató csatlakozott a kísérleti projekthez, de nem mindegyikük volt teljesen tisztában azokkal a technikai kihívásokkal, amelyeket ez az új megközelítés jelentene. Négy szolgáltató nem tudott összekapcsolt adatként adatkészletet szolgáltatni, két másik szolgáltató pedig olyan adatkészletet szolgáltatott, amely nem rendelkezett elegendő adattal az Europeanába való összesítéshez.
A hat sikeres esetben öt szolgáltató már rendelkezett házon belüli ismeretekkel vagy az összekapcsolt adatok meglévő végrehajtásával, és egy esetben ez volt az első erőfeszítése az összekapcsolt adatok közzétételére. Következtetésünk az, hogy az adatszolgáltatók körében nagy az érdeklődés az összekapcsolt adatok bevezetése iránt. Jelentős erőforrásokra van azonban szükség, ha egy szervezet nem rendelkezik korábbi tapasztalattal.
Kísérleti eredmények
A kísérleti projekt az összekapcsolt adatösszesítésre vonatkozó megközelítést alkalmazott, amely az Europeana összekapcsolt adatkészletének biztosítására vonatkozó két előíráson alapult. Ezek korábban sikeresnek bizonyultak a „Rise of Literacy” (Az írni-olvasni tudás felemelkedése) elnevezésű kisléptékű kísérleti projektben.
Az első specifikáció az, hogy az adatkészlet szintű metaadatokat jól ismert szótárak használatával kell biztosítani. Magában foglalja az adatszolgáltatók által használható adatkészlet-eloszlások típusait, valamint az egyes adatkészletekhez szükséges metaadatokat.
A második specifikáció a Schema.org-hoz kapcsolt adatoknak a kulturális örökségi tárgyak leírására való felhasználásával foglalkozik az Europeana és az Europeana adatmodell (EDM) követelményeinek megfelelően. Jelenleg az Europeana csak a metaadatok bevitelét támogatja az EDM-ben. A Schema.org-nak a kulturális örökségi tárgyak metaadatleírásaira való alkalmazásával kapcsolatos kísérletek azonban azt mutatták, hogy jó minőségű adatokat képes szolgáltatni, amelyek képesek megfelelni az Europeana követelményeinek. Ez a specifikáció általános útmutatást nyújt a Schema.org metaadatainak használatához, amelyek az EDM-re való átalakítás után olyan metaadatokat eredményeznek, amelyek alkalmasak az Europeana általi összesítésre.
Ez a kísérleti projekt egy olyan eszközkészletet is eredményezett az összekapcsolt adatösszesítéshez, amelyet más hasonló hálózatok Europeana aggregátorai és aggregátorai általi használatra terveztek. Bár az eszközkészlet funkcionalitása az EDM-hez van igazítva, a más adatmodelleket használó aggregátorok saját konverziókat és validálásokat adhatnak hozzá az eszközkészlet által bevezetett szabványok használatával. Az eszközkészlet Docker konténereken alapul, amelyek megőrzik az eszközök műszaki függetlenségét, így a megoldás különböző környezetekbe hordozható és skálázható, lehetővé téve az eszközkészlet kis vagy nagy gyűjteményekre való alkalmazását. Az eszközkészlet és annak forráskódja a Github-ban érhető el.
Jövőbeni munka
A jövőbeli munka számos területét azonosították. Az adatszolgáltatók számára előnyösek lennének az összekapcsolt adataik elkészítésére szolgáló eszközök. Az eszközkészletben bevezetett validálási eszközök az adatszolgáltatók számára nyújtott szolgáltatások létrehozása során is felhasználhatók, lehetővé téve számukra, hogy az összekapcsolt adatok közzétételének korábbi szakaszaiban ellenőrizzék adataik érvényességét. Az ebbe az irányba tett első lépés az összesített összekapcsolt adatoknak az Europeana Metis tesztkörnyezet használatával történő tesztelése volt. A 2021-ben kezdődő második munkaterület az eszközkészlet interoperabilitását és az aggregátorok rendszereibe való integrálását szolgáló elemekre fog összpontosítani. Ezt a munkát a The Netherlands Institute for Sound and Vision koordinálja a Digitale Collectie holland nemzeti projektben.
Ha többet szeretne megtudni a kapcsolt adatokról, nézze meg 2020. októberi webináriumunkat a LODA-ról - a kapcsolt nyíltadat-aggregátorról, és ha érdekli a téma, és több lehetőséget szeretne megvitatni, csatlakozzon az EuropeanaTech közösséghez.
Ezt a bejegyzést 2021. január 21-én szerkesztették, hogy frissítsék az e területen tervezett jövőbeli munka részleteit.
