Združevanje povezanih podatkov
Povezani podatki so način objavljanja strukturiranih podatkov na spletu, ki omogoča povezovanje in obogatitev metapodatkov. To zagotavlja, da je mogoče najti različne predstavitve iste vsebine in povezave med povezanimi viri. Združevanje povezanih podatkov lahko prinese stroškovne koristi in izboljša interoperabilnost podatkov na svetovni ravni, projekt Europeana Common Culture pa je raziskal izvedljivost uporabe takih povezanih podatkov za združevanje.
Europeana že upravlja nadgradljiv in trajnosten model združevanja metapodatkov za sektor kulturne dediščine. Združevanje povezanih podatkov bi pomenilo, da bi ponudniki podatkov lažje delili svoje metapodatke z združevalci kulturne dediščine, ki so uporabljali povezane podatke. Ponudnikom, ki še ne objavljajo povezanih podatkov, bi njihovo izvajanje za sodelovanje v Europeani omogočilo tudi uporabo njihovih povezanih podatkov za druge aplikacije in druga področja poleg kulturne dediščine, kot so spletni iskalniki.
Sodelovanje s ponudniki podatkov
Pilotni projekt je potekal od maja 2019 do junija 2020. Usklajeval ga je Nizozemski inštitut za zvok in vizijo (NISV), izvajal pa se je v tesnem sodelovanju z nizozemsko mrežo za digitalno dediščino (NDE), ki je projekt podprla z zagotavljanjem znanja, programske opreme in infrastrukture za izvajanje testov. Pilotni projekt je vključeval tri vrste udeležencev v ekosistemu Europeane: ponudniki podatkov, združevalci in fundacija Europeana. Pilotnemu projektu se je pridružilo dvanajst ponudnikov podatkov, vendar se vsi niso v celoti zavedali tehničnih izzivov, ki jih bo prinesel ta nov pristop. Štirje ponudniki niso mogli zagotoviti nabora podatkov kot povezanih podatkov, dva druga ponudnika pa sta predložila nabore podatkov z nezadostnimi podatki za združevanje v Europeano.
V šestih uspešnih primerih je pet ponudnikov že imelo notranje znanje ali obstoječe izvajanje povezanih podatkov, v enem primeru pa je bilo to prvo prizadevanje za objavo povezanih podatkov. Naš zaključek je, da je med ponudniki podatkov veliko zanimanja za izvajanje povezanih podatkov. Vendar pa zahteva znatno raven virov, če organizacija nima predhodnih izkušenj.
Rezultati pilotnih projektov
Pilotni projekt je uporabil pristop za združevanje povezanih podatkov na podlagi dveh specifikacij za zagotavljanje povezanega nabora podatkov za Europeano. Ti so bili pred tem uspešni pri pilotnem projektu manjšega obsega v okviru projekta „Rise of Literacy“ (vzpon pismenosti).
Prva specifikacija je, da bi bilo treba metapodatke na ravni nabora podatkov zagotoviti z uporabo dobro znanih besednjakov. Vključuje vrste porazdelitev naborov podatkov, ki jih lahko uporabljajo ponudniki podatkov, in zahtevane metapodatke za vsakega.
Druga specifikacija obravnava uporabo povezanih podatkov Schema.org za opis predmetov kulturne dediščine v skladu z zahtevami Europeane in podatkovnega modela Europeane (EDM). Europeana trenutno podpira samo vnos metapodatkov v EDM. Vendar so poskusi uporabe spletne strani Schema.org za metapodatkovne opise predmetov kulturne dediščine pokazali, da lahko zagotovi kakovostne podatke, ki lahko izpolnijo zahteve Europeane. Ta specifikacija zagotavlja splošno raven smernic za uporabo metapodatkov Schema.org, ki bodo po pretvorbi v EDM privedli do metapodatkov, primernih za združevanje s strani Europeane.
Rezultat tega pilotnega projekta je bil tudi nabor orodij za združevanje povezanih podatkov, ki je zasnovan tako, da ga lahko uporabljajo združevalci Europeane in združevalci drugih podobnih omrežij. Čeprav je funkcionalnost nabora orodij prilagojena za EDM, lahko agregatorji, ki uporabljajo druge podatkovne modele, dodajo lastne pretvorbe in potrditve z uporabo standardov, ki jih izvaja nabor orodij. Komplet orodij temelji na docker posodah, ki ohranjajo tehnično neodvisnost svojih orodij, zaradi česar je rešitev prenosljiva v različna okolja in nadgradljiva, kar omogoča uporabo kompleta orodij za majhne ali velike zbirke. Zbirka orodij in njena izvorna koda sta na voljo v Github.
Prihodnje delo
Opredeljenih je bilo več področij za prihodnje delo. Ponudniki podatkov bi imeli koristi od orodij za pripravo povezanih podatkov. Orodja za potrjevanje, ki se uporabljajo v naboru orodij, se lahko uporabljajo tudi pri ustvarjanju storitev za ponudnike podatkov, kar jim omogoča preverjanje veljavnosti njihovih podatkov v zgodnejših fazah povezane objave podatkov. Prvi korak v tej smeri je bil izveden s preskušanjem združenih povezanih podatkov z uporabo peskovnika Europeana Metis. Druga vrsta dela, ki se bo začela leta 2021, bo osredotočena na komponente za interoperabilnost in vključevanje nabora orodij v sisteme agregatorjev. To delo bo koordiniral Nizozemski inštitut za zvok in vizijo v nizozemskem nacionalnem projektu Digitale Collectie.
Če želite izvedeti več o povezanih podatkih, si oglejte naš spletni seminar iz oktobra 2020 o LODA – združevalniku povezanih odprtih podatkov. Če vas tema zanima in bi želeli več možnosti za razpravo o njej, se pridružite skupnosti EuropeanaTech.
Ta objava je bila spremenjena 21. januarja 2021, da bi se posodobile podrobnosti o prihodnjem načrtovanem delu na tem področju.
