Saistīto datu apkopošana
Saistītie dati ir veids, kā tīmeklī publicēt strukturētus datus, kas ļauj savienot un papildināt metadatus. Tas nodrošina, ka var atrast dažādus viena un tā paša satura attēlojumus un izveidot saites starp saistītajiem resursiem. Saistīto datu apkopošanai ir potenciāls radīt izmaksu ieguvumus un uzlabot datu sadarbspēju globālā mērogā, un projektā Europeana Common Culture tika pētīta iespēja šādus saistītos datus izmantot apkopošanai.
Europeana jau izmanto mērogojamu un ilgtspējīgu metadatu apkopošanas modeli kultūras mantojuma nozarē. Saistīto datu apkopošana nozīmētu, ka datu sniedzēji varētu vieglāk kopīgot savus metadatus ar kultūras mantojuma apkopotājiem, kuri izmanto saistītos datus. Pakalpojumu sniedzējiem, kuri vēl nepublicē saistītos datus, to īstenošana dalībai Europeana arī sniegtu tiem priekšrocību izmantot savus saistītos datus citām lietojumprogrammām un citām jomām papildus kultūras mantojumam, piemēram, interneta meklētājprogrammām.
Sadarbība ar datu sniedzējiem
Šis izmēģinājuma projekts ilga no 2019. gada maija līdz 2020. gada jūnijam. To koordinēja Nīderlandes Skaņas un redzējuma institūts (NISV), un tas tika īstenots ciešā sadarbībā ar Nīderlandes Digitālā mantojuma tīklu (NDE), kas atbalstīja projektu, nodrošinot zināšanas, programmatūru un infrastruktūru testu veikšanai. Izmēģinājuma projektā piedalījās trīs veidu dalībnieki no Europeana ekosistēmas: datu sniedzēji, apkopotāji un Europeana fonds. Izmēģinājuma projektam pievienojās divpadsmit datu sniedzēji, bet ne visi pilnībā apzinājās tehniskās problēmas, ko radīs šī jaunā pieeja. Četri pakalpojumu sniedzēji nespēja sniegt datu kopu kā saistītus datus, un divi citi pakalpojumu sniedzēji iesniedza datu kopas ar nepietiekamiem datiem apkopošanai Europeana.
Sešos sekmīgajos gadījumos pieciem pakalpojumu sniedzējiem jau bija iekšējas zināšanas par saistītajiem datiem vai to īstenošana, un vienā gadījumā tas bija pirmais mēģinājums publicēt saistītos datus. Mūsu secinājums ir tāds, ka pastāv liela interese par saistītu datu ieviešanu starp datu sniedzējiem. Tomēr, ja organizācijai nav iepriekšējas pieredzes, tai ir vajadzīgi ievērojami resursi.
Izmēģinājuma rezultāti
Izmēģinājuma projektā tika izmantota pieeja saistītu datu apkopošanai, pamatojoties uz divām specifikācijām, lai nodrošinātu saistītu datu kopu Europeana vajadzībām. Iepriekš tie bija sekmīgi maza mēroga izmēģinājuma projektā Rise of Literacy .
Pirmā specifikācija ir tāda, ka datu kopas līmeņa metadati būtu jāsniedz, izmantojot labi zināmas vārdnīcas. Tas ietver datu kopu izplatīšanas veidus, ko datu sniedzēji var izmantot, un katram no tiem nepieciešamos metadatus.
Otrā specifikācija attiecas uz datu, kas saistīti ar Schema.org, izmantošanu kultūras mantojuma objektu aprakstīšanai saskaņā ar Europeana un Europeana datu modeļa (EDM) prasībām. Pašlaik Europeana atbalsta tikai metadatu uzņemšanu EDM. Tomēr eksperimenti ar Schema.org piemērošanu kultūras mantojuma objektu metadatu aprakstiem ir parādījuši, ka tas var sniegt kvalitatīvus datus, kas spēj izpildīt Europeana prasības. Šī specifikācija sniedz vispārīgus norādījumus par Schema.org metadatu izmantošanu, kas pēc pārveidošanas par EDM radīs metadatus, kuri ir piemēroti Europeana apkopošanai.
Šā izmēģinājuma projekta rezultātā tika izveidots arī saistītu datu apkopošanas rīkkopa, ko paredzēts izmantot Europeana agregatoriem un citu līdzīgu tīklu agregatoriem. Lai gan rīkkopas funkcionalitāte ir pielāgota EDM, agregatori, kas izmanto citus datu modeļus, var pievienot savus reklāmguvumus un validācijas, izmantojot rīkkopas ieviestos standartus. Rīkkopas pamatā ir Docker konteineri, kas saglabā savu rīku tehnisko neatkarību, padarot risinājumu pārnesamu dažādās vidēs un mērogojamu, dodot iespēju izmantot rīku komplektu mazām vai lielām kolekcijām. Rīkkopa un tās pirmkods ir pieejams Github.
Turpmākais darbs
Ir noteiktas vairākas turpmākā darba jomas. Datu sniedzēji gūtu labumu no rīkiem saistīto datu sagatavošanai. Rīkkopā ieviestos validācijas rīkus var izmantot arī, lai izveidotu pakalpojumus datu sniedzējiem, ļaujot tiem pārbaudīt savu datu derīgumu saistītos datu publicēšanas iepriekšējos posmos. Sākotnējais solis šajā virzienā tika veikts, pārbaudot apkopotos saistītos datus, izmantojot Europeana Metis Sandbox. Otrā darba līnija, kas sāksies 2021. gadā, būs vērsta uz komponentiem rīkkopas sadarbspējai un integrācijai agregatoru sistēmās. Šo darbu koordinēs Nīderlandes Skaņas un redzējuma institūts Nīderlandes valsts projektā Digitale Collectie.
Lai uzzinātu vairāk par saistītajiem datiem, noskatieties mūsu 2020. gada oktobra tīmekļsemināru par LODA - saistīto atvērto datu apkopotāju, un, ja jūs interesē šis temats un vēlaties vairāk iespēju to apspriest, pievienojieties EuropeanaTech kopienai.
Šis amats tika rediģēts 2021. gada 21. janvārī, lai atjauninātu informāciju par turpmāko plānoto darbu šajā jomā.
