Susietų duomenų apibendrinimas
Susieti duomenys yra struktūrizuotų duomenų skelbimo internete būdas, leidžiantis susieti ir papildyti metaduomenis. Taip užtikrinama, kad būtų galima rasti skirtingus to paties turinio vaizdus ir susieti susijusius išteklius. Susietų duomenų apibendrinimas gali duoti ekonominės naudos ir pagerinti duomenų sąveikumą pasauliniu mastu, o įgyvendinant projektą „Europeana Common Culture“ buvo ištirtos galimybės tokius susietus duomenis naudoti agregavimui.
EUROPEANA jau taiko kintamo masto ir tvarų kultūros paveldo sektoriaus metaduomenų kaupimo modelį. Susietų duomenų apibendrinimas reikštų, kad duomenų teikėjai galėtų lengviau dalytis savo metaduomenimis su kultūros paveldo kaupėjais, kurie naudojosi susietaisiais duomenimis. Teikėjams, kurie dar neskelbia susietųjų duomenų, juos įdiegus, kad galėtų dalyvauti Europeanoje, jiems taip pat būtų naudinga turėti galimybę naudoti savo susietus duomenis kitoms taikomosioms programoms ir kitoms sritims, ne tik kultūros paveldui, pavyzdžiui, interneto paieškos sistemoms.
Bendradarbiavimas su duomenų teikėjais
Šis bandomasis projektas buvo vykdomas nuo 2019 m. gegužės mėn. iki 2020 m. birželio mėn. Projektą koordinavo Nyderlandų garso ir vaizdo institutas (NISV) ir jis buvo įgyvendinamas glaudžiai bendradarbiaujant su Nyderlandų skaitmeninio paveldo tinklu (NDE), kuris rėmė projektą teikdamas žinias, programinę įrangą ir infrastruktūrą bandymams atlikti. Bandomajame projekte dalyvavo trijų rūšių Europeanos ekosistemos dalyviai: duomenų teikėjai, telkėjai ir Europeanos fondas. Dvylika duomenų teikėjų prisijungė prie bandomojo projekto, tačiau ne visi jie puikiai žinojo apie techninius iššūkius, kuriuos sukels šis naujas požiūris. Keturi paslaugų teikėjai negalėjo pateikti duomenų rinkinio kaip susietų duomenų, o kiti du paslaugų teikėjai pateikė duomenų rinkinius su nepakankamais duomenimis, kad juos būtų galima agreguoti į EUROPEANA.
Šešiais sėkmingais atvejais penki paslaugų teikėjai jau turėjo vidaus žinių arba jau įdiegė susietus duomenis, o vienu atveju tai buvo pirmosios jų pastangos skelbti susietus duomenis. Darome išvadą, kad duomenų teikėjai yra labai suinteresuoti įgyvendinti susietus duomenis. Tačiau tam reikia didelių išteklių, kai organizacija neturi jokios ankstesnės patirties.
Bandomųjų projektų rezultatai
Vykdant bandomąjį projektą taikytas susietojo duomenų agregavimo metodas, pagrįstas dviem susieto EUROPEANA duomenų rinkinio pateikimo specifikacijomis. Anksčiau jos buvo sėkmingos vykdant nedidelio masto bandomąjį projektą „Gebėjimų ugdymas“.
Pirmoji specifikacija – duomenų rinkinio lygmens metaduomenys turėtų būti teikiami naudojant gerai žinomus žodynus. Tai apima duomenų rinkinių platinimo rūšis, kurias duomenų teikėjai gali naudoti, ir kiekvienam iš jų reikalingus metaduomenis.
Antrojoje specifikacijoje aptariamas su „Schema.org“ susietų duomenų naudojimas kultūros paveldo objektams apibūdinti pagal „Europeanos“ ir „Europeanos duomenų modelio“ (EDM) reikalavimus. Šiuo metu Europeana palaiko tik metaduomenų įvedimą į EDM. Tačiau "Schema.org" taikymo kultūros paveldo objektų metaduomenų aprašymams eksperimentai parodė, kad jis gali suteikti geros kokybės duomenis, kurie gali atitikti "Europeanos" reikalavimus. Šioje specifikacijoje pateikiamos bendro lygio rekomendacijos, kaip naudoti Schema.org metaduomenis, kuriuos konvertavus į EDM, bus gauti metaduomenys, tinkami agreguoti pagal Europeaną.
Šio bandomojo projekto rezultatas taip pat buvo susietųjų duomenų agregavimo priemonių rinkinys, skirtas „Europeanos“ telkėjams ir kitų panašių tinklų telkėjams. Nors įrankių rinkinio funkcionalumas yra pritaikytas EDM, agregatoriai, naudojantys kitus duomenų modelius, gali pridėti savo konversijas ir patvirtinimus, naudodami įrankių rinkinio įdiegtus standartus. Įrankių rinkinys yra pagrįstas "Docker" konteineriais, kurie išsaugo savo įrankių techninį nepriklausomumą, todėl sprendimas yra nešiojamas skirtingose aplinkose ir išplečiamas, suteikiant galimybę pritaikyti įrankių rinkinį mažoms ar didelėms kolekcijoms. Priemonių rinkinį ir jo pirminį kodą galima rasti Github.
Tolesnis darbas
Buvo nustatytos kelios būsimo darbo sritys. Duomenų teikėjams būtų naudingos jų susietų duomenų rengimo priemonės. Priemonių rinkinyje įdiegtos patvirtinimo priemonės taip pat gali būti naudojamos kuriant paslaugas duomenų teikėjams, kad jie galėtų patikrinti savo duomenų galiojimą ankstesniuose susietųjų duomenų skelbimo etapuose. Pirmasis žingsnis šia kryptimi buvo atliktas išbandant suvestinius susietus duomenis naudojant „Europeana Metis Sandbox“. 2021 m. prasidės antroji darbo kryptis, kurioje daugiausia dėmesio bus skiriama priemonių rinkinio sąveikumo ir integravimo į telkėjų sistemas komponentams. Šį darbą koordinuos Nyderlandų garso ir vizijos institutas Nyderlandų nacionaliniame projekte "Digitale Collectie".
Norėdami sužinoti daugiau apie susietus duomenis, žiūrėkite mūsų 2020 m. spalio mėn. internetinį seminarą apie susietųjų atvirųjų duomenų telkėją LODA ir, jei jus domina ši tema ir norėtumėte daugiau galimybių ją aptarti, prisijunkite prie „EuropeanaTech“ bendruomenės.
Šis pranešimas buvo redaguotas 2021 m. sausio 21 d., siekiant atnaujinti informaciją apie būsimus planuojamus darbus šioje srityje.
