Lingitud andmete koondamine
Lingitud andmed on struktureeritud andmete veebis avaldamise viis, mis võimaldab metaandmeid ühendada ja rikastada. See tagab, et sama sisu kohta on võimalik leida erinevaid esitusi ja lingid seotud ressursside vahel. Seotud andmete koondamine võib tuua kasu kuludele ja parandada andmete koostalitlusvõimet ülemaailmsel tasandil ning projekti Europeana Common Culture raames uuriti selliste seotud andmete koondamiseks kasutamise teostatavust.
Europeana juba kasutab kultuuripärandisektori jaoks skaleeritavat ja kestlikku metaandmete koondamise mudelit. Lingitud andmete koondamine tähendaks, et andmeesitajatel oleks lihtsam jagada oma metaandmeid kultuuripärandi agregaatoritega, kes kasutavad lingitud andmeid. Teenuseosutajate jaoks, kes veel ei avalda lingitud andmeid, annaks nende rakendamine Europeanas osalemiseks neile ka võimaluse kasutada oma lingitud andmeid muudes rakendustes ja lisaks kultuuripärandile ka muudes valdkondades, näiteks interneti otsingumootorites.
Koostöö andmeesitajatega
Katseprojekt kestis 2019. aasta maist 2020. aasta juunini. Seda koordineeris Madalmaade heli- ja visiooniinstituut (NISV) ning see viidi ellu tihedas koostöös Madalmaade digipärandi võrgustikuga (NDE), kes toetas projekti, pakkudes testide läbiviimiseks teadmisi, tarkvara ja taristut. Katseprojekt hõlmas kolme liiki osalejaid Europeana ökosüsteemis: andmete esitajad, agregaatorid ja Europeana sihtasutus. Katseprojektiga ühines 12 andmepakkujat, kuid mitte kõik neist ei olnud täielikult teadlikud tehnilistest probleemidest, mida see uudne lähenemisviis kaasa tooks. Neli teenuseosutajat ei suutnud esitada andmestikku lingitud andmetena ja veel kaks teenuseosutajat esitasid andmestikke, mille andmed ei olnud Europeanasse koondamiseks piisavad.
Kuuel edukal juhul olid viiel teenuseosutajal juba olemas asutusesisesed teadmised või lingitud andmete rakendamine ning ühel juhul oli see tema esimene jõupingutus lingitud andmete avaldamisel. Meie järeldus on, et andmete esitajate seas on suur huvi lingitud andmete rakendamise vastu. Kui organisatsioonil puudub varasem kogemus, nõuab see siiski märkimisväärseid ressursse.
Katsetulemused
Katseprojektis kasutati seotud andmete koondamiseks lähenemisviisi, mis põhines kahel spetsifikatsioonil, et esitada Europeanale lingitud andmestik. Need projektid olid varem olnud edukad kirjaoskuse suurendamise projekti väikesemahulise katseprojekti puhul.
Esimene täpsustus on see, et andmekogumi tasandi metaandmed tuleks esitada tuntud sõnaloendeid kasutades. See hõlmab andmestike levitamise liike, mida andmeesitajad saavad kasutada, ja iga andmeesitaja jaoks vajalikke metaandmeid.
Teises spetsifikaadis käsitletakse Schema.org lingitud andmete kasutamist kultuuripärandi objektide kirjeldamiseks vastavalt Europeana ja Europeana andmemudeli (EDM) nõuetele. Praegu toetab Europeana ainult metaandmete allaneelamist EDM-is. Kuid katsed rakendada Schema.org-i kultuuripärandi objektide metaandmete kirjeldustele on näidanud, et see võib pakkuda kvaliteetseid andmeid, mis suudavad täita Europeana nõudeid. Käesolev spetsifikaat annab üldised juhised Schema.org metaandmete kasutamiseks, mis pärast teisendamist EDM-iks annavad tulemuseks metaandmed, mida Europeana saab agregeerida.
Katseprojekti tulemuseks oli ka seotud andmete koondamise töövahend, mis on mõeldud kasutamiseks Europeana agregaatoritele ja muude sarnaste võrkude agregaatoritele. Kuigi tööriistakomplekti funktsionaalsus on kohandatud EDM-i jaoks, võivad teisi andmemudeleid kasutavad agregaatorid lisada oma konversioone ja valideerimisi, kasutades tööriistakomplekti rakendatud standardeid. Tööriistakomplekt põhineb Dockeri konteineritel, mis säilitavad selle tööriistade tehnilise sõltumatuse, muutes lahenduse erinevatesse keskkondadesse kaasaskantavaks ja skaleeritavaks, andes võimaluse tööriistakomplekti väikestele või suurtele kollektsioonidele rakendada. Tööriistakomplekt ja selle lähtekood on saadaval Githubis.
Edasine töö
Kindlaks on määratud mitu tulevase töö valdkonda. Andmeesitajad saaksid kasu lingitud andmete ettevalmistamise vahenditest. Vahendistikus rakendatavaid valideerimisvahendeid saab kasutada ka andmeesitajatele teenuste loomisel, mis võimaldab neil kontrollida oma andmete kehtivust lingitud andmete avaldamise varasemates etappides. Esimene samm selles suunas tehti lingitud koondandmete testimisega Europeana Metis Sandboxi abil. Teises töösuunas, mis algab 2021. aastal, keskendutakse koostalitlusvõime komponentidele ja vahendite integreerimisele agregaatorite süsteemidesse. Seda tööd koordineerib Madalmaade heli ja visiooni instituut Madalmaade riikliku projekti Digitale Collectie raames.
Lingitud andmete kohta lisateabe saamiseks vaadake meie 2020. aasta oktoobri veebiseminari LODA (Linked Open Data Aggregator) kohta ning kui olete teemast huvitatud ja soovite rohkem võimalusi selle arutamiseks, liituge EuropeanaTechi kogukonnaga.
Seda postitust muudeti 21. jaanuaril 2021, et ajakohastada üksikasju tulevase kavandatud töö kohta selles valdkonnas.
