Agregiranje povezanih podataka
Povezani podaci su način objavljivanja strukturiranih podataka na webu koji omogućuje povezivanje i obogaćivanje metapodataka. Time se osigurava da se mogu pronaći različiti prikazi istog sadržaja i poveznice između povezanih resursa. Agregiranje povezanih podataka može donijeti troškovne koristi i poboljšati interoperabilnost podataka na globalnoj razini, a projekt Europeana Common Culture istražio je izvedivost upotrebe takvih povezanih podataka za agregiranje.
Europeana već primjenjuje skalabilan i održiv model agregiranja metapodataka za sektor kulturne baštine. Agregiranje povezanih podataka značilo bi da bi pružatelji podataka lakše mogli dijeliti svoje metapodatke s agregatorima kulturne baštine koji su se koristili povezanim podacima. Kad je riječ o pružateljima koji još ne objavljuju povezane podatke, njihova provedba radi sudjelovanja u Europeani omogućila bi im i da svoje povezane podatke mogu upotrebljavati za druge aplikacije i s drugim domenama osim kulturne baštine, kao što su internetske tražilice.
Suradnja s pružateljima podataka
Pilot-projekt trajao je od svibnja 2019. do lipnja 2020. Koordinirao ga je Nizozemski institut za zvuk i viziju (NISV) i isporučio u bliskoj suradnji s nizozemskom mrežom digitalne baštine (NDE) koja je podržala projekt pružanjem znanja, softvera i infrastrukture za provedbu testova. Pilot-projekt uključivao je tri vrste sudionika u ekosustavu Europeane: pružatelji podataka, agregatori i Zaklada Europeana. Dvanaest pružatelja podataka pridružilo se pilot-projektu, ali nisu svi bili u potpunosti svjesni tehničkih izazova koje bi taj novi pristup donio. Četiri pružatelja nisu mogla dostaviti skup podataka kao povezane podatke, a dva druga pružatelja dostavila su skupove podataka s nedovoljnim podacima za objedinjavanje u Europeanu.
U šest uspješnih slučajeva pet pružatelja usluga već je raspolagalo internim znanjem ili postojećom provedbom povezanih podataka, a kao prvo, to je bio njegov prvi napor u objavljivanju povezanih podataka. Naš zaključak je da postoji veliki interes za implementaciju povezanih podataka među davateljima podataka. Međutim, potrebna je znatna razina resursa ako organizacija nema prethodno iskustvo.
Rezultati pilot-projekta
Pilot-projektom primijenjen je pristup za povezano agregiranje podataka na temelju dviju specifikacija za isporuku povezanog skupa podataka za Europeanu. Ti su projekti prethodno bili uspješni za mali pilot-projekt u okviru projekta „Rast pismenosti”.
Prva je specifikacija da bi se metapodaci na razini skupova podataka trebali pružati upotrebom dobro poznatih rječnika. Uključuje vrste distribucija skupova podataka koje pružatelji podataka mogu upotrebljavati i potrebne metapodatke za svaku od njih.
Druga specifikacija odnosi se na upotrebu podataka povezanih sa sustavom Schema.org za opisivanje predmeta kulturne baštine u skladu sa zahtjevima podatkovnog modela Europeana i Europeana (EDM). Europeana trenutačno podupire samo unos metapodataka u EDM. Međutim, eksperimenti na primjeni Schema.org na opise metapodataka predmeta kulturne baštine pokazali su da može pružiti kvalitetne podatke, što je u stanju ispuniti zahtjeve Europeane. Ova specifikacija pruža opću razinu smjernica za upotrebu metapodataka Schema.org koji će, nakon konverzije u EDM, rezultirati metapodacima koji su prikladni za agregiranje od strane Europeane.
Ovaj pilot-projekt rezultirao je i alatom za povezano agregiranje podataka koji je osmišljen za upotrebu od strane agregatora Europeana i agregatora drugih sličnih mreža. Iako je funkcionalnost alata prilagođena EDM-u, agregatori koji upotrebljavaju druge podatkovne modele mogu dodati vlastite konverzije i validacije primjenom standarda koje primjenjuje alat. Alat se temelji na Docker kontejnerima koji čuvaju tehničku neovisnost svojih alata, čineći rješenje prenosivim na različita okruženja i skalabilnim, dajući mogućnost primjene alata na male ili velike zbirke. Alat i njegov izvorni kod dostupni su u Githubu.
Budući rad
Utvrđena su brojna područja za budući rad. Pružatelji podataka imali bi koristi od alata za pripremu povezanih podataka. Alati za validaciju koji se primjenjuju u skupu alata mogu se upotrebljavati i za stvaranje usluga za pružatelje podataka, čime im se omogućuje da provjere valjanost svojih podataka u ranijim fazama objave povezanih podataka. Početni korak u tom smjeru proveden je ispitivanjem agregiranih povezanih podataka s pomoću pješčanog okruženja Europeana Metis. Druga linija rada koja počinje 2021. bit će usmjerena na komponente za interoperabilnost i integraciju skupa alata u sustave agregatora. Ovaj rad će koordinirati Nizozemski institut za zvuk i viziju u nizozemskom nacionalnom projektu Digitale Collectie.
Da biste saznali više o povezanim podacima, pogledajte naš webinar iz listopada 2020. o LODA-i - poveznom agregatoru otvorenih podataka, a ako ste zainteresirani za tu temu i želite više prilika za raspravu, pridružite se zajednici EuropeanaTech.
Ovaj je post izmijenjen 21. siječnja 2021. kako bi se ažurirale pojedinosti o budućem planiranom radu u tom području.
