Agregarea datelor conexate
Datele legate sunt o modalitate de publicare a datelor structurate pe web, care permite ca metadatele să fie conectate și îmbogățite. Acest lucru asigură că pot fi găsite reprezentări diferite ale aceluiași conținut și legături între resursele conexe. Agregarea datelor conexate are potențialul de a aduce beneficii în materie de costuri și de a îmbunătăți interoperabilitatea datelor la scară mondială, iar proiectul Europeana Common Culture a investigat fezabilitatea utilizării unor astfel de date conexate pentru agregare.
Europeana operează deja un model scalabil și durabil de agregare a metadatelor pentru sectorul patrimoniului cultural. Agregarea datelor conexate ar însemna că furnizorii de date ar putea să își partajeze mai ușor metadatele cu agregatorii patrimoniului cultural care au utilizat datele conexate. Pentru furnizorii care nu publică încă date conexate, punerea lor în aplicare pentru participarea la Europeana le-ar oferi, de asemenea, avantajul de a putea utiliza datele lor conexate pentru alte aplicații și cu alte domenii în afară de patrimoniul cultural, cum ar fi motoarele de căutare pe internet.
Colaborarea cu furnizorii de date
Acest proiect-pilot s-a desfășurat în perioada mai 2019-iunie 2020. Proiectul a fost coordonat de Institutul Olandez pentru Sunet și Viziune (NISV) și a fost realizat în strânsă colaborare cu Rețeaua Olandeză pentru Patrimoniul Digital (NDE), care a sprijinit proiectul prin furnizarea de cunoștințe, software și infrastructură pentru efectuarea testelor. Proiectul-pilot a implicat trei tipuri de participanți la ecosistemul Europeana: furnizorii de date, agregatorii și Fundația Europeana. Doisprezece furnizori de date s-au alăturat proiectului-pilot, dar nu toți erau pe deplin conștienți de provocările tehnice pe care le-ar aduce această nouă abordare. Patru dintre furnizori nu au fost în măsură să furnizeze un set de date ca date conexate, iar alți doi furnizori au furnizat seturi de date cu date insuficiente pentru agregare în Europeana.
În cele șase cazuri de succes, cinci furnizori dispuneau deja de cunoștințe interne sau de o punere în aplicare existentă a datelor conexate, iar pentru unul dintre acestea, acesta a fost primul său efort de publicare a datelor conexate. Concluzia noastră este că există mult interes în implementarea datelor legate între furnizorii de date. Cu toate acestea, este nevoie de un nivel semnificativ de resurse atunci când o organizație nu are experiență anterioară.
Rezultatele proiectului-pilot
Proiectul-pilot a aplicat o abordare pentru agregarea datelor legate pe baza a două specificații pentru furnizarea unui set de date legate pentru Europeana. Acestea au fost anterior încununate de succes pentru un proiect-pilot la scară mică în cadrul proiectului Rise of Literacy.
Prima specificație este că metadatele la nivel de set de date ar trebui furnizate prin utilizarea unor vocabulare bine cunoscute. Acesta include tipurile de distribuții de seturi de date pe care le pot utiliza furnizorii de date și metadatele necesare pentru fiecare.
O a doua specificație abordează utilizarea datelor legate de Schema.org pentru descrierea obiectelor de patrimoniu cultural în conformitate cu cerințele Europeana și ale modelului de date Europeana (EDM). În prezent, Europeana sprijină doar ingerarea metadatelor în EDM. Cu toate acestea, experimentele privind aplicarea Schema.org la descrierile metadatelor obiectelor de patrimoniu cultural au arătat că aceasta poate furniza date de bună calitate, care sunt capabile să îndeplinească cerințele Europeana. Această specificație oferă un nivel general de orientare pentru utilizarea metadatelor Schema.org care, după conversia la EDM, vor avea ca rezultat metadate adecvate pentru agregarea de către Europeana.
Acest proiect-pilot a condus, de asemenea, la un set de instrumente pentru agregarea datelor legate, care este conceput pentru a fi utilizat de agregatorii Europeana și de agregatorii altor rețele similare. Deși funcționalitatea setului de instrumente este adaptată pentru EDM, agregatorii care utilizează alte modele de date pot adăuga propriile conversii și validări utilizând standardele puse în aplicare de setul de instrumente. Setul de instrumente se bazează pe containere Docker care păstrează independența tehnică a instrumentelor sale, făcând soluția portabilă pentru diferite medii și scalabilă, oferind posibilitatea de a aplica setul de instrumente la colecții mici sau mari. Setul de instrumente și codul său sursă sunt disponibile în Github.
Lucrări viitoare
Au fost identificate o serie de domenii de activitate viitoare. Furnizorii de date ar beneficia de instrumente pentru pregătirea datelor lor conexate. Instrumentele de validare puse în aplicare în setul de instrumente pot fi, de asemenea, utilizate la crearea de servicii pentru furnizorii de date, permițându-le să verifice valabilitatea datelor lor în etapele anterioare ale publicării datelor conexate. Un prim pas în această direcție a fost realizat prin testarea datelor agregate legate utilizând cutia de nisip Europeana Metis. O a doua linie de lucru, care va începe în 2021, se va concentra asupra componentelor pentru interoperabilitate și integrarea setului de instrumente în sistemele agregatorilor. Această lucrare va fi coordonată de Institutul Olandez pentru Sunet și Viziune în cadrul proiectului național olandez Digitale Collectie.
Pentru a afla mai multe despre datele legate, urmăriți webinarul nostru din octombrie 2020 despre LODA - agregatorul de date deschise legate și, dacă sunteți interesat de subiect și doriți mai multe șanse de a-l discuta, alăturați-vă comunității EuropeanaTech.
Acest post a fost editat la 21 ianuarie 2021 pentru a actualiza detaliile viitoarelor lucrări planificate în acest domeniu.
