FAIR Guiding Principles for scientific data management and stewardship är avsedda att förbättra infrastrukturen för och tjänsterna kring vetenskapliga data. Dessa principer, som presenteras på webbplatsen GO FAIR där de finns, är avsedda som ”riktlinjer för att förbättra sökbarheten, tillgängligheten, interoperabiliteten och återanvändningen av digitala tillgångar”. De vägleder nu utformningen och genomförandet av viktiga initiativ såsom det europeiska öppna forskningsmolnet,vilketillustreras av det nyligen lanserade Fairsair-projektet.
Europeana Collections och dess API:er gör digitaliserat kulturarv från över 3 700 leverantörer (gallerier, bibliotek, museer och arkiv) tillgängligt på alla europeiska språk. Europeana Research vill att fler ska använda detta material i akademisk forskning, särskilt inom humaniora.
Vi undersöker möjligheterna att samarbeta med EOSC, som också tillgodoser forskningsbehov inom samhällsvetenskap och humaniora. I detta sammanhang, hur följer Europeanas tjänster FAIR-principerna och hur kan vi spela en roll i det bredare antagandet av dessa principer inom kulturarvssektorn?
Hur stämmer FAIR-principerna överens med Europeanas?
Det finns en stor samhörighet mellan Fair-principerna och Europeanas värderingar och mål, såsom de kommer till uttryck i dess strategi. Våra principer ”Användbara, Ömsesidiga, Tillförlitliga” och det sätt på vilket vi har genomfört dem under de senaste tio åren överensstämmer med FAIR:s egna principer om ”Hittabara, Tillgängliga, Interoperabilitetsbara, Återanvändbara”. Vi har varit involverade i utvecklingen av teknik som har stor potential att förbättra FAIRness av data, såsom öppna webb-API: er, länkade data och International Image Interoperability Framework (IIIF), genomföra det för oss själva samt uppmuntra alla i vår sektor att anta det.
Europeana och dess breda nätverk av partner har utvecklat en licensram som möjliggör helt öppna metadata och obligatorisk märkning av innehåll med standardiserade och interoperabla rättighetsförklaringar som tydliggör möjligheterna till återanvändning för varje post. Vi har också förespråkat antagandet av bättre upphovsrättspolicyer som gör det lättare att öppet dela kulturdata över hela linjen. Slutligen har det stora nätverket av Europeanas datapartner arbetat med att förbättra kvaliteten på de data som tillhandahålls i ett försök att göra våra mycket varierande data mer användbara över domäner och språk.
![[Ontwerp:] S[ocié]té A[nony]me de l'Exposition universelle et internationale de Gand 1913. Entrée principale (entrée principale). Coupé A-B](/files/Images/Blog_images/2019-04/Ghent.jpg)
[Ontwerp:] S[ocié]té A[nony]me de l'Exposition universelle et internationale de Gand 1913. Entrée principale (entrée principale). Coupe A-B,Oscar Henricus Van de Voorde, 1913, Gents universitetsbibliotek, CC BY-SA

Hur uppfyller Europeanas data och tjänster FAIR-kraven?
Europeana sammanställer metadataposter om kulturarvsföremål. Dessa register innehåller länkar till digitaliserat innehåll som är tillgängligt på Europeanas partners webbplatser och driver en söktjänst som underlättar upptäckten av kulturellt material för en mängd olika målgrupper. Både data och tjänster presenteras via en webbplattform och en serie API:er. Det finns därför flera nivåer att ta hänsyn till när man bedömer om Europeanas anbud är rättvist.
F- Att vara hittad
Det digitaliserade innehåll som Europeana ger tillgång till beskrivs av metadata, vars aggregering utgör ryggraden i Europeanas tjänster. Omfattningen och mångfalden av Europeanas metadatauppsättningar innebär att deras rikedom varierar kraftigt. Europeana har dock utrustat sig med en datamodell (se nedan) som följer de länkade dataprinciperna, som förutom flexibilitet ger våra partner – eller Europeana självt – möjlighet att berika metadata med länkar till (flerspråkiga) semantiska resurser som också beskriver kulturföremålens ”sammanhang”, vilket gör dem lättare att hitta.
Som tidigare nämnts indexerar vi Europeanas dataset och gör det sökbart på nätet själva. Dessutom går det att hitta datasetet genom de europeiska forskningsinfrastrukturerna Clarin och Eudat.
Europeana och våra partner främjar en ihållande identifiering av både kulturarvsföremålens metadata och digitala versioner. Europeana tilldelar identifierare till varje aggregerad post och har förfaranden för att stödja att dess identifierare kvarstår när så är möjligt. Europeana-identifierare är URI:er och ingår i dataposterna i alla format där datauppsättningen är tillgänglig. I ett sammanhang med aggregering där data skickas och behandlas mellan olika partner kan vi inte (och av härkomstskäl vill vi inte) genomdriva global unikhet, dvs. det kan finnas flera identifierare för flera versioner av en resurs. Men vi försöker upprätthålla länkar över alla dessa versioner så att konsumenterna av våra tjänster alltid kan hitta vad de söker efter.
A - Att vara tillgänglig
Europeana-identifierare är resolvable (HTTP) URI:er, som orienterar användare och datakrävande tjänster mot sidor på vår webbplats eller data från våra API:er. Europeana försöker också lösa URI:er som är föråldrade och har uppdaterats av tekniska skäl genom att använda HTTP-omdirigering.
Europeanas dataset är tillgängligt via webb-API:er som genomför öppna standardprotokoll, såsom protokoll och praxis för länkade data (inklusive SPARQL), OpenSearch, OAI-PMH.
Åtkomst till datasetets poster via deras URI:er är gratis och ingen autentisering krävs. Vissa API:er (t.ex. Annotations API)och delar av vår plattform (t.ex. Europeana 1914-1918)kräver autentisering, eftersom de gör det möjligt att ändra våra uppgifter.
I - Att vara interoperabel
Europeana använder Europeanas datamodell (EDM) för datautbyte med dataleverantörer, för sitt interna informationssystem och även för användning av tredje part. EDM är en samarbetsbaserad, samhällsbaserad modell som utvecklats i samråd med företrädare för alla områden som är representerade i Europeana. Det är under ständig förbättring. EDM bygger på Resource Description Framework (RDF), vilket gör det möjligt för oss att skapa en modell för våra metadata som mestadels återanvänder befintliga (Linked Data) standardvokabulärer, som Dublin Core, SKOS och FOAF.
Europeana stöder sina datapartners i att använda ordförråd för att hänvisa till begrepp, platser, personer och organisationer. De mest framträdande ordförråden som används i datauppsättningen är DBpedia och Geonames. Vår användning av externa ordförråd för anrikning följer alltid standardpraxis för länkade öppna data och frågor som kvalitet och tillgång.
Observera att vi i ett par fall som är avgörande för Europeana har börjat skapa egna vokabulär, till exempel den på RightsStatements.org (se nedan) för att komplettera befintliga standarder. Återigen är detta samhällsdrivet och följer befintlig bästa praxis (t.ex. att tillhandahålla URI:er).
R - Att vara återanvändbar
Att underlätta återanvändning av kulturarvsdata är ett centralt mål för Europeana.
Alla metadata som tillhandahålls Europeana måste licensieras enligt CC0, och Europeana gör den fullständiga aggregerade metadatauppsättningen (inklusive resultaten av sina egna dataförbättringar) öppet tillgänglig även enligt CC0.
Rättigheterna att använda innehållet anges i varje post, med hjälp av rättighetsförklaringar från antingen Creative Commons eller RightsStatements.org. Det senare är en vokabulär som utvecklats som ett gemenskapsinitiativ för att förbättra kulturarvsinstitutionernas kommunikation av upphovsrätten till och återanvändningsstatus för digitala föremål, vilket gör det lättare för användarna att ”se om och hur kulturarv på nätet kan återanvändas”.
Uppgifternas ursprung anges alltid, med erkännande av den ursprungliga dataleverantören (t.ex. ett museum eller bibliotek) och alla mellanhänder i aggregeringsarbetsflödet i metadata.
Slutligen görs våra metadata tillgängliga med hjälp av datastandarder som vanligen används inom kulturarvs-, utbildnings- och forskningsområdena, såsom Schema.org, Dublin Core, SKOS och andra (delvis tack vare att EDM följer bästa praxis för datamodellering och redan bygger på dessa standarder).
Vad kommer Europeana att göra inom en snar framtid?
För att ytterligare uppmuntra partnerna att tillhandahålla mer omfattande data som gör det digitala kulturarvet mer sökbart och återanvändbart har Europeana fortlöpande insatser för datakvalitet för att utbyta bästa praxis och rapportera om kvaliteten på innehåll och metadata på ett sätt som är till hjälp och motiverande för både leverantörer och användare.
Vi har nyligen definierat åtgärder för metadatakvalitet, identifiera viktiga dataelement och värden som möjliggör rika användargränssnitt och bättre användarupplevelse. Under de kommande månaderna kommer vi att göra dessa mätningar tillgängliga för våra dataåterbrukare så att de kan identifiera det material som är mest användbart för dem.
När det gäller tillgängligheten till digitaliserat innehåll är Europeana en av grundarna av den nya internationella ramen för interoperabilitet för bilder (IIIF). IIIF är en uppsättning öppna API:er som är utformade för att hjälpa människor att publicera digitalt innehåll på webben på ett sätt som är mer interoperabelt, möjliggör rikare interaktion med innehåll i alla databaser och håller bättre koll på innehållets ursprung. Europeana erkänner och utnyttjar IIIF-innehåll som tillhandahålls oss och arbetar hårt för att uppmuntra våra datapartner att anta det.
Andra utvecklingar som är relevanta för Fair-måtten är det kommande genomförandet av en mekanism för ”en enda inloggning” för alla våra produkter och de kontinuerliga insatserna för att anpassa vår datamodell till nya tillämpnings- och datadelningsbehov, på ett samhällsdrivet sätt (ett aktuellt exempel är en utvidgning för att representera och offentliggöra tidningarnasfulltextinnehåll).
Håll dig informerad och gå med oss
För att hålla dig informerad om den utveckling som beskrivs i det här inlägget, gå med i Europeana Research och/eller EuropeanaTech-grupperna i Europeana Network Association och följ oss på Twitter (@eurresearch och @europeanatech)
Detta inlägg redigerades den 1 februari 2022 för att klargöra hur Europeana tilldelar identifierare till poster.
