Vi vill att människor ska kunna söka, hitta och använda kulturarvsmaterial på nätet. Det är lättare – och en mycket smidigare upplevelse för alla – när innehållsfilerna (bilderna, textdokumenten eller ljud-/videoklippen) och tillhörande metadata (informationen om vad objektet är och var det kommer ifrån) är av god kvalitet.
Genom Europeana-strategin 2020–2025 kommer vi att fortsätta att arbeta med aggregatorer och dataleverantörer för att investera i resurser, aktiviteter och teknik – såsom maskininlärning och andra anrikningstjänster – för att göra våra metadata och vårt innehåll bättre.
Fokus på kvalitet
Genom att arbeta genom befintliga nätverk av aggregatorer och med stöd av EU:s medlemsstater kommer vi att arbeta för att hjälpa institutioner att förstå varför bra data är viktiga och vi kommer att hjälpa dem att producera innehåll och metadata av högre kvalitet. Vi kommer att utveckla och använda Europeanas publiceringsram för att stödja hur institutionerna arbetar med, producerar och förbättrar det material som de delar med oss.
Vi kommer att visa upp högkvalitativt innehåll via Europeanas redaktion och kampanjer, och vi kommer att utveckla själva plattformen för att lägga större vikt vid våra partnerinstitutioner och se till att goda resultat är synliga för alla.
Cosmina Berta från det tyska digitala biblioteket och en medlem av Europeanas kommitté för datakvalitet säger: ”De största utmaningarna för metadatautövare är att definiera vad datakvalitet är och genomföra datakvalitetsmått, särskilt eftersom dataanvändningsscenarier förändras över tiden. Jag hoppas att vi genom denna strategi kan nå mer konsensus när det gäller att definiera och mäta datakvalitet och definiera ett tydligare koncept för dess genomförande. Jag är ett stort fan av standardisering och i min idealvärld kommer standardisering att spela en större roll när det gäller att definiera och uppnå datakvalitet.
”Om vi definierar de mål vi vill uppnå – ”vad” och ”i vilket syfte” – kan ”hur” vi når dit lättare beskrivas, genomföras och standardiseras. Aggregatorer är viktiga här. Institutionerna kan då bättre nå sin publik och främja sina övergripande forsknings- och utbildningsändamål.”
Bli bättre uppkopplad
När kulturellt innehåll och metadata utarbetas på ett standardiserat sätt, oavsett vilken institution som skapar dem, kan de användas i och över ett brett spektrum av system, inte bara Europeana-plattformen. Kulturarvsinstitutioner kan till exempel dra nytta av interoperabilitet med samlingar från andra institutioner eller kopplingar till internationella initiativ som Wikidata.
Här kommer användningen av standardiserade länkade dataformat i kombination med förbättringar av flerspråkigheten att leda till bättre anslutning av Europeanas samlingar till andra plattformar och tjänster.
Henning Scholz, Europeana Foundations partner och verksamhetschef, säger: ”Med lanseringen av metadatakomponenten Europeana Publishing Framework sommaren 2019 gjorde vi flerspråkighet till en integrerad del av vårt koncept för datakvalitet. Att klargöra vilket språk metadata tillhandahålls på kommer att underlätta maskinöversättning av metadata och göra vårt kulturarv tillgängligt på alla EU-språk. Vi har fortfarande en lång väg att gå, men om vi kan fokusera på att märka viktiga metadatafält med rätt språk kan vi göra goda framsteg under de kommande två åren.”
Använda teknik - och människors makt - för att berika data
Att manuellt förbättra metadatakvaliteten för miljontals poster från olika källor kräver mycket tid och resurser. Tillämpningen av verktyg för artificiell intelligens och maskininlärning, i kombination med mänsklig kunskap från både domänexperter och crowdsourcing-kampanjer (tänk EnrichEuropeana och CrowdHeritage), erbjuder en anmärkningsvärd möjlighet att förbättra kvaliteten på metadata.
Vi kommer att arbeta på sätt att berika metadata och utföra datarelaterade uppgifter automatiskt, halvautomatiskt eller genom att använda publikens styrka.
