Hoe meer je geeft, hoe meer je krijgt. Deze slogan vat samen waarom het Europeana-initiatief van mening is dat investeren in gegevenskwaliteit belangrijk is. Het streven naar de hoogst mogelijke kwaliteit van metagegevens die op de Europeana-website worden gepubliceerd (bijvoorbeeld met betekenisvolle titels en beschrijvingen, contextuele informatie over het onderwerp of de maker van het object, informatie in meerdere talen) zal het waarschijnlijker maken dat de inhoud waarnaar iemand op zoek is, in de zoekresultaten wordt geretourneerd. Als de inhoud van hoge kwaliteit is (met directe links naar objecten en afbeeldingen met een hoge resolutie), is de kans groter dat deze wordt gebruikt door docenten, studenten, onderzoekers en creatieven. Uiteindelijk, hoe hoger de kwaliteit van de gegevens (hoe meer je geeft), hoe groter de kans dat instellingen voor cultureel erfgoed in staat zullen zijn om nieuwe doelgroepen op nieuwe manieren te betrekken en meer zichtbaarheid en relevantie in de samenleving te hebben (hoe meer je krijgt).
Hulpmiddelen ter ondersteuning van gegevenspartners en aggregators
Samen met onze partners biedt het Europeana-initiatief producten, diensten, instrumenten en kaders die instellingen voor cultureel erfgoed ondersteunen bij hun inspanningen om gegevens van hoge kwaliteit aan Europeana te beheren en te leveren. Het Europeana Publishing Framework biedt bijvoorbeeld richtsnoeren over de kwaliteit van inhoud en metagegevens die met Europeana worden gedeeld, en wordt ondersteund door de Europeana Publishing Guide.
Het Europeana Data Statistics Dashboard helpt instellingen voor cultureel erfgoed meer inzicht te krijgen in de kwaliteit van de gegevens die zij op de Europeana-website hebben gepubliceerd. Het Dashboard biedt een goed overzicht van verschillende datakwaliteitsdimensies voor een bepaalde dataset, dataprovider, provider of zelfs land. Dit maakt het mogelijk om verbeterpunten te identificeren. Bekijk hieronder een video over het Dashboard.
Een andere tool, ontwikkeld door partners van het EnrichEuropeana+ Generic Services-project, is de EDM Tier Checker-extensie voor Google Chrome. Deze eenvoudige tool kan worden geïnstalleerd vanuit de Chrome Web Store. Het geeft aggregators - en iedereen met een interesse! - een snelle en eenvoudige manier om objecten te bekijken die door een Europeana-zoekopdracht zijn geretourneerd aan de hand van de verschillende kwaliteitscategorieën voor inhoud en metagegevens, die we “tiers” noemen. Zie het in actie in de onderstaande afbeelding.

Het Dashboard voor gegevensstatistieken en de EDM-tierchecker zijn producten die zijn ontwikkeld met behulp van de API’s van Europeana. De eerste is ontwikkeld door de Europeana Foundation, de laatste is een product ontwikkeld door partners. Dit laat zien hoe anderen kunnen bijdragen aan de reeks producten die de kwaliteit van gegevens ondersteunen, door use cases aan te pakken die niet onder de door de Europeana Foundation ontwikkelde producten vallen en deze te delen met de gemeenschap.
De Metis Sandbox
Het krachtigste product dat het Europeana-initiatief heeft ontwikkeld om de publicatie van hoogwaardige gegevens te ondersteunen, is de Metis Sandbox. In tegenstelling tot de bovenstaande tools stelt de Metis Sandbox dataproviders in staat om de kwaliteit van gegevens te evalueren voordat deze op de Europeana-website worden gepubliceerd, omdat het hen in staat stelt de verrijkings- en publicatieprocedure te simuleren die Europeana op hun gegevens zal uitvoeren. Dit betekent dat ze feedback kunnen krijgen, kunnen zien hoe hun gegevens eruit zouden zien op de eigenlijke Europeana-website en inzicht kunnen krijgen in de kwaliteit van de gegevens. De applicatie helpt verzamelaars en instellingen voor cultureel erfgoed een idee te krijgen van hoe goed hun gegevens zijn voorbereid op inname door Europeana.
De ontwikkeling van de Metis Sandbox begon in het kader van het Europeana Common Culture Generic Services-project en had tot doel de feedbackloop tussen datapartners en het team van Europeana Data Publishing Services (DPS) te verkorten. Met behulp van de Metis Sandbox kan een datapartner aan de data werken zonder het Europeana DPS-team erbij te betrekken. Gegevenskwesties kunnen in een vroeger stadium worden opgelost en er kan om feedback van instellingen voor cultureel erfgoed worden gevraagd voordat de gegevens bij Europeana worden ingediend. Dit vermindert veel van de heen en weer communicatie tussen instellingen, een aggregator en het DPS-team om gegevens klaar te maken voor publicatie in Europeana.
Krachtige functies
De Metis Sandbox is meer dan alleen een voorbeeld van de gegevens op de Europeana-website; het biedt ook functies om de gegevens op een gedetailleerde manier te analyseren en de bevindingen te rapporteren.
Via de functie “tier report” kan een gegevensverstrekker bijvoorbeeld informatie vinden over de kwaliteit van een specifiek stuk metagegevens. Het rapport specificeert bijvoorbeeld de resolutie van het beeld dat wordt gebruikt als representatie van het cultureel erfgoedobject en legt uit waarom het voldoet aan een bepaald kwaliteitsniveau. Het geeft aan welke metagegevensvelden naar verwachting een taalattribuut hebben, en welke velden het taalattribuut hebben en welke niet. Het biedt ook een volledige analyse van de kwaliteit van de contextuele informatie en waar mogelijk meer contextuele informatie kan worden verstrekt. Dit kan helpen bij het identificeren van gebieden voor verbeteringen, of op zijn minst verduidelijkt wat kan worden bereikt met de gegevens zoals deze nu zijn.
De meest recente functie die in de Metis Sandbox is geïntroduceerd, is de mogelijkheid om gegevenskwaliteitscriteria te analyseren die geen deel uitmaken van de berekening van inhouds- of metagegevenslagen. De titels en beschrijvingen van cultureel erfgoedobjecten vormen de eerste focus voor deze functie. Het gebruik van deze functie kan helpen bij het beantwoorden van vragen als “is deze titel of beschrijving uniek?” of “kunnen we verwachten dat deze titel of beschrijving zinvol is op basis van de lengte ervan en het type teken dat wordt gebruikt?”. Op deze manier wordt iemand die de Metis Sandbox gebruikt op de hoogte gebracht van mogelijke problemen met titels en beschrijvingen die in de gegevens worden gebruikt. Het verstrekken van ten minste één daarvan is verplicht voor een metadatarecord dat in Europeana wordt gepubliceerd, en daarom wordt verwacht dat de rapporten over de kwaliteit van titels en beschrijvingen deze in de loop van de tijd zullen helpen verbeteren.
Meer informatie
Dit nieuwsbericht start onze januari Europeana Pro News focus op de Metis Sandbox. De komende weken richten we ons op use cases voor aggregators en instellingen voor cultureel erfgoed, en kijken we naar de toekomst van de Metis Sandbox en hoe je er het beste uit kunt halen. Lees Pro News voor meer!
