Toen Metis (de toepassing die Europeana gebruikt om haar inname-, aggregatie- en verrijkingspijplijn uit te voeren) werd ontworpen, was het niet alleen bedoeld om het werk van de Europeana-stichting efficiënter te maken, maar ook om een systeem te zijn waarmee de gegevenspartners van Europeana kunnen samenwerken om de gegevensverwerking voor hen gemakkelijker en lonender te maken.
In de begindagen van Metis waren slechts bepaalde functionaliteiten beschikbaar voor aggregators, waardoor zij voornamelijk konden controleren of gegevens konden worden aanvaard voor inname in Europeana. Maar nu de Metis Sandbox als tool is uitgebracht, kunnen alle Metis-workflowstappen voor het testen van gegevensinname in één keer worden uitgevoerd via een gebruiksvriendelijke interface waarmee ook gegevens kunnen worden bekeken alsof ze op de Europeana-website staan. Hiermee komt het Europeana-initiatief dichter bij de ambities die in de aggregatiestrategie zijn uiteengezet om de actualisering van datasets te versnellen, bijdragers te betrekken bij het testen en gegevensverrijking aan te moedigen. Dit zal op zijn beurt de kwaliteit van onze gegevens ten goede komen en bijdragen aan de opbouw van capaciteit in aggregators.
Wat aggregators te zeggen hebben over het werken met de Metis Sandbox
Tom Miles, Metadata Coordinator van de Europeana Sounds aggregator van de British Library, en Kerstin Arnold, Manager (COO) van de Archives Portal Europe Foundation (APEF), maken al sinds het begin gebruik van de Metis Sandbox. Cosmina Berta, adviseur Projectmanagement, Tools en Workflows, en haar collega's van de Deutsche Digitale Bibliothek waren al eerder betrokken bij de Sandbox, vanaf de pilotfasen in het Europeana Common Culture-project, en blijven de Metis Sandbox regelmatig gebruiken in hun werk.
Voor Kerstin heeft het werken met de Metis Sandbox de communicatieworkflow tussen APEF, Europeana Foundation en de verschillende archieven die gegevens via APEF verstrekken gestroomlijnd. “Met de Metis Sandbox kan ik zelf potentiële gegevensproblemen identificeren voordat ik de gegevens bij Europeana indien. Ik kan ook rechtstreeks onderscheid maken tussen kwesties die in het archief moeten worden aangepakt en kwesties waaraan APEF moet werken, zoals aanpassingen van de omzetting naar het Europeana Data Model (EDM).”
Voor Tom was het nuttig om te zien hoe een dataset eruit zal zien wanneer deze op Europeana wordt gepubliceerd, omdat het niet altijd gemakkelijk is om de weergave van spreadsheets en XML-bestanden te visualiseren. Het is nu mogelijk om bijvoorbeeld te zien of er meer informatie in de titel moet staan, of er te weinig of te veel informatie in het beschrijvingsveld staat, of dat de onderwerptermen goed werken. “Het was echt nuttig om toegang te hebben tot de Metis Sandbox voor de Microsoft-boekendataset – ik heb deze dataset kunnen bekijken met behulp van de Sandbox en zag verschillende dingen die moesten worden gewijzigd.”
Cosmina: “De Metis Sandbox is zeer succesvol in de Europeana-aggregatorgemeenschap en wij, de Deutsche Digitale Bibliothek, zijn er bijzonder trots op dat wij hebben bijgedragen aan de ontwikkeling van een dergelijk praktisch instrument. We gebruiken het voor al onze Europeana-leveringen en het is zo nuttig om problemen vroeg genoeg in de gegevenslevering te kunnen signaleren, zodat we ze efficiënt kunnen corrigeren. Naar onze mening is het belangrijkste voordeel dat we de datapartner - die de eigenlijke bron van de gegevens is - kunnen laten zien wat de gevolgen zijn van grondige catalogisering en mapping, of de effecten van slechte kwaliteit en gegevens van goede kwaliteit op de Europeana-website. We zien de Metis Sandbox dus zeker als een goed “leermiddel” voor iedereen die betrokken is bij het gegevensleveringsproces.”
Wat kan de Metis Sandbox nog meer?
De Metis Sandbox is vooral handig bij het werken met nieuwe datasets. Het helpt om een idee te geven van de algemene kwaliteit van de dataset en om te bevestigen of een verwacht of vereist niveau van gegevenskwaliteit kan worden bereikt. In dat verband is de module Metis Media Processing, die is ingebed in de Sandbox, nuttig. Met dit onderdeel wordt getracht technische metagegevens uit de gekoppelde mediabronnen van records te extraheren, waardoor verbroken links zoveel mogelijk worden voorkomen. Evenzo kan het gebruik van de Metis Sandbox essentieel zijn voor aggregators die geen eigen EDM-validatietool hebben om meer onmiddellijke feedback te krijgen en gegevensproblemen op te lossen.
Metis Sandbox kan ook zijn sterke punten laten zien bij het experimenteren met nieuwe technologieën of dataformaten. Verschillende aggregators zijn gaan werken met het International Image Interoperability Framework (IIIF) - een reeks open standaarden voor het online op grote schaal leveren van hoogwaardige, toegeschreven digitale objecten. IIIF-bronnen op de juiste manier toewijzen aan EDM is complexer dan traditionele medialinks in kaart brengen. Het krijgen van een idee van hoe de mapping van invloed is op de weergave en kwaliteit van de inhoud kan eenvoudig worden uitgeprobeerd met kleine voorbeelden in de Metis Sandbox. Bovendien kunnen experimenten als deze ook helpen om vooruitgang te boeken bij de berekening van de metagegevens- en inhoudsniveaus, waardoor de gebruiksgevallen die onder het Europeana Publishing Framework vallen, worden uitgebreid.
Meer informatie
Dit nieuwsbericht is de tweede in onze januari Europeana Pro News focus op de Metis Sandbox! Blijf Europeana Pro-nieuws volgen voor meer - onze volgende post zal onderzoeken hoe instellingen voor cultureel erfgoed samenwerken met de Metis Sandbox om gegevens van hoge kwaliteit te leveren. U kunt ook meer te weten komen over het delen van uw gegevens met Europeana.
