Werken bij APOLLONIS
In het kader van de Griekse infrastructuur voor onderzoek en innovatie op het gebied van digitale kunsten, geesteswetenschappen en talen werkt APOLLONIS, een aangewezen taskforce onder leiding van ATHENA R.C., aan het identificeren en ondersteunen van de behoeften van onderzoekers bij de toegang tot uiteenlopende archieven. Het richt zich op archiefmateriaal uit het decennium van de jaren 1940, een turbulente periode in de Griekse geschiedenis vanwege de belangrijke gebeurtenissen (WWII, bezetting, oppositie, bevrijding, burgeroorlog), en heeft gedigitaliseerde historische archieven van verschillende aanbieders verzameld om licht te werpen op verschillende historische aspecten van deze gebeurtenissen.
De taskforce heeft twee hoofddoelstellingen:
- Ontwerpen en ontwikkelen van een gezamenlijke opslagplaats voor metadata en indexen voor mensen, organisaties, plaatsen, tijden, onderwerpen en evenementen, zodat mensen inhoud in verschillende archieven kunnen doorzoeken
- Digitale curatieactiviteiten en workflows definiëren, zodat het werk dat nodig is om de repository te ontwikkelen kan worden gerepliceerd, en verdere analyse en verwerking van de verrijkte inhoud ondersteunen.
De taskforce, die nog aan de gang is, omvat leden van ATHENA R.C., coördinator van APOLLONIS, de Academie van Athene, FORTH, het Instituut voor communicatie en computersystemen/NTUA, en de School voor Schone Kunsten van Athene.
Archieven bij elkaar brengen - het proces
De activiteiten van de Task Force zijn interdisciplinair en gevarieerd. Van het samenbrengen van middelen tot het aanbieden ervan in een nieuwe vorm aan onderzoekers, we registreren onze workflows. Ze omvatten het initiële curatieproces van de gedigitaliseerde archieven, inname, gezamenlijke indexering van de gegevens, het genereren van semantische grafiekrepresentaties en, tot slot, de publicatie ervan. Hieronder beschrijven we de processen die de Task Force heeft doorlopen om dit te bereiken.
Nadat we de bronmaterialen hadden verkregen, onderzochten we hun structuur en inhoud om verschillende archiefmetagegevens in kaart te brengen op een gemeenschappelijk metadataschema, waardoor gezamenlijke indexering mogelijk werd en semantische links in archiefinhoud konden worden vastgesteld. Het gemeenschappelijke metadataschema is een verrijkte versie van het Europeana Data Model (EDM).
De volgende stap was het opschonen van gegevens, waarbij “vuile” gegevens met typografische fouten en ongeldige of onjuiste waarden werden gecorrigeerd. We hebben de datasets vervolgens verbeterd door aanvullende informatie te identificeren en in de records te annoteren - deze informatie heeft meestal betrekking op mensen, plaatsen, gewapende eenheden, data en terugkerende onderwerpen, en we hebben daarom geprofiteerd van Natural Language Processing (NLP) -technieken. Uitdagingen die worden aangepakt, zijn onder meer verschillende inhoudsformaten en -schema’s, variaties in vocabularia en terminologieën, inconsistenties in de standaardisering van inhoud binnen dezelfde collectie en tussen collecties, evenals spellings- en typografische fouten, het gebruik van Griekse en Latijnse tekens, afkortingen en declinaties.
De resulterende bestanden werden uitgedrukt in XML-formaat en geaggregeerd. Dit structureringsproces laat ruimte voor verdere verrijking door onderzoekers die bekend zijn met het onderwerp. Maar ons primaire doel is om complexe onderzoeksvragen te ondersteunen. Daartoe werden de gegevens uiteindelijk georganiseerd door verschillende bronnen aan elkaar te koppelen.
De onmiddellijke plannen van de taskforce omvatten de volledige opname en indexering van het materiaal uit een aantal archieven om een overeenkomstige semantische grafiek te produceren. Het opnemen van nieuwe archieven zou de natuurlijke voortzetting van ons werk zijn, en verdere samenwerkingen zouden welkom zijn.
Verbeterde archieven ter ondersteuning van onderzoek
Deze lopende werkzaamheden zullen de huidige gebruikerservaring verbeteren door de toegang tot inhoud op nieuwe en innovatieve manieren te vergemakkelijken, naast het aanpakken van conserveringskwesties. Onderzoekers die APOLLONIS gebruiken, hoeven niet in zes verschillende archieven te zoeken of problemen te ondervinden met betrekking tot de chronologie van de items of de manieren waarop ze waren opgenomen.
Wanneer ons werk is afgerond, hebben onderzoekers tegelijkertijd toegang tot verschillende archieven en verrijkte bronnen. Ze zullen ook gebruik kunnen maken van curatie- en contentanalyseworkflows die zijn ontwikkeld als onderdeel van het project. Het project laat daarom zien en weerspiegelt hoe digitale curatie een tussenstap kan zijn om onderzoekers nuttige middelen aan te bieden en hoe onderzoekers kunnen samenwerken met instellingen voor cultureel erfgoed om hun middelen te verrijken.
Meer informatie
De APOLLONIS Task Force is een van de projecten op het gebied van WWII digitale middelen die zal worden besproken in een webinar georganiseerd door Athena RC op 10 september 2020 in het kader van haar samenwerking met Europeana Research 2018-2020. Ontdek het programma en registreer!
