Oplysninger om APOLLONIS
I forbindelse med den græske infrastruktur for digital kunst, humaniora og sprogforskning og -innovation arbejder APOLLONIS, en udpeget taskforce under ledelse af ATHENA R.C., på at identificere og støtte forskernes behov, når de får adgang til forskellige arkiver. Det fokuserer på arkivmateriale fra årtiet i 1940'erne, en turbulent periode i græsk historie på grund af dens betydelige begivenheder (WWII, Besættelse, Opposition, Befrielse, borgerkrig), og har samlet digitaliserede historiske arkiver fra forskellige udbydere for at kaste lys over forskellige historiske aspekter af disse begivenheder.
Taskforcen har to hovedformål:
- At designe og udvikle et fælles lager for metadata og indekser for personer, organisationer, steder, tidspunkter, emner og begivenheder, så folk kan søge i indhold på tværs af forskellige arkiver
- At definere digitale kurateringsaktiviteter og arbejdsgange, så det arbejde, der er udført for at udvikle lageret, kan kopieres, og understøtte yderligere analyse og behandling af det berigede indhold.
Taskforcen, som stadig er i gang, omfatter medlemmer fra ATHENA R.C., koordinator for APOLLONIS, Athens akademi, FORTH, Institute of Communications and Computer Systems/NTUA og Athens kunstskole.
Samling af arkiver - processen
Taskforcens aktiviteter er tværfaglige og varierede. Fra at samle ressourcer til at tilbyde dem i en ny form til forskere, registrerer vi vores arbejdsgange. De omfatter den indledende kurateringsproces for de digitaliserede arkiver, indtagelse, fælles indeksering af dataene, generering af semantiske grafrepræsentationer og endelig deres offentliggørelse. Nedenfor beskriver vi de processer, som taskforcen gik igennem for at opnå dette.
Efter vi erhvervede kildematerialerne, undersøgte vi deres struktur og indhold for at kortlægge forskellige arkivmetadata på et fælles metadataskema, der muliggør fælles indeksering og etablering af semantiske links i arkivindhold. Det fælles metadataskema er en beriget version af Europeana Data Model (EDM).
Det næste skridt var datarensning, hvor "beskidte" data, der omfattede typografiske fejl og ugyldige eller ukorrekte værdier, blev rettet. Vi forbedrede derefter datasættene ved at identificere yderligere oplysninger og annotere dem i optegnelserne - disse oplysninger er for det meste relateret til mennesker, steder, væbnede enheder, datoer og tilbagevendende emner, og vi nød derfor godt af Natural Language Processing (NLP) teknikker. Udfordringerne omfatter forskellige indholdsformater og -skemaer, variationer i ordforråd og terminologi, uoverensstemmelser i standardiseringen af indhold inden for samme samling og på tværs af samlinger samt stave- og typografiske fejl, brug af græske og latinske tegn, forkortelser og deklinationer.
De resulterende filer blev udtrykt i XML-format og aggregeret. Denne struktureringsproces giver plads til yderligere berigelse af forskere, der er bekendt med emnet. Men vores primære mål er at understøtte komplekse forskningsforespørgsler. Til dette formål blev data endelig organiseret ved at sammenkæde forskellige kilder.
Taskforcens umiddelbare planer omfatter fuldskalaindtagelse og indeksering af materialet fra en række arkiver for at udarbejde en tilsvarende semantisk graf. Indarbejdelsen af nye arkiver ville være den naturlige fortsættelse af vores arbejde, og yderligere samarbejde ville være velkomne.
Forbedrede arkiver til støtte for forskning
Dette igangværende arbejde vil forbedre den nuværende brugeroplevelse ved at lette adgangen til indhold på nye og innovative måder ud over at løse bevaringsproblemer. Forskere, der bruger APOLLONIS, behøver ikke at søge på tværs af seks forskellige arkiver eller står over for problemer i forbindelse med kronologien af genstandene eller de måder, hvorpå de var blevet registreret.
Når vores arbejde er færdigt, vil forskere kunne få adgang til forskellige arkiver og berigede ressourcer samtidigt. De vil også være i stand til at bruge kuratering og indhold analyse arbejdsgange udviklet som en del af projektet. Projektet demonstrerer og afspejler derfor, hvordan digital kuratering kan være et mellemliggende skridt til at tilbyde nyttige ressourcer til forskere, og hvordan forskere kan samarbejde med kulturarvsinstitutioner for at berige deres ressourcer.
Læs mere
APOLLONIS-taskforcen er et af projekterne om digitale ressourcer fra anden verdenskrig, som vil blive drøftet på et webinar arrangeret af Athena RC den 10. september 2020 inden for rammerne af samarbejdet med Europeana Research 2018-2020. Gå på opdagelse i programmet, og registrer dig!
