Om APOLLONIS
Inom ramen för den grekiska infrastrukturen för digital konst, humaniora och språkforskning och innovation arbetar APOLLONIS, en utsedd arbetsgrupp under ledning av Athena R.C., med att identifiera och stödja forskares behov när de får tillgång till olika arkiv. Den fokuserar på arkivmaterial från 1940-talet, en turbulent period i grekisk historia på grund av dess betydande händelser (andra världskriget, ockupation, opposition, befrielse, inbördeskrig), och har samlat digitaliserade historiska arkiv från olika leverantörer för att belysa olika historiska aspekter av dessa händelser.
Arbetsgruppen har två huvudsyften:
- Att utforma och utveckla en gemensam databas för metadata och index för personer, organisationer, platser, tider, ämnen och händelser, så att människor kan söka innehåll i olika arkiv.
- Att definiera digitala kurateringsaktiviteter och arbetsflöden, så att det arbete som krävs för att utveckla arkivet kan replikeras, och stödja ytterligare analys och bearbetning av det berikade innehållet.
Arbetsgruppen, som fortfarande pågår, består av medlemmar från Athena R.C., samordnare för APOLLONIS, Atens akademi, FORTH, Institute of Communications and Computer Systems/NTUA, och Athens School of Fine Arts.
Samla arkiven - processen
Arbetsgruppens verksamhet är tvärvetenskaplig och varierad. Från att samla resurser till att erbjuda dem i en ny form till forskare, registrerar vi våra arbetsflöden. De omfattar den inledande behandlingen av de digitaliserade arkiven, intag, gemensam indexering av data, generering av semantiska grafrepresentationer och slutligen offentliggörande av dessa. Nedan beskriver vi de processer som arbetsgruppen gick igenom för att uppnå detta.
Efter att vi förvärvat källmaterialen undersökte vi deras struktur och innehåll för att kartlägga olika arkivmetadata till ett gemensamt metadataschema, vilket möjliggjorde gemensam indexering och upprättande av semantiska länkar i arkivinnehåll. Det gemensamma metadataschemat är en berikad version av Europeanas datamodell (EDM).
Nästa steg var datarensning, där ”smutsiga” data som innehöll typografiska fel och ogiltiga eller felaktiga värden korrigerades. Vi förbättrade sedan dataseten genom att identifiera ytterligare information och kommentera den i posterna - denna information är mestadels relaterad till människor, platser, väpnade enheter, datum och återkommande ämnen, och vi drog därför nytta av Natural Language Processing (NLP) -tekniker. Utmaningar som tas upp är olika innehållsformat och innehållsscheman, variationer i ordförråd och terminologier, inkonsekvenser i standardiseringen av innehåll inom samma samling och mellan samlingar samt stavnings- och typografiska fel, användning av grekiska och latinska tecken, förkortningar och deklinationer.
De resulterande filerna uttrycktes i XML-format och aggregerades. Denna struktureringsprocess lämnar utrymme för ytterligare berikning av forskare som är bekanta med ämnet. Men vårt främsta mål är att stödja komplexa forskningsfrågor. I detta syfte organiserades uppgifterna slutligen genom att olika källor kopplades samman.
Arbetsgruppens omedelbara planer omfattar fullskaligt intag och indexering av materialet från ett antal arkiv för att ta fram en motsvarande semantisk graf. Införandet av nya arkiv skulle vara en naturlig fortsättning på vårt arbete, och ytterligare samarbeten skulle vara välkomna.
Förbättrade arkiv för att stödja forskning
Detta pågående arbete kommer att förbättra den nuvarande användarupplevelsen genom att underlätta tillgången till innehåll på nya och innovativa sätt, förutom att ta itu med bevarandefrågor. Forskare som använder APOLLONIS kommer inte att behöva söka i sex olika arkiv eller möta problem relaterade till kronologin för objekten eller hur de hade spelats in.
När vårt arbete är klart kommer forskare att kunna komma åt olika arkiv och berikade resurser samtidigt. De kommer också att kunna använda arbetsflöden för kuration och innehållsanalys som utvecklats som en del av projektet. Projektet visar och reflekterar därför hur digital kuration kan vara ett mellansteg för att erbjuda användbara resurser till forskare, och hur forskare kan samarbeta med kulturarvsinstitutioner för att berika sina resurser.
Läs mer
APOLLONIS Task Force är ett av projekten om andra världskrigets digitala resurser som kommer att diskuteras i ett webbseminarium som anordnas av Athena RC den 10 september 2020 inom ramen för samarbetet med Europeana Research 2018-2020. Utforska programmet och registrera dig!
