O spoločnosti APOLLONIS
V súvislosti s gréckou infraštruktúrou pre digitálny, humanitný a jazykový výskum a inováciu pracuje APOLLONIS, určená pracovná skupina pod vedením ATHENA R.C., na identifikácii a podpore potrieb výskumných pracovníkov pri prístupe k rôznorodým archívom. Zameriava sa na archívny materiál z desaťročia 40. rokov 20. storočia, búrlivého obdobia v gréckej histórii kvôli jeho významným udalostiam (druhá svetová vojna, okupácia, opozícia, oslobodenie, občianska vojna), a zhromaždil digitalizované historické archívy od rôznych poskytovateľov, aby objasnili rôzne historické aspekty týchto udalostí.
Osobitná skupina má dva hlavné ciele:
- Navrhnúť a vytvoriť spoločný archív metaúdajov a indexov pre ľudí, organizácie, miesta, časy, témy a podujatia s cieľom umožniť ľuďom vyhľadávať obsah v rôznych archívoch.
- Vymedziť činnosti a pracovné postupy digitálneho spracovania, aby bolo možné zopakovať prácu vykonanú na vývoji úložiska, a podporiť ďalšiu analýzu a spracovanie obohateného obsahu.
Pracovná skupina, ktorá stále prebieha, zahŕňa členov ATHENA R.C., koordinátora APOLLONIS, Aténskej akadémie, FORTH, Inštitútu pre komunikáciu a počítačové systémy/NTUA a Aténskej školy výtvarných umení.
Spájanie archívov - proces
Činnosť osobitnej skupiny je interdisciplinárna a rôznorodá. Od spájania zdrojov až po ich ponúkanie v novej forme výskumným pracovníkom zaznamenávame naše pracovné postupy. Zahŕňajú počiatočný proces spracovania digitalizovaných archívov, požitie, spoločné indexovanie údajov, generovanie sémantických grafických znázornení a nakoniec ich uverejnenie. Nižšie uvádzame podrobnosti o procesoch, ktorými pracovná skupina prešla na dosiahnutie tohto cieľa.
Po získaní zdrojových materiálov sme preskúmali ich štruktúru a obsah, aby sme zmapovali rôzne archívne metadáta do spoločnej schémy metadát, čo umožnilo spoločné indexovanie a vytvorenie sémantických odkazov v archívnom obsahu. Spoločná schéma metaúdajov je obohatenou verziou dátového modelu Europeany (EDM).
Ďalším krokom bolo čistenie údajov, pri ktorom sa opravili „špinavé“ údaje, ktoré zahŕňali typografické chyby a neplatné alebo nesprávne hodnoty. Potom sme vylepšili súbory údajov identifikáciou dodatočných informácií a ich anotáciou v záznamoch - tieto informácie sa väčšinou týkajú ľudí, miest, ozbrojených jednotiek, dátumov a opakujúcich sa tém, a preto sme ťažili z techník spracovania prirodzeného jazyka (NLP). Medzi riešené výzvy patria rôzne formáty a schémy obsahu, rozdiely v slovníkoch a terminológiách, nezrovnalosti v štandardizácii obsahu v rámci tej istej zbierky a medzi zbierkami, ako aj pravopisné a typografické chyby, používanie gréckych a latinských znakov, skratiek a deklinácií.
Výsledné súbory boli vyjadrené vo formáte XML a agregované. Tento proces štruktúrovania ponecháva priestor pre ďalšie obohatenie výskumníkmi, ktorí sú oboznámení s touto témou. Naším hlavným cieľom je podporiť komplexné výskumné otázky. Na tento účel boli údaje nakoniec usporiadané prepojením rôznych zdrojov.
Bezprostredné plány osobitnej skupiny zahŕňajú úplné požitie a indexáciu materiálu z viacerých archívov s cieľom vytvoriť zodpovedajúci sémantický graf. Začlenenie nových archívov by bolo prirodzeným pokračovaním našej práce a ďalšia spolupráca by bola vítaná.
Vylepšené archívy na podporu výskumu
Táto prebiehajúca práca zlepší súčasnú používateľskú skúsenosť uľahčením prístupu k obsahu novými a inovatívnymi spôsobmi, ako aj riešením problémov s uchovávaním. Výskumníci, ktorí používajú APOLLONIS, nebudú musieť vyhľadávať v šiestich rôznych archívoch alebo čeliť problémom súvisiacim s chronológiou položiek alebo so spôsobmi, akými boli zaznamenané.
Po dokončení našej práce budú mať výskumní pracovníci prístup k rôznym archívom a obohateným zdrojom súčasne. Budú tiež môcť používať pracovné postupy spracovania a analýzy obsahu vyvinuté v rámci projektu. Projekt preto demonštruje a odráža, ako môže byť digitálna starostlivosť prechodným krokom k poskytovaniu užitočných zdrojov výskumným pracovníkom a ako môžu výskumní pracovníci spolupracovať s inštitúciami správy kultúrneho dedičstva s cieľom obohatiť svoje zdroje.
Ďalšie informácie
Pracovná skupina APOLLONIS je jedným z projektov týkajúcich sa digitálnych zdrojov druhej svetovej vojny, o ktorých sa bude diskutovať na webinári organizovanom výborom Athena RC 10. septembra 2020 v rámci jeho spolupráce s Europeana Research na roky 2018 – 2020. Preskúmajte program a zaregistrujte sa!
