Despre APOLLONIS
În contextul Infrastructurii elene pentru arte digitale, științe umaniste și cercetare și inovare lingvistică, APOLLONIS, un grup operativ desemnat condus de ATHENA R.C., lucrează la identificarea și sprijinirea nevoilor cercetătorilor atunci când accesează arhive disparate. Acesta se concentrează pe materiale de arhivă din deceniul anilor 1940, o perioadă turbulentă în istoria Greciei din cauza evenimentelor sale semnificative (Al Doilea Război Mondial, Ocupația, Opoziția, Eliberarea, Războiul Civil) și a adunat arhive istorice digitalizate de la diverși furnizori pentru a face lumină asupra diferitelor aspecte istorice ale acestor evenimente.
Grupul operativ are două obiective principale:
- Proiectarea și dezvoltarea unui registru comun pentru metadate și indici pentru persoane, organizații, locuri, ore, subiecte și evenimente, pentru a permite persoanelor să caute conținut în diferite arhive
- Definirea activităților de organizare digitală și a fluxurilor de lucru, astfel încât activitatea desfășurată pentru dezvoltarea depozitului să poată fi reprodusă și să sprijine analiza și prelucrarea ulterioară a conținutului îmbogățit.
Grupul operativ, care este încă în curs de desfășurare, include membri din partea ATHENA R.C., coordonator al APOLLONIS, al Academiei din Atena, al FORTH, al Institutului de Comunicații și Sisteme Informatice/NTUA și al Școlii de Arte Frumoase din Atena.
Reunirea arhivelor - procesul
Activitățile grupului operativ sunt interdisciplinare și variate. De la reunirea resurselor la oferirea lor într-o nouă formă cercetătorilor, înregistrăm fluxurile noastre de lucru. Acestea includ procesul inițial de conservare a arhivelor digitalizate, ingestia, indexarea comună a datelor, generarea de reprezentări grafice semantice și, în cele din urmă, publicarea acestora. Mai jos, detaliem procesele prin care a trecut grupul operativ pentru a realiza acest lucru.
După ce am achiziționat materialele sursă, am investigat structura și conținutul acestora pentru a cartografia diferite metadate de arhivă pe o schemă comună de metadate, permițând indexarea comună și stabilirea legăturilor semantice în conținutul de arhivă. Schema comună de metadate este o versiune îmbogățită a modelului de date Europeana (EDM).
Următoarea etapă a fost curățarea datelor, în cadrul căreia au fost corectate datele „murdare” care includeau erori tipografice și valori nevalide sau incorecte. Am îmbunătățit apoi seturile de date prin identificarea informațiilor suplimentare și adnotarea acestora în înregistrări - aceste informații sunt legate în cea mai mare parte de persoane, locuri, unități armate, date și subiecte recurente și, prin urmare, am beneficiat de tehnicile de procesare a limbajului natural (NLP). Printre provocările abordate se numără diferite formate și scheme de conținut, variații ale vocabularelor și terminologiilor, inconsecvențe în standardizarea conținutului în cadrul aceleiași colecții și între colecții, precum și erori de ortografie și de tipografie, utilizarea caracterelor grecești și latine, abrevieri și declinări.
Fișierele rezultate au fost exprimate în format XML și agregate. Acest proces de structurare lasă loc pentru îmbogățirea ulterioară de către cercetătorii familiarizați cu acest subiect. Dar scopul nostru principal este de a sprijini interogări complexe de cercetare. În acest scop, datele au fost în cele din urmă organizate prin conectarea diferitelor surse.
Planurile imediate ale grupului operativ includ ingerarea și indexarea la scară largă a materialelor dintr-o serie de arhive pentru a produce un grafic semantic corespunzător. Încorporarea de noi arhive ar fi continuarea firească a activității noastre, iar colaborările viitoare ar fi binevenite.
Arhive îmbunătățite pentru a sprijini cercetarea
Această activitate în curs va îmbunătăți experiența actuală a utilizatorilor prin facilitarea accesului la conținut în moduri noi și inovatoare, pe lângă abordarea problemelor de conservare. Cercetătorii care utilizează APOLLONIS nu vor trebui să caute în șase arhive diferite sau să se confrunte cu probleme legate de cronologia articolelor sau de modul în care au fost înregistrate.
Când activitatea noastră va fi finalizată, cercetătorii vor putea accesa simultan diferite arhive și resurse îmbogățite. De asemenea, aceștia vor putea utiliza fluxurile de lucru de organizare și analiză a conținutului dezvoltate ca parte a proiectului. Prin urmare, proiectul demonstrează și reflectă modul în care organizarea digitală poate fi un pas intermediar pentru a oferi resurse utile cercetătorilor și modul în care cercetătorii pot colabora cu instituțiile de patrimoniu cultural pentru a-și îmbogăți resursele.
Aflați mai multe
Grupul operativ APOLLONIS este unul dintre proiectele privind resursele digitale din al doilea război mondial care vor fi discutate în cadrul unui webinar organizat de Athena RC la 10 septembrie 2020 în cadrul colaborării sale cu Europeana Research 2018-2020. Explorați programul și înregistrați-vă!
