A proposito di APOLLONIS
Nel contesto dell'infrastruttura greca per le arti digitali, le discipline umanistiche e la ricerca e l'innovazione linguistica, APOLLONIS, una task force designata guidata da ATHENA R.C., sta lavorando per individuare e sostenere le esigenze dei ricercatori nell'accesso a archivi disparati. Si concentra sul materiale archivistico del decennio degli anni '40, un periodo turbolento nella storia greca a causa dei suoi eventi significativi (seconda guerra mondiale, occupazione, opposizione, liberazione, guerra civile), e ha raccolto archivi storici digitalizzati da vari fornitori per far luce su diversi aspetti storici di questi eventi.
La task force persegue due obiettivi principali:
- Progettare e sviluppare un archivio congiunto di metadati e indici per persone, organizzazioni, luoghi, orari, argomenti ed eventi, per consentire alle persone di cercare contenuti in diversi archivi
- Definire le attività e i flussi di lavoro di digital curation, in modo che il lavoro svolto per sviluppare il repository possa essere replicato e supportare ulteriori analisi ed elaborazione del contenuto arricchito.
La task force, tuttora in corso, comprende membri di ATHENA R.C., coordinatore di APOLLONIS, dell'Accademia di Atene, di FORTH, dell'Istituto di comunicazione e sistemi informatici/NTUA e della Scuola di belle arti di Atene.
Riunire gli archivi - il processo
Le attività della task force sono interdisciplinari e varie. Dal riunire le risorse all'offrirle in una nuova forma ai ricercatori, stiamo registrando i nostri flussi di lavoro. Includono il processo di cura iniziale degli archivi digitalizzati, l'ingestione, l'indicizzazione congiunta dei dati, la generazione di rappresentazioni grafiche semantiche e, infine, la loro pubblicazione. Di seguito, descriviamo in dettaglio i processi che la Task Force ha attraversato per raggiungere questo obiettivo.
Dopo aver acquisito i materiali di origine, abbiamo studiato la loro struttura e il loro contenuto al fine di mappare diversi metadati di archivio su uno schema di metadati comune, consentendo l'indicizzazione congiunta e stabilendo collegamenti semantici nel contenuto di archivio. Lo schema comune di metadati è una versione arricchita del modello di dati Europeana (EDM).
La fase successiva è stata la pulizia dei dati, in cui sono stati corretti i dati "sporchi" che includevano errori tipografici e valori non validi o errati. Abbiamo quindi migliorato i set di dati identificando ulteriori informazioni e annotandole nei record - queste informazioni sono per lo più relative a persone, luoghi, unità armate, date e argomenti ricorrenti, e quindi abbiamo beneficiato delle tecniche di elaborazione del linguaggio naturale (NLP). Le sfide affrontate comprendono diversi formati e schemi di contenuto, variazioni nei vocabolari e nelle terminologie, incongruenze nella standardizzazione dei contenuti all'interno della stessa raccolta e tra le collezioni, nonché errori ortografici e tipografici, uso di caratteri greci e latini, abbreviazioni e declinazioni.
I file risultanti sono stati espressi in formato XML e aggregati. Questo processo di strutturazione lascia spazio a un ulteriore arricchimento da parte dei ricercatori che hanno familiarità con l'argomento. Ma il nostro obiettivo principale è quello di supportare query di ricerca complesse. A tal fine, i dati sono stati infine organizzati collegando diverse fonti.
I piani immediati della task force comprendono l'ingestione e l'indicizzazione su vasta scala del materiale proveniente da una serie di archivi per produrre un grafico semantico corrispondente. L'incorporazione di nuovi archivi sarebbe la naturale continuazione del nostro lavoro e ulteriori collaborazioni sarebbero benvenute.
Archivi migliorati per sostenere la ricerca
Questo lavoro in corso migliorerà l'esperienza utente attuale facilitando l'accesso ai contenuti in modi nuovi e innovativi, oltre ad affrontare i problemi di conservazione. I ricercatori che utilizzano APOLLONIS non dovranno cercare in sei diversi archivi o affrontare problemi relativi alla cronologia degli elementi o ai modi in cui erano stati registrati.
Quando il nostro lavoro sarà completato, i ricercatori saranno in grado di accedere contemporaneamente a diversi archivi e risorse arricchite. Saranno anche in grado di utilizzare i flussi di lavoro di curation e analisi dei contenuti sviluppati come parte del progetto. Il progetto dimostra e riflette quindi come la cura digitale possa essere un passo intermedio per offrire risorse utili ai ricercatori e come i ricercatori possano collaborare con le istituzioni del patrimonio culturale per arricchire le loro risorse.
Scopri di più
La task force APOLLONIS è uno dei progetti sulle risorse digitali della seconda guerra mondiale che saranno discussi in un webinar organizzato da Athena RC il 10 settembre 2020 nel quadro della sua collaborazione con Europeana Research 2018-2020. Esplora il programma e registrati!
