Acerca de APOLLONIS
En el contexto de la Infraestructura Griega para las Artes Digitales, las Humanidades y la Investigación e Innovación Lingüística, APOLLONIS, un grupo de trabajo designado dirigido por ATHENA R.C., está trabajando para identificar y apoyar las necesidades de los investigadores a la hora de acceder a archivos dispares. Se centra en el material de archivo de la década de 1940, un período turbulento en la historia griega debido a sus eventos significativos (Segunda Guerra Mundial, Ocupación, Oposición, Liberación, Guerra Civil), y ha reunido archivos históricos digitalizados de varios proveedores para arrojar luz sobre diferentes aspectos históricos de estos eventos.
El Grupo Operativo tiene dos objetivos principales:
- Diseñar y desarrollar un repositorio conjunto de metadatos e índices para personas, organizaciones, lugares, horarios, temas y eventos, para permitir a las personas buscar contenido en diferentes archivos.
- Definir actividades y flujos de trabajo de curación digital, de modo que el trabajo realizado para desarrollar el repositorio pueda ser replicado, y apoyar el análisis y procesamiento adicional del contenido enriquecido.
El grupo de trabajo, que aún está en curso, está integrado por miembros de ATHENA R.C., coordinadora de APOLLONIS, la Academia de Atenas, FORTH, el Instituto de Comunicaciones y Sistemas Informáticos/NTUA, y la Escuela de Bellas Artes de Atenas.
Reunir archivos - el proceso
Las actividades del Grupo de Tareas son interdisciplinarias y variadas. Desde reunir recursos hasta ofrecerlos en una nueva forma a los investigadores, estamos registrando nuestros flujos de trabajo. Incluyen el proceso de curación inicial de los archivos digitalizados, la ingestión, la indexación conjunta de los datos, la generación de representaciones gráficas semánticas y, finalmente, su publicación. A continuación, detallamos los procesos por los que pasó el Grupo de Trabajo para lograr esto.
Después de adquirir los materiales de origen, investigamos su estructura y contenido para mapear diferentes metadatos de archivo en un esquema de metadatos común, lo que permitió la indexación conjunta y el establecimiento de enlaces semánticos en el contenido de archivo. El esquema común de metadatos es una versión enriquecida del modelo de datos Europeana (EDM).
El siguiente paso fue la limpieza de datos, en la que se corrigieron los datos «sucios» que incluían errores tipográficos y valores no válidos o incorrectos. Luego mejoramos los conjuntos de datos identificando información adicional y anotándola en los registros: esta información está relacionada principalmente con personas, lugares, unidades armadas, fechas y temas recurrentes, y por lo tanto nos beneficiamos de las técnicas de Procesamiento del Lenguaje Natural (PNL). Los desafíos abordados incluyen diferentes formatos y esquemas de contenido, variaciones en vocabularios y terminologías, incoherencias en la normalización del contenido dentro de la misma colección y entre colecciones, así como errores ortográficos y tipográficos, uso de caracteres griegos y latinos, abreviaturas y declinaciones.
Los archivos resultantes se expresaron en formato XML y se agregaron. Este proceso de estructuración deja espacio para un mayor enriquecimiento por parte de investigadores familiarizados con el tema. Pero nuestro objetivo principal es apoyar consultas de investigación complejas. Con este fin, los datos se organizaron finalmente mediante la vinculación de diferentes fuentes.
Los planes inmediatos del grupo de trabajo incluyen la ingestión a gran escala y la indexación del material de una serie de archivos para producir un gráfico semántico correspondiente. La incorporación de nuevos archivos sería la continuación natural de nuestro trabajo, y serían bienvenidas nuevas colaboraciones.
Archivos mejorados para apoyar la investigación
Este trabajo en curso mejorará la experiencia actual del usuario al facilitar el acceso al contenido de formas nuevas e innovadoras, además de abordar los problemas de preservación. Los investigadores que utilizan APOLLONIS no tendrán que buscar en seis archivos diferentes o enfrentar problemas relacionados con la cronología de los elementos o las formas en que se habían registrado.
Cuando finalice nuestro trabajo, los investigadores podrán acceder simultáneamente a diferentes archivos y recursos enriquecidos. También podrán utilizar flujos de trabajo de curación y análisis de contenido desarrollados como parte del proyecto. Por lo tanto, el proyecto demuestra y refleja cómo la curación digital puede ser un paso intermedio para ofrecer recursos útiles a los investigadores y cómo los investigadores pueden colaborar con las instituciones de patrimonio cultural para enriquecer sus recursos.
Descubre más
El Grupo de Trabajo APOLLONIS es uno de los proyectos sobre recursos digitales de la Segunda Guerra Mundial que se debatirá en un seminario web organizado por Athena RC el 10 de septiembre de 2020 en el marco de su colaboración con Europeana Research 2018-2020. ¡Explore el programa y regístrese!
