Sobre a APOLLONIS
No contexto da Infraestrutura Grega para a Investigação e Inovação nas Artes Digitais, Humanidades e Línguas, a APOLLONIS, um grupo de trabalho designado liderado pelo ATHENA R.C., está a trabalhar na identificação e no apoio às necessidades dos investigadores no acesso a arquivos díspares. Centra-se em material de arquivo da década de 1940, um período turbulento na história grega devido aos seus eventos significativos (II Guerra Mundial, Ocupação, Oposição, Libertação, Guerra Civil), e reuniu arquivos históricos digitalizados de vários fornecedores para lançar luz sobre diferentes aspectos históricos desses eventos.
O grupo de trabalho tem dois objetivos principais:
- Conceber e desenvolver um repositório conjunto de metadados e índices para pessoas, organizações, locais, horários, temas e eventos, a fim de permitir que as pessoas pesquisem conteúdos em diferentes arquivos
- Definir atividades de curadoria digital e fluxos de trabalho, para que o trabalho realizado para desenvolver o repositório possa ser replicado e apoiar a análise e o processamento adicionais do conteúdo enriquecido.
A Task Force, ainda em curso, inclui membros do ATHENA R.C., coordenador da APOLLONIS, da Academia de Atenas , da FORTH, do Instituto de Comunicações e Sistemas Informáticos/NTUA, e da Escola de Belas Artes de Atenas.
Reunir os arquivos - o processo
As atividades da Task Force são interdisciplinares e variadas. Desde reunir recursos a oferecê-los de uma nova forma aos investigadores, estamos a registar os nossos fluxos de trabalho. Incluem o processo de curadoria inicial dos arquivos digitalizados, a ingestão, a indexação conjunta dos dados, a geração de representações gráficas semânticas e, por último, a sua publicação. Abaixo, detalhamos os processos que a Força-Tarefa passou para conseguir isso.
Após a aquisição dos materiais-fonte, investigou-se sua estrutura e conteúdo, a fim de mapear diferentes metadados de arquivo em um esquema de metadados comum, possibilitando a indexação conjunta e o estabelecimento de links semânticos no conteúdo arquivístico. O esquema comum de metadados é uma versão enriquecida do Modelo de Dados Europeana (EDM).
A etapa seguinte foi a limpeza dos dados, em que foram corrigidos os dados «sujos» que incluíam erros tipográficos e valores inválidos ou incorretos. Em seguida, melhoramos os conjuntos de dados ao identificar informações adicionais e anotá-las nos registros - essas informações estão principalmente relacionadas a pessoas, locais, unidades armadas, datas e tópicos recorrentes, e, portanto, beneficiamos das técnicas de Processamento de Linguagem Natural (PNL). Os desafios abordados incluem diferentes formatos e esquemas de conteúdos, variações nos vocabulários e terminologias, incoerências na normalização de conteúdos dentro da mesma coleção e entre coleções, bem como erros ortográficos e tipográficos, utilização de carateres gregos e latinos, abreviaturas e declinações.
Os ficheiros resultantes foram expressos em formato XML e agregados. Este processo de estruturação deixa margem para um maior enriquecimento por parte de investigadores familiarizados com o tema. Mas o nosso principal objetivo é apoiar consultas de investigação complexas. Para o efeito, os dados foram finalmente organizados através da ligação de diferentes fontes.
Os planos imediatos do grupo de trabalho incluem a ingestão em grande escala e a indexação do material de vários arquivos para produzir um gráfico semântico correspondente. A incorporação de novos arquivos seria a continuação natural do nosso trabalho, e novas colaborações seriam bem-vindas.
Melhoria dos arquivos para apoiar a investigação
Este trabalho em curso melhorará a experiência atual dos utilizadores, facilitando o acesso a conteúdos de formas novas e inovadoras, para além de abordar questões de preservação. Os investigadores que utilizam o APOLLONIS não terão de pesquisar em seis arquivos diferentes ou enfrentar problemas relacionados com a cronologia dos itens ou com a forma como foram registados.
Quando o nosso trabalho estiver concluído, os investigadores poderão aceder a diferentes arquivos e recursos enriquecidos em simultâneo. Também poderão utilizar fluxos de trabalho de curadoria e análise de conteúdo desenvolvidos como parte do projeto. Por conseguinte, o projeto demonstra e reflete como a curadoria digital pode ser um passo intermédio para oferecer recursos úteis aos investigadores e como os investigadores podem colaborar com instituições responsáveis pelo património cultural para enriquecer os seus recursos.
Mais informações
O Grupo de Trabalho APOLLONIS é um dos projetos sobre recursos digitais da Segunda Guerra Mundial que será debatido num webinário organizado pela Athena RC em 10 de setembro de 2020, no âmbito da sua colaboração com a Europeana Research 2018-2020. Explore o programa e registe-se!
