Os métodos do domínio da inteligência artificial (IA) e da aprendizagem automática (ML) ajudaram a ultrapassar as fronteiras tecnológicas em vários domínios, nomeadamente no setor do património cultural (o relatório intercalar da EuropeanaTech AI em relação ao grupo de trabalho GLAM e a iniciativa AI4LAM fornecem alguns exemplos). Para incentivar a inovação neste domínio, há algumas semanas a EuropeanaTech anunciou o seu primeiro desafio para os conjuntos de dados de IA/ML da Europeana. Com esta nova atividade, quisemos estimular a criação de conjuntos de dados para o setor GLAM que possam ser utilizados para a IA/ML, tirando partido dos ricos recursos do património cultural disponíveis na Europeana. Esperamos que a disponibilidade desses conjuntos de dados possa ajudar a promover um maior envolvimento com os dados do património cultural digital em IA/ML e apoiar a transferência dos recentes avanços em IA/ML para o domínio da curadoria digital e da análise de conteúdos do património cultural.
O Tribunal recebeu um total de cinco propostas, que foram cuidadosamente analisadas pelos membros do Grupo Diretor EuropeanaTech e pela IA em relação ao Grupo de Trabalho GLAM. Avaliaram as propostas com base na sua relevância para o setor GLAM (25 %), relevância para a IA/ML (25 %), relação com a Europeana (30 %) e clareza da descrição e do plano de trabalho (20 %).
Anunciar os vencedores
Entidades nomeadas em textos arqueológicos
Esta proposta de uma equipa baseada na Universidade de Nápoles 'L'Orientale' visa criar um conjunto de dados para o Reconhecimento de Entidade Nomeada (NER) e a Extração de Termos para termos arqueológicos em italiano e inglês na coleção de Arqueologia da Europeana. NER é o processo de identificação de nomes próprios, como nomes de pessoas ou locais em texto não estruturado. Term Extraction é semelhante, mas concentra-se em encontrar termos especializados, neste caso do domínio da arqueologia. Vocabulários como Getty e CIDOC CRM serão considerados. O conjunto de dados final poderia ser utilizado no desenvolvimento e na avaliação de tecnologias baseadas na IA/LM para a ERN no domínio da arqueologia.
Os revisores apreciaram particularmente a estrutura clara e a maturidade da proposta, para a qual já foi elaborado um conjunto de dados simulado utilizando as API da Europeana para testar a abordagem proposta. O aspecto bilingue e a escassez de recursos abertos semelhantes para o campo da arqueologia também foram vistos como particularmente valiosos.
Zac Grace
Esta proposta de um estudante da Ecole Nationale d'Ingénieurs de Tarbes visa criar máscaras de píxeis para segmentação semântica, através da anotação manual de dados de imagem na coleção Europeana Fashion. Isto significa que, por exemplo, quando uma imagem é analisada, os elementos de moda relevantes (camisa, calças, sapatos) na imagem são depois marcados com os seus contornos de píxeis. Estes dados podem ser utilizados para a formação de um sistema de segmentação automatizado.

Os avaliadores apreciaram o âmbito e a compreensão claros do trabalho necessário para aplicar a proposta. Eles também pensaram que tinha um grande potencial de aplicação em diferentes coleções.
Os Contextos Contenciosos do Corpus
Esta proposta conjunta do Cluster de Humanidades da KNAW e do Centrum Wiskunde & Informatica nos Países Baixos pretende estabelecer um corpus anotado de termos contenciosos no contexto (ConConCor) dos jornais holandeses na Europeana. Estes podem então ser utilizados para iniciar e avaliar métodos (semi)automáticos para detetar tais termos em coleções de património cultural. Termos controversos aqui significam as palavras ou frases que são sugestivas de algum viés (implícito ou explícito) para ou contra um grupo, evento, ou de outra forma.
Os avaliadores valorizaram a forma como a presente proposta visa abordar um objetivo fundamental do desafio, a deteção de questões éticas e preconceitos inerentes às coleções digitalizadas do património cultural.
Serão disponibilizadas aos vencedores três bolsas de 2500 EUR cada, a fim de implementar as suas propostas e apresentar os conjuntos de dados correspondentes até ao final de junho de 2021.
Mais informações
Gostaríamos de agradecer a todos os que apresentaram uma proposta a este desafio pelo seu trabalho árduo e excelentes ideias. Estamos ansiosos para a implementação dos projetos vencedores e esperamos que outra rodada seja aberta no futuro para aqueles que não foram bem sucedidos desta vez!
Se quiser saber mais sobre oportunidades como esta e trabalhar em rede e colaborar com profissionais técnicos multidisciplinares de todo o mundo, junte-se à EuropeanaTech através da Europeana Network Association e siga a comunidade no Twitter.
Esta publicação foi editada em 16/04/21 para refletir o prazo alargado para os vencedores entregarem os seus conjuntos de dados.
