O HAICu, um projeto para aceder, ligar e analisar coleções do património digital utilizando a inteligência artificial, recebeu uma subvenção de 10,3 milhões de EUR do Conselho de Investigação neerlandês em 2023 e teve início em fevereiro de 2024. Jelle Posthuma, jornalista de impacto/ciência da Escola Jantina Tammes de Sociedade Digital, Tecnologia e IA, fala com Rosemarie Van der Veen-Oei, chefe do Departamento de Investigação da Biblioteca Nacional dos Países Baixos (KB), parceira do consórcio, sobre o projeto.
Um legado da «CATCH»
As origens do HAICu decorrem, em grande medida, do Acesso Contínuo ao Património Cultural, ou CATCH, um programa de investigação de 15 anos financiado pelo Conselho de Investigação neerlandês e pelo Ministério da Educação, Cultura e Ciência neerlandês.
"HAICu não é baseado no CATCH, mas muitas pessoas da mesma comunidade estão envolvidas", diz Van der Veen-Oei. Nos Países Baixos, o CATCH deu um importante contributo para a investigação na intersecção das instituições de TI e do património. Mais tarde, as humanidades foram adicionadas. O objetivo do Catch era tornar as coleções digitais acessíveis.
Com base numa parceria única
Os estudantes de doutoramento financiados pelo CATCH estavam estacionados em instituições patrimoniais dois dias por semana, diz Van der Veen-Oei. Como resultado, trabalharam fora de um ambiente académico, e ao longo de um período de 15 anos, isto resultou em doutoramentos e pós-doutoramentos com experiência e conhecimento sobre o setor do património, coleções digitais e o mundo académico. Com esta colaboração, as instituições responsáveis pelo património deram os seus primeiros passos no meio académico. Tratou-se de uma parceria única entre o meio académico e as instituições responsáveis pelo património e produziu um novo tipo de conhecimento e especialização para ambas as instituições.
O projeto foi a primeira vez que muitas das instituições do património cooperaram estreitamente com investigadores de TI. Van der Veen-Oei continua, 'Investigadores de TI, por sua vez, tiveram acesso às coleções digitais de instituições de património pela primeira vez. De repente, tinham grandes quantidades de dados à sua disposição para treinar as suas ferramentas e algoritmos.
Um projeto seguinte, CATCHPlus, procurou encontrar maneiras de converter os protótipos ou demos em ferramentas ou instrumentos para a prática. No final, nem todos os protótipos ou demos desenvolvidos foram efetivamente utilizados pelas instituições responsáveis pelo património e a ligação das coleções digitais ainda não tinha sido concluída. Com a HAICu, queremos ir mais longe. Desta vez, no entanto, com a aplicação de técnicas de IA.
Introdução à inteligência artificial
Investigadores e profissionais das instituições de património envolvidas no CATCH quiseram continuar com a comunidade que o projeto construiu, trazendo novas técnicas de IA. Van der Veen-Oei observa que «a IA tem vindo a desenvolver-se há décadas, mas hoje em dia a IA também pode dar significado às coleções de forma responsável. Queríamos usar estes desenvolvimentos de forma inteligente para aceder, ligar e analisar as nossas coleções.
Instituições do património como a Biblioteca Nacional dos Países Baixos (KB) estão a enfrentar um aumento de novos dados. Atualmente, o KB tem cerca de três petabytes (três mil milhões de megabytes) de dados digitais, diz Van der Veen-Oei. Até 2027, a biblioteca espera hospedar mais de cinco petabytes de dados. Para ilustrar, um petabyte de informação corresponde a uma torre de 1,8 km de altura de discos CD-ROM empilhados sem caixa. «Para isso, precisamos de novas ferramentas e técnicas para o tornar fácil e simples.» É aí que entra o projeto HAICu.
Novas perspetivas
A inteligência artificial também traz novas perspetivas para as coleções. O que costumava ser bastante normal no passado às vezes não é aceitável hoje em dia. Podemos usar a IA para mostrar múltiplas perspetivas. Tome o termo Zwarte Piet (Black Pete), que aparece em títulos de livros no passado, mas está sujeito a debate nos dias de hoje. Nós, como KB, estamos à procura de insights e maneiras de detectar automaticamente este viés de metadados.
Ao mesmo tempo, a IA fornece os dados com contexto. Trata-se de como podemos utilizar os dados do património para proporcionar uma reflexão transparente e fiável sobre a realidade. Durante a pesquisa, são-lhe fornecidas ideias: dar uma vista de olhos nesta coleção, ou nesta. Além disso, as fontes são contextualizadas. Os laboratórios de inovação são utilizados para testar novos desenvolvimentos no âmbito da HAICu.»
Abordagens multimodais
Nos últimos dois anos, a IA generativa cresceu em destaque através de sistemas como o ChatGPT. Na HAICu, queremos utilizar este método de pesquisa também para as coleções de instituições responsáveis pelo património.
A multimodalidade, ou a utilização de diferentes fontes, desempenha um papel importante.
Dentro do HAICu, as coleções de diferentes instituições patrimoniais estão ligadas. Não se trata apenas de texto, mas também de vídeo, áudio, etc. Veja-se o conjunto de dados Delpher, um sítio Web que disponibiliza jornais históricos, livros, revistas e folhas de cópia digitalizados em língua neerlandesa e de texto integral para as transmissões de notícias de rádio. Como seria maravilhoso se pudéssemos ligar as digitalizações de jornais com material audiovisual do Instituto Neerlandês de Som e Visão (Beeld & Geluid), por exemplo. Numa só pesquisa, pode recolher toda a informação. É disso que se trata o HAICu.
Mais informações
A HAICu pretende ir além do simples desenvolvimento e utilização de técnicas e ferramentas de IA. O projeto pretende promover a colaboração interdisciplinar e institucional através de laboratórios de inovação e projetos de ciência cidadã. Estas iniciativas envolverão aqueles que podem não estar ativamente envolvidos no HAICu atualmente. Com estes esforços, a HAICu espera fornecer um terreno fértil para contribuições e serviços curatoriais de todas as partes interessadas. Além disso, o consórcio está motivado para assegurar a integração a longo prazo dos resultados do HAICu nas organizações parceiras e respetivas redes.
Este projeto desperta a sua curiosidade? Consulte o sítio Web da HAICu para obter ofertas de emprego e atualizações futuras, entre outras, uma entrevista exaustiva com um dos líderes do projeto HAICu.
Para se manter a par dos mais recentes desenvolvimentos em matéria de investigação e desenvolvimento no setor do património cultural, estabelecer uma rede com os seus pares e colaborar, junte-se hoje à Comunidade EuropeanaTech!
