HAICu, un proyecto para acceder, vincular y analizar colecciones del patrimonio digital utilizando inteligencia artificial, recibió una subvención de 10,3 millones EUR del Consejo de Investigación de los Países Bajos en 2023 y comenzó en febrero de 2024. Jelle Posthuma, periodista de Impacto/Ciencia de la Escuela Jantina Tammes de Sociedad Digital, Tecnología e IA, habla con Rosemarie Van der Veen-Oei, jefa del Departamento de Investigación de la Biblioteca Nacional de los Países Bajos (KB), socia del consorcio, sobre el proyecto.
Un legado de la «CATCH»
Los orígenes de HAICu se derivan en gran medida del acceso continuo al patrimonio cultural, o CATCH, un programa de investigación de quince años financiado por el Consejo de Investigación de los Países Bajos y el Ministerio de Educación, Cultura y Ciencia de los Países Bajos.
"HAICu no se basa en CATCH, pero muchas personas de la misma comunidad están involucradas", dice Van der Veen-Oei. En los Países Bajos, CATCH hizo una importante contribución a la investigación en la intersección de las instituciones de TI y patrimonio. Más tarde, se añadieron las humanidades. El objetivo de CATCH era hacer accesibles las colecciones digitales".
Sobre la base de una asociación única
Los estudiantes de doctorado financiados por CATCH estaban estacionados en instituciones de patrimonio dos días a la semana, dice Van der Veen-Oei. Como resultado, trabajaron fuera de un entorno académico, y durante un período de 15 años, esto resultó en doctorados y postdoctorados con experiencia y conocimiento sobre el sector del patrimonio, las colecciones digitales y el mundo académico. Con esta colaboración, las instituciones de patrimonio dieron sus primeros pasos en la academia. "Fue una asociación única entre el mundo académico y las instituciones de patrimonio, y produjo un nuevo tipo de conocimiento y experiencia para ambas instituciones".
El proyecto fue la primera vez que muchas de las instituciones de patrimonio cooperaron estrechamente con investigadores de TI. Van der Veen-Oei continúa: "Los investigadores de TI, a su vez, tuvieron acceso a las colecciones digitales de las instituciones de patrimonio por primera vez. De repente tenían grandes cantidades de datos a su disposición para entrenar sus herramientas y algoritmos".
Un siguiente proyecto, CATCHPlus, buscó formas de convertir los prototipos o demostraciones en herramientas o instrumentos para la práctica. Al final, no todos los prototipos o demostraciones desarrollados fueron realmente puestos en uso por las instituciones de patrimonio, y la conexión de colecciones digitales aún no se había completado. Con HAICu, queremos ir un paso más allá. Esta vez, sin embargo, con la aplicación de técnicas de IA".
Incorporación de la inteligencia artificial
Los investigadores y profesionales de las instituciones patrimoniales involucradas en CATCH querían continuar con la comunidad que construyó el proyecto, incorporando nuevas técnicas de IA. Van der Veen-Oei señala que «la IA se ha desarrollado durante décadas, pero hoy en día también puede dar sentido a las colecciones de manera responsable. Queríamos utilizar estos desarrollos de forma inteligente para acceder, vincular y analizar nuestras colecciones".
Instituciones patrimoniales como la Biblioteca Nacional de los Países Bajos (KB) se enfrentan a un aumento de nuevos datos. El KB actualmente tiene alrededor de tres petabytes (tres mil millones de megabytes) de datos digitales, dice Van der Veen-Oei. Para 2027, la biblioteca espera albergar más de cinco petabytes de datos. Para ilustrar, un petabyte de información corresponde a una torre de 1,8 kilómetros de altura de discos CD-ROM apilados sin caja. «Para ello, necesitamos nuevas herramientas y técnicas que lo hagan fácil y sencillo». Ahí es donde entra en juego el proyecto HAICu.
Nuevas perspectivas
La inteligencia artificial también aporta nuevas perspectivas a las colecciones. Lo que solía ser bastante normal en el pasado a veces no es aceptable hoy en día. Podemos usar la IA para mostrar múltiples perspectivas. Tomemos el término Zwarte Piet (Black Pete), que aparece en títulos de libros en el pasado, pero está sujeto a debate en estos días. Nosotros, como KB, estamos buscando ideas y formas de detectar automáticamente este sesgo de metadatos".
Al mismo tiempo, la IA proporciona contexto a los datos. Se trata de cómo podemos utilizar los datos patrimoniales para proporcionar una reflexión transparente y fiable sobre la realidad. Durante la búsqueda, se le proporcionan ideas: Echa un vistazo a esta colección, o a esta. Además, las fuentes se colocan en contexto. Los laboratorios de innovación se utilizan para probar nuevos desarrollos dentro de HAICu.»
Enfoques multimodales
En los últimos dos años, la IA generativa ha crecido en prominencia a través de sistemas como ChatGPT. "En HAICu, también queremos utilizar este método de búsqueda para las colecciones de instituciones patrimoniales".
La multimodalidad, o el uso de diferentes fuentes, juega un papel importante.
Dentro de HAICu, las colecciones de diferentes instituciones patrimoniales están vinculadas. No se trata solo de texto, sino también de video, audio, etc. Tome el conjunto de datos Delpher, un sitio web que proporciona periódicos históricos digitalizados en holandés de texto completo, libros, revistas y hojas de copia para transmisiones de noticias de radio. Qué maravilloso sería si pudiéramos conectar los escaneos de periódicos con material audiovisual del Instituto Holandés de Sonido y Visión (Beeld & Geluid), por ejemplo. En una búsqueda, puede recopilar toda la información. De eso se trata HAICu".
Descubre más
HAICu tiene como objetivo ir más allá del simple desarrollo y uso de técnicas y herramientas de IA. El proyecto pretende promover la colaboración interdisciplinaria e institucional a través de laboratorios de innovación y proyectos de ciencia ciudadana. Estas iniciativas involucrarán a aquellos que pueden no estar involucrados activamente en HAICu actualmente. Con estos esfuerzos, HAICu espera proporcionar un caldo de cultivo fértil para los insumos y los servicios curatoriales de todas las partes interesadas. Además, el consorcio está motivado para garantizar la integración a largo plazo de los resultados de HAICu en las organizaciones asociadas y sus redes.
¿Este proyecto despierta tu curiosidad? Consulte el sitio web de HAICu para ver las próximas vacantes y actualizaciones, entre otras cosas, una extensa entrevista con uno de los líderes del proyecto HAICu.
Para mantenerse al día con los últimos avances en investigación y desarrollo en el sector del patrimonio cultural, establecer redes con pares y colaborar, ¡únase hoy a la Comunidad EuropeanaTech!
