HAICu, un projet visant à accéder aux collections du patrimoine numérique, à les relier et à les analyser au moyen de l’intelligence artificielle, a reçu une subvention de 10,3 millions d’euros du Conseil néerlandais de la recherche en 2023 et a démarré en février 2024. Jelle Posthuma, journaliste scientifique pour la Jantina Tammes School of Digital Society, Technology and AI, s’entretient avec Rosemarie Van der Veen-Oei, directrice du département de recherche de la Bibliothèque nationale des Pays-Bas (KB), partenaire du consortium, à propos du projet.
Un héritage de «CATCH»
Les origines de HAICu proviennent en grande partie de l’accès continu au patrimoine culturel, ou CATCH, un programme de recherche de 15 ans financé par le Conseil néerlandais de la recherche et le ministère néerlandais de l’éducation, de la culture et des sciences.
«HAICu n'est pas basé sur CATCH, mais beaucoup de gens de la même communauté sont impliqués», explique Van der Veen-Oei. Aux Pays-Bas, CATCH a apporté une contribution importante à la recherche à l'intersection des institutions informatiques et patrimoniales. Plus tard, les sciences humaines ont été ajoutées. L'objectif de CATCH était de rendre les collections numériques accessibles. »
S'appuyer sur un partenariat unique
Les doctorants financés par CATCH étaient en poste dans des institutions patrimoniales deux jours par semaine, explique Van der Veen-Oei. En conséquence, ils ont travaillé en dehors d'un environnement académique, et sur une période de 15 ans, cela a abouti à des doctorats et des postdocs avec une expérience et des connaissances sur le secteur du patrimoine, les collections numériques et le monde académique. Grâce à cette collaboration, les institutions patrimoniales ont fait leurs premiers pas dans le milieu universitaire. Il s'agissait d'un partenariat unique entre les universités et les institutions du patrimoine, et il a produit un nouveau type de connaissances et d'expertise pour les deux institutions.
C'était la première fois qu'un grand nombre d'institutions patrimoniales coopéraient étroitement avec des chercheurs en TI. Van der Veen-Oei poursuit : « Les chercheurs en informatique, à leur tour, ont eu accès pour la première fois aux collections numériques des institutions patrimoniales. Ils avaient soudainement de grandes quantités de données à leur disposition pour former leurs outils et leurs algorithmes.
Un projet suivant, CATCHPlus, a cherché des moyens de convertir les prototypes ou les démonstrations en outils ou instruments pour la pratique. En fin de compte, tous les prototypes ou démos développés n'ont pas été réellement utilisés par les institutions patrimoniales, et la connexion des collections numériques n'avait pas encore été achevée. « Avec HAICu, nous voulons aller un peu plus loin. Cette fois, cependant, avec l'application de techniques d'IA.
Intégrer l'intelligence artificielle
Les chercheurs et les professionnels des institutions patrimoniales impliquées dans CATCH ont voulu poursuivre avec la communauté le projet construit, en apportant de nouvelles techniques d'IA. Van der Veen-Oei note que «l’IA se développe depuis des décennies, mais aujourd’hui, l’IA peut également donner un sens aux collections de manière responsable. Nous voulions utiliser ces développements intelligemment pour accéder, relier et analyser nos collections. »
Les institutions patrimoniales comme la Bibliothèque nationale des Pays-Bas (BK) sont confrontées à une augmentation des nouvelles données. La KB dispose actuellement d'environ trois pétaoctets (trois milliards de mégaoctets) de données numériques, explique Van der Veen-Oei. D'ici 2027, la bibliothèque prévoit d'héberger plus de cinq pétaoctets de données. Pour illustrer, un pétaoctet d'informations correspond à une tour de 1,8 kilomètre de haut de disques CD-ROM empilés sans boîte. «Pour cela, nous avons besoin de nouveaux outils et de nouvelles techniques pour le rendre facile et simple.» C’est là qu’intervient le projet HAICu.
Nouvelles perspectives
L'intelligence artificielle apporte également de nouvelles perspectives aux collections. Ce qui était tout à fait normal dans le passé n'est parfois pas acceptable de nos jours. Nous pouvons utiliser l'IA pour montrer de multiples perspectives. Prenez le terme Zwarte Piet (Black Pete), qui apparaît dans les titres de livres dans le passé, mais est sujet à débat ces jours-ci. En tant que KB, nous recherchons des informations et des moyens de détecter automatiquement ce biais de métadonnées.
Dans le même temps, l'IA fournit aux données un contexte. Il s'agit de la façon dont nous pouvons utiliser les données patrimoniales pour fournir une réflexion transparente et fiable sur la réalité. Lors de la recherche, vous avez des idées: Jetez un coup d'œil dans cette collection, ou celle-ci. En outre, les sources sont mises en contexte. Les laboratoires d’innovation sont utilisés pour tester de nouveaux développements au sein de HAICu.»
Approches multimodales
Au cours des deux dernières années, l'IA générative a pris de l'importance grâce à des systèmes tels que ChatGPT. Chez HAICu, nous voulons également utiliser cette méthode de recherche pour les collections des institutions patrimoniales.
La multimodalité, ou l'utilisation de différentes sources, joue un grand rôle.
Au sein de HAICu, les collections des différentes institutions patrimoniales sont liées. Il ne s'agit pas seulement de texte, mais aussi de vidéo, audio et ainsi de suite. Prenez l'ensemble de données Delpher, un site Web fournissant en texte intégral des journaux historiques numérisés en néerlandais, des livres, des revues et des feuilles de copie pour les émissions d'actualités radiophoniques. Comme ce serait merveilleux si nous pouvions relier les scans des journaux avec du matériel audiovisuel de l'Institut néerlandais du son et de la vision (Beeld & Geluid), par exemple. En une seule recherche, vous pouvez rassembler toutes les informations. C'est de cela qu'il s'agit, HAICu. »
En savoir plus
HAICu vise à aller au-delà du simple développement et de l'utilisation de techniques et d'outils d'IA. Le projet vise à promouvoir la collaboration interdisciplinaire et institutionnelle par le biais de laboratoires d'innovation et de projets de science citoyenne. Ces initiatives mobiliseront ceux qui ne sont peut-être pas activement impliqués dans HAICu actuellement. Grâce à ces efforts, HAICu s'attend à fournir un terrain fertile pour l'apport et les services de conservation de toutes les parties prenantes. En outre, le consortium est motivé pour assurer l'intégration à long terme des résultats de HAICu dans les organisations partenaires et leurs réseaux.
Ce projet pique-t-il votre curiosité? Consultez le site web du HAICu pour connaître les offres d’emploi et les mises à jour à venir, notamment un entretien approfondi avec l’un des chefs de projet du HAICu.
Pour rester au courant des derniers développements en matière de recherche et développement dans le secteur du patrimoine culturel, réseauter avec des pairs et collaborer, rejoignez la communauté EuropeanaTech dès aujourd'hui!
