HAICu, et projekt om adgang til, sammenkobling og analyse af samlinger af digital kulturarv ved hjælp af kunstig intelligens, modtog et tilskud på 10,3 mio. EUR fra det nederlandske forskningsråd i 2023 og startede i februar 2024. Jelle Posthuma, Impact/Science journalist for Jantina Tammes School of Digital Society, Technology and AI, taler med Rosemarie Van der Veen-Oei, leder af forskningsafdelingen ved National Library of the Netherlands (KB), konsortiepartner, om projektet.
Et eftermæle fra "CATCH"
HAICus oprindelse stammer i vid udstrækning fra kontinuerlig adgang til kulturarv eller CATCH, et 15-årigt forskningsprogram finansieret af det nederlandske forskningsråd og det nederlandske ministerium for uddannelse, kultur og videnskab.
"HAICu er ikke baseret på CATCH, men mange mennesker fra samme samfund er involveret," siger Van der Veen-Oei. I Holland har CATCH ydet et vigtigt bidrag til forskningen i krydsfeltet mellem it- og kulturarvsinstitutioner. Senere blev humaniora tilføjet. CATCHs mål var at gøre digitale samlinger tilgængelige.
Bygger på et unikt partnerskab
De ph.d.-studerende, der blev finansieret af CATCH, var udstationeret på kulturarvsinstitutioner to dage om ugen, siger Van der Veen-Oei. Som følge heraf arbejdede de uden for et akademisk miljø, og over en periode på 15 år resulterede dette i ph.d.'er og postdocs med erfaring og viden om kulturarvssektoren, digitale samlinger og den akademiske verden. Med dette samarbejde tog kulturarvsinstitutioner deres første skridt ind i den akademiske verden. Det var et unikt partnerskab mellem den akademiske verden og kulturarvsinstitutioner, og det skabte en ny form for viden og ekspertise for begge institutioner.
Projektet var første gang, at mange af kulturarvsinstitutionerne arbejdede tæt sammen med it-forskere. Van der Veen-Oei fortsætter: "IT-forskere havde igen for første gang adgang til kulturarvsinstitutioners digitale samlinger. De havde pludselig store mængder data til rådighed til at træne deres værktøjer og algoritmer.
Et efterfølgende projekt, CATCHPlus, søgte at finde måder at konvertere prototyper eller demoer til værktøjer eller instrumenter til praksis. I sidste ende blev ikke alle udviklede prototyper eller demoer faktisk taget i brug af kulturarvsinstitutionerne, og tilslutning af digitale samlinger var endnu ikke afsluttet. Med HAICu ønsker vi at gå et skridt videre. Denne gang dog med anvendelse af AI-teknikker.
Indførelse af kunstig intelligens
Forskere og fagfolk fra de kulturarvsinstitutioner, der er involveret i CATCH, ønskede at fortsætte med det samfund, projektet byggede op, og bringe nye AI-teknikker ind. Van der Veen-Oei bemærker, at AI har udviklet sig i årtier, men at AI i dag også kan give samlinger mening på en ansvarlig måde. Vi ønskede at bruge disse udviklinger intelligent til at få adgang til, linke til og analysere vores samlinger.
Kulturarvsinstitutioner som National Library of the Netherlands (KB) står over for en stigning i nye data. KB har i øjeblikket omkring tre petabyte (tre milliarder megabyte) digitale data, siger Van der Veen-Oei. I 2027 forventer biblioteket at være vært for over fem petabyte data. For at illustrere svarer en petabyte information til et 1,8 kilometer højt tårn af stablede cd-rom-diske uden en kasse. "Dertil har vi brug for nye værktøjer og teknikker til at gøre det nemt og enkelt." Det er her, HAICu-projektet kommer ind i billedet.
Nye perspektiver
Kunstig intelligens bringer også nye perspektiver til samlinger. Det, der tidligere var helt normalt, er nogle gange ikke acceptabelt i dag. Vi kan bruge AI til at vise flere perspektiver. Tag udtrykket Zwarte Piet (Black Pete), som vises i bogtitler i fortiden, men er genstand for debat i disse dage. Vi som KB er på udkig efter indsigt og måder til automatisk at opdage denne metadata bias.
Samtidig giver AI dataene kontekst. Det handler om, hvordan vi kan bruge arvsdata til at give en gennemsigtig og troværdig refleksion over virkeligheden. Mens du søger, får du ideer: Tag et kig i denne samling, eller denne. Hertil kommer, at kilderne sættes i kontekst. Innovationslaboratorier anvendes til at afprøve nye udviklinger inden for HAICu."
Multimodale tilgange
I de sidste to år er generativ AI vokset i fremtrædende gennem systemer som ChatGPT. Hos HAICu vil vi også bruge denne søgemetode til kulturarvsinstitutioners samlinger.
Multimodalitet, eller ved hjælp af forskellige kilder, spiller en stor rolle.
Inden for HAICu er samlinger fra forskellige kulturarvsinstitutioner forbundet. Det handler ikke kun om tekst, men også om video, lyd og så videre. Tag datasættet Delpher, et websted, der leverer fuldtekst hollandsksprogede digitaliserede historiske aviser, bøger, tidsskrifter og kopiark til radionyhedsudsendelser. Hvor ville det være vidunderligt, hvis vi kunne forbinde scanningerne af aviser med audiovisuelt materiale fra det nederlandske institut for lyd og vision (Beeld & Geluid), for eksempel. I en søgning kan du samle alle oplysninger. Det er det, HAICU handler om.
Læs mere
HAICu har til formål at gå videre end blot at udvikle og anvende AI-teknikker og -værktøjer. Projektet har til formål at fremme tværfagligt og institutionelt samarbejde gennem innovationslaboratorier og borgervidenskabelige projekter. Disse initiativer vil inddrage dem, der måske ikke er aktivt involveret i HAICu i øjeblikket. Med disse bestræbelser forventer HAICu at skabe et frugtbart grobund for input og kuratoriske tjenester fra alle interessenter. Desuden er konsortiet motiveret til at sikre langsigtet integration af HAICu-resultater i partnerorganisationer og deres netværk.
Har projektet vækket din nysgerrighed? Tjek HAICus websted for kommende ledige stillinger og opdateringer, bl.a. et omfattende interview med en af HAICu-projektlederne.
For at holde dig ajour med den seneste udvikling inden for forskning og udvikling i kulturarvssektoren, netværk med jævnaldrende og samarbejde, tilmeld dig EuropeanaTech Community i dag!
