HAICu, un progetto per accedere, collegare e analizzare le collezioni del patrimonio digitale utilizzando l'intelligenza artificiale, ha ricevuto una sovvenzione di 10,3 milioni di EUR dal Consiglio olandese della ricerca nel 2023 e ha preso il via nel febbraio 2024. Jelle Posthuma, giornalista di Impact/Science per la Jantina Tammes School of Digital Society, Technology and AI, parla del progetto a Rosemarie Van der Veen-Oei, capo del dipartimento di ricerca presso la Biblioteca nazionale dei Paesi Bassi (KB), partner del consorzio.
Un lascito di "CATCH"
Le origini di HAICu derivano in gran parte dall'accesso continuo al patrimonio culturale, o CATCH, un programma di ricerca di 15 anni finanziato dal Consiglio olandese della ricerca e dal ministero olandese dell'Istruzione, della cultura e della scienza.
"HAICu non si basa su CATCH, ma sono coinvolte molte persone della stessa comunità", afferma Van der Veen-Oei. Nei Paesi Bassi, CATCH ha dato un importante contributo alla ricerca all'intersezione tra IT e istituti di tutela del patrimonio. Successivamente sono state aggiunte le discipline umanistiche. L'obiettivo di CATCH era rendere accessibili le collezioni digitali.
Basandosi su una partnership unica
I dottorandi finanziati da CATCH erano di stanza presso gli istituti di tutela del patrimonio due giorni alla settimana, afferma Van der Veen-Oei. Di conseguenza, hanno lavorato al di fuori di un ambiente accademico e, per un periodo di 15 anni, questo ha portato a dottorati di ricerca e postdoc con esperienza e conoscenza del settore del patrimonio, delle collezioni digitali e del mondo accademico. Con questa collaborazione, le istituzioni del patrimonio hanno mosso i primi passi nel mondo accademico. "È stata una partnership unica tra il mondo accademico e le istituzioni del patrimonio e ha prodotto un nuovo tipo di conoscenza e competenza per entrambe le istituzioni".
Il progetto è stato la prima volta che molte delle istituzioni del patrimonio hanno collaborato strettamente con i ricercatori IT. Van der Veen-Oei continua: "I ricercatori IT, a loro volta, hanno avuto accesso alle collezioni digitali degli istituti di tutela del patrimonio per la prima volta. Improvvisamente avevano grandi quantità di dati a loro disposizione per addestrare i loro strumenti e algoritmi.
Un progetto successivo, CATCHPlus, ha cercato di trovare modi per convertire i prototipi o le demo in strumenti o strumenti per la pratica. Alla fine, non tutti i prototipi o le demo sviluppati sono stati effettivamente messi in uso dalle istituzioni del patrimonio e le collezioni digitali di connessione non erano ancora state completate. Con HAICu, vogliamo fare un ulteriore passo avanti. Questa volta, tuttavia, con l'applicazione di tecniche di IA.
Introdurre l'intelligenza artificiale
Ricercatori e professionisti delle istituzioni del patrimonio coinvolte in CATCH hanno voluto portare avanti con la comunità il progetto costruito, introducendo nuove tecniche di IA. Van der Veen-Oei osserva che "l'IA si sviluppa da decenni, ma oggi può anche dare un significato alle collezioni in modo responsabile. Volevamo utilizzare questi sviluppi in modo intelligente per accedere, collegare e analizzare le nostre collezioni".
Le istituzioni del patrimonio come la Biblioteca Nazionale dei Paesi Bassi (KB) stanno affrontando un'ondata di nuovi dati. La KB ha attualmente circa tre petabyte (tre miliardi di megabyte) di dati digitali, afferma Van der Veen-Oei. Entro il 2027, la biblioteca prevede di ospitare oltre cinque petabyte di dati. Per illustrare, un petabyte di informazioni corrisponde a una torre di 1,8 chilometri di dischi CD-ROM impilati senza scatola. "Per questo, abbiamo bisogno di nuovi strumenti e tecniche per renderlo facile e semplice". È qui che entra in gioco il progetto HAICu.
Nuove prospettive
L'intelligenza artificiale porta anche nuove prospettive alle collezioni. Ciò che in passato era normale a volte non è accettabile al giorno d'oggi. Possiamo usare l'IA per mostrare più prospettive. Prendete il termine Zwarte Piet (Black Pete), che appare nei titoli dei libri in passato, ma è oggetto di dibattito in questi giorni. Noi come KB siamo alla ricerca di approfondimenti e modi per rilevare automaticamente questa distorsione dei metadati.
Allo stesso tempo, l'IA fornisce ai dati il contesto. Si tratta di come possiamo utilizzare i dati del patrimonio per fornire una riflessione trasparente e affidabile sulla realtà. Durante la ricerca, ti vengono fornite idee: Date un'occhiata a questa collezione, o a questa. Inoltre, le fonti sono collocate nel contesto. I laboratori di innovazione sono utilizzati per testare nuovi sviluppi all'interno di HAICu."
Approcci multimodali
Negli ultimi due anni, l'IA generativa è cresciuta in risalto attraverso sistemi come ChatGPT. "In HAICu, vogliamo utilizzare questo metodo di ricerca anche per le collezioni delle istituzioni del patrimonio".
La multimodalità, o l'utilizzo di fonti diverse, gioca un ruolo importante.
All'interno di HAICu, le collezioni di diverse istituzioni del patrimonio sono collegate. Non si tratta solo di testo, ma anche di video, audio e così via. Prendiamo il set di dati Delpher, un sito web che fornisce giornali storici, libri, riviste e fogli di copia digitalizzati in lingua olandese per le trasmissioni radiofoniche di notizie. Sarebbe meraviglioso se potessimo collegare le scansioni dei giornali con il materiale audiovisivo dell'Istituto olandese per il suono e la visione (Beeld & Geluid), per esempio. In una ricerca, è possibile raccogliere tutte le informazioni. Questo è ciò che HAICu è tutto.
Scopri di più
HAICu mira ad andare oltre il semplice sviluppo e utilizzo di tecniche e strumenti di IA. Il progetto intende promuovere la collaborazione interdisciplinare e istituzionale attraverso laboratori di innovazione e progetti di citizen science. Queste iniziative coinvolgeranno coloro che potrebbero non essere attivamente coinvolti in HAICu attualmente. Con questi sforzi, HAICu si aspetta di fornire un terreno fertile per l'input e i servizi curatoriali di tutte le parti interessate. Inoltre, il consorzio è motivato a garantire l'integrazione a lungo termine dei risultati HAICu nelle organizzazioni partner e nelle loro reti.
Questo progetto suscita la tua curiosità? Consulta il sito web di HAICu per i prossimi posti vacanti e aggiornamenti, tra cui un'ampia intervista con uno dei responsabili del progetto HAICu.
Per rimanere aggiornato sugli ultimi sviluppi in materia di ricerca e sviluppo nel settore del patrimonio culturale, fare rete con i colleghi e collaborare, aderisci oggi alla Comunità EuropeanaTech!
