HAICu-hanke, joka koskee digitaalisten perintökokoelmien saatavuutta, linkittämistä ja analysointia tekoälyn avulla, sai Alankomaiden tutkimusneuvostolta 10,3 miljoonan euron avustuksen vuonna 2023 ja käynnistyi helmikuussa 2024. Jantina Tammes School of Digital Society, Technology and AI:n vaikuttavuus-/tiedetoimittaja Jelle Posthuma puhuu hankkeesta Alankomaiden kansalliskirjaston (KB) tutkimusosaston päällikölle Rosemarie Van der Veen-Oeille konsortiokumppanina.
”CATCHin” perintö
HAICun juuret juontavat pitkälti kulttuuriperinnön jatkuvasta saatavuudesta eli CATCH-ohjelmasta, joka on Alankomaiden tutkimusneuvoston ja Alankomaiden opetus-, kulttuuri- ja tiedeministeriön rahoittama 15-vuotinen tutkimusohjelma.
"HAICu ei perustu CATCHiin, mutta monet ihmiset samasta yhteisöstä ovat mukana", Van der Veen-Oei sanoo. Alankomaissa CATCH antoi merkittävän panoksen tutkimukseen tietotekniikan ja kulttuuriperintölaitosten risteyksessä. Myöhemmin lisättiin humanistiset tieteet. CATCHin tavoitteena oli tehdä digitaalisista kokoelmista saavutettavia.
Perustuu ainutlaatuiseen kumppanuuteen
CATCHin rahoittamat tohtoriopiskelijat sijoitettiin kulttuuriperintölaitoksiin kahtena päivänä viikossa, Van der Veen-Oei sanoo. Tämän seurauksena he työskentelivät akateemisen ympäristön ulkopuolella, ja 15 vuoden aikana tämä johti tohtoreihin ja postdoc-tutkijoihin, joilla oli kokemusta ja tietoa kulttuuriperintöalasta, digitaalisista kokoelmista ja akateemisesta maailmasta. Tämän yhteistyön myötä kulttuuriperintölaitokset ottivat ensimmäiset askeleensa akateemiseen maailmaan. Se oli ainutlaatuinen kumppanuus korkeakoulujen ja kulttuuriperintölaitosten välillä, ja se tuotti uudenlaista tietoa ja asiantuntemusta molemmille laitoksille.
Hanke oli ensimmäinen kerta, kun monet kulttuuriperintölaitokset tekivät tiivistä yhteistyötä IT-tutkijoiden kanssa. Van der Veen-Oei jatkaa: "Tietotekniikan tutkijat puolestaan pääsivät ensimmäistä kertaa käsiksi kulttuuriperintölaitosten digitaalisiin kokoelmiin. Heillä oli yhtäkkiä käytössään suuria määriä dataa työkalujensa ja algoritmiensa kouluttamiseen.
Seuraava projekti, CATCHPlus, etsi tapoja muuntaa prototyypit tai demot käytännön työkaluiksi tai instrumenteiksi. Kaikkia kehitettyjä prototyyppejä tai demoja ei lopulta otettu käyttöön kulttuuriperintölaitoksissa, eikä yhdistäviä digitaalisia kokoelmia ollut vielä saatu valmiiksi. HAICun kanssa haluamme mennä askeleen pidemmälle. Tällä kertaa kuitenkin tekoälytekniikoiden käytöllä.
Tekoälyn käyttöönotto
CATCH-hankkeessa mukana olevien kulttuuriperintölaitosten tutkijat ja ammattilaiset halusivat jatkaa hankkeen rakentamaa yhteisöä ja tuoda uusia tekoälytekniikoita. Van der Veen-Oei toteaa, että tekoälyä on kehitetty vuosikymmeniä, mutta nykyään tekoäly voi myös antaa kokoelmille merkityksen vastuullisella tavalla. Halusimme käyttää näitä kehityssuuntia älykkäästi käyttääksemme, linkittääksemme ja analysoidaksemme kokoelmiamme.
Alankomaiden kansalliskirjaston (KB) kaltaiset kulttuuriperintölaitokset kohtaavat uuden tiedon lisääntymistä. KB:llä on tällä hetkellä noin kolme petatavua (kolme miljardia megatavua) digitaalista dataa, Van der Veen-Oei sanoo. Vuoteen 2027 mennessä kirjastossa odotetaan olevan yli viisi petatavua dataa. Yksi petatavu tietoa vastaa 1,8 kilometrin korkuista pinottujen CD-ROM-levyjen tornia ilman laatikkoa. ”Tätä varten tarvitaan uusia välineitä ja tekniikoita, jotta se olisi helppoa ja yksinkertaista.” HAICu-hanke on tässä mukana.
Uusia näkökulmia
Tekoäly tuo myös uusia näkökulmia kokoelmiin. Se, mikä ennen oli aivan normaalia, ei nykyään aina ole hyväksyttävää. Voimme käyttää tekoälyä näyttämään useita näkökulmia. Otetaan termi Zwarte Piet (Black Pete), joka esiintyy kirjojen otsikoissa aiemmin, mutta josta keskustellaan nykyään. Me KB:nä etsimme oivalluksia ja tapoja havaita tämä metadatan vääristymä automaattisesti.
Samalla tekoäly tarjoaa datalle kontekstin. Kyse on siitä, miten voimme käyttää perintötietoja läpinäkyvän ja luotettavan todellisuuden pohtimiseen. Kun etsit, saat ideoita: Katsokaa tätä kokoelmaa tai tätä. Lisäksi lähteet sijoitetaan asiayhteyteen. Innovaatiolaboratorioita käytetään uuden kehityksen testaamiseen HAICussa.”
Multimodaaliset lähestymistavat
Kahden viime vuoden aikana generatiivinen tekoäly on kasvanut näkyvästi ChatGPT:n kaltaisten järjestelmien kautta. HAICussa haluamme käyttää tätä hakumenetelmää myös kulttuuriperintölaitosten kokoelmiin.
Multimodaalisuudella eli eri lähteiden käytöllä on suuri merkitys.
HAICussa eri kulttuuriperintölaitosten kokoelmat ovat yhteydessä toisiinsa. Kyse ei ole vain tekstistä, vaan myös videosta, äänestä ja niin edelleen. Otetaan Delpher-tietoaineisto, verkkosivusto, joka tarjoaa kokotekstisiä hollanninkielisiä digitoituja historiallisia sanomalehtiä, kirjoja, lehtiä ja kopiolomakkeita radio-uutislähetyksiin. Kuinka hienoa olisikaan, jos voisimme yhdistää sanomalehtien skannaukset esimerkiksi Alankomaiden ääni- ja visioinstituutin (Beeld & Geluid) audiovisuaaliseen materiaaliin. Yhdellä haulla voit kerätä kaikki tiedot. Siitä HAICUssa on kyse.
Lue lisää
HAICu pyrkii ylittämään pelkän tekoälytekniikoiden ja -työkalujen kehittämisen ja hyödyntämisen. Hankkeen tarkoituksena on edistää tieteidenvälistä ja institutionaalista yhteistyötä innovaatiolaboratorioiden ja kansalaistiedehankkeiden kautta. Näihin aloitteisiin otetaan mukaan ne, jotka eivät ehkä ole aktiivisesti mukana HAICussa tällä hetkellä. Näillä toimilla HAICu odottaa tarjoavansa hedelmällisen kasvualustan kaikkien sidosryhmien panos- ja kuraattoripalveluille. Lisäksi konsortio on motivoitunut varmistamaan HAICun tulosten pitkän aikavälin integroinnin kumppaniorganisaatioihin ja niiden verkostoihin.
Herättääkö tämä projekti uteliaisuutesi? Tutustu HAICun verkkosivustolla tuleviin avoimiin työpaikkoihin ja päivityksiin, muun muassa yhden HAICu-hankkeen vetäjän laajaan haastatteluun.
Pysyäksesi ajan tasalla kulttuuriperintöalan tutkimus- ja kehitystyön viimeaikaisesta kehityksestä, verkostoituaksesi vertaisryhmien kanssa ja tehdäksesi yhteistyötä, liity EuropeanaTech-yhteisöön tänään!
