HAICu – projekts, kura mērķis ir piekļūt digitālā mantojuma kolekcijām, tās sasaistīt un analizēt, izmantojot mākslīgo intelektu, – 2023. gadā saņēma 10,3 miljonu EUR dotāciju no Nīderlandes Pētniecības padomes un tika uzsākts 2024. gada februārī. Jelle Posthuma, ietekmes/zinātnes žurnāliste Jantinas Tammesas Digitālās sabiedrības, tehnoloģiju un MI skolā, par projektu runā ar Rosemarie Van der Veen-Oei, Nīderlandes Nacionālās bibliotēkas (KB) Pētniecības departamenta vadītāju, konsorcija partneri.
Legāts no “CATCH”
HAICu izcelsme lielā mērā ir saistīta ar nepārtrauktu piekļuvi kultūras mantojumam jeb CATCH — 15 gadu pētniecības programmu, ko finansē Nīderlandes Pētniecības padome un Nīderlandes Izglītības, kultūras un zinātnes ministrija.
"HAICu nav balstīta uz CATCH, bet daudzi cilvēki no vienas kopienas ir iesaistīti," saka Van der Veen-Oei. "Nīderlandē CATCH sniedza nozīmīgu ieguldījumu pētniecībā IT un mantojuma iestāžu krustpunktā. Vēlāk tika pievienotas humanitārās zinātnes. CATCH mērķis bija padarīt digitālās kolekcijas pieejamas.
Pamatojoties uz unikālu partnerību
CATCH finansētie doktorantūras studenti divas dienas nedēļā tika izvietoti kultūras mantojuma iestādēs, saka Van der Veen-Oei. Tā rezultātā viņi strādāja ārpus akadēmiskās vides, un 15 gadu laikā viņi ieguva doktora grādus un pēcdoktorantūras grādus ar pieredzi un zināšanām par mantojuma nozari, digitālajām kolekcijām un akadēmisko pasauli. Ar šo sadarbību mantojuma iestādes spēra pirmos soļus akadēmiskajā vidē. “Tā bija unikāla partnerība starp akadēmiskajām aprindām un kultūras mantojuma iestādēm, un tā abām iestādēm radīja jauna veida zināšanas un zinātību.”
Projekts bija pirmā reize, kad daudzas kultūras mantojuma iestādes cieši sadarbojās ar IT pētniekiem. Van der Veen-Oei turpina: "IT pētniekiem savukārt pirmo reizi bija piekļuve kultūras mantojuma iestāžu digitālajām kolekcijām. Pēkšņi viņu rīcībā bija liels datu apjoms, lai apmācītu savus rīkus un algoritmus.
Nākamajā projektā CATCHPlus meklēja veidus, kā pārvērst prototipus vai demos par instrumentiem vai instrumentiem praksei. Galu galā mantojuma iestādes faktiski neizmantoja visus izstrādātos prototipus vai demonstrācijas, un digitālo kolekciju savienošana vēl nebija pabeigta. Ar HAICu mēs vēlamies spert vēl vienu soli uz priekšu. Tomēr šoreiz, izmantojot mākslīgā intelekta metodes.
Mākslīgā intelekta ieviešana
CATCH iesaistīto mantojuma iestāžu pētnieki un speciālisti vēlējās kopā ar kopienu turpināt izstrādāto projektu, ieviešot jaunas MI metodes. Van der Veen-Oei norāda, ka “mākslīgais intelekts ir attīstījies jau gadu desmitiem, bet mūsdienās mākslīgais intelekts var arī atbildīgi piešķirt nozīmi kolekcijām. Mēs vēlējāmies gudri izmantot šos sasniegumus, lai piekļūtu mūsu kolekcijām, sasaistītu tās un analizētu tās.
Mantojuma iestādes, piemēram, Nīderlandes Nacionālā bibliotēka (KB), saskaras ar jaunu datu pieaugumu. KB pašlaik ir aptuveni trīs petabaiti (trīs miljardi megabaitu) digitālo datu, saka Van der Veen-Oei. Līdz 2027. gadam bibliotēka plāno mitināt vairāk nekā piecus petabaitus datu. Piemēram, viens informācijas petabaits atbilst 1,8 kilometrus augstam tornim ar sakrautiem CD-ROM diskiem bez kastes. “Tādēļ mums ir vajadzīgi jauni rīki un metodes, lai tas būtu viegli un vienkārši.” Tieši tur tiek īstenots HAICu projekts.
Jaunas perspektīvas
Mākslīgais intelekts arī sniedz jaunas perspektīvas kolekcijām. Tas, kas agrāk bija diezgan normāls, mūsdienās dažkārt nav pieņemams. Mēs varam izmantot mākslīgo intelektu, lai parādītu vairākas perspektīvas. Pieņemsim terminu Zwarte Piet (Black Pete), kas parādās grāmatu nosaukumos pagātnē, bet šodien tiek apspriests. Mēs kā KB meklējam ieskatus un veidus, kā automātiski atklāt šo metadatu neobjektivitāti.
Tajā pašā laikā mākslīgais intelekts nodrošina datus ar kontekstu. Runa ir par to, kā mēs varam izmantot mantojuma datus, lai nodrošinātu pārredzamu un uzticamu pārdomu procesu par realitāti. Meklējot, jums tiek sniegtas idejas: Ieskatieties šajā kolekcijā vai arī šajā kolekcijā. Turklāt avoti tiek skatīti kontekstā. Lai pārbaudītu jaunus sasniegumus HAICu ietvaros, tiek izmantotas inovācijas laboratorijas.”
Multimodālas pieejas
Pēdējo divu gadu laikā ģeneratīvais mākslīgais intelekts ir kļuvis nozīmīgāks, izmantojot tādas sistēmas kā ChatGPT. "HAICu mēs vēlamies izmantot šo meklēšanas metodi arī mantojuma iestāžu kolekcijām."
Daudzveidībai vai dažādu avotu izmantošanai ir liela nozīme.
HAICu ietvaros dažādu kultūras mantojuma iestāžu kolekcijas ir savstarpēji saistītas. Tas ir ne tikai par tekstu, bet arī par video, audio un tā tālāk. Iepazīstieties ar datu kopu Delpher — tīmekļa vietni, kurā pieejami pilnteksta digitalizēti vēsturiskie laikraksti, grāmatas, žurnāli un kopijas radio ziņu pārraidēm holandiešu valodā. Cik brīnišķīgi būtu, ja mēs varētu savienot laikrakstu skenējumus ar, piemēram, Nīderlandes Skaņas un redzamības institūta (Beeld & Geluid) audiovizuālajiem materiāliem. Vienā meklēšanā jūs varat apkopot visu informāciju. Tieši par to ir runa HAICu.
Uzzināt vairāk
HAICu mērķis ir ne tikai izstrādāt un izmantot MI metodes un rīkus. Projekta mērķis ir veicināt starpdisciplināru un institucionālu sadarbību, izmantojot inovācijas laboratorijas un amatierzinātnes projektus. Šajās iniciatīvās tiks iesaistīti tie, kas pašlaik, iespējams, nav aktīvi iesaistīti HAICu. Ar šiem centieniem HAICu cer nodrošināt auglīgu augsni visu ieinteresēto personu ieguldījumam un kuratoru pakalpojumiem. Turklāt konsorcijs ir motivēts nodrošināt HAICu rezultātu ilgtermiņa integrāciju partnerorganizācijās un to tīklos.
Vai šis projekts izceļ jūsu zinātkāri? Skatiet HAICu tīmekļa vietni, lai uzzinātu par gaidāmajām vakancēm un jaunumiem, kā arī plašu interviju ar vienu no HAICu projekta vadītājiem.
Lai sekotu līdzi jaunākajām norisēm kultūras mantojuma nozares pētniecībā un izstrādē, veidotu kontaktus un sadarbotos, pievienojieties EuropeanaTech kopienai šodien!
