HAICu, projekt za pristup zbirkama digitalne baštine s pomoću umjetne inteligencije, njihovo povezivanje i analizu, primio je 2023. bespovratna sredstva nizozemskog istraživačkog vijeća u iznosu od 10,3 milijuna eura, a započeo je u veljači 2024. Jelle Posthuma, novinarka Impact/Science za Jantina Tammes School of Digital Society, Technology and AI, govori o projektu s Rosemarie Van der Veen-Oei, voditeljicom Odjela za istraživanje u Nacionalnoj knjižnici Nizozemske (KB), partnericom konzorcija.
Nasljeđe „CATCH-a”
Podrijetlo HAICua uglavnom proizlazi iz kontinuiranog pristupa kulturnoj baštini ili CATCH-a, petnaestogodišnjeg istraživačkog programa koji financiraju nizozemsko istraživačko vijeće i nizozemsko Ministarstvo obrazovanja, kulture i znanosti.
"HAICu se ne temelji na CATCH-u, ali su uključeni mnogi ljudi iz iste zajednice", kaže Van der Veen-Oei. U Nizozemskoj je CATCH dao važan doprinos istraživanju na sjecištu IT i baštinskih institucija. Kasnije su dodane i humanističke znanosti. Cilj CATCH-a bio je omogućiti dostupnost digitalnih zbirki.
Nadovezujući se na jedinstveno partnerstvo
Doktorski studenti financirani od strane CATCH-a bili su smješteni u baštinskim ustanovama dva dana u tjednu, kaže Van der Veen-Oei. Kao rezultat toga, radili su izvan akademskog okruženja, a tijekom razdoblja od 15 godina to je rezultiralo doktoratima i postdoktorandima s iskustvom i znanjem o sektoru baštine, digitalnim zbirkama i akademskom svijetu. Zahvaljujući toj suradnji institucije kulturne baštine poduzele su prve korake u akademskoj zajednici. „Bilo je to jedinstveno partnerstvo između akademske zajednice i baštinskih institucija te je proizvelo novu vrstu znanja i stručnosti za obje institucije.”
Projekt je bio prvi put da su mnoge baštinske institucije blisko surađivale s IT istraživačima. Van der Veen-Oei nastavlja: "Istraživači informacijskih tehnologija prvi su put imali pristup digitalnim zbirkama baštinskih institucija. Odjednom su imali na raspolaganju velike količine podataka kako bi trenirali svoje alate i algoritme.
Sljedeći projekt, CATCHPlus, tražio je načine za pretvaranje prototipova ili demonstracija u alate ili instrumente za praksu. Na kraju, baštinske institucije zapravo nisu upotrijebile sve razvijene prototipove ili demonstracije, a povezivanje digitalnih zbirki još nije bilo dovršeno. S HAICuom želimo ići korak dalje. Međutim, ovaj put uz primjenu tehnika umjetne inteligencije.
Uvođenje umjetne inteligencije
Istraživači i stručnjaci iz baštinskih institucija uključenih u CATCH željeli su nastaviti sa zajednicom projekt koji je izgradio, uvodeći nove tehnike umjetne inteligencije. Van der Veen-Oei napominje da se „umjetna inteligencija razvija već desetljećima, ali danas umjetna inteligencija također može dati smisao zbirkama na odgovoran način. Željeli smo inteligentno iskoristiti taj razvoj kako bismo pristupili svojim zbirkama, povezali ih i analizirali.
Institucije baštine poput Nacionalne knjižnice Nizozemske (KB) suočavaju se s porastom novih podataka. KB trenutno ima oko tri petabajta (tri milijarde megabajta) digitalnih podataka, kaže Van der Veen-Oei. Do 2027. godine, knjižnica očekuje da će ugostiti više od pet pet bajtova podataka. Za ilustraciju, jedan petabajt informacija odgovara 1,8 kilometara visokom tornju složenih CD-ROM diskova bez kutije. „Za to su nam potrebni novi alati i tehnike kako bismo ga učinili jednostavnim i jednostavnim.” U to je uključen projekt HAICu.
Nove perspektive
Umjetna inteligencija donosi i nove perspektive za zbirke. Ono što je u prošlosti bilo sasvim normalno danas ponekad nije prihvatljivo. Umjetnom inteligencijom možemo prikazati više perspektiva. Uzmite pojam Zwarte Piet (Crni Pete), koji se pojavljuje u naslovima knjiga u prošlosti, ali je danas predmet rasprave. Mi kao KB tražimo uvide i načine za automatsko otkrivanje ove pristranosti metapodataka.
Istodobno, umjetna inteligencija pruža podatke s kontekstom. Riječ je o tome kako možemo koristiti podatke o baštini kako bismo pružili transparentno i pouzdano promišljanje o stvarnosti. Tijekom pretraživanja dobivate ideje: Imati pogled u ovoj zbirci, ili ovaj. Osim toga, izvori su smješteni u kontekst. Inovacijski laboratoriji upotrebljavaju se za ispitivanje novih kretanja u okviru HAICua.”
Multimodalni pristupi
U posljednje dvije godine, generativna umjetna inteligencija je porasla u važnosti kroz sustave kao što je ChatGPT. 'U HAICuu želimo koristiti ovu metodu pretraživanja i za zbirke baštinskih institucija.'
Multimodalnost, ili korištenje različitih izvora, igra veliku ulogu.
U okviru HAICua povezane su zbirke različitih baštinskih institucija. Ne radi se samo o tekstu, već i o video, audio i tako dalje. Uzmite skup podataka Delpher, web stranicu koja pruža cjeloviti tekst na nizozemskom jeziku digitalizirane povijesne novine, knjige, časopise i kopije listova za radijske vijesti. Kako bi bilo divno kad bismo mogli povezati skeniranje novina s audiovizualnim materijalom s Nizozemskog instituta za zvuk i vid (Beeld & Geluid), na primjer. U jednom pretraživanju možete prikupiti sve informacije. O tome je riječ u HAICU-u.
Saznajte više
HAICu ima za cilj nadići jednostavno razvijanje i korištenje tehnika i alata umjetne inteligencije. Projektom se namjerava promicati interdisciplinarna i institucionalna suradnja putem inovacijskih laboratorija i projekata građanske znanosti. Te inicijative uključivat će one koji trenutačno možda nisu aktivno uključeni u HAICu. S tim naporima HAICu očekuje da će svim dionicima pružiti plodno tlo za uzgoj inputa i kustoskih usluga. Osim toga, konzorcij je motiviran osigurati dugoročnu integraciju rezultata HAICua u partnerske organizacije i njihove mreže.
Potiče li ovaj projekt vašu znatiželju? Pogledajte internetske stranice HAICua za predstojeća slobodna radna mjesta i ažuriranja, među ostalim opsežan razgovor s jednim od voditelja projekta HAICu.
Kako biste bili u toku s najnovijim dostignućima u istraživanju i razvoju u sektoru kulturne baštine, povezali se s kolegama i surađivali, pridružite se zajednici EuropeanaTech danas!
