Projekt HAICu zameraný na prístup, prepojenie a analýzu zbierok digitálneho dedičstva pomocou umelej inteligencie získal v roku 2023 grant od holandskej rady pre výskum vo výške 10,3 milióna EUR a začal sa vo februári 2024. Jelle Posthuma, novinárka Impact/Science na Jantina Tammes School of Digital Society, Technology and AI, hovorí o projekte s Rosemarie Van der Veen-Oei, vedúcou výskumného oddelenia v Národnej knižnici Holandska (KB), ktorá je partnerom konzorcia.
Odkaz zo systému „CATCH“
Počiatky HAICu vo veľkej miere pramenia z nepretržitého prístupu ku kultúrnemu dedičstvu alebo CATCH, 15-ročného výskumného programu financovaného Holandskou radou pre výskum a holandským ministerstvom školstva, kultúry a vedy.
"HAICu nie je založené na CATCH, ale veľa ľudí z rovnakej komunity je zapojených," hovorí Van der Veen-Oei. V Holandsku CATCH významne prispel k výskumu na križovatke IT a inštitúcií správy kultúrneho dedičstva. Neskôr boli pridané humanitné vedy. Cieľom spoločnosti CATCH bolo sprístupniť digitálne zbierky.
Budovanie na jedinečnom partnerstve
Študenti doktorandského štúdia financovaného spoločnosťou CATCH boli umiestnení v inštitúciách kultúrneho dedičstva dva dni v týždni, hovorí Van der Veen-Oei. V dôsledku toho pracovali mimo akademického prostredia a počas 15 rokov to viedlo k PhD a postdoktorandom so skúsenosťami a znalosťami o sektore kultúrneho dedičstva, digitálnych zbierkach a akademickom svete. Vďaka tejto spolupráci inštitúcie správy kultúrneho dedičstva podnikli prvé kroky do akademickej obce. „Išlo o jedinečné partnerstvo medzi akademickou obcou a inštitúciami správy kultúrneho dedičstva, ktoré obom inštitúciám prinieslo nový druh vedomostí a odborných znalostí.“
Projekt bol prvýkrát, keď mnohé inštitúcie kultúrneho dedičstva úzko spolupracovali s výskumníkmi v oblasti IT. Van der Veen-Oei pokračuje: "Výskumní pracovníci v oblasti IT mali po prvýkrát prístup k digitálnym zbierkam inštitúcií správy kultúrneho dedičstva. Zrazu mali k dispozícii veľké množstvo údajov, aby mohli trénovať svoje nástroje a algoritmy.
Nasledujúci projekt, CATCHPlus, hľadal spôsoby, ako previesť prototypy alebo ukážky do nástrojov alebo nástrojov pre prax. Napokon nie všetky vyvinuté prototypy alebo ukážky boli skutočne uvedené do používania inštitúciami správy kultúrneho dedičstva a prepojenie digitálnych zbierok ešte nebolo dokončené. S HAICu chceme ísť ešte o krok ďalej. Tentoraz však s použitím techník umelej inteligencie.
Prinášame umelú inteligenciu
Výskumní pracovníci a odborníci z inštitúcií správy kultúrneho dedičstva zapojených do projektu CATCH chceli pokračovať v komunite vybudovaného projektu a priniesť nové techniky umelej inteligencie. Van der Veen-Oei poznamenáva, že „umelá inteligencia sa vyvíja už desaťročia, ale v súčasnosti môže umelá inteligencia zodpovedne dávať zmysel aj zbierkam. Chceli sme využiť tento vývoj inteligentne na prístup, prepojenie a analýzu našich zbierok.
Inštitúcie kultúrneho dedičstva, ako je Národná knižnica Holandska (KB), čelia nárastu nových údajov. KB má v súčasnosti približne tri petabajty (tri miliardy megabajtov) digitálnych dát, hovorí Van der Veen-Oei. Knižnica očakáva, že do roku 2027 bude hostiť viac ako päť petabajtov dát. Na ilustráciu, jeden petabajt informácií zodpovedá 1,8-kilometrovej veži naskladaných CD-ROM diskov bez krabice. „Na to potrebujeme nové nástroje a techniky, ktoré nám to uľahčia a uľahčia.“ Na to prichádza projekt HAICu.
Nové perspektívy
Umelá inteligencia prináša do zbierok aj nové perspektívy. To, čo bolo v minulosti celkom normálne, je dnes niekedy neprijateľné. Umelú inteligenciu môžeme použiť na zobrazenie viacerých perspektív. Vezmime si termín Zwarte Piet (Black Pete), ktorý sa objavuje v knižných tituloch v minulosti, ale je predmetom diskusie v týchto dňoch. My ako KB hľadáme poznatky a spôsoby, ako automaticky odhaliť túto zaujatosť metaúdajov.
Umelá inteligencia zároveň poskytuje údaje s kontextom. Ide o to, ako môžeme použiť údaje o dedičstve na poskytnutie transparentnej a dôveryhodnej úvahy o realite. Pri vyhľadávaní máte k dispozícii nápady: Pozrite sa na túto zbierku, alebo túto. Okrem toho sa zdroje zaraďujú do kontextu. Inovačné laboratóriá sa používajú na testovanie nového vývoja v rámci HAICu.“
Multimodálne prístupy
V posledných dvoch rokoch sa generatívna umelá inteligencia rozrástla do popredia prostredníctvom systémov, ako je ChatGPT. V HAICu chceme túto metódu vyhľadávania použiť aj pre zbierky inštitúcií správy kultúrneho dedičstva.
Multimodalita alebo používanie rôznych zdrojov zohráva veľkú úlohu.
V rámci HAICu sú prepojené zbierky rôznych inštitúcií správy kultúrneho dedičstva. Nejde len o text, ale aj o video, audio a tak ďalej. Zoberte si dátový súbor Delpher, webovú stránku poskytujúcu plnotextové holandské digitalizované historické noviny, knihy, časopisy a kopírovacie hárky pre rozhlasové spravodajstvo. Aké úžasné by bolo, keby sme mohli napríklad prepojiť skeny novín s audiovizuálnym materiálom z Holandského inštitútu pre zvuk a víziu (Beeld & Geluid). V jednom vyhľadávaní môžete zhromaždiť všetky informácie. To je to, o čom HAICu je.
Ďalšie informácie
Cieľom HAICu je ísť nad rámec jednoduchého vývoja a využívania techník a nástrojov umelej inteligencie. Cieľom projektu je podporovať interdisciplinárnu a inštitucionálnu spoluprácu prostredníctvom inovačných laboratórií a projektov občianskej vedy. Do týchto iniciatív sa zapoja tí, ktorí sa v súčasnosti nemusia aktívne zapájať do HAICu. S týmto úsilím HAICu očakáva, že poskytne úrodnú živnú pôdu pre vstupné a kurátorské služby od všetkých zainteresovaných strán. Okrem toho je konzorcium motivované zabezpečiť dlhodobú integráciu výsledkov HAICu do partnerských organizácií a ich sietí.
Vyvoláva tento projekt vašu zvedavosť? Ďalšie voľné pracovné miesta a aktualizácie nájdete na webovom sídle HAICu, okrem iného rozsiahly rozhovor s jedným z vedúcich projektov HAICu.
Ak chcete mať aktuálne informácie o najnovšom vývoji v oblasti výskumu a vývoja v odvetví kultúrneho dedičstva, nadväzovať kontakty s partnermi a spolupracovať, pridajte sa k komunite EuropeanaTech ešte dnes!
