Projekt HAICu pro přístup ke sbírkám digitálního dědictví, jejich propojení a analýzu pomocí umělé inteligence získal v roce 2023 grant od nizozemské rady pro výzkum ve výši 10,3 milionu EUR a byl zahájen v únoru 2024. Jelle Posthuma, novinářka časopisu Impact/Science z Jantina Tammes School of Digital Society, Technology and AI, hovoří o projektu s Rosemarie Van der Veen-Oei, vedoucí výzkumného oddělení Národní knihovny Nizozemska (KB), která je partnerem konsorcia.
Dědictví „CATCH“
Původ HAICu pochází z velké části z nepřetržitého přístupu ke kulturnímu dědictví neboli CATCH, patnáctiletého výzkumného programu financovaného nizozemskou Radou pro výzkum a nizozemským ministerstvem školství, kultury a vědy.
"HAICu není založeno na CATCH, ale je do něj zapojeno mnoho lidí ze stejné komunity," říká Van der Veen-Oei. V Nizozemsku CATCH významně přispěl k výzkumu na křižovatce institucí v oblasti informačních technologií a kulturního dědictví. Později byly přidány humanitní obory. Cílem CATCHu bylo zpřístupnit digitální sbírky.
Vycházíme z jedinečného partnerství
Doktorandi financovaní CATCH byli umístěni v památkových institucích dva dny v týdnu, říká Van der Veen-Oei. V důsledku toho pracovali mimo akademické prostředí a po dobu 15 let to vedlo k doktorátům a postdoktorandům se zkušenostmi a znalostmi o odvětví dědictví, digitálních sbírkách a akademickém světě. Díky této spolupráci učinily instituce kulturního dědictví své první kroky v akademické sféře. „Bylo to jedinečné partnerství mezi akademickou obcí a institucemi kulturního dědictví a přineslo oběma institucím nový druh znalostí a odborných znalostí.“
Projekt byl poprvé, kdy mnoho institucí kulturního dědictví úzce spolupracovalo s výzkumnými pracovníky v oblasti informačních technologií. Van der Veen-Oei pokračuje: "Výzkumní pracovníci v oblasti IT měli poprvé přístup k digitálním sbírkám institucí kulturního dědictví. Najednou měli k dispozici velké množství dat, aby mohli vycvičit své nástroje a algoritmy.
Následující projekt, CATCHPlus, hledal způsoby, jak převést prototypy nebo ukázky do nástrojů nebo nástrojů pro praxi. Nakonec ne všechny vyvinuté prototypy nebo ukázky byly skutečně uvedeny do provozu institucemi kulturního dědictví a propojení digitálních sbírek ještě nebylo dokončeno. S HAICu chceme jít ještě o krok dál. Tentokrát však s použitím technik umělé inteligence.
Zavedení umělé inteligence
Výzkumní pracovníci a odborníci z institucí kulturního dědictví zapojených do projektu CATCH chtěli pokračovat v komunitě, kterou projekt vybudoval, a přinášet nové techniky umělé inteligence. Van der Veen-Oei poznamenává, že „UI se vyvíjí po desetiletí, ale dnes může umělá inteligence také dávat smysl sbírkám odpovědným způsobem. Chtěli jsme tento vývoj inteligentně využít k přístupu, propojení a analýze našich sbírek.
Instituce kulturního dědictví, jako je Národní knihovna Nizozemska (KB), čelí nárůstu nových dat. KB má v současné době asi tři petabajty (tři miliardy megabajtů) digitálních dat, říká Van der Veen-Oei. Do roku 2027 knihovna očekává, že bude hostit více než pět petabajtů dat. Pro ilustraci, jeden petabajt informací odpovídá 1,8 kilometru vysoké věži složených CD-ROM disků bez krabice. „K tomu potřebujeme nové nástroje a techniky, aby to bylo snadné a jednoduché.“ Proto přichází projekt HAICu.
Nové perspektivy
Umělá inteligence také přináší nové perspektivy do sbírek. To, co bývalo v minulosti zcela normální, je dnes někdy nepřijatelné. Umělou inteligenci můžeme využít k tomu, abychom ukázali více perspektiv. Vezměme si termín Zwarte Piet (Black Pete), který se objevuje v knižních titulech v minulosti, ale je předmětem diskuse v těchto dnech. My jako KB hledáme postřehy a způsoby, jak tuto zkreslení metadat automaticky detekovat.
Umělá inteligence zároveň poskytuje data s kontextem. Jde o to, jak můžeme data z dědictví využít k transparentnímu a důvěryhodnému zamyšlení se nad realitou. Při hledání získáte nápady: Podívejte se do této kolekce, nebo do této. Zdroje jsou navíc zasazeny do kontextu. Inovační laboratoře se používají k testování nového vývoje v rámci HAICu.“
Multimodální přístupy
V posledních dvou letech se generativní AI rozrostla do popředí prostřednictvím systémů, jako je ChatGPT. V HAICu chceme tuto metodu vyhledávání použít i pro sbírky institucí kulturního dědictví.
Multimodalita nebo použití různých zdrojů hraje velkou roli.
V rámci HAICu jsou propojeny sbírky různých institucí kulturního dědictví. Není to jen o textu, ale také o videu, zvuku a tak dále. Vezměte datový soubor Delpher, webovou stránku poskytující plné texty nizozemsky psaných digitalizovaných historických novin, knih, časopisů a kopií listů pro rozhlasové zpravodajství. Jak úžasné by bylo, kdybychom mohli propojit skeny novin s audiovizuálním materiálem například z Nizozemského institutu pro zvuk a vidění (Beeld & Geluid). Při jednom vyhledávání můžete shromáždit všechny informace. To je to, o čem HAICU je.
Zjistit více
Cílem HAICu je jít nad rámec pouhého vývoje a využívání technik a nástrojů umělé inteligence. Cílem projektu je podporovat interdisciplinární a institucionální spolupráci prostřednictvím inovačních laboratoří a projektů občanské vědy. Tyto iniciativy zapojí ty, kteří v současné době nemusí být aktivně zapojeni do HAICu. S tímto úsilím HAICu očekává, že poskytne úrodnou živnou půdu pro vstupy a kurátorské služby od všech zúčastněných stran. Kromě toho je konsorcium motivováno k zajištění dlouhodobé integrace výsledků HAICu do partnerských organizací a jejich sítí.
Vzbuzuje tento projekt vaši zvědavost? Na internetových stránkách HAICu najdete informace o nadcházejících volných pracovních místech a aktuálních informacích, mimo jiné rozsáhlý rozhovor s jedním z vedoucích projektů HAICu.
Chcete-li být informováni o nejnovějším vývoji v oblasti výzkumu a vývoje v odvětví kulturního dědictví, navazovat kontakty se svými vrstevníky a spolupracovat, připojte se ke komunitě EuropeanaTech ještě dnes!
