HAICu, projekt mający na celu dostęp do zbiorów dziedzictwa cyfrowego, ich łączenie i analizowanie z wykorzystaniem sztucznej inteligencji, otrzymał w 2023 r. dotację w wysokości 10,3 mln euro od Holenderskiej Rady ds. Badań Naukowych i rozpoczął się w lutym 2024 r. Jelle Posthuma, dziennikarka Impact/Science z Jantina Tammes School of Digital Society, Technology and AI, rozmawia o projekcie z Rosemarie Van der Veen-Oei, szefową Działu Badań w Bibliotece Narodowej Holandii (KB), partnerem konsorcjum.
Dziedzictwo „CATCH”
Początki HAICu wynikają w dużej mierze z ciągłego dostępu do dziedzictwa kulturowego lub CATCH, 15-letniego programu badawczego finansowanego przez holenderską Radę ds. Badań Naukowych i holenderskie Ministerstwo Edukacji, Kultury i Nauki.
"HAICu nie opiera się na CATCH, ale wiele osób z tej samej społeczności jest zaangażowanych", mówi Van der Veen-Oei. W Niderlandach CATCH wniósł istotny wkład w badania na styku instytucji informatycznych i instytucji dziedzictwa kulturowego. Później dodano nauki humanistyczne. Celem CATCH było udostępnienie zbiorów cyfrowych.
Opierając się na wyjątkowym partnerstwie
Doktoranci finansowani przez CATCH stacjonowali w instytucjach dziedzictwa dwa dni w tygodniu, mówi Van der Veen-Oei. W rezultacie pracowali poza środowiskiem akademickim, a przez okres 15 lat zaowocowało to doktoratami i doktoratami z doświadczeniem i wiedzą na temat sektora dziedzictwa, kolekcji cyfrowych i świata akademickiego. Dzięki tej współpracy instytucje zajmujące się dziedzictwem kulturowym stawiały pierwsze kroki w środowisku akademickim. „Było to wyjątkowe partnerstwo między środowiskiem akademickim a instytucjami zajmującymi się dziedzictwem kulturowym i przyniosło obu instytucjom nowy rodzaj wiedzy i doświadczenia”.
Projekt był pierwszym, w którym wiele instytucji dziedzictwa ściśle współpracowało z badaczami IT. Van der Veen-Oei kontynuuje: "Naukowcy IT z kolei po raz pierwszy mieli dostęp do cyfrowych zbiorów instytucji dziedzictwa. Nagle mieli do dyspozycji duże ilości danych do trenowania swoich narzędzi i algorytmów.
Kolejny projekt, CATCHPlus, szukał sposobów na przekształcenie prototypów lub wersji demonstracyjnych w narzędzia lub instrumenty do praktyki. Ostatecznie nie wszystkie opracowane prototypy lub wersje demonstracyjne zostały faktycznie wprowadzone do użytku przez instytucje dziedzictwa kulturowego, a łączenie zbiorów cyfrowych nie zostało jeszcze ukończone. Z HAICu chcemy pójść o krok dalej. Tym razem jednak z zastosowaniem technik AI.
Wprowadzanie sztucznej inteligencji
Naukowcy i specjaliści z instytucji zajmujących się dziedzictwem kulturowym zaangażowanych w CATCH chcieli kontynuować projekt wraz ze społecznością, wprowadzając nowe techniki sztucznej inteligencji. Van der Veen-Oei zauważa, że „AI rozwija się od dziesięcioleci, ale dziś może również w odpowiedzialny sposób nadać znaczenie zbiorom. Chcieliśmy inteligentnie wykorzystać te osiągnięcia, aby uzyskać dostęp, połączyć i przeanalizować nasze kolekcje".
Instytucje dziedzictwa kulturowego, takie jak Biblioteka Narodowa Holandii (KB), stoją w obliczu gwałtownego wzrostu nowych danych. KB ma obecnie około trzech petabajtów (trzy miliardy megabajtów) danych cyfrowych, mówi Van der Veen-Oei. Do 2027 roku biblioteka ma pomieścić ponad pięć petabajtów danych. Dla zilustrowania, jeden petabajt informacji odpowiada 1,8-kilometrowej wieży ułożonych płyt CD-ROM bez pudełka. „W tym celu potrzebujemy nowych narzędzi i technik, które ułatwią i uproszczą realizację projektu HAICu”.
Nowe perspektywy
Sztuczna inteligencja wnosi również nowe perspektywy do kolekcji. To, co kiedyś było całkiem normalne w przeszłości, jest czasami nie do przyjęcia w dzisiejszych czasach. Możemy wykorzystać sztuczną inteligencję do pokazania wielu perspektyw. Weźmy termin Zwarte Piet (Black Pete), który pojawia się w tytułach książek w przeszłości, ale jest obecnie przedmiotem debaty. Jako KB szukamy spostrzeżeń i sposobów automatycznego wykrywania tego błędu metadanych.
Jednocześnie AI dostarcza danych z kontekstem. Chodzi o to, w jaki sposób możemy wykorzystać dane o dziedzictwie, aby zapewnić przejrzystą i wiarygodną refleksję nad rzeczywistością. Podczas wyszukiwania otrzymujesz pomysły: Zajrzyj do tej kolekcji lub do tej. Ponadto źródła są umieszczane w kontekście. Laboratoria innowacji są wykorzystywane do testowania nowych rozwiązań w ramach HAICu.”
Podejścia multimodalne
W ciągu ostatnich dwóch lat generatywna sztuczna inteligencja zyskała na znaczeniu dzięki systemom takim jak ChatGPT. W HAICu chcemy wykorzystać tę metodę wyszukiwania również w odniesieniu do zbiorów instytucji dziedzictwa kulturowego.
Multimodalność lub korzystanie z różnych źródeł odgrywa dużą rolę.
W HAICu zbiory różnych instytucji dziedzictwa kulturowego są ze sobą powiązane. Nie chodzi tylko o tekst, ale także o wideo, audio i tak dalej. Zapoznaj się ze zbiorem danych Delpher, stroną internetową oferującą pełnotekstowe, zdigitalizowane w języku niderlandzkim historyczne gazety, książki, czasopisma i kopie do radiowych audycji informacyjnych. Jak wspaniale byłoby połączyć skany gazet z materiałami audiowizualnymi z Holenderskiego Instytutu Dźwięku i Wizji (Beeld & Geluid). W jednym wyszukiwaniu możesz zebrać wszystkie informacje. Na tym właśnie polega HAICU".
Dowiedz się więcej
HAICu ma na celu wykraczanie poza zwykłe opracowywanie i wykorzystywanie technik i narzędzi sztucznej inteligencji. Projekt ma na celu promowanie współpracy interdyscyplinarnej i instytucjonalnej poprzez laboratoria innowacji i projekty nauki obywatelskiej. Inicjatywy te będą angażować tych, którzy mogą nie być obecnie aktywnie zaangażowani w HAICu. Dzięki tym wysiłkom HAICu spodziewa się zapewnić żyzny teren hodowlany dla wkładu i usług kuratorskich ze strony wszystkich zainteresowanych stron. Ponadto konsorcjum jest zmotywowane do zapewnienia długoterminowej integracji wyników HAICu z organizacjami partnerskimi i ich sieciami.
Czy ten projekt wzbudza Twoją ciekawość? Zapoznaj się ze stroną internetową HAICu, aby uzyskać informacje na temat nadchodzących wakatów i aktualizacji, m.in. obszerny wywiad z jednym z liderów projektu HAICu.
Aby być na bieżąco z najnowszymi osiągnięciami w dziedzinie badań i rozwoju w sektorze dziedzictwa kulturowego, nawiązywać kontakty i współpracować, dołącz do społeczności EuropeanaTech już dziś!
