HAICu – projekt, mille eesmärk on tehisintellekti abil digipärandi kogudele juurde pääseda, neid linkida ja analüüsida – sai Madalmaade teadusnõukogult 2023. aastal 10,3 miljoni euro suuruse toetuse ja see käivitati 2024. aasta veebruaris. Jantina Tammesi digiühiskonna, tehnoloogia ja tehisintellekti kooli mõju- ja teadusajakirjanikJelle Posthuma räägib projektist konsortsiumi partneri, Madalmaade Rahvusraamatukogu (KB) teadusosakonna juhataja Rosemarie Van der Veen-Oeiga.
„CATCHi“ pärand
HAICu on pärit peamiselt Madalmaade teadusnõukogu ning Madalmaade haridus-, kultuuri- ja teadusministeeriumi rahastatavast 15-aastasest teadusprogrammist CATCH (Continuous Access to Cultural Heritage).
"HAICu ei põhine CATCH, kuid paljud inimesed samast kogukonnast on kaasatud," ütleb Van der Veen-Oei. Madalmaades andis CATCH olulise panuse teadusuuringutesse IT- ja pärandiasutuste ristumiskohas. Hiljem lisandusid humanitaarteadused. CATCHi eesmärk oli teha digitaalsed kollektsioonid kättesaadavaks.
Ainulaadsele partnerlusele tuginemine
CATCHi rahastatud doktorandid asusid pärandiasutustes kaks päeva nädalas, ütleb Van der Veen-Oei. Selle tulemusena töötasid nad väljaspool akadeemilist keskkonda ja 15 aasta jooksul tõi see kaasa doktorikraadid ja järeldoktorid, kellel on kogemusi ja teadmisi pärandisektori, digitaalsete kogude ja akadeemilise maailma kohta. Selle koostööga astusid kultuuripärandiasutused esimesed sammud akadeemilistesse ringkondadesse. „Tegemist oli ainulaadse partnerlusega akadeemiliste ringkondade ja kultuuripärandiasutuste vahel ning see andis mõlemale asutusele uut liiki teadmisi ja oskusteavet.“
Projekt oli esimene kord, kui paljud muinsuskaitseasutused tegid tihedat koostööd IT-teadlastega. Van der Veen-Oei jätkab: "IT-teadlastel omakorda oli esimest korda juurdepääs pärandiasutuste digitaalsetele kogudele. Äkitselt oli nende käsutuses suur hulk andmeid, et koolitada oma tööriistu ja algoritme.
Järgmises projektis, CATCHPlus, otsiti võimalusi prototüüpide või demode muutmiseks praktilisteks tööriistadeks või instrumentideks. Lõppkokkuvõttes ei võtnud muinsuskaitseasutused tegelikult kasutusele kõiki välja töötatud prototüüpe või demosid ning digikogude ühendamine ei olnud veel lõpule viidud. HAICuga tahame minna sammu võrra kaugemale. Seekord aga tehisintellekti tehnikate rakendamisega.
Tehisintellekti kasutamine
CATCHiga seotud muinsuskaitseasutuste teadlased ja spetsialistid soovisid kogukonnaga jätkata loodud projekti, tuues kaasa uusi tehisintellekti tehnikaid. Van der Veen-Oei märgib, et „tehisintellekt on arenenud aastakümneid, kuid tänapäeval võib tehisintellekt anda kollektsioonidele vastutustundlikul viisil tähenduse. Tahtsime neid arenguid targalt kasutada, et oma kogudele ligi pääseda, neid linkida ja analüüsida.
Muinsuskaitseasutused, nagu Madalmaade Rahvusraamatukogu (KB), seisavad silmitsi uute andmete hüppelise kasvuga. KB-l on praegu umbes kolm petabaiti (kolm miljardit megabaiti) digitaalseid andmeid, ütleb Van der Veen-Oei. 2027. aastaks loodetakse raamatukogus majutada üle viie petabaidi andmeid. Näiteks vastab üks petabait informatsiooni 1,8 kilomeetri kõrgusele virnastatud CD-ROM-plaatide tornile ilma kastita. „Selleks on meil vaja uusi vahendeid ja tehnikaid, et muuta see lihtsaks ja lihtsaks.“ See on koht, kus HAICu projekt käivitub.
Uued perspektiivid
Tehisintellekt toob kollektsioonidesse ka uusi perspektiive. See, mis varem oli üsna normaalne, ei ole tänapäeval mõnikord vastuvõetav. Tehisintellekti saab kasutada mitme vaatenurga näitamiseks. Võtame termini Zwarte Piet (Black Pete), mis esineb varem raamatute pealkirjades, kuid mida tänapäeval arutatakse. Meie KB-na otsime teadmisi ja viise selle metaandmete kallutatuse automaatseks tuvastamiseks.
Samal ajal annab tehisintellekt andmetele konteksti. Küsimus on selles, kuidas me saame kasutada pärandiandmeid, et pakkuda läbipaistvat ja usaldusväärset ülevaadet tegelikkusest. Otsides saate ideid: Vaadake seda kollektsiooni või seda. Lisaks paigutatakse allikad konteksti. Innovatsioonilaboreid kasutatakse HAICu uute arenduste katsetamiseks.“
Mitmeliigilised lähenemisviisid
Viimase kahe aasta jooksul on generatiivne tehisintellekt kasvanud esile selliste süsteemide kaudu nagu ChatGPT. „HAICus soovime kasutada seda otsingumeetodit ka muinsuskaitseasutuste kogude jaoks.“
Multimodaalsus või erinevate allikate kasutamine mängib suurt rolli.
HAICu sees on omavahel seotud erinevate muinsuskaitseasutuste kogud. See ei puuduta ainult teksti, vaid ka videot, heli jne. Andmekogu Delpher, veebisait, mis pakub täistekstina hollandikeelseid digiteeritud ajaloolisi ajalehti, raamatuid, ajakirju ja koopialehti raadiouudiste edastamiseks. Kui imeline oleks, kui saaksime näiteks ühendada ajaleheskaneeringud Hollandi Heli ja Visiooni Instituudi (Beeld & Geluid) audiovisuaalse materjaliga. Ühe otsinguga saate koguda kogu teabe. See on see, mida HAICu on kõike.
Uuri lähemalt
HAICu eesmärk on minna kaugemale lihtsalt tehisintellekti tehnikate ja vahendite arendamisest ja kasutamisest. Projekti eesmärk on edendada interdistsiplinaarset ja institutsioonilist koostööd innovatsioonilaborite ja kodanike teadusprojektide kaudu. Need algatused kaasavad neid, kes ei pruugi praegu HAICus aktiivselt osaleda. Nende jõupingutustega loodab HAICu pakkuda viljakat kasvupinda kõigi sidusrühmade panusele ja kuraatorite teenustele. Lisaks on konsortsium motiveeritud tagama HAICu tulemuste pikaajalist integreerimist partnerorganisatsioonidesse ja nende võrgustikesse.
Kas see projekt köidab teie uudishimu? Tutvuge HAICu veebisaidiga, et leida tulevasi vabu töökohti ja ajakohastusi, muu hulgas korraldades põhjaliku intervjuu ühe HAICu projektijuhiga.
Selleks et olla kursis kultuuripärandi sektori teadus- ja arendustegevuse viimaste arengutega, luua võrgustikke eakaaslastega ja teha koostööd, ühinege täna EuropeanaTechi kogukonnaga!
