Lugege edasi, et saada ülevaade korratavast katseprojektist, mis ühendas Europeana.eu platvormi ja rakendusliideste kasutamise, eeltreenitud tehisintellektimudelid, reaalajas koodi ja semantilise andmemodelleerimise, inimosalejad ühishanke platvormil, eelarvamusteteadliku tesauruse vahendi ja andmeparameetrid, mis tõi kaasa Ukraina etnograafilise kogu rikastamise Europeana.eu kaudu 55 000 märketoimingu ja peaaegu 6000 uue metaandmete sildi kaudu.
Kodanike juhitud Ukraina pärandi kaitsmine
Alates 2025. aastast on Web2Learn koos Luksemburgi, Läti, Kiievi Taras Shevchenko ja Europeana sihtasutusega teinud koostööd programmi „Erasmus+“ projektis AISTER, mis käsitleb tehisintellektil põhinevat kodanike osalemist Ukraina kultuuripärandi kaitsmisel. Web2Learn panustab oma teadmistega kodanikukeskse innovatsiooni valdkonnas projekti, mis kasutab haridust, koolitust ja kodanikuaktiivsust edendavaid avatud lähtekoodiga tehnoloogiaid.

HITL Crowdsourcing Pilot Poster by Web2Learn sisaldab ülalnimetatud rahvamaali "tüdruku portree", mis on lisatud käesolevasse kompositsiooni õiguste omaniku täiendava loaga.
Konsortsium AISTER on kavandanud projekti kestuse ajaks mitmeid seminare, kus osalevad teadlased, üliõpilased ja noored spetsialistid. Viis Web2Learni juhitud veebipõhist ja kohapealset õpikoda Läti Ülikooli raamatukogus andsid võimaluse viia läbi katseprojekt: testida inimahela töövoogu, et rikastada kujutiste digitaalseid kogusid rahvahanke ja tehisintellekti vahendite abil, kutsudes seminaril osalejaid üles suhtlema Ukraina etnograafiapärandiga ja saama aktiivseks panustajaks, rikastades ja valideerides tehisintellekti loodud kirjeldusmärgiseid.
Katseprojekt kavandati avatud ja reprodutseeritava ressursina koos üksikasjaliku dokumentatsiooniga, et hõlbustada digihumanitaarteaduste alaseid teadusuuringuid ja koolitust, ning see tehakse teadlastele, üliõpilastele ja õpetajatele taaskasutamiseks ning loominguliseks taaskasutamiseks vabalt kättesaadavaks.
Ukraina rahvakunst veebisaidil Europeana.eu
2025. aastal avaldas Ukraina traditsioonilise kunsti veebimuuseum Krovets, mis tegutseb alates 2014. aastast tänu muuseumi asutajate vabatahtlikele jõupingutustele, agregaatori MUSEU kaudu Europeana.eu andmestiku, mis sisaldab 3840 etnograafilist pärandit, sealhulgas traditsioonilisi kostüüme, tekstiilitööstust, rahvakunsti, materjalikultuuri ja fotosid.
Piloodi jaoks kasutatud pildid pärinevad sellest etnograafilisest kollektsioonist. Katseprojekti raames avaldati veebisaidil Europeana.eu Ukraina rahvakunsti galerii, mis võimaldab juurdepääsu muuseumi rahvakunsti alamkogule, mis sisaldab 312 rahvamaalideks või rahvaikoonideks liigitatud artefakti. Enamik maale, mis kujutavad igapäevast maaelu, folkloori ja religioosseid teemasid, pärinevad Ukraina, Kesk-Podniprovia ja Poltavštšina kesksetest etnograafilistest piirkondadest ning pärinevad peamiselt 20. sajandi algusest ja keskpaigast.
Kollektsioon koosneb peamiselt žanri stseenidest, maastikest ja üksikutest portreedest. Rahvamaalid moodustavad visuaalseid narratiive, pakkudes ülevaateid maamaastikest, religioossetest traditsioonidest, rahvakunsti motiividest ja igapäevasest materiaalsest kultuurist. Paljusid detaile on piltide vaatamisel lihtne märgata, kuid neid ei ole alati lihtne otsingu abil avastada.
Inim-in-the-loop crowdsourcing piloot
Katseprojekti eesmärk oli luua Ukraina rahvakunsti jaoks uus nähtavustasand. Selle raames töötati välja töövoog, mis ühendab Europeana APIde kasutamise, tehisintellektipõhised meetodid loomuliku keele töötlemiseks ja arvutinägemiseks, Jupyteri sülearvuti kui reprodutseeritava kodeerimise interaktiivse tööruumi ja eetikapõhise andmetöötluse ning üldsuse kaasamise rahvahankeplatvormi CrowdHeritage kaudu, et luua üldiselt otsitavaid, inimvalideeritud ja eetiliselt hinnatud kirjeldusmärgiseid.
Alustamiseks kasutati galeriielementide ja metaandmete hankimiseks kahte Europeana rakendusliidest: Europeana kasutajakomplekti rakendusliidest Europeanas avaldatud kasutaja loodud galeriidele juurdepääsuks ja Europeana otsingu rakendusliidest Europeanas juurdepääsetava sisu metaandmete otsimiseks, mis on modelleeritud Europeana andmemudeli (EDM) abil. Seejärel loodi uued kirjeldavad annotatsioonid tehisintellektivahenditega, mis kasutasid loomuliku keele töötlemisel ja arvutinägemisel avatud lähtekoodiga eelkoolitatud tehisintellektimudeleid ja -teeke. Automaatsed märked loodi Jupyteri sülearvutites ja järjestati JSON-LD-s vastavalt W3C (World Wide Web Consortium) veebimärkuste andmemudelile, et toetada nende importi Datoptroni hallatavale CrowdHeritage’i ühishankeplatvormile.
Kokku töötas piloot välja kaheksa Jupyteri sülearvutit, mis toimisid interaktiivsete arvutikeskkondadena, mis võimaldavad reaalajas kodeerimist ja reprodutseeritavust, et toetada andmetöötlusetappide täielikku täitmist. Märkmikud võeti kasutusele Google Colabis, et võimaldada reaalajas koostööd ja ühistoimetamist, ning seejärel edastati need GitHubis avatud hoidlana versioonikontrolliks, hõlbustades koostööpõhise koodi optimeerimise läbipaistvust ja jälgitavust. Need hõlmavad katseprojekti täielikku andmeprotsessi järjestikustes etappides, mis hõlmavad järgmist:
etapp: Automaatne annotatsiooni genereerimine tekstiliste metaandmete põhjal (NLP-põhine)
1i. Otsige avaldatud Ukraina rahvakunsti galeriist välja esemete ID-d, kasutades Europeana kasutajakomplekti ΑPI, ja hankige Europeana otsingu rakendusliidese abil esemete tekstilised metaandmed (nt pealkirjad, teemad).
1ii. Looge metaandmetest automatiseeritud annotatsioone (kirjeldussilte), kasutades loomuliku keele töötlemise (NLP) tehnikaid, eelkõige reeglitel põhinevat heuristikat ja nimeliste olemite tuvastamist (NER), kasutades avatud lähtekoodiga Pythoni teeki spaCy.
etapp: Automaatne annotatsiooni genereerimine piltidest (arvuti nägemisel põhinev)
2i. Laadige galerii artefaktid alla piltidena, kasutades Europeana kasutajakomplekti API-t.
2ii. Looge kirjeldavaid pildipealdiseid, kasutades arvutinägemistehnikaid eeltreenitud tehisintellektimudelitega, eelkõige avatud lähtekoodiga Qweni mudelite variante – Qwen3-VL-2B-Instruct mitmeliigiline visuaalne keelemudel (VLM) ja Qwen3.5-4B suurkeelemudel (LLM).
lõike 2 punkt iii. Automaatsete märkuste genereerimine pildi pealdistest.
etapp: Automaatsete märgete ettevalmistamine rahvahulgapõhiseks valideerimiseks (JSON-LD vormindamine)
3i. Vormindage kõik genereeritud annotatsioonid, mis põhinevad W3C annotatsioonimudelil otseseks allaneelamiseks crowdsourcing platvormil CrowdHeritage.
3ii. Teisendage JSON-vormingus lõplikud märked masinloetavaks CSV-ks ja ühendage kõik viie rahvahanke töökoja märked.
etapp: Andmete kvaliteedi tagamine ja inimkontrolli läbinud märgete kallutatusest teadlik sõelumine
4i. Kontrollige lõplikke märkusi kahjulike, erapoolikute või vastuoluliste terminite kohta DE-BIASi sõnastikus RDF-põhise tesauruse päringu kaudu.

Kohapeal ja veebis toimunud viie rahvahankeseminari käigus vaatasid 70 osalejat, sealhulgas teadlased, üliõpilased ja rahvakunsti eksperdid, läbi tehisintellekti loodud märked, kinnitades täpseid märgiseid, lükates eksitavad märgid tagasi üles- ja allahääletamise kaudu ning andes omapoolseid lisamärkusi.
Andmete analüüs ja eetiline hindamine
Enamik pilte oli rikastatud 15 kuni 20 uue kirjeldava sildiga. Kokku registreeriti peaaegu 55 000 märkimistoimingut, sealhulgas sildi genereerimine, üleshääletamine ja allahääletamine. Selle tulemusena avanevad rikkalikumad võimalused Ukraina rahvakunsti avastamiseks ja sellega tegelemiseks. Kampaaniajärgsed mõõdikud näitavad, et enamik tehisintellekti loodud märkeid tunnistati täpseks, kuid vaid mõned neist lükati tagasi.
Nende viie tehisintellekti loodud märgise aktsepteerimise määr oli kõrgeim:
- ikoon
- värvimine
- Man
- puud
- naine.
Need viis tehisintellekti loodud silti said kõrgeima tagasilükkamise määra:
- praod
- kanna
- kahju
- väike objekt
- töötajad.
Eetilise mõju hindamise kohaldamist lõplike märkuste suhtes käsitleti katseprojekti olulise sammuna. Tehti teine läbivaatamine, et teha kindlaks potentsiaalselt problemaatiline sõnastus ja tugevdada vastutust. Inimeste heakskiidetud siltide sõelumisel DE-BIASi sõnastiku suhtes tuvastati üks termin, ori, mis hiljem muudeti orjastatud isikuks vastavalt soovitusele. Sõnavara kasutati eetilise mõju hindamise meetmena enne avatud andmekogumi lõplikku avaldamist, võttes arvesse UNESCO soovitust tehisintellekti eetika kohta (2022) ja eetilise mõju hindamise vahendit (2023).
Katseprojekti väljatöötamisel ja selle tehisintellektiga seotud eetiliste mõõtmete mõistmisel võeti arvesse ka AISTERi andmeanalüüsi uuringut, milles kaardistati 22 rahvusvahelist teadusprojekti, milles kasutatakse tehisintellekti ja kodanike osalemist kultuuripärandi säilitamiseks hädaolukordades. Uuringus liigitati valitud projektid AISTERi klassifitseerimisraamistiku alusel, mis pakub süstemaatilist kategoriseerimist 24 analüütilise mõõtme vahel, mis on kavandatud tehisintellektil põhinevate osaluspärandi algatuste analüüsimiseks. Raamistiku mõõtmed hõlmavad kultuuripärandi valdkondi, kodanike osalemise mudelit (Shirk et al., 2012) ja koostöömudelit (Carayannis & Campbell, 2009) koos tehisintellektipõhiste mõõtmetega, sealhulgas tehisintellekti tehnoloogiatüübid, ratsionaalse mõjuri mudel (Russell & Norvig, 2020, 4. väljaanne), rakendatud eetiline tehisintellekti tüpoloogia (Morley et al., 2019), litsentsitüübid ja palju muud. Uuringu andmed avaldatakse avatud juurdepääsuga interaktiivsete veebi visualiseeringutena, mis pakuvad valdkonna võrdlevat uurimist. Katseprojekti töövoog ja tulemused avaldatakse tulevases konverentsidokumendis (Ziku, Zourou, & Kouzelis, 2026).
Järeldused
Katseprojekti eesmärk oli luua avatud ja korratav tee tehisintellekti vahendite kasutamiseks andmete ulatuslikul töötlemisel koos inimeste osalemise, eetilise hindamise ja andmetest ülevaate saamisega, et toetada täpsemaid, vastutustundlikumaid, mõõdikutest lähtuvaid ja rikastatud viise Ukraina rahvakunsti avastamiseks. Mõnikord algab serendipitaalne teekond pärandisse otsingukasti sisestatud sõnaga. Ja mõnikord võivad õiged sõnad tuua päevavalgele uue kollektsiooni.
Rahvahanke kampaania kolm kõige aktiivsemat toetajat said vastavalt honorari ning kuld-, hõbe- ja pronksmärgid: Inna Kaika, Mykola Gogoli Riikliku Ülikooli inglise keele ja võõrkeele tudeng; Daria Markova, tõlketudeng, Pryazovskyi Riiklik Tehnikaülikool; Marko Lakhmatov, küberjulgeoleku üliõpilane, Pryazovskyi Riiklik Tehnikaülikool.
Kajastades oma osalemist, ütles Inna: „Ukraina kunst peegeldab meie inimeste vastupanuvõimet ja loovust ning selle jagamine on olulisem kui kunagi varem. Sellest kirest ajendatuna ühinesin kampaaniaga, et muuta kultuuripärand kättesaadavamaks. Eriti meeldis mulle annotatsiooniprotsess ja etnograafilise kollektsiooni uurimine. Oli au anda oma panus kunsti ja tehnoloogiat ühendavasse projekti.“
Uurida ja taaskasutada katseressursse
Kas olete huvitatud sarnaste meetodite kasutamisest oma kogudes?
- Vaadake CrowdHeritage'is Ukraina rahvakunsti rahvahanke kampaaniat.
- Uurige inim-in-the-loop crowdsourcing piloot.
- Taaskasutage avatud lähtekoodiga Jupyteri märkmikke, mis dokumenteerivad kogu töövoogu alates andmeotsingust kuni tehisintellekti loodud annotatsioonide ja platvormivalmis ekspordini.
- Juurdepääs Zenodo avatud hoidla avatud andmestikele, mis sisaldavad piloodi andmeid ja väljundeid säilitamiseks, tsiteerimiseks ja taaskasutamiseks.
- Tutvuge interaktiivsete andmete visualiseerimisega ja tutvuge 22 rahvusvahelise teadusalgatusega, milles kasutatakse tehisintellekti ja kodanike osalemist kultuuripärandi säilitamiseks hädaolukordades ja mujal.
Tunnustused
Täname kõiki AISTERi projekti partnereid ja koostööpartnereid, eelkõige Yevgen Dmytrukit Krovetsi muuseumis, Eirini Kaldelit CrowdHeritage'is ja Datoptronis, Hugo Manguinhast Europeana Fondis ning Uldis Zariņši ja Sanita Reinsonet Läti Ülikoolis.
Valitud viited
- Jupyteri sülearvutite dokumentatsioon järgib GLAMi institutsioonide Jupyteri projektide kvaliteedi hindamise kriteeriume, mis on avaldatud väljaandes Candela, G., Chambers, S., & Sherratt, T. (2023). GLAMi institutsioonide avaldatud Jupyteri projektide kvaliteedi hindamise meetod. Infoteaduse ja -tehnoloogia liidu Teataja, 74(13), 1550–1564.
- Katseprojekti README dokumentatsioonis GitHubi kohta on kasutatud Leuveni raamatukogude andmebaasi põhise andmebaasi dokumentatsiooni struktuuri. Vt: KU Leuveni raamatukogud, digitaliseerimise osakond. (2019). KU Leuveni raamatukogude portreede kogu andmestik, erikogud (versioon 01-beta2) [andmekogum]. Zenodo.
- M. Ziku, K. Zourou ja A. Kouzelis, „AI-Assisted Metadata Enrichment for Ethnographic Heritage: A Reproducible Human-in-the-Loop Crowdsourcing Workflow“, 2026. aasta IEEE rahvusvaheline küberhumanitaaria konverents (IEEE-CH), Veneetsia, Itaalia, 7.–9. september 2026, ajakirjanduses.