Lue lisää toistettavissa olevasta pilottihankkeesta, jossa yhdistettiin Europeana.eu-alustan ja API-rajapintojen käyttö, esikoulutetut tekoälymallit, reaaliaikainen koodi ja semanttinen datamallinnus, joukkoistamisalustalla olevat ihmisen avustajat, harhaanjohtava tesaurustyökalu ja datametriikka, mikä johti ukrainalaisen etnografisen kokoelman rikastumiseen Europeana.eu-sivustolla 55 000 huomautustoimen ja lähes 6 000 uuden metatietotunnisteen avulla.
Kansalaisjohtoinen ukrainalaisen perinnön suojelu
Vuodesta 2025 lähtien Web2Learn on yhdessä Luxemburgin, Latvian, Kiovan ja Taras Shevchenkon yliopistojen sekä Europeana-säätiön kanssa tehnyt yhteistyötä AISTER-hankkeessa, Erasmus+-hankkeessa, jossa käsitellään tekoälyä hyödyntävää kansalaisten osallistumista Ukrainan kulttuuriperinnön turvaamiseen. Web2Learn tarjoaa asiantuntemustaan kansalaislähtöisestä innovoinnista hankkeeseen, jossa hyödynnetään avoimen lähdekoodin teknologioita, jotka edistävät koulutusta ja aktiivista kansalaisuutta.

HITL Crowdsourcing Pilot Poster by Web2Learn sisältää kansanmaalauksen "Tytön muotokuva", kuten edellä on osoitettu, sisällytetty nykyiseen kokoonpanoon oikeudenhaltijan lisäluvalla.
AISTER-konsortio on suunnitellut hankkeen ajaksi työpajoja, joihin osallistuu tutkijoita, opiskelijoita ja nuoria ammattilaisia. Web2Learnin johtamat viisi työpajaa verkossa ja paikan päällä Latvian yliopiston kirjastossa tarjosivat tilaisuuden pilottihankkeen järjestämiseen: testataan ihmisen silmukassa -työnkulkua digitaalisten kuvakokoelmien rikastamiseksi joukkoistamis- ja tekoälytyökalujen avulla ja kehotetaan työpajan osallistujia osallistumaan Ukrainan etnografiseen perintöön ja ryhtymään aktiivisiksi osallistujiksi täydentämällä ja validoimalla tekoälyn tuottamia kuvaustunnisteita.
Pilotti suunniteltiin avoimeksi ja toistettavaksi resurssiksi, jossa on yksityiskohtainen dokumentaatio digitaalisen humanistisen tutkimuksen ja koulutuksen helpottamiseksi, ja se on vapaasti tutkijoiden, opiskelijoiden ja opettajien käytettävissä uudelleenkäyttöön sekä luovaan uudelleenkäyttöön.
Ukrainalaista kansantaidetta Europeana.eu-sivustolla
Vuonna 2025 Ukrainan perinteisen taiteen Krovets-verkkomuseo, joka on toiminut vuodesta 2014 museon perustajien vapaaehtoisten toimien ansiosta, julkaisi MUSEU-aggregaattorin kautta Europeana.eu-sivustoa koskevan tietoaineiston, joka sisältää 3 840 etnografisen perinnön esinettä, kuten perinteisiä pukuja, tekstiilikäsitöitä, kansantaidetta, materiaalikulttuuria ja valokuvia.
Pilotissa käytetyt kuvat ovat peräisin tästä etnografisesta kokoelmasta. Osana pilottihanketta Europeana.eu-sivustolla julkaistiin ukrainalaisen kansantaiteen galleria, joka tarjoaa pääsyn museon kansantaiteen alakokoelmaan, johon kuuluu 312 kansanmaalauksiksi tai kansankuvakkeiksi luokiteltua esinettä. Useimmat maalaukset, jotka kuvaavat maaseudun jokapäiväistä elämää, kansanperinnettä ja uskonnollisia teemoja, ovat peräisin Ukrainan keskisiltä etnografisilta alueilta, Keski-Podniproviasta ja Poltavshchynasta, ja ne ovat peräisin pääasiassa 1900-luvun alkupuolelta ja puolivälistä.
Kokoelma koostuu pääasiassa genrekohtauksista, maisemista ja yksittäisistä muotokuvista. Kansanmaalaukset muodostavat visuaalisia kertomuksia, jotka tarjoavat tilannekuvia maaseutumaisemista, uskonnollisista perinteistä, kansantaiteen motiiveista ja jokapäiväisestä materiaalikulttuurista. Monet yksityiskohdat on helppo huomata kuvia katsellessa, mutta niitä ei aina ole helppo löytää haun avulla.
Human-in-the-loop crowdsourcing -pilotti
Pilottihankkeen tavoitteena oli luoda ukrainalaiselle kansantaiteelle uusi näkyvyystaso. Siinä kehitettiin työnkulku, jossa yhdistyvät Europeanan sovellusrajapintojen käyttö, tekoälyyn perustuvat menetelmät luonnollisen kielen käsittelyyn ja tietokonenäköön, Jupyter Notebook interaktiivisena työtilana toistettavissa olevalle koodaukselle ja etiikkapohjainen tietojenkäsittely sekä julkinen osallistuminen joukkoistamisalustan CrowdHeritage kautta hakukelpoisten, ihmisen validoimien ja eettisesti arvioitujen kuvaustunnisteiden luomiseksi.
Aloittamiseen käytettiin kahta Europeana-sovellusliittymää gallerian kohteiden ja metatietojen hakemiseen, Europeana User Set -sovellusliittymää Europeanassa julkaistujen käyttäjien tuottamien gallerioiden käyttämiseen ja Europeana Search -sovellusliittymää Europeanassa käytettävän sisällön metatietojen hakemiseen Europeana-tietomallin (EDM) avulla. Sitten luotiin uusia kuvailevia huomautuksia tekoälytyökaluilla, jotka käyttivät avoimen lähdekoodin ennalta koulutettuja tekoälymalleja ja kirjastoja luonnollisen kielen käsittelyssä ja tietokonenäkössä. Automaattiset merkinnät generoitiin Jupyter Notebooksissa ja sarjoitettiin JSON-LD:hen W3C:n (World Wide Web Consortium) Web Annotation Data Modelin mukaisesti tukemaan niiden tuontia Datoptronin ylläpitämään CrowdHeritage-joukkoistamisalustaan.
Pilotti kehitti yhteensä kahdeksan Jupyter-kannettavaa, jotka toimivat vuorovaikutteisina laskentaympäristöinä, jotka mahdollistavat reaaliaikaisen koodauksen ja toistettavuuden tukemaan tietojenkäsittelyvaiheiden suorittamista päästä päähän. Muistikirjat otettiin käyttöön Google Colabissa reaaliaikaisen yhteistyön ja yhteismuokkaamisen mahdollistamiseksi, minkä jälkeen ne siirrettiin GitHubin avoimeen arkistoon versionhallintaa varten, mikä helpotti yhteistoiminnallisen koodin optimoinnin läpinäkyvyyttä ja jäljitettävyyttä. Ne kattavat pilottihankkeen koko tietoprosessin vaiheittain, joita ovat muun muassa seuraavat:
Vaihe 1: Automaattinen huomautusten luominen tekstimuotoisista metatiedoista (NLP-pohjainen)
1i. Hae esineiden tunnukset julkaistusta Ukrainan kansantaiteen galleriasta Europeana User Set ΑPI:n avulla ja hae esineiden tekstimuotoiset metatiedot (esim. otsikot, aiheet) Europeana Search API:n avulla.
1ii. Luo automaattiset merkinnät (kuvaustunnisteet) metatiedoista käyttämällä luonnollisen kielen käsittelytekniikoita (NLP), erityisesti sääntöpohjaista heuristiikkaa ja nimetyn yksikön tunnistusta (NER) avoimen lähdekoodin Python-kirjaston spaCy: n avulla.
Vaihe 2: Automaattinen huomautusten generointi kuvista (tietokonenäköpohjainen)
2i. Lataa Galleria-artefakteja kuvina Europeana User Set API:n avulla.
2ii. Luo kuvailevia kuvatekstejä käyttämällä tietokonenäkötekniikoita esikoulutetuilla tekoälymalleilla, erityisesti avoimen lähdekoodin Qwen-mallien muunnelmilla – Qwen3-VL-2B-Instruct multimodaalinen visuaalinen kielimalli (VLM) ja Qwen3.5-4B suuri kielimalli (LLM).
2iii. Luo automaattisia huomautuksia kuvateksteistä.
Vaihe 3: Automaattisten huomautusten laatiminen joukkoistettua validointia varten (JSON-LD-muotoilu)
3i. Muotoile kaikki W3C-merkintämalliin perustuvat merkinnät suoraa nielemistä varten joukkoistamisalustalla CrowdHeritage.
3ii. Muunna JSON-muotoillut lopulliset merkinnät koneellisesti luettavaksi CSV:ksi ja yhdistä kaikki viiden joukkoistamistyöpajan merkinnät.
Vaihe 4: Tietojen laadunvarmistus ja ihmisen vahvistamien huomautusten harhaanjohtava seulonta
4i. Tarkista lopulliset huomautukset haitallisista, puolueellisista tai kiistanalaisista termeistä DE-BIAS-sanastossa RDF-pohjaisen tesauruskyselyn avulla.

Viiden paikan päällä ja verkossa järjestetyn joukkoistamistyöpajan aikana 70 osallistujaa, mukaan lukien tutkijat, yliopisto-opiskelijat ja kansantaiteen asiantuntijat, tarkastelivat tekoälyn tuottamia huomautuksia, vahvistivat tarkat tunnisteet, hylkäsivät harhaanjohtavat tunnisteet ylä- ja alaäänillä ja antoivat omia lisämerkintöjään.
Datan oivallukset ja eettinen arviointi
Suurin osa kuvista täydennettiin 15-20 uudella kuvailevalla tunnisteella. Kaiken kaikkiaan kirjattiin lähes 55 000 huomautustoimenpidettä, mukaan lukien tunnisteiden luominen, ylä- ja alaäänet. Tuloksena on rikkaampia väyliä ukrainalaisen kansantaiteen löytämiseen ja siihen osallistumiseen. Kampanjan jälkeiset mittarit osoittavat, että useimmat tekoälyn tuottamat merkinnät hyväksyttiin tarkoiksi ja vain muutama hylättiin.
Nämä viisi tekoälyn tuottamaa tunnistetta saivat korkeimmat hyväksymisasteet:
- kuvaketta
- maalaus
- äijä
- puut
- nainen.
Nämä viisi tekoälyn tuottamaa tunnistetta saivat korkeimmat hylkäysasteet:
- halkeamia
- kuluminen
- vahingot
- pieni esine
- henkilöstö.
Eettisen vaikutustenarvioinnin soveltamista lopullisiin huomautuksiin pidettiin tärkeänä askeleena pilotissa. Toisessa tarkastelukerroksessa pyrittiin tunnistamaan mahdollisesti ongelmallinen kieli ja vahvistamaan vastuuvelvollisuutta. Ihmisen hyväksymien tunnisteiden seulonta DE-BIAS-sanaston perusteella yksilöi yhden termin, orjan, joka myöhemmin tarkistettiin orjuutetuksi henkilöksi suosituksen mukaisesti. Sanastoa sovellettiin eettisenä vaikutustenarviointitoimenpiteenä ennen lopullisen avoimen data-aineiston julkaisemista ottaen huomioon Unescon suositus tekoälyn etiikasta (2022) ja eettinen vaikutustenarviointiväline (2023).
Pilottihankkeen kehittämisessä ja sen tekoälyyn liittyvien eettisten ulottuvuuksien ymmärtämisessä hyödynnettiin myös AISTER-data-analyysitutkimusta, jossa kartoitettiin 22 kansainvälistä tutkimushanketta, joissa käytetään tekoälyä ja kansalaisten osallistumista kulttuuriperinnön säilyttämiseen hätätilanteissa. Tutkimuksessa valitut hankkeet luokiteltiin käyttäen AISTER-luokituskehystä, joka tarjoaa järjestelmällisen luokittelun 24 analyyttiseen ulottuvuuteen, jotka on suunniteltu analysoimaan tekoälyyn perustuvia osallistavaa kulttuuriperintöä koskevia aloitteita. Puiteulottuvuuksiin kuuluvat kulttuuriperintöalat, kansalaisten osallistumismalli (Shirk et al., 2012) ja yhteistyömalli (Carayannis & Campbell, 2009) sekä tekoälyyn liittyvät ulottuvuudet, mukaan lukien tekoälyteknologiatyypit, rationaalinen agenttimalli (Russell & Norvig, 2020, 4. painos), sovellettu eettinen tekoälytypologia (Morley et al., 2019), lisenssityypit ja paljon muuta. Tutkimuksen tiedot julkaistaan avoimena interaktiivisena web-visualisointina, joka tarjoaa vertailevan tutkimuksen alasta. Pilottityönkulku ja tulokset julkaistaan tulevassa konferenssiasiakirjassa (Ziku, Zourou, & Kouzelis, 2026).
Päätelmät
Pilottihankkeen tavoitteena oli luoda avoin ja toistettavissa oleva polku tekoälytyökalujen käyttämiseksi datan laajamittaiseen käsittelyyn yhdistettynä ihmisen osallistumiseen, eettiseen arviointiin ja datanäkemyksiin, jotta voidaan tukea tarkempia, vastuullisempia, mittareihin perustuvia ja rikastettuja tapoja löytää ukrainalaista kansantaidetta. Joskus serendipitous-matka perintöön alkaa hakukenttään kirjoitetulla sanalla. Ja joskus oikeat sanat voivat tuoda uuden kokoelman valoon.
Joukkoistamiskampanjan kolme aktiivisinta osallistujaa saivat kunniamerkin sekä kulta-, hopea- ja pronssimerkit: Inna Kaika, englannin kielen ja ulkomaisen kirjallisuuden opiskelija, Mykola Gogolin valtionyliopisto; Daria Markova, kääntämisen opiskelija, Pryazovskyi State Technical University; Marko Lakhmatov, kyberturvallisuuden opiskelija, Pryazovskyi State Technical University.
Inna kertoi osallistumisestaan seuraavasti: ”Ukrainalainen taide kuvastaa kansamme selviytymiskykyä ja luovuutta, ja sen jakaminen on tärkeämpää kuin koskaan. Tämän intohimon ohjaamana liityin kampanjaan kulttuuriperinnön saavutettavuuden parantamiseksi. Nautin erityisesti huomautusprosessista ja etnografisen kokoelman tutkimisesta. Oli kunnia osallistua taidetta ja teknologiaa yhdistävään hankkeeseen.”
Tutustu pilottiresursseihin ja käytä niitä uudelleen
Oletko kiinnostunut käyttämään samanlaisia menetelmiä omissa kokoelmissasi?
- Katso Ukrainan kansantaiteen joukkoistamiskampanja CrowdHeritagessa.
- Tutustu Human-in-the-loop crowdsourcing -pilottiin.
- Käytä uudelleen avoimen lähdekoodin Jupyter-muistikirjoja , jotka dokumentoivat koko työnkulun tietojen hausta tekoälyn tuottamiin huomautuksiin ja alustavalmiiseen vientiin.
- Pääsy Zenodon avoimessa tietovarastossa oleviin avoimiin tietoaineistoihin, jotka sisältävät pilottihankkeen tiedot ja tuotokset säilyttämistä, lainausta ja uudelleenkäyttöä varten.
- Tutustu interaktiivisiin datavisualisointeihin ja ota selvää 22 kansainvälisestä tutkimusaloitteesta, joissa hyödynnetään tekoälyä ja kansalaisten osallistumista kulttuuriperinnön säilyttämiseen hätätilanteissa ja niiden ulkopuolella.
Tunnustukset
Haluamme kiittää kaikkia AISTER-projektin kumppaneita ja yhteistyökumppaneita, erityisesti Yevgen Dmytruk Krovets-museossa, Eirini Kaldeli CrowdHeritagessa ja Datoptronissa, Hugo Manguinhas Europeana-säätiössä ja Uldis Zariņš ja Sanita Reinsone Latvian yliopistossa.
Valitut referenssit
- Jupyter-muistikirjojen dokumentaatio noudattaa GLAM-instituutioiden Jupyter-hankkeiden laadunarviointikriteerejä, jotka on julkaistu julkaisussa Candela, G., Chambers, S., & Sherratt, T. (2023). Lähestymistapa, jolla arvioidaan GLAM-instituutioiden julkaisemien Jupyter-hankkeiden laatua. Journal of the Association for Information Science and Technology, 74(13), 1550–1564.
- Pilottihankkeen GitHubia koskevassa README-dokumentaatiossa noudatetaan KU Leuven -kirjastojen Git-pohjaisen data-aineistodokumentaation rakennetta. Ks. KU Leuvenin kirjastot, digitointiosasto. (2019). The Portraits Collection Dataset of KU Leuven Libraries, Special Collections (Version 01-beta2) [Tietosarja]. Zenodo. - Mitä?
- M. Ziku, K. Zourou ja A. Kouzelis, 'AI-Assisted Metadata Enrichment for Ethnographic Heritage: A Reproducible Human-in-the-Loop Crowdsourcing Workflow, 2026 IEEE International Conference on Cyber Humanities (IEEE-CH), Venetsia, Italia, 7.–9. syyskuuta 2026, lehdistössä.