Objavljeno 2. julij 2026 po

Katerina Zourou (Web2Learn)

Preberite več o ponovljivem pilotnem projektu, ki je združeval uporabo platforme Europeana.eu in vmesnikov za aplikacijsko programiranje, predhodno naučene modele umetne inteligence, modeliranje kode v živo in semantično modeliranje podatkov, človeške prispevke na platformi za črpanje iz množic, orodje tezavra, ki upošteva pristranskost, in podatkovno metriko, kar je privedlo do obogatitve ukrajinske etnografske zbirke na platformi Europeana.eu s 55 000 opozorilnimi akcijami in skoraj 6 000 novimi oznakami metapodatkov.

Varstvo ukrajinske dediščine pod vodstvom državljanov

Od leta 2025 Web2Learn skupaj z univerzami v Luksemburgu, Latviji, Kijevu Tarasu Ševčenku in fundacijo Europeana sodeluje pri projektu AISTER, ki obravnava sodelovanje državljanov pri varovanju ukrajinske kulturne dediščine, ki temelji na umetni inteligenci. Web2Learn prispeva svoje strokovno znanje na področju inovacij, ki jih vodijo državljani, k projektu z uporabo odprtokodnih tehnologij, ki spodbujajo izobraževanje, usposabljanje in aktivno državljanstvo.

A painting of a woman in traditional Ukrainian attire with text about annotating Ukrainian folk art.

HITL Crowdsourcing Pilot Poster by Web2Learn vključuje Folk Painting "Portrait of a girl", kot je pripisano zgoraj, vključeno v sedanjo kompozicijo z dodatnim dovoljenjem imetnika pravic.

Konzorcij AISTER je v času trajanja projekta predvidel vrsto delavnic, na katerih bodo sodelovali raziskovalci, študenti in mladi strokovnjaki. Pet delavnic pod vodstvom Web2Learn online in na kraju samem v knjižnici Univerze v Latviji je ponudilo priložnost za izvedbo pilotnega projekta: preskusiti potek dela v zanki za obogatitev digitalnih zbirk slik s črpanjem iz množic in orodji umetne inteligence ter udeležence delavnice povabiti k sodelovanju z ukrajinsko etnografsko dediščino in aktivnemu prispevanju z obogatitvijo in potrjevanjem opisnih oznak, ustvarjenih z umetno inteligenco.

Pilotni projekt je bil zasnovan kot odprt in ponovljiv vir s podrobno dokumentacijo za olajšanje raziskav in usposabljanja na področju digitalne humanistike ter je prosto dostopen za ponovno uporabo s strani akademikov, študentov in učiteljev ter za ustvarjalno ponovno uporabo.

Ukrajinska ljudska umetnost na Europeana.eu

Leta 2025 je spletni muzej tradicionalne umetnosti Ukrajine Krovets, ki deluje od leta 2014 po zaslugi prostovoljnih prizadevanj ustanoviteljev muzeja, prek združevalnika MUSEU objavil nabor podatkov na Europeana.eu, ki zajema 3 840 artefaktov etnografske dediščine, vključno s tradicionalnimi kostumi, tekstilnimi obrtmi, ljudsko umetnostjo, materialno kulturo in fotografijami.

Slike, uporabljene za pilota, izvirajo iz te etnografske zbirke. V okviru pilotnega projekta je bila na Europeana.eu objavljena galerija ukrajinske ljudske umetnosti, ki omogoča dostop do muzejske podzbirke ljudske umetnosti, ki vključuje 312 artefaktov, uvrščenih med ljudske slike ali ljudske ikone. Večina slik, ki prikazujejo vsakdanje podeželsko življenje, folkloro in verske teme, izvira iz osrednjih etnografskih regij Ukrajine, Srednje Podniprovije in Poltavščene in datira predvsem v zgodnje in sredino 20. stoletja.

Zbirka je sestavljena predvsem iz žanrskih prizorov, pokrajin in posameznih portretov. Folk slike tvorijo vizualne pripovedi, ki ponujajo posnetke podeželskih pokrajin, verskih tradicij, motivov ljudske umetnosti in vsakdanje materialne kulture. Veliko podrobnosti je enostavno opaziti pri gledanju slik, vendar jih ni vedno enostavno odkriti z iskanjem.

Človeški v zanki crowdsourcing pilot

Cilj pilotnega projekta je bil ustvariti novo raven prepoznavnosti ukrajinske ljudske umetnosti. Razvil je delovni postopek, ki združuje uporabo vmesnikov za aplikacijsko programiranje Europeana, metod za obdelavo naravnega jezika in računalniškega vida, ki temeljijo na umetni inteligenci, prenosni računalnik Jupyter kot interaktivni delovni prostor za ponovljivo kodiranje in obdelavo podatkov na podlagi etike, skupaj z vključevanjem javnosti prek platforme za množično financiranje CrowdHeritage za ustvarjanje oznak opisov na splošno, ki jih je mogoče iskati, jih je potrdil človek in so etično ocenjene.

Za začetek sta bila uporabljena dva API-ja Europeane za pridobivanje galerijskih elementov in metapodatkov, API Europeana User Set za dostop do galerij, ki jih ustvarijo uporabniki, objavljenih na Europeani, in API Europeana Search za pridobivanje metapodatkov o vsebinah, do katerih se dostopa na Europeani, modeliran z uporabo podatkovnega modela Europeana (EDM). Nato so bile ustvarjene nove opisne oznake z orodji umetne inteligence, ki so uporabljala odprtokodne predhodno naučene modele umetne inteligence in knjižnice na področju obdelave naravnega jezika in računalniškega vida. Avtomatizirane oznake so bile ustvarjene v Jupyter Notebooks in serializirane v JSON-LD v skladu s podatkovnim modelom za spletne oznake konzorcija W3C (World Wide Web Consortium), da bi se podprl njihov uvoz v platformo CrowdHeritage crowdsourcing, ki jo vzdržuje Datoptron.

Skupno je pilot razvil osem Jupyterjevih prenosnih računalnikov, ki so delovali kot interaktivna računalniška okolja, ki omogočajo kodiranje v živo in ponovljivost za podporo izvajanju korakov obdelave podatkov od konca do konca. Prenosniki so bili uvedeni v Google Colab, da bi omogočili sodelovanje v realnem času in sourejanje, nato pa so bili preneseni kot odprto skladišče na GitHubu za nadzor različic, kar je olajšalo preglednost in sledljivost sodelovalne optimizacije kode. Zajemajo celoten postopek zbiranja podatkov pilotnega projekta v zaporednih korakih, ki vključujejo:

Korak 1: Samodejno ustvarjanje oznak iz besedilnih metapodatkov (na podlagi NLP)

1i. Z uporabniškim naborom Europeana ΑPI pridobite identifikacijske oznake artefaktov v objavljeni galeriji ukrajinske ljudske umetnosti in besedilne metapodatke (npr. naslove, teme) artefaktov z uporabo vmesnika Europeana Search API.

1ii. Ustvarite avtomatizirane oznake (oznake z opisom) iz metapodatkov z uporabo tehnik obdelave naravnega jezika (NLP), zlasti hevristike na podlagi pravil in prepoznavanja imenovanih subjektov (NER) z uporabo odprtokodne knjižnice Python spaCy.

Drugi korak: Samodejno ustvarjanje zaznamkov iz slik (na podlagi računalniškega vida)

2i. Prenesite artefakte iz galerije kot slike z uporabo API-ja Europeana User Set.

2ii. Ustvarite opisne napise slik z uporabo tehnik računalniškega vida s predhodno naučenimi umetnointeligenčnimi modeli, zlasti različicami odprtokodnih modelov Qwen – večmodalni vizualni jezikovni model Qwen3-VL-2B-Instruct (VLM) in veliki jezikovni model Qwen3.5-4B (LLM).

2iii. Ustvarite samodejne opombe iz napisov slik.

Korak 3: Priprava samodejnih opomb za potrjevanje z množičnimi viri (oblikovanje JSON-LD)

3i. Oblikujte vse ustvarjene opombe na podlagi modela W3C za neposredno zaužitje v platformi crowdsourcing CrowdHeritage.

3ii. Pretvorite končne pripombe, oblikovane v obliki JSON, v strojno berljiv CSV in združite vse pripombe iz petih delavnic množičnega izvajanja.

Četrti korak: Zagotavljanje kakovosti podatkov in pregledovanje pripomb, potrjenih s strani človeka, ob upoštevanju pristranskosti

4i. Preverite končne opombe proti škodljivim, pristranskim ali spornim izrazom v besednjaku DE-BIAS s poizvedovanjem v tezavru, ki temelji na RDF.

Screenshot of code for image captioning, with a painting of a man on a horse and a woman near a windmill below.

V petih delavnicah za črpanje iz množic, ki so potekale na kraju samem in na spletu, je 70 udeležencev, vključno z raziskovalci, univerzitetnimi študenti in strokovnjaki za ljudsko umetnost, pregledalo pripombe, ustvarjene z umetno inteligenco, potrdilo točne oznake, zavrnilo zavajajoče oznake z glasovi in negativnimi glasovi ter prispevalo dodatne lastne opombe.

Vpogled v podatke in etična ocena

Večina slik je bila obogatena s 15 do 20 novimi opisnimi oznakami. Skupno je bilo zabeleženih skoraj 55.000 zaznamkov, vključno z ustvarjanjem oznak, upvotes in downvotes. Rezultat je odpiranje bogatejših poti za odkrivanje ukrajinske ljudske umetnosti in sodelovanje z njo. Meritve po kampanji kažejo, da je bila večina oznak, ki jih je ustvarila umetna inteligenca, sprejeta kot točna, le nekaj pa jih je bilo zavrnjenih.

Teh pet oznak, ustvarjenih z umetno inteligenco, je prejelo najvišje stopnje sprejemljivosti:

ikona
slikanje
človek
drevje
ženska.

Teh pet oznak, ustvarjenih z umetno inteligenco, je prejelo najvišje stopnje zavrnitve:

razpoke
obleci
škoda
Majhen predmet
osebje.

Uporaba etične ocene učinka pri končnih opombah je bila obravnavana kot pomemben korak v pilotnem projektu. Druga raven pregleda je bila izvedena za opredelitev potencialno problematičnega jezika in okrepitev odgovornosti. S preverjanjem oznak, ki jih je odobril človek, glede na besednjak DE-BIAS je bil opredeljen en izraz, suženj, ki je bil nato na priporočilo spremenjen v zasužnjeno osebo. Besednjak je bil uporabljen kot ukrep za oceno etičnega učinka pred končno objavo odprtega nabora podatkov ob upoštevanju priporočila Unesca o etiki umetne inteligence (2022) in orodja za oceno etičnega učinka (2023).

Razvoj pilotnega projekta in razumevanje njegovih etičnih razsežnosti, povezanih z umetno inteligenco, sta temeljila tudi na študiji AISTER o analizi podatkov, v kateri je bilo evidentiranih 22 mednarodnih raziskovalnih projektov, pri katerih se umetna inteligenca in udeležba državljanov uporabljata za ohranjanje kulturne dediščine v izrednih razmerah. V študiji so bili izbrani projekti razvrščeni z uporabo klasifikacijskega okvira AISTER, ki ponuja sistematično kategorizacijo v 24 analitičnih razsežnostih, zasnovanih za analizo pobud participativne dediščine, ki temeljijo na umetni inteligenci. Okvirne razsežnosti vključujejo področja kulturne dediščine, model državljanske udeležbe (Shirk idr., 2012) in model sodelovanja (Carayannis & Campbell, 2009), skupaj z razsežnostmi, specifičnimi za umetno inteligenco, vključno z vrstami tehnologije umetne inteligence, modelom racionalnega agenta (Russell & Norvig, 2020, 4. izdaja), uporabljeno etično tipologijo umetne inteligence (Morley idr., 2019), vrstami licenc in drugimi. Vpogledi v podatke v študiji so objavljeni kot interaktivne spletne vizualizacije z odprtim dostopom, ki omogočajo primerjalno raziskovanje področja. Pilotni delovni postopek in ugotovitve so objavljeni v prihodnjem konferenčnem dokumentu (Ziku, Zourou, & Kouzelis, 2026).

Sklepne ugotovitve

Cilj pilotnega projekta je bil ustvariti odprto in ponovljivo pot za uporabo orodij umetne inteligence za obdelavo podatkov v velikem obsegu, skupaj s sodelovanjem ljudi, etičnim ocenjevanjem in vpogledi v podatke, da bi podprli natančnejše, odgovornejše, na metriki temelječe in obogatene načine odkrivanja ukrajinske ljudske umetnosti. Včasih se naključna pot v dediščino začne z besedo, vtipkano v iskalno polje. In včasih lahko prave besede prinesejo novo zbirko.

Trije najaktivnejši udeleženci kampanje crowdsourcing so prejeli honorar ter zlate, srebrne in bronaste značke: Inna Kaika, študentka angleškega jezika in tuje književnosti, Državna univerza Mykola Gogol; Daria Markova, študentka prevajanja, Pryazovskyi State Technical University; Marko Lakhmatov, študent kibernetske varnosti, državna tehnična univerza Pryazovskyi.

Inna je o svoji udeležbi povedala: „Ukrajinska umetnost odraža odpornost in ustvarjalnost naših ljudi, njena izmenjava pa je pomembnejša kot kdaj koli prej. Zaradi te strasti sem se pridružil kampanji, da bi kulturna dediščina postala dostopnejša. Še posebej mi je bil všeč postopek označevanja in raziskovanje etnografske zbirke. V čast mi je bilo prispevati k projektu, ki združuje umetnost in tehnologijo.“

Raziskovanje in ponovna uporaba pilotnih virov

Vas zanima uporaba podobnih metod v vaših zbirkah?

Oglejte si kampanjo crowdsourcing za ukrajinsko ljudsko umetnost na CrowdHeritage.
Raziščite pilotni projekt črpanja iz množic v zanki.
Ponovna uporaba odprtokodnih Jupyterjevih zvezkov, ki dokumentirajo celoten potek dela od pridobivanja podatkov do pripomb, ustvarjenih z umetno inteligenco, in izvoza, pripravljenega za platformo.
Dostop do odprtih naborov podatkov na odprtem repozitoriju družbe Zenodo, ki vključujejo pilotne podatke in izhodne podatke za hrambo, navajanje in ponovno uporabo.
Raziščite interaktivne vizualizacije podatkov in odkrijte spoznanja iz 22 mednarodnih raziskovalnih pobud, ki uporabljajo umetno inteligenco in državljansko udeležbo za ohranjanje kulturne dediščine v izrednih razmerah in drugod.

Zahvale

Zahvaljujemo se vsem partnerjem in sodelavcem projekta AISTER, zlasti Jevgenu Dmitruku iz muzeja Krovets, Eiriniju Kaldeliju iz CrowdHeritage in Datoptronu, Hugu Manguinhasu iz fundacije Europeana ter Uldisu Zariņšu in Saniti Reinsone iz latvijske univerze.

Izbrane reference

Dokumentacija Jupyter Notebooks upošteva merila ocenjevanja kakovosti za projekte Jupyter, ki jih izvajajo institucije GLAM, kot so bila objavljena v Candela, G., Chambers, S., & Sherratt, T. (2023). pristop k ocenjevanju kakovosti projektov Jupyter, ki so ga objavile institucije GLAM. Journal of the Association for Information Science and Technology, 74(13), 1550–1564.
V pilotni dokumentaciji README o mreži GitHub je sprejeta struktura dokumentacije nabora podatkov na podlagi zbirke podatkov KU Leuven Libraries Git. Glej: KU Leuven Libraries, oddelek za digitalizacijo. (2019). Nabor podatkov za zbiranje portretov knjižnic KU Leuven, posebne zbirke (različica 01-beta2) [Nabor podatkov]. Zenodo.
M. Ziku, K. Zourou, in A. Kouzelis, „AI-Assisted Metadata Enrichment for Ethnographic Heritage: A Reproducible Human-in-the-Loop Crowdsourcing Workflow, Mednarodna konferenca IEEE 2026 o kibernetski humanistiki (IEEE-CH), Benetke, Italija, 7.–9. september 2026, v tisku.

Discovering Ukrainian folk art together: a human-in-the-loop crowdsourcing pilot

Deli