Pročitajte kako biste vidjeli ponovljiv pilot-projekt u kojem su se kombinirali upotreba platforme Europeana.eu i API-ja, prethodno obučeni modeli umjetne inteligencije, live code i semantičko modeliranje podataka, ljudski doprinositelji na platformi crowdsourcing, alat za pristranost i mjerni podaci, što je dovelo do obogaćivanja ukrajinske etnografske zbirke na platformi Europeana.eu s pomoću 55 000 aktivnosti zapažanja i gotovo 6000 novih oznaka metapodataka.
Zaštita ukrajinske baštine pod vodstvom građana
Od 2025. Web2Learn, zajedno sa sveučilištima u Luksemburgu, Latviji, Kijevu Tarasu Shevchenku i Zakladom Europeana, surađuje na projektu AISTER, projektu Erasmus+ koji se bavi sudjelovanjem građana utemeljenim na umjetnoj inteligenciji u zaštiti ukrajinske kulturne baštine. Web2Learn svojim stručnim znanjem o inovacijama koje pokreću građani doprinosi projektu koristeći tehnologije otvorenog koda koje potiču obrazovanje, osposobljavanje i aktivno građanstvo.

HITL Crowdsourcing Pilot Plakat tvrtke Web2Learn uključuje Folk slikarstvo "Portret djevojke" kako je gore navedeno, ugrađeno u sadašnju kompoziciju uz dodatno dopuštenje nositelja prava.
Konzorcij AISTER predvidio je niz radionica u kojima će sudjelovati istraživači, studenti i mladi stručnjaci tijekom trajanja projekta. Pet radionica koje je vodio Web2Learn na internetu i na licu mjesta u knjižnici Sveučilišta u Latviji pružilo je priliku za pokretanje pilot-projekta: testirati tijek rada „ljudski u petlji” kako bi se digitalne zbirke slika obogatile alatima crowdsourcinga i umjetne inteligencije, pozivajući sudionike radionice da se uključe u ukrajinsku etnografsku baštinu i postanu aktivni sudionici obogaćivanjem i potvrđivanjem opisnih oznaka generiranih umjetnom inteligencijom.
Pilot-projekt osmišljen je kao otvoren i ponovljiv resurs s detaljnom dokumentacijom za olakšavanje istraživanja i osposobljavanja u području digitalnih humanističkih znanosti te je besplatno dostupan znanstvenicima, studentima i nastavnicima za ponovnu uporabu, kao i za kreativnu ponovnu uporabu.
Ukrajinska narodna umjetnost na Europeana.eu
Internetski muzej tradicionalne umjetnosti Ukrajine Krovets, koji djeluje od 2014. zahvaljujući dobrovoljnim naporima osnivača muzeja, objavio je 2025. skup podataka o platformi Europeana.eu putem agregatora MUSEU, koji obuhvaća 3840 artefakata etnografske baštine, uključujući tradicionalne nošnje, tekstilne zanate, narodnu umjetnost, materijalnu kulturu i fotografije.
Slike korištene za pilot-projekt potječu iz ove etnografske zbirke. U okviru pilot-projekta na platformi Europeana.eu objavljena je galerija ukrajinske narodne umjetnosti, koja omogućuje pristup podskupini muzeja za narodnu umjetnost, koja uključuje 312 artefakta klasificirana kao narodne slike ili narodne ikone. Većina slika, koje prikazuju svakodnevni ruralni život, folklor i vjerske teme, potječu iz središnjih etnografskih regija Ukrajine, Srednje Podniprovije i Poltavščine, a datiraju prije svega do početka i sredine dvadesetog stoljeća.
Zbirka se sastoji prvenstveno od žanrovskih scena, pejzaža i pojedinačnih portreta. Narodne slike čine vizualne narative, nudeći snimke ruralnih krajolika, vjerskih tradicija, motiva narodne umjetnosti i svakodnevne materijalne kulture. Mnoge detalje je lako primijetiti kada gledate slike, ali ih nije uvijek lako otkriti pretraživanjem.
Pilot-projekt crowdsourcinga u kojem sudjeluje čovjek u petlji
Cilj pilot-projekta bio je stvoriti novi sloj vidljivosti ukrajinske narodne umjetnosti. Razvio je tijek rada u kojem se kombiniraju upotreba API-ja Europeana, metode koje se temelje na umjetnoj inteligenciji za obradu prirodnog jezika i računalni vid, prijenosno računalo Jupyter kao interaktivni radni prostor za ponovljivo kodiranje i obrada podataka koja se temelji na etici, zajedno s javnim angažmanom putem platforme crowdsourcing CrowdHeritage kako bi se općenito stvorile oznake opisa koje se mogu pretraživati, koje je potvrdio čovjek i koje se etički ocjenjuju.
Za početak su korištena dva API-ja Europeana za dohvaćanje galerijskih stavki i metapodataka, API za korisnički set Europeana za pristup galerijama koje su izradili korisnici objavljen na Europeani i API za pretraživanje Europeana za dohvaćanje metapodataka sadržaja kojem se pristupa na Europeani, po uzoru na podatkovni model Europeana (EDM). Zatim su generirane nove opisne napomene s alatima umjetne inteligencije koji su upotrebljavali unaprijed obučene modele umjetne inteligencije otvorenog koda i knjižnice u obradi prirodnog jezika i računalnom vidu. Automatizirane bilješke generirane su u Jupyter prijenosnim računalima i serijalizirane u JSON-LD-u u skladu s modelom podataka o mrežnim bilješkama W3C-a (World Wide Web Consortium) kako bi se podržao njihov uvoz u platformu CrowdHeritage crowdsourcing koju održava Datoptron.
Ukupno je u okviru pilot-projekta razvijeno osam prijenosnih računala Jupyter, koja su funkcionirala kao interaktivna računalna okruženja koja omogućuju kodiranje i obnovljivost uživo kako bi se poduprla provedba koraka obrade podataka od kraja do kraja. Prijenosna računala uvedena su u Google Colab kako bi se omogućila suradnja i zajedničko uređivanje u stvarnom vremenu, a zatim su prenesena kao otvoreni repozitorij na GitHubu za kontrolu verzija, čime se olakšava transparentnost i sljedivost optimizacije suradničkog koda. Obuhvaćaju cjelokupni postupak obrade podataka pilot-projekta u uzastopnim koracima, koji uključuju:
Korak 1.: Automatizirano generiranje bilješki iz tekstualnih metapodataka (na temelju NLP-a)
1i. Dohvatiti identifikacijske oznake artikala u objavljenoj Galeriji ukrajinske narodne umjetnosti s pomoću Korisničkog skupa Europeana ΑPI i dohvatiti tekstualne metapodatke (npr. naslove, predmete) artefakata s pomoću API-ja za pretraživanje Europeana.
ii. Generirajte automatizirane bilješke (oznake opisa) iz metapodataka pomoću tehnika obrade prirodnog jezika (NLP), posebno heuristike temeljene na pravilima i prepoznavanja imenovanih subjekata (NER) pomoću otvorenog koda Python library spaCy.
Korak 2.: Automatizirano generiranje bilješki iz slika (na temelju računalnog vida)
2i. Preuzimanje Galerija artefakata kao slike pomoću Europeana User Set API.
2.ii. Generiranje opisnih opisa slika s pomoću tehnika računalnog vida s prethodno obučenim UI modelima, posebno varijantama Qwenovih modela otvorenog koda – Qwen3-VL-2B-Instruct multimodalni model vizualnog jezika (VLM) i Qwen3.5-4B veliki jezični model (LLM).
2iii. Generirajte automatizirane bilješke iz naslova slike.
Korak 3.: Priprema automatiziranih bilješki za validaciju iz mnoštva izvora (formiranje JSON-LD-a)
3i. Oblikujte sve generirane bilješke na temelju modela W3C za izravno gutanje u platformi crowdsourcing CrowdHeritage.
ii. Pretvorite završne napomene formatirane JSON-om u strojno čitljiv CSV i kombinirajte sve napomene iz pet radionica crowdsourcinga.
Četvrti korak: Osiguravanje kvalitete podataka i provjera pristranosti bilješki koje je potvrdio čovjek
4i. Provjerite konačne napomene protiv štetnih, pristranih ili spornih pojmova u rječniku DE-BIAS putem pretraživanja pojmovnika na temelju RDF-a.

Tijekom pet radionica crowdsourcinga održanih na licu mjesta i na internetu 70 sudionika, uključujući istraživače, sveučilišne studente i stručnjake za narodnu umjetnost, pregledalo je napomene generirane umjetnom inteligencijom, potvrdilo točne oznake, odbacilo obmanjujuće oznake putem upvota i downvota te doprinijelo dodatnim vlastitim bilješkama.
Uvidi u podatke i etička procjena
Većina slika obogaćena je s 15 do 20 novih opisnih oznaka. Ukupno je zabilježeno gotovo 55.000 anotacija, uključujući generiranje tagova, upvote i downvote. Rezultat toga je otvaranje bogatijih putova za otkrivanje ukrajinske narodne umjetnosti i bavljenje njome. Metrike nakon kampanje otkrivaju da je većina bilješki generiranih umjetnom inteligencijom prihvaćena kao točna, a samo ih je nekoliko odbijeno.
Tih pet oznaka generiranih umjetnom inteligencijom dobilo je najviše stope prihvaćanja:
- ikona
- slikarstvo
- covjek
- stabla
- žena.
Tih pet oznaka generiranih umjetnom inteligencijom dobilo je najviše stope odbijanja:
- pukotine
- obuci
- oštećenja
- mali objekt
- osoblje.
Primjena etičke procjene učinka na završne napomene smatra se važnim korakom u pilot-projektu. Provedena je druga razina preispitivanja kako bi se utvrdio potencijalno problematičan jezik i ojačala odgovornost. Provjerom oznaka koje je odobrio čovjek protiv rječnika DE-BIAS utvrđen je jedan pojam, rob, koji je naknadno revidiran na porobljenu osobu prema preporuci. Vokabular je primijenjen kao etička mjera procjene učinka prije konačne publikacije otvorenog skupa podataka, uzimajući u obzir Preporuku UNESCO-a o etici umjetne inteligencije (2022.) i alat za procjenu etičkog učinka (2023.).
Razvoj pilot-projekta i razumijevanje njegovih etičkih dimenzija povezanih s umjetnom inteligencijom temeljili su se i na studiji analize podataka AISTER, u kojoj su mapirana 22 međunarodna istraživačka projekta u kojima se umjetna inteligencija i sudjelovanje građana upotrebljavaju za očuvanje kulturne baštine u kriznim situacijama. U studiji su odabrani projekti razvrstani prema klasifikacijskom okviru AISTER, koji nudi sustavnu kategorizaciju u 24 analitičke dimenzije osmišljene za analizu inicijativa za participativnu baštinu koje se temelje na umjetnoj inteligenciji. Okvirne dimenzije uključuju područja kulturne baštine, model sudjelovanja građana (Shirk et al., 2012.) i model suradnje (Carayannis & Campbell, 2009.), uz dimenzije specifične za umjetnu inteligenciju, uključujući vrste tehnologije umjetne inteligencije, model racionalnog agenta (Russell & Norvig, 2020., 4. izdanje), primijenjenu etičku tipologiju umjetne inteligencije (Morley et al., 2019.), vrste dozvola i još mnogo toga. Uvidi u podatke iz studije objavljuju se kao interaktivne internetske vizualizacije s otvorenim pristupom koje omogućuju komparativno istraživanje tog područja. Tijek i rezultati pilot-projekta objavljeni su u sljedećem konferencijskom dokumentu (Ziku, Zourou, & Kouzelis, 2026.).
Zaključci
Cilj pilot-projekta bio je stvoriti otvoren i ponovljiv put za upotrebu alata umjetne inteligencije za obradu podataka u širim razmjerima, u kombinaciji s ljudskim sudjelovanjem, etičkom procjenom i uvidima u podatke, kako bi se poduprli točniji, odgovorniji, mjerni i obogaćeni načini otkrivanja ukrajinske narodne umjetnosti. Ponekad čudesno putovanje u baštinu započinje riječju unesenom u okvir za pretraživanje. I ponekad, prave riječi mogu donijeti novu kolekciju na svjetlo.
Tri najaktivnija suradnika kampanje crowdsourcinga dobila su počasne, kao i zlatne, srebrne i brončane značke: Inna Kaika, studentica engleskog jezika i strane književnosti, Državno sveučilište Mykola Gogol; Daria Markova, studentica prevođenja, Državno tehničko sveučilište Pryazovskyi; Marko Lakhmatov, student kibernetičke sigurnosti, Državno tehničko sveučilište Pryazovskyi.
Osvrćući se na svoje sudjelovanje, Inna je podijelila: „Ukrajinska umjetnost odražava otpornost i kreativnost naših ljudi, a dijeljenje je važnije nego ikad. Potaknut tom strašću, pridružio sam se kampanji kako bih kulturnu baštinu učinio dostupnijom. Posebno sam uživao u procesu bilježenja i istraživanju etnografske zbirke. Bila je čast doprinijeti projektu koji objedinjuje umjetnost i tehnologiju.”
Istražite i ponovno upotrijebite resurse pilot-projekta
Zainteresirani ste za primjenu sličnih metoda na vlastite kolekcije?
- Pogledajte crowdsourcing kampanju za ukrajinsku narodnu umjetnost na CrowdHeritage.
- Istražite pilot-projekt crowdsourcinga u kojem sudjeluje čovjek u petlji.
- Ponovna upotreba Jupyter prijenosnih računala otvorenog koda, u kojima se dokumentira cijeli tijek rada od dohvata podataka do bilješki generiranih umjetnom inteligencijom i izvoza spremnog za platformu.
- Pristup otvorenim skupovima podataka u otvorenom repozitoriju poduzeća Zenodo, koji uključuju podatke i izlazne podatke pilot-projekta za očuvanje, citiranje i ponovnu uporabu.
- Istražite interaktivne vizualizacije podataka i otkrijte uvide iz 22 međunarodne istraživačke inicijative u kojima se umjetna inteligencija i sudjelovanje građana upotrebljavaju za očuvanje kulturne baštine u hitnim situacijama i šire.
Priznanja
Zahvaljujemo svim partnerima i suradnicima projekta AISTER, a posebno Yevgenu Dmytruku u Muzeju Krovets, Eirini Kaldeli u CrowdHeritageu i Datoptronu, Hugu Manguinhasu u Zakladi Europeana te Uldisu Zariņšu i Saniti Reinsone na Sveučilištu u Latviji.
Odabrana upućivanja
- Dokumentacija bilježnica Jupyter u skladu je s kriterijima za ocjenjivanje kvalitete projekata Jupyter koje provode institucije GLAM-a, kako su objavljeni u Candela, G., Chambers, S., & Sherratt, T. (2023.). Pristup procjeni kvalitete projekata Jupyter koje su objavile institucije GLAM-a. Časopis Udruženja za informacijske znanosti i tehnologiju, 74(13), 1550.–1564.
- U pilot-dokumentaciji README o GitHubu prihvaća se struktura dokumentacije o skupu podataka na temelju baze podataka KU Leuven Libraries Git. Vidjeti: KU Leuven Knjižnice, Odjel za digitalizaciju. (2019). Skup podataka zbirke portreta knjižnica KU Leuven, posebne zbirke (verzija 01-beta2) [skup podataka]. Zenodo.
- M. Ziku, K. Zourou i A. Kouzelis, „Obogaćivanje metapodataka za etnografsku baštinu potpomognuto umjetnom inteligencijom: „A Reproducible Human-in-the-Loop Crowdsourcing Workflow”, Međunarodna konferencija IEEE-a o kiberhumanističkim znanostima (IEEE-CH), Venecija, Italija, 7. i 9. rujna 2026., u tisku.