Susipažinkite su atkuriamu bandomuoju projektu, kuriame buvo derinamas platformos „Europeana.eu“ ir API, iš anksto apmokytų DI modelių, tiesioginio kodo ir semantinio duomenų modeliavimo, žmonių duomenų teikėjų visuomenės patalkos platformoje, šališkai suvokiamo tezauro priemonės ir duomenų metrikos naudojimas, dėl kurio buvo papildytas Ukrainos etnografinis rinkinys portale „Europeana.eu“ atliekant 55 000 anotavimo veiksmų ir beveik 6 000 naujų metaduomenų žymų.
Piliečių vadovaujama Ukrainos paveldo apsauga
Nuo 2025 m. „Web2Learn“ kartu su Liuksemburgo, Latvijos, Kijevo universitetais Tarasu Ševčenko ir fondu „Europeana“ bendradarbiauja įgyvendinant „Erasmus+“ projektą AISTER, kuriuo sprendžiamas dirbtiniu intelektu grindžiamo piliečių dalyvavimo saugant Ukrainos kultūros paveldą klausimas. "Web2Learn" prisideda prie projekto, kuriame naudojamos atvirojo kodo technologijos, skatinančios švietimą, mokymą ir aktyvų pilietiškumą.

"HITL Crowdsourcing" bandomasis plakatas "Web2Learn" apima liaudies tapybą "mergaitės portretas", kaip nurodyta pirmiau, įtrauktas į dabartinę kompoziciją su papildomu teisių turėtojo leidimu.
Projekto laikotarpiu AISTER konsorciumas numatė keletą praktinių seminarų, kuriuose dalyvaus mokslininkai, studentai ir jauni specialistai. Penki praktiniai seminarai, kuriems vadovavo „Web2Learn“ internetu ir vietoje Latvijos universiteto bibliotekoje, suteikė galimybę vykdyti bandomąjį projektą: išbandyti žmogaus dalyvavimo procese darbo eigą, siekiant praturtinti skaitmenines vaizdų kolekcijas pasitelkiant visuomenės patalką ir DI priemones, kviečiant seminaro dalyvius domėtis Ukrainos etnografiniu paveldu ir tapti aktyviais rėmėjais praturtinant ir patvirtinant DI sukurtas aprašymo žymas.
Bandomasis projektas buvo sukurtas kaip atviras ir atkuriamas išteklius su išsamiais dokumentais, siekiant palengvinti skaitmeninių humanitarinių mokslų mokslinius tyrimus ir mokymą, ir yra laisvai prieinamas mokslininkams, studentams ir mokytojams pakartotinai naudoti, taip pat kūrybiniam pakartotiniam naudojimui.
Ukrainiečių liaudies menas Europeana.eu
2025 m. „Krovets Online Museum of Traditional Art of Ukraine“, veikiantis nuo 2014 m. dėl savanoriškų muziejaus steigėjų pastangų, per telkėją MUSEU paskelbė duomenų rinkinį „Europeana.eu“, kurį sudaro 3 840 etnografinio paveldo artefaktų, įskaitant tradicinius kostiumus, tekstilės amatus, liaudies meną, materialinę kultūrą ir nuotraukas.
Pilotui naudoti vaizdai kilę iš šios etnografinės kolekcijos. Vykdant bandomąjį projektą Europeana.eu svetainėje buvo paskelbta Ukrainos liaudies meno galerija, kurioje galima susipažinti su muziejaus liaudies meno subkolekcija, kurią sudaro 312 artefaktų, priskiriamų liaudies paveikslams arba liaudies ikonoms. Dauguma paveikslų, vaizduojančių kasdienį kaimo gyvenimą, folklorą ir religines temas, yra kilę iš centrinių etnografinių Ukrainos regionų, Vidurio Podniprovijos ir Poltavščynos, ir daugiausia datuojami XX amžiaus pradžioje ir viduryje.
Kolekciją daugiausia sudaro žanrinės scenos, peizažai ir individualūs portretai. Liaudies paveikslai formuoja vaizdinius naratyvus, kuriuose pateikiami kaimo kraštovaizdžių, religinių tradicijų, liaudies meno motyvų ir kasdienės materialinės kultūros vaizdai. Daugelis detalių yra lengva pastebėti, kai žiūri į vaizdus, bet ne visada lengva atrasti per paiešką.
Žmogaus-in-the-loop crowdsourcing bandomasis projektas
Bandomuoju projektu buvo siekiama sukurti naują Ukrainos liaudies meno matomumo lygmenį. Juo buvo sukurta darbo eiga, apimanti „Europeanos“ programų sąsajas, dirbtiniu intelektu grindžiamus natūraliosios kalbos apdorojimo ir kompiuterinės vizijos metodus, „Jupyter Notebook“ kaip interaktyvią atkuriamo kodavimo darbo erdvę ir etika grindžiamą duomenų tvarkymą, taip pat visuomenės dalyvavimą per visuomenės patalkos platformą „CrowdHeritage“, siekiant apskritai sukurti paieškai tinkamas, žmogaus patvirtintas ir etiškai įvertintas aprašymo žymas.
Norėdami pradėti, galerijos elementams ir metaduomenims gauti buvo naudojamos dvi „Europeanos“ API, „Europeanos“ naudotojų rinkinio API, skirta prieigai prie „Europeanoje“ paskelbtų naudotojų sukurtų galerijų, ir „Europeanos“ paieškos API, skirta „Europeanoje“ pasiekiamo turinio metaduomenų paieškai, modeliuojama naudojant „Europeanos“ duomenų modelį (EDM). Tada buvo sukurtos naujos aprašomosios anotacijos naudojant dirbtinio intelekto priemones, kuriose buvo naudojami atvirojo kodo iš anksto parengti dirbtinio intelekto modeliai ir bibliotekos, skirtos natūraliosios kalbos apdorojimui ir kompiuterinei vizijai. Automatinės anotacijos buvo sugeneruotos Jupyter Notebooks ir serijuotos JSON-LD pagal W3C (World Wide Web Consortium) žiniatinklio anotacijų duomenų modelį, siekiant paremti jų importą į Datoptron prižiūrimą CrowdHeritage crowdsourcing platformą.
Iš viso bandomasis projektas sukūrė aštuonis „Jupyter Notebook“ kompiuterius, kurie veikė kaip interaktyvios kompiuterinės aplinkos, leidžiančios tiesioginį kodavimą ir atkuriamumą, kad būtų galima vykdyti ištisinius duomenų apdorojimo etapus. Nešiojamieji kompiuteriai buvo įdiegti "Google Colab", kad būtų galima tikruoju laiku bendradarbiauti ir bendrai redaguoti, o tada perduoti kaip atvirą "GitHub" saugyklą versijų kontrolei, palengvinant bendradarbiavimo kodo optimizavimo skaidrumą ir atsekamumą. Jie apima visą bandomojo projekto duomenų procesą nuosekliais etapais, įskaitant:
1 etapas. Automatinis anotacijų generavimas iš tekstinių metaduomenų (pagal NLP)
1i. Iš paskelbtos Ukrainos liaudies meno galerijos per „Europeanos“ naudotojų rinkinį ΑPI gaukite daiktų ID, o per „Europeanos“ paieškos API gaukite artefaktų tekstinius metaduomenis (pvz., pavadinimus, temas).
1ii. Sukurti automatines anotacijas (aprašymo žymes) iš metaduomenų, naudojant natūraliosios kalbos apdorojimo (NLP) metodus, ypač taisyklėmis pagrįstą euristiką ir įvardyto subjekto atpažinimą (NER), naudojant atvirojo kodo Python bibliotekos spaCy.
2 etapas. Automatinis anotacijų generavimas iš vaizdų (kompiuterinis regėjimas)
2i. Atsisiųskite galerijos artefaktus kaip vaizdus naudodami „Europeanos“ naudotojų rinkinio API.
2ii. Sukurti aprašomąsias vaizdo antraštes naudojant kompiuterinės regos metodus ir iš anksto parengtus DI modelius, visų pirma atvirojo kodo Qwen modelių variantus – Qwen3-VL-2B-Instruct multimodalinį vizualinės kalbos modelį (VLM) ir Qwen3.5-4B didelės apimties kalbos modelį (LLM).
2iii. Sukurti automatines anotacijas iš vaizdo antraštes.
3 etapas. Automatinių anotacijų parengimas visuomenės patalkos patvirtinimui (JSON-LD formatavimas)
3i. Formatuokite visas sugeneruotas anotacijas, pagrįstas W3C anotacijų modeliu, skirtu tiesioginiam prarijimui visuomenės patalkos platformoje CrowdHeritage.
3ii. Konvertuokite JSON formato galutines anotacijas į kompiuterio skaitomą CSV ir sujunkite visas penkių visuomenės patalkos seminarų anotacijas.
4 etapas. Duomenų kokybės užtikrinimas ir žmogaus patvirtintų anotacijų tikrinimas atsižvelgiant į šališkumą
4i. Patikrinkite galutines pastabas dėl žalingų, šališkų ar ginčytinų terminų DE-BIAS žodyne per RDF pagrįstą tezauro užklausą.

Per penkis visuomenės patalkos praktinius seminarus, surengtus vietoje ir internetu, 70 dalyvių, įskaitant tyrėjus, universitetų studentus ir liaudies meno ekspertus, peržiūrėjo dirbtinio intelekto sukurtas anotacijas, patvirtino tikslias žymas, atmetė klaidinančias per padidintus ir sumažintus balsus ir pateikė papildomų savo anotacijų.
Duomenų įžvalgos ir etinis vertinimas
Dauguma vaizdų buvo praturtinti 15-20 naujų aprašomųjų žymų. Iš viso buvo užregistruota beveik 55 000 anotavimo veiksmų, įskaitant žymų generavimą, padidintus balsus ir sumažintus balsus. Rezultatas – atverti turtingesnius Ukrainos liaudies meno atradimo ir bendravimo su juo kelius. Po kampanijos surinkti duomenys rodo, kad dauguma dirbtinio intelekto sukurtų anotacijų buvo priimtos kaip tikslios, o tik kelios buvo atmestos.
Šie penki DI sukurti žymenys sulaukė didžiausio pripažinimo:
- piktograma
- dažymas
- vyras
- medžiai
- moteris.
Šių penkių dirbtinio intelekto sukurtų žymenų atmetimo rodikliai buvo didžiausi:
- įtrūkimai
- dėvėti
- žala
- mažas objektas
- darbuotojai.
Etinio poveikio vertinimo taikymas galutinėms anotacijoms buvo laikomas svarbiu bandomojo projekto etapu. Antrasis peržiūros lygmuo buvo atliktas siekiant nustatyti galimai problemišką kalbą ir sustiprinti atskaitomybę. Patikrinus žmogaus patvirtintus žymenis pagal DE-BIAS žodyną, buvo nustatytas vienas terminas, vergas, kuris vėliau buvo persvarstytas į vergišką asmenį pagal rekomendaciją. Žodynas buvo taikomas kaip poveikio etikai vertinimo priemonė prieš paskelbiant galutinį atvirųjų duomenų rinkinį, atsižvelgiant į UNESCO rekomendaciją dėl dirbtinio intelekto etikos (2022 m.) ir Etinio poveikio vertinimo priemonę (2023 m.).
Bandomojo projekto plėtojimas ir su dirbtiniu intelektu susijusių etinių aspektų supratimas taip pat buvo grindžiami AISTER duomenų analizės tyrimu, kuriame nustatyti 22 tarptautiniai mokslinių tyrimų projektai, kuriuose dirbtinis intelektas ir piliečių dalyvavimas naudojami kultūros paveldui išsaugoti ekstremaliosios situacijos aplinkybėmis. Atliekant tyrimą atrinkti projektai buvo suskirstyti pagal AISTER klasifikavimo sistemą, pagal kurią jie sistemingai skirstomi į kategorijas pagal 24 analitinius aspektus, skirtus dirbtiniu intelektu grindžiamoms dalyvaujamojo paveldo iniciatyvoms analizuoti. Pagrindiniai aspektai apima kultūros paveldo sritis, piliečių dalyvavimo modelį (Shirk et al., 2012 m.) ir bendradarbiavimo modelį (Carayannis & Campbell, 2009 m.), taip pat konkrečius DI aspektus, įskaitant DI technologijų tipus, racionalaus agento modelį (Russell & Norvig, 2020, 4-asis leidimas), taikomą etišką DI tipologiją (Morley et al., 2019 m.), licencijų tipus ir kt. Tyrimo duomenų įžvalgos skelbiamos kaip atviros prieigos interaktyvios žiniatinklio vizualizacijos, kuriose galima palyginti šią sritį. Bandomasis darbo srautas ir išvados skelbiami būsimame konferencijos dokumente (Ziku, Zourou, & Kouzelis, 2026 m.).
Išvados
Bandomuoju projektu buvo siekiama sukurti atvirą ir atkuriamą būdą naudoti DI priemones duomenims apdoroti dideliu mastu, kartu su žmonių dalyvavimu, etiniu vertinimu ir duomenų įžvalgomis, kad būtų remiami tikslesni, atskaitingesni, į metriką orientuoti ir praturtinti Ukrainos liaudies meno atradimo būdai. Kartais serendipitous kelionė į paveldą prasideda žodžiu, įvestu į paieškos laukelį. Ir kartais teisingi žodžiai gali atnešti naują kolekciją į šviesą.
Trys aktyviausi visuomenės patalkos kampanijos dalyviai gavo atitinkamai honorarą, taip pat aukso, sidabro ir bronzos ženklelius: Inna Kaika, Mykolos Gogolio valstybinio universiteto anglų kalbos ir užsienio literatūros studentė; Daria Markova, Pryazovskyi valstybinio technikos universiteto vertimo studentė; Marko Lakhmatov, Pryazovskyi valstybinio technikos universiteto kibernetinio saugumo studentas.
Apmąstydama savo dalyvavimą, Inna pasidalijo: „Ukrainos menas atspindi mūsų žmonių atsparumą ir kūrybiškumą, o dalytis juo yra kaip niekad svarbu. Šios aistros paskatintas prisijungiau prie kampanijos, kuria siekiama, kad kultūros paveldas taptų prieinamesnis. Man ypač patiko anotacijos procesas ir etnografinės kolekcijos tyrinėjimas. Man buvo garbė prisidėti prie meną ir technologijas jungiančio projekto.“
Ištirti ir pakartotinai naudoti bandomuosius išteklius
Norite taikyti panašius metodus savo kolekcijoms?
- Žiūrėti crowdsourcing kampaniją Ukrainos liaudies meno CrowdHeritage.
- Susipažinkite su bandomuoju projektu „Žmogus grandinėje“ (angl. human-in-the-loop crowdsourcing).
- Pakartotinai naudoti atvirojo kodo „Jupyter Notebooks“, kuriuose dokumentuojama visa darbo eiga nuo duomenų paieškos iki DI sugeneruotų anotacijų ir platformoms parengto eksporto.
- Prieiga prie atvirųjų duomenų rinkinių „Zenodo“ atviroje saugykloje, įskaitant bandomojo projekto duomenis ir išvedinius išsaugojimo, citavimo ir pakartotinio naudojimo tikslais.
- Susipažinkite su interaktyviomis duomenų vizualizacijomis ir sužinokite 22 tarptautinių mokslinių tyrimų iniciatyvų, kuriose DI ir piliečių dalyvavimas naudojamas kultūros paveldui išsaugoti ekstremaliosiose situacijose ir už jų ribų, įžvalgas.
Pripažinimai
Dėkojame visiems AISTER projekto partneriams ir bendradarbiams, ypač Jevgenui Dmytrukui Krovets muziejuje, Eirini Kaldeli CrowdHeritage ir Datoptrone, Hugo Manguinhasui Europeanos fonde ir Uldiui Zariņšui bei Sanitai Reinsonei Latvijos universitete.
Pasirinktos nuorodos
- Jupyter Notebooks dokumentai atitinka GLAM institucijų Jupyter projektų kokybės vertinimo kriterijus, paskelbtus Candela, G., Chambers, S., & Sherratt, T. (2023). GLAM institucijų paskelbtas Jupyter projektų kokybės vertinimo metodas. Informacinių mokslų ir technologijų asociacijos leidinys, 74(13), 1550–1564.
- Bandomojo projekto „README“ „GitHub“ dokumentuose patvirtinta „KU Leuven Libraries Git“ duomenų rinkinio dokumentų struktūra. Žr. KU Leveno bibliotekos, Skaitmeninimo skyrius. (2019). The Portraits Collection Dataset of KU Leuven Libraries, Special Collections (Version 01-beta2) [Duomenų rinkinys]. Zenodo.
- M. Ziku, K. Zourou ir A. Kouzelis, „Su DI susijęs etnografinio paveldo metaduomenų sodrinimas: A Reproducible Human-in-the-Loop Crowdsourcing Workflow“, 2026 m. IEEE tarptautinė konferencija dėl kibernetinių humanitarinių mokslų (IEEE-CH), Venecija, Italija, 2026 m. rugsėjo 7–9 d., spaudoje.