Aqra għal ħarsa lejn proġett pilota riproduċibbli li għaqqad l-użu tal-pjattaforma Europeana.eu u l-APIs, il-mudelli tal-IA mħarrġa minn qabel, il-kodiċi ħaj u l-immudellar semantiku tad-data, il-kontributuri umani fuq pjattaforma tal-crowdsourcing, għodda tat-teżawru u metrika tad-data konxji mill-preġudizzju, li wasslu għall-arrikkiment ta’ ġbir etnografiku Ukren fuq Europeana.eu permezz ta’ 55,000 azzjoni ta’ annotazzjoni u kważi 6,000 tag ġdid ta’ metadata.
Salvagwardja tal-wirt Ukren immexxija miċ-ċittadini
Mill-2025, Web2Learn – flimkien mal-Universitajiet tal-Lussemburgu, il-Latvja, Kiev Taras Shevchenko, u l-Fondazzjoni Europeana – ikkollabora fuq AISTER, proġett Erasmus+ li jindirizza l-parteċipazzjoni taċ-ċittadini abilitata bl-IA fis-salvagwardja tal-wirt kulturali Ukren. Web2Learn jikkontribwixxi l-għarfien espert tiegħu fl-innovazzjoni mmexxija miċ-ċittadini għall-proġett li juża teknoloġiji b’sors miftuħ li jrawmu l-edukazzjoni, it-taħriġ u ċ-ċittadinanza attiva.

HITL Crowdsourcing Pilot Poster minn Web2Learn jinkorpora Folk Painting "ritratt ta' tifla" kif attribwit hawn fuq, inkorporat fil-kompożizzjoni preżenti b'permess addizzjonali mid-detentur tad-drittijiet.
Il-konsorzju AISTER ippreveda sensiela ta’ sessjonijiet ta’ ħidma bl-involviment ta’ riċerkaturi, studenti u professjonisti żgħażagħ għat-tul tal-proġett. Ħames workshops immexxija minn Web2Learn online u fuq il-post fil-Librerija tal-Università tal-Latvja pprovdew opportunità biex jitmexxa proġett pilota: jittestja fluss tax-xogħol human-in-the-loop biex jarrikkixxi kollezzjonijiet diġitali ta’ immaġnijiet permezz ta’ crowdsourcing u għodod tal-IA, filwaqt li jistieden lill-parteċipanti tal-workshop jinvolvu ruħhom mal-wirt etnografiku Ukren u jsiru kontributuri attivi billi jarrikkixxu u jivvalidaw tags ta’ deskrizzjoni ġġenerati mill-IA.
Il-proġett pilota tfassal bħala riżorsa miftuħa u riproduċibbli b'dokumentazzjoni dettaljata biex jiġu ffaċilitati r-riċerka u t-taħriġ fl-istudji umanistiċi diġitali, u jsir disponibbli liberament għall-użu mill-ġdid mill-akkademiċi, l-istudenti u l-għalliema, kif ukoll għall-użu mill-ġdid kreattiv.
Arti folkloristika Ukrena fuq Europeana.eu
Fl-2025, il-Mużew Online tal-Arti Tradizzjonali tal-Ukrajna ta’ Krovets, li ilu jopera mill-2014 bis-saħħa tal-isforzi volontarji tal-fundaturi tal-mużew, ippubblika sett ta’ data dwar Europeana.eu permezz tal-aggregatur MUSEU, li jinkludi 3,840 artefatt ta’ wirt etnografiku, inklużi kostumi tradizzjonali, snajja’ tat-tessuti, arti folkloristika, kultura materjali u ritratti.
L-istampi użati għall-pilota joriġinaw minn din il-kollezzjoni etnografika. Bħala parti mill-proġett pilota, Gallerija tal-arti folkloristika Ukrena ġiet ippubblikata fuq Europeana.eu, li tipprovdi aċċess għas-subġbir tal-arti folkloristika tal-mużew, li jinkludi 312-il artefatt ikklassifikati bħala pitturi folkloristiċi jew ikoni folkloristiċi. Il-biċċa l-kbira tal-pitturi, li juru l-ħajja rurali ta' kuljum, il-folklor u t-temi reliġjużi, joriġinaw mir-reġjuni etnografiċi ċentrali tal-Ukrajna, il-Podniprovia Nofsani u l-Poltavshchyna, u jmorru primarjament sal-bidu u nofs is-seklu għoxrin.
Il-kollezzjoni hija magħmula primarjament minn xeni ġeneri, pajsaġġi u ritratti individwali. Il-pitturi folkloristiċi jiffurmaw narrattivi viżivi, li joffru ritratti ta' pajsaġġi rurali, tradizzjonijiet reliġjużi, motifi tal-arti folkloristika u kultura materjali ta' kuljum. Ħafna mid-dettalji huma faċli biex tinduna meta tħares lejn l-istampi, iżda mhux dejjem faċli biex tiskopri permezz ta 'tfittxija.
Il-pilota tal-crowdsourcing human-in-the-loop
Il-proġett pilota kellu l-għan li joħloq saff ġdid ta’ viżibbiltà għall-arti folkloristika Ukrena. Huwa żviluppa fluss tax-xogħol li jikkombina l-użu ta’ APIs tal-Europeana, metodi bbażati fuq l-IA għall-ipproċessar tal-lingwa naturali u l-viżjoni tal-kompjuter, Jupyter Notebook bħala spazju tax-xogħol interattiv għall-kodifikazzjoni riproduċibbli, u l-ipproċessar tad-data bbażat fuq l-etika, flimkien mal-involviment pubbliku permezz tal-pjattaforma ta’ crowdsourcing CrowdHeritage biex jinħolqu tags ta’ deskrizzjoni li jistgħu jiġu mfittxija, ivvalidati mill-bniedem u vvalutati b’mod etiku b’mod ġenerali.
Biex tibda, intużaw żewġ APIs tal-Europeana biex jinġabru l-oġġetti tal-gallerija u l-metadata, l-API tas-Sett ta’ Utenti tal-Europeana għall-aċċess għall-galleriji ġġenerati mill-utenti ppubblikati fuq Europeana, u l-API tat-Tiftix tal-Europeana għall-irkupru tal-metadata tal-kontenut aċċessat fuq Europeana, immudellat bl-użu tal-Mudell tad-Data tal-Europeana (EDM). Imbagħad, ġew iġġenerati annotazzjonijiet deskrittivi ġodda b’għodod tal-IA li użaw mudelli u libreriji tal-IA mħarrġa minn qabel b’sors miftuħ fl-ipproċessar tal-lingwi naturali u fil-viżjoni tal-kompjuter. L-annotazzjonijiet awtomatizzati ġew iġġenerati f’Jupyter Notebooks u ġew serjalizzati f’JSON-LD skont il-Mudell tad-Data tal-Annotazzjoni tal-Web tad-W3C (World Wide Web Consortium), biex jappoġġaw l-importazzjoni tagħhom fil-pjattaforma tal-crowdHeritage ta’ crowdsourcing miżmuma minn Datoptron.
B’kollox, il-proġett pilota żviluppa tmien Jupyter Notebooks, li ħadmu bħala ambjenti tal-computing interattivi li jippermettu l-kodifikazzjoni u r-riproduċibbiltà diretti biex jappoġġaw l-eżekuzzjoni minn tarf sa tarf tal-passi tal-ipproċessar tad-data. In-notebooks ġew implimentati f’Google Colab biex jippermettu kollaborazzjoni u koeditjar f’ħin reali u mbagħad ġew ittrasferiti bħala repożitorju miftuħ fuq GitHub għall-kontroll tal-verżjoni, li jiffaċilita t-trasparenza u t-traċċabbiltà tal-ottimizzazzjoni tal-kodiċi kollaborattiv. Dawn ikopru l-proċess sħiħ tad-data tal-bdot fi stadji sekwenzjali, li jinkludu:
L-ewwel pass: Ġenerazzjoni ta’ annotazzjoni awtomatizzata minn metadata testwali (ibbażata fuq l-NLP)
1i. Iġbor l-IDs tal-oġġetti fil-Gallerija tal-arti folkloristika Ukrena ppubblikata bl-użu tas-Sett ta’ Utenti tal-Europeana ΑPI u fittex metadata testwali (eż. titli, suġġetti) tal-artifatti bl-użu tal-API tat-Tfittxija tal-Europeana.
1ii. Jiġġeneraw annotazzjonijiet awtomatizzati (tikketti ta’ deskrizzjoni) mill-metadata bl-użu ta’ tekniki tal-ipproċessar tal-lingwi naturali (NLP), b’mod partikolari ewristiċi bbażati fuq ir-regoli u Rikonoxximent tal-Entitajiet Imsemmija (NER) bl-użu tal-ispaCy tal-librerija Python b’sors miftuħ.
It-tieni pass: Ġenerazzjoni ta’ annotazzjoni awtomatizzata minn immaġnijiet (ibbażata fuq il-viżjoni tal-kompjuter)
2i. Niżżel l-artefatti tal-Gallerija bħala immaġnijiet bl-użu tal-API tas-Sett ta’ Utenti tal-Europeana.
2ii. Iġġenera captions ta’ immaġni deskrittivi bl-użu ta’ tekniki ta’ viżjoni bil-kompjuter b’mudelli tal-IA mħarrġa minn qabel, b’mod partikolari varjanti tal-mudelli Qwen b’sors miftuħ – il-mudell tal-lingwa viżwali multimodali (VLM) Qwen3-VL-2B-Instruct u l-mudell tal-lingwa kbira (LLM) Qwen3.5-4B.
2iii. Iġġenera annotazzjonijiet awtomatizzati mill-captions tal-immaġni.
It-tielet pass: Tħejjija ta’ annotazzjonijiet awtomatizzati għall-validazzjoni b’sors ta’ folla (ifformattjar JSON-LD)
3i. Format tal-annotazzjonijiet iġġenerati kollha bbażati fuq il-mudell ta’ annotazzjoni W3C għall-inġestjoni diretta fil-pjattaforma ta’ crowdsourcing CrowdHeritage.
3ii. Ikkonverti l-annotazzjonijiet finali fformattjati mill-JSON f’CSV li jinqara mill-magni u għaqqad l-annotazzjonijiet kollha mill-ħames workshops tal-crowdsourcing.
Pass 4: Assigurazzjoni tal-kwalità tad-data u skrinjar konxju tal-preġudizzju tal-annotazzjonijiet ivvalidati mill-bniedem
4i. Iċċekkja l-annotazzjonijiet finali kontra termini dannużi, preġudikati jew kontenzjużi fil-Vokabolarju DE-BIAS permezz ta’ mistoqsijiet dwar it-teżawru bbażati fuq l-RDF.

Matul il-kors ta’ ħames workshops ta’ crowdsourcing li saru fuq il-post u online, 70 parteċipant inklużi riċerkaturi, studenti universitarji u esperti tal-arti folkloristika eżaminaw l-annotazzjonijiet iġġenerati mill-IA, ikkonfermaw tags preċiżi, irrifjutaw dawk qarrieqa permezz ta’ upvotes u downvotes, u kkontribwew annotazzjonijiet addizzjonali tagħhom stess.
Għarfien dwar id-data u valutazzjoni etika
Il-maġġoranza tal-immaġnijiet ġew arrikkiti bi 15 sa 20 tags deskrittivi ġodda kull wieħed. B’mod ġenerali, ġew irreġistrati kważi 55,000 azzjoni ta’ annotazzjoni, inklużi l-ġenerazzjoni tat-tags, il-voti ’l fuq, u l-voti ’l isfel. Ir-riżultat qed jiftaħ perkorsi aktar rikki għall-iskoperta u l-involviment mal-arti folkloristika Ukrena. Il-metriċi ta’ wara l-kampanja jiżvelaw li l-biċċa l-kbira tal-annotazzjonijiet iġġenerati mill-IA ġew aċċettati bħala preċiżi, bi ftit biss li ġew miċħuda.
Dawn il-ħames tags iġġenerati mill-IA rċevew l-ogħla rati ta’ aċċettazzjoni:
- ikona
- żebgħa
- il-bniedem
- siġar
- mara.
Dawn il-ħames tags iġġenerati mill-IA rċevew l-ogħla rati ta’ rifjut:
- xquq
- ilbes
- ħsara
- oġġett żgħir
- il-persunal.
L-applikazzjoni ta’ valutazzjoni tal-impatt etiku għall-annotazzjonijiet finali ġiet ittrattata bħala pass importanti fil-proġett pilota. Sar it-tieni saff ta’ rieżami biex jiġi identifikat lingwaġġ potenzjalment problematiku u tissaħħaħ ir-responsabbiltà. L-iskrinjar tat-tikketti approvati mill-bniedem kontra l-Vokabularju DE-BIAS identifika terminu wieħed, ilsir, li sussegwentement ġie rivedut għal persuna skjavi skont ir-rakkomandazzjoni. Il-vokabularju ġie applikat bħala miżura ta’ valutazzjoni tal-impatt etiku qabel il-pubblikazzjoni finali tas-sett tad-data miftuħ, filwaqt li tqieset ir-“Rakkomandazzjoni dwar l-Etika tal-Intelliġenza Artifiċjali” tal-UNESCO (2022) u l-għodda tal-“Valutazzjoni tal-impatt etiku” (2023).
L-iżvilupp tal-proġett pilota u l-fehim tad-dimensjonijiet etiċi tiegħu relatati mal-IA ġew infurmati wkoll mill-istudju tal-analiżi tad-data AISTER, li mmappja 22 proġett ta’ riċerka internazzjonali li jużaw l-intelliġenza artifiċjali u l-parteċipazzjoni taċ-ċittadini għall-preservazzjoni tal-wirt kulturali f’kuntesti ta’ emerġenza. L-istudju kklassifika l-proġetti magħżula bl-użu tal-qafas ta’ klassifikazzjoni AISTER, li joffri kategorizzazzjoni sistematika f’24 dimensjoni analitika mfassla għall-analiżi ta’ inizjattivi ta’ wirt parteċipattiv xprunati mill-IA. Id-dimensjonijiet qafas jinkludu l-oqsma tal-wirt kulturali, il-mudell tal-parteċipazzjoni taċ-ċittadini (Shirk et al., 2012), u l-mudell ta’ kooperazzjoni (Carayannis & Campbell, 2009), flimkien ma’ dimensjonijiet speċifiċi għall-IA, inklużi t-tipi tat-teknoloġija tal-IA, il-mudell tal-aġent razzjonali (Russell & Norvig, 2020, ir-raba’ edizzjoni), it-tipoloġija etika applikata tal-IA (Morley et al., 2019), it-tipi ta’ liċenzji u aktar. L-għarfien tad-data tal-istudju jiġi ppubblikat bħala viżwalizzazzjonijiet interattivi tal-web b’aċċess miftuħ li joffru esplorazzjoni komparattiva tal-qasam. Il-fluss tax-xogħol pilota u s-sejbiet huma ppubblikati f’dokument tal-konferenza li jmiss (Ziku, Zourou, & Kouzelis, 2026).
Konklużjonijiet
Il-proġett pilota kellu l-għan li joħloq perkors miftuħ u riproduċibbli għall-użu tal-għodod tal-IA biex tiġi pproċessata d-data fuq skala kbira, flimkien mal-parteċipazzjoni tal-bniedem, il-valutazzjoni etika, u l-għarfien dwar id-data, biex jiġu appoġġati modi aktar preċiżi, responsabbli, xprunati mill-metriċi, u arrikkiti ta’ kif tiġi skoperta l-arti folkloristika Ukrena. Xi drabi l-vjaġġ serendipituż fil-wirt jibda bil-kelma ttajpjata f’kaxxa tat-tiftix. U xi kultant, il-kliem it-tajjeb jista 'jġib kollezzjoni ġdida għad-dawl.
It-tliet kontributuri l-aktar attivi għall-kampanja ta’ crowdsourcing irċevew onorarju kif ukoll badges tad-deheb, tal-fidda u tal-bronż rispettivament: Inna Kaika, studenta fil-Lingwa Ingliża u l-Letteratura Barranija, Mykola Gogol State University; Daria Markova, studenta fit-Traduzzjoni, Università Teknika tal-Istat ta’ Pryazovskyi; Marko Lakhmatov, student fiċ-Ċibersigurtà, Università Teknika tal-Istat ta’ Pryazovskyi.
Filwaqt li tirrifletti fuq il-parteċipazzjoni tagħha, Inna kkondividiet, “L-arti Ukrena tirrifletti r-reżiljenza u l-kreattività tal-poplu tagħna, u l-kondiviżjoni tagħha hija aktar importanti minn qatt qabel. Immexxi minn din il-passjoni, ingħaqadt mal-kampanja biex il-wirt kulturali jsir aktar aċċessibbli. B'mod speċjali gawdejt il-proċess ta' annotazzjoni u l-esplorazzjoni tal-kollezzjoni etnografika. Kien unur li nikkontribwixxu għal proġett li jiġbor flimkien l-arti u t-teknoloġija.”
Esplorazzjoni u użu mill-ġdid tar-riżorsi pilota
Interessat li tapplika metodi simili għall-kollezzjonijiet tiegħek stess?
- Ara l-kampanja ta’ crowdsourcing għall-arti folkloristika Ukrena fuq CrowdHeritage.
- Esplora l-pilota tal-crowdsourcing human-in-the-loop.
- Uża mill-ġdid il-Jupyter Notebooks b’sors miftuħ, li jiddokumentaw il-fluss tax-xogħol sħiħ mill-irkupru tad-data sal-annotazzjonijiet iġġenerati mill-IA u l-esportazzjonijiet lesti għall-pjattaformi.
- Aċċessa s-settijiet ta’ data miftuħa fir-repożitorju miftuħ ta’ Zenodo, li jinkludu d-data u l-outputs tal-bdot għall-preservazzjoni, il-kwotazzjoni u l-użu mill-ġdid.
- Esplora l-viżwalizzazzjonijiet interattivi tad-data u skopri għarfien minn 22 inizjattiva ta’ riċerka internazzjonali li jużaw l-IA u l-parteċipazzjoni taċ-ċittadini għall-preservazzjoni tal-wirt kulturali f’ambjenti ta’ emerġenza u lil hinn.
Rikonoxximenti
Nixtiequ nirringrazzjaw lill-imsieħba u l-kollaboraturi kollha tal-proġett AISTER, u b'mod partikolari lil Yevgen Dmytruk fil-Mużew Krovets, Eirini Kaldeli fi CrowdHeritage u Datoptron, Hugo Manguinhas fil-Fondazzjoni Europeana, u Uldis Zariņš u Sanita Reinsone fl-Università tal-Latvja.
Referenzi magħżula
- Id-dokumentazzjoni tal-Jupyter Notebooks issegwi l-kriterji tal-valutazzjoni tal-kwalità għall-proġetti Jupyter mill-istituzzjonijiet tal-GLAM, kif ippubblikati f’Candela, G., Chambers, S., & Sherratt, T. (2023). Approċċ biex tiġi vvalutata l-kwalità tal-proġetti Jupyter ippubblikati mill-istituzzjonijiet tal-GLAM. Il-Ġurnal tal-Assoċjazzjoni għax-Xjenza u t-Teknoloġija tal-Informazzjoni, 74(13), 1550–1564.
- Id-dokumentazzjoni README tal-pilota dwar GitHub tadotta l-istruttura tad-dokumentazzjoni tas-sett tad-data bbażat fuq KU Leuven Libraries Git. Ara: KU Leuven Libraries, Dipartiment tad-Diġitalizzazzjoni. (2019). Is-Sett ta’ Data tal-Ġbir ta’ Portraits tal-Libreriji KU Leuven, Kollezzjonijiet Speċjali (Verżjoni 01-beta2) [Sett ta’ Data]. Zenodo.
- M. Ziku, K. Zourou, u A. Kouzelis, "AI-Assisted Metadata Enrichment for Ethnographic Heritage: A Reproducible Human-in-the-Loop Crowdsourcing Workflow," 2026 IEEE International Conference on Cyber Humanities (IEEE-CH), Venezja, l-Italja, Settembru 7–9, 2026, fl-istampa.