Citiți mai departe pentru a arunca o privire asupra unui proiect-pilot reproductibil care a combinat utilizarea platformei Europeana.eu și a interfețelor de programare a aplicațiilor, a modelelor de IA pre-antrenate, a modelării codului viu și a datelor semantice, a contribuitorilor umani pe o platformă de externalizare spre public, a unui instrument de tezaur și a unor indicatori de date conștienți de prejudecăți, ceea ce a dus la îmbogățirea unei colecții etnografice ucrainene pe Europeana.eu prin 55 000 de acțiuni de adnotare și aproape 6 000 de etichete noi de metadate.
Protejarea patrimoniului ucrainean sub conducerea cetățenilor
Începând din 2025, Web2Learn – împreună cu universitățile din Luxemburg, Letonia, Kiev, Taras Shevchenko și Fundația Europeana – colaborează la AISTER, un proiect Erasmus+ care abordează participarea cetățenilor bazată pe IA la protejarea patrimoniului cultural ucrainean. Web2Learn contribuie cu expertiza sa în inovarea orientată către cetățeni la proiect, utilizând tehnologii cu sursă deschisă care promovează educația, formarea și cetățenia activă.

HITL Crowdsourcing Pilot Poster by Web2Learn încorporează pictura populară "Portretul unei fete", așa cum a fost atribuită mai sus, încorporată în prezenta compoziție cu permisiunea suplimentară a titularului drepturilor.
Consorțiul AISTER a avut în vedere o serie de ateliere cu implicarea cercetătorilor, a studenților și a tinerilor profesioniști pe durata proiectului. Cinci ateliere conduse de Web2Learn online și la fața locului la Biblioteca Universității din Letonia au oferit ocazia de a desfășura un proiect-pilot: să testeze un flux de lucru „human-in-the-loop” pentru a îmbogăți colecțiile digitale de imagini prin externalizarea spre public și instrumente de IA, invitând participanții la atelier să se implice în patrimoniul etnografic ucrainean și să devină contribuitori activi prin îmbogățirea și validarea etichetelor descriptive generate de IA.
Proiectul-pilot a fost conceput ca o resursă deschisă și reproductibilă, cu documentație detaliată, pentru a facilita cercetarea și formarea în domeniul științelor umaniste digitale, și este pus la dispoziție gratuit pentru reutilizare de către cercetători, studenți și profesori, precum și pentru reutilizare creativă.
Arta populară ucraineană pe Europeana.eu
În 2025, Muzeul online de artă tradițională din Ucraina de la Krovets, care funcționează din 2014 datorită eforturilor voluntare ale fondatorilor muzeului, a publicat un set de date pe Europeana.eu prin agregatorul MUSEU, care cuprinde 3 840 de artefacte de patrimoniu etnografic, inclusiv costume tradiționale, meșteșuguri textile, artă populară, cultură materială și fotografii.
Imaginile folosite pentru pilot provin din această colecție etnografică. Ca parte a proiectului-pilot, pe site-ul Europeana.eu a fost publicată o Galerie de artă populară ucraineană, care oferă acces la subcolecția de artă populară a muzeului, care include 312 artefacte clasificate drept picturi populare sau icoane populare. Majoritatea picturilor, care descriu viața rurală de zi cu zi, folclorul și temele religioase, provin din regiunile etnografice centrale ale Ucrainei, Podniprovia de Mijloc și Poltavshchyna și datează în primul rând de la începutul și mijlocul secolului al XX-lea.
Colecția este compusă în principal din scene de gen, peisaje și portrete individuale. Picturile populare formează narațiuni vizuale, oferind instantanee ale peisajelor rurale, tradițiilor religioase, motivelor de artă populară și culturii materiale de zi cu zi. Multe dintre detalii sunt ușor de observat atunci când se uită la imagini, dar nu întotdeauna ușor de descoperit prin căutare.
Pilotul de crowdsourcing human-in-the-loop
Proiectul-pilot a urmărit să creeze un nou nivel de vizibilitate pentru arta populară ucraineană. Acesta a dezvoltat un flux de lucru care combină utilizarea API-urilor Europeana, metodele bazate pe IA pentru prelucrarea limbajului natural și viziunea pe calculator, Jupyter Notebook ca spațiu de lucru interactiv pentru codificarea reproductibilă și prelucrarea datelor bazată pe etică, împreună cu implicarea publicului prin intermediul platformei de crowdsourcing CrowdHeritage pentru a crea etichete descriptive care pot fi căutate, validate de om și evaluate din punct de vedere etic în general.
Pentru început, au fost utilizate două API-uri Europeana pentru a prelua elementele galeriei și metadatele, API-ul setului de utilizatori Europeana pentru accesarea galeriilor generate de utilizatori publicate pe Europeana și API-ul Europeana Search pentru extragerea metadatelor din conținutul accesat pe Europeana, modelat utilizând modelul de date Europeana (EDM). Apoi, au fost generate noi adnotări descriptive cu instrumente AI care au folosit modele și biblioteci AI pre-antrenate open-source în procesarea limbajului natural și viziunea computerizată. Adnotările automate au fost generate în Jupyter Notebooks și serializate în JSON-LD în conformitate cu Web Annotation Data Model al W3C (World Wide Web Consortium), pentru a sprijini importul acestora în platforma de crowdsourcing CrowdHeritage gestionată de Datoptron.
În total, proiectul-pilot a dezvoltat opt notebook-uri Jupyter, care au funcționat ca medii de calcul interactive care permit codificarea și reproductibilitatea în timp real pentru a sprijini executarea de la un capăt la altul a etapelor de prelucrare a datelor. Notebook-urile au fost implementate în Google Colab pentru a permite colaborarea și co-editarea în timp real și apoi transferate ca un depozit deschis pe GitHub pentru controlul versiunii, facilitând transparența și trasabilitatea optimizării codului colaborativ. Acestea acoperă întregul proces de date al proiectului-pilot în etape secvențiale, care includ:
Etapa 1: Generare automată de adnotări din metadate textuale (bazate pe NLP)
1i. Obțineți ID-urile obiectelor din Galeria de artă populară ucraineană publicată utilizând setul de utilizatori Europeana ΑPI și obțineți metadate textuale (de exemplu, titluri, subiecte) ale artefactelor utilizând API-ul de căutare Europeana.
1ii. Generați adnotări automate (etichete de descriere) din metadate utilizând tehnici de prelucrare a limbajului natural (NLP), în special euristica bazată pe reguli și recunoașterea entităților numite (NER), utilizând spaCy-ul bibliotecii Python open-source.
Etapa 2: Generare automată de adnotări din imagini (bazată pe viziunea calculatorului)
2i. Descărcați artefactele Galeriei sub formă de imagini utilizând API-ul Europeana User Set.
2ii. Generarea de subtitrări descriptive ale imaginilor utilizând tehnici de vizualizare pe calculator cu modele de IA pre-antrenate, în special variante ale modelelor Qwen cu sursă deschisă – Qwen3-VL-2B-Instruct multimodal visual-language model (VLM) și Qwen3.5-4B large language model (LLM).
2iii. Generați adnotări automate din subtitrările imaginilor.
Etapa 3: Pregătirea adnotărilor automate pentru validarea prin crowdsourced (formatare JSON-LD)
3i. Formatați toate adnotările generate pe baza modelului de adnotare W3C pentru ingestia directă în platforma de crowdsourcing CrowdHeritage.
3ii. Convertiți adnotările finale în format JSON într-un CSV care poate fi citit automat și combinați toate adnotările din cele cinci ateliere de crowdsourcing.
Etapa 4: Asigurarea calității datelor și examinarea adnotărilor validate de om în funcție de prejudecăți
4i. Verificați adnotările finale împotriva termenilor dăunători, părtinitori sau contencioși din Vocabularul DE-BIAS prin interogarea tezaurului bazat pe RDF.

Pe parcursul a cinci ateliere de crowdsourcing organizate la fața locului și online, 70 de participanți, inclusiv cercetători, studenți și experți în artă populară, au revizuit adnotările generate de IA, confirmând etichetele exacte, respingându-le pe cele înșelătoare prin voturi pozitive și voturi negative și contribuind cu adnotări suplimentare proprii.
Informații privind datele și evaluarea etică
Majoritatea imaginilor au fost îmbogățite cu 15 până la 20 de etichete descriptive noi fiecare. În total, au fost înregistrate aproape 55.000 de acțiuni de adnotare, inclusiv generarea de etichete, voturi pozitive și voturi negative. Rezultatul deschide căi mai bogate pentru descoperirea și implicarea în arta populară ucraineană. Valorile post-campanie arată că majoritatea adnotărilor generate de IA au fost acceptate ca fiind exacte, doar câteva fiind respinse.
Aceste cinci etichete generate de IA au primit cele mai mari rate de acceptare:
- pictogramă
- pictură
- bărbat
- copaci
- femeie.
Aceste cinci etichete generate de IA au primit cele mai mari rate de respingere:
- crăpături
- uzură
- daune
- obiect mic
- personalul.
Aplicarea unei evaluări a impactului etic la adnotările finale a fost tratată ca un pas important în cadrul proiectului-pilot. Un al doilea nivel de revizuire a fost efectuat pentru a identifica limbajul potențial problematic și pentru a consolida responsabilitatea. Screening-ul etichetelor aprobate de om împotriva Vocabularului DE-BIAS a identificat un termen, sclav, care a fost ulterior revizuit la persoană înrobită conform recomandării. Vocabularul a fost aplicat ca măsură de evaluare a impactului etic înainte de publicarea finală a setului de date deschise, ținând seama de „Recomandarea UNESCO privind etica inteligenței artificiale” (2022) și de instrumentul „Evaluarea impactului etic” (2023).
Dezvoltarea proiectului-pilot și înțelegerea dimensiunilor sale etice legate de IA s-au bazat, de asemenea, pe studiul de analiză a datelor AISTER, care a cartografiat 22 de proiecte internaționale de cercetare care utilizează inteligența artificială și participarea cetățenilor pentru conservarea patrimoniului cultural în contexte de urgență. Studiul a clasificat proiectele selectate utilizând cadrul de clasificare AISTER, care oferă o clasificare sistematică pe 24 de dimensiuni analitice concepute pentru analizarea inițiativelor de patrimoniu participativ bazate pe IA. Dimensiunile-cadru includ domeniile patrimoniului cultural, modelul de participare a cetățenilor (Shirk et al., 2012) și modelul de cooperare (Carayannis & Campbell, 2009), alături de dimensiunile specifice IA, inclusiv tipurile de tehnologie IA, modelul de agent rațional (Russell & Norvig, 2020, ediția a patra), tipologia IA etică aplicată (Morley et al., 2019), tipurile de licențe și multe altele. Informațiile privind datele din studiu sunt publicate sub formă de vizualizări web interactive cu acces liber, care oferă o explorare comparativă a domeniului. Fluxul de lucru pilot și constatările sunt publicate într-un viitor document al conferinței (Ziku, Zourou, & Kouzelis, 2026).
Concluzii
Proiectul-pilot și-a propus să creeze o cale deschisă și reproductibilă de utilizare a instrumentelor IA pentru prelucrarea datelor la scară largă, combinată cu participarea umană, evaluarea etică și înțelegerea datelor, pentru a sprijini modalități mai precise, mai responsabile, bazate pe indicatori și îmbogățite de descoperire a artei populare ucrainene. Uneori, călătoria serendipită în patrimoniu începe cu cuvântul tastat într-o casetă de căutare. Și, uneori, cuvintele potrivite pot aduce o nouă colecție la lumină.
Cei mai activi trei contribuitori la campania de crowdsourcing au primit un onorariu, precum și insigne de aur, argint și, respectiv, bronz: Inna Kaika, studentă la limba engleză și literatură străină, Universitatea de Stat Mykola Gogol; Daria Markova, studentă la traducere, Universitatea Tehnică de Stat din Pryazovskyi; Marko Lakhmatov, student la Cybersecurity, Universitatea Tehnică de Stat din Pryazovskyi.
Reflectând asupra participării sale, Inna a împărtășit următoarele: „Arta ucraineană reflectă reziliența și creativitatea poporului nostru, iar împărtășirea acesteia este mai importantă ca niciodată. Condusă de această pasiune, m-am alăturat campaniei pentru a face patrimoniul cultural mai accesibil. Mi-a plăcut în mod deosebit procesul de adnotare și explorarea colecției etnografice. A fost o onoare să contribui la un proiect care reunește arta și tehnologia.”
Explorarea și reutilizarea resurselor-pilot
Sunteți interesat să aplicați metode similare propriilor colecții?
- Vezi campania de crowdsourcing pentru arta populară ucraineană pe CrowdHeritage.
- Explorați proiectul-pilot de crowdsourcing „human-in-the-loop”.
- Reutilizați notebook-urile Jupyter cu sursă deschisă, care documentează întregul flux de lucru de la extragerea datelor la adnotările generate de IA și la exporturile pregătite pentru platforme.
- Accesați seturile de date deschise din registrul deschis al Zenodo, care includ datele și rezultatele proiectului-pilot pentru conservare, citare și reutilizare.
- Explorați vizualizările interactive ale datelor și descoperiți informații din 22 de inițiative internaționale de cercetare care utilizează IA și participarea cetățenilor pentru conservarea patrimoniului cultural în situații de urgență și nu numai.
Confirmări de primire
Mulțumim tuturor partenerilor și colaboratorilor proiectului AISTER, în special lui Yevgen Dmytruk de la Muzeul Krovets, Eirini Kaldeli de la CrowdHeritage și Datoptron, Hugo Manguinhas de la Fundația Europeana și Uldis Zariņš și Sanita Reinsone de la Universitatea din Letonia.
Referințe selectate
- Documentația Jupyter Notebooks respectă criteriile de evaluare a calității pentru proiectele Jupyter de către instituțiile GLAM, astfel cum au fost publicate în Candela, G., Chambers, S., & Sherratt, T. (2023). O abordare pentru evaluarea calității proiectelor Jupyter publicată de instituțiile GLAM. Journal of the Association for Information Science and Technology (Jurnalul Asociației pentru Știința și Tehnologia Informației), 74(13), 1550-1564.
- Documentația README a proiectului-pilot privind GitHub adoptă structura documentației privind setul de date bazat pe Git a KU Leuven Libraries. A se vedea: KU Leuven Libraries, Departamentul de digitalizare. (2019). The Portraits Collection Dataset of KU Leuven Libraries, Special Collections (Versiunea 01-beta2) [Set de date]. Zenodo.
- M. Ziku, K. Zourou și A. Kouzelis, „AI-Assisted Metadata Enrichment for Ethnographic Heritage: A Reproducible Human-in-the-Loop Crowdsourcing Workflow, 2026 IEEE International Conference on Cyber Humanities (IEEE-CH), Veneția, Italia, 7-9 septembrie 2026, în presă.