Marco Rendina: Eirini, să începem cu elementele de bază. Ce este crowdsourcing-ul?
Eirini Kaldeli: Crowdsourcing-ul este procesul de distribuire a unei sarcini către un grup de oameni, care de obicei contribuie prin munca lor online. În unele cazuri, contribuitorii primesc compensații materiale; în altele, participarea lor este voluntară, recompensele fiind nesemnificative, cum ar fi satisfacția personală, contribuția culturală sau dobândirea de cunoștințe. În sectorul patrimoniului cultural, externalizarea spre public a fost utilizată de mult timp pentru a aborda diverse provocări, de la colectarea și transcrierea conținutului până la etichetarea colecțiilor și detectarea termenilor părtinitori în descrierea obiectelor de patrimoniu cultural. În funcție de natura sarcinii, participanții pot avea nevoie de competențe sau cunoștințe specializate.
MR: Care sunt beneficiile externalizării spre public pentru sectorul patrimoniului cultural?
EK: Un proiect de crowdsourcing responsabil și semnificativ poate aduce beneficii reciproce instituțiilor de patrimoniu cultural și participanților. În primul rând, externalizarea spre public ar trebui abordată ca mijloc de implicare a cetățenilor în ceea ce privește colecțiile de patrimoniu. Pe de o parte, participanții au posibilitatea de a interacționa cu patrimoniul cultural și de a se conecta cu acesta; să învețe informații utile despre elemente și subiecte într-un mod jucăuș; să își împărtășească perspectivele și cunoștințele; co-modelarea modului în care sunt prezentate colecțiile; și să colaboreze cu concetățenii într-o experiență participativă. Pe de altă parte, instituțiile de patrimoniu cultural pot îmbunătăți calitatea colecțiilor lor și le pot face mai ușor de descoperit și mai accesibile; să sensibilizeze publicul cu privire la bunurile lor de patrimoniu cultural; să ajungă la noi categorii de public; și să dobândească o perspectivă mai profundă asupra modului în care colecțiile lor sunt percepute de comunități.
MR: Spyros, ne poți spune câteva cuvinte despre platforma CrowdHeritage la care lucrezi în contextul proiectului AI4Culture?
Spyros Bekiaris: CrowdHeritage este o platformă deschisă pentru organizarea de campanii online de crowdsourcing care mobilizează oamenii pentru a îmbunătăți calitatea colecțiilor de patrimoniu cultural. Acest lucru ar putea fi în legătură cu diferite aspecte, de la acoperirea multilingvă la etichetarea semantică. Participanții sunt invitați să îmbogățească colecțiile digitale, fie prin producerea de noi informații (de exemplu, adăugarea de geolocații), fie prin evaluarea și validarea rezultatelor automate produse de instrumentele digitale (de exemplu, traduceri automate sau detectarea limbajului părtinitor).
CrowdHeritage a fost utilizat pe scară largă pentru a stimula participarea la mediile educaționale și la mediile științifice cetățenești prin implicarea comunităților, inclusiv a studenților și a elevilor, a iubitorilor de cultură, a profesioniștilor din domeniul patrimoniului cultural și a publicului larg. Până în prezent, platforma a fost utilizată pentru a organiza 40 de campanii de crowdsourcing cu peste 970 de contribuitori unici, generând aproximativ 112.000 de adnotări și evaluând peste 16.000.
MR: Crowdsourcing-ul este înrădăcinat în efortul manual distribuit, în timp ce AI4Culture se referă la tehnologiile AI. Puteți explica relația dintre platforma CrowdHeritage și instrumentele AI?
SB: CrowdHeritage a fost inițial conceput pentru a sprijini campaniile care invită utilizatorii să adauge adnotări noi de la zero. În ultimii ani, observăm un interes tot mai mare pentru cuplarea CrowdHeritage cu instrumentele AI. Astfel de instrumente oferă oportunități remarcabile de îmbunătățire automată a calității colecțiilor de patrimoniu cultural digital la scară largă și cu un efort manual minim, de la recunoașterea optică a caracterelor și traducerea automată, până la subtitrarea automată și clasificarea imaginilor.
Cu toate acestea, recurgerea la metode pur automate a evidențiat, de asemenea, mai multe aspecte care trebuie abordate. Avem nevoie de modalități de a evalua dacă rezultatele algoritmilor IA sunt suficient de exacte pentru standardele noastre și de a compara modul în care se comportă diferiți algoritmi pe baza unor date specifice și pe baza anumitor criterii. În acest context, externalizarea spre public este un mijloc excelent de a valorifica inteligența umană colectivă și de a colecta informații utile. Feedback-ul acumulat ne poate ajuta să eliminăm rezultatele automate incorecte, să aplicăm filtre adecvate pentru menținerea a ceea ce considerăm a fi rezultate de bună calitate și să identificăm anumite deficiențe ale algoritmilor IA. În această interacțiune cu IA, platforma CrowdHeritage este, de asemenea, utilă pentru producerea de seturi de date bazate pe adevăruri de la sol care pot fi exploatate în continuare pentru a adapta instrumentele IA în raport cu datele privind patrimoniul cultural.
MR: Eirini, poți oferi câteva exemple concrete ale modului în care CrowdHeritage a fost aplicat în combinație cu instrumentele IA?
EK: Pot să vă ofer multe! În contextul proiectului Europeana Translate, am desfășurat o serie de campanii în care participanții au evaluat rezultatele unui algoritm de traducere automată instruit pe metadatele Europeana (dezvoltate de partenerul nostru AI4Culture Pangeanic). Acest feedback ne-a permis să îmbunătățim calitatea rezultatelor și a condus, de asemenea, la crearea unor seturi de date deschise publicate în registrul ELRC-SHARE, care colectează resurse lingvistice în întreaga UE.
Într-un alt studiu de caz despre selectarea modelelor optime de Super Rezoluție (SR) pentru diferite tipuri de imagini (pe care le cunoașteți foarte bine, Marco!), am înființat o campanie în colaborare cu Asociația Europeană a Patrimoniului Modei (EFHA), în care participanților li s-a cerut să compare și să clasifice un eșantion de imagini îmbunătățite de diferite modele SR. Rezultatele acestei campanii au permis EFHA să selecteze și să aplice cel mai bun algoritm SR în funcție de caracteristicile imaginii.
În cadrul proiectului CRAFTED, au fost organizate o serie de campanii pentru a evalua culorile identificate automat de algoritmii IA de detectare a culorilor. Analiza feedback-ului colectat ne-a condus la concluzia că algoritmii automați au identificat în mod repetat anumite culori absente și le-au ratat pe cele existente, ceea ce ne-a ajutat să ne îmbunătățim abordarea de filtrare și să selectăm cea mai bună configurare a algoritmului.
În cadrul proiectului DE-BIAS, suntem în curs de a institui o serie de campanii în cadrul cărora comunitățile vor inspecta și evalua termenii marcați de un instrument automat de detectare a prejudecăților ca având un limbaj derogatoriu.
MR: Acest lucru este cu adevărat interesant, Eirini, dar vor putea instituțiile de patrimoniu cultural să utilizeze platforma CrowdHeritage pentru a-și crea propriile campanii de externalizare spre public?
EK: Bineînțeles! Prin proiectul AI4Culture, pe platforma CrowdHeritage a fost pusă la dispoziție o nouă funcție de „redactor de campanie”, care permite oricui să creeze și să desfășoare o campanie de crowdsourcing pe platformă. Oricine este interesat poate să se uite la acest tutorial video sau să consulte documentația CrowdHeritage pentru a afla mai multe!
Aflați mai multe
În septembrie 2024, proiectul va lansa o platformă în cadrul căreia va fi pus la dispoziție online un set de instrumente deschise, împreună cu documentația și materialele de formare aferente. Urmăriți pagina proiectului de pe Europeana Pro pentru mai multe detalii și rămâneți la curent cu proiectul LinkedIn și contul X!
