Metodele din domeniul inteligenței artificiale (IA) și al învățării automate (ML) au contribuit la depășirea limitelor tehnologice în diferite domenii, inclusiv în sectorul patrimoniului cultural (Raportul intermediar al EuropeanaTech AI în legătură cu Grupul operativ GLAM și inițiativa AI4LAM oferă câteva exemple). Pentru a încuraja inovarea în acest domeniu, cu câteva săptămâni în urmă, EuropeanaTech și-a anunțat prima provocare pentru seturile de date Europeana AI/ML. Prin această nouă activitate, am dorit să stimulăm crearea de seturi de date pentru sectorul GLAM care să poată fi utilizate pentru IA/ML, pe baza bogatelor resurse de patrimoniu cultural disponibile în Europeana. Sperăm că disponibilitatea unor astfel de seturi de date ar putea contribui la promovarea unui angajament mai mare față de datele privind patrimoniul cultural digital în domeniul IA/ML și la sprijinirea transferului progreselor recente în domeniul IA/ML către domeniul curării digitale și al analizei conținutului patrimoniului cultural.
Curtea a primit în total cinci propuneri, care au fost examinate cu atenție de membrii Grupului de coordonare EuropeanaTech și ai AI în legătură cu Grupul operativ GLAM. Aceștia au evaluat propunerile pe baza relevanței lor pentru sectorul GLAM (25 %), a relevanței pentru IA/ML (25 %), a relației cu Europeana (30 %) și a clarității descrierii și a planului de lucru (20 %).
Anunțarea câștigătorilor
Entități numite în texte arheologice
Această propunere a unei echipe de la Universitatea din Napoli "L'Orientale" își propune să creeze un set de date pentru recunoașterea entităților numite (NER) și extragerea termenilor în termeni arheologici în italiană și engleză în colecția de arheologie Europeana. NER este procesul de identificare a numelor proprii, cum ar fi numele de persoane sau locații în text nestructurat. Extracția termenilor este similară, dar se concentrează pe găsirea unor termeni specializați, în acest caz din domeniul arheologiei. Vor fi luate în considerare Vocabulare precum Getty și CIDOC CRM. Setul final de date ar putea fi utilizat în dezvoltarea și evaluarea tehnologiilor bazate pe IA/ML pentru NER în domeniul arheologiei.
Evaluatorii au apreciat în special structura clară și maturitatea propunerii, pentru care a fost deja realizat un set de date simulat utilizând API ale Europeana pentru a testa abordarea propusă. Aspectul bilingv și insuficiența resurselor deschise similare pentru domeniul arheologiei au fost, de asemenea, considerate deosebit de valoroase.
Zac Grace
Această propunere a unui student al Ecole Nationale d'Ingénieurs de Tarbes își propune să creeze măști de pixeli pentru segmentarea semantică, prin adnotarea manuală a datelor de imagine în colecția Europeana Fashion. Aceasta înseamnă că, de exemplu, atunci când se analizează o imagine, elementele de modă relevante (cămașă, pantaloni, pantofi) din imagine sunt apoi marcate cu contururile pixelilor. Astfel de date pot fi utilizate pentru antrenarea unui sistem automatizat de segmentare.

Evaluatorii au apreciat domeniul de aplicare și înțelegerea clară a activității necesare pentru punerea în aplicare a propunerii. Ei au crezut, de asemenea, că are un mare potențial de aplicare în diferite colecții.
Contextele controversate Corpus
Această propunere comună a KNAW Humanities Cluster și Centrum Wiskunde & Informatica din Țările de Jos dorește să stabilească un corpus adnotat de termeni contencioși în context (ConConCor) din ziarele olandeze din Europeana. Acestea pot fi apoi utilizate pentru a bootstrap și a evalua metode (semi)automate de detectare a unor astfel de termeni în colecțiile de patrimoniu cultural. Termenii contencioși aici înseamnă acele cuvinte sau fraze care sunt sugestive pentru o anumită părtinire (implicită sau explicită) față de sau împotriva unui grup, eveniment sau altfel.
Evaluatorii au apreciat modul în care prezenta propunere urmărește să abordeze un obiectiv-cheie al provocării, detectarea problemelor etice și a prejudecăților inerente colecțiilor de patrimoniu cultural digitalizate.
Trei burse în valoare de 2 500 EUR fiecare vor fi puse la dispoziția câștigătorilor pentru a-și pune în aplicare propunerile și pentru a furniza seturile de date corespunzătoare până la sfârșitul lunii iunie 2021.
Aflați mai multe
Dorim să le mulțumim tuturor celor care au prezentat o propunere la această provocare pentru munca lor asiduă și ideile excelente. Așteptăm cu nerăbdare punerea în aplicare a proiectelor câștigătoare și sperăm că o altă rundă se va deschide în viitor pentru cei care nu au avut succes de data aceasta!
Dacă doriți să aflați mai multe despre astfel de oportunități și să colaborați în rețea cu profesioniști tehnici multidisciplinari din întreaga lume, alăturați-vă EuropeanaTech prin intermediul Asociației Europeana Network și urmăriți comunitatea pe Twitter.
Acest post a fost editat la 16.4.2021 pentru a reflecta termenul prelungit până la care câștigătorii își pot furniza seturile de date.
