Metode iz područja umjetne inteligencije i strojnog učenja pridonijele su pomicanju tehnoloških granica u različitim područjima, među ostalim u sektoru kulturne baštine (u privremenom izvješću EuropeanaTech AI-a u vezi s radnom skupinom GLAM-a i inicijativom AI4LAM navedeni su neki primjeri). Kako bi se potaknule inovacije u tom području, EuropeanaTech je prije nekoliko tjedana najavio svoj prvi izazov za skupove podataka AI/ML Europeane. Ovom novom aktivnošću željeli smo potaknuti stvaranje skupova podataka za GLAM sektor koji se mogu koristiti za UI/ML, oslanjajući se na bogate resurse kulturne baštine dostupne u Europeani. Nadamo se da bi dostupnost takvih skupova podataka mogla pomoći u poticanju veće suradnje s digitalnim podacima o kulturnoj baštini u umjetnoj inteligenciji/ML-u i poduprijeti prijenos nedavnog napretka u umjetnoj inteligenciji/ML-u u područje digitalne kuracije i analize sadržaja kulturne baštine.
Primili smo ukupno pet prijedloga koje su članovi upravljačke skupine EuropeanaTech i umjetne inteligencije pažljivo pregledali u vezi s radnom skupinom za GLAM-ove. Ocijenili su prijedloge na temelju njihove relevantnosti za sektor GLAM-a (25 %), relevantnosti za umjetnu inteligenciju/ML (25 %), povezanosti s Europeanom (30 %) i jasnoće opisa i plana rada (20 %).
Objava pobjednika
Imenovani subjekti u arheološkim tekstovima
Cilj je ovog prijedloga tima sa Sveučilišta u Napulju „L'Orientale” stvoriti skup podataka za priznavanje imenovanih subjekata (NER) i izvlačenje termina za arheološke pojmove na talijanskom i engleskom jeziku u zbirci arheologije Europeane. NER je postupak identifikacije vlastitih imena kao što su imena osoba ili mjesta u nestrukturiranom tekstu. Termin Ekstrakcija je sličan, ali se usredotočuje na pronalaženje specijaliziranih pojmova, u ovom slučaju iz arheološke domene. Razmotrit će se rječnici kao što su Getty i CIDOC CRM. Konačni skup podataka mogao bi se upotrijebiti za razvoj i evaluaciju tehnologija koje se temelje na umjetnoj inteligenciji/ML-u za NER u području arheologije.
Recenzenti su posebno cijenili jasnu strukturu i zrelost prijedloga, za koji je već izrađen lažni skup podataka s pomoću API-ja Europeane kako bi se ispitao predloženi pristup. Dvojezični aspekt i nedostatak sličnih otvorenih resursa za područje arheologije također su se smatrali posebno vrijednima.
Zac Grace
Ovaj prijedlog studenta Ecole Nationale d'Ingénieurs de Tarbes ima za cilj stvoriti piksel maske za semantičku segmentaciju, kroz ručno bilježenje podataka o slikama u kolekciji Europeana Fashion. To znači da se, na primjer, pri analizi slike relevantni modni elementi (majica, hlače, cipele) na slici zatim označavaju obrisima piksela. Takvi se podaci mogu koristiti za treniranje automatiziranog sustava segmentacije.

Recenzentima se svidio jasan opseg i razumijevanje rada potrebnog za provedbu prijedloga. Također su mislili da ima puno potencijala za primjenu u različitim zbirkama.
Sporni konteksti Corpus
Ovaj zajednički prijedlog Klastera humanističkih znanosti KNAW-a i Centrum Wiskunde & Informatica u Nizozemskoj želi uspostaviti korpus spornih pojmova s komentarima u kontekstu (ConConCor) iz nizozemskih novina u Europeani. Oni se zatim mogu upotrijebiti za pokretanje i evaluaciju (polu)automatskih metoda za otkrivanje takvih pojmova u zbirkama kulturne baštine. Sporni pojmovi ovdje znače one riječi ili fraze koje sugeriraju neku (implicitnu ili eksplicitnu) pristranost prema ili protiv grupe, događaja ili na drugi način.
Recenzenti su cijenili način na koji se ovim prijedlogom nastoji riješiti ključni cilj u pogledu izazova, otkrivanja etičkih pitanja i pristranosti svojstvenih digitaliziranim zbirkama kulturne baštine.
Pobjednicima će biti na raspolaganju tri stipendije u iznosu od po 2500 eura kako bi mogli provesti svoje prijedloge i dostaviti odgovarajuće skupove podataka do kraja lipnja 2021.
Saznajte više
Zahvaljujemo svima koji su na ovaj izazov podnijeli prijedlog za njihov naporan rad i izvrsne ideje. Veselimo se provedbi pobjedničkih projekata i nadamo se da će se u budućnosti otvoriti još jedan krug za one koji ovaj put nisu bili uspješni!
Želite li čuti više o takvim mogućnostima i umrežiti se i surađivati s multidisciplinarnim tehničkim stručnjacima iz cijelog svijeta, pridružite se EuropeanaTechu putem udruge Europeana Network i pratite zajednicu na Twitteru.
Ovaj je post izmijenjen 16. travnja 2021. kako bi se odrazio produljeni rok u kojem pobjednici moraju dostaviti svoje skupove podataka.
