O pozivu
Metode iz područja umjetne inteligencije i strojnog učenja pridonijele su pomicanju tehnoloških granica u različitim područjima, među ostalim u sektoru kulturne baštine (vidjeti primjere u privremenom izvješću EuropeanaTech AI-a u vezi s radnom skupinom GLAM-a ili inicijativom AI4LAM).
Nadziru se mnoge metode umjetne inteligencije i umjetne inteligencije koje su od interesa za aplikacije u GLAM-ovima; na primjer, rade osposobljavanjem prediktora (poput neuronske mreže) koristeći zemaljsku istinu (idealne i očekivane izlaze) ili označene podatke, iz kojih metoda može naučiti i zaključiti model. Kako bi se model dobro generalizirao i provodio točna predviđanja za širok raspon ulaznih podataka, njegovi podaci za osposobljavanje moraju biti dovoljno opsežni, kvalitetni i reprezentativni za domenu iz koje se uzorkuje. U suprotnom postoji rizik od prenapučenosti (model će dati samo dobra predviđanja za ulazne materijale koji su vrlo slični podacima o osposobljavanju) ili uvođenja pristranosti, čime će se ne samo smanjiti opća primjenjivost i uspješnost modela, nego može dovesti i do etički problematičnih ili na drugi način nenamjernih nuspojava.
Sektor GLAM-a u dobrom je položaju za primjenu umjetne inteligencije/ML-a u smislu da su prilagođeni i raznoliki podaci dostatne količine, kvalitete i raznolikosti u obliku digitalnih zbirki iz GLAM-ova (kao što su zbirni podaci koje pruža Europeana) sada široko dostupni u okviru otvorenih licencija. Trenutačno nedostaje šira dostupnost skupova podataka iz sektora GLAM-a koji su prikladni za izravnu uporabu u kontekstu istraživanja i razvoja umjetne inteligencije/ML-a. Dostupnost takvih otvorenih skupova podataka mogla bi ne samo pomoći u poticanju veće suradnje s digitalnim podacima o kulturnoj baštini u umjetnoj inteligenciji/ML-u, već i poduprijeti prijenos nedavnih napredaka u umjetnoj inteligenciji/ML-u u područje digitalne kuracije i analize sadržaja kulturne baštine. S druge strane, daljnji napredak u području umjetne inteligencije/ML-a često ide ruku pod ruku s izdavanjem novih visokokvalitetnih skupova podataka.
EuropeanaTech stoga poziva na podnošenje prijedloga za sastavljanje odgovarajućih skupova podataka umjetne inteligencije/ML-a na temelju opsežnih zbirki na internetskim stranicama Europeane. Tražimo prijedloge za stvaranje velikih, dobro dokumentiranih skupova podataka koji su oblikovani za izravno prihvaćanje u svrhe umjetne inteligencije/ML-a (kao što je osposobljavanje modela) i koji mogu biti javno dostupni na relevantnim internetskim platformama na temelju otvorenih licencija.
Dvama pobjedničkim prijedlozima dodijelit ćemo financijsku stipendiju u iznosu od 2.500 eura za potporu proizvodnji, dokumentiranju i objavljivanju skupova podataka. Dobitnici nagrada bit će pozvani da predstave svoje doprinose na budućem događanju Europeane (na internetu) i dostave tekst za objavu povezan s njihovim rezultatima.
Kako se prijaviti
Da biste se prijavili, pročitajte smjernice za podnošenje i dostavite prijedlog do 15. veljače 2021. u 23:59 po srednjoeuropskom vremenu. Prijedlozi bi trebali sadržavati manje od 1500 riječi:
Predviđeni sadržaj skupa podataka (u smislu obujma, vrste imovine, napomene itd.)
Postupak koji ste namjeravali slijediti za izradu skupa podataka
Kako je to relevantno za UI/ML.
Prijedlozi bi trebali uključivati i prijedlog za mogući slučaj uporabe, potkrijepljen prethodno obučenim modelom s prikazom ili evaluacijom njegovih rezultata. U slučaju prihvaćanja mora biti izvedivo izraditi i objaviti skup podataka i svu potrebnu dokumentaciju i tehničke resurse prije 30. lipnja 2021.
Zbirke europske kulturne baštine obično su podložne pristranostima i uključuju etička pitanja. Iako to može negativno utjecati na umjetnu inteligenciju i rješenja za strojno učenje, umjetna inteligencija i strojno učenje mogli bi se upotrijebiti i za otkrivanje tih problema. Ta se pitanja možda neće riješiti u okviru ovog poziva, ali savjetujemo vam da ih dokumentirate i raspravite o njima.
Skupovi podataka MORAju:
biti izvučeni iz podataka uključenih u različite zbirke koje se pružaju putem Europeane;
Uključite samo metapodatke koje ste izradili ili koji dolaze iz Europeane. Dobiveni metapodaci moraju biti licencirani pod Creative Commons Zero;
biti sastavljeni u strojno čitljivom formatu, uključujući dokumentaciju i podrijetlo;
Nije objavljeno prije. Ako su prethodno objavljeni, moraju biti detaljno opisani načini poboljšanja i uporabe novog skupa podataka;
Uključiti opis jednog ili više predviđenih slučajeva uporabe skupa podataka.
Skupovi podataka trebali bi:
uključuju samo medijsku imovinu s licencom koja je kompatibilna sa sadržajem iz 3. razine okvira za objavljivanje Europeane;
pojasniti odnos s najboljom praksom u području umjetne inteligencije i pranja novca te najnovija dostignuća u području digitalne kulturne baštine i njihov doprinos tim praksama;
Uključiti prethodno obučeni model koji proizlazi iz primjene (primjenom osnovne metode ML/AI za (jedan od) predviđenih slučajeva uporabe) i demonstraciju primjene tog modela ili procjenu njegovih rezultata;
Dokumentirati ili raspravljati o potencijalnim etičkim pitanjima i pristranostima.
Skupovi podataka MOGU:
Uključiti dodatna kustoska obogaćivanja i poboljšanja kao što su napomena o podacima, označivanje ili unakrsno upućivanje s drugim (digitalnim) resursima, pod uvjetom da su dovršeni prije objave skupa podataka i da se primjenjuju odgovarajuće mjere kontrole kvalitete;
Sastaviti dio publikacije u stručno recenziranom časopisu ili konferenciji.
Potrebno je osigurati osnovnu dokumentaciju za tehnička rješenja i svaki proizvedeni softver mora biti objavljen pod licencom otvorenog koda.
Ključni datumi
Natječaj se otvara: 8. siječnja 2021.
Rok za podnošenje prijava: veljače 2021., 23:59 (SEV)
Obavijest o prihvaćanju: 1. ožujka 2021.
Objava skupa podataka: 30. lipnja 2021.
Kriteriji za dodjelu
Podneske će preispitati radna skupina za umjetnu inteligenciju EuropeanaTech u okviru GLAM-ova i upravljačka skupina zajednice EuropeanaTech na temelju:
Važnost primjene za zajednicu GLAM-a: 25%
Relevantnost skupa podataka za UI/ML u odnosu na slučaj uporabe: 25%
Jasna definicija slučaja/demoa uporabe u odnosu na Europeanu: 30%
Jasnoća u opisu skupa podataka: 20%
Prihvatljivost
Službeno se sredstva neće dodjeljivati pojedincima, već institucijama, koje mogu biti kulturna baština ili istraživačke institucije, a sastoje se od sveučilišta. Od predstavnika svake institucije dobitnika nagrade tražit će se da potpiše podugovor sa Zakladom Europeana.
Podnositelji zahtjeva moraju imati sjedište u državi članici EU-a.
Prijavitelji moraju biti članovi zajednice EuropeanaTech i udruženja Europeana Network. Ako već niste član, možete saznati kako se pridružiti.
Dodjela je stoga bruto iznos koji uključuje PDV.
Partneri projekta Europeana DSI-4 ne ispunjavaju uvjete za financiranje. Cijeli popis dostupan je ovdje.
Preporučeno čitanje
Ova je stranica izmijenjena 19. siječnja 2021. kako bi se uzelo u obzir produljenje roka s 31. siječnja 2021. na 15. veljače 2021. Ureden je 16. travnja 2021. kako bi se uzeo u obzir produljeni rok u kojem pobjednici moraju dostaviti svoje skupove podataka do lipnja 2021.
