O razpisu
Metode s področja umetne inteligence in strojnega učenja so pripomogle k premikanju tehnoloških meja na različnih področjih, tudi v sektorju kulturne dediščine (glej primere v vmesnem poročilu EuropeanaTech AI v zvezi s projektno skupino GLAM ali pobudo AI4LAM).
Nadzorujejo se številne metode umetne inteligence/minimalne migracije, ki so zanimive za aplikacije v sistemih GLAM; na primer, delajo z usposabljanjem napovednika (kot je nevronska mreža) z uporabo talne resnice (idealni in pričakovani izhodi) ali označenih podatkov, iz katerih se lahko metoda uči in sklepa model. Da bi se model dobro posplošil in izvedel natančne napovedi za širok nabor vhodnih podatkov, morajo biti njegovi učni podatki dovolj obsežni in kakovostni ter reprezentativni za področje, s katerega se vzorči. V nasprotnem primeru obstaja tveganje pretiranega opremljanja (model bo zagotovil le dobre napovedi za vložke, ki so zelo podobni učnim podatkom) ali uvedbe pristranskosti, ki ne bo le zmanjšala splošne uporabnosti in učinkovitosti modela, temveč lahko povzroči tudi etično problematične ali drugače nenamerne stranske učinke.
Sektor GLAM je v dobrem položaju za uporabo umetne inteligence/umetnega jezika v smislu, da so kurirani in raznoliki podatki zadostnega obsega, kakovosti in raznolikosti v obliki digitalnih zbirk iz GLAM (kot so zbirke, ki jih zbira in zagotavlja Europeana) zdaj široko dostopni na podlagi odprtih licenc. Trenutno manjka širša razpoložljivost naborov podatkov iz sektorja GLAM, ki so primerni za neposredno uporabo v okviru raziskav in razvoja umetne inteligence/ML. Razpoložljivost takih odprtih naborov podatkov bi lahko pripomogla k spodbujanju večjega sodelovanja z digitalnimi podatki o kulturni dediščini na področju umetne inteligence/ML, pa tudi podprla prenos nedavnega napredka na področju umetne inteligence/ML na področje digitalnega kuriranja in analize vsebin kulturne dediščine. Po drugi strani pa je nadaljnji napredek na področju umetne inteligence/ML pogosto povezan z objavo novih visokokakovostnih naborov podatkov.
EuropeanaTech zato poziva k pripravi predlogov za zbiranje ustreznih naborov podatkov o umetni inteligenci/ML na podlagi obsežnih zbirk na spletišču Europeane. Iščemo predloge za oblikovanje obsežnih, dobro dokumentiranih naborov podatkov, ki so oblikovani za neposredno uporabo za namene umetne inteligence/umetne inteligence na lokalni ravni (kot je učenje modela) in jih je mogoče javno objaviti na ustreznih spletnih platformah z odprtimi licencami.
Zmagovalnima predlogoma bomo dodelili finančno štipendijo v višini 2.500 EUR za podporo izdelavi, dokumentiranju in objavi naborov podatkov. Dobitniki nagrad bodo povabljeni, da predstavijo svoje prispevke na prihodnjem dogodku Europeane (na spletu) in zagotovijo besedilo za objavo, povezano z njihovimi rezultati.
Kako se prijaviti
Prijavite se lahko na podlagi spodnjih smernic za predložitev, predlog pa predložite do 15. februarja 2021 do 23.59 po srednjeevropskem času. Predlogi morajo v manj kot 1 500 besedah opisati:
Predvidena vsebina podatkovnega niza (v smislu obsega, vrst sredstev, oznake itd.)
Postopek, ki ste ga nameravali uporabiti za izdelavo nabora podatkov
Kako pomembna je za umetno inteligenco/umetno inteligenco.
Predlogi bi morali vključevati tudi predlog za morebiten primer uporabe, podprt s predhodno usposobljenim modelom s prikazom ali oceno njegovih rezultatov. V primeru sprejetja morata biti priprava in objava nabora podatkov ter vse potrebne dokumentacije in tehničnih virov izvedljivi pred 30. junijem 2021.
Zbirke evropske kulturne dediščine so običajno pristranske in vključujejo etična vprašanja. Čeprav lahko to negativno vpliva na rešitve umetne inteligence in strojnega učenja, bi se lahko za odkrivanje teh težav uporabili tudi umetna inteligenca in strojno učenje. Ta vprašanja morda ne bodo rešena v okviru tega razpisa, vendar vam svetujemo, da jih dokumentirate in o njih razpravljate.
Podatkovni nizi MORAJO:
izhajati iz podatkov, vključenih v različne zbirke, ki se zagotavljajo prek Europeane;
Vključite samo metapodatke, ki ste jih ustvarili vi ali prihajajo iz Europeane. Pridobljeni metapodatki morajo biti licencirani pod Creative Commons Zero;
morajo biti sestavljeni v strojno berljivi obliki, vključno z dokumentacijo in izvorom;
Še ni bilo objavljeno. Če so že objavljeni, je treba podrobno opredeliti, kako se bo novi nabor podatkov izboljšal in uporabljal;
Vključite opis enega ali več primerov predvidene uporabe podatkovnega niza.
Podatkovni nizi morajo:
Vključujejo samo medijska sredstva z licenco, ki je združljiva s 3. stopnjo vsebine okvira Europeana Publishing Framework;
pojasnitev povezave z najboljšimi praksami in najsodobnejšimi praksami na področju umetne inteligence in ML v digitalni kulturni dediščini ter njihovega prispevka k njima;
vključi predhodno usposobljeni model, ki izhaja iz uporabe (z uporabo izhodiščne metode ML/AI za (enega od) predvidenih primerov uporabe), in predstavitev uporabe tega modela ali oceno njegovih rezultatov;
Dokumentirajte ali razpravljajte o morebitnih etičnih vprašanjih in pristranskosti.
Podatkovni nizi LAHKO:
vključi dodatne kuratorske obogatitve in izboljšave, kot so označevanje podatkov, označevanje ali navzkrižno sklicevanje z drugimi (digitalnimi) viri, pod pogojem, da se te dopolnijo pred objavo nabora podatkov in da se uporabijo ustrezni ukrepi za nadzor kakovosti;
Oblikujte del publikacije v recenzirani reviji ali na konferenci.
Zagotoviti bi bilo treba osnovno dokumentacijo za tehnične rešitve, vsa izdelana programska oprema pa bi morala biti izdana pod odprtokodno licenco.
Ključni datumi
Odpre se razpis: z dne 8. januarja 2021
Rok za oddajo predlogov: februar 2021 do 23.59 po srednjeevropskem času
Uradno obvestilo o sprejetju: 1. marec 2021
Objava podatkovnega niza: 30. junij 2021
Merila za oddajo javnega naročila
Prispevke bosta pregledali projektna skupina za umetno inteligenco EuropeanaTech v okviru GLAM in usmerjevalna skupina skupnosti EuropeanaTech na podlagi:
Ustreznost primera uporabe za skupnost GLAM: 25%
Ustreznost nabora podatkov za umetno inteligenco/ML v zvezi s primerom uporabe: 25%
Jasna opredelitev primera/predstavitve uporabe v zvezi z Europeano: 30%
Jasnost opisa nabora podatkov: 20%
Upravičenost
Formalno se sredstva ne bodo dodeljevala posameznikom, temveč ustanovam, ki so lahko ustanove za kulturno dediščino ali raziskovalne ustanove, vključno z univerzami. Predstavnik vsake institucije, ki bo prejela nagrado, bo moral podpisati podizvajalsko pogodbo s fundacijo Europeana.
Prosilci morajo imeti sedež v eni od držav članic EU.
Kandidati morajo biti člani skupnosti EuropeanaTech in združenja Europeana Network Association. Če še niste član, lahko izveste, kako se včlaniti.
Nagrada je bruto znesek, zato vključuje DDV.
Projektni partnerji Europeane DSI-4 niso upravičeni do financiranja. Celoten seznam je na voljo tukaj.
Priporočeno branje
Ta stran je bila spremenjena 19. januarja 2021, da bi se upoštevalo podaljšanje roka z 31. januarja 2021 na 15. februar 2021. Urejen je bil 16. aprila 2021, da bi odražal podaljšan rok, v katerem morajo zmagovalci svoje nabore podatkov predložiti do junija 2021.
