Apie kvietimą
Dirbtinio intelekto ir mašinų mokymosi srities metodai padėjo išplėsti technologines ribas įvairiose srityse, be kita ko, kultūros paveldo sektoriuje (žr. „EuropeanaTech“ dirbtinio intelekto tarpinėje ataskaitoje pateiktus pavyzdžius, susijusius su GLAM darbo grupe arba iniciatyva AI4LAM).
prižiūrima daug DI ir (arba) MD metodų, kurie domina GLAM taikomąsias programas; pavyzdžiui, jie dirba mokydami prognozatorių (pvz., neuroninį tinklą), naudodami antžeminę tiesą (idealius ir tikėtinus rezultatus) arba pažymėtus duomenis, iš kurių metodas gali išmokti ir numanyti modelį. Kad modelis gerai apibendrintų ir tiksliai prognozuotų įvairius įvesties duomenis, jo mokymo duomenys turi būti pakankamos apimties, kokybės ir reprezentatyvūs tai sričiai, iš kurios jie imami. Priešingu atveju kyla perdėto pritaikymo rizika (modelis tik tinkamai prognozuos įvedinius, kurie yra labai panašūs į mokymo duomenis) arba šališkumo atsiradimo rizika, o tai ne tik sumažins bendrą modelio pritaikomumą ir veiksmingumą, bet ir gali sukelti etikos požiūriu probleminį ar kitokį nenumatytą šalutinį poveikį.
GLAM sektorius yra gerai pasirengęs įsisavinti dirbtinį intelektą ir (arba) mūrą, nes pagal atvirąsias licencijas dabar plačiai prieinami pakankamos apimties, kokybės ir įvairovės kuruoti ir įvairūs GLAM skaitmeninių kolekcijų duomenys (pvz., apibendrinti ir pateikti Europeanoje). Šiuo metu trūksta platesnio GLAM sektoriaus duomenų rinkinių, kurie būtų tinkami tiesiogiai naudoti DI / MD mokslinių tyrimų ir plėtros kontekste, prieinamumo. Tokių atvirųjų duomenų rinkinių prieinamumas galėtų ne tik padėti skatinti aktyvesnį bendradarbiavimą su skaitmeniniais kultūros paveldo duomenimis dirbtinio intelekto ir (arba) masinio naikinimo srityje, bet ir padėti perkelti pastarojo meto pažangą dirbtinio intelekto ir (arba) masinio naikinimo srityje į kultūros paveldo turinio skaitmeninio kuravimo ir analizės sritį. Kita vertus, tolesnė pažanga dirbtinio intelekto ir (arba) pinigų plovimo srityje dažnai yra susijusi su naujų aukštos kokybės duomenų rinkinių išleidimu.
Todėl „EuropeanaTech“, remdamasi gausiais „Europeanos“ interneto svetainėje esančiais rinkiniais, kviečia teikti pasiūlymus dėl tinkamų DI / MD duomenų rinkinių surinkimo. Ieškome pasiūlymų, kaip sukurti didelius, gerai dokumentuotus duomenų rinkinius, kurie būtų suformuoti taip, kad juos būtų galima tiesiogiai naudoti DI / MD tikslais (pvz., mokyti modelį) ir kurie galėtų būti viešai prieinami atitinkamose interneto platformose pagal atvirąsias licencijas.
Abiem laimėjusiems pasiūlymams skirsime 2 500 EUR finansinę stipendiją duomenų rinkinių rengimui, dokumentavimui ir skelbimui remti. Apdovanojimų laureatai bus pakviesti pristatyti savo indėlį būsimame Europeanos (internetiniame) renginyje ir pateikti leidinį, susijusį su jų rezultatais.
Kaip pateikti paraišką?
Norėdami pateikti paraišką, perskaitykite toliau pateiktas paraiškų teikimo gaires ir pateikite pasiūlymą iki 2021 m. vasario 15 d. 23.59 val. Vidurio Europos laiku. Pasiūlymuose turėtų būti aprašyta mažiau nei 1500 žodžių:
Numatomas duomenų rinkinio turinys (apimtis, turto rūšys, anotacija ir t. t.)
Duomenų rinkinio rengimo procedūra, kurios ketinote laikytis
Kokią reikšmę tai turi DI ir (arba) ML?
Pasiūlymuose taip pat turėtų būti pateiktas pasiūlymas dėl galimo naudojimo atvejo, paremto iš anksto parengtu modeliu, kuriame būtų pademonstruoti arba įvertinti jo rezultatai. Priėmimo atveju turi būti įmanoma iki 2021 m. birželio 30 d. parengti ir paskelbti duomenų rinkinį ir visus būtinus dokumentus bei techninius išteklius.
Europos kultūros paveldo kolekcijos paprastai yra šališkos ir susijusios su etikos klausimais. Nors tai gali daryti neigiamą poveikį DI ir mašinų mokymosi sprendimams, DI ir mašinų mokymasis taip pat galėtų būti naudojami šioms problemoms atskleisti. Šių klausimų šiame kvietime gali nepavykti išspręsti, tačiau patariame juos dokumentuoti ir aptarti.
Duomenų rinkiniai PRIVALO:
būti paimtas iš duomenų, įtrauktų į įvairius rinkinius, teikiamus per Europeaną;
Įtraukite tik jūsų sukurtus arba iš Europeanos gautus metaduomenis. Gauti metaduomenys turi būti licencijuojami pagal programą „Creative Commons Zero“;
sudaryti kompiuterio skaitomu formatu, įskaitant dokumentus ir kilmės vietą;
Anksčiau jis nebuvo publikuotas. Jei naujas duomenų rinkinys buvo paskelbtas anksčiau, turi būti išsamiai nurodyta, kaip jis turi būti tobulinamas ir naudojamas;
Apibūdinkite vieną ar daugiau duomenų rinkinio numatomo naudojimo atvejų.
Duomenų rinkiniai turėtų:
Įtraukti tik žiniasklaidos priemones, turinčias licenciją, suderinamą su Europeana Publishing Framework turinio 3 pakopa;
paaiškinti ryšį su geriausia patirtimi ir pažangiausiais skaitmeninio kultūros paveldo metodais, susijusiais su dirbtiniu intelektu ir pinigų plovimu, ir jų indėlį;
Įtraukti iš anksto parengtą modelį, parengtą taikant (kai (vienam iš) numatytų naudojimo atvejų taikomas bazinis ML/AI metodas) ir šio modelio naudojimo demonstracinę versiją arba jo rezultatų vertinimą;
Dokumentuoti arba aptarti galimus etinius klausimus ir šališkumą.
Duomenų rinkiniai GALI būti:
įtraukti papildomus kuratorinius patobulinimus ir patobulinimus, pvz., duomenų anotavimą, ženklinimą ar kryžmines nuorodas į kitus (skaitmeninius) išteklius, su sąlyga, kad jie bus užbaigti prieš paskelbiant duomenų rinkinį ir kad bus taikomos tinkamos kokybės kontrolės priemonės;
Priklauso publikacijai recenzuojamame žurnale ar konferencijoje.
Turėtų būti pateikti pagrindiniai techninių sprendimų dokumentai, o bet kokia pagaminta programinė įranga turi būti išleista pagal atvirojo kodo licenciją.
Pagrindinės datos
Kvietimas teikti paraiškas skelbiamas: 2021 m. sausio 8 d.
Galutinis paraiškų pateikimo terminas: 2021 m. vasario 15 d. 23.59 val. Vidurio Europos laiku
Pranešimas apie priėmimą: 2021 m. kovo 1 d.
Duomenų rinkinio skelbimas: 2021 m. birželio 30 d.
Sutarties sudarymo kriterijai
Pateiktas pastabas peržiūrės EuropeanaTech DI GLAM darbo grupė ir EuropeanaTech bendruomenės iniciatyvinė grupė, remdamosi:
Naudojimo atvejo aktualumas GLAM bendruomenei: 25%
Duomenų rinkinio aktualumas DI/ML atveju, atsižvelgiant į naudojimo atvejį: 25%
Aiški naudojimo atvejo (demo) apibrėžtis, susijusi su Europeana: 30%
Duomenų rinkinio aprašymo aiškumas: 20%
Atitiktis reikalavimams
Formaliai lėšos bus skiriamos ne pavieniams asmenims, o institucijoms, kurios gali būti kultūros paveldo arba mokslinių tyrimų institucijos, įskaitant universitetus. Kiekvienos konkursą laimėjusios institucijos atstovo bus paprašyta pasirašyti subrangos sutartį su Europeanos fondu.
Pareiškėjai turi būti įsisteigę ES valstybėje narėje.
Pareiškėjai turi būti EuropeanaTech bendruomenės ir Europeana tinklo asociacijos nariai. Jei dar nesate narys, galite sužinoti, kaip prisijungti.
Apdovanojimas yra bendra suma, todėl į ją įskaičiuotas PVM.
Europeana DSI-4 projekto partneriai negali gauti finansavimo. Visą sąrašą galima rasti čia.
Rekomenduojama skaityti
Šis puslapis buvo redaguotas 2021 m. sausio 19 d., siekiant atsižvelgti į termino pratęsimą nuo 2021 m. sausio 31 d. iki 2021 m. vasario 15 d. Jis buvo redaguotas 2021 m. balandžio 16 d., siekiant atsižvelgti į pratęstą terminą, iki kurio nugalėtojai turi pateikti savo duomenų rinkinius iki 2021 m. birželio mėn.
