Par uzaicinājumu
Metodes mākslīgā intelekta un mašīnmācīšanās (MI/ML) jomā ir palīdzējušas paplašināt tehnoloģiskās robežas dažādās jomās, tostarp kultūras mantojuma nozarē (sk. piemērus EuropeanaTech AI starpposma ziņojumā saistībā ar GLAM darba grupu vai AI4LAM iniciatīvu).
Tiek uzraudzītas daudzas MI/ML metodes, kas interesē GLAM lietojumprogrammas; piemēram, viņi strādā, apmācot prognozētāju (piemēram, neironu tīklu), izmantojot zemes patiesību (ideālos un gaidāmos rezultātus) vai marķētus datus, no kuriem metode spēj mācīties un izsecināt modeli. Lai modelis labi vispārinātu un precīzi prognozētu plašu ievaddatu klāstu, tā apmācības datiem jābūt pietiekami apjomīgiem, kvalitatīviem un reprezentatīviem attiecībā uz jomu, no kuras tas tiek atlasīts. Pretējā gadījumā pastāv pāraprīkošanas risks (modelis tikai labi prognozēs ievaddatus, kas ir ļoti līdzīgi apmācības datiem) vai neobjektivitātes ieviešana, kas ne tikai samazinās modeļa vispārējo piemērojamību un veiktspēju, bet var arī radīt ētiski problemātiskus vai citādi neparedzētus blakusefektus.
GLAM nozare ir labi sagatavota MI/ML ieviešanai tādā nozīmē, ka pārraudzīti un daudzveidīgi dati pietiekamā apjomā, kvalitātē un daudzveidībā GLAM digitālo kolekciju veidā (piemēram, Europeana apkopotie un sniegtie dati) tagad ir plaši pieejami saskaņā ar atvērtajām licencēm. Pašlaik trūkst plašākas tādu GLAM nozares datu kopu pieejamības, kas ir piemērotas tiešai izmantošanai MI/ML pētniecības un izstrādes kontekstā. Šādu atvērto datu kopu pieejamība varētu ne tikai palīdzēt veicināt lielāku iesaisti ar digitālajiem kultūras mantojuma datiem MI/ML jomā, bet arī atbalstīt neseno MI/ML sasniegumu pārnešanu uz kultūras mantojuma satura digitālās pārzināšanas un analīzes jomu. No otras puses, MI/ML turpmāka attīstība bieži vien iet roku rokā ar jaunu augstas kvalitātes datu kopu publiskošanu.
Tāpēc EuropeanaTech aicina iesniegt priekšlikumus par piemērotu MI/ML datu kopu montāžu, izmantojot plašās kolekcijas Europeana tīmekļa vietnē. Mēs meklējam priekšlikumus, lai izveidotu lielas, labi dokumentētas datu kopas, kas ir veidotas tiešai izmantošanai MI/ML nolūkos (piemēram, modeļa apmācība) un ko var darīt publiski pieejamas attiecīgajās tiešsaistes platformās saskaņā ar atvērtām licencēm.
Diviem uzvarējušajiem priekšlikumiem mēs piešķirsim finanšu stipendiju 2500 eiro apmērā, lai atbalstītu datu kopu sagatavošanu, dokumentēšanu un publicēšanu. Balvas ieguvēji tiks aicināti iepazīstināt ar savu ieguldījumu kādā no turpmākajiem Europeana (tiešsaistes) pasākumiem un iesniegt publicēšanai tekstu, kas saistīts ar viņu rezultātiem.
Kā pieteikties
Lai pieteiktos, izlasiet tālāk norādītās iesniegšanas vadlīnijas un iesniedziet priekšlikumu līdz 2021. gada 15. februārim plkst. 23.59 (pēc Centrāleiropas laika). Priekšlikumos mazāk nekā 1500 vārdiem jāapraksta:
Paredzētais datu kopas saturs (apjoma, aktīvu veidu, anotācijas utt. izteiksmē)
Procedūra, ko paredzējāt ievērot, lai sagatavotu datu kopu
Kā tas attiecas uz MI/ML.
Priekšlikumos būtu jāiekļauj arī ierosinājums iespējamam izmantošanas gadījumam, ko papildina iepriekš apmācīts modelis ar tā rezultātu demonstrējumu vai novērtējumu. Pieņemšanas gadījumā datu kopai un visai nepieciešamajai dokumentācijai un tehniskajiem resursiem jābūt pieejamiem līdz 2021. gada 30. jūnijam.
Eiropas kultūras mantojuma kolekcijas parasti ir pakļautas aizspriedumiem un ir saistītas ar ētikas jautājumiem. Lai gan tas var negatīvi ietekmēt MI un mašīnmācīšanās risinājumus, MI un mašīnmācīšanos varētu izmantot arī šo problēmu atklāšanai. Šie jautājumi, iespējams, netiks atrisināti šā uzaicinājuma ietvaros, taču mēs iesakām tos dokumentēt un apspriest.
Datu kopām JĀBŪT:
jābūt iegūtiem no datiem, kas iekļauti dažādajās kolekcijās, kuras sniegtas, izmantojot Europeana;
Iekļaujiet tikai tos metadatus, ko esat izveidojis jūs vai kas nāk no Europeana. Iegūtajiem metadatiem jābūt licencētiem saskaņā ar Creative Commons Zero;
jābūt mašīnlasāmā formātā, tostarp dokumentācijai un izcelsmei;
Neesmu iepriekš publicējis. Ja jaunā datu kopa ir publicēta iepriekš, ir sīki jāizklāsta, kā to uzlabot un izmantot;
Iekļaut datu kopas viena vai vairāku paredzēto izmantošanas gadījumu aprakstu.
Datu kopām JĀBŪT:
ietver tikai mediju aktīvus ar licenci, kas ir saderīga ar Europeana Publishing Framework 3. līmeņa saturu;
precizēt saikni ar MI un ML paraugpraksi un jaunākos sasniegumus digitālajā kultūras mantojumā un ieguldījumu tajā;
iekļaut iepriekš apmācītu modeli, kas iegūts, piemērojot (izmantojot ML/AI pamatmetodi (vienam no) paredzētajiem lietošanas gadījumiem), un demonstrāciju par šā modeļa izmantošanu vai tā rezultātu novērtēšanu;
Dokumentēt vai apspriest iespējamos ētikas jautājumus un neobjektivitāti.
Datu kopas VAR:
iekļaut papildu kuratoriālus papildinājumus un uzlabojumus, piemēram, datu anotāciju, marķēšanu vai mijnorādes ar citiem (digitāliem) resursiem, ar nosacījumu, ka tie ir pabeigti pirms datu kopas izlaišanas un ka tiek piemēroti atbilstoši kvalitātes kontroles pasākumi;
Veidojiet daļu no publikācijas zinātniski recenzētā žurnālā vai konferencē.
Būtu jānodrošina tehnisko risinājumu pamatdokumentācija, un jebkura izstrādātā programmatūra ir jāizlaiž saskaņā ar atklātā pirmkoda licenci.
Svarīgākie datumi
Izsludina konkursu: 2021. gada 8. janvāris
Iesniegšanas termiņš: 2021. gada 15. februāris, plkst. 23.59 (pēc Centrāleiropas laika)
Paziņojums par pieņemšanu: 2021. gada 1. marts
Datu kopas publicēšana: 2021. gada 30. jūnijs
Piešķiršanas kritēriji
Iesniegumus izskatīs EuropeanaTech AI GLAM darba grupa un EuropeanaTech kopienas vadības grupa, pamatojoties uz:
Izmantošanas gadījuma atbilstība GLAM kopienai: 25%
Datu kopas atbilstība MI/ML saistībā ar lietošanas gadījumu: 25%
Skaidra lietošanas gadījuma/demo definīcija saistībā ar Europeana: 30%
Skaidrība datu kopas aprakstā: 20%
Attiecināmība
Formāli līdzekļi netiks piešķirti privātpersonām, bet gan iestādēm, kas var būt kultūras mantojums vai pētniecības iestādes, kurās ietilpst universitātes. Katras balvas saņēmējas iestādes pārstāvis tiks aicināts parakstīt apakšuzņēmuma līgumu ar Europeana fondu.
Pieteikuma iesniedzējiem jābūt reģistrētiem kādā ES dalībvalstī.
Pretendentiem jābūt EuropeanaTech kopienas un Europeana Network asociācijas biedriem. Ja vēl neesat dalībnieks, varat uzzināt, kā pievienoties.
Piešķiršana ir bruto summa, tāpēc tajā ir iekļauts PVN.
Europeana DSI-4 projekta partneri nav tiesīgi saņemt finansējumu. Pilns saraksts ir pieejams šeit.
Ieteicamais lasījums
Šī lapa tika rediģēta 2021. gada 19. janvārī, lai atspoguļotu termiņa pagarinājumu no 2021. gada 31. janvāra līdz 2021. gada 15. februārim. Tas tika rediģēts 2021. gada 16. aprīlī, lai atspoguļotu pagarināto termiņu, kurā uzvarētājiem datu kopas jāiesniedz līdz 2021. gada jūnijam.
