Konkursikutse kohta
Tehisintellekti ja masinõppe valdkonna meetodid on aidanud nihutada tehnoloogilisi piire eri valdkondades, sealhulgas kultuuripärandi sektoris (vt näiteid EuropeanaTechi tehisintellekti vahearuandes seoses GLAMide rakkerühma või algatusega AI4LAM).
Jälgitakse paljusid tehisintellekti/MLi meetodeid, mis pakuvad huvi GLAMide rakendustele; näiteks töötavad nad ennustaja (nagu närvivõrk) koolitamisega, kasutades maapealset tõde (ideaalsed ja eeldatavad väljundid) või märgistatud andmeid, millest meetod on võimeline õppima ja mudelit järeldama. Selleks et mudel saaks üldistada hästi ja teha täpseid prognoose paljude sisendite kohta, peavad selle koolitusandmed olema piisava mahu ja kvaliteediga ning esindama valdkonda, kust see on võetud. Vastasel juhul tekib liigsobitamise oht (mudel annab ainult häid prognoose koolitusandmetega väga sarnaste sisendite kohta) või kallutatuse tekkimise oht, mis mitte ainult ei vähenda mudeli üldist kohaldatavust ja toimivust, vaid võib kaasa tuua ka eetiliselt problemaatilisi või muul viisil soovimatuid kõrvalmõjusid.
GLAM-sektor on tehisintellekti/MLi kasutuselevõtuks hästi positsioneeritud selles mõttes, et GLAM-ide digitaalsete kogudena (näiteks Europeana koondatud ja pakutavad) on nüüd avatud litsentside alusel laialdaselt kättesaadavad piisava mahu, kvaliteedi ja mitmekesisusega kureeritud ja mitmekesised andmed. Praegu on puudu selliste GLAM-sektori andmestike laialdasemast kättesaadavusest, mis sobivad otseseks kasutamiseks tehisintellekti/rahandusvaldkonna teadus- ja arendustegevuses. Selliste avatud andmestike kättesaadavus ei saaks mitte ainult aidata edendada digitaalse kultuuripärandi andmete suuremat kaasamist tehisintellekti/rahandussektorisse, vaid toetada ka tehisintellekti/rahandussektori hiljutiste edusammude ülekandmist kultuuripärandi sisu digitaalse hooldamise ja analüüsimise valdkonda. Teisest küljest käivad tehisintellekti ja rahapesu tõkestamise edasised edusammud sageli käsikäes uute kvaliteetsete andmekogumite avaldamisega.
Seepärast kutsub EuropeanaTech üles esitama ettepanekuid sobivate tehisintellekti/MLi andmekogumite koostamiseks, tuginedes Europeana veebisaidi ulatuslikele kogudele. Otsime ettepanekuid suurte, hästi dokumenteeritud andmekogumite loomiseks, mis on kujundatud otseseks kasutuselevõtuks tehisintellekti/rahanduslikel eesmärkidel (nt mudeli treenimine) ja mida saab avatud litsentside alusel asjaomastel veebiplatvormidel avalikult kättesaadavaks teha.
Me anname kahele võitnud projektile 2500 euro suuruse rahalise stipendiumi, et toetada andmekogumite koostamist, dokumenteerimist ja avaldamist. Auhinnavõitjatel palutakse tutvustada oma panust tulevasel Europeana (veebipõhisel) üritusel ja esitada oma väljunditega seotud tekst avaldamiseks.
Kuidas kandideerida?
Kandideerimiseks lugege palun allpool esitatud esitamisjuhiseid ja esitage ettepanek 15. veebruariks 2021 kell 23.59 Kesk-Euroopa aja järgi. Ettepanekutes tuleks kirjeldada vähem kui 1500 sõnaga:
Andmekogumi kavandatud sisu (maht, varade liigid, märge jne)
Toiming, mida kavatsesite andmekogumi koostamisel järgida
Kuidas see on tehisintellekti/rahapesu seisukohast asjakohane?
Ettepanekud peaksid sisaldama ka ettepanekut võimaliku kasutusjuhu kohta, mida toetab eelkoolitatud mudel koos selle tulemuste tutvustamise või hindamisega. Heakskiitmise korral peab olema võimalik koostada ja avaldada andmekogum ning kõik vajalikud dokumendid ja tehnilised vahendid enne 30. juunit 2021.
Euroopa kultuuripärandi kogud on tavaliselt kallutatud ja hõlmavad eetilisi küsimusi. Kuigi see võib tehisintellekti ja masinõppe lahendusi negatiivselt mõjutada, võiks nende probleemide avastamiseks kasutada ka tehisintellekti ja masinõpet. Neid probleeme ei pruugita käesoleva konkursikutse raames lahendada, kuid soovitame teil need dokumenteerida ja neid arutada.
Andmekogumid peavad:
olema koostatud Europeana kaudu esitatud eri kogudes sisalduvate andmete põhjal;
Lisage ainult metaandmed, mis on loodud teie poolt või pärinevad Europeanast. Saadud metaandmed peavad olema litsentsitud Creative Commons Zero alusel;
olema koostatud masinloetavas vormingus, mis sisaldab dokumente ja päritolu;
Ei ole varem avaldatud. Kui see on varem avaldatud, tuleb üksikasjalikult kirjeldada, kuidas uut andmekogumit parandada ja kasutada;
Lisada andmekogumi ühe või mitme kavandatud kasutusjuhtumi kirjeldus.
Andmekogumid peaksid:
hõlmama üksnes selliseid meediavarasid, mille litsents ühildub Europeana avaldamisraamistiku 3. taseme sisuga;
selgitada seost tehisintellekti ja rahapesu parimate tavadega ja tipptasemel digitaalse kultuuripärandiga ning anda neisse oma panus;
sisaldama eelnevalt koolitatud mudelit, mis on saadud (kasutades (ühe) kavandatud kasutusjuhu puhul ML/AI baasmeetodit) ja selle mudeli kasutamise näidist või selle tulemuste hindamist;
Dokumenteerida või arutada võimalikke eetilisi küsimusi ja eelarvamusi.
Andmekogumid võivad:
lisada täiendavaid kuraatorlikke täiendusi ja täiustusi, nagu andmete annoteerimine, märgistamine või ristviitamine muude (digitaalsete) ressurssidega, tingimusel et need viiakse lõpule enne andmekogumi avaldamist ja kohaldatakse asjakohaseid kvaliteedikontrolli meetmeid;
Moodustage osa publikatsioonist eelretsenseeritud ajakirjas või konverentsil.
Tehniliste lahenduste põhidokumendid tuleks esitada ja kogu toodetud tarkvara tuleb välja anda avatud lähtekoodi litsentsi alusel.
Tähtsamad kuupäevad
Konkursikutse on avatud: 8. jaanuar 2021
Esitamise tähtaeg: veebruar 2021 kell 23.59 Kesk-Euroopa aja järgi
Vastuvõtmisest teatamine: 1. märts 2021
Andmestiku avaldamine: 30. juuni 2021
Toetuse andmise kriteeriumid
Ettepanekud vaatavad läbi EuropeanaTechi tehisintellekti töörühm ja EuropeanaTechi kogukonna juhtrühm, tuginedes järgmisele:
Kasutusjuhtumi olulisus GLAMi kogukonna jaoks: 25%
Andmestiku olulisus tehisintellekti/MLi jaoks seoses kasutusjuhtumiga: 25%
Europeanaga seotud kasutusjuhtumi/demo selge määratlus: 30%
Selgus andmestiku koostamise kirjelduses: 20%
Abikõlblikkus
Formaalselt ei eraldata vahendeid üksikisikutele, vaid asutustele, mis võivad olla kultuuripärandi- või teadusasutused, mis koosnevad ülikoolidest. Iga auhinna saanud institutsiooni esindajal palutakse sõlmida alltöövõtuleping Europeana sihtasutusega.
Taotlejad peavad asuma ELi liikmesriigis.
Taotlejad peavad olema EuropeanaTechi kogukonna ja Europeana Network Associationi liikmed. Kui te ei ole veel liige, saate teada, kuidas liituda.
Lepingu sõlmimine on brutosumma, mis seega sisaldab käibemaksu.
Europeana DSI-4 projektipartnerid ei ole rahastamiskõlblikud. Täielik loetelu on kättesaadav siin.
Soovituslik lugemine
Seda lehekülge muudeti 19. jaanuaril 2021, et kajastada tähtaja pikendamist 31. jaanuarist 2021 kuni 15. veebruarini 2021. Seda muudeti 16. aprillil 2021, et kajastada pikendatud tähtaega, mille jooksul võitjad peavad esitama oma andmekogumid 2021. aasta juuniks.
