Puhelusta
Tekoälyn ja koneoppimisen alan menetelmät ovat auttaneet ylittämään teknologisia rajoja eri aloilla, myös kulttuuriperinnön alalla (ks. esimerkkejä EuropeanaTech AI:n väliraportissa, joka liittyy GLAM-työryhmään tai AI4LAM-aloitteeseen).
Valvotaan monia tekoälyn ja rahanpesun torjuntamenetelmiä, jotka kiinnostavat GLAM-sovelluksia. Ne toimivat esimerkiksi kouluttamalla ennustajaa (kuten hermoverkkoa) käyttäen pohjatotuutta (ihanteellisia ja odotettuja tuotoksia) tai merkittyä dataa, josta menetelmä pystyy oppimaan ja päättelemään mallin. Jotta malli voisi yleistyä hyvin ja tehdä tarkkoja ennusteita monenlaisista syötteistä, sen koulutustietojen on oltava riittävän tilavia ja laadukkaita ja edustavia sen aihealueen osalta, josta se otetaan. Muussa tapauksessa vaarana on ylisovitus (malli tekee hyviä ennusteita vain sellaisista syöttötiedoista, jotka ovat hyvin samankaltaisia kuin koulutustiedot) tai vinoutumien käyttöönotto, mikä paitsi heikentää mallin yleistä sovellettavuutta ja suorituskykyä myös voi aiheuttaa eettisesti ongelmallisia tai muuten tahattomia sivuvaikutuksia.
GLAM-sektorilla on hyvät mahdollisuudet ottaa käyttöön tekoälyä ja rahanpesua siinä mielessä, että kuratoitua ja monipuolista dataa, joka on määrältään, laadultaan ja monimuotoisuudeltaan riittävää ja joka on peräisin digitaalisista kokoelmista (kuten Europeanan kokoamat ja toimittamat kokoelmat), on nyt laajalti saatavilla avoimilla lisensseillä. Tällä hetkellä puuttuu sellaisten GLAM-alan tietoaineistojen laajempi saatavuus, jotka soveltuvat suoraan käyttöön tekoälyn ja rahanpesun tutkimuksen ja kehittämisen yhteydessä. Tällaisten avointen data-aineistojen saatavuus voisi paitsi auttaa lisäämään sitoutumista digitaaliseen kulttuuriperintödataan tekoälyn ja rahanpesun alalla myös tukea tekoälyn ja rahanpesun viimeaikaisen kehityksen siirtämistä kulttuuriperinnön sisällön digitaalisen kuratoinnin ja analysoinnin alalle. Toisaalta tekoälyn ja rahanpesun edistyminen kulkee usein käsi kädessä uusien korkealaatuisten tietoaineistojen julkaisemisen kanssa.
EuropeanaTech pyytää näin ollen ehdotuksia sopivien tekoälyä ja rahanpesua koskevien tietoaineistojen kokoamiseksi Europeanan verkkosivustolla olevien laajojen kokoelmien pohjalta. Haemme ehdotuksia sellaisten suurten, hyvin dokumentoitujen tietoaineistojen luomiseksi, jotka on muotoiltu tekoälyn ja rahanpesun suoraa käyttöönottoa varten (kuten mallin kouluttaminen) ja jotka voidaan asettaa julkisesti saataville asiaankuuluvilla verkkoalustoilla avoimilla lisensseillä.
Myönnämme kahdelle voittaneelle ehdotukselle 2 500 euron rahoitustuen aineistojen tuottamiseen, dokumentointiin ja julkaisemiseen. Palkinnonsaajia pyydetään esittelemään panoksensa tulevassa Europeana-tapahtumassa (verkkotapahtumassa) ja toimittamaan julkaisuteksti, joka liittyy heidän tuotoksiinsa.
Näin haet
Hakemuksen voi tehdä tutustumalla alla oleviin hakuohjeisiin ja jättämällä ehdotuksen 15. helmikuuta 2021 klo 23.59 (Keski-Euroopan aikaa) mennessä. Ehdotuksissa tulisi kuvata alle 1 500 sanalla:
Aineiston aiottu sisältö (volyymin, omaisuustyyppien, huomautusten jne. osalta)
Menettely, jota aioit noudattaa tietoaineiston tuottamisessa
Miten se on merkityksellinen tekoälyn ja mikrobilääkeresistenssin kannalta?
Ehdotuksiin olisi myös sisällyttävä ehdotus mahdollisesta käyttötapauksesta, jota tuetaan esikoulutetulla mallilla ja sen tulosten demonstroinnilla tai arvioinnilla. Jos hakemus hyväksytään, tietoaineisto ja kaikki tarvittavat asiakirjat ja tekniset resurssit on voitava tuottaa ja luovuttaa ennen 30 päivää kesäkuuta 2021.
Euroopan kulttuuriperintökokoelmiin kohdistuu yleensä ennakkoluuloja, ja niihin liittyy eettisiä kysymyksiä. Vaikka tämä voi vaikuttaa kielteisesti tekoäly- ja koneoppimisratkaisuihin, tekoälyä ja koneoppimista voitaisiin käyttää myös näiden ongelmien paljastamiseen. Näitä kysymyksiä ei ehkä ratkaista tämän ehdotuspyynnön puitteissa, mutta suosittelemme dokumentoimaan ne ja keskustelemaan niistä.
Tietokokonaisuuksien on täytettävä seuraavat vaatimukset:
ne on poimittava Europeanan kautta toimitettuihin eri kokoelmiin sisältyvistä tiedoista;
Sisällytä vain metatiedot, jotka olet itse luonut tai jotka ovat peräisin Europeanasta. Tuloksena olevat metatiedot on lisensoitava Creative Commons Zero -lisenssillä.
ne on laadittava koneellisesti luettavassa muodossa, mukaan lukien asiakirjat ja lähtöisyys;
Sitä ei ole julkaistu aiemmin. Jos tiedot on julkaistu aiemmin, on esitettävä yksityiskohtaisesti, miten uutta tietoaineistoa on tarkoitus parantaa ja miten sitä on tarkoitus käyttää.
Sisällytetään kuvaus yhdestä tai useammasta tietoaineiston käyttötarkoituksesta.
Aineistot PITÄÄ:
Sisältää vain mediaresurssit, joiden lisenssi on yhteensopiva Europeana Publishing Frameworkin tason 3 sisällön kanssa;
Selvennetään suhdetta tekoälyn ja rahanpesun parhaisiin käytäntöihin ja uusimpaan teknologiaan digitaalisessa kulttuuriperinnössä ja edistetään niitä.
Sisällytetään mukaan esikoulutettu malli, joka on saatu soveltamalla (käyttämällä lähtötason ML/AI-menetelmää (jossakin) suunnitelluista käyttötapauksista) ja demo tämän mallin käytöstä tai sen tulosten arvioinnista.
Dokumentoi tai keskustele mahdollisista eettisistä kysymyksistä ja ennakkoluuloista.
Aineistot VOI:
sisällyttää suunnitelmaan lisäparannuksia ja -parannuksia, kuten tietojen merkinnät, merkinnät tai ristiviittaukset muihin (digitaalisiin) resursseihin, edellyttäen, että ne on saatu valmiiksi ennen tietoaineiston julkaisemista ja että asianmukaisia laadunvalvontatoimenpiteitä sovelletaan;
Muodosta osa julkaisua vertaisarvioidussa lehdessä tai konferenssissa.
Teknisten ratkaisujen perusdokumentaatio olisi toimitettava, ja kaikki tuotetut ohjelmistot on julkaistava avoimen lähdekoodin lisenssillä.
Keskeiset päivämäärät
Ehdotuspyyntö avautuu: tammikuuta 2021
Hakemusten jättämisen määräaika: helmikuuta 2021 klo 23.59 Keski-Euroopan aikaa
Hyväksymisilmoitukset: maaliskuuta 2021
Tietoaineiston julkaiseminen: kesäkuuta 2021
Myöntämisperusteet
EuropeanaTech AI tarkastelee ehdotuksia GLAM-työryhmässä ja EuropeanaTech-yhteisön ohjausryhmässä seuraavin perustein:
Käyttötapauksen merkitys GLAM-yhteisölle: 25%
Data-aineiston merkitys tekoälyn ja rahanpesun kannalta käyttötapauksen kannalta: 25%
Käyttötapauksen/demon selkeä määritelmä Europeanan osalta: 30%
Aineiston kuvauksen selkeys: 20%
Tukikelpoisuus
Muodollisesti varoja ei osoiteta yksityishenkilöille vaan laitoksille, jotka voivat olla kulttuuriperintöä tai tutkimuslaitoksia, joihin kuuluu yliopistoja. Kunkin palkitun toimielimen edustajaa pyydetään allekirjoittamaan alihankintasopimus Europeana-säätiön kanssa.
Hakijoiden on sijaittava jossakin EU:n jäsenvaltiossa.
Hakijoiden on oltava EuropeanaTech-yhteisön ja Europeana Network Associationin jäseniä. Jos et ole vielä jäsen, voit selvittää, miten voit liittyä.
Palkinto on bruttomäärä, joka sisältää näin ollen arvonlisäveron.
Europeana DSI-4 -hankekumppanit eivät voi saada rahoitusta. Täydellinen luettelo on saatavilla täällä.
Suositeltu lukeminen
Tätä sivua muokattiin 19.1.2021, jotta voitiin ottaa huomioon määräajan pidentäminen 31.1.2021–15. helmikuuta 2021. Sitä muokattiin 16.4.2021 vastaamaan pidennettyä määräaikaa, jonka kuluessa voittajien oli toimitettava tietonsa kesäkuuhun 2021 mennessä.
