Tekoälyn ja koneoppimisen alan menetelmät ovat auttaneet ylittämään teknologisia rajoja eri aloilla, myös kulttuuriperinnön alalla (esimerkkejä tästä ovat EuropeanaTech AI:n väliraportti GLAM-työryhmästä ja AI4LAM-aloite). Edistääkseen innovointia tällä alalla EuropeanaTech julkisti muutama viikko sitten ensimmäisen haasteensa Europeana AI/ML -datajoukoille. Tällä uudella toimella halusimme edistää sellaisten data-aineistojen luomista GLAM-sektorille, joita voidaan käyttää tekoälyyn ja rahanpesuun, hyödyntäen Europeanassa saatavilla olevia rikkaita kulttuuriperintöresursseja. Toivomme, että tällaisten tietoaineistojen saatavuus voisi auttaa lisäämään sitoutumista digitaaliseen kulttuuriperintödataan tekoälyn ja rahanpesun alalla ja tukea tekoälyn ja rahanpesun viimeaikaisen kehityksen siirtämistä kulttuuriperinnön sisällön digitaalisen kuratoinnin ja analysoinnin alalle.
Tilintarkastustuomioistuin sai yhteensä viisi ehdotusta, joita EuropeanaTech-ohjausryhmän jäsenet ja tekoälytyöryhmä tarkastelivat huolellisesti GLAM-työryhmän yhteydessä. He arvioivat ehdotuksia sen perusteella, miten merkityksellisiä ne ovat GLAM-alan kannalta (25 %), tekoälyn ja rahanpesun kannalta (25 %), suhteessa Europeanaan (30 %) sekä kuvauksen ja työsuunnitelman selkeyden perusteella (20 %).
Voittajien julkistaminen
Nimetyt entiteetit arkeologisissa teksteissä
Tämän Napolin yliopistossa toimivan L'Orientale-ryhmän ehdotuksen tarkoituksena on luoda Europeana Archeology -kokoelmaan tietoaineisto italian- ja englanninkielisiä arkeologisia termejä varten nimettyjen yhteisöjen tunnustamista (NER) ja termien uuttamista varten. NER on prosessi, jossa tunnistetaan nimiä, kuten henkilöiden nimiä tai sijainteja strukturoimattomassa tekstissä. Termi louhinta on samanlainen, mutta keskittyy etsimään erikoistuneita termejä, tässä tapauksessa arkeologian alalla. Vocabularies kuten Getty ja CIDOC CRM harkitaan. Lopullista data-aineistoa voitaisiin käyttää tekoälyyn ja rahanpesun torjuntaan perustuvien teknologioiden kehittämisessä ja arvioinnissa NER:iä varten arkeologian alalla.
Arvioijat arvostivat erityisesti ehdotuksen selkeää rakennetta ja kypsyyttä. Ehdotusta varten tehtiin jo mallidatajoukko, jossa käytettiin Europeanan sovellusrajapintoja ehdotetun lähestymistavan testaamiseksi. Erityisen arvokkaana pidettiin myös arkeologian alan kaksikielisyyttä ja samankaltaisten avointen resurssien niukkuutta.
Zac Grace
Tämän Ecole Nationale d'Ingénieurs de Tarbes -oppilaan ehdotuksen tarkoituksena on luoda pikselimaskeja semanttiseen segmentointiin tekemällä käsin huomautuksia Europeana Fashion -kokoelman kuvatiedoista. Tämä tarkoittaa esimerkiksi sitä, että kun kuvaa analysoidaan, kuvassa olevat asiaankuuluvat muotielementit (paita, housut, kengät) merkitään sitten pikselin ääriviivoilla. Näitä tietoja voidaan käyttää automatisoidun segmentointijärjestelmän kouluttamiseen.

Arvioijat pitivät ehdotuksen täytäntöönpanon edellyttämän työn selkeää laajuutta ja ymmärtämistä hyvänä asiana. He ajattelivat myös, että sillä oli paljon mahdollisuuksia soveltaa eri kokoelmissa.
Riita-asiat Corpus
Tämä yhteinen ehdotus KNAW Humanities Cluster ja Centrum Wiskunde & Informatica Alankomaissa haluaa luoda selityksin varustettu korpus kiistanalaisia termejä yhteydessä (ConConCor) hollantilaisten sanomalehtien Europeana. Niitä voidaan sitten käyttää käynnistämään ja arvioimaan (puoli)automaattisia menetelmiä tällaisten termien havaitsemiseksi kulttuuriperintökokoelmissa. Kiistanalaiset termit tarkoittavat tässä sanoja tai lauseita, jotka viittaavat johonkin (implisiittiseen tai eksplisiittiseen) puolueellisuuteen ryhmää, tapahtumaa tai muuta kohtaan tai sitä vastaan.
Arvioijat arvostivat sitä, miten tällä ehdotuksella pyritään vastaamaan haasteen keskeiseen tavoitteeseen eli digitaalisiin kulttuuriperintökokoelmiin liittyvien eettisten kysymysten ja vinoutumien havaitsemiseen.
Kolme 2 500 euron stipendiä annetaan voittajien käyttöön, jotta he voivat toteuttaa ehdotuksensa ja toimittaa niiden mukaiset tietoaineistot kesäkuun 2021 loppuun mennessä.
Lue lisää
Haluamme osoittaa kiitollisuutemme kaikille, jotka esittivät tähän haasteeseen ehdotuksen kovasta työstään ja erinomaisista ideoistaan. Odotamme innolla voittavien hankkeiden toteuttamista ja toivomme, että tulevaisuudessa avautuu uusi kierros niille, jotka eivät tällä kertaa menestyneet!
Jos haluat kuulla lisää tämänkaltaisista mahdollisuuksista ja verkostoitua ja tehdä yhteistyötä eri puolilta maailmaa tulevien monialaisten teknisten ammattilaisten kanssa, liity EuropeanaTechiin Europeana Network Associationin kautta ja seuraa yhteisöä Twitterissä.
Tätä julkaisua muokattiin 16.4.2021, jotta se kuvastaisi pidennettyä määräaikaa, johon mennessä voittajien on toimitettava tietoaineistonsa.
