Monikielisyysstrategia
Europeanassa olemme työskennelleet useiden vuosien ajan digitaalisen kulttuuriperinnön monikielisen saatavuuden mahdollistamiseksi esimerkiksi hyödyntämällä monikielistä linkitettyä avointa dataa metadatan rikastamiseksi. Se on ollut yhteisöllinen hanke: Europeana-säätiöllä on oma osuutensa, mutta myös datan toimittajien työ on ratkaisevan tärkeää. Tämä edellyttää asianmukaista pitkän aikavälin strategiaa ja avointa lähestymistapaa tavoitteiden ja jatkuvien toimien jakamiseen.
EuropeanaTech julkaisi vuonna 2016 monikielistä saatavuutta koskevista parhaista käytännöistä valkoisen kirjan, jossa hahmoteltiin alan haasteita ja esitettiin ideoita niiden ratkaisemiseksi. Europeana DSI -hankkeessa vuonna 2020 julkaisimme tämän valkoisen kirjan pohjalta uuden monikielisen strategian ja etenemissuunnitelman. Tässä asiakirjassa esitetään ehdotuksia monikielisyyden käsittelemiseksi kolmen yleisen käyttöskenaarion yhteydessä: Etsi, navigoi ja lue. Siinä esitetään, miten Europeanan objektien metadataa, kokotekstisisältöä, toimituksellista sisältöä ja käyttöliittymää voidaan rikastaa monikielisillä resursseilla ja/tai kääntää automaattisesti paremman käyttökokemuksen tarjoamiseksi, ja ehdotetaan kokeilujen ja toteutusten etenemissuunnitelmaa.
Sekä vuoden 2016 valkoinen kirja että strategian varhainen versio annettiin palautetta varten ja jaettiin EuropeanaTech-yhteisölle. Strategiassa hyödynnettiin myös keskusteluja, joita käytiin EU:n puheenjohtajavaltion Suomen järjestämässä digitaalisen kulttuuriperinnön monikielisyyttä käsitelleessä tapahtumassa (ks. koko raportti täällä).
EuropeanaTech Insight ja tulevaisuuden suunnitelmat
Tänään haluamme kiinnittää huomionne näihin aiheisiin uudessa EuropeanaTech Insight -julkaisussa, joka käsittelee monikielisyyttä digitaalisessa kulttuuriperinnössä. Tämä kysymys sisältää kolme asiakirjaa, joissa esitellään ongelmia ja keskeisiä teknologioita, joita Europeanan ja laajemman kulttuuriperintöalan olisi tutkittava, jotta kokoelmat ja käyttäjät voitaisiin yhdistää paremmin eri kieliin. Tähän sisältyy viimeaikainen edistyminen automaattisessa käännöstekniikassa ja se, miten tätä teknologiaa voidaan käyttää hakuihin kulttuuriperintörekistereistä. Lue EuropeanaTech Insight -julkaisu.
Tulevina kuukausina jatkamme näitä toimia ja keskitymme tutkimaan, miten Europeana voi käyttää eTranslationin kaltaisia automaattisia käännösjärjestelmiä, jotka hyötyvät tekoälyyn perustuvan kieliteknologian viimeaikaisesta kehityksestä. Automaattista kääntämistä ja Europeanaa koskeva hanke on hiljattain valittu yhteisrahoitettavaksi Verkkojen Eurooppa -välineen vuoden 2020 televiestintäalan automatisoitua kääntämistä koskevassa ehdotuspyynnössä, ja pidämme sinut ajan tasalla Europeana Pro -uutisten kautta !
Osallistu
Kuten kaikki koneoppimiseen perustuvat järjestelmät, Euroopan komission tarjoaman eTranslation-palvelun laatu riippuu sen kouluttamisessa käytettävien tietojen laadusta. Mitä enemmän kulttuuriperintöä koskevaa tietoa on saatavilla sen koulutusta varten, sitä paremmin se toimii alallamme, minkä vuoksi tietojen syöttäminen on aina enemmän kuin tervetullutta. Aiempi eTranslationin monikielistä dataa koskeva ehdotuspyyntömme on edelleen avoinna, ja pyydämme Teitä toimittamaan ehdotuksia äskettäin käynnistettyyn EuropeanaTech Challenge -haasteeseen, jossa pyydetään datajoukkoja, jotka soveltuvat käytettäviksi tekoälyn / koneoppimisen tutkimuksessa ja kehittämisessä (ja joihin luonnollisesti sisältyy kieliteknologiaan liittyviä toimia).
Voit vaihtaa ajatuksia, vastaanottaa uutisia ja verkostoitua alan asiantuntijoiden sekä kulttuuriperintöalan tutkimuksen ja kehittämisen kanssa liittymällä EuropeanaTech-yhteisöön.
