Marco Rendina: Eirini, aloitetaan perusasioista. Mitä on crowdsourcing?
Eirini Kaldeli: Joukkoistaminen on prosessi, jossa tehtävä jaetaan ihmisryhmälle, joka yleensä osallistuu työhönsä verkossa. Joissakin tapauksissa rahoittajat saavat aineellista korvausta; toisissa taas osallistuminen on vapaaehtoista, ja palkkiot ovat epäolennaisia, kuten henkilökohtainen tyytyväisyys, kulttuurinen panos tai tietämyksen hankkiminen. Kulttuuriperinnön alalla joukkoistamista on jo pitkään käytetty erilaisten haasteiden ratkaisemiseen sisällön keräämisestä ja transkriptiosta kokoelmien merkitsemiseen ja vääristyneiden termien havaitsemiseen kulttuuriperintökohteiden kuvauksessa. Tehtävän luonteesta riippuen osallistujat saattavat tarvita erityistaitoja tai -tietoja.
MR: Mitä hyötyä joukkoistamisesta on kulttuuriperintöalalle?
EK: Vastuullinen ja mielekäs joukkoistamishanke voi tuoda molemminpuolista hyötyä kulttuuriperintölaitoksille ja -osallistujille. Ennen kaikkea joukkoistamista olisi pidettävä keinona saada kansalaiset mukaan kulttuuriperintökokoelmiin. Yhtäältä osallistujilla on mahdollisuus olla vuorovaikutuksessa kulttuuriperinnön kanssa ja olla yhteydessä siihen. oppia hyödyllistä tietoa asioista ja aiheista leikkisällä tavalla; jakaa näkemyksiään ja tietämystään; muotoilla yhdessä kokoelmien esitystapaa; ja tehdä yhteistyötä muiden kansalaisten kanssa osallistavassa kokemuksessa. Toisaalta kulttuuriperintölaitokset voivat parantaa kokoelmiensa laatua ja tehdä niistä helpommin löydettäviä ja saavutettavia. lisätä tietoisuutta kulttuuriperintöomaisuudestaan; tavoittaa uusia yleisöjä; ja saada syvempää tietoa siitä, miten yhteisöt mieltävät heidän kokoelmansa.
MR: Spyros, voisitko kertoa meille muutaman sanan CrowdHeritage-alustasta, jota työskentelet AI4Culture-hankkeen yhteydessä?
Spyros Bekiaris: CrowdHeritage on avoin foorumi, jolla järjestetään verkossa joukkoistamiskampanjoita, joilla ihmisiä saadaan parantamaan kulttuuriperintökokoelmien laatua. Tämä voisi liittyä eri näkökohtiin monikielisestä kattavuudesta semanttiseen merkitsemiseen. Osallistujia pyydetään rikastamaan digitaalisia kokoelmia joko tuottamalla uutta tietoa (esim. lisäämällä maantieteelliset sijainnit) tai arvioimalla ja validoimalla digitaalisten välineiden tuottamia automaattisia tuotoksia (esim. automaattiset käännökset tai puolueellisen kielen havaitseminen).
CrowdHeritagea on käytetty laajasti kannustamaan osallistumista koulutusympäristöihin ja kansalaistiedeympäristöihin osallistamalla yhteisöjä, kuten opiskelijoita ja oppilaita, kulttuurin ystäviä, kulttuuriperinnön ammattilaisia ja suurta yleisöä. Alustaa on tähän mennessä käytetty 40 joukkoistamiskampanjan järjestämiseen, joissa on yli 970 ainutlaatuista osallistujaa, jotka tuottavat noin 112 000 huomautusta ja arvioivat yli 16 000.
MR: Joukkoistaminen perustuu hajautettuun manuaaliseen työhön, kun taas AI4Culturessa on kyse tekoälyteknologioista. Voitko selittää CrowdHeritage-alustan ja tekoälytyökalujen välisen suhteen?
SB: CrowdHeritage suunniteltiin alun perin tukemaan kampanjoita, jotka kutsuvat käyttäjiä lisäämään uusia huomautuksia tyhjästä. Viime vuosina olemme nähneet kasvavaa kiinnostusta yhdistää CrowdHeritage tekoälytyökaluihin. Tällaiset välineet tarjoavat merkittäviä mahdollisuuksia parantaa automaattisesti digitaalisen kulttuuriperinnön kokoelmien laatua laajamittaisesti ja mahdollisimman pienellä manuaalisella työllä optisesta hahmontunnistuksesta ja konekääntämisestä automaattiseen tekstitykseen ja kuvaluokitukseen.
Puhtaasti automaattisiin menetelmiin turvautuminen on kuitenkin myös paljastanut useita kysymyksiä, joita on käsiteltävä. Tarvitsemme tapoja arvioida, ovatko tekoälyalgoritmien tulokset riittävän tarkkoja standardeihimme nähden, ja verrata sitä, miten eri algoritmit käyttäytyvät tiettyjen tietojen ja tiettyjen kriteerien perusteella. Tässä yhteydessä joukkoistaminen on erinomainen keino hyödyntää kollektiivista ihmisälyä ja kerätä hyödyllisiä oivalluksia. Kertynyt palaute voi auttaa meitä suodattamaan virheelliset automaattiset tulokset, käyttämään asianmukaisia suodattimia laadukkaiden tulosten ylläpitämiseksi ja havaitsemaan tiettyjä AI-algoritmien puutteita. Tässä vuorovaikutuksessa tekoälyn kanssa CrowdHeritage-alusta on hyödyllinen myös sellaisten totuutta koskevien tietoaineistojen tuottamisessa, joita voidaan hyödyntää edelleen tekoälyvälineiden mukauttamisessa kulttuuriperintötietoihin.
MR: Eirini, voitko antaa konkreettisia esimerkkejä siitä, miten CrowdHeritagea on sovellettu yhdessä tekoälytyökalujen kanssa?
EK: Voin tarjota monia! Europeana Translate -hankkeen yhteydessä järjestimme useita kampanjoita, joissa osallistujat arvioivat Europeanan metadataan koulutetun konekäännösalgoritmin (jonka on kehittänyt AI4Culture-kumppanimme Pangeanic) tuloksia. Tämän palautteen avulla pystyimme parantamaan tulosten laatua ja luomaan avoimia tietoaineistoja, jotka on julkaistu ELRC-SHARE-tietokannassa, johon on koottu kieliresursseja eri puolilta EU:ta.
Toisessa tapaustutkimuksessa, joka koski optimaalisten Super Resolution (SR) -mallien valitsemista eri kuvatyypeille (jonka tiedät hyvin, Marco!), perustimme yhteistyössä Euroopan muotiperintöyhdistyksen (EFHA) kanssa kampanjan, jossa osallistujia pyydettiin vertaamaan ja luokittelemaan otos eri SR-mallien skaalatuista kuvista. Tämän kampanjan tulosten perusteella EFHA pystyi valitsemaan ja soveltamaan parasta SR-algoritmia kuvan ominaisuuksien mukaan.
CRAFTED-hankkeen puitteissa järjestettiin useita kampanjoita, joissa arvioitiin tekoälyn värintunnistusalgoritmeilla automaattisesti tunnistettavia värejä. Kerätyn palautteen analyysi johti meidät siihen johtopäätökseen, että automaattiset algoritmit tunnistivat toistuvasti tiettyjä puuttuvia värejä ja jäivät joistakin olemassa olevista, mikä auttoi meitä parantamaan suodatusmenetelmäämme ja valitsemaan parhaan algoritmin.
DE-BIAS-hankkeessa olemme käynnistämässä useita kampanjoita, joissa yhteisöt tarkastavat ja arvioivat automaattisella vinoutumien havaitsemisvälineellä merkittyjä termejä, jotka sisältävät halventavaa kieltä.
MR: Se on todella mielenkiintoista, Eirini, mutta voivatko kulttuuriperintölaitokset käyttää CrowdHeritage-alustaa omien joukkoistamiskampanjoidensa järjestämiseen?
EK: Tietenkin! AI4Culture-hankkeen kautta CrowdHeritageen on lisätty uusi kampanjaeditori, jonka avulla kuka tahansa voi käynnistää ja toteuttaa joukkoistamiskampanjan alustalla. Kaikki kiinnostuneet voivat tutustua tähän video-oppaaseen tai tutustua CrowdHeritage-dokumentaatioon oppiakseen lisää!
Lue lisää
Syyskuussa 2024 hankkeessa käynnistetään alusta, jolla verkossa asetetaan saataville joukko avoimia välineitä sekä niihin liittyvää dokumentaatiota ja koulutusmateriaalia. Seuraa Europeana Pron projektisivua saadaksesi lisätietoja ja pysy ajan tasalla projektin LinkedIn- ja X-tilistä!
