Marco Rendina: Eirini, začnimo z osnovami. Kaj je crowdsourcing?
Eirini Kaldeli: Crowdsourcing je proces distribucije naloge skupini ljudi, ki običajno prispevajo prek svojega dela na spletu. V nekaterih primerih prispevajoči prejmejo materialno nadomestilo; v drugih je njihova udeležba prostovoljna, nagrade pa niso pomembne, kot so osebno zadovoljstvo, kulturni prispevek ali pridobivanje znanja. V sektorju kulturne dediščine se množično financiranje že dolgo uporablja za reševanje različnih izzivov, od zbiranja vsebin in prepisovanja do označevanja zbirk in odkrivanja pristranskih izrazov v opisu predmetov kulturne dediščine. Glede na naravo naloge bodo udeleženci morda potrebovali specializirane spretnosti ali znanje.
MR: Kakšne so koristi črpanja iz množic za sektor kulturne dediščine?
EK: Odgovoren in smiseln projekt črpanja iz množic lahko ustanovam za varstvo kulturne dediščine in udeležencem prinese vzajemne koristi. Predvsem bi bilo treba k črpanju iz množic pristopiti kot k sredstvu za vključevanje državljanov v zbirke dediščine. Po eni strani imajo udeleženci možnost interakcije s kulturno dediščino in povezovanja z njo; se na igriv način naučite koristnih informacij o predmetih in temah; delijo svoje poglede in znanje; sooblikovati način predstavitve zbirk; in sodelovanje s sodržavljani v participativni izkušnji. Po drugi strani pa lahko ustanove za varstvo kulturne dediščine izboljšajo kakovost svojih zbirk ter poskrbijo, da jih bo lažje najti in da bodo dostopnejše; ozaveščajo o svoji kulturni dediščini; doseganje novega občinstva; in pridobiti globlji vpogled v to, kako skupnosti dojemajo njihove zbirke.
MR: Spyros, nam lahko poveste nekaj besed o platformi CrowdHeritage, na kateri delate v okviru projekta AI4Culture?
Spyros Bekiaris: CrowdHeritage je odprta platforma za organizacijo spletnih kampanj množičnega financiranja, ki mobilizirajo ljudi za izboljšanje kakovosti zbirk kulturne dediščine. To je lahko povezano z različnimi vidiki, od večjezične pokritosti do semantičnega označevanja. Udeleženci so vabljeni, da obogatijo digitalne zbirke bodisi s pripravo novih informacij (npr. dodajanjem geolokacij) bodisi z ocenjevanjem in potrjevanjem samodejnih rezultatov, ki jih ustvarijo digitalna orodja (npr. samodejni prevodi ali odkrivanje pristranskega jezika).
CrowdHeritage se v veliki meri uporablja za spodbujanje udeležbe v izobraževalnih okoljih in okoljih ljubiteljske znanosti z vključevanjem skupnosti, vključno s študenti in učenci, ljubitelji kulture, strokovnjaki za kulturno dediščino in širšo javnostjo. Platforma je bila doslej uporabljena za organizacijo 40 kampanj množičnega financiranja z več kot 970 edinstvenimi sodelujočimi, ki so ustvarile približno 112 000 pripomb in ocenile več kot 16 000.
MR: Crowdsourcing temelji na porazdeljenem ročnem delu, AI4Culture pa na tehnologijah umetne inteligence. Ali lahko pojasnite razmerje med platformo CrowdHeritage in orodji umetne inteligence?
Št. predl.: CrowdHeritage je bil prvotno zasnovan za podporo oglaševalskim akcijam, ki uporabnike vabijo k dodajanju novih opomb iz nič. V zadnjih nekaj letih opažamo vse večje zanimanje za povezovanje CrowdHeritage z orodji umetne inteligence. Takšna orodja ponujajo izjemne priložnosti za samodejno izboljšanje kakovosti digitalnih zbirk kulturne dediščine v velikem obsegu in z minimalnim ročnim naporom, od optičnega prepoznavanja znakov in strojnega prevajanja do samodejnega podnaslavljanja in klasifikacije slik.
Vendar pa je uporaba izključno samodejnih metod razkrila tudi več vprašanj, ki jih je treba obravnavati. Potrebujemo načine, da ocenimo, ali so rezultati algoritmov umetne inteligence dovolj natančni za naše standarde, in primerjamo, kako se različni algoritmi obnašajo na podlagi specifičnih podatkov in določenih meril. V tem okviru je črpanje iz množic odlično sredstvo za izkoriščanje kolektivne človeške inteligence in zbiranje koristnih vpogledov. Pridobljene povratne informacije nam lahko pomagajo pri filtriranju nepravilnih samodejnih rezultatov, uporabi ustreznih filtrov za ohranjanje rezultatov, ki se nam zdijo kakovostni, in odkrivanju nekaterih pomanjkljivosti algoritmov umetne inteligence. V tem medsebojnem delovanju z umetno inteligenco je platforma CrowdHeritage koristna tudi za pripravo naborov podatkov o zemeljski resnici, ki jih je mogoče nadalje izkoristiti za prilagoditev orodij umetne inteligence v zvezi s podatki o kulturni dediščini.
MR: Eirini, ali lahko navedete nekaj konkretnih primerov uporabe CrowdHeritage v kombinaciji z orodji umetne inteligence?
EK: Lahko jih dam veliko! V okviru projekta Europeana Translate smo izvedli številne kampanje, v katerih so udeleženci ocenili rezultate algoritma strojnega prevajanja, ki je bil usposobljen na podlagi metapodatkov Europeane (ki ga je razvil naš partner AI4Culture Pangeanic). Te povratne informacije so nam omogočile, da smo izboljšali kakovost rezultatov, privedle pa so tudi do oblikovanja odprtih naborov podatkov, objavljenih v repozitoriju ELRC-SHARE, v katerem so zbrani jezikovni viri po vsej EU.
V drugi študiji primera o izbiri optimalnih modelov Super Resolution (SR) za različne vrste slik (ki jih zelo dobro poznate, Marco!) smo v sodelovanju z Evropskim združenjem za modno dediščino (EFHA) pripravili kampanjo, v kateri so udeležence pozvali, naj primerjajo in razvrstijo vzorec slik, ki so jih nadgradili različni modeli SR. Rezultati te kampanje so EFHA omogočili, da izbere in uporabi najboljši algoritem SR glede na značilnosti slike.
V okviru projekta CRAFTED je bila organizirana vrsta kampanj za ocenjevanje barv, ki jih samodejno prepoznajo algoritmi za zaznavanje barv umetne inteligence. Analiza zbranih povratnih informacij nas je pripeljala do zaključka, da so avtomatski algoritmi večkrat identificirali nekatere specifične odsotne barve in zamudili nekatere obstoječe, kar nam je pomagalo izboljšati naš pristop filtriranja in izbrati najboljšo nastavitev algoritma.
V projektu DE-BIAS pripravljamo vrsto kampanj, v okviru katerih bodo skupnosti pregledale in ocenile izraze, ki so z orodjem za samodejno odkrivanje pristranskosti označeni kot izrazi, ki vsebujejo žaljiv jezik.
MR: To je res zanimivo, Eirini, toda ali bodo lahko ustanove za varstvo kulturne dediščine platformo CrowdHeritage uporabile za pripravo lastnih kampanj črpanja iz množic?
EK: Seveda! S projektom AI4Culture je bila na platformi CrowdHeritage na voljo nova funkcija „urednika kampanje“, ki vsakomur omogoča, da na platformi vzpostavi in vodi kampanjo množičnega financiranja. Vsakdo, ki ga zanima, si lahko ogleda ta video tutorial ali si ogleda dokumentacijo CrowdHeritage, če želi izvedeti več!
Izvedite več
Septembra 2024 bo v okviru projekta vzpostavljena platforma, na kateri bo na spletu na voljo sklop odprtih orodij, skupaj s povezano dokumentacijo in gradivom za usposabljanje. Bodite pozorni na stran projekta na Europeana Pro za več podrobnosti in ostanite na tekočem s projektom LinkedIn in X račun!
