Marco Rendina: Eirini, začnime od základov. Čo je crowdsourcing?
Eirini Kaldeli: Crowdsourcing je proces distribúcie úlohy skupine ľudí, ktorí zvyčajne prispievajú prostredníctvom svojej práce online. V niektorých prípadoch prispievatelia dostávajú materiálnu náhradu; v iných je ich účasť dobrovoľná, pričom odmeny sú nepodstatné, ako je osobná spokojnosť, kultúrny prínos alebo získavanie vedomostí. V sektore kultúrneho dedičstva sa crowdsourcing už dlho používa na riešenie rôznych výziev, od zberu a prepisu obsahu až po označovanie zbierok a odhaľovanie neobjektívnych pojmov v opise predmetov kultúrneho dedičstva. V závislosti od povahy úlohy môžu účastníci potrebovať špecializované zručnosti alebo znalosti.
MR: Aké sú výhody crowdsourcingu pre odvetvie kultúrneho dedičstva?
EK: Zodpovedný a zmysluplný projekt crowdsourcingu môže inštitúciám a účastníkom v oblasti kultúrneho dedičstva priniesť vzájomné výhody. V prvom rade by sa malo pristupovať k crowdsourcingu ako k prostriedku na zapojenie občanov do zbierok kultúrneho dedičstva. Na jednej strane majú účastníci možnosť komunikovať s kultúrnym dedičstvom a spojiť sa s ním; naučiť sa užitočné informácie o predmetoch a témach hravým spôsobom; podeliť sa o svoje názory a poznatky; spoluvytvárať spôsob prezentácie zbierok; a spolupracovať so spoluobčanmi na participatívnej skúsenosti. Na druhej strane môžu inštitúcie správy kultúrneho dedičstva zlepšiť kvalitu svojich zbierok a zlepšiť ich vyhľadateľnosť a prístupnosť; zvyšovať informovanosť o svojich aktívach kultúrneho dedičstva; osloviť nové publikum; a získať hlbší pohľad na to, ako komunity vnímajú ich zbierky.
MR: Spyros, mohli by ste nám povedať pár slov o platforme CrowdHeritage, na ktorej pracujete v kontexte projektu AI4Culture?
Spyros Bekiaris: CrowdHeritage je otvorená platforma na organizovanie online crowdsourcingových kampaní, ktoré mobilizujú ľudí na zlepšenie kvality zbierok kultúrneho dedičstva. Mohlo by to súvisieť s rôznymi aspektmi, od viacjazyčného pokrytia až po sémantické označovanie. Účastníci sa vyzývajú, aby obohatili digitálne zbierky, a to buď vypracovaním nových informácií (napr. pridaním geolokalizácií), alebo vyhodnotením a validáciou automatických výstupov vytvorených digitálnymi nástrojmi (napr. automatickým prekladom alebo odhalením neobjektívneho jazyka).
CrowdHeritage sa vo veľkej miere využíva na stimulovanie účasti na vzdelávacích prostrediach a prostrediach občianskej vedy zapojením komunít vrátane študentov a žiakov, milovníkov kultúry, odborníkov v oblasti kultúrneho dedičstva a širokej verejnosti. Platforma sa doteraz používala na organizovanie 40 crowdsourcingových kampaní s viac ako 970 jedinečnými prispievateľmi, ktoré generovali približne 112 000 poznámok a hodnotili viac ako 16 000.
MR: Crowdsourcing je založený na distribuovanom manuálnom úsilí, zatiaľ čo AI4Culture je o technológiách umelej inteligencie. Môžete vysvetliť vzťah medzi platformou CrowdHeritage a nástrojmi umelej inteligencie?
SB: CrowdHeritage bol pôvodne navrhnutý na podporu kampaní, ktoré vyzývajú používateľov na pridávanie nových poznámok od začiatku. V posledných rokoch sme svedkami rastúceho záujmu o prepojenie CrowdHeritage s nástrojmi umelej inteligencie. Takéto nástroje ponúkajú pozoruhodné príležitosti na automatické zlepšovanie kvality zbierok digitálneho kultúrneho dedičstva vo veľkom rozsahu a s minimálnym manuálnym úsilím, od optického rozpoznávania znakov a strojového prekladu až po automatické titulkovanie a klasifikáciu obrázkov.
Použitie čisto automatických metód však odhalilo aj niekoľko problémov, ktoré je potrebné riešiť. Potrebujeme spôsoby, ako posúdiť, či sú výsledky algoritmov umelej inteligencie dostatočne presné pre naše normy, a porovnať, ako sa rôzne algoritmy správajú na základe konkrétnych údajov a na základe určitých kritérií. V tejto súvislosti je crowdsourcing vynikajúcim prostriedkom na využitie kolektívnej ľudskej inteligencie a zhromažďovanie užitočných poznatkov. Získaná spätná väzba nám môže pomôcť odfiltrovať nesprávne automatické výsledky, použiť vhodné filtre na zachovanie toho, čo považujeme za kvalitné výsledky, a odhaliť určité nedostatky algoritmov umelej inteligencie. V tejto súhre s umelou inteligenciou je platforma CrowdHeritage užitočná aj pri vytváraní súborov údajov o pravde na zemi, ktoré možno ďalej využívať na prispôsobenie nástrojov umelej inteligencie v súvislosti s údajmi o kultúrnom dedičstve.
MR: Eirini, môžete uviesť niekoľko konkrétnych príkladov toho, ako sa CrowdHeritage používa v kombinácii s nástrojmi umelej inteligencie?
EK: Môžem poskytnúť veľa! V rámci projektu Europeana Translate sme uskutočnili niekoľko kampaní, v ktorých účastníci vyhodnotili výsledky algoritmu strojového prekladu vyškoleného na metaúdaje Europeany (vyvinutého naším partnerom AI4Culture Pangeanic). Táto spätná väzba nám umožnila zlepšiť kvalitu výsledkov a viedla aj k vytvoreniu otvorených súborov údajov uverejnených v archíve ELRC-SHARE, ktorý zhromažďuje jazykové zdroje v celej EÚ.
V ďalšej prípadovej štúdii o výbere optimálnych modelov Super Resolution (SR) pre rôzne typy obrázkov (ktoré veľmi dobre poznáte, Marco!) sme v spolupráci s Európskou asociáciou pre módne dedičstvo (EFHA) vytvorili kampaň, v ktorej boli účastníci požiadaní, aby porovnali a zoradili vzorku obrázkov upravených rôznymi modelmi SR. Výsledky tejto kampane umožnili EFHA vybrať a použiť najlepší algoritmus SR v závislosti od charakteristík obrazu.
V rámci projektu CRAFTED sa zorganizovala séria kampaní na hodnotenie farieb automaticky identifikovaných algoritmami detekcie farieb umelej inteligencie. Analýza získanej spätnej väzby nás viedla k záveru, že automatické algoritmy opakovane identifikovali niektoré konkrétne chýbajúce farby a vynechali niektoré existujúce, čo nám pomohlo zlepšiť náš prístup k filtrovaniu a vybrať najlepšie nastavenie algoritmu.
V rámci projektu DE-BIAS pripravujeme sériu kampaní, v rámci ktorých budú komunity kontrolovať a vyhodnocovať pojmy označené automatickým nástrojom na detekciu zaujatosti ako pojmy obsahujúce hanlivý jazyk.
MR: Je to naozaj zaujímavé, Eirini, ale budú môcť inštitúcie správy kultúrneho dedičstva využívať platformu CrowdHeritage na vytváranie vlastných crowdsourcingových kampaní?
EK: Samozrejme! Prostredníctvom projektu AI4Culture bola na platforme CrowdHeritage sprístupnená nová funkcia editora kampaní, ktorá každému umožňuje vytvoriť a spustiť na platforme kampaň crowdsourcingu. Každý, kto má záujem, sa môže pozrieť na tento video tutoriál alebo sa pozrieť na dokumentáciu CrowdHeritage a dozvedieť sa viac!
Ďalšie informácie
V septembri 2024 sa v rámci projektu spustí platforma, na ktorej bude online k dispozícii súbor otvorených nástrojov spolu so súvisiacou dokumentáciou a školiacimi materiálmi. Podrobnejšie informácie nájdete na stránke projektu Europeana Pro a pozrite sa na účet LinkedIn a X projektu.
