Marco Rendina: Eirini, začněme od základů. Co je to crowdsourcing?
Eirini Kaldeliová: Crowdsourcing je proces distribuce úkolu skupině lidí, kteří obvykle přispívají prostřednictvím své práce online. V některých případech obdrží přispěvatelé hmotnou náhradu; u jiných je jejich účast dobrovolná, přičemž odměny jsou nevýznamné, jako je osobní spokojenost, kulturní přínos nebo získávání znalostí. V odvětví kulturního dědictví se crowdsourcing již dlouho využívá k řešení různých výzev, od sběru a přepisu obsahu až po označování sbírek a odhalování neobjektivních výrazů v popisu předmětů kulturního dědictví. V závislosti na povaze úkolu mohou účastníci potřebovat specializované dovednosti nebo znalosti.
MR: Jaké jsou přínosy crowdsourcingu pro odvětví kulturního dědictví?
EK: Zodpovědný a smysluplný crowdsourcingový projekt může přinést vzájemné výhody institucím a účastníkům kulturního dědictví. V první řadě by se k crowdsourcingu mělo přistupovat jako k prostředku, jak zapojit občany do sbírek kulturního dědictví. Na jedné straně mají účastníci možnost komunikovat s kulturním dědictvím a spojit se s ním; hravým způsobem získávat užitečné informace o předmětech a tématech; sdílet své názory a znalosti; spoluutvářet způsob prezentace sbírek; a spolupracovat se spoluobčany na participativních zkušenostech. Na druhé straně mohou instituce kulturního dědictví zlepšit kvalitu svých sbírek a učinit je objevitelnějšími a přístupnějšími; zvyšovat povědomí o svém kulturním dědictví; oslovit nové publikum; a získat hlubší vhled do toho, jak jsou jejich sbírky vnímány komunitami.
MR: Spyrosi, mohl byste nám říct pár slov o platformě CrowdHeritage, na které pracujete v rámci projektu AI4Culture?
Spyros Bekiaris: CrowdHeritage je otevřená platforma pro pořádání online crowdsourcingových kampaní, které mobilizují lidi ke zlepšení kvality sbírek kulturního dědictví. To by mohlo souviset s různými aspekty, od vícejazyčného pokrytí až po sémantické označování. Účastníci se vyzývají, aby obohatili digitální sbírky, a to buď vytvořením nových informací (např. přidáním geolokací), nebo vyhodnocením a validací automatických výstupů vytvořených digitálními nástroji (např. automatické překlady nebo detekce neobjektivního jazyka).
CrowdHeritage se hojně využívá ke stimulaci účasti ve vzdělávacím prostředí a prostředí občanské vědy zapojením komunit, včetně studentů a žáků, milovníků kultury, odborníků v oblasti kulturního dědictví a široké veřejnosti. Platforma byla dosud využita k uspořádání 40 crowdsourcingových kampaní s více než 970 jedinečnými přispěvateli, které vygenerovaly přibližně 112 000 anotací a vyhodnotily více než 16 000.
MR: Crowdsourcing je založen na distribuovaném manuálním úsilí, zatímco AI4Culture je o technologiích umělé inteligence. Můžete vysvětlit vztah mezi platformou CrowdHeritage a nástroji umělé inteligence?
SB: CrowdHeritage byl původně navržen tak, aby podporoval kampaně, které vyzývají uživatele k přidávání nových poznámek od nuly. V posledních několika letech vidíme rostoucí zájem o propojení CrowdHeritage s nástroji AI. Tyto nástroje nabízejí pozoruhodné příležitosti pro automatické zlepšování kvality sbírek digitálního kulturního dědictví ve velkém měřítku a s minimálním manuálním úsilím, od optického rozpoznávání znaků a strojového překladu až po automatické titulkování a klasifikaci obrazu.
Uchýlení se k čistě automatickým metodám však také odhalilo několik problémů, které je třeba řešit. Potřebujeme způsoby, jak posoudit, zda jsou výsledky algoritmů umělé inteligence dostatečně přesné pro naše standardy, a jak porovnat, jak se různé algoritmy chovají na konkrétních datech a na základě určitých kritérií. V této souvislosti je crowdsourcing vynikajícím prostředkem k využití kolektivní lidské inteligence a shromažďování užitečných poznatků. Získaná zpětná vazba nám může pomoci odfiltrovat nesprávné automatické výsledky, použít vhodné filtry pro zachování toho, co považujeme za kvalitní výsledky, a odhalit určité nedostatky algoritmů umělé inteligence. V této souhře s umělou inteligencí je platforma CrowdHeritage rovněž užitečná pro vytváření datových souborů pozemní pravdy, které lze dále využívat k přizpůsobení nástrojů umělé inteligence ve vztahu k datům kulturního dědictví.
MR: Eirini, můžete uvést některé konkrétní příklady toho, jak bylo CrowdHeritage aplikováno v kombinaci s nástroji umělé inteligence?
EK: Mohu poskytnout mnoho! V rámci projektu Europeana Translate jsme uspořádali řadu kampaní, v nichž účastníci vyhodnotili výsledky algoritmu strojového překladu vyškoleného na metadata Europeany (vyvinutého naším partnerem AI4Culture Pangeanic). Tato zpětná vazba nám umožnila zlepšit kvalitu výsledků a také vedla k vytvoření otevřených datových souborů zveřejněných v úložišti ELRC-SHARE, které shromažďuje jazykové zdroje v celé EU.
V další případové studii o výběru optimálních modelů Super Resolution (SR) pro různé typy obrázků (což velmi dobře znáte, Marco!) jsme ve spolupráci s Evropskou asociací módního dědictví (EFHA) vytvořili kampaň, v níž byli účastníci požádáni, aby porovnali a seřadili vzorek obrázků rozšířených o různé modely SR. Výsledky této kampaně umožnily agentuře EFHA vybrat a použít nejlepší algoritmus SR v závislosti na charakteristikách obrazu.
V rámci projektu CRAFTED byla uspořádána řada kampaní, jejichž cílem bylo vyhodnotit barvy automaticky identifikované algoritmy detekce barev umělé inteligence. Analýza shromážděné zpětné vazby nás vedla k závěru, že automatické algoritmy opakovaně identifikovaly některé konkrétní chybějící barvy a vynechaly některé stávající, což nám pomohlo zlepšit náš přístup k filtrování a vybrat nejlepší nastavení algoritmu.
V projektu DE-BIAS připravujeme sérii kampaní, v nichž budou komunity kontrolovat a vyhodnocovat pojmy označené automatickým nástrojem pro detekci předpojatosti jako obsahující hanlivý jazyk.
MR: To je opravdu zajímavé, Eirini, ale budou instituce kulturního dědictví moci využít platformu CrowdHeritage k vytvoření vlastních crowdsourcingových kampaní?
EK: Samozřejmě! Prostřednictvím projektu AI4Culture byla na platformě CrowdHeritage zpřístupněna nová funkce „redaktora kampaní“, která umožňuje komukoli nastavit a spustit crowdsourcingovou kampaň na platformě. Každý, kdo má zájem, se může podívat na tento video tutoriál nebo se podívat na dokumentaci CrowdHeritage a dozvědět se více!
Zjistit více
V září 2024 projekt spustí platformu, kde bude k dispozici soubor otevřených nástrojů online spolu se související dokumentací a školicími materiály. Sledujte stránku projektu na Europeana Pro pro více podrobností a zůstaňte naladěni na projekt LinkedIn a X účet!
