Marco Rendina: Eirini, lad os starte med det grundlæggende. Hvad er crowdsourcing?
Eirini Kaldeli: Crowdsourcing er processen med at distribuere en opgave til en gruppe af mennesker, der normalt bidrager gennem deres arbejde online. I nogle tilfælde modtager bidragyderne væsentlig kompensation. i andre er deres deltagelse frivillig, og belønninger er uvæsentlige, f.eks. personlig tilfredshed, kulturelt bidrag eller erhvervelse af viden. Inden for kulturarvssektoren har crowdsourcing længe været anvendt til at tackle forskellige udfordringer, fra indsamling og transskription af indhold til mærkning af samlinger og afsløring af forudindtagede udtryk i beskrivelsen af kulturarvsgenstande. Afhængigt af opgavens art kan deltagerne have brug for specialiserede færdigheder eller viden.
MR: Hvad er fordelene ved crowdsourcing for kulturarvssektoren?
EK: Et ansvarligt og meningsfuldt crowdsourcing-projekt kan skabe gensidige fordele for kulturarvsinstitutioner og -deltagere. Først og fremmest bør crowdsourcing gribes an som et middel til at engagere borgerne i kulturarvssamlinger. På den ene side har deltagerne mulighed for at interagere med kulturarven og forbinde sig med den. lære nyttige oplysninger om emner og emner på en legende måde; dele deres perspektiver og viden være med til at forme præsentationen af samlinger og samarbejde med medborgere i en deltagelsesbaseret oplevelse. På den anden side kan kulturarvsinstitutioner forbedre kvaliteten af deres samlinger og gøre dem mere synlige og tilgængelige; øge bevidstheden om deres kulturarvsaktiver nå ud til et nyt publikum og få dybere indsigt i, hvordan deres samlinger opfattes af fællesskaber.
MR: Spyros, kan du fortælle os et par ord om CrowdHeritage-platformen, du arbejder på i forbindelse med AI4Culture-projektet?
Spyros Bekiaris: CrowdHeritage er en åben platform til at organisere online crowdsourcing-kampagner, der mobiliserer folk til at forbedre kvaliteten af kulturarvssamlinger. Dette kan være i forbindelse med forskellige aspekter, fra flersproget dækning til semantisk mærkning. Deltagerne opfordres til at berige digitale samlinger, enten ved at producere nye oplysninger (f.eks. tilføje geolokaliseringer) eller ved at evaluere og validere automatiske output produceret af digitale værktøjer (f.eks. automatiske oversættelser eller påvisning af partisk sprog).
CrowdHeritage er i vid udstrækning blevet brugt til at stimulere deltagelse i uddannelsesmiljøer og borgervidenskabelige miljøer ved at inddrage lokalsamfund, herunder studerende og elever, kulturelskere, fagfolk inden for kulturarv og den brede offentlighed. Platformen er hidtil blevet brugt til at organisere 40 crowdsourcing-kampagner med mere end 970 unikke bidragydere, genererer omkring 112.000 anmærkninger og evaluerer mere end 16.000.
MR: Crowdsourcing er forankret i distribueret manuel indsats, mens AI4Culture handler om AI-teknologier. Kan du forklare forholdet mellem CrowdHeritage-platformen og AI-værktøjer?
SB: CrowdHeritage blev oprindeligt designet til at understøtte kampagner, der inviterer brugere til at tilføje nye anmærkninger fra bunden. Inden for de sidste par år ser vi en stigende interesse for at koble CrowdHeritage med AI-værktøjer. Sådanne værktøjer giver bemærkelsesværdige muligheder for automatisk at forbedre kvaliteten af digitale kulturarvssamlinger i stor skala og med et minimum af manuel indsats, fra optisk tegngenkendelse og maskinoversættelse til automatisk undertekstning og billedklassificering.
Anvendelsen af rent automatiske metoder har imidlertid også afsløret en række problemer, der skal løses. Vi har brug for metoder til at vurdere, om resultaterne af AI-algoritmer er nøjagtige nok til vores standarder, og til at sammenligne, hvordan forskellige algoritmer opfører sig på grundlag af specifikke data og på grundlag af visse kriterier. I denne sammenhæng er crowdsourcing et glimrende middel til at udnytte den kollektive menneskelige intelligens og indsamle nyttig indsigt. Den akkumulerede feedback kan hjælpe os med at filtrere forkerte automatiske resultater, anvende passende filtre til at opretholde resultater af god kvalitet og spotte visse mangler ved AI-algoritmer. I dette samspil med kunstig intelligens er CrowdHeritage-platformen også nyttig til at producere datasæt med jordbaserede sandheder, der kan udnyttes yderligere til at tilpasse AI-værktøjer i forbindelse med kulturarvsdata.
MR: Eirini, kan du give nogle konkrete eksempler på, hvordan CrowdHeritage er blevet anvendt i kombination med AI-værktøjer?
EK: Jeg kan give mange! I forbindelse med Europeana Translate-projektet gennemførte vi en række kampagner, hvor deltagerne evaluerede resultaterne af en maskinoversættelsesalgoritme, der var trænet i Europeana-metadata (udviklet af vores AI4Culture-partner Pangeanic). Denne feedback gjorde det muligt for os at forbedre kvaliteten af resultaterne og førte også til oprettelsen af åbne datasæt, der blev offentliggjort på ELRC-SHARE-databasen, som samler sprogressourcer i hele EU.
I et andet casestudie om valg af optimale Super Resolution-modeller (SR) til forskellige billedtyper (som du kender meget godt, Marco!) oprettede vi en kampagne i samarbejde med European Fashion Heritage Association (EFHA), hvor deltagerne blev bedt om at sammenligne og rangordne en prøve af billeder opskaleret af forskellige SR-modeller. Resultaterne af denne kampagne gjorde det muligt for EFHA at vælge og anvende den bedste SR-algoritme afhængigt af billedegenskaberne.
Inden for rammerne af CRAFTED-projektet blev der tilrettelagt en række kampagner for at evaluere farver, der automatisk identificeres ved hjælp af AI-farvedetekteringsalgoritmer. Analysen af den indsamlede feedback førte os til den konklusion, at de automatiske algoritmer gentagne gange identificerede nogle specifikke fraværende farver og savnede nogle eksisterende, noget der hjalp os med at forbedre vores filtreringstilgang og vælge den bedste algoritmeopsætning.
I DE-BIAS-projektet er vi i gang med at oprette en række kampagner, hvor lokalsamfund vil inspicere og evaluere termer, der er markeret af et automatisk værktøj til registrering af bias som indeholdende nedsættende sprog.
MR: Det er virkelig interessant, Eirini, men vil kulturarvsinstitutioner kunne bruge CrowdHeritage-platformen til at iværksætte deres egne crowdsourcing-kampagner?
EK: Selvfølgelig! Gennem AI4Culture-projektet er der blevet stillet en ny "kampagneredaktør"-funktion til rådighed på CrowdHeritage, som giver alle mulighed for at oprette og køre en crowdsourcing-kampagne på platformen. Enhver interesseret kan se på denne video tutorial eller tjek CrowdHeritage dokumentation for at lære mere!
Læs mere
I september 2024 vil projektet lancere en platform, hvor et sæt åbne værktøjer vil blive stillet til rådighed online sammen med tilhørende dokumentation og uddannelsesmateriale. Hold øje med projektsiden på Europeana Pro for flere detaljer og hold øje med projektet LinkedIn og X konto!
