Marco Rendina: Eirini, ejja nibdew mill-punti bażiċi. X’inhu l-crowdsourcing?
Eirini Kaldeli: Il-crowdsourcing huwa l-proċess tad-distribuzzjoni ta’ kompitu lil grupp ta’ nies, li normalment jikkontribwixxu permezz tax-xogħol tagħhom online. F’xi każijiet, il-kontributuri jirċievu kumpens materjali; f’oħrajn, il-parteċipazzjoni tagħhom hija volontarja, u l-premjijiet huma immaterjali, bħas-sodisfazzjon personali, il-kontribuzzjoni kulturali, jew il-kisba tal-għarfien. Fi ħdan is-settur tal-wirt kulturali, il-crowdsourcing ilu jintuża biex jiġu indirizzati diversi sfidi, mill-ġbir u t-traskrizzjoni tal-kontenut sat-tikkettar tal-kollezzjonijiet u d-detezzjoni ta’ termini preġudikati fid-deskrizzjoni tal-oġġetti tal-wirt kulturali. Skont in-natura tal-kompitu, il-parteċipanti jistgħu jeħtieġu ħiliet jew għarfien speċjalizzati.
MR: X’inhuma l-benefiċċji tal-crowdsourcing għas-settur tal-wirt kulturali?
EK: Proġett ta’ crowdsourcing responsabbli u sinifikanti jista’ jġib benefiċċji reċiproċi għall-istituzzjonijiet u l-parteċipanti tal-wirt kulturali. L-ewwel u qabel kollox, il-crowdsourcing għandu jiġi avviċinat bħala mezz biex iċ-ċittadini jiġu involuti f’kollezzjonijiet ta’ patrimonju. Minn naħa waħda, il-parteċipanti għandhom l-opportunità li jinteraġixxu mal-wirt kulturali u jingħaqdu miegħu; titgħallem informazzjoni utli dwar l-oġġetti u s-suġġetti b’mod divertenti; jaqsmu l-perspettivi u l-għarfien tagħhom; il-forma konġunta ta’ kif jiġu ppreżentati l-kollezzjonijiet; u jikkollaboraw ma’ ċittadini sħabhom f’esperjenza parteċipattiva. Min-naħa l-oħra, l-istituzzjonijiet tal-wirt kulturali jistgħu jtejbu l-kwalità tal-kollezzjonijiet tagħhom u jagħmluhom aktar traċċabbli u aċċessibbli; iqajmu kuxjenza dwar l-assi tal-wirt kulturali tagħhom; jilħqu udjenzi ġodda; u jiksbu għarfien aktar profond dwar kif il-kollezzjonijiet tagħhom jiġu perċepiti mill-komunitajiet.
MR: Spyros, tista 'tgħidilna ftit kliem dwar il-pjattaforma CrowdHeritage li qed taħdem fuqha fil-kuntest tal-proġett AI4Culture?
Spyros Bekiaris: CrowdHeritage hija pjattaforma miftuħa għall-organizzazzjoni ta’ kampanji online ta’ crowdsourcing li jimmobilizzaw lin-nies biex itejbu l-kwalità tal-kollezzjonijiet tal-wirt kulturali. Dan jista’ jkun b’rabta ma’ aspetti differenti, minn kopertura multilingwi għal tikkettar semantiku. Il-parteċipanti huma mistiedna jarrikkixxu l-kollezzjonijiet diġitali, jew billi jipproduċu informazzjoni ġdida (eż. iżidu l-ġeolokalizzazzjonijiet) jew billi jevalwaw u jivvalidaw l-outputs awtomatiċi prodotti minn għodod diġitali (eż. traduzzjonijiet awtomatiċi jew detezzjoni ta’ lingwaġġ preġudikat).
CrowdHeritage intuża b’mod estensiv biex jistimula l-parteċipazzjoni f’ambjenti edukattivi u f’ambjenti tax-xjenza taċ-ċittadini billi jinvolvi komunitajiet inklużi studenti u studenti, dawk li jħobbu l-kultura, professjonisti tal-wirt kulturali u l-pubbliku ġenerali. Il-pjattaforma s’issa ntużat biex jiġu organizzati 40 kampanja ta’ crowdsourcing b’aktar minn 970 kontributur uniku, li jiġġeneraw madwar 112,000 annotazzjoni u jevalwaw aktar minn 16,000.
MR: Il-crowdsourcing għandu l-għeruq tiegħu fi sforz manwali distribwit filwaqt li l-AI4Culture hija dwar it-teknoloġiji tal-IA. Tista’ tispjega r-relazzjoni bejn il-pjattaforma CrowdHeritage u l-għodod tal-IA?
SB: CrowdHeritage kien oriġinarjament iddisinjat biex jappoġġja kampanji li jistiednu lill-utenti biex iżidu annotazzjonijiet ġodda mill-bidu nett. F’dawn l-aħħar ftit snin, qed naraw interess dejjem akbar fl-akkoppjament ta’ CrowdHeritage ma’ għodod tal-IA. Tali għodod joffru opportunitajiet notevoli għat-titjib awtomatiku tal-kwalità tal-kollezzjonijiet tal-wirt kulturali diġitali fuq skala kbira u bi sforz manwali minimu, mir-rikonoxximent ottiku tal-karattri u t-traduzzjoni awtomatika, sas-sottotitolar awtomatiku u l-klassifikazzjoni tal-immaġnijiet.
Madankollu, ir-rikors għal metodi purament awtomatiċi żvela wkoll diversi kwistjonijiet li jridu jiġu indirizzati. Neħtieġu modi biex nivvalutaw jekk ir-riżultati tal-algoritmi tal-IA humiex preċiżi biżżejjed għall-istandards tagħna u biex inqabblu kif algoritmi differenti jġibu ruħhom fuq data speċifika u abbażi ta’ ċerti kriterji. F’dan il-kuntest, il-crowdsourcing huwa mezz eċċellenti biex tiġi sfruttata l-intelliġenza umana kollettiva u jinġabar għarfien utli. Il-feedback akkumulat jista’ jgħinna niffiltraw riżultati awtomatiċi skorretti, napplikaw filtri xierqa biex inżommu dak li nqisu bħala riżultati ta’ kwalità tajba u nidentifikaw ċerti nuqqasijiet tal-algoritmi tal-IA. F’din l-interazzjoni mal-IA, il-pjattaforma CrowdHeritage hija utli wkoll għall-produzzjoni ta’ settijiet tad-data tal-verità tal-art li jistgħu jiġu sfruttati aktar biex jiġu adattati l-għodod tal-IA fir-rigward tad-data dwar il-wirt kulturali.
MR: Eirini, tista’ tipprovdi xi eżempji konkreti ta’ kif CrowdHeritage ġie applikat flimkien mal-għodod tal-IA?
EK: Nista 'nagħmel ħafna! Fil-kuntest tal-proġett Europeana Translate, wettaqna għadd ta’ kampanji fejn il-parteċipanti evalwaw ir-riżultati ta’ algoritmu tat-traduzzjoni awtomatika mħarreġ dwar il-metadata tal-Europeana (żviluppat mis-sieħeb tagħna tal-AI4Culture Pangeanic). Dan ir-rispons ippermettielna ntejbu l-kwalità tar-riżultati u wassal ukoll għall-ħolqien ta’ settijiet ta’ data miftuħa ppubblikati fuq ir-repożitorju ELRC-SHARE, li jiġbor riżorsi lingwistiċi madwar l-UE.
Fi studju ieħor tal-każ dwar l-għażla ta’ mudelli ottimali ta’ SuperRiżoluzzjoni (SR) għal tipi differenti ta’ immaġnijiet (li taf tajjeb ħafna, Marco!), waqqafna kampanja f’kollaborazzjoni mal-Assoċjazzjoni Ewropea tal-Wirt tal-Moda (EFHA), fejn il-parteċipanti ntalbu jqabblu u jikklassifikaw kampjun ta’ immaġnijiet imtella’ minn mudelli differenti ta’ SR. Ir-riżultati ta’ din il-kampanja ppermettew lill-EFHA tagħżel u tapplika l-aħjar algoritmu tal-SR skont il-karatteristiċi tal-immaġni.
Fil-qafas tal-proġett CRAFTED, ġew organizzati sensiela ta’ kampanji biex jiġu evalwati l-kuluri identifikati awtomatikament mill-algoritmi tad-detezzjoni tal-kulur tal-IA. L-analiżi tal-feedback miġbur wasslitna għall-konklużjoni li l-algoritmi awtomatiċi ripetutament identifikaw xi kuluri speċifiċi assenti u tilfu xi wħud eżistenti, xi ħaġa li għenitna ntejbu l-approċċ ta’ filtrazzjoni tagħna u nagħżlu l-aħjar struttura tal-algoritmi.
Fil-proġett DE-BIAS, ninsabu fil-proċess li nistabbilixxu sensiela ta’ kampanji fejn il-komunitajiet se jispezzjonaw u jevalwaw it-termini mmarkati minn għodda awtomatika għad-detezzjoni tal-preġudizzji bħala li fihom lingwaġġ derogatorju.
MR: Dan huwa tassew interessanti, Eirini, iżda l-istituzzjonijiet tal-wirt kulturali se jkunu jistgħu jużaw il-pjattaforma CrowdHeritage biex jistabbilixxu l-kampanji ta’ crowdsourcing tagħhom stess?
EK: Naturalment! Permezz tal-proġett AI4Culture, saret disponibbli karatteristika ġdida ta’ “editur tal-kampanja” fuq CrowdHeritage, li tippermetti lil kulħadd iwaqqaf u jmexxi kampanja ta’ crowdsourcing fuq il-pjattaforma. Kull min hu interessat jista’ jħares lejn dan il-video tutorial jew jiċċekkja d-dokumentazzjoni ta’ CrowdHeritage biex jitgħallem aktar!
Skopri aktar
F’Settembru 2024, il-proġett se jniedi pjattaforma fejn sett ta’ għodod miftuħa se jkun disponibbli online, flimkien ma’ dokumentazzjoni u materjali ta’ taħriġ relatati. Żomm għajnejk fuq il-paġna tal-proġett fuq Europeana Pro għal aktar dettalji u ibqa’ aġġornat dwar il-proġett LinkedIn u l-kont X!
