Marco Rendina: Eirini, kezdjük az alapokkal. Mi az a crowdsourcing?
Eirini Kaldeli: A Crowdsourcing az a folyamat, amelynek során egy feladatot osztanak ki emberek egy csoportjának, akik általában az online munkájukon keresztül járulnak hozzá. Egyes esetekben a hozzájárulók anyagi kompenzációban részesülnek; másokban a részvétel önkéntes, és a jutalmak lényegtelenek, mint például a személyes elégedettség, a kulturális hozzájárulás vagy a tudás megszerzése. A kulturális örökség ágazatán belül a közösségi kiszervezést már régóta használják különböző kihívások kezelésére, a tartalomgyűjtéstől és -átírástól kezdve a gyűjtemények címkézéséig és a kulturális örökségi tárgyak leírásában szereplő elfogult kifejezések felderítéséig. A feladat jellegétől függően a résztvevőknek speciális készségekre vagy ismeretekre lehet szükségük.
MR: Milyen előnyökkel jár a közösségi kiszervezés a kulturális örökség ágazata számára?
EK: Egy felelős és értelmes crowdsourcing projekt kölcsönös előnyökkel járhat a kulturális örökséget ápoló intézmények és a résztvevők számára. Mindenekelőtt a közösségi kiszervezést olyan eszközként kell megközelíteni, amely bevonja a polgárokat az örökségi gyűjteményekbe. Egyrészt a résztvevőknek lehetőségük van arra, hogy kapcsolatba lépjenek a kulturális örökséggel, és kapcsolatba lépjenek vele; játékos módon tanuljon meg hasznos információkat a tárgyakról és témákról; osszák meg nézeteiket és ismereteiket; a gyűjtemények bemutatásának közös kialakítása; és részvételen alapuló tapasztalatszerzés keretében működjenek együtt polgártársaikkal. Másrészt a kulturális örökséget ápoló intézmények javíthatják gyűjteményeik minőségét, valamint felfedezhetőbbé és hozzáférhetőbbé tehetik azokat; felhívják a figyelmet kulturális örökségük értékeire; új közönségek elérése; és mélyebb betekintést nyerjenek abba, hogy a közösségek hogyan érzékelik gyűjteményeiket.
MR: Spyros, mondanál pár szót arról a CrowdHeritage platformról, amelyen az AI4Culture projekt keretében dolgozol?
Spyros Bekiaris: A CrowdHeritage egy nyílt platform olyan online közösségi kiszervezési kampányok szervezésére, amelyek arra ösztönzik az embereket, hogy javítsák a kulturális örökség gyűjteményeinek minőségét. Ez különböző szempontokhoz kapcsolódhat, a többnyelvű lefedettségtől a szemantikai címkézésig. A résztvevőket felkérik, hogy gazdagítsák a digitális gyűjteményeket, akár új információk előállításával (pl. földrajzi helymeghatározás hozzáadásával), akár a digitális eszközök által előállított automatikus kimenetek értékelésével és validálásával (pl. automatikus fordítások vagy az elfogult nyelv felismerése).
A CrowdHeritage-et széles körben használják az oktatási környezetben és a civil tudományos környezetben való részvétel ösztönzésére azáltal, hogy bevonják a közösségeket, köztük a diákokat és a tanulókat, a kultúra szerelmeseit, a kulturális örökséggel foglalkozó szakembereket és a nagyközönséget. A platformot eddig 40 crowdsourcing kampány megszervezésére használták, több mint 970 egyedi közreműködővel, mintegy 112 000 megjegyzést generálva és több mint 16 000 értékeléssel.
MR: A Crowdsourcing az elosztott manuális erőfeszítésben gyökerezik, míg az AI4Culture az AI technológiákról szól. El tudná magyarázni a CrowdHeritage platform és az MI-eszközök közötti kapcsolatot?
SB: A CrowdHeritage-et eredetileg olyan kampányok támogatására tervezték, amelyek felkérik a felhasználókat új jegyzetek hozzáadására a semmiből. Az elmúlt néhány évben egyre nagyobb érdeklődés mutatkozik a CrowdHeritage és az AI eszközök összekapcsolása iránt. Ezek az eszközök figyelemre méltó lehetőségeket kínálnak a digitális kulturális örökség gyűjteményei minőségének nagy léptékű és minimális manuális erőfeszítéssel történő automatikus javítására, az optikai karakterfelismeréstől és a gépi fordítástól az automatikus feliratozásig és a képosztályozásig.
A tisztán automatikus módszerek alkalmazása azonban számos olyan kérdést is feltárt, amelyekkel foglalkozni kell. Módszerekre van szükségünk annak értékeléséhez, hogy az MI-algoritmusok eredményei elég pontosak-e a szabványainkhoz, és hogy összehasonlítsuk, hogy a különböző algoritmusok hogyan viselkednek bizonyos adatok alapján és bizonyos kritériumok alapján. Ebben az összefüggésben a közösségi kiszervezés kiváló eszköz a kollektív emberi intelligencia kiaknázására és hasznos ismeretek gyűjtésére. Az összegyűjtött visszajelzések segíthetnek kiszűrni a helytelen automatikus eredményeket, megfelelő szűrőket alkalmazni a jó minőségű eredmények fenntartásához, és észlelni az AI algoritmusok bizonyos hiányosságait. A mesterséges intelligenciával való kölcsönhatásban a CrowdHeritage platform olyan földi igazságokkal kapcsolatos adatkészletek előállításához is hasznos, amelyek jobban felhasználhatók a mesterségesintelligencia-eszközöknek a kulturális örökséggel kapcsolatos adatokhoz való hozzáigazítására.
MR: Eirini, tudna néhány konkrét példát mondani arra, hogyan alkalmazták a CrowdHeritage-et az MI-eszközökkel kombinálva?
EK: Sok mindent tudok nyújtani! Az Europeana Translate projekt keretében több kampányt is lebonyolítottunk, amelyek során a résztvevők értékelték az (AI4Culture partnerünk, a Pangeanic által kifejlesztett) Europeana metaadatokon képzett gépi fordítási algoritmus eredményeit. Ez a visszajelzés lehetővé tette számunkra, hogy javítsuk az eredmények minőségét, és az ELRC-SHARE adattárban közzétett nyílt adatkészletek létrehozásához is vezetett, amely az egész EU-ban gyűjti a nyelvi erőforrásokat.
Egy másik esettanulmányban az optimális szuperfelbontású (SR) modellek kiválasztásáról különböző képtípusokhoz (amit nagyon jól ismersz, Marco!), az Európai Divatörökség Szövetséggel (EFHA) együttműködve kampányt indítottunk, ahol a résztvevőket felkértük, hogy hasonlítsák össze és rangsorolják a különböző SR modellek által felnagyított képek mintáját. A kampány eredményei lehetővé tették az EFHA számára, hogy a kép jellemzőitől függően a legjobb SR algoritmust válassza ki és alkalmazza.
A CRAFTED projekt keretében egy sor kampányt szerveztek a mesterséges intelligencián alapuló színfelismerő algoritmusok által automatikusan azonosított színek értékelésére. Az összegyűjtött visszajelzések elemzése arra a következtetésre vezetett, hogy az automatikus algoritmusok ismételten azonosítottak néhány konkrét hiányzó színt, és kihagytak néhány meglévőt, ami segített nekünk a szűrési megközelítés javításában és a legjobb algoritmus beállítás kiválasztásában.
A DE-BIAS projekt keretében folyamatban van egy olyan kampánysorozat létrehozása, amelyben a közösségek megvizsgálják és értékelik azokat a kifejezéseket, amelyeket egy automatikus elfogultság-felderítő eszköz becsmérlő nyelvezetet tartalmazóként jelöl meg.
MR: Ez valóban érdekes, Eirini, de a kulturális örökségvédelmi intézmények képesek lesznek-e használni a CrowdHeritage platformot saját crowdsourcing kampányaik létrehozására?
EK: Hát persze! Az AI4Culture projekten keresztül egy új „kampányszerkesztő” funkciót tettek elérhetővé a CrowdHeritage-en, amely bárki számára lehetővé teszi, hogy crowdsourcing kampányt indítson és futtasson a platformon. Bárki, aki érdeklődik, megnézheti ezt a videó bemutatót, vagy nézze meg a CrowdHeritage dokumentációját, hogy többet megtudjon!
Tudjon meg többet
2024 szeptemberében a projekt elindít egy platformot, ahol online elérhetővé teszik a nyílt eszközöket, valamint a kapcsolódó dokumentációt és képzési anyagokat. Tartsa szemmel az Europeana Pro projektoldalát a további részletekért, és tartsa a kapcsolatot a projekt LinkedIn és X fiókjával!
