Marco Rendina: Eirini, alustame põhitõdedest. Mis on rahvahange?
Eirini Kaldeli: Crowdsourcing on protsess, mille käigus jagatakse ülesanne rühmale inimestele, kes tavaliselt panustavad oma töö kaudu võrgus. Mõnel juhul saavad sisendandmete esitajad materiaalset hüvitist; teistes on nende osalemine vabatahtlik, kusjuures hüved, nagu isiklik rahulolu, kultuuriline panus või teadmiste omandamine, on ebaolulised. Kultuuripärandisektoris on rahvahankeid pikka aega kasutatud mitmesuguste probleemide lahendamiseks, alates sisu kogumisest ja transkriptsioonist kuni kogude märgistamiseni ja kallutatud terminite avastamiseni kultuuripärandi objektide kirjeldamisel. Sõltuvalt ülesande laadist võivad osalejad vajada erioskusi või -teadmisi.
MR: Millised on ühishanke eelised kultuuripärandisektorile?
EK: Vastutustundlik ja sisukas rahvahankeprojekt võib tuua kultuuripärandiasutustele ja osalejatele vastastikust kasu. Eelkõige tuleks kasutada rahvalt tellimist kui vahendit, mille abil kaasata kodanikke kultuuripärandi kogudesse. Ühelt poolt on osalejatel võimalus kultuuripärandiga suhelda ja sellega suhelda; õppida mängulisel viisil kasulikku teavet esemete ja teemade kohta; jagada oma seisukohti ja teadmisi; kollektsioonide esitamise kaaskujundamine; ning tegema osaluskogemuse kaudu koostööd kaaskodanikega. Teisest küljest saavad kultuuripärandiasutused parandada oma kogude kvaliteeti ning muuta need leitavamaks ja kättesaadavamaks; suurendada teadlikkust oma kultuuripärandi varadest; jõuda uue publikuni; ning saada põhjalikumat teavet selle kohta, kuidas kogukonnad nende kogusid tajuvad.
MR: Spyros, kas te võiksite meile öelda paar sõna CrowdHeritage platvormi kohta, millega te töötate AI4Culture projekti kontekstis?
Spyros Bekiaris: CrowdHeritage on avatud platvorm veebipõhiste rahvahankekampaaniate korraldamiseks, et mobiliseerida inimesi parandama kultuuripärandi kogude kvaliteeti. See võib olla seotud eri aspektidega alates mitmekeelsest katvusest kuni semantilise märgistamiseni. Osalejaid kutsutakse üles rikastama digikogusid kas uue teabe koostamisega (nt geograafiliste asukohtade lisamine) või digivahendite abil loodud automaatsete väljundite hindamise ja valideerimisega (nt automaattõlked või kallutatud keele tuvastamine).
CrowdHeritage'i on laialdaselt kasutatud hariduskeskkonnas ja kodanike teaduskeskkonnas osalemise stimuleerimiseks, kaasates kogukondi, sealhulgas üliõpilasi ja õpilasi, kultuurisõpru, kultuuripärandi spetsialiste ja üldsust. Platvormi on seni kasutatud 40 rahvahankekampaania korraldamiseks enam kui 970 unikaalse kaastöölisega, mis on tekitanud ligikaudu 112 000 märkust ja hinnanud rohkem kui 16 000 inimest.
MR: Ühishanked põhinevad hajutatud käsitsitööl, samas kui AI4Culture on seotud tehisintellekti tehnoloogiatega. Kas oskate selgitada CrowdHeritage'i platvormi ja tehisintellekti tööriistade vahelist seost?
SB: CrowdHeritage oli algselt mõeldud toetama kampaaniaid, mis kutsuvad kasutajaid üles lisama uusi märke nullist. Viimastel aastatel oleme näinud kasvavat huvi CrowdHeritage'i ühendamise vastu AI-tööriistadega. Sellised vahendid pakuvad märkimisväärseid võimalusi digitaalse kultuuripärandi kogude kvaliteedi automaatseks parandamiseks mastaapselt ja minimaalse käsitsitööga alates optilisest märgituvastusest ja masintõlkest kuni automaatse subtiitrite ja kujutiste klassifitseerimiseni.
Puhtalt automaatsete meetodite kasutamine on aga toonud esile ka mitu probleemi, millega tuleb tegeleda. Vajame viise, kuidas hinnata, kas tehisintellekti algoritmide tulemused on meie standardite jaoks piisavalt täpsed, ning võrrelda, kuidas erinevad algoritmid käituvad konkreetsete andmete ja teatavate kriteeriumide alusel. Selles kontekstis on rahvalt tellimine suurepärane vahend kollektiivse inimintellekti rakendamiseks ja kasulike teadmiste kogumiseks. Kogunenud tagasiside aitab meil välja filtreerida valed automaatsed tulemused, rakendada asjakohaseid filtreid, et säilitada meie arvates kvaliteetsed tulemused ja märgata tehisintellekti algoritmide teatavaid puudusi. Koostoimes tehisintellektiga aitab platvorm CrowdHeritage luua ka maapealseid tõeandmestikke, mida saab veelgi kasutada tehisintellekti vahendite kohandamiseks kultuuripärandi andmetega.
MR: Eirini, kas võiksite tuua mõned konkreetsed näited selle kohta, kuidas CrowdHeritage'i on rakendatud koos tehisintellekti tööriistadega?
EK: Ma võin pakkuda palju! Projekti Europeana Translate raames korraldasime mitu kampaaniat, kus osalejad hindasid Europeana metaandmete põhjal koolitatud masintõlke algoritmi (mille töötas välja meie AI4Culture partner Pangeanic) tulemusi. See tagasiside võimaldas meil parandada tulemuste kvaliteeti ja tõi kaasa ka avatud andmestike loomise, mis avaldati ELRC-SHARE hoidlas, mis koondab keeleressursse kogu ELis.
Teises juhtumiuuringus optimaalsete Super Resolution (SR) mudelite valimise kohta erinevate pilditüüpide jaoks (mida teate väga hästi, Marco!), lõime koostöös Euroopa Moepärandi Assotsiatsiooniga (EFHA) kampaania, kus osalejatel paluti võrrelda ja järjestada erinevate SR-mudelite suurendatud piltide valimit. Selle kampaania tulemused võimaldasid EFHA-l valida ja rakendada parimat SR-algoritmi sõltuvalt pildi omadustest.
Projekti CRAFTED raames korraldati rida kampaaniaid, et hinnata tehisintellekti värvituvastusalgoritmide abil automaatselt tuvastatavaid värve. Kogutud tagasiside analüüs viis meid järeldusele, et automaatsed algoritmid tuvastasid korduvalt mõned konkreetsed puuduvad värvid ja jätsid mõned olemasolevad, mis aitas meil oma filtreerimismeetodit parandada ja valida parima algoritmi seadistuse.
Projekti DE-BIAS raames on käimas kampaaniate seeria, kus kogukonnad kontrollivad ja hindavad termineid, mis on märgistatud automaatse eelarvamuste tuvastamise vahendiga, mis sisaldab halvustavat keelt.
MR: See on tõesti huvitav, Eirini, kuid kas kultuuripärandiasutused saavad kasutada platvormi CrowdHeritage, et korraldada oma rahvahankekampaaniaid?
EK: Loomulikult! Projekti AI4Culture kaudu on CrowdHeritage’is kättesaadavaks tehtud uus kampaaniatoimetaja funktsioon, mis võimaldab igaühel platvormil korraldada ja juhtida rahvahankekampaaniat. Igaüks, kes on huvitatud, saab vaadata seda videoõpetust või vaadata CrowdHeritage'i dokumentatsiooni, et rohkem teada saada!
Uuri lähemalt
2024. aasta septembris käivitatakse projekti raames platvorm, kus tehakse veebis kättesaadavaks avatud vahendite kogum koos seonduvate dokumentide ja koolitusmaterjalidega. Lisateabe saamiseks jälgige Europeana Pro projekti lehekülge ja jälgige projekti LinkedIn ja X kontot!
