Jekk jogħġbok innota: il-metadata ta’ dan l-oġġett fuq E__uropeana.eu tuża lingwaġġ antikwat biex tiddeskrivi l-persuni Rom.
Illum, kulħadd jista’ jibbrawżja permezz ta’ miljuni ta’ oġġetti ta’ wirt kulturali diġitali online, b’Europeana.eu waħedha tipprovdi aċċess għal aktar minn 50 miljun oġġett. Dan huwa possibbli parzjalment bis-saħħa ta’ Linked Open Data jew LOD.
Bl-użu tal-LOD, l-istituzzjonijiet tal-wirt kulturali jistgħu jippubblikaw, jistrutturaw u jgħaqqdu l-kollezzjonijiet tagħhom, u jżidu metadata aktar standardizzata mal-artefatti. Pereżempju, ir-Rijksmuseum jgħaqqad artefatti fil-kollezzjoni LOD tiegħu mal-Wikidata u l-Getty Art & Architecture Thesaurus (AAT). Il-verżjoni LOD tal-pittura famuża Vermeer “The Milkmaid” hija marbuta mal-kunċett ta’ “żebgħa taż-żejt” mill-AAT.
Filwaqt li LOD iġib ħafna benefiċċji, għandu wkoll xi limitazzjonijiet. Waħda mill-akbar problemi li jenfasizzaw ir-riċerkaturi u l-prattikanti tal-wirt kulturali hija kif l-LOD jirrifletti l-preġudizzji fid-data li huwa bbażat fuqha, u jista’ jħalli barra sfumaturi u kumplessitajiet kulturali. Dan huwa partikolarment viżibbli meta nħarsu lejn artefatti bi stejjer ikkumplikati u konfliġġenti: oġġetti relatati mal-kolonjaliżmu, persuni storikament emarġinati u komunitajiet oppressi. Fir-riċerka tagħna, aħna ninvestigaw aspett wieħed ta 'din il-problema: Terminoloġija kontroversjali.
Termini kontenzjużi fis-settijiet tad-data popolari
Jekk it-terminu “żebgħa taż-żejt” x’aktarx li ma joffendix, l-istorja hija differenti minn slurs razzjali, referenzi derogatorji għal gruppi soċjali jew ismijiet kolonjali skaduti. Wieħed jista’ jaħseb li settijiet ta’ data użati b’mod wiesa’, bħall-Wikidata jew l-AAT, huma ħielsa minn “kliem preġudikat” u “ħażin”. Dan mhuwiex il-każ, kif wera l-istudju reċenti tagħna.
Aħna sibna eluf ta' okkorrenzi ta' termini kontenzjużi bl-Ingliż u bl-Olandiż f'erba' settijiet ta' data - Wikidata, AAT, u żewġ bażijiet ta' data lexiċi Princeton WordNet u Open Dutch WordNet. Aħna ma ħriġniex b'lista ta 'termini kontenzjużi nfusna, iżda ddependejna fuq il-pubblikazzjoni Words Matter mill-Mużew Nazzjonali Olandiż tal-Kulturi Dinjija, li jispjega s-sensittivitajiet kulturali wara t-termini użati fid-deskrizzjonijiet tal-mużewijiet.
Meta wieħed iħares lejn fejn dehru eżattament termini kontenzjużi, sibna li l-Wikidata tużahom ta' spiss f'tikketti preferuti. Dan ifisser li l-utenti jaraw it-termini tal-isterjotipar bħala l-ismijiet ewlenin tal-oġġetti fl-interfaċċi. Settijiet ta’ data oħrajn isemmu termini kontenzjużi primarjament f’oqsma deskrittivi itwal.
Indaħħlu għarfien espert kollettiv
Wara li tgħallimna dwar l-iskala tal-problema, ridna nkunu nafu kif il-prattikanti tal-wirt kulturali u l-iżviluppaturi tal-LOD setgħu jindirizzawha, u ma kien hemm l-ebda opportunità aħjar mill-organizzazzjoni ta’ workshop fil-konferenza dwar l-IA u l-wirt fin-Netherlands.
Flimkien ma’ Laura Hollink, is-superviżur tiegħi fis-CWI (l-istitut nazzjonali tar-riċerka għall-matematika u x-xjenza tal-kompjuter fin-Netherlands) u koawtur, għażilna każijiet għall-parteċipanti tal-workshop biex jiddiskutu. Il-workshop tagħna attira 45 persuna, u ffurmajna tmien gruppi. Għal kull grupp, ħejjejna envelop b’kopja stampata ta’ kunċett ta’ LOD jew rekord minn Europeana.eu b’termini kontenzjużi, paġna minn Words Matter li tispjega għaliex terminu partikolari huwa kontroversjali, u noti li jwaħħlu. Tlabna lill-parteċipanti jissuġġerixxu kif ir-rappreżentanza ta’ kunċett ta’ LOD jew rekord ta’ Europeana.eu tista’ ssir aktar inklużiva.
Is-sostituzzjoni waħedha mhijiex soluzzjoni
Filwaqt li saru ħafna suġġerimenti biex tiġi indirizzata l-kwistjoni, ħadd minnhom ma qal li s-sostituzzjoni ta 'terminu kontenzjuż b'sinonimu xieraq issolvi l-kwistjoni kompletament. Minbarra l-użu ta’ sinonimi, il-parteċipanti enfasizzaw il-ħtieġa li jiġu inklużi spjegazzjonijiet dwar it-terminoloġija kontenzjuża fil-metadata - għaliex intużat u għaliex ma saritx xierqa. Nota waħda ssuġġeriet li tali spjegazzjonijiet u diskussjonijiet dwar termini kontenzjużi jistgħu jkunu soluzzjoni għall-preġudizzji fil-metadata. F’żewġ każijiet, sibna noti li jgħidu li għandu jkun hemm informazzjoni mill-komunitajiet li huma rrappreżentati ħażin fil-metadata.
Għażilna tliet każijiet bl-istess terminu — ġipsija — biex naraw kif gruppi differenti fis-sessjoni ta’ ħidma javviċinaw l-istess terminu. Żewġ każijiet b’rekord ta’ Europeana.eu kienu identiċi: huma semmew it-terminu fit-titolu, id-deskrizzjoni u l-qasam tal-metadata “suġġett” dwar film li jkopri l-isfidi tas-soċjetà tal-poplu Rom f’Londra. It-tielet każ kien il-kunċett tal-AAT “vaguni għaż-żingari”. Il-Kliem Kwistjoni jissuġġerixxi l-użu tat-terminu “Rom” minflok it-terminu derogatorju “Żingarjetà”. It-tliet gruppi kollha qablu ma’ dan is-suġġeriment, iżda wkoll li mhux sempliċiment jissostitwixxu l-kelma “Żingarjetà”.
Grupp wieħed issuġġerixxa li tiżdied aktar informazzjoni mal-metadata tar-rekord: li t-terminu “Żingariżmu” jitqies bħala pejorattiv, li qabel kien jintuża fil-metadata, u li l-persuni Rom qabel kienu jissejħu “Żingariżmu”. Grupp ieħor irrifletta li, “Jidher faċli li tinbidel il-kelma [“Żingariżmu”] għar-Rom, iżda l-konnotazzjonijiet negattivi fit-test/fil-kuntest [fit-test tad-deskrizzjoni tal-oġġett] mhux biss jittrasferixxu għat-terminu “Rom”?” Nota oħra tgħid li t-terminu jista’ jiġi pperċepit b’mod differenti f’kulturi differenti: Dan it-terminu huwa meqjus bħala derogatorju kullimkien?
Nistgħu nfasslu metadata inklużiva b’LOD?
Dawn il-mistoqsijiet u s-suġġerimenti li ġbarna mhumiex ġodda. L-istituzzjonijiet tal-wirt kulturali, flimkien mas-sidien tat-teżawri u tal-vokabularji u l-edituri, kienu qed ifittxu modi kif jagħmlu l-metadata inklużiva. Hemm linji gwida u glossarji miktuba biex jgħinu lill-kuraturi jirrappreżentaw oġġetti diġitali b’mod inklużiv: pereżempju, liema teżawri jagħżlu u kif jikklassifikaw l-oġġetti b’mod xieraq.
Madankollu, it-termini tal-isterjotipar qed jintużaw kemm fid-deskrizzjonijiet tal-artefatti kif ukoll fil-kunċetti tal-LOD. Liema rwol se jkollhom l-iżviluppi l-ġodda fl-LOD biex isolvu dan? Kif nistgħu nużaw il-graffs tal-għarfien, it-teżawri u l-iskemi fil-bini ta’ rappreżentazzjonijiet inklużivi tal-wirt kulturali? Għar-riċerkaturi u l-prattikanti tal-LOD, dawn il-mistoqsijiet għad iridu jiġu indirizzati, u l-isfidi tar-rappreżentanza ta’ oġġetti ta’ wirt kulturali kumplessi, sfumati u kkontestati jistgħu jkunu xprun għalihom.
Skopri aktar
Tgħallem aktar dwar ir-riċerka tal-Laboratorju tal-IA Kulturali fid-dokumenti b’aċċess miftuħ Graff tal-Għarfien tat-Terminoloġija Kontenzjuża għar-Rappreżentanza Inklużiva tal-Wirt Kulturali u Kif Jintużaw Termini Kontenzjużi Dwar in-Nies u l-Kulturi fid-Data Miftuħa Marbuta.
Il-Fondazzjoni Europeana tipparteċipa fi proġetti bħal DE-BIAS li għandhom l-għan li jiżviluppaw vokabularji, bażijiet ta' għarfien bl-użu ta' Linked Open Data, u għodod awtomatizzati ta' rikonoxximent u ta' mmarkar li jippermettu li termini kontenzjużi jiġu mmarkati u kuntestwalizzati fil-bażi tad-data tal-Europeana. Aqra aktar dwar il-proġett DE-BIAS hawnhekk.
Din il-kariga nkitbet minn Andrei Nesterov, PhD-student fil-grupp Human-Centered Data Analytics, CWI - Iċ-Ċentru Nazzjonali tar-Riċerka għax-Xjenza tal-Matematika u tal-Kompjuter fin-Netherlands. Il-proġett ta’ riċerka tiegħu huwa parti mil-Laboratorju tal-IA Kulturali.
