L-abilitazzjoni tat-traduzzjoni awtomatika għall-arrikkiment
Għodda tal-API żviluppata mis-sieħeb tal-proġett Pangeanic tidentifika l-lingwa użata fil-metadata tal-Europeana, u tippermettilha li tiġi tradotta b’mod awtomatiku. Imsejħa s-Servizz tat-Traduzzjoni Awtomatika tal-Metadata tal-Patrimonju (HM ATS), din l-għodda hija parti minn sett ta’ għodod ta’ arrikkiment semantiku żviluppati mill-Europeana XX.
Biex toħloq l-għodda, Pangeanic bena 10 magni tat-traduzzjoni awtomatika newrali (li jittraduċu t-Taljan, il-Ġermaniż, iċ-Ċek, il-Grieg, il-Franċiż, l-Iżvediż, il-Katalan, l-Olandiż, il-Pollakk, u l-Ispanjol għall-Ingliż). Huma użaw data dwar it-taħriġ mir-repożitorji proprji ta’ Pangeanic u data miftuħa fuq l-internet. Pangeanic impjegat ukoll tradutturi biex jittraduċu ammont limitat ta’ rekords minn repożitorji tal-Europeana sabiex ikun hemm data speċifika dwar it-taħriġ tal-Europeana għal diversi lingwi.
L-għodda ntużat biex tittraduċi u tarrikkixxi madwar żewġ miljun u nofs rekord matul il-proġett. Pangeanic b’suċċess estenda u rfina l-għodda biex tissodisfa r-rekwiżiti tal-prestazzjoni ta’ tali volum massiv ta’ data. Uża l-kodiċi API lilek innifsek.
Biex jevalwaw u jivvalidaw il-kwalità tat-traduzzjoni awtomatika, is-sħab jistabbilixxu wkoll sistema ta’ validazzjoni tat-traduzzjoni (ibbażata fuq LabelStudio). Il-professjonisti tal-wirt kulturali u l-kelliema nattivi tal-lingwi rilevanti vvalidaw aktar minn 2,700 traduzzjoni bl-użu ta’ din is-sistema. Il-feedback kien pożittiv ħafna, u kkonferma l-kwalità għolja tat-traduzzjoni awtomatika newrali u li din taħdem tajjeb għad-dominju tal-wirt kulturali diġitali.
It-traduzzjonijiet ivvalidati se jintużaw biex ikomplu jittejbu l-magni tat-traduzzjoni awtomatika fil-proġett Europeana Translate, li fih huwa involut ukoll Pangeanic. L-għan ta’ dan il-proġett huwa li jgħin lill-Europeana tagħmel progress fl-implimentazzjoni tal-istrateġija multilingwi tagħha, billi jipprovdi traduzzjonijiet tal-metadata li jippermettu tiftix u wiri aħjar tal-kollezzjonijiet tagħha fil-lingwi nattivi tagħhom u fil-lingwi tal-utenti.
Arrikkiment għas-settijiet tad-data
SAGE, għodda bbażata fuq l-internet għall-produzzjoni, l-arrikkiment, il-pubblikazzjoni, l-aċċess u l-ġestjoni tas-settijiet tad-data tal-RDF, ġiet żviluppata mill-Università Teknika Nazzjonali ta’ Ateni (NTUA) għal Europeana XX. RDF (qafas għad-deskrizzjoni tar-riżorsi) hija lingwa użata biex tirrappreżenta l-kontenut ta’ sett ta’ data. Id-data tal-RDF tista’ tiġi importata jew iġġenerata direttament minn diversi sorsi u formati tad-data, organizzata f’settijiet tad-data, u arrikkita bl-użu ta’ annotaturi. Dawn l-arrikkimenti jistgħu mbagħad jiġu vvalidati manwalment. Is-settijiet tad-data kollha, inkluż kwalunkwe annotazzjoni, jistgħu jiġu ppubblikati fil-ħwienet tal-RDF, indiċjati u aċċessati permezz ta’ sejħiet tal-API.
Bis-saħħa ta’ SAGE, partijiet magħżula ta’ settijiet tad-data ppubblikati issa jistgħu jiġu annotati u arrikkiti wkoll permezz ta’ servizzi esterni tal-API, bħal għodod li jgħaqqdu d-data ma’ Wikidata rilevanti, DBPedia, Geonames u riżorsi oħra, jew għodod li jidentifikaw okkorrenzi ta’ termini ta’ vokabularju fid-data. Ladarba jsiru arrikkimenti fis-SAGE, dawn imbagħad jiġu vvalidati manwalment permezz ta’ sistema li tippermetti validazzjonijiet bl-ingrossa bl-użu tar-raggruppament tat-test u l-issortjar tal-frekwenza tat-test, l-assenjazzjoni ta’ kompiti ta’ validazzjoni lil diversi utenti, u monitoraġġ mill-qrib tal-proċess ta’ validazzjoni ġenerali.
L-għodda SAGE intużat ukoll fil-proġett Pagode biex awtomatikament tarrikkixxi aktar minn 20,000 rekord. Dan se jintuża wkoll fil-proġett CRAFTED biex jiġu analizzati l-oqsma tal-metadata u t-test estratt mill-għodod tal-analiżi tal-kontenut tal-Intelliġenza Artifiċjali sabiex tiġi identifikata u titneħħa l-inċertezza minn entitajiet imsemmija. L-għan aħħari huwa li jiġu arrikkiti aktar minn 100,000 rekord u li jiġu permessi l-validazzjoni u l-valutazzjoni tal-utenti ta’ entitajiet estratti awtomatikament.
Skopri aktar
Tista’ tesplora l-għodod kollha żviluppati taħt il-proġett Europeana XX (u proġetti oħra tas-Servizzi Ġeneriċi) fuq il-paġna tas-Servizzi u l-Għodod tal-Europeana.
