Imnedija fl-2016, il-pjattaforma Transcribathon ġiet żviluppata aktar minn żewġ proġetti ta’ Servizzi Ġeneriċi: Enrich Europeana (2018-2020) u Enrich Europeana Plus (2021-2023). Il-pjattaforma tippermetti lill-voluntiera jittraskrivu testi storiċi miktuba bl-idejn f’lingwi differenti u minn perjodi storiċi differenti, bl-użu ta’ xejn aktar mill-kompjuter tagħhom. Minn meta bdew il-proġetti, aktar minn 372,000 dokument ġew traskritti mill-voluntiera u nbidlu f’fajls ta’ test diġitali, li jgħinu biex jespandu u jarrikkixxu l-kollezzjonijiet vasti ta’ oġġetti ta’ wirt kulturali diġitali tal-Europeana.
Fl-2021, il-proġett Enrich Europeana Plus beda jaġġorna l-pjattaforma Transcribathon b’teknoloġija avvanzata ta’ rikonoxximent tal-kitba bl-idejn, li tuża l-intelliġenza artifiċjali biex tipprovdi traskrizzjonijiet awtomatiċi li mbagħad jistgħu jiġu vverifikati mill-voluntiera. Wieħed mill-akbar fornituri ta' din it-teknoloġija huwa READ-COOP, Soċjetà Kooperattiva Ewropea li timmaniġġja s-softwer popolari Transkribus. Enrich Europeana Plus qattgħet diversi xhur taħdem ma’ READ-COOP u tinkorpora t-teknoloġija tagħhom fil-pjattaforma Transcribathon.
Il-konnessjoni tat-Transcribathon mal-API tal-“metagrapho”
Żviluppat bħala parti minn proġett iffinanzjat mill-UE mmexxi mill-Università ta' Innsbruck, is-softwer Transkribus jippermetti li dokumenti storiċi miktuba bl-idejn jiġu traskritti awtomatikament fuq skala tal-massa. It-teknoloġija tuża l-IA biex “titgħallem” kif taqra tipi speċifiċi ta’ kitba bl-idejn, u mbagħad timplimenta dan l-għarfien biex toħloq traskrizzjonijiet awtomatiċi ta’ testi. Dan iħaffef b’mod drammatiku l-proċess ta’ traskrizzjoni: it-transcriber m'għadx għandu bżonn iqatta 'sigħat jikteb traskrizzjoni mill-bidu nett, peress li jistgħu jaqraw il-prova tat-traskrizzjoni awtomatika minflok.
It-teknoloġija tar-rikonoxximent tal-kitba bl-idejn bħal Transkribus hija partikolarment ideali għal proġetti tax-xjenza taċ-ċittadini. Aktar ma jkun faċli li jiġu traskritti dawk id-dokumenti, aktar ikunu jistgħu jipproċessaw dokumenti l-voluntiera f’ċertu perjodu ta’ żmien, u aktar ma s-sit web tal-Europeana jkun jista’ jiġi arrikkit malajr. It-tim ta 'Transcribathon kien għalhekk ħerqan li jimplimenta din it-teknoloġija fil-pjattaforma.
Biex jagħmlu dan, iddeċidew li jużaw l-API tal-metagrafu ta’ READ-COOP biex Transcribathon ikun jista’ jaċċessa t-teknoloġija Transkribus. API hija biċċa softwer li taġixxi bħala messaġġier bejn żewġ pjattaformi differenti. Xi ħadd jitlob informazzjoni fuq pjattaforma waħda, u l-pjattaforma tibgħat din it-talba lill-API ta’ pjattaforma oħra. Ladarba din it-tieni pjattaforma jkollha tweġiba għat-talba, l-API ġġibha lura għall-ewwel pjattaforma u l-persuna tikseb l-informazzjoni li teħtieġ.
Il-pjattaforma Transcribathon tuża l-metagrapho API eżattament b'dan il-mod. Meta voluntier ikun irid jikseb traskrizzjoni awtomatika ta' test, huwa jitlob dan fuq il-pjattaforma Transcribathon. Transcribathon imbagħad jibgħat din it-talba lill-metagrapho API, li juża teknoloġija ta’ rikonoxximent tal-kitba bl-idejn biex jipproċessa l-immaġni u jiġġenera traskrizzjoni awtomatika. Fl-aħħar nett, ladarba jitlesta l-ipproċessar, il-pjattaforma Transcribathon tista’ taċċessa t-traskrizzjoni u turiha lill-voluntier, għal darb’oħra permezz tal-metagrapho API.
Il-metagrapho API mhux biss jipprovdi t-traskrizzjoni iżda wkoll il-koordinati għal kull linja jew saħansitra kelma misjuba fl-immaġni - xi ħaġa li ma kinitx possibbli fil-verżjoni l-qadima ta 'Transcribathon. Din il-karatteristika tagħmilha possibbli li mbagħad jintużaw it-traskrizzjonijiet għal aktar applikazzjonijiet, bħall-enfasizzar tat-tqabbil tal-kliem kjavi fit-test matul tfittxija b’test sħiħ.
Editur tat-traskrizzjoni mtejjeb
L-aġġornament tat-teknoloġija wara Transcribathon kien ifisser li l-editur tat-traskrizzjoni - il-parti li juża voluntier biex idaħħal it-traskrizzjonijiet tiegħu - ma kienx għadu kapaċi jlaħħaq mal-format tad-data aktar sinjur li kien qed jirċievi lura mill-metagrapho API. Għalhekk, READ-COOP bena editur tat-traskrizzjoni tad-dwana għal Transcribathon. Dan jippermetti lin-nies jikklikkjaw fuq linja tat-traskrizzjoni, u jaraw il-linja korrispondenti fl-immaġni tat-test.
Biex tħaffef il-proċess, READ-COOP ħa l-editur eżistenti fis-softwer Transkribus, immodifikah biex jaqbel mar-rekwiżiti ta 'Transcribathon, u biddelha f'widget. Il-widget imbagħad sempliċement iddaħħal fil-pjattaforma Transcribathon, li jagħmilha possibbli għall-utenti li jaċċessaw u jeditjaw it-traskrizzjonijiet iġġenerati mill-metagrapho API. L-użu tal-editur eżistenti tat-Transkribus u sempliċiment il-modifika tiegħu ffrankaw ukoll ħin u spejjeż prezzjużi għall-iżvilupp.
Is-setgħa ta' kollaborazzjoni
Dawn l-aġġornamenti teknoloġiċi jieħdu Transcribathon għal-livell li jmiss. Minflok ma joħolqu traskrizzjonijiet li jieħdu ħafna ħin mill-bidu nett, il-voluntiera issa jistgħu sempliċiment jikkoreġu traskrizzjonijiet iġġenerati awtomatikament fl-editur il-ġdid tat-traskrizzjoni, u jgħinuhom jipproċessaw ħafna aktar dokumenti matul sessjoni.
READ-COOP bħalissa qed iħarreġ il-mudelli tal-IA għar-rikonoxximent tat-test miktub bl-idejn abbażi ta’ materjal diġà traskritt, jew għal materjal li dalwaqt jiġi traskritt, fi Transcribathon. Aktar ma l-mudell tal-IA jkun adattat għall-materjal fil-mira, aktar ikunu preċiżi t-traskrizzjonijiet awtomatiċi.
Pereżempju, Transcribathon Run li jmiss se jkollu skans ta’ karti ta’ razzjon mill-Arkivji tal-Istat f’Zagreb, li ntużaw matul id-WW2 (mill-1941 sal-1945.) bħala forma ta’ razzjonar tal-ikel u riżorsi oħra. Il-kards fihom indikaturi demografiċi u soċjoekonomiċi għal individwi u/jew unitajiet domestiċi bħal titoli, impjiegi, u għalhekk huma sors rikk ta’ materjal ta’ riċerka.
Bħala tħejjija għal din il-ġirja, READ-COOP organizza webinar mal-impjegati tal-arkivju, biex jurihom kif iħejju d-data tat-taħriġ. Din id-data tat-taħriġ imbagħad tintuża biex jitħarreġ mudell ta’ kitba bl-idejn jew biex il-magna “titgħallem” kif taqra dokumenti ta’ dan it-tip, sabiex tkun tista’ tipprovdi traskrizzjonijiet aktar preċiżi matul il-ġirja. Dan, flimkien mal-ħiliet ta’ qari tal-provi tal-voluntiera, għandu jippermetti li l-arkivju ta’ Zagreb jiddiġitalizza għadd akbar ta’ dokumenti minn qatt qabel.
Skopri aktar
Tista’ tirrevedi l-webinar dwar kif tħejji d-data tat-taħriġ f’dan il-video. Għandek issib l-integrazzjoni tal-editur għar-Rikonoxximent awtomatiku tat-Test miktub bl-idejn fuq il-pjattaforma Transcribathon u tista 'tiċċekkja l-ewwel riżultati mid-dokumenti ta' Dublin.
Din il-kariga nkitbet minn Fiona Park, Content Manager READ-COOP SCE, u Philip Kahle, Software Developer, READ COOP.
