Seoladh an t-ardán Transcribathon in 2016 agus rinne dhá thionscadal Seirbhísí Cineálacha tuilleadh forbartha air: Enrich Europeana (2018-2020) agus Enrich Europeana Plus (2021-2023). Ligeann an t-ardán d'oibrithe deonacha téacsanna stairiúla lámhscríofa a thras-scríobh i dteangacha éagsúla agus ó thréimhsí stairiúla éagsúla, gan aon rud níos mó ná a ríomhaire a úsáid. Ó cuireadh tús leis na tionscadail, rinne oibrithe deonacha breis agus 372,000 doiciméad a thras-scríobh agus rinneadh comhaid téacs dhigiteacha díobh, rud a chuidigh le bailiúcháin ollmhóra earraí oidhreachta cultúrtha digiteacha Europeana a leathnú agus a shaibhriú.
In 2021, thosaigh tionscadal Enrich Europeana Plus ag nuashonrú ardán Transcribathon le hardteicneolaíocht aitheanta lámhscríbhneoireachta, a úsáideann intleacht shaorga chun trascríbhinní uathoibríocha a sholáthar ar féidir le hoibrithe deonacha iad a sheiceáil ansin. Ceann de na soláthraithe is mó de theicneolaíocht den sórt sin is ea READ-COOP, Comharchumann Eorpach a bhainistíonn na bogearraí Transkribus a bhfuil an-tóir orthu . Chaith Enrich Europeana Plus roinnt míonna ag obair le READ-COOP agus ag ionchorprú a dteicneolaíochta san ardán Transcribathon.
Transcribathon a nascadh leis an API ‘metagrapho’
Forbraíodh bogearraí Transkribus mar chuid de thionscadal atá maoinithe ag an Aontas Eorpach faoi stiúir Ollscoil Innsbruck, rud a fhágann gur féidir doiciméid lámhscríofa stairiúla a thras-scríobh go huathoibríoch ar mhórscála. Úsáideann an teicneolaíocht IS chun ‘foghlaim’ conas cineálacha sonracha lámhscríbhneoireachta a léamh, agus ansin cuireann sí an t-eolas sin chun feidhme chun trascríbhinní uathoibríocha téacsanna a chruthú. Cuireann sé seo go mór leis an bpróiseas trascríobh: ní gá don tras-scríobhaí uaireanta an chloig a chaitheamh a thuilleadh ag scríobh tras-scríbhinne ón tús, mar is féidir leo an tras-scríobh uathoibríoch a phrofléamh ina ionad sin.
Tá teicneolaíocht aitheantais lámhscríbhneoireachta cosúil le Transkribus oiriúnach go háirithe do thionscadail eolaíochta saoránach. Dá éasca atá sé na doiciméid sin a thras-scríobh, is ea is mó doiciméad is féidir leis na saorálaithe a phróiseáil laistigh de thréimhse ama áirithe, agus is tapúla is féidir suíomh gréasáin Europeana a shaibhriú. Dá bhrí sin, bhí fonn ar fhoireann Transcribathon an teicneolaíocht seo a chur i bhfeidhm san ardán.
Chun é sin a dhéanamh, chinn siad API metagrapho READ-COOP a úsáid chun cur ar chumas Transcribathon rochtain a fháil ar theicneolaíocht Transkribus. Is píosa bogearraí é API a fheidhmíonn mar theachtaire idir dhá ardán éagsúla. Iarrann duine éigin faisnéis ar ardán amháin, agus seolann an t-ardán an t-iarratas seo chuig API ardáin eile. Nuair a bheidh freagra ag an dara hardán seo ar an iarratas, tugann an API ar ais chuig an gcéad ardán é agus faigheann an duine an fhaisnéis a theastaíonn uathu.
Úsáideann an t-ardán Transcribathon an API metagrapho ar an mbealach seo go díreach. Nuair is mian le saorálaí trascríobh uathoibríoch a fháil ar théacs, iarrann siad é seo ar an ardán Transcribathon. Ansin cuireann Transcribathon an t-iarratas seo chuig an metagrapho API, a úsáideann teicneolaíocht aitheantais lámhscríbhneoireachta chun an íomhá a phróiseáil agus trascríobh uathoibríoch a ghiniúint. Ar deireadh, a luaithe a bheidh an phróiseáil críochnaithe, is féidir leis an ardán Transcribathon rochtain a fháil ar an tras-scríobh agus é a thaispeáint don oibrí deonach, arís tríd an API metagrapho.
Ní amháin go soláthraíonn an API metagrapho an tras-scríobh ach freisin na comhordanáidí do gach líne nó fiú focal atá le fáil san íomhá - rud nach raibh indéanta sa seanleagan de Transcribathon. Fágann an ghné seo gur féidir na tras-scríbhinní a úsáid ansin le haghaidh tuilleadh feidhmchlár, mar shampla eochairfhocail mheaitseála a aibhsiú sa téacs le linn cuardach téacs iomlán.
Eagarthóir tras-scríofa feabhsaithe
Chiallaigh nuashonrú na teicneolaíochta taobh thiar de Transcribathon nach raibh an t-eagarthóir trascríobh - an chuid a úsáideann oibrí deonach chun a gcuid trascríbhinní a ionchur - in ann déileáil leis an bhformáid sonraí níos saibhre a bhí á fháil aige ar ais ón metagrapho API. Dá bhrí sin, thóg READ-COOP eagarthóir trascríobh saincheaptha do Transcribathon. Ligeann sé seo do dhaoine cliceáil ar líne den tras-scríobh, agus an líne chomhfhreagrach a fheiceáil in íomhá an téacs.
Chun an próiseas a bhrostú, ghlac READ-COOP an t-eagarthóir atá ann cheana sna bogearraí Transkribus, mhodhnaigh sé é chun freastal ar riachtanais Transcribathon, agus d'iompaigh sé ina ghiuirléid é. Ansin cuireadh an ghiuirléid isteach san ardán Transcribathon, rud a fhágann gur féidir le húsáideoirí na trascríbhinní a ghineann an API metagrapho a rochtain agus a chur in eagar. Ag baint úsáide as an eagarthóir Transkribus atá ann cheana féin agus go simplí a mhodhnú shábháil sé freisin am forbartha luachmhar agus costais.
Cumhacht an Chomhoibrithe
Tógann na nuashonruithe teicneolaíochta seo Transcribathon go dtí an chéad leibhéal eile. In ionad trascríbhinní a thógann go leor ama a chruthú ón tús, is féidir le hoibrithe deonacha trascríbhinní a ghintear go huathoibríoch san eagarthóir trascríobh nua a cheartú anois, rud a chabhraíonn leo i bhfad níos mó doiciméad a phróiseáil le linn rith.
Tá oiliúint á cur ag READ-COOP faoi láthair ar na samhlacha intleachta saorga maidir le haitheantas téacs lámhscríofa ar bhonn ábhar atá tras-scríofa cheana féin, nó ar bhonn ábhar atá le tras-scríobh go luath, in Transcribathon. Dá fheabhas a chuirfear samhail na hintleachta saorga in oiriúint don ábhar a bhfuiltear ag díriú air, is ea is cruinne a bheidh na tras-scríbhinní uathoibríocha.
Mar shampla, beidh scanadh de chártaí ciondála ó Chartlann an Stáit i Ságrab, a úsáideadh le linn WW2 (ó 1941 1945.) mar chineál ciondála bia agus acmhainní eile, mar chuid de Rith Transcribathon amháin atá ar na bacáin. Tá táscairí déimeagrafacha agus socheacnamaíocha sna cártaí do dhaoine aonair agus/nó do theaghlaigh amhail teidil, poist, agus dá bhrí sin is foinse shaibhir ábhair taighde iad.
Mar ullmhúchán don rith seo, reáchtáil READ-COOP seimineár gréasáin le fostaithe na cartlainne, chun a thaispeáint dóibh conas sonraí oiliúna a ullmhú. Úsáidfear na sonraí oiliúna sin ansin chun oiliúint a chur ar shamhail lámhscríbhneoireachta nó chun an t-inneall a mhúineadh conas doiciméid den chineál sin a léamh, ionas gur féidir léi tras-scríbhinní níos cruinne a chur ar fáil le linn na tréimhse reatha. Ba cheart go gcuirfeadh sé sin, in éineacht le scileanna profléitheoireachta na n-oibrithe deonacha, ar chumas chartlann Shágraib líon níos mó doiciméad a dhigitiú ná riamh.
Tuilleadh eolais
Is féidir leat athbhreithniú a dhéanamh ar an seimineár gréasáin maidir le conas sonraí oiliúna a ullmhú san fhíseán seo. Gheobhaidh tú comhtháthú an eagarthóra d'Aitheantas Téacs Lámhscríofa uathoibríoch ar ardán Transcribathon agus is féidir leat na chéad torthaí ó pháipéir Bhaile Átha Cliath a sheiceáil.
Scríobh Fiona Park, Bainisteoir Ábhar READ-COOP SCE, agus Philip Kahle, Forbróir Bogearraí, READ COOP an post seo.
