Trí mheiteashonraí na hoidhreachta cultúrtha a shaibhriú le clibeanna agus tuairiscí níos fearr, tá sé níos éasca do dhuine ar bith na réada oidhreachta cultúrtha sin a chuardach agus a aimsiú, rud a chiallaíonn go bhfaighidh tú an méid atá uait níos tapúla agus níos éasca. Leis an dul chun cinn a rinneadh le déanaí i réimse na teicneolaíochta faisnéise agus na hintleachta saorga, cuirtear deiseanna suntasacha ar fáil chun meiteashonraí na hoidhreachta cultúrtha a shaibhriú go huathoibríoch leis na hacmhainní is lú is féidir. Mar sin féin, tá sé fós tábhachtach go mbeadh daoine páirteach san obair seo. Sa tionscadal CRAFTED, táimid ag glacadh leis an oidhreacht cheardaíochta mar chás-staidéar chun modheolaíocht a chruthú, a chur chun feidhme agus a thástáil lena gcomhcheanglaítear algartaim le bailíochtú daonna chun meiteashonraí na hoidhreachta cultúrtha a shaibhriú ar scála.
Tá ceithre phríomhchéim sa mhodheolaíocht, a leagaimid amach thíos: anailís sonraí; saibhriú uathoibríoch; bailíochtú na saibhrithe ag daoine; agus saibhrithe a bheachtú bunaithe ar thorthaí an bhailíochtaithe. I ngach ceann de na céimeanna sa phróiseas seo, chuaigh muid i ngleic le roinnt ceisteanna ríthábhachtacha. Cad iad na cineálacha saibhrithe atá úsáideach do chineálacha éagsúla sonraí? Conas a roghnaíonn muid samplaí cuí lena mbailíochtú ag an duine? Conas is féidir linn tairseacha cáilíochta inghlactha a bhunú le haghaidh saibhrithe uathoibríocha?
Anailís sonraí
Is céad chéim ríthábhachtach é tuiscint mhionsonraithe a fháil ar na meiteashonraí agus ar an ábhar sna bailiúcháin a roghnaítear le haghaidh saibhrithe, chomh maith le cuspóirí saibhrithe iomchuí a shainiú, chun na ceanglais nach mór dár n-uirlisí a chomhlíonadh a chinneadh. Tá sé tábhachtach staidéar a dhéanamh ar theangacha agus séimeantaic éagsúla gach réimse meiteashonraí, chomh maith leis an gcaoi a bhfuil a luachanna struchtúrtha (mar shampla, agus iad ag féachaint ar réimse a thugann faisnéis spásúil d’fhéadfadh duine a fháil amach go mbíonn a luach struchtúrtha go minic i bhformáid ‘cathair / réigiúin’). Ar an gcaoi chéanna, ní mór grinnscrúdú a dhéanamh ar shaintréithe an ábhair chun gnéithe fiúntacha is féidir a dhíorthú uaidh a shainaithint, agus gnéithe amhail an taifeach íomhánna atá ar fáil agus an chaoi a léirítear réada in íomhánna á gcur san áireamh.
Saibhriú uathoibríoch
Sa tionscadal CRAFTED tá roinnt uirlisí éagsúla curtha i bhfeidhm againn chun anailís a dhéanamh ar mheiteashonraí téacsúla agus ar ábhar réimse mór bailiúchán a bhfuil saintréithe agus riachtanais shaibhrithe éagsúla acu. Chun anailís a dhéanamh ar mheiteashonraí, bhaineamar úsáid as an ardán SAGE (Nótaíocht Shéimeantach agus Saibhreas a Ghiniúint) a d’fhorbair Ollscoil Theicniúil Náisiúnta na hAithne. Tá an t-ardán in ann anailís a dhéanamh ar mheiteashonraí téacsúla i dteangacha éagsúla agus réimse leathan coincheap cás-oiriúnach (amhail ábhair agus teicnící) a luaitear sna meiteashonraí a shainaithint. Is féidir leis ansin iad a nascadh le téarmaí ó fhoclóiríní ar líne a bhaineann go sonrach le fearann ar leith, amhail teasáras Faisin Europeana a chumhdaíonn coincheapa a bhaineann le faisean. Is féidir leis eastóscadh eintitis ainmnithe níos ilchuspóirí a dhéanamh freisin chun eagraíochtaí, áiteanna agus daoine a shainaithint, agus iad a nascadh le boinn eolais Nasctha Oscailte amhail Wikidata.
Ag an am céanna, bhaineamar triail as roinnt uirlisí a dhéanann anailís ar íomhánna agus ar fhíseáin. Bhaineamar triail as dhá phríomhchur chuige chun dath a bhrath: déanann an chéad chur chuige idirdhealú idir an tulra agus an cúlra, agus ina dhiaidh sin déanann sé iarracht dath/dathanna na tulra braite a bhaint. Déanann an dara cur chuige an rud céanna go bunúsach, ach cabhraíonn algartam braite réad oilte leis. Rinneamar iarracht freisin téacs scríofa a bhrath agus a bhaint as íomhánna ag baint úsáide as OCR (Aitheantas Carachtair Optúil). Ar deireadh, bhaineamar trascríbhinní téacsúla as físeáin, le torthaí measctha ag brath ar an teanga labhartha.
Bailíochtú daonna
Sa tríú céim den mhodheolaíocht, iarrtar ar dhaoine torthaí na céime anótála uathoibrithe a sheiceáil agus glacadh leo nó diúltú dóibh. Is féidir leis na bailíochtóirí daonna nótaí nua a chur leis freisin nár shainaithin an t-algartam uathoibríoch.
Admittedly, an níos mó de na anótálacha uathoibríoch bailíochtaithe, is amhlaidh is fearr. Mar sin féin, tá na mílte de na nótaí uathoibrithe seo ann, agus is próiseas an-dian ar acmhainní é bailíochtóirí daonna a bheith ag dul tríothu. Mar sin, ina ionad sin déanaimid athbhreithniú ar shampla de na nótaí a roghnaítear chun ligean dúinn conclúidí a tharraingt faoi na nótaí uathoibríocha go léir.
Ní mór roinnt tosca a chur san áireamh le linn roghnú an tsampla. Maidir leis an anailís meiteashonraí, ní mór don sampla réimsí meiteashonraí éagsúla a chumhdach le faid téacs éagsúla, na scóir cinnteachta a mheas a shanntar do na halgartaim anótála dá nótaí (a thugann le fios cé chomh muiníneach agus a bhraitheann siad go bhfuil siad ceart), agus mar sin de. Ar an gcaoi chéanna, maidir leis an anailís ábhair, ní mór léiriú cothrom a choinneáil sa sampla ar mhíreanna a bhfuil saintréithe éagsúla inneachair acu, mar shampla, le dathanna éagsúla agus cineálacha éagsúla réad.

Anailís a dhéanamh ar aiseolas ó dhaoine chun ár saibhrithe a bheachtú
Tá sé mar aidhm againn anailís a dhéanamh ar an gcomhghaol idir na scóir muiníne uathoibríocha a shanntar lenár n-algartaim anótála agus ár mbreithiúnais dhaonna, ionas gur féidir linn a fháil amach cad é tairseach iomchuí chun a mheas go bhfuil anótáil uathoibríoch bailí nó nach bhfuil. Mar shampla, má bhíonn claonadh ag daoine glacadh le gach anótáil shamplach ar thug an tsamhail uathoibrithe scór muiníne 80% nó níos airde ina leith, féadfaimid a chinneadh gur féidir glacadh go huathoibríoch le gach anótáil os cionn an scóir sin mar anótáil bhailí. Is féidir le bailíochtú daonna cabhrú linn éifeachtacht halgartaim éagsúla a mheas agus a chur i gcomparáid. Is é an sprioc dheireanach sin an cuspóir atá le feachtas sluafhoinsithe a tionscnaíodh le déanaí agus arb é is aidhm dó meastóireacht a dhéanamh ar na torthaí a thagann as dhá algartam braite dathanna éagsúla. Is féidir leat cabhrú linn ár samhlacha anótála a mheas freisin!
Ar deireadh, ba mhaith linn aiseolas daonna a úsáid chun cruinneas na n-algartam uathoibríoch féin a fheabhsú. Cé nach bhfuil algartaim athoiliúna atá ag brath ar theicnící meaisínfhoghlama i measc chuspóirí thionscadal CRAFTED, is féidir le haiseolas daonna cabhrú linn na halgartaim a thweakáil i dtreo torthaí cruinnis níos airde a bhaint amach.
Glac páirt
Más mian leat cabhrú linn meastóireacht a dhéanamh ar na torthaí a thagann as ár n-algartaim braite dathanna, iarraimid ort cur le ceann de na feachtais sluafhoinsithe seo a leanas:
