Múnla le haghaidh aicmiú lipéid aonair
Bhí an tacar sonraí a bhailíomar dár dtreoirthionscadal aicmithe íomhá oiriúnach chun samhail aicmithe lipéid aonair a oiliúint - is é sin, samhail a aschuireann catagóir amháin in aghaidh na híomhá. Tugtar an ‘fhírinne talún’ freisin ar na lipéid nó ar na catagóirí ón tacar sonraí oiliúna, rud a chiallaíonn gurb iad sin na lipéid fhíora nó chearta le haghaidh na n-íomhánna ar leith.
D'úsáideamar cineál líonra neural convolutional mar ár n-aicmitheoir do na híomhánna, ar samhail mhatamaiticiúil é le struchtúr srathach spreagtha ag feidhmiú na hinchinne. Is samhail foghlama domhain é líonra neural convolutional atá deartha chun faisnéis ábhartha a bhaint as íomhánna, agus is iad an rogha is gnách d'fheidhmchláir fís ríomhaire.
Inár gcás féin, ba íomhá é ionchur an mhúnla, agus dáileadh dóchúlachta a bhí san aschur thar chatagóirí uile an spriocfhoclóra. Thug sé uimhir idir 0 agus 1 do gach catagóir a léirmhínítear go minic mar scór muiníne. Cuireadh oiliúint ar an tsamhail seo ansin trí íomhánna a thuar go atriallach ón tacar sonraí, agus na tuartha a bhí mar thoradh air a cheartú trí iad a chur i gcomparáid leis an bhfírinne talún iarbhír.

Nuair a cuireadh oiliúint ar an tsamhail, rinneamar measúnú ar a feidhmíocht trína tástáil ar íomhánna nach bhfacthas a leithéid riamh agus trí chomparáid a dhéanamh idir cé acu a chomhfhreagraíonn nó nach gcomhfhreagraíonn an tuar a rinne an tsamhail don choincheap a léirítear san íomhá. D’fhostaigh muid algartam intleachta saorga inmhínithe freisin a chuidigh linn aschur na samhla a thuiscint trí na réigiúin spéise do gach ceann de na catagóirí aschuir a shamhlú. Thug sé seo deis dúinn tuiscint a fháil ar na réimsí den íomhá is ábhartha do gach catagóir, a thug leideanna faoi oibriú inmheánach an mhúnla.
Anseo thíos, is féidir leat roinnt samplaí de thuar ar shamplaí a fuarthas trí úsáid a bhaint as an API Cuardaigh, mar aon leis na scóir muiníne agus na léarscáileanna inmhínitheachta. Úsáideann an tsamhail na híomhánna seo a leanas: aanzicht, Beeldbank van de Rijksdienst voor het Cultureel Erfgoed, an Ísiltír, G.Th. Scriosadh, 1965-03, CC-BY-SA. Lerkärl, kärl, vessel@eng, Vasija, Världskulturmuseet, an tSualainn, CC-BY. Esimene rohelus, Eesti Sõjamuuseum - Kindral Laidoneri Muuseum, an Eastóin, Genin, CC0.

Ár gcuid foghlama
Ó na torthaí roimhe seo, is féidir linn a fheiceáil go raibh an tsamhail in ann na coincheapa is ábhartha den fhoclóir a ghabháil go rathúil do na híomhánna a tugadh. Cé nach bhfuil sé foirfe, is féidir leis an tsamhail foghlaim ónár mbailiúcháin shaibhrithe, agus is féidir í a chur i bhfeidhm ar íomhánna nua chun meiteashonraí a d’fhéadfadh a bheith úsáideach a ghiniúint.
Is é príomhtheorainn ár gcur chuige nach bhfuil coincheapa an fhoclóra eisiach, agus nach bhfuil sé sin ag teacht go maith le haicme amháin in aghaidh na híomhá. Mar shampla, is féidir le grianghraf a bheith ina ghrianghraf agus foirgneamh agus dealbh araon a bheith ann, ach mar gheall ar chur chuige an lipéid aonair ní féidir linn ach ár múnla a oiliúint agus a mheas chun ceann de na gnéithe seo a aithint.
Tugann sé seo samhail dúinn a chuireann scór ard muiníne ar fáil go minic do cheann amháin de na catagóirí, agus an mhuinín don chuid eile de na catagóirí íseal. Trí thairseach íseal a leagan síos do scóir muiníne an aschuir, is féidir linn níos mó ná lipéad amháin a fháil mar an t-aschur. Mar sin féin, níl an cur chuige seo oiriúnach ós rud é go gcaithfidh na scóir muiníne go léir a bheith suas le ceann amháin (mar atá in aon dáileadh dóchúlachta dlíthiúla), rud a chuireann cosc ar luachanna ardmhuiníne i gcás stór focal le catagóirí éagsúla.
Go hidéalach, is aicmitheoir il-lipéad a bheadh inár múnla - samhail atá oilte le níos mó ná lipéad amháin in aghaidh na híomhá agus atá in ann scóir ardmhuiníne a aschur do roinnt catagóirí.
Is fiú a lua freisin gur cuireadh ár dtacar sonraí le chéile gan maoirseacht dhaonna (ní dhearnamar athbhreithniú ar na híomhánna a fuarthas ná ní dhearnamar seiceáil ar cé acu atá nó nach bhfuil siad ailínithe leis na catagóirí). Ciallaíonn sé sin go mbeidh cáilíocht an tacair sonraí ag brath ar na meiteashonraí a bhaineann leis na réada oidhreachta cultúrtha agus ar shaibhrithe uathoibríocha roimhe sin bunaithe ar mheiteashonraí. Sa chleachtas, ní raibh na híomhánna uile ón tacar sonraí oiliúna ailínithe leis na catagóirí cearta.
Na chéad chéimeanna eile
Tá tacar sonraí oiliúna á chur le chéile againn faoi láthair le haghaidh aicmiú illipéid, agus roinnfimid ár gcuid oibre agus ár gcur chuige i bpost Pro news amach anseo - fan tiúnta! Idir an dá linn, is féidir leat iniúchadh a dhéanamh ar ár stór Github don phíolóta, agus ar an leabhar nótaí Colab seo, áit ar féidir leat do cheisteanna féin a chur ar API Cuardaigh Europeana agus samhail aicmithe an lipéid aonair a chur i bhfeidhm.
Ná bíodh drogall ort teagmháil a dhéanamh linn ag [email protected] má tá aon cheist nó smaoineamh agat!
