Prirodoslovne zbirke u muzejima širom svijeta su spremišta ogromnih količina očuvanih bioloških primjeraka koji dokumentiraju prošlu i sadašnju bioraznolikost našeg planeta, uključujući mnoge izumrle vrste. Te zbirke sadrže predmete kao što su punjene i montirane životinje, prikvačeni insekti, sušene biljke, sjemenke i voće, kao i sve vrste fosila. U prošlosti je većina tih primjeraka bila dostupna samo znanstvenicima, ali ih danas digitalizacija čini sve vidljivijima javnosti. Virtualne galerije slika i 3D modela, kao i videozapisi i audiodatoteke, omogućuju istraživanje skrivenih blaga muzejskih skladišta koja su obično zabranjena za redovite posjetitelje. Europeanin agregator za prirodnu povijest OpenUp! trenutačno na portal Europeana unosi 8,7 milijuna predmeta iz 34 institucije. Ta se dostava podataka temelji na uspostavljenim podatkovnim infrastrukturama u području prirodne povijesti, odnosno na usluzi pristupa biološkoj zbirci za Europu i Globalnom informacijskom instrumentu za biološku raznolikost.
![Ursus thibetanus G.[Baron] Cuvier, 1823., Museumfür Naturkunde Berlin, Njemačka, CC BY-SA](/files/Images/Blog_images/2019-01/Ursusthibetanus.jpeg)
Kako bi se ti predmeti pronašli u zbirkama Europeana, najčešća pristupna točka je naziv organizma. Biolozi upotrebljavaju binome – nazive koji se sastoje od dva dijela, kao što je Ursus maritimus za polarnog medvjeda – kako bi označili vrste. Za razliku od uobičajenih naziva na različitim jezicima, ti se (latinski) nazivi koriste na međunarodnoj razini. Vrste koje dijele određene karakteristike grupirane su u rodove, koji se pak grupiraju u porodice. Definirajući nekoliko hijerarhijskih skupina organizama sa zajedničkim karakteristikama i podrijetlom (tzv. taksonomi), biolozi (taksonomisti) stvaraju taksonomije. Vrsta Ursus maritimus bila bi na donjoj razini takve taksonomije, zajedno s vrstom Ursus arctos (smeđi medvjed) i vrstom Ursus thibetanus (azijski crni medvjed) pripada rodu Ursus, koji pak pripada porodici Ursidae; Na najvišoj razini bila bi Animalia kao kraljevstvo.
Taksonomije predstavljaju naše razumijevanje biološke raznolikosti i evolucije vrsta, što je predmet stalnih istraživanja. Slijedom toga, taksonomije su u stalnom tijeku. Budući da su otkrivene nove vrste, dodat će se nova imena. Sustavnim istraživanjem moglo bi se otkriti da je određena vrsta uže povezana s drugim rodom, tako da se dio binoma vrste mora promijeniti. Rod se može spojiti s drugim rodom ili podijeliti u nekoliko rodova, što zahtijeva promjenu nekoliko naziva vrsta. Cijele taksonske skupine mogu se premjestiti u druge dijelove hijerarhijskog stabla kao rezultat novootkrivenog znanja o zajedničkom podrijetlu, npr. u slučajevima kada se tradicionalno korištene morfološke karakteristike moraju ponovno razmotriti u svjetlu molekularnih dokaza. Posebnosti kao što su homonimi (identični nazivi za različite vrste) i sinonimi (nekoliko naziva za jednu vrstu) pridonose poteškoćama u postupanju s taksonomijama. Složenost obrade takvih dinamičkih podataka dovela je do novog područja taksonomskog računalstva.

Tradicionalne taksonomije često se bave definiranom skupinom organizama, npr. određenom obitelji, klasom ili kraljevstvom, i odnose se na određenu zemljopisnu regiju u kojoj je opisana skupina dobro poznata i dokumentirana. Primjeri su regionalni „taksonomski kontrolni popisi”, kao što su Euro + Med PlantBase (vaskularne biljke u Europi i mediteranskoj regiji) i Fauna Europaea (europske kopnene i slatkovodne životinje), koji su zajednički napori taksonomista iz mnogih institucija i stalno se ažuriraju. Inicijative kao što je paneuropska infrastruktura za upravljanje vrstama (PESI) objedinjuju taksonomije iz različitih zajednica u jedinstveni kontrolni popis za sve poreze. Slične inicijative postoje na globalnoj razini: Katalog života objedinjuje podatke iz 168 taksonomskih baza podataka u autoritativni indeks poznatih vrsta životinja, biljaka, gljiva i mikroorganizama, koji trenutno navodi 1,8 milijuna od ukupno 1,9 milijuna navedenih vrsta na svijetu. Taksonomija okosnice GBIF-a temelji se na Katalogu života i redovito se sastavlja automatski iz 56 izvora.
Nepotrebno je reći da odluka o tome koji kontrolni popis treba koristiti za prikupljanje ovisi o taksonomskoj i zemljopisnoj pokrivenosti. Taksonomije se stalno ažuriraju, pa bi se usklađivanje predmeta prikupljanja s bilo kojim od navedenih kontrolnih popisa trebalo provoditi u redovitim vremenskim razmacima. Većina ih je dostupna putem internetskih usluga koje omogućuju jednostavnu integraciju u postojeće infrastrukture i proizvode. Regionalni i globalni sinonimizirani kontrolni popisi kao što su PESI i Katalog života mogu se koristiti za provedbu mehanizama širenja upita koji proširuju korisničke upite za takson na sve poznate sinonime ovog taksona. Takve funkcije širenja upita već su najsuvremenije na portalima za biološku raznolikost.
Kad je riječ o primjercima iz prirodne povijesti, identifikatori povezanih otvorenih podataka u nedavnoj su se prošlosti naširoko upotrebljavali, primjerice uvođenjem stabilnih identifikatora HTTP-a Konzorcija europskih taksonomskih objekata (CETAF). Kad je riječ o taksonomiji, raspravlja se o sličnim inicijativama, ali zbog inherentne nesigurnosti i stalnog protoka taksonomija taksonomije nije lako shvatiti i otežati takve napore.
Problem koji se ne može riješiti kanonskim taksonomijama jest pitanje pogrešne identifikacije – primjerci se zamijene za određenu vrstu, zbog čega se za predmete upotrebljavaju netočni nazivi. To se ne može u potpunosti izbjeći s obzirom na to da neke zbirke sadržavaju milijune primjeraka, koji se ne mogu stalno ažurirati. Stoga bi to trebalo uzeti u obzir pri korištenju podataka.

Za OpenUp!, ne koristi se jedinstvena taksonomija za primjerke predmeta. Budući da podatke dostavljaju institucije koje su stručnjaci u svojim područjima, od njih se očekuje da primjenjuju odgovarajuće kontrolne popise svojih podataka prije nego što ih unesu u OpenUp. Međutim, kako bi se povećala pristupačnost, OpenUp! obogaćuje metapodatke objekata uobičajenim nazivima na 300 jezika i dijalekata kako bi se vrsta mogla pronaći (uz određenu sigurnost) bez poznavanja njezina znanstvenog naziva. Dodatno obogaćivanje uključuje poveznice na znanstvenu literaturu dostupnu u knjižnici biološke raznolikosti (BHL), konzorciju posvećenom tome da literatura o biološkoj raznolikosti postane dostupna na internetu.
Priznanja: Zahvaljujem kolegama Walteru Berendsohnu, Petri Böttinger, Gabi Dröge, Antonu Güntschu, Agnes Kirchhoff i Gerdi Koch na njihovim vrijednim komentarima i prijedlozima.
Atribucije slika:
- Ursus thibetanus G.[Baron] Cuvier, 1823., Museumfür Naturkunde Berlin, Njemačka, CC BY-SA
- Sedam glavnih taksonomskih položaja biološke klasifikacije, Peter Halasz, Wikimedia Commons, Public Domain.
- Testudo hermanni Gmelin, 1789., Muséum national d'Histoire naturelle, Francuska, CC BY-NC-ND
