Luonnonhistorialliset kokoelmat museoissa ympäri maailmaa ovat valtavia määriä säilyneitä biologisia näytteitä, jotka dokumentoivat planeettamme menneisyyden ja nykyisen biologisen monimuotoisuuden, mukaan lukien monet sukupuuttoon kuolleet lajit. Nämä kokoelmat sisältävät esineitä, kuten täytettyjä ja asennettuja eläimiä, kiinnitettyjä hyönteisiä, kuivattuja kasveja, siemeniä ja hedelmiä sekä kaikenlaisia fossiileja. Aikaisemmin suurin osa näistä näytteistä oli vain tutkijoiden saatavilla, mutta nykyään digitointi tekee niistä yhä näkyvämpiä yleisölle. Virtuaaliset kuvagalleriat ja 3D-mallit sekä videot ja äänitiedostot antavat mahdollisuuden tutustua museon varikkojen piilotettuihin aarteisiin, jotka eivät yleensä ole säännöllisten vierailijoiden käytettävissä. Europeanan luonnonhistorian aggregaattori OpenUp! toimittaa tällä hetkellä 8,7 miljoonaa esinettä 34 toimielimestä Europeana-portaaliin. Tämä tietojen toimittaminen perustuu luonnonhistorian alalla vakiintuneisiin tietoinfrastruktuureihin eli Biological Collection Access Service for Europe -palveluun ja Global Biodiversity Information Facility -välineeseen.
![Ursus thibetanus G.[Baron] Cuvier, 1823, Museumfür Naturkunde Berlin, Saksa, CC BY-SA](/files/Images/Blog_images/2019-01/Ursusthibetanus.jpeg)
Näiden kohteiden löytämiseksi Europeanan kokoelmista yleisin yhteyspiste on organismin nimi. Biologit käyttävät lajin nimeämiseen binomialeja, jotka koostuvat kahdesta osasta, kuten jääkarhusta Ursus maritimus. Toisin kuin yleisnimet eri kielillä, näitä (latinoituja) nimiä käytetään kansainvälisesti. Lajit, joilla on tiettyjä ominaisuuksia, ryhmitellään suvuiksi, jotka puolestaan ryhmitellään perheiksi. Määrittelemällä useita hierarkkisia organismiryhmiä, joilla on yhteiset ominaisuudet ja esivanhemmat (ns. taksonomia), biologit (taksonomit) luovat taksonomioita. Ursus maritimus -laji olisi tällaisen taksonomian alimmalla tasolla yhdessä Ursus arctos -lajin (ruskea karhu) ja Ursus thibetanus -lajin (aasialainen mustakarhu) kanssa. Se kuuluu Ursus-sukuun, joka puolestaan kuuluu Ursidae-heimoon. Korkeimmalla tasolla olisi Animalia valtakuntana.
Taksonomiat edustavat käsitystämme lajien biologisesta monimuotoisuudesta ja kehityksestä, jota tutkitaan jatkuvasti. Näin ollen taksonomiat ovat jatkuvassa virrassa. Kun uusia lajeja löydetään, uusia nimiä lisätään. Järjestelmällisessä tutkimuksessa voidaan havaita, että tietty laji liittyy läheisemmin toiseen sukuun, joten osa lajin binomiaalista on muutettava. Suku voidaan yhdistää toiseen sukuun tai jakaa useisiin sukuihin, mikä edellyttää useiden lajien nimien muuttamista. Kokonaisia taksoniryhmiä voidaan siirtää hierarkkisen puun muihin osiin, kun on saatu uutta tietoa yhteisestä syntyperästä, esimerkiksi tapauksissa, joissa perinteisesti käytettyjä morfologisia ominaisuuksia on tarkasteltava uudelleen molekyylinäytön perusteella. Erityispiirteet, kuten homonyymit (eri lajien identtiset nimet) ja synonyymit (useita nimiä yhdelle lajille), lisäävät taksonomiaan liittyviä ongelmia. Tällaisten dynaamisten tietojen käsittelyn monimutkaisuus on synnyttänyt uuden taksonomisen laskennan alan.

Perinteiset taksonomiat käsittelevät usein tiettyä organismien ryhmää, esimerkiksi tiettyä perhettä, luokkaa tai kuningaskuntaa, ja viittaavat tiettyyn maantieteelliseen alueeseen, jolla kuvattu ryhmä on tunnettu ja dokumentoitu. Esimerkkejä ovat alueelliset ”taksonomiset tarkistuslistat”, kuten Euro + Med PlantBase (Euroopan ja Välimeren alueen verisuonten kasvit) ja Fauna Europaea (Euroopan maa- ja makean veden eläimet), jotka ovat monien laitosten taksonomien yhteisiä toimia ja joita päivitetään jatkuvasti. Yleiseurooppalaisen lajihakemistoinfrastruktuurin (PESI) kaltaisissa aloitteissa eri yhteisöjen taksonomiat yhdistetään yhdeksi kaikki verot kattavaksi tarkistuslistaksi. Vastaavia aloitteita on tehty maailmanlaajuisesti: Elämänluettelo kokoaa 168 taksonomisesta tietokannasta saadut tiedot viralliseen tunnettujen eläin-, kasvi-, sieni- ja mikro-organismilajien indeksiin, johon on tällä hetkellä merkitty 1,8 miljoonaa maailman 1,9 miljoonasta nimetystä lajista. GBIF:n runkotaksonomia perustuu elämänluetteloon, ja sitä kootaan säännöllisesti automaattisessa prosessissa 56 lähteestä.
On sanomattakin selvää, että päätös siitä, mitä tarkistuslistaa kokoelmassa olisi käytettävä, riippuu taksonomisesta ja maantieteellisestä kattavuudesta. Taksonomioita päivitetään jatkuvasti, joten keräyskohteiden täsmäyttäminen johonkin mainituista tarkistuslistoista olisi tehtävä säännöllisin väliajoin. Useimmat niistä ovat saatavilla verkkopalvelujen kautta, jotka mahdollistavat helpon integroinnin olemassa oleviin infrastruktuureihin ja tuotteisiin. Alueellisia ja maailmanlaajuisia synonyymejä tarkistuslistoja, kuten PESI ja Elämänluettelo, voidaan käyttää kyselyn laajentamismekanismien toteuttamiseen, jotka laajentavat taksonin käyttäjäkyselyt kaikkiin tämän taksonin tunnettuihin synonyymeihin. Tällaiset kyselyjen laajentamistoiminnot ovat jo uusinta tekniikkaa biodiversiteettiportaaleissa.
Luonnonhistoriallisten näytteiden osalta linkitetyn avoimen datan tunnisteita on viime aikoina käytetty laajalti esimerkiksi ottamalla käyttöön eurooppalaisten taksonomisten laitosten yhteenliittymän (CETAF) HTTP-stabiileja tunnisteita. Taksonomian osalta keskustellaan samankaltaisista aloitteista, mutta taksonomian luontainen epävarmuus ja jatkuva virta tekevät taksonomiasta vaikeasti ymmärrettävän ja haittaavat tällaisia toimia.
Ongelma, jota ei voida ratkaista käyttämällä kanonisia taksonomioita, on virheiden tunnistaminen – näytteet erehtyvät tietylle lajille, mikä johtaa siihen, että esineistä käytetään virheellisiä nimiä. Tätä ei voida täysin välttää, kun otetaan huomioon, että joissakin kokoelmissa on miljoonia näytteitä, joita ei voida päivittää jatkuvasti. Tämä on otettava huomioon tietoja käytettäessä.

OpenUp!:ssa näyteobjekteille ei käytetä yhtenäistä taksonomiaa. Koska tietoja toimittavat laitokset, jotka ovat oman alansa asiantuntijoita, niiden odotetaan soveltavan tietoihinsa asianmukaisia tarkistuslistoja ennen niiden syöttämistä OpenUpiin. Saavutettavuuden parantamiseksi OpenUp! kuitenkin rikastaa objektien metadataa yleisillä nimillä 300 kielellä ja murteella, jotta laji voidaan löytää (tietyllä varmuudella) tietämättä sen tieteellistä nimeä. Jatkorikastus sisältää linkkejä biologisen monimuotoisuuden perintökirjastossa (BHL) saatavilla olevaan tieteelliseen kirjallisuuteen. BHL on konsortio, jonka tarkoituksena on tehdä biologista monimuotoisuutta koskevasta vanhasta kirjallisuudesta saatavilla olevaa verkossa.
Tunnustukset: Haluan kiittää kollegojani Walter Berendsohnia, Petra Böttingeriä, Gabi Drögeä, Anton Güntschiä, Agnes Kirchhovia ja Gerda Kochia heidän arvokkaista kommenteistaan ja ehdotuksistaan.
Kuvan attribuutit:
- Ursus thibetanus G.[Baron] Cuvier, 1823, Museumfür Naturkunde Berlin, Saksa, CC BY-SA
- Biologisen luokituksen seitsemän tärkeintä taksonomiaa ovat Peter Halasz, Wikimedia Commons, Public Domain.
- Testudo hermanni Gmelin, 1789, Muséum national d'Histoire naturelle, Ranska, CC BY-NC-ND
