Naturhistoriske samlinger på museer over hele verden er depoter af enorme mængder af bevarede biologiske prøver, der dokumenterer vores planets tidligere og nuværende biodiversitet, herunder mange uddøde arter. Disse samlinger indeholder genstande som udstoppede og monterede dyr, fastgjorte insekter, tørrede planter, frø og frugt samt alle former for fossiler. Tidligere var de fleste af disse eksemplarer kun tilgængelige for forskere, men i dag gør digitalisering dem mere og mere synlige for offentligheden. Virtuelle gallerier med billeder og 3D-modeller samt videoer og lydfiler gør det muligt at udforske de skjulte skatte i museets depoter, der normalt er uden for grænserne for regelmæssige besøgende. Europeanas aggregator for naturhistorie, OpenUp!, bidrager i øjeblikket med 8,7 mio. genstande fra 34 institutioner til Europeana-portalen. Denne levering af data er baseret på etablerede datainfrastrukturer på området naturhistorie, nemlig tjenesten for adgang til biologisk indsamling for Europa og den globale biodiversitetsinformationsfacilitet.
![Ursus thibetanus G.[Baron] Cuvier, 1823, Museumfür Naturkunde Berlin, Tyskland, CC BY-SA](/files/Images/Blog_images/2019-01/Ursusthibetanus.jpeg)
For at finde disse objekter i Europeana Collections er det mest almindelige adgangspunkt organismens navn. Biologer bruger binomialer – navne, der består af to dele, såsom Ursus maritimus for isbjørnen – til at udpege arter. I modsætning til almindelige navne på forskellige sprog bruges disse (latinske) navne internationalt. Arter med visse karakteristika er grupperet i slægter, som igen er grupperet i familier. Ved at definere flere hierarkiske grupper af organismer med fælles karakteristika og herkomst (såkaldte taxa) skaber biologer (taxonomister) taksonomier. Arten Ursus maritimus vil ligge i bunden af en sådan taksonomi sammen med Ursus arctos (brun bjørn) og Ursus thibetanus (asiatisk sortbjørn) og tilhører slægten Ursus, som igen tilhører familien Ursidae. På det øverste niveau ville være Animalia som et kongerige.
Taksonomier repræsenterer vores forståelse af arternes biodiversitet og udvikling, som er genstand for permanent forskning. Derfor er taksonomier i konstant flow. Efterhånden som nye arter opdages, vil nye navne blive tilføjet. Systematisk forskning kan vise, at en bestemt art er tættere beslægtet med en anden slægt, så en del af artens binomiale skal ændres. En slægt kan fusioneres med en anden slægt eller opdeles i flere slægter, hvilket kræver, at flere artsnavne ændres. Hele systematiske grupper kan flyttes til andre dele af det hierarkiske træ som følge af nyopdaget viden om fælles herkomst, f.eks. i tilfælde, hvor traditionelt anvendte morfologiske karakteristika skal genovervejes i lyset af molekylære beviser. Særtræk såsom enslydende betegnelser (identiske betegnelser for forskellige arter) og synonymer (flere betegnelser for en art) bidrager til de vanskeligheder, der er forbundet med taksonomier. Kompleksiteten i håndteringen af sådanne dynamiske data gav anledning til det nye område for taksonomisk databehandling.

Traditionelle taksonomier beskæftiger sig ofte med en defineret gruppe af organismer, f.eks. en bestemt familie, klasse eller kongerige, og henviser til et bestemt geografisk område, hvor den beskrevne gruppe er velkendt og dokumenteret. Eksempler herpå er regionale "taksonomiske tjeklister" såsom Euro + Med PlantBase (vaskulære planter i Europa og Middelhavsområdet) og Fauna Europaea (europæiske land- og ferskvandsdyr), som er en fælles indsats fra taksonomister fra mange institutioner, og som løbende ajourføres. Initiativer som f.eks. den paneuropæiske artsfortegnelsesinfrastruktur (PESI) samler taksonomier fra forskellige samfund i én fælles taksonomitjekliste. Lignende initiativer findes på globalt plan: Kataloget samler data fra 168 taksonomiske databaser i et autoritativt indeks over kendte arter af dyr, planter, svampe og mikroorganismer, som i øjeblikket lister 1,8 m af verdens 1,9 m navngivne arter. GBIF's Backbone Taxonomy bygger på Catalogue of Life og samles regelmæssigt i en automatisk proces fra 56 kilder.
Det er overflødigt at sige, at beslutningen om, hvilken tjekliste der skal anvendes til en samling, afhænger af den taksonomiske og geografiske dækning. Taksonomier undergår konstante opdateringer, så matchning af indsamlingsobjekter til nogen af de nævnte tjeklister bør udføres med jævne mellemrum. De fleste af dem er tilgængelige via webtjenester, der muliggør nem integration i eksisterende infrastrukturer og produkter. Regionale og globale synonymiserede tjeklister som PESI og Catalogue of Life kan bruges til at implementere forespørgselsudvidelsesmekanismer, der udvider brugerforespørgsler til en taxon til alle kendte synonymer for denne taxon. Sådanne forespørgselsudvidelsesfunktioner er allerede avancerede i biodiversitetsportaler.
For naturhistoriske enheder er identifikatorer for sammenkædede åbne data blevet almindeligt anvendt i den seneste tid, f.eks. ved at implementere HTTP Stable Identifiers of the Consortium of European Taxonomic Facilities (CETAF). For taxa drøftes lignende initiativer, men den iboende usikkerhed og den konstante strøm af taksonomier gør taxa ikke let at forstå og hæmmer sådanne bestræbelser.
Et problem, der ikke kan løses ved hjælp af kanoniske taksonomier, er spørgsmålet om fejlidentifikationer – enheder, der forveksles med en bestemt art, hvilket resulterer i, at der anvendes forkerte navne på objekter. Dette kan ikke helt undgås i betragtning af, at nogle samlinger indeholder millioner af eksemplarer, som ikke kan opdateres konstant. Det skal der tages højde for ved brug af data.

For OpenUp! anvendes der ingen ensartet taksonomi for prøveobjekterne. Da dataene leveres af institutioner, der er eksperter på deres respektive områder, forventes de at anvende passende tjeklister på deres data, inden de overføres til OpenUp. For at øge tilgængeligheden beriger OpenUp! imidlertid objekternes metadata med almindelige navne på 300 sprog og dialekter, således at en art (med en vis sikkerhed) kan findes uden at kende dens videnskabelige navn. Yderligere berigelse omfatter links til videnskabelig litteratur, der er tilgængelig i Biodiversity Heritage Library (BHL), et konsortium, der er dedikeret til at gøre ældre litteratur om biodiversitet tilgængelig online.
Anerkendelser: Jeg vil gerne takke mine kolleger Walter Berendsohn, Petra Böttinger, Gabi Dröge, Anton Güntsch, Agnes Kirchhoff og Gerda Koch for deres værdifulde kommentarer og forslag.
Billedtilskrivninger:
- Ursus thibetanus G.[Baron] Cuvier, 1823, Museumfür Naturkunde Berlin, Tyskland, CC BY-SA
- En biologisk klassifikations syv store taksonomiske rækker, Peter Halasz, Wikimedia Commons, Public Domain.
- Testudo hermanni Gmelin, 1789, Muséum national d'Histoire naturelle, Frankrig, CC BY-NC-ND
