Natuurhistorische collecties in musea over de hele wereld zijn opslagplaatsen van enorme hoeveelheden bewaard gebleven biologische specimens die de vroegere en huidige biodiversiteit van onze planeet documenteren, waaronder veel uitgestorven soorten. Die collecties bevatten objecten zoals opgezette en opgezette dieren, gepinde insecten, gedroogde planten, zaden en fruit, evenals allerlei fossielen. In het verleden waren de meeste van deze exemplaren alleen toegankelijk voor wetenschappers, maar tegenwoordig maakt digitalisering ze steeds zichtbaarder voor het publiek. Virtuele galerijen met afbeeldingen en 3D-modellen, evenals video’s en audiobestanden, maken het mogelijk de verborgen schatten van de depots van het museum te verkennen, die normaal gesproken niet toegankelijk zijn voor gewone bezoekers. Europeana’s natuurhistorische aggregator, OpenUp!, levert momenteel 8,7 miljoen objecten van 34 instellingen aan het Europeana-portaal. Die gegevensverstrekking is gebaseerd op bestaande gegevensinfrastructuren op het gebied van de natuurgeschiedenis, namelijk de Biological Collection Access Service for Europe en de Global Biodiversity Information Facility.

Om deze voorwerpen in Europeana Collections te vinden, is het meest voorkomende toegangspunt de naam van het organisme. Biologen gebruiken binomialen – namen die uit twee delen bestaan, zoals Ursus maritimus voor de ijsbeer – om soorten aan te duiden. In tegenstelling tot veel voorkomende namen in verschillende talen worden deze (gelatiniseerde) namen internationaal gebruikt. Soorten die bepaalde kenmerken delen, worden gegroepeerd in geslachten, die op hun beurt worden gegroepeerd in families. Door verschillende hiërarchische groepen organismen met gedeelde kenmerken en afkomst (zogenaamde taxa) te definiëren, creëren biologen (taxonomen) taxonomieën. De soort Ursus maritimus zou zich op het laagste niveau van een dergelijke taxonomie bevinden, samen met Ursus arctos (bruine beer) en Ursus thibetanus (Aziatische zwarte beer) behoort het tot het geslacht Ursus, dat op zijn beurt behoort tot de familie Ursidae; Op het hoogste niveau zou Animalia als koninkrijk zijn.
Taxonomieën vertegenwoordigen ons begrip van de biodiversiteit en evolutie van soorten, die onderworpen is aan permanent onderzoek. De taxonomieën zijn constant in beweging. Naarmate er nieuwe soorten worden ontdekt, zullen er nieuwe namen worden toegevoegd. Systematisch onderzoek zou kunnen uitwijzen dat een bepaalde soort nauwer verwant is aan een ander geslacht, zodat een deel van de binomiaal van de soort moet worden gewijzigd. Een geslacht kan worden samengevoegd met een ander geslacht of worden opgesplitst in verschillende geslachten, waarvoor verschillende soortennamen moeten worden gewijzigd. Hele taxongroepen kunnen worden verplaatst naar andere delen van de hiërarchische boom als gevolg van nieuw ontdekte kennis over gemeenschappelijke afkomst, bijvoorbeeld in gevallen waarin traditioneel gebruikte morfologische kenmerken moeten worden heroverwogen in het licht van moleculair bewijs. Eigenaardigheden zoals homoniemen (identieke namen voor verschillende soorten) en synoniemen (verschillende namen voor één soort) maken het moeilijk om met taxonomieën om te gaan. De complexiteit van de verwerking van dergelijke dynamische gegevens heeft geleid tot het nieuwe gebied van taxonomische computing.

Traditionele taxonomieën hebben vaak betrekking op een bepaalde groep organismen, bijvoorbeeld een bepaalde familie, klasse of koninkrijk, en verwijzen naar een bepaald geografisch gebied, waarin de beschreven groep bekend en gedocumenteerd is. Voorbeelden zijn regionale “taxonomische checklists”, zoals Euro + Med PlantBase (vasculaire planten van Europa en het Middellandse Zeegebied) en Fauna Europaea (Europese land- en zoetwaterdieren), die gezamenlijke inspanningen zijn van taxonomen van vele instellingen en voortdurend worden bijgewerkt. Initiatieven zoals de pan-Europese infrastructuur voor soortengidsen (PESI) voegen taxonomieën uit verschillende gemeenschappen samen in één enkele, all-taxa-checklist. Soortgelijke initiatieven bestaan op mondiaal niveau: De Catalogue of Life bundelt gegevens uit 168 taxonomische databases in een gezaghebbende index van bekende soorten dieren, planten, schimmels en micro-organismen, die momenteel 1,8 miljoen van 's werelds 1,9 miljoen benoemde soorten bevat. De Backbone Taxonomy van GBIF bouwt voort op de Catalogue of Life en wordt regelmatig in een automatisch proces samengesteld uit 56 bronnen.
Onnodig te zeggen dat de beslissing over welke checklist moet worden gebruikt voor een verzameling afhankelijk is van de taxonomische en geografische dekking. Taxonomieën worden voortdurend bijgewerkt, dus de afstemming van verzamelobjecten op een van de genoemde checklists moet met regelmatige tussenpozen worden uitgevoerd. De meeste zijn beschikbaar via webservices die eenvoudige integratie in bestaande infrastructuren en producten mogelijk maken. Regionale en wereldwijde gesynonimiseerde checklists zoals PESI en de Catalogue of Life kunnen worden gebruikt om query-uitbreidingsmechanismen te implementeren die gebruikersquery's voor een taxon uitbreiden naar alle bekende synoniemen van dit taxon. Dergelijke query-uitbreidingsfuncties zijn al state-of-the-art in biodiversiteitsportalen.
Voor natuurhistorische specimens zijn Linked Open Data identifiers in het recente verleden op grote schaal gebruikt, bijvoorbeeld door de implementatie van de HTTP Stable Identifiers van het Consortium of European Taxonomic Facilities (CETAF). Voor taxa worden soortgelijke initiatieven besproken, maar de inherente onzekerheid en de constante stroom van taxonomieën maken taxa niet gemakkelijk te begrijpen en belemmeren dergelijke inspanningen.
Een probleem dat niet kan worden opgelost door canonieke taxonomieën te gebruiken, is het probleem van verkeerde identificaties – specimens die voor een bepaalde soort worden aangezien, waardoor onjuiste namen voor objecten worden gebruikt. Dit kan niet volledig worden vermeden, aangezien sommige collecties miljoenen exemplaren bevatten, die niet voortdurend kunnen worden bijgewerkt. Hiermee moet dus rekening worden gehouden bij het gebruik van de gegevens.

Voor OpenUp! wordt geen uniforme taxonomie gebruikt voor de specimenobjecten. Aangezien de gegevens worden verstrekt door instellingen die deskundigen zijn op hun respectieve gebieden, wordt van hen verwacht dat zij passende checklists op hun gegevens toepassen voordat zij deze aan OpenUp verstrekken. Om de toegankelijkheid te vergroten, verrijkt OpenUp! de metadata van de objecten echter met gemeenschappelijke namen in 300 talen en dialecten, zodat een soort (met enige zekerheid) kan worden gevonden zonder de wetenschappelijke naam ervan te kennen. Verdere verrijking omvat links naar wetenschappelijke literatuur die beschikbaar is in de Biodiversity Heritage Library (BHL), een consortium dat zich toelegt op het online toegankelijk maken van erfgoedliteratuur over biodiversiteit.
Erkenningen: Ik wil mijn collega’s Walter Berendsohn, Petra Böttinger, Gabi Dröge, Anton Güntsch, Agnes Kirchhoff en Gerda Koch bedanken voor hun waardevolle opmerkingen en suggesties.
Afbeeldingstoeschrijvingen:
- Ursus thibetanus G. Cuvier, 1823, Museumfür Naturkunde Berlijn, Duitsland, CC BY-SA
- De zeven belangrijkste taxonomische rangen van een biologische classificatie, Peter Halasz, Wikimedia Commons, Public Domain.
- Testudo hermanni Gmelin, 1789, Muséum national d'Histoire naturelle, Frankrijk, CC BY-NC-ND
