Naturhistoriska samlingar i museer över hela världen är förråd av stora mängder bevarade biologiska exemplar som dokumenterar vår planets tidigare och nuvarande biologiska mångfald, inklusive många utdöda arter. Dessa samlingar innehåller föremål som fyllda och monterade djur, nålade insekter, torkade växter, frön och frukt samt alla typer av fossiler. Tidigare var de flesta av dessa exemplar endast tillgängliga för forskare, men idag gör digitaliseringen dem alltmer synliga för allmänheten. Virtuella gallerier med bilder och 3D-modeller samt videor och ljudfiler gör det möjligt att utforska de gömda skatterna i museets depåer, som vanligtvis inte är tillgängliga för vanliga besökare. Europeanas aggregator för naturhistoria, OpenUp!, bidrar för närvarande med 8,7 miljoner objekt från 34 institutioner till Europeana-portalen. Tillhandahållandet av uppgifter bygger på etablerade datainfrastrukturer på naturhistoriskt område, nämligen tjänsten för tillgång till biologisk insamling för Europa och den globala informationsfaciliteten för biologisk mångfald.

För att hitta dessa föremål i Europeana Collections är organismens namn den vanligaste åtkomstpunkten. Biologer använder binomialer – namn som består av två delar, såsom Ursus maritimus för isbjörnen – för att beteckna arter. I motsats till vanliga namn på olika språk används dessa (latiniserade) namn internationellt. Arter som delar vissa egenskaper grupperas i släkten, som i sin tur grupperas i familjer. Genom att definiera flera hierarkiska grupper av organismer med gemensamma egenskaper och anor (så kallade taxa) skapar biologer (taxonomer) taxonomier. Arten Ursus maritimus skulle befinna sig på bottennivån av en sådan taxonomi, tillsammans med Ursus arctos (brunbjörn) och Ursus thibetanus (asiatisk svartbjörn) tillhör den släktet Ursus, som i sin tur tillhör familjen Ursidae. På den högsta nivån skulle vara Animalia som ett kungarike.
Taxonomier representerar vår förståelse av arters biologiska mångfald och evolution, som är föremål för permanent forskning. Därför är taxonomierna i konstant flöde. När nya arter upptäcks kommer nya namn att läggas till. Systematisk forskning kan visa att en viss art är närmare besläktad med ett annat släkte, så att en del av artens binomial måste ändras. Ett släkte kan slås samman med ett annat släkte eller delas upp i flera släkten, vilket kräver att flera artnamn ändras. Hela taxongrupper kan flyttas till andra delar av det hierarkiska trädet som ett resultat av nyupptäckt kunskap om vanliga anor, t.ex. i fall där traditionellt använda morfologiska egenskaper måste omprövas mot bakgrund av molekylära bevis. Särdrag som homonymer (identiska namn för olika arter) och synonymer (flera namn för en art) bidrar till svårigheterna att hantera taxonomier. Komplexiteten i hanteringen av sådana dynamiska data gav upphov till det nya området taxonomisk databehandling.

Traditionella taxonomier behandlar ofta en definierad grupp av organismer, t.ex. en viss familj, klass eller rike, och hänvisar till en viss geografisk region, där den beskrivna gruppen är välkänd och dokumenterad. Exempel är regionala ”taxonomiska checklistor” som Euro + Med PlantBase (vaskulära växter i Europa och Medelhavsområdet) och Fauna Europaea (europeiska land- och sötvattensdjur), som är gemensamma insatser av taxonomer från många institutioner och ständigt uppdateras. Initiativ som den alleuropeiska infrastrukturen för artförteckningar (PESI) sammanför taxonomier från olika samhällen till en enda checklista för hela taxan. Liknande initiativ finns på global nivå: Catalogue of Life samlar data från 168 taxonomiska databaser i ett auktoritativt index över kända arter av djur, växter, svampar och mikroorganismer, som för närvarande listar 1,8m av världens 1,9m namngivna arter. GBIF:s ryggradstaxonomi bygger på livskatalogen och sammanställs regelbundet i en automatisk process från 56 källor.
Det behöver inte sägas att beslutet om vilken checklista som ska användas för en samling beror på den taxonomiska och geografiska täckningen. Taxonomier genomgår ständiga uppdateringar, så matchning av samlingsobjekt till någon av de nämnda checklistorna bör utföras med jämna mellanrum. De flesta av dem är tillgängliga via webbtjänster som möjliggör enkel integration i befintliga infrastrukturer och produkter. Regionala och globala synonymiserade checklistor som PESI och Catalogue of Life kan användas för att genomföra mekanismer för utvidgning av frågor som utvidgar användarfrågor för ett taxon till alla kända synonymer för detta taxon. Sådana frågeexpansionsfunktioner är redan toppmoderna i portaler för biologisk mångfald.
För naturhistoriska exemplar har länkade öppna dataidentifierare blivit allmänt använda under den senaste tiden, till exempel genom att implementera HTTP Stable Identifiers från Consortium of European Taxonomic Facilities (CETAF). För taxa diskuteras liknande initiativ, men den inneboende osäkerheten och det ständiga flödet av taxonomier gör taxa inte lätt att förstå och hindrar sådana insatser.
Ett problem som inte kan lösas med hjälp av kanoniska taxonomier är frågan om felidentifieringar – exemplar som förväxlas med en viss art, vilket leder till att felaktiga namn används för föremål. Detta kan inte helt undvikas med tanke på att vissa samlingar innehåller miljontals exemplar, som inte kan uppdateras hela tiden. Så detta bör beaktas när data används.

För OpenUp! används ingen enhetlig taxonomi för provobjekten. Eftersom uppgifterna tillhandahålls av institutioner som är experter inom sina respektive områden förväntas de tillämpa lämpliga checklistor på sina uppgifter innan de matas in i OpenUp. För att öka tillgängligheten berikar OpenUp! objektens metadata med vanliga namn på 300 språk och dialekter, så att en art kan hittas (med viss säkerhet) utan att veta dess vetenskapliga namn. Ytterligare berikning omfattar länkar till vetenskaplig litteratur som finns tillgänglig i Biodiversity Heritage Library (BHL), ett konsortium som ägnar sig åt att göra äldre litteratur om biologisk mångfald tillgänglig online.
Bekräftelser: Jag vill tacka mina kolleger Walter Berendsohn, Petra Böttinger, Gabi Dröge, Anton Güntsch, Agnes Kirchhoff och Gerda Koch för deras värdefulla kommentarer och förslag.
Bildattribut:
- Ursus thibetanus G. Cuvier, 1823, Museumfür Naturkunde Berlin, Tyskland, CC BY-SA
- En biologisk klassificerings sju stora taxonomiska rangordningar, Peter Halasz, Wikimedia Commons, Public Domain.
- Testudo hermanni Gmelin, 1789, Muséum national d'Histoire naturelle, Frankrike, CC BY-NC-ND
