Οι συλλογές φυσικής ιστορίας σε μουσεία σε όλο τον κόσμο είναι αποθετήρια τεράστιων ποσοτήτων διατηρημένων βιολογικών δειγμάτων που τεκμηριώνουν την παρελθούσα και παρούσα βιοποικιλότητα του πλανήτη μας, συμπεριλαμβανομένων πολλών εξαφανισμένων ειδών. Αυτές οι συλλογές περιέχουν αντικείμενα όπως γεμιστά και τοποθετημένα ζώα, καρφωμένα έντομα, αποξηραμένα φυτά, σπόρους και φρούτα, καθώς και κάθε είδους απολιθώματα. Στο παρελθόν, τα περισσότερα από αυτά τα δείγματα ήταν προσβάσιμα μόνο στους επιστήμονες, αλλά σήμερα η ψηφιοποίηση τα καθιστά όλο και πιο ορατά στο κοινό. Οι εικονικές γκαλερί εικόνων και τρισδιάστατων μοντέλων, καθώς και τα βίντεο και τα αρχεία ήχου, επιτρέπουν την εξερεύνηση των κρυφών θησαυρών των αποθηκών του μουσείου, οι οποίοι είναι συνήθως εκτός ορίων για τους τακτικούς επισκέπτες. Ο συσσωρευτής φυσικής ιστορίας της Europeana, OpenUp!, συνεισφέρει επί του παρόντος 8,7 εκατομμύρια αντικείμενα από 34 ιδρύματα στη διαδικτυακή πύλη της Europeana. Η εν λόγω παροχή δεδομένων βασίζεται σε καθιερωμένες υποδομές δεδομένων στον τομέα της φυσικής ιστορίας, και συγκεκριμένα στην υπηρεσία πρόσβασης στη βιολογική συλλογή για την Ευρώπη και στον παγκόσμιο μηχανισμό πληροφοριών για τη βιοποικιλότητα.
![Ursus thibetanus G.[Baron] Cuvier, 1823, Museumfür Naturkunde Berlin, Γερμανία, CC BY-SA](/files/Images/Blog_images/2019-01/Ursusthibetanus.jpeg)
Για να βρείτε αυτά τα αντικείμενα στις συλλογές Europeana, το πιο κοινό σημείο πρόσβασης είναι το όνομα του οργανισμού. Οι βιολόγοι χρησιμοποιούν διώνυμα —ονόματα που αποτελούνται από δύο μέρη, όπως Ursus maritimus για την πολική αρκούδα— για τον χαρακτηρισμό ειδών. Σε αντίθεση με τα κοινά ονόματα σε διάφορες γλώσσες, αυτά τα (λατινικά) ονόματα χρησιμοποιούνται διεθνώς. Τα είδη που έχουν ορισμένα κοινά χαρακτηριστικά ομαδοποιούνται σε γένη, τα οποία με τη σειρά τους ομαδοποιούνται σε οικογένειες. Καθορίζοντας διάφορες ιεραρχικές ομάδες οργανισμών με κοινά χαρακτηριστικά και καταγωγή (τα λεγόμενα taxa), οι βιολόγοι (ταξονόμοι) δημιουργούν ταξινομίες. Το είδος Ursus maritimus θα βρίσκεται στο κατώτατο επίπεδο μιας τέτοιας ταξινόμησης, μαζί με την Ursus arctos (καφέ αρκούδα) και την Ursus thibetanus (ασιατική μαύρη αρκούδα), ανήκει στο γένος Ursus, το οποίο με τη σειρά του ανήκει στην οικογένεια των Ursidae· στο ανώτατο επίπεδο θα ήταν η Ζώια ως βασίλειο.
Οι ταξινομίες αντιπροσωπεύουν την κατανόησή μας για τη βιοποικιλότητα και την εξέλιξη των ειδών, η οποία υπόκειται σε μόνιμη έρευνα. Κατά συνέπεια, οι ταξινομίες βρίσκονται σε συνεχή ροή. Καθώς ανακαλύπτονται νέα είδη, προστίθενται νέα ονόματα. Η συστηματική έρευνα μπορεί να ανακαλύψει ότι ένα συγκεκριμένο είδος συνδέεται στενότερα με άλλο γένος, με αποτέλεσμα να πρέπει να αλλάξει μέρος του διωνυμικού του είδους. Ένα γένος μπορεί να συγχωνευθεί με ένα άλλο γένος ή να χωριστεί σε διάφορα γένη, γεγονός που απαιτεί την αλλαγή πολλών ονομάτων ειδών. Ολόκληρες ταξινομικές ομάδες μπορούν να μετακινηθούν σε άλλα μέρη του ιεραρχικού δέντρου ως αποτέλεσμα νέων γνώσεων σχετικά με την κοινή καταγωγή, π.χ. σε περιπτώσεις όπου τα μορφολογικά χαρακτηριστικά που χρησιμοποιούνται παραδοσιακά πρέπει να επανεξεταστούν υπό το πρίσμα μοριακών στοιχείων. Ιδιαιτερότητες όπως οι ομώνυμες ονομασίες (πανομοιότυπες ονομασίες για διαφορετικά είδη) και οι συνώνυμες ονομασίες (πολλές ονομασίες για ένα είδος) συνθέτουν τις δυσκολίες αντιμετώπισης των ταξινομιών. Η πολυπλοκότητα του χειρισμού αυτών των δυναμικών δεδομένων δημιούργησε το νέο πεδίο της ταξινομικής πληροφορικής.

Οι παραδοσιακές ταξινομίες συχνά ασχολούνται με μια καθορισμένη ομάδα οργανισμών, π.χ. μια συγκεκριμένη οικογένεια, τάξη ή βασίλειο, και αναφέρονται σε μια συγκεκριμένη γεωγραφική περιοχή, στην οποία η περιγραφόμενη ομάδα είναι γνωστή και τεκμηριωμένη. Παραδείγματα είναι οι περιφερειακοί «κατάλογοι ελέγχου ταξινόμησης», όπως το Euro + Med PlantBase (αγγειακά φυτά της Ευρώπης και της περιοχής της Μεσογείου) και η πανίδα Europaea (ζώα της ευρωπαϊκής γης και των γλυκών υδάτων), οι οποίοι αποτελούν κοινές προσπάθειες ταξινομιστών από πολλά ιδρύματα και επικαιροποιούνται συνεχώς. Πρωτοβουλίες όπως η πανευρωπαϊκή υποδομή καταλόγων ειδών (PESI) συγχωνεύουν ταξινομίες από διαφορετικές κοινότητες σε έναν ενιαίο κατάλογο ελέγχου όλων των ταξινομικών κατηγοριών. Παρόμοιες πρωτοβουλίες υπάρχουν σε παγκόσμιο επίπεδο: Ο Κατάλογος της Ζωής συγκεντρώνει δεδομένα από 168 ταξινομικές βάσεις δεδομένων σε έναν έγκυρο δείκτη γνωστών ειδών ζώων, φυτών, μυκήτων και μικροοργανισμών, ο οποίος σήμερα απαριθμεί 1,8 εκατομμύρια από τα 1,9 εκατομμύρια ονομαζόμενα είδη στον κόσμο. Η βασική ταξινομία του GBIF βασίζεται στον κατάλογο ζωής και συναρμολογείται τακτικά με αυτόματη διαδικασία από 56 πηγές.
Περιττό να πούμε ότι η απόφαση σχετικά με το ποιος κατάλογος ελέγχου θα πρέπει να χρησιμοποιείται για μια συλλογή εξαρτάται από την ταξινομική και γεωγραφική κάλυψη. Οι ταξινομίες υπόκεινται σε συνεχείς επικαιροποιήσεις, επομένως η αντιστοίχιση των αντικειμένων συλλογής με οποιονδήποτε από τους προαναφερθέντες καταλόγους ελέγχου θα πρέπει να πραγματοποιείται σε τακτά χρονικά διαστήματα. Τα περισσότερα από αυτά είναι διαθέσιμα μέσω διαδικτυακών υπηρεσιών που επιτρέπουν την εύκολη ενσωμάτωση σε υπάρχουσες υποδομές και προϊόντα. Οι περιφερειακές και παγκόσμιες συνωνυμοποιημένες λίστες ελέγχου, όπως το PESI και ο Κατάλογος Ζωής, μπορούν να χρησιμοποιηθούν για την εφαρμογή μηχανισμών επέκτασης ερωτημάτων που επεκτείνουν τα ερωτήματα των χρηστών για μια ταξινομική βαθμίδα σε όλα τα γνωστά συνώνυμα αυτής της ταξινομικής βαθμίδας. Οι εν λόγω λειτουργίες επέκτασης ερωτημάτων είναι ήδη προηγμένες στις πύλες για τη βιοποικιλότητα.
Για τα δείγματα φυσικής ιστορίας, τα αναγνωριστικά συνδεδεμένων ανοικτών δεδομένων έχουν χρησιμοποιηθεί ευρέως στο πρόσφατο παρελθόν, για παράδειγμα με την εφαρμογή των σταθερών αναγνωριστικών HTTP της κοινοπραξίας ευρωπαϊκών ταξινομικών εγκαταστάσεων (CETAF). Για τις ταξινομικές βαθμίδες συζητούνται παρόμοιες πρωτοβουλίες, αλλά η εγγενής αβεβαιότητα και η συνεχής ροή ταξινομιών καθιστούν τις ταξινομικές βαθμίδες δυσνόητες και παρεμποδίζουν τις προσπάθειες αυτές.
Ένα πρόβλημα που δεν μπορεί να επιλυθεί με τη χρήση κανονικών ταξινομήσεων είναι το ζήτημα των εσφαλμένων ταυτοποιήσεων — δείγματα που συγχέονται με ένα συγκεκριμένο είδος, γεγονός που έχει ως αποτέλεσμα τη χρήση εσφαλμένων ονομασιών για αντικείμενα. Αυτό δεν μπορεί να αποφευχθεί εντελώς, δεδομένου ότι ορισμένες συλλογές περιέχουν εκατομμύρια δείγματα, τα οποία δεν μπορούν να επικαιροποιούνται συνεχώς. Αυτό θα πρέπει να λαμβάνεται υπόψη κατά τη χρήση των δεδομένων.

Για το OpenUp!, δεν χρησιμοποιείται ομοιόμορφη ταξινομία για τα αντικείμενα δειγμάτων. Δεδομένου ότι τα δεδομένα παρέχονται από ιδρύματα που είναι εμπειρογνώμονες στους αντίστοιχους τομείς τους, αναμένεται από αυτά να εφαρμόζουν κατάλληλους καταλόγους ελέγχου για τα δεδομένα τους πριν τα διαβιβάσουν στο OpenUp. Ωστόσο, για να αυξηθεί η προσβασιμότητα, το OpenUp! εμπλουτίζει τα μεταδεδομένα των αντικειμένων με κοινές ονομασίες σε 300 γλώσσες και διαλέκτους, έτσι ώστε ένα είδος να μπορεί να βρεθεί (με κάποια βεβαιότητα) χωρίς να γνωρίζει την επιστημονική του ονομασία. Ο περαιτέρω εμπλουτισμός περιλαμβάνει συνδέσμους με την επιστημονική βιβλιογραφία που είναι διαθέσιμη στη Βιβλιοθήκη Κληρονομιάς της Βιοποικιλότητας (BHL), μια κοινοπραξία αφιερωμένη στο να καταστήσει την κληρονομιά της βιβλιογραφίας για τη βιοποικιλότητα προσβάσιμη στο διαδίκτυο.
Επιβεβαιώσεις: Θα ήθελα να ευχαριστήσω τους συναδέλφους μου Walter Berendsohn, Petra Böttinger, Gabi Dröge, Anton Güntsch, Agnes Kirchhoff και Gerda Koch για τις πολύτιμες παρατηρήσεις και προτάσεις τους.
Απονομές εικόνας:
- Ursus thibetanus G.[Baron] Cuvier, 1823, Museumfür Naturkunde Berlin, Γερμανία, CC BY-SA
- Οι επτά κύριες ταξινομικές τάξεις μιας βιολογικής ταξινόμησης, Peter Halasz, Wikimedia Commons, Public Domain.
- Testudo hermanni Gmelin, 1789, Muséum national d'Histoire naturelle, Γαλλία, CC BY-NC-ND
