Μέθοδοι από τον τομέα της τεχνητής νοημοσύνης (ΤΝ) και της μηχανικής μάθησης (ΜΜ) έχουν συμβάλει στη διεύρυνση των τεχνολογικών ορίων σε διάφορους τομείς, μεταξύ άλλων στον τομέα της πολιτιστικής κληρονομιάς (η ενδιάμεση έκθεση της EuropeanaTech AI σε σχέση με την ειδική ομάδα GLAM και η πρωτοβουλία AI4LAM παρέχουν ορισμένα παραδείγματα). Για να ενθαρρύνει την καινοτομία σε αυτόν τον τομέα, πριν από λίγες εβδομάδες η EuropeanaTech ανακοίνωσε την πρώτη της πρόκληση για τα σύνολα δεδομένων AI/ML της Europeana. Με αυτή τη νέα δραστηριότητα, θέλαμε να τονώσουμε τη δημιουργία συνόλων δεδομένων για τον τομέα GLAM που μπορούν να χρησιμοποιηθούν για ΤΝ/ΜΛ, αντλώντας από τους πλούσιους πόρους πολιτιστικής κληρονομιάς που διατίθενται στην Europeana. Ελπίζουμε ότι η διαθεσιμότητα των εν λόγω συνόλων δεδομένων θα μπορούσε να συμβάλει στην προώθηση της μεγαλύτερης συμμετοχής στα δεδομένα ψηφιακής πολιτιστικής κληρονομιάς στον τομέα της ΤΝ/ML και να στηρίξει τη μεταφορά των πρόσφατων εξελίξεων στον τομέα της ΤΝ/ML στον τομέα της ψηφιακής επιμέλειας και ανάλυσης του περιεχομένου πολιτιστικής κληρονομιάς.
Λάβαμε συνολικά πέντε προτάσεις, οι οποίες εξετάστηκαν προσεκτικά από μέλη της διευθύνουσας ομάδας EuropeanaTech και της τεχνητής νοημοσύνης σε σχέση με την ειδική ομάδα GLAM. Αξιολόγησαν τις προτάσεις με βάση τη συνάφειά τους για τον τομέα GLAM (25 %), τη συνάφειά τους για την ΤΝ/ML (25 %), τη σχέση τους με την Europeana (30 %) και τη σαφήνεια της περιγραφής και του προγράμματος εργασίας (20 %).
Ανακοινώνοντας τους νικητές
Ονομαστικές Οντότητες σε Αρχαιολογικά Κείμενα
Αυτή η πρόταση από μια ομάδα που εδρεύει στο Πανεπιστήμιο της Νάπολης «L'Orientale» έχει ως στόχο να δημιουργήσει ένα σύνολο δεδομένων για την αναγνώριση ονομάτων οντοτήτων (NER) και την εξαγωγή όρων για αρχαιολογικούς όρους στα ιταλικά και τα αγγλικά στη συλλογή Europeana Archeology. Το NER είναι η διαδικασία ταυτοποίησης των κύριων ονομάτων, όπως ονόματα προσώπων ή τοποθεσίες σε μη δομημένο κείμενο. Ο όρος Εξόρυξη είναι παρόμοιος, αλλά επικεντρώνεται στην εύρεση εξειδικευμένων όρων, στην περίπτωση αυτή από τον τομέα της αρχαιολογίας. Λεξιλόγια όπως το Getty και το CIDOC CRM θα ληφθούν υπόψη. Το τελικό σύνολο δεδομένων θα μπορούσε να χρησιμοποιηθεί για την ανάπτυξη και την αξιολόγηση τεχνολογιών που βασίζονται στην ΤΝ/ΜΛ για το NER στον τομέα της αρχαιολογίας.
Οι αξιολογητές εκτίμησαν ιδιαίτερα τη σαφή δομή και ωριμότητα της πρότασης, για την οποία είχε ήδη δημιουργηθεί ένα εικονικό σύνολο δεδομένων με τη χρήση των API της Europeana για τη δοκιμή της προτεινόμενης προσέγγισης. Η δίγλωσση πτυχή και η έλλειψη παρόμοιων ανοικτών πόρων για τον τομέα της αρχαιολογίας θεωρήθηκαν επίσης ιδιαίτερα πολύτιμες.
ο Ζακ Γκρέις
Αυτή η πρόταση από έναν φοιτητή της Ecole Nationale d'Ingénieurs de Tarbes στοχεύει στη δημιουργία μασκών pixel για σημασιολογική κατάτμηση, μέσω χειροκίνητου σχολιασμού των δεδομένων εικόνας στη συλλογή της Europeana Fashion. Αυτό σημαίνει ότι, για παράδειγμα, όταν αναλύεται μια εικόνα, τα σχετικά στοιχεία μόδας (πουκάμισα, παντελόνια, παπούτσια) στην εικόνα επισημαίνονται στη συνέχεια με το περίγραμμα των εικονοστοιχείων τους. Τα δεδομένα αυτά μπορούν να χρησιμοποιηθούν για την εκπαίδευση ενός αυτοματοποιημένου συστήματος κατάτμησης.

Στους αναθεωρητές άρεσε το σαφές πεδίο εφαρμογής και η κατανόηση των εργασιών που απαιτούνται για την εφαρμογή της πρότασης. Θεώρησαν επίσης ότι είχε πολλές δυνατότητες εφαρμογής σε διάφορες συλλογές.
Το αμφιλεγόμενο πλαίσιο Corpus
Αυτή η κοινή πρόταση του KNAW Humanities Cluster και του Centrum Wiskunde & Informatica στις Κάτω Χώρες θέλει να δημιουργήσει ένα σχολιασμένο σώμα αμφιλεγόμενων όρων στο πλαίσιο (ConConCor) από ολλανδικές εφημερίδες στην Europeana. Αυτά μπορούν στη συνέχεια να χρησιμοποιηθούν για την εκκίνηση και την αξιολόγηση (ημι-)αυτόματων μεθόδων για τον εντοπισμό τέτοιων όρων σε συλλογές πολιτιστικής κληρονομιάς. Οι αμφιλεγόμενοι όροι εδώ σημαίνουν εκείνες τις λέξεις ή φράσεις που υποδηλώνουν κάποια (έμμεση ή ρητή) προκατάληψη προς ή εναντίον μιας ομάδας, ενός γεγονότος ή με άλλο τρόπο.
Οι αξιολογητές αξιολόγησαν τον τρόπο με τον οποίο η παρούσα πρόταση αποσκοπεί στην αντιμετώπιση ενός βασικού στόχου της πρόκλησης, στον εντοπισμό δεοντολογικών ζητημάτων και προκαταλήψεων που είναι εγγενείς στις ψηφιοποιημένες συλλογές πολιτιστικής κληρονομιάς.
Τρεις υποτροφίες ύψους 2.500 ευρώ η καθεμία θα διατεθούν στους νικητές προκειμένου να υλοποιήσουν τις προτάσεις τους και να παραδώσουν τα αντίστοιχα σύνολα δεδομένων έως το τέλος Ιουνίου 2021.
Μάθετε περισσότερα
Θα θέλαμε να εκφράσουμε την ευγνωμοσύνη μας σε όλους όσους υπέβαλαν πρόταση σε αυτή την πρόκληση για τη σκληρή δουλειά και τις εξαιρετικές ιδέες τους. Προσβλέπουμε στην υλοποίηση των νικητήριων έργων και ελπίζουμε ότι θα ανοίξει και άλλος γύρος στο μέλλον για όσους δεν πέτυχαν αυτή τη φορά!
Αν θέλετε να μάθετε για περισσότερες ευκαιρίες όπως αυτή και να δικτυωθείτε και να συνεργαστείτε με πολυεπιστημονικούς τεχνικούς επαγγελματίες από όλο τον κόσμο, συμμετάσχετε στην EuropeanaTech μέσω της Europeana Network Association και ακολουθήστε την κοινότητα στο Twitter.
Αυτή η ανάρτηση τροποποιήθηκε στις 16/04/21 για να αντικατοπτρίζει την παράταση της προθεσμίας για τους νικητές να παραδώσουν τα σύνολα δεδομένων τους.
