Europeana Μετάφραση
Το έργο eTranslation CEF Telecom Europeana Translate αποσκοπεί στην ενίσχυση των συνδέσεων μεταξύ της υποδομής eTranslation και του κοινού ευρωπαϊκού χώρου δεδομένων για την πολιτιστική κληρονομιά, που αναπτύχθηκε από την πρωτοβουλία Europeana, προς όφελος και των δύο. Από τη μία πλευρά, το έργο αποσκοπεί στη βελτίωση της χρηστικότητας των πόρων πολιτιστικής κληρονομιάς μέσω του εμπλουτισμού των συνόλων δεδομένων πολιτιστικής κληρονομιάς με πολύγλωσσα μεταδεδομένα. Από την άλλη πλευρά, ενισχύει τους γλωσσικούς πόρους που διατίθενται ανοιχτά μέσω του Ευρωπαϊκού Συντονισμού Γλωσσικών Πόρων με μεταδεδομένα από εκατομμύρια αντικείμενα πολιτιστικής κληρονομιάς, τα οποία επιλέχθηκαν προσεκτικά, καθαρίστηκαν και κανονικοποιήθηκαν ώστε να καταστούν δεκτικά για εκπαιδευτικούς σκοπούς.
Για τους σκοπούς αυτούς, η Europeana Translate έχει αναπτύξει και αναπτύξει εργαλεία αυτόματης μετάφρασης προσαρμοσμένα στις ανάγκες του τομέα της πολιτιστικής κληρονομιάς. Τα εργαλεία εφαρμόζονται για τη μετάφραση των μεταδεδομένων περισσότερων από 25 εκατομμυρίων εγγραφών που διατίθενται επί του παρόντος μέσω της υποδομής της Europeana από 22 επίσημες γλώσσες της ΕΕ στα αγγλικά, βελτιώνοντας την πολύγλωσση εμπειρία που παρέχεται στους χρήστες της.
Κατά τη διάρκεια του έργου, οι εταίροι εκπαίδευσαν ένα σύνολο μηχανών μετάφρασης που παρείχε ο εταίρος Pangeanic με μια επιλογή μεταδεδομένων που επιλέχθηκαν από την υποδομή Europeana, συμπεριλαμβανομένων δίγλωσσων και μονόγλωσσων δεδομένων καθώς και πολύγλωσσων λεξιλογίων. Εξετάστηκαν επίσης πρόσθετα δεδομένα που επελέγησαν από τον ιστότοπο συλλογής OPUS για γλώσσες που δεν εκπροσωπήθηκαν επαρκώς. Διεξήχθη μια σειρά πειραμάτων για να αποφασιστεί ο καλύτερος συνδυασμός δεδομένων εκπαίδευσης και ρύθμισης των μηχανών για κάθε γλώσσα. Με τον διαχωρισμό των δεδομένων μεταξύ συνόλων κατάρτισης και δοκιμασιών, πραγματοποιήθηκε αυτόματη αξιολόγηση με βάση τυποποιημένες μετρήσεις (όπως BLEU και TER) για όλα τα ζεύγη γλωσσών. Τα αποτελέσματα δείχνουν σημαντική βελτίωση σε σύγκριση με τα γενόσημα παγανιστικά μοντέλα (πριν από την επιτόπια εκπαίδευση) και το eTranslation DSI για τις περισσότερες γλώσσες.
Αξιολόγηση της αυτόματης μετάφρασης από εμπειρογνώμονες
Οι αυτόματες μεταφράσεις υποβλήθηκαν επίσης σε εκτενή αξιολόγηση από γλωσσολόγους και εμπειρογνώμονες στον τομέα της πολιτιστικής κληρονομιάς. Οι αξιολογητές κλήθηκαν να αξιολογήσουν τις αυτόματες μεταφράσεις στα αγγλικά σε κλίμακα από το 0 έως το 100, λαμβάνοντας υπόψη πτυχές όπως η ευχέρεια (γραμματική ορθότητα), η ακρίβεια (γενική έννοια) και η επάρκεια (ορθή χρήση της ορολογίας). Τους ζητήθηκε επίσης να υποβάλουν πρόσθετες παρατηρήσεις, συμπεριλαμβανομένης της αναφοράς σημαντικών και επαναλαμβανόμενων σφαλμάτων. Διοργανώθηκαν τρεις εκστρατείες πληθοπορισμού μέσω της πλατφόρμας CrowdHeritage για τη συμμετοχή μελών του τομέα της πολιτιστικής κληρονομιάς. Συνολικά, σε αυτές συμμετείχαν 44 ειδικοί γλωσσολόγοι και 29 επαγγελματίες του τομέα της πολιτιστικής κληρονομιάς, οι οποίοι έδωσαν αρκετά υψηλές βαθμολογίες (πάνω από 80 %) για την πλειονότητα των 22 γλωσσών.
Τα αποτελέσματα που προέκυψαν από την ανθρώπινη αξιολόγηση μας παρείχαν πληροφορίες σχετικά με τη συμπεριφορά των μηχανών αυτόματης μετάφρασης για διάφορες γλώσσες. Μια εις βάθος στατιστική ανάλυση των βαθμολογιών που αποδίδονται από ανθρώπους, σε συνδυασμό με τις αυτόματες βαθμολογίες εμπιστοσύνης που υπολογίζονται από τις μηχανές αυτόματης μετάφρασης, μας επέτρεψε να καθορίσουμε τα κατάλληλα κατώτατα όρια ποιότητας για τη δημοσίευση μεταφράσεων από διάφορες γλώσσες στην υποδομή της Europeana.
Οφέλη για τους χρήστες και τα ιδρύματα πολιτιστικής κληρονομιάς
Οι μεταφραστικές μηχανές χρησιμοποιούνται από την υποδομή της Europeana για την παραγωγή, την ευρετηρίαση, την κοινή χρήση και την εμφάνιση αυτόματων αγγλικών μεταφράσεων μεταδεδομένων, οι οποίες θα επιτρέψουν στους ανθρώπους να ανακαλύψουν, να αναλύσουν και να επαναχρησιμοποιήσουν καλύτερα το υλικό.
Ο θετικός αντίκτυπος του έργου αυτού επιβεβαιώθηκε από έρευνα εκτίμησης επιπτώσεων που συμπληρώθηκε από 27 γλωσσολόγους και 18 εμπειρογνώμονες στον τομέα της πολιτιστικής κληρονομιάς. Όταν ερωτήθηκαν σχετικά με την προστιθέμενη αξία που μπορούν να προσφέρουν οι αυτόματες αγγλικές μεταφράσεις στην αναζήτηση και την προβολή αντικειμένων πολιτιστικής κληρονομιάς στον ιστότοπο της Europeana, και οι δύο κοινότητες το θεώρησαν σημαντικό. Ανέφεραν επίσης ότι εκτιμούν τον αναμενόμενο αυξημένο αριθμό αποτελεσμάτων αναζήτησης, τα οποία θα περιλαμβάνουν στοιχεία πολιτιστικής κληρονομιάς που δεν επιστρέφονται επί του παρόντος κατά την αναζήτηση στα αγγλικά: Το 83,4 % και το 62,9 % των εμπειρογνωμόνων στον τομέα της πολιτιστικής κληρονομιάς και των γλωσσολόγων, αντίστοιχα, έκριναν ότι η βελτίωση αυτή είναι πολύτιμη.
Επιπλέον, οι μεταφραστικές μηχανές που δημιουργούνται από το έργο μπορούν να είναι χρήσιμες για τους παρόχους δεδομένων που επιθυμούν να μεταφράσουν τα μεταδεδομένα των συλλογών τους στα αγγλικά, βελτιώνοντας την προσβασιμότητα των συλλογών τους. Οι χρήστες της πλατφόρμας συγκέντρωσης MINT μπορούν να κάνουν άμεση χρήση της υφιστάμενης διασύνδεσης API με τις μηχανές, ενώ τα ιδρύματα πολιτιστικής κληρονομιάς με τεχνική εμπειρογνωσία μπορούν να επωφεληθούν από τις εύκολα αναπτυσσόμενες μηχανές αυτόματης μετάφρασης που διατίθενται ανοικτά στο αποθετήριο ELG. Όλοι οι εμπειρογνώμονες στον τομέα της πολιτιστικής κληρονομιάς που συμμετείχαν στην έρευνα δήλωσαν ότι θα εξετάσουν το ενδεχόμενο χρήσης των εργαλείων Europeana Translate για τον εμπλουτισμό των συλλογών του οργανισμού τους με αυτόματες μεταφράσεις, ώστε να βελτιωθεί η δυνατότητα εντοπισμού.
Europeana Translate Event - πώς η αυτόματη μετάφραση και η πολύγλωσση πρόσβαση επηρεάζουν την πολιτιστική κληρονομιά
Ενδιαφέρεστε να μάθετε περισσότερα για το έργο Europeana Translate, τη μεθοδολογία και τα αποτελέσματά του; Θα θέλατε επίσης να εμβαθύνετε τις γνώσεις σας σχετικά με τις τεχνολογίες αυτόματης μετάφρασης αιχμής και τον τρόπο με τον οποίο μπορούν να εφαρμοστούν στον τομέα της πολιτιστικής κληρονομιάς;
Στη συνέχεια, ελάτε μαζί μας στην εκδήλωση Europeana Translate Event - How machine translation & multilingual access impacts cultural heritage (Πώς η αυτόματη μετάφραση και η πολύγλωσση πρόσβαση επηρεάζουν την πολιτιστική κληρονομιά). Πρόκειται για διαδικτυακή εκδήλωση που θα πραγματοποιηθεί στις 13 Απριλίου 2023, από τις 14:00 έως τις 17:00 (ώρα Κεντρικής Ευρώπης). Θα ακούσετε τους εταίρους του έργου να εξηγούν λεπτομερώς τη μεθοδολογία και τα αποτελέσματα που επιτεύχθηκαν κατά τη διάρκεια αυτών των δύο ετών εργασίας. Παρόμοια έργα θα συζητηθούν επίσης, λαμβάνοντας πάντα υπόψη με κριτικό πνεύμα τη σημασία των αυτοματοποιημένων μεταφράσεων δεδομένων/μεταδεδομένων πολιτιστικής κληρονομιάς με προβληματισμούς σχετικά με τα μελλοντικά βήματα, τη χρηστικότητα και τις προκλήσεις της τεχνολογίας ΤΝ για τον τομέα της πολιτιστικής κληρονομιάς.
