Europeana Tradurre
Il progetto eTranslation CEF Telecom Europeana Translate mira a rafforzare i collegamenti tra l'infrastruttura di eTranslation e lo spazio comune europeo di dati per il patrimonio culturale, implementato dall'iniziativa Europeana, a beneficio di entrambi. Da un lato, il progetto mira a migliorare l'usabilità delle risorse del patrimonio culturale arricchendo i set di dati del patrimonio culturale con metadati multilingue. Dall'altro, migliora le risorse linguistiche rese apertamente disponibili attraverso il coordinamento europeo delle risorse linguistiche con metadati provenienti da milioni di beni del patrimonio culturale, accuratamente selezionati, puliti e normalizzati in modo che diventino utilizzabili a fini di formazione.
A tal fine, Europeana Translate ha sviluppato e implementato strumenti di traduzione automatica adattati alle esigenze del settore del patrimonio culturale. Gli strumenti sono applicati per tradurre i metadati di oltre 25 milioni di registrazioni attualmente disponibili attraverso l'infrastruttura di Europeana da 22 lingue ufficiali dell'UE all'inglese, migliorando l'esperienza multilingue fornita ai suoi utenti.
Nel corso del progetto, i partner hanno addestrato una serie di motori di traduzione forniti dal partner Pangeanic con una selezione di metadati selezionati dall'infrastruttura Europeana, inclusi dati bilingue e monolingue e vocabolari multilingue. Ulteriori dati selezionati dal sito web di raccolta OPUS sono stati presi in considerazione anche per le lingue che non erano sufficientemente rappresentate. Sono stati eseguiti diversi esperimenti per decidere la migliore combinazione di dati di allenamento e di set-up dei motori per ogni lingua. Dividendo i dati tra training e test set, è stata eseguita una valutazione automatica basata su metriche standard (come BLEU e TER) per tutte le coppie di lingue. I risultati dimostrano un notevole miglioramento rispetto ai modelli generici Pangeanic (prima della formazione in-domain) e al DSI eTranslation per la maggior parte delle lingue.
Valutazione della traduzione automatica da parte di esperti umani
Le traduzioni automatiche sono state anche oggetto di un'ampia valutazione da parte di linguisti ed esperti del patrimonio culturale. Ai valutatori è stato chiesto di valutare le traduzioni automatiche in inglese su una scala da 0 a 100, considerando aspetti come la fluidità (correttezza grammaticale), l'accuratezza (significato generale) e l'adeguatezza (uso corretto della terminologia). È stato inoltre chiesto loro di fornire ulteriori riscontri, tra cui la segnalazione di errori importanti e ricorrenti. Attraverso la piattaforma CrowdHeritage sono state organizzate tre campagne di crowdsourcing per coinvolgere i membri del settore del patrimonio culturale. Complessivamente, questi hanno visto la partecipazione di 44 linguisti esperti e 29 professionisti del patrimonio culturale, che hanno dato valutazioni piuttosto elevate (oltre l'80%) per la maggior parte delle 22 lingue.
I risultati ottenuti dalla valutazione umana ci hanno fornito approfondimenti sul comportamento dei motori di traduzione automatica per diverse lingue. Un'approfondita analisi statistica delle valutazioni assegnate dagli esseri umani, in correlazione con i punteggi di affidabilità automatica calcolati dai motori di traduzione automatica, ci ha permesso di determinare soglie di qualità adeguate per la pubblicazione di traduzioni da varie lingue all'infrastruttura Europeana.
Vantaggi per gli utenti e gli istituti di tutela del patrimonio culturale
I motori di traduzione sono utilizzati dall'infrastruttura Europeana per produrre, indicizzare, condividere e visualizzare traduzioni automatiche in inglese di metadati, che consentiranno alle persone di scoprire, analizzare e riutilizzare meglio il materiale.
L'impatto positivo di questo lavoro è stato confermato da un'indagine sulla valutazione d'impatto compilata da 27 linguisti e 18 esperti del patrimonio culturale. Alla domanda sul valore aggiunto che le traduzioni automatiche in inglese possono apportare alla ricerca e alla visualizzazione di beni del patrimonio culturale sul sito web Europeana, entrambe le comunità lo hanno ritenuto importante. Hanno anche riferito di aver apprezzato l'aumento previsto della quantità di risultati di ricerca, che includerebbe elementi del patrimonio culturale che non sono attualmente restituiti durante la ricerca in inglese: L'83,4 % e il 62,9 % degli esperti di patrimonio culturale e dei linguisti ritengono che questo miglioramento sia prezioso.
Inoltre, i motori di traduzione istituiti dal progetto possono essere utili ai fornitori di dati che desiderano tradurre in inglese i metadati delle loro collezioni, migliorandone l'accessibilità. Gli utenti della piattaforma di aggregazione MINT possono utilizzare direttamente l'interconnessione API esistente con i motori, mentre gli istituti di tutela del patrimonio culturale con competenze tecniche possono sfruttare i motori di traduzione automatica facilmente dispiegabili resi apertamente disponibili nell'archivio ELG. Tutti gli esperti di patrimonio culturale che hanno partecipato al sondaggio hanno dichiarato che avrebbero preso in considerazione l'utilizzo degli strumenti di Europeana Translate per arricchire le collezioni della loro organizzazione con traduzioni automatiche per migliorare la reperibilità.
Evento Europeana Translate - come la traduzione automatica e l'accesso multilingue influiscono sul patrimonio culturale
Sei interessato a saperne di più sul progetto Europeana Translate, la sua metodologia e i suoi risultati? Vorresti anche approfondire la tua conoscenza delle tecnologie di traduzione automatica più avanzate e di come possono essere applicate nel settore del patrimonio culturale?
Unisciti a noi all'evento Europeana Translate - How machine translation & multilingual access impacts cultural heritage. Si tratta di un evento online che si terrà il 13 aprile 2023, dalle 14:00 alle 17:00 CEST. Ascolterai i partner del progetto spiegare in dettaglio la metodologia e i risultati ottenuti in questi due anni di lavoro. Saranno inoltre discussi progetti simili, sempre in modo critico considerando l'importanza delle traduzioni automatizzate di dati/metadati del patrimonio culturale con riflessioni sulle fasi future, sull'usabilità e sulle sfide della tecnologia di IA per il settore del patrimonio culturale.
