Europeana Traduzir
O projeto eTranslation CEF Telecom Europeana Translate visa reforçar as ligações entre a infraestrutura eTranslation e o espaço comum europeu de dados para o património cultural, implantado pela Iniciativa Europeana, em benefício de ambos. Por um lado, o projeto visa melhorar a usabilidade dos recursos do património cultural, enriquecendo os conjuntos de dados do património cultural com metadados multilingues. Por outro lado, reforça os recursos linguísticos disponibilizados abertamente através da Coordenação Europeia dos Recursos Linguísticos com metadados de milhões de bens do património cultural, que foram cuidadosamente selecionados, limpos e normalizados, de modo a poderem ser utilizados para fins de formação.
Para o efeito, a Europeana Tradutor desenvolveu e implantou ferramentas de tradução automática adaptadas às necessidades do setor do património cultural. As ferramentas estão a ser aplicadas para traduzir os metadados de mais de 25 milhões de registos atualmente disponíveis através da infraestrutura da Europeana de 22 línguas oficiais da UE para inglês, melhorando a experiência multilingue proporcionada aos seus utilizadores.
Ao longo do projeto, os parceiros formaram um conjunto de motores de tradução fornecidos pelo parceiro Pangeanic com uma seleção de metadados selecionados a partir da infraestrutura Europeana, incluindo dados bilingues e monolingues, bem como vocabulários multilingues. Foram também considerados dados adicionais selecionados a partir do sítio Web de recolha do OPUS para línguas que não estavam suficientemente representadas. Foram realizadas várias experiências para decidir sobre a melhor combinação de dados de treino e configuração dos motores para cada língua. Ao dividir os dados entre os conjuntos de treino e teste, foi realizada uma avaliação automática baseada em métricas padrão (como BLEU e TER) para todos os pares linguísticos. Os resultados demonstram uma melhoria considerável em comparação com os modelos pangeânicos genéricos (antes da formação no domínio) e o DSI eTranslation para a maioria das línguas.
Avaliação da tradução automática por peritos humanos
As traduções automáticas foram também objeto de uma avaliação exaustiva por linguistas e peritos em património cultural. Os avaliadores foram convidados a classificar as traduções automáticas para o inglês numa escala de 0 a 100, considerando aspetos como a fluência (correção gramatical), a exatidão (significado geral) e a adequação (utilização adequada da terminologia). Foi-lhes igualmente solicitado que apresentassem observações adicionais, incluindo a comunicação de erros importantes e recorrentes. Foram organizadas três campanhas de crowdsourcing através da plataforma CrowdHeritage para envolver membros do setor do património cultural. Globalmente, contaram com a participação de 44 linguistas especializados e 29 profissionais do património cultural, que atribuíram classificações bastante elevadas (acima de 80 %) à maioria das 22 línguas.
Os resultados obtidos pela avaliação humana forneceram-nos informações sobre o comportamento dos motores de tradução automática para diferentes línguas. Uma análise estatística aprofundada das classificações atribuídas pelos seres humanos, em correlação com as pontuações de confiança automáticas calculadas pelos motores de tradução automática, permitiu determinar limiares de qualidade adequados para a publicação de traduções de várias línguas para a infraestrutura da Europeana.
Benefícios para os utilizadores e as instituições responsáveis pelo património cultural
Os motores de tradução estão a ser utilizados pela infraestrutura Europeana para produzir, indexar, partilhar e apresentar traduções automáticas de metadados em inglês, o que permitirá às pessoas descobrir, analisar e reutilizar melhor o material.
O impacto positivo que este trabalho está a ter foi confirmado por um inquérito de avaliação de impacto preenchido por 27 linguistas e 18 peritos em património cultural. Quando questionadas sobre o valor acrescentado que as traduções automáticas em inglês podem trazer para a pesquisa e a exibição de bens do património cultural no sítio Web da Europeana, ambas as comunidades consideraram-no importante. Informaram igualmente que apreciavam o aumento previsto da quantidade de resultados de pesquisa, que incluiria bens do património cultural que não são atualmente devolvidos quando se pesquisa em inglês: 83,4 % e 62,9 % dos peritos em património cultural e dos linguistas, respetivamente, consideraram esta melhoria valiosa.
Além disso, os motores de tradução criados pelo projeto podem ser úteis para os fornecedores de dados que pretendam traduzir os metadados das suas coleções para inglês, melhorando a acessibilidade das suas coleções. Os utilizadores da plataforma de agregação MINT podem utilizar diretamente a interligação API existente com os motores, enquanto as instituições responsáveis pelo património cultural com conhecimentos técnicos especializados podem tirar partido dos motores de tradução automática facilmente implantáveis e disponibilizados abertamente no repositório ELG. Todos os peritos em património cultural que participaram no inquérito declararam que considerariam a possibilidade de utilizar as ferramentas Europeana Translate para enriquecer as coleções da sua organização com traduções automáticas, a fim de melhorar a visibilidade.
Evento Europeana Traduzir - como a tradução automática & acesso multilingue afeta o património cultural
Está interessado em saber mais sobre o projeto Europeana Tradutor, a sua metodologia e os seus resultados? Gostaria também de aprofundar os seus conhecimentos sobre as tecnologias de tradução automática mais avançadas e sobre a forma como podem ser aplicadas no setor do património cultural?
Em seguida, junte-se a nós no Evento Europeana Tradutor - Como a tradução automática & o acesso multilingue afeta o património cultural. Este é um evento online que terá lugar a 13 de abril de 2023, das 14:00 às 17:00 CEST. Os parceiros do projeto explicarão em pormenor a metodologia e os resultados obtidos nestes dois anos de trabalho. Serão também debatidos projetos semelhantes, tendo sempre em conta, de forma crítica, a importância das traduções automatizadas de dados/metadados do património cultural, com reflexões sobre as etapas futuras, a usabilidade e os desafios da tecnologia de IA para o setor do património cultural.
