Desde enero de 2015, Europeana es una de las infraestructuras de servicios digitales de la Unión Europea. La UE tiene varios de ellos, otros incluyen una internet más segura para los niños, servicios sanitarios electrónicos y gestión empresarial. El ISD de Europeana muestra y proporciona acceso en línea al patrimonio cultural y científico de Europa a través de la plataforma Europeana Collections y apoya a las instituciones de patrimonio cultural a medida que se adaptan a esta era digital.
El año pasado, la Comisión Europea publicó una evaluación de Europeana, en la que se exponían nuestros logros y algunos ámbitos en los que centrarnos a continuación. En esta serie, analizaremos algunas de las actividades de Europeana DSI que la evaluación consideró prioritarias, lo que le permitirá comprender mejor los esfuerzos y retos en los que estamos trabajando en este momento.
La lengua que hablas no debería ser una barrera para encontrar lo que quieres en Europeana Collections, pero en este momento, podría serlo. Averigüe qué estamos haciendo para corregirlo.
Europeana Collections contiene material de galerías, bibliotecas, archivos y museos de los 28 países miembros de la UE, entre otros. Puede navegar por el sitio web en 27 idiomas, y es fácil buscar elementos descritos en su propia lengua. Pero las cosas se complican más cuando desea ver elementos que coinciden con su búsqueda pero se describen en un idioma diferente.
En total, se utilizan 37 idiomas para describir las colecciones. Sin embargo, más de la mitad de todo el material (57%) utiliza uno de los cinco idiomas: inglés, alemán, holandés, noruego o francés.
Hacer que un elemento descrito en un idioma aparezca en los resultados o material relacionado cuando se busca en otro idioma no es fácil. Y sabemos que tenemos un largo camino por recorrer, pero hacer cambios positivos en esta área es una de nuestras prioridades.
Nuestro objetivo
Queremos que las personas encuentren lo que buscan, incluso si no utilizan el idioma en el que se describe su elemento objetivo.
Queremos aumentar las posibilidades de que la búsqueda de algo en un idioma muestre resultados que coincidan con sus criterios en otro idioma.
Desafíos
La traducción automática está mejorando, pero no es infalible, como habrás visto si alguna vez has utilizado una herramienta en línea como Google Translate. En el caso de Europeana Collections, hay complicaciones añadidas. No nos estamos concentrando en que una lengua específica se traduzca a otra. Estamos trabajando con colecciones descritas en 37 idiomas y tratando de emparejarlas con términos de búsqueda que podrían venir en cualquier idioma. Además, los metadatos no son como el lenguaje natural con frases completas y gramática predecible; a menudo se presenta en frases cortas o incluso en palabras sencillas, lo que significa que el contexto necesario para una traducción precisa es difícil de encontrar. Agregar otra capa de complejidad es el hecho de que los términos utilizados pueden ser muy específicos: pueden parecer un término común, pero tienen un significado diferente cuando se usan en el contexto de la descripción de material cultural digital.
Los procesos automatizados solo pueden funcionar cuando se les proporciona la información correcta y apropiada. Esto suena obvio, pero como hemos visto en las publicaciones anteriores de esta serie, la información proporcionada a Europeana varía mucho en términos de profundidad y calidad.
Para que algo se traduzca, necesitamos saber en qué idioma se proporciona el elemento original. Nuestros sistemas no adivinarán. Así que cada elemento (como el título y la descripción) necesita un marcador de idioma. Esa es otra capa de información que las instituciones de patrimonio cultural deben proporcionar.
Lo que estamos haciendo
Nuevas innovaciones
Este año, revisamos nuestro estándar de calidad, Europeana Publishing Framework, para incluir estándares para metadatos además de los estándares existentes para el contenido. Ahora, alienta a las personas que trabajan en metadatos a traducir elementos como títulos a múltiples idiomas e incluir contextos como nombres de lugares, que son multilingües, a partir de vocabularios contextuales (ver ítem a continuación). El Marco también fomenta el uso de esas etiquetas lingüísticas tan importantes para mostrar qué idioma se está utilizando. Esto elimina las conjeturas y significa que se pueden implementar más procesos automáticos de vinculación y traducción.
Además de utilizar la experiencia de la Europeana Foundation and Network Association, confiamos en el trabajo de otros para mejorar el multilingüismo en Europeana Collections. El año pasado, llevamos a cabo un proyecto piloto con el equipo de eTranslation, otro proyecto DSI financiado por la Unión Europea. Ahora nos basamos en ese piloto con nuevas actividades de experimentación con vistas a aprovechar el potencial de traducción automática del proyecto para Europeana.
Actividades en curso
Cuando se da a una frase el contexto adecuado, es mucho más fácil traducirla. Seguimos utilizando el enriquecimiento de metadatos para proporcionar más contexto para el material que encuentra en Europeana Collections. Nuestros esfuerzos en este sentido incluyen el uso de «vocabularios contextuales», especialmente los disponibles como datos abiertos vinculados. Estos conjuntos de datos nos dan detalles adicionales como etiquetas multilingües, traducciones de conceptos clave o diferentes variantes de nombres para personas y lugares. Esto hace que sea más fácil para las personas buscar y encontrar artículos en Europeana Collections. Los vocabularios pueden ser utilizados por los proveedores de datos o por Europeana como parte de varios procesos de enriquecimiento de metadatos (semi)automáticos.
Europa es multilingüe. Tenemos que serlo también. Agradecemos a nuestros socios y amigos que nos hayan ayudado a traducir a más idiomas elementos importantes como el Marco de publicación de Europeana y las declaraciones de derechos que utiliza Europeana (la información que le indica lo que puede hacer con un artículo que encuentra en Europeana, por ejemplo, ¿tiene derechos de autor o es de dominio público?). Hasta ahora, las declaraciones de derechos tienen siete traducciones con seis más en camino.
El sitio web de Europeana Collections está disponible en 27 idiomas, y este año lanzamos una nueva exposición, Heritage at Risk, en siete idiomas.
Qué hay que tener en cuenta...
Hacer que Europeana sea más multilingüe es una prioridad y el tema de un acto de dos días de duración que tendrá lugar este mes de octubre bajo la Presidencia finlandesa del Consejo de la UE. En el acto, la Fundación Europeana y el Ministerio de Educación y Cultura finlandés se centrarán en las necesidades, expectativas y formas de avanzar en el multilingüismo en el patrimonio cultural digital.
Tú también puedes ayudar. Con nuestros socios, organizamos eventos «Transcribathon» que invitan a participar a cualquier persona (ya sea en casa en línea o en un evento físico) y tecleamos el contenido de documentos de texto a menudo escritos a mano para que luego se pueda acceder a ellos y buscarlos más fácilmente, y para que puedan traducirse por máquina. En el último año, se organizaron cinco trancribathons en cooperación con instituciones de patrimonio de toda Europa (Alemania, Italia, Bélgica, Austria, Rumania) y se transcribió casi 3.000 documentos relacionados con la Primera Guerra Mundial.
Descubre más
Más información sobre nuestros enriquecimientos automáticos o la actividad eTranslation de la Unión Europea.
Y si está interesado en los detalles finos del elemento lingüístico del Marco de publicación de Europeana, también puede consultar la Guía de publicación de Europeana, que detalla exactamente lo que se requiere al enviar datos a Europeana.
EuropeanaTech ha realizado esfuerzos en el ámbito del multilingüismo; véanse, por ejemplo, las mejores prácticas para el acceso multilingüe y las diversas presentaciones sobre cómo abordar las cuestiones lingüísticas en la última conferencia EuropeanaTech.
Y ayuda a que Europeana sea más multilingüe uniéndote a Transcribathon.eu. Allí encontrará tutoriales para ayudarle a empezar en inglés, francés y alemán, así como información sobre nuestros próximos eventos.
