TAUS en Copenhague: lo que necesita saber

Muchas empresas quieren adoptar MT, pero enfrentan un conjunto aparentemente impenetrable de barreras cuando se enfrentan al costo de las licencias de MT, saber qué motores están disponibles, comprender la facilidad de personalización y determinar cómo medir el ROI. El reciente Foro Ejecutivo de TAUS en Copenhague ayudó a arrojar luz sobre cómo avanzar.

Facilitando la traducción automática Jaap van der Meer abrió resumiendo la visión de TAUS de superar las barreras para ayudar al mundo a comunicarse mejor con el nacimiento de mil motores de MT.

Compartiendo la inversión Achim Ruopp de Digital Silk Road siguió con un llamado a la acción para que la industria de la traducción aprenda de numerosas iniciativas exitosas de código abierto en otras industrias. Organizar y contribuir de nuevo a la iniciativa de traducción automática estadística (SMT) de Moses llenando los vacíos que dejó la comunidad de investigación académica. Moses es, con mucho, el motor de traducción automática de código abierto más utilizado. Este proyecto financiado por el gobierno proporciona un SMT bien respaldado, estable y de vanguardia bajo la licencia LGPL. Un creciente número de casos de uso demuestra su viabilidad como motor comercial. ¿Entonces no necesitas esas costosas licencias? Pero el kit de herramientas gratuito aún no tiene ciertas características necesarias para uso comercial. Un esfuerzo relativamente menor ayudaría a garantizar un uso mucho más amplio. El gráfico a continuación identifica las brechas.

Donde buscar Se entiende ampliamente que ninguna solución de MT es la mejor en todos los escenarios. Los motores que se especializan en pares de idiomas y están personalizados para dominios específicos tienden a brillar. Pero, ¿qué varita mágica es la adecuada para mí? ¿Cómo puedo comparar cuál es la opción de MT correcta?

Dos iniciativas TAUS relacionadas buscan abordar estos problemas. El primero, TAUS Tracker, un directorio de motores de MT con descripciones detalladas del sistema estará disponible en este sitio en las próximas semanas, lo que ayudará a los compradores a crear listas de proveedores potenciales.

En Copenhague se presentaron los resultados de un proyecto piloto para confirmar la viabilidad del segundo, el MT Trainer & Evaluator. Yan Yu brindó una descripción general del exitoso piloto MT Trainer de TAUS Data Association (TDA) para automatizar el flujo de trabajo para la personalización de MT utilizando datos de clientes y datos de TDA.

Adobe, eBay y McAfee fueron los tres posibles compradores que buscaban motores y métricas capacitados para medir la calidad de la producción. Languagelens, Pangea MT y Tilde entregaron motores de MT personalizados en 24 horas o menos, a partir de los cuales se midió la calidad de la salida (en este piloto) utilizando puntajes BLEU. El piloto ayuda a que la industria se acerque un paso más a la creación de un mercado para conectar compradores y proveedores, con el beneficio adicional de informes objetivos con calidad de referencia.

Un gigante despierta Spyros Pilos explicó la hoja de ruta de MT de la Comisión Europea, que busca implementar el mejor enfoque para la demanda masiva de contenido multilingüe en la CE. Descubrimos que cada ciudadano de la UE paga 2 € al año por la traducción y que se necesitarían 8.500 traductores a tiempo completo al año para que europa.eu sea completamente multilingüe.

Los motores basados ​​en reglas existentes de la CE se mejoraron diligentemente desde la década de 1970 hasta 2006, pero su desarrollo es lento y costoso en comparación con las soluciones basadas en datos. En los próximos meses, la CE llevará a cabo un gigantesco ejercicio de evaluación comparativa para evaluar sistemáticamente los motores de MT por cobertura de idioma y tipo de uso, considerando la calidad de la producción, el costo total de propiedad y la viabilidad.

¿Qué medir? La calidad de la salida de MT puede ser medida por humanos o por métricas automatizadas. La evaluación humana es costosa y requiere mucho tiempo, pero es útil para revisar la adecuación y la fluidez hasta el nivel de la oración. Las métricas automatizadas son más rápidas, más baratas y más escalables, pero no son intuitivas ni granulares de manera confiable. Alon Lavie de Carnegie Mellon University y Safaba finalizó la sesión con un desglose de los desafíos para crear mejores métricas para medir la calidad de salida de MT. El gráfico a continuación identifica las brechas.

Desbloqueo de los recursos lingüísticos Hace dos años, TAUS destacó una industria en ese entonces cerrada y patentada con su Libro blanco de innovación empresarial de localización. Las principales partes interesadas respondieron con entusiasmo, transformando el panorama de la industria de manera irrevocable. Los estándares abiertos y la apertura a la conexión son ahora prácticas comunes. El éxito de Moses y la Iniciativa GlobalSight demuestran que el código abierto es una estrategia comercial viable. Desde la perspectiva de TAUS, la agenda ahora pasa de abrir plataformas de traducción a liberar el potencial de los recursos lingüísticos compartidos. Los datos de idiomas se han trasladado en gran medida del escritorio al servidor empresarial y ahora se están trasladando a la nube.

Megatendencias Paula Shannon describió las megatendencias de ubicuidad e inmediatez que motivan la creación del Translator Workspace de Lionbridge y la asociación con IBM. Un modelo de software como servicio de computación en la nube y el potencial para crear motores de MT personalizados utilizando la tecnología de IBM forman los dos pilares para dar servicio a las megatendencias. Está previsto que la integración con la supernube de TAUS Data Association se complete a finales de julio.

Estándares, intercambio y crecimiento En el Foro Ejecutivo de TAUS del año pasado en Edimburgo, la imaginación de los participantes se despertó con la introducción de Lingotek de la dinámica de las redes sociales en el negocio de la traducción. Su plataforma también permite a los usuarios compartir traducciones para su reutilización en bóvedas públicas o privadas (uso compartido limitado). En este evento, Willem Stoeller respiró hondo antes de enumerar nuevas asociaciones e integraciones para la plataforma de traducción colaborativa Lingotek. La lista incluye actualmente SharePoint, Drupal, Alfresco, sistemas de CRM social (Jive, Lithium), Google, PROMT, Microsoft Bing, Language Weaver y Moses en asociación con Pangea MT. Jeremy Harpham describió las formas en las que SDL está abierto al participar en el establecimiento de estándares y la conexión a través de API. David Filip de Moravia explicó que los metadatos son importantes para crear ontologías para aprovechar al máximo los datos de idiomas compartidos una vez que estos se mueven a la nube.

Emparejamiento en la supernube Gran parte de la traducción se ha movido de la basada en proyectos a la simulación y ahora se está moviendo a una base casi en tiempo real o en tiempo real. La calidad de la conectividad a través de la cadena de suministro y la facilidad de colaboración se están convirtiendo en elementos fundamentales para que cualquier ecosistema de traducción funcione de manera eficiente. Smith Yewell habló sobre GlobalSight Editions, un lanzamiento planificado de este sistema de código abierto que busca abordar estos requisitos. Al explicar la motivación empresarial para patrocinar el desarrollo de la correspondencia de traducción en la supernube de TDA, Smith se centró en el potencial de seguir mejorando la eficiencia mediante la búsqueda de coincidencias en la supernube cuando las memorias de traducción ‘doradas’ no funcionan. El emparejamiento en la supernube de TAUS Data Association se pondrá en marcha en octubre.

Qué problema de idioma Sergio Pelino hizo que la solución del ‘problema’ del idioma pareciera fácil con una charla sobre el enfoque de Google titulada ‘La traducción como una utilidad, haciendo que la información del mundo sea universalmente accesible y útil. Traducción y colaboración en la Nube. ‘ El usuario de datos lingüísticos más grande del mundo también es probablemente el innovador más sexy en el espacio de la automatización de la traducción. En virtud de la rápida incorporación de idiomas a su motor de traducción automática, la integración de la traducción automática en su conjunto de aplicaciones, la búsqueda instantánea y la traducción de sitios web, combina el reconocimiento óptico de caracteres y la traducción automática, y causa interrupciones con Translator Toolkit.

Convergencia Con una traducción automática mejor y más accesible y plataformas abiertas, comenzamos a ver una convergencia con otras funciones y oportunidades de crecimiento. La atención al cliente global es solo una oportunidad identificada por TAUS e iluminada por el Consortium for Service Innovation (CSI). Greg Oxton de CSI resumió la evolución de la función de soporte desde los centros de llamadas hasta el soporte moderno centrado en el conocimiento y la creciente demanda de soporte multimedia multilingüe.

Una muestra de 21 compradores de traducción importantes del sector de TI indicó recientemente sus planes para traducir contenido de soporte. El setenta y dos por ciento planea aumentar la cantidad de contenido que se traduce. El gráfico a continuación ilustra su enfoque preferido.

Daniel Grasmick explicó la evolución gradual de la MT de SAP en el caso de uso de soporte al cliente utilizando Lucy Software y sus encarnaciones anteriores. La última instalación basada en reglas ha estado en funcionamiento desde 2004 y, con la inversión continua, sigue funcionando bien.

Fred Doyle presentó el caso de uso multimedia multilingüe de IBM utilizando soluciones Knowledge Accelerators. La biblioteca de ayuda de IBM está traducida a 11 idiomas y contiene 200.000 tutoriales específicos de tareas de un minuto, que permiten a los usuarios ver, escuchar y leer instrucciones. Se utiliza multimedia multilingüe para soporte de ventas, capacitación en implementación, aceptación del usuario final y configuración y ajuste. El resultado es tiempos de implementación más cortos gracias a procesos de capacitación mejorados y costos de soporte reducidos. Fred terminó haciendo dos preguntas: ¿están sus herramientas de traducción listas para admitir multimedia? ¿Y por qué no reemplazar el archivo de ayuda tradicional? El siguiente gráfico ayuda a ilustrar la tendencia hacia el uso de videos en la web.

La experiencia de los miembros de TAUS Data Association Jaap inició la sesión delineando la Hoja de ruta de desarrollo de TAUS Data Association (TDA).

Representantes de Adobe, Intel, KCSL, Logrus y Microsoft explicaron sus motivaciones como miembros, su experiencia hasta la fecha con el uso de datos de TDA y sus objetivos para el futuro. Para todos los miembros del panel, la motivación inicial fue buscar datos de calidad para obtener una mejor producción de MT. Adobe e Intel han experimentado serendipia y ROI solo con TAUS Search.

En última instancia, los compradores quieren vender más productos y una operación de traducción escalable a través de MT lo respalda, particularmente cuando los mercados de mayor crecimiento tienden a estar en lugares que no hablan inglés.

La mejora significativa en el motor MT de Microsoft ha sido bien documentada. Se han logrado más avances para los lenguajes de segundo nivel en los que Microsoft no tiene suficientes datos por sí solo. Adobe expresó la misma motivación y agregó que una fuente de datos confiable es útil para reducir la complejidad.

Microsoft también ha comenzado a buscar aprovechar los datos de TDA. Las pruebas de Intel que utilizaron el aprovechamiento avanzado de TDA y sus propios datos dieron como resultado una traducción de mejor calidad, pero no una mayor productividad. Intel utiliza los datos de TDA para entrenar motores Moses con fines comparativos.

La experiencia altamente positiva de KCSL también está bien documentada. Los datos de TDA ayudaron a garantizar que Logrus tenga suficientes datos para entrenar su motor Moses de inglés a ruso. Si bien la diversidad de datos demostró ser una ventaja para Microsoft, Logrus consideró que esto era perjudicial para la calidad.

La hoja de ruta de desarrollo de la TDA se basa en los comentarios de los miembros e incluye funciones como la limpieza de TM estadística para marcar las malas traducciones y las puntuaciones coincidentes para ayudar a seleccionar los datos a un nivel más granular y gestionar mejor la diversidad terminológica. Se están utilizando comentarios detallados de los miembros, como el de Logrus, para garantizar que se creen nuevas funciones para atender las necesidades cambiantes de la industria en el futuro.

Sabiduría colectiva La tarde final vio a los participantes informar sobre las discusiones de grupo que habían tenido lugar durante el evento, destacando lo que vieron como las principales tendencias e implicaciones para el negocio de los idiomas.

Los participantes habían revisado el horizonte de cinco años en escenarios que cubren cuestiones legales / políticas, requisitos del cliente, proceso de localización, métricas comerciales, proceso de localización y cuestiones económicas. Este análisis ayuda a completar el primer paso en un proceso de seis etapas utilizando el enfoque de planificación basada en escenarios para evaluar posibles estados futuros para el negocio de los idiomas.

Puede interesarte

Desde la Edad de Piedra hasta ahora

Esta vasta región constituye el 21% de la superficie de Indonesia y se considera la …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *