Microsoft ha anunciado hoy una actualización de sus servicios de traducción que, gracias a las nuevas técnicas de aprendizaje automático, promete mejorar significativamente las traducciones entre un gran número de pares de idiomas.
Basados en su Proyecto Z-Code, que utiliza un enfoque de «mezcla de expertos», estos nuevos modelos obtienen ahora a menudo una puntuación entre el 3% y el 15% mejor que los modelos anteriores de la empresa durante las evaluaciones ciegas. Z-Code forma parte de la iniciativa más amplia XYZ-Code de Microsoft, que busca combinar modelos de texto, visión y audio en varios idiomas para crear sistemas de IA más potentes y útiles.
La «mezcla de expertos» no es una técnica completamente nueva, pero es especialmente útil en el contexto de la traducción.
En esencia, el sistema divide las tareas en múltiples subtareas y las delega en modelos más pequeños y especializados llamados «expertos». El modelo decide entonces qué tarea delegar a qué experto, basándose en sus propias predicciones.
Simplificando mucho, se puede pensar en él como un modelo que incluye múltiples modelos más especializados.
Una nueva clase de modelos de mezcla de expertos de Z-Code está impulsando mejoras de rendimiento en Translator, un servicio cognitivo de Microsoft Azure.
«Con Z-Code estamos haciendo realmente un progreso sorprendente porque estamos aprovechando tanto el aprendizaje de transferencia como el aprendizaje multitarea de datos monolingües y multilingües para crear un modelo lingüístico de vanguardia que creemos que tiene la mejor combinación de calidad, rendimiento y eficiencia que podemos ofrecer a nuestros clientes», dijo Xuedong Huang, becario técnico de Microsoft y director de tecnología de Azure AI.
El resultado es un nuevo sistema que ahora puede, por ejemplo, traducir directamente entre 10 idiomas, lo que elimina la necesidad de contar con varios sistemas. Microsoft también ha empezado a utilizar recientemente los modelos de Z-Code para mejorar otras funciones de sus sistemas de IA, como el reconocimiento de entidades, el resumen de textos, la clasificación de textos personalizados y la extracción de frases clave. Sin embargo, es la primera vez que utiliza este enfoque para un servicio de traducción.
Tradicionalmente, los modelos de traducción son extremadamente grandes, lo que dificulta su introducción en un entorno de producción.
Sin embargo, el equipo de Microsoft ha optado por un enfoque «disperso», que sólo activa un pequeño número de parámetros del modelo por tarea en lugar de todo el sistema. «Eso hace que su funcionamiento sea mucho más rentable, del mismo modo que es más barato y eficiente calentar la casa en invierno sólo durante las horas del día en que lo necesitas y en los espacios que utilizas habitualmente, en lugar de mantener una caldera a pleno rendimiento todo el tiempo», explica el equipo en el anuncio de hoy.