Sólo unos días después de anunciar el lanzamiento de Code LlaMa, su IA asistente para programadores, Meta ha presentado su última innovación en el campo de la inteligencia artificial: el modelo SeamlessM4T, que promete transformar tanto el proceso de traducción como el de transcripción de lenguaje hablado.
¿Cómo? Fácil: convirtiéndose en un intérprete que ofrezca traducción automática masiva multimodal (puede traducir de voz a texto, de texto a voz, de voz a voz y —¿lo adivinas?— de texto a texto) y multilingüe (traduce para cerca de 100 idiomas de entrada y 35 de salida)…
…lo que podría tener un profundo impacto en la comunicación global y en la accesibilidad de contenidos en diferentes lenguajes, sobre todo teniendo en cuenta que también ofrece reconocimiento automático del idioma de origen… o el hecho de que el hablante pueda entremezclar idiomas en una misma oración.
Según el director científico de Meta, Paco Guzmán, esto último es posible gracias a la flexibilidad de que le dota el gran avance de este modelo: que no depende de modelos intermedios.
En Genbeta
En un año increíble para la inteligencia artificial, ninguna me ha resultado tan útil como Whisper: te cuento por qué
Según Meta, este nuevo modelo de IA ha sido entrenado con "decenas de miles de millones" de oraciones en formato texto y 4 millones de clips de voz, todo ello disponible públicamente en la web sin vulnerar derechos de autor. …