Meta revela SeamlessM4T: Tecnología de traducción e inteligencia artificial multimodal


 Mosaico

Meta, la firma de Mark Zuckerberg, presentó este martes su tecnología SeamlessM4T, la cual presumió como el primer modelo de traducción y transcripción de inteligencia artificial (IA) multimodal y multilingüe.

Esta IA puede realizar traducciones de voz a texto, de voz a voz, de texto a voz y de texto a texto hasta en 100 idiomas, según la tarea.

SeamlessM4T permite el uso de las siguientes herramientas:

  • Reconocimiento de voz para casi 100 idiomas
  • Traducción de voz a texto para casi 100 idiomas de entrada y salida
  • Traducción de voz a voz, compatible con casi 100 idiomas de entrada y 36 idiomas de salida (incluido el inglés)
  • Traducción de texto a texto para casi 100 idiomas
  • Traducción de texto a voz, compatible con casi 100 idiomas de entrada y 35 idiomas de salida (incluido el inglés)

“De acuerdo con nuestro enfoque de ciencia abierta, lanzaremos públicamente SeamlessM4T bajo una licencia de investigación para permitir a los investigadores y desarrolladores desarrollar este trabajo. También estamos publicando los metadatos de SeamlessAlign, el conjunto de datos de traducción multimodal abierto más grande hasta la fecha, con un total de 270,000 horas de alineaciones de voz y texto extraídas”, apuntó Meta en su blog oficial.



Fuente: Forbes


Artículo Anterior Artículo Siguiente