Conozca VALL-E: la IA de texto a voz que puede imitar la voz de cualquier persona
- El año pasado vio la aparición de herramientas de inteligencia artificial (IA) que pueden crear imágenes, obras de arte o incluso videos con un mensaje de texto
También hubo grandes avances en la escritura de IA, con ChatGPT de OpenAI causando entusiasmo y temor generalizados sobre el futuro de la escritura.
Ahora, solo unos días después de 2023, otro poderoso caso de uso para la IA ha pasado a primer plano: una herramienta de texto a voz que puede imitar impecablemente la voz de una persona.
Desarrollado por Microsoft, VALL-E puede tomar una grabación de tres segundos de la voz de alguien y replicar esa voz, convirtiendo las palabras escritas en habla, con entonación y emoción realistas según el contexto del texto.
Entrenado con 60.000 horas de grabaciones de habla en inglés, puede pronunciar un discurso en una «situación de Zero-Shot», lo que significa sin ningún ejemplo previo o entrenamiento en un contexto o situación específica.
Al presentar VALL-E en un artículo publicado por la Universidad de Cornell, los desarrolladores explicaron que los datos de grabación consistían en más de 7000 hablantes únicos.
El equipo dice que su sistema de texto a voz (TTS) usó cientos de veces más datos que los sistemas TTS existentes, lo que les ayudó a superar el problema de Zero-Shots.
Actualmente, la herramienta no está disponible para uso público, pero genera dudas sobre la seguridad, dado que podría usarse para generar cualquier texto proveniente de la voz de cualquier persona.
Sin embargo, sus creadores han proporcionado una demostración, que muestra una serie de indicaciones del orador de tres segundos y una demostración de texto a voz en acción, con la voz imitada correctamente.
Junto con el aviso del orador y la salida de VALL-E, puede comparar los resultados con la «verdad básica» (el orador real que lee el texto del aviso) y el resultado de «línea de base» de la tecnología TTS actual.
Microsoft ha invertido mucho en IA y es uno de los patrocinadores de OpenAI, la compañía detrás de ChatGPT y DALL-E, una herramienta de texto a imagen o de arte.
El gigante del software invirtió 1.000 millones de dólares en OpenAI en 2019, y un informe de esta semana en semafor.com indicó que estaba pensando en invertir otros 10.000 millones de dólares en la empresa.
Fuente: Euronews