¿Te imaginas a Joe Rogan hablando un español perfecto? ¿Y si los podcasters pudieran pulsar un interruptor y hablar al instante en otro idioma? Esa es la premisa en la que se basa la nueva función (basada en la IA Whisper, de OpenAI) con inteligencia artificial de traducción de voz de Spotify, que reproduce podcasts en otros idiomas utilizando la propia voz del podcaster.

(Relacionado: Cómo convertir texto en canción online gratis)

Spotify anuncia podcasts traducidos con inteligencia artificial

Spotify se ha asociado con un puñado de podcasters para traducir sus episodios en inglés al español (latino) con su nueva herramienta, y tiene previsto lanzar traducciones al francés y al alemán en las próximas semanas. La primera tanda de episodios vendrá de la mano de grandes nombres, como Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons y Steven Bartlett. Spotify planea ampliar el grupo para incluir The Rewatchables de The Ringer y su próximo programa de Trevor Noah, según ha informado la plataforma en su página web.

Aquí tienes una de las traducciones de Spotify en un episodio del programa de Fridman:

Como puedes comprobar, se trata de un español latino y no castellano. La espina dorsal de la función de traducción es la herramienta de transcripción de voz Whisper de OpenAI, que puede tanto transcribir el habla inglesa como traducir otros idiomas al inglés.

Relacionado: Así funcionan las listas de reproducción con IA de Spotify

Pero la herramienta de Spotify va más allá de la traducción de voz a texto: la función traducirá un podcast a otro idioma y lo reproducirá en una versión sintetizada de la propia voz del podcaster.

«Al ajustarse a la propia voz del creador, Voice Translation ofrece a los oyentes de todo el mundo la posibilidad de descubrir e inspirarse en nuevos podcasters de una forma más auténtica que nunca», afirma en un comunicado Ziad Sultan, vicepresidente de personalización de Spotify.

Es probable que OpenAI también esté detrás de la replicación de voz de esta nueva función. La empresa de IA ha hecho varios anuncios esta mañana, entre ellos el lanzamiento de una herramienta que puede crear «audio similar al humano a partir de texto y unos segundos de voz de muestra». OpenAI afirma que está limitando intencionadamente el alcance de esta herramienta por motivos de seguridad y privacidad.

Esa es probablemente una de las razones por las que Spotify dice que la tecnología de traducción sólo se está probando con un «grupo selecto» de podcasters por ahora. La empresa no ha dado más detalles sobre el alcance que tiene previsto dar a la herramienta ni sobre cuándo se espera una ampliación.