Seleccionar página
Entre esas reglas está que no se use la voz de alguien sin su consentimiento o que hay que indicar a los usuarios que son voces sintéticas.
Por: Rafael Moreta
lunes que mediante su modelo Voice Engine puede clonar voces humanas reproduciendo un sonido natural “emotivo y realista” usando una muestra de 15 segundos, pero que aún no lanzará la tecnología al público general, ya que sería demasiado arriesgado.

“Reconocemos que generar un discurso que se asemeje a las voces de las personas, conlleva serios riesgos, que son especialmente importantes en un año electoral”, apuntó en un comunicado los creadores de ChatGPT.

Potencial de “Voice Engine”: voces sintéticas “emotivas y realistas”

Voice Engine representa un nuevo hito en el desarrollo de inteligencia artificial, siendo capaz de convertir texto en voz para crear voces sintéticas que, según OpenAI, mantienen la emotividad y el realismo del habla humano.

Esta tecnología podría tener aplicaciones diversas, desde permitir a los creadores de contenido traducir su trabajo conservando sus acentos nativos hasta ayudar a personas con dificultades de comunicación verbal.

Limitaciones en el acceso a la tecnología

Voice Engine ofrece diversas aplicaciones, desde facilitar la traducción de contenido manteniendo el acento nativo del hablante hasta ayudar a personas con dificultades de comunicación verbal, como aquellas que utilizan sistemas de llamadas telefónicas.

La empresa proporciona ejemplos convincentes de cómo Voice Engine puede traducir voces de diferentes idiomas conservando el acento original de la persona. Sin embargo, por el momento, el acceso a esta tecnología está limitado a ciertas empresas seleccionadas, como Age of Learning, HeyGen, Dimagi, Livox y Lifespan.

OpenAI ha adoptado una postura cautelosa ante el lanzamiento generalizado de Voice Engine, reconociendo el potencial de uso indebido de la voz sintética. Las empresas que acceden a esta tecnología deben cumplir con las políticas de uso establecidas por OpenAI, que incluyen obtener el consentimiento de las personas cuyas voces se clonan y divulgar a los usuarios que están interactuando con voces sintéticas.

Además, OpenAI ha implementado medidas de seguridad adicionales, como marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine y un monitoreo proactivo del uso de la tecnología.

La preocupación por el mal uso de voces sintéticas generadas por IA no es infundada. Este año electoral en Estados Unidos, se han reportado casos de llamadas automáticas con voces clonadas de políticos prominentes, como el presidente Joe Biden.

Otro gran problema de las voces sintéticas generadas por IA es que los estafadores las podrían usar para acceder a cuentas bancarias que utilizan autenticación de voz.

En este contexto, OpenAI prioriza la prudencia y la responsabilidad en el desarrollo y la implementación de su tecnología de clonación vocal, con el objetivo de minimizar los riesgos potenciales y maximizar los beneficios para la sociedad.