Proyecto VocaliD crea voces sintéticas para personas que perderán su voz

Proyecto VocaliD crea voces sintéticas personalizadas para personas que perderán su voz
Comparte este artículo:

La Universidad de Northeastern en Estados Unidos ha inaugurado un centro, que trabaja junto al proyecto VocaliD, para que las personas que podrían perder su voz temporal o para siempre puedan grabarla en un sistema basado en inteligencia artificial. Gracias a esta iniciativa las personas podrán contar con una voz personalizada, de forma que podrán comunicarse con su propia voz, pero en versión sintetizada.

En concreto, la nueva ‘Clínica de Preservación de la Voz’ se ha creado en colaboración con la investigadora de la universidad estadounidense, Rupal Patel. El plan de ambas entidades es desarrollar un banco de voces que se guarden por todas las personas que lo deseen y pudieran estar en riesgo de perder la voz.

Se trata de situaciones delicadas, ya que “a veces las personas vienen a en el último momento, por lo que no tienen tiempo suficiente para almacenar su voz y están tan envueltos en su enfermedad y en su operación que no son capaces de registrar su voz “, según ha indicado Patel al medio británico The Guardian en referencia al motivo de la creación de la clínica.

La aplicación sólo daba la opción de grabar las voces desde las casas de los usuarios, pero ahora los profesionales del centro guiarán y asistirán a los clientes para que realicen todas sus grabaciones con buena calidad, así como para que se puedan emplear en la generación de la voz sintética.

Todo el procedimiento está diseñado con un sistema de inteligencia artificial, por lo que utilizan algoritmos de aprendizaje automático, los cuales comienzan a grabar cuando el usuario accede al ‘Banco de voces humanas de VocaliD‘. En ese momento, el cliente debe leer historias cortas o cualquier otro tipo de contenido de su interés, según indica la página oficial del centro.

Respecto al procedimiento de grabación, el usuario tendrá que emplear su voz durante al menos 40 minutos, sólo así se podrá crear una voz de calidad razonable. Como es lógico, cuantos más discursos y mejor calidad de las grabaciones, mejor será la calidad y la naturalidad de la voz digital.

No se trata de un proceso simple, sino que el centro recomienda grabar alrededor de 1.500 frases en diferentes sesiones para comprobar que el cliente tiene el suficiente audio de alta calidad para la creación de la voz. Es más, las grabaciones no se pueden efectuar todas de una vez, sino que el usuario tendrá que esperar entre 15 y 20 minutos por cada grabación, con el fin de evitar la fatiga.

Comparte este artículo:

Dejar respuesta