Ampliando las voces para respuestas verbales de VoiceAttack
Buenas a todos.
Estoy evaluando el excelente programa VoiceAttack que muchos usáis con Elite: Dangerous. Buceando por YouTube, he visto las maravillas que se pueden hacer, no ya para que a un mandato de voz nos realice un comando en el juego (pulsación de teclas, movimiento del ratón, etc.), sino que además nos responda verbalmente. Incluso sin aplicar ningún comando al juego, solo para darnos información o para crear ambiente a aumentar la experiencia de inmersión del juego. Hay gente que vende excelentes paquetes de comandos para Elite: Dangerous con respuestas verbales de alta calidad para VoiceAttack, pero además de que te cuesten dinero, no se encuentran en español.
Algunos en este foro ya han puesto muchos ejemplos y comandos, así que seguramente ya sabréis de qué va el tema de crear comandos, y voy a lo que voy.
He visto que los dos métodos principales de respuesta verbal que podemos incorporar a los comandos de VoiceAttack son dos:
1) Reproducir un sonido que tendremos guardado en determinada carpeta del ordenador
- Ventaja: encontrando los sonidos adecuados, podemos crear realmente resultados de gran calidad.
- Inconveniente: no es fácil encontrar las frases exactas que queremos tener como respuestas verbales, o a alguien que nos las grabe con la calidad deseada.
2) Convertir un texto a voz usando el motor de texto a voz incorporado en el sistema operativo- Inconveniente: no es fácil encontrar las frases exactas que queremos tener como respuestas verbales, o a alguien que nos las grabe con la calidad deseada.
- Ventaja: puedes poner el texto que te dé la gana sin preocuparte por buscar a alguien que lo grabe o encontrar un archivo de sonido con esa frase.
- Inconveniente: por defecto los sistemas operativos no traen muchas voces para elegir, y son de calidad mediocre y el texto nunca quedará igual de bien que leído por una persona. Por ejemplo, Windows 7 x64 trae solo la voz Anna, en inglés, y no tiene muy buena calidad.
Bueno, no estaría escribiendo este mensaje si no trajera algunas ideas debajo del brazo para cada uno de los casos...- Inconveniente: por defecto los sistemas operativos no traen muchas voces para elegir, y son de calidad mediocre y el texto nunca quedará igual de bien que leído por una persona. Por ejemplo, Windows 7 x64 trae solo la voz Anna, en inglés, y no tiene muy buena calidad.
Soluciones posibles para ambos casos
CASO 1 (Reproducir un sonido que tendremos guardado en determinada carpeta)
En realidad no hay nada que pueda sustituir la calidad de un sonido de una persona con una voz adecuada leyendo el texto que se necesita con la entonación correcta. Lo más que puede uno aproximarse es creando nuestros propios sonidos personalmente o con una aplicación de texto a voz que tenga cierta calidad (nunca llegará a ser como grabado por un profesional, pero hay resultados que no quedan mal del todo).
- En estos enlaces de ejemplo (hay bastantes más por ahí, incluso extensiones que se instalan como complemento en el navegador) podemos encontrar aplicaciones online que nos permiten convertir un texto a voz (sin meter ruido o publicidad) permitiendo seleccionar de entre una variedad de voces limitada:
http://www.oddcast.com/home/demos/tts/tts_example.php?utm_expid=46875813-0
http://www.ivona.com/
http://www.acapela-group.com/
https://www.cereproc.com/es/
Podemos grabar el sonido que se está reproduciendo en el navegador con diferentes programas. Yo he probado Freecorder (http://www.freecorder.com/) y me funciona perfectamente, integrado con Internet Explorer (no parece que Chrome permita que se integre como complemento).
http://www.oddcast.com/home/demos/tts/tts_example.php?utm_expid=46875813-0
http://www.ivona.com/
http://www.acapela-group.com/
https://www.cereproc.com/es/
Podemos grabar el sonido que se está reproduciendo en el navegador con diferentes programas. Yo he probado Freecorder (http://www.freecorder.com/) y me funciona perfectamente, integrado con Internet Explorer (no parece que Chrome permita que se integre como complemento).
- Usar un programa instalable de conversión de texto a voz, como por ejemplo Balabolka (http://www.cross-plus-a.com/es/balabolka.htm), que incorpora ya las funciones de grabación del audio en varios formatos. Aunque claro, estos programas suelen depender de las voces instaladas en motor de conversión de texto a voz del sistema operativo… lo que nos lleva al siguiente apartado.
CASO 2 (Convertir un texto a voz usando el motor incorporado en el sistema operativo)
Podemos incorporar al sistema operativo voces adicionales para que tengamos más variedad entre lo que elegir, incluso puede que encontremos alguna de la suficiente calidad como para que cuando VoiceAttack envía el texto para su conversión, el resultado sea aceptable. Es la mejor solución a largo plazo, siempre que consigamos una voz con buena calidad (esto es lo difícil). El método normal para añadir voces de lectura de texto al sistema operativo, suele ser instalarlas con su propio archivo instalador. El problema es que normalmente no se comercializan de forma individual, sino como parte de algún programa de conversión de texto. Y salen bastante caras, por cierto. Si se han incorporado correctamente, deben aparecer en el sistema operativo en Panel de Control -> Accesibilidad -> Reconocimiento de voz -> Texto a voz (tal como muestra esta imagen de Windows 7 x64)

- Aquí algunos proveedores con voces de buena calidad:
IVONA (http://www.ivona.com/) en mi opinión, las mejores voces. Yo busco voces españolas, pero la voz británica de Amy es sencillamente impresionante. Me he instalado una versión de prueba de 21 días y es muy parecida a las voces de la nave del Elite: Dangerous.
Nuance (http://www.nuance.es/) la voz española de Leonor es muy buena.
Cere Proc (https://www.cereproc.com/es/) la voz de Sara está bastante bien.
Acapela Group (http://www.acapela-group.com/)
- También hay una forma (un tanto complicada, aunque no demasiado) para poder instalar algunas voces gratuitas de Microsoft. No pueden compararse con la calidad de las versiones comerciales, pero la que trae de Helena en castellano no está mal, y me planteo usarla en VoiceAttack. A continuación explico el método usado para Windows 7 x64 (para otras plataformas puede haber variaciones en el proceso)
i) Descargar e instalar “Microsoft Speech Platform - Runtime (Version 11)” del enlace:
http://www.microsoft.com/en-us/download/details.aspx?id=27225
http://www.microsoft.com/en-us/download/details.aspx?id=27225
ii) Descargar e instalar las voces adicionales que se deseen del enlace:
http://www.microsoft.com/en-us/download/details.aspx?id=27224
iii) Por desgracia, hacer que el motor de texto a voz del sistema operativo incorpore estas voces recién instaladas para este otro motor recién instalado solo es posible mediante la edición de las claves de registro del sistema operativo. Precaución al hacer esto:
http://www.microsoft.com/en-us/download/details.aspx?id=27224
iii) Por desgracia, hacer que el motor de texto a voz del sistema operativo incorpore estas voces recién instaladas para este otro motor recién instalado solo es posible mediante la edición de las claves de registro del sistema operativo. Precaución al hacer esto:
(1) Abrir el editor de registro (escribir regedit en el cuadro de búsqueda de Windows y pulsar intro) y localizar la clave de registro: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech Server\v11.0\Voices, dentro de dicha clave se verá una carpeta llamada “Tokens”. Pulsar la carpeta “Tokens” con el botón derecho y exportar (guardar el archivo como Tokens1.reg, por ejemplo).
(2) Localizar la clave de registro: HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\Microsoft\Speech Server\v11.0\Voices, dentro de dicha clave se verá una carpeta llamada “Tokens”. Pulsar la carpeta “Tokens” con el botón derecho y exportar (guardar el archivo como Tokens2.reg, por ejemplo).
(3) Editar con el bloc de notas (botón derecho sobre el archivo -> editar) los dos archivos anteriores y sustituir todas las ocurrencias de “\Speech Server\v11.0\” por “\Speech\” en ambos archivos. Es recomendable usar la herramienta del bloc de notas de Buscar y Reemplazar para no equivocarnos o dejarnos sin cambiar alguna ocurrencia del texto. Guardar los cambios en ambos archivos.
(4) Incorporar las claves de registro modificadas anteriormente ejecutando ambos archivos (haciendo doble click sobre ellos y respondiendo “Sí” a la pregunta de seguridad).
(2) Localizar la clave de registro: HKEY_LOCAL_MACHINE\SOFTWARE\Wow6432Node\Microsoft\Speech Server\v11.0\Voices, dentro de dicha clave se verá una carpeta llamada “Tokens”. Pulsar la carpeta “Tokens” con el botón derecho y exportar (guardar el archivo como Tokens2.reg, por ejemplo).
(3) Editar con el bloc de notas (botón derecho sobre el archivo -> editar) los dos archivos anteriores y sustituir todas las ocurrencias de “\Speech Server\v11.0\” por “\Speech\” en ambos archivos. Es recomendable usar la herramienta del bloc de notas de Buscar y Reemplazar para no equivocarnos o dejarnos sin cambiar alguna ocurrencia del texto. Guardar los cambios en ambos archivos.
(4) Incorporar las claves de registro modificadas anteriormente ejecutando ambos archivos (haciendo doble click sobre ellos y respondiendo “Sí” a la pregunta de seguridad).
iv) Comprobar en Panel de Control -> Accesibilidad -> Reconocimiento de voz -> Texto a voz que en el desplegable aparecen la voces instaladas, lo que significa que estarán disponibles para ser usadas en VoiceAttack (ver imagen anterior)
Y eso es todo. Yo ya estoy escuchando en español las respuestas de mi nave... cuando le digo "Información Cobra" me responde "Es una nave de propósito general, cuya masa suele rondar las 270 toneladas. Es rápida, con una velocidad máxima de 280 metros por segundo, o 400 con sobreimpulso. Es moderadamente maniobrable, con un índice de 6 sobre 10. Anclajes de armamento: 2 pequeños y 2 medianos. El índice de escudo es de 80. El de blindaje es de 120."
Last edited: