Alexa de Amazon mejora sus herramientas de voz para ayudar a los desarrolladores

Amazon Alexa es un asistente personal inteligente desarrollado por Amazon Lab126, y que se popularizó con el lanzamiento de Amazon Echo y Amazon Echo Dot. La intereacción con este dispositivo se produce mediante comandos de voz que nos permiten reproduccir música, hacer listas de tareas pendientes, establecer alarmas, transmitir podcasts, reproducir audiolibros además de proporcionar información meteorológica, de tráfico y otra información en tiempo real, como noticias.

Alexa también puede controlar varios dispositivos inteligentes que se utilizan como un sistema de automatización del hogar, por lo que ha supuesto un paso importante en el uso más sencillo de cualquier dispositivo domótico. La mayoría de los dispositivos que se integran con Alexa permiten conectar el dispositivo utilizando una palabra de activación (como Echo); Otros dispositivos (como la aplicación de Amazon en iOS o Android) requieren que el usuario presione un botón para activar el modo de escucha de Alexa. Actualmente, la interacción y la comunicación con Alexa sólo está disponible en inglés y alemán…aunque llegará a más idiomas.

Alexa de Amazon se aprovecha de un lenguaje de marcado de síntesis de voz especialmente diseñado para ayudar a los desarrolladores a hacer que la voz de Alexa suene más natural. Hoy en día, ese lenguaje se está actualizando y añadiendo adicionalmente cinco herramientas de voz de Alexa.

Las nuevas herramientas de SSML permiten a Alexa susurrar, cambiar el énfasis del discurso, aprovecharse de la prosodia, difamar las palabras como si fueran palabrotas en la televisión por cable, y leer cosas además del texto escrito, lo que podría ser útil para que Alexa pueda comentar sobre los compromisos o tareas desarrolladas en diferentes Apps . Las nuevas herramientas tienen sus propias variables, lo que permite a los desarrolladores jugar con una amplia gama de diferentes opciones para la voz de Alexa.

Innovacion en las herramientas de voz de Alexa

La herramienta de Whisper es bastante simple; sólo hace que Alexa susurre. Por su parte la herramienta Expletive funciona de la misma manera, pero en lugar de pronunciar el diálogo más suavemente, Alexa simplemente emite un efecto de sonido de pitido. Por su parte, herramienta Sub le permite definir lo que Alexa dirá en el código de Skill, mientras que el texto sin formato leerá algo más. Esto puede ser útil para dispositivos con pantallas, donde un usuario puede leer contenido mientras Alexa lo habla.

El caso de la herramienta Emphasis viene en las variaciones ninguno, moderado y fuerte, que se explican por sí mismas. También hay una opción reducida para la herramienta deEmphasis, que reducirá el énfasis en una palabra o frase al hablar más silencioso y más rápido. La nueva herramienta final en el set, Prosody, permite a los desarrolladores controlar el tono y la velocidad de la voz de Alexa. Cuando se utiliza con la herramienta de volumen, se puede utilizar para personalizar el discurso exactamente como el desarrollador lo desee.

Alexa de Amazon ofrece más posibilidades para los desarrolladores

Estas nuevas herramientas de voz de Alexa se integran perfectamente con el impresionante catálogo existente que los desarrolladores de habilidades de Alexa tienen a su disposición. Junto con las herramientas SSML existentes, estas nuevas habilidades proporcionan a los desarrolladores un nivel de libertad sin precedentes en la personalización de la voz de Alexa de Amazon, y la oportunidad de hacer que suene lo más humano posible. Curiosamente, se están desarrollando justo después de que Google anunció un nuevo bot de síntesis de voz, llamado Tacotron, que integra y automatiza la mayoría de estas nuevas características y algunas otras, a través de la magia de aprendizaje de máquinas y redes neuronales.

Saludos desde lo más profundo de los bytes.