Tema: WaveNet by Google DeepMind, software de conversión de texto a audio que ya no suena robótico.

Mensajes

  • MaximVR

    17 Jun 2014 19:51

    Mensajes: 1163

    Visores

    Oculus Go
    MaximVR » 13 SEP 2016  12:58

    www.abc.es/tecnologia/informatica/soluciones/abci-wavenet-sistema-ayuda-maquinas-hablen-como-humano-201609121148_noticia.html
    computerhoy.com/noticias/software/deepmind-revoluciona-voz-sintetica-wavenet-50954

     

    Los ingenieros de DeepMind, una compañía de inteligencia artificial adquirida por Google en el año 2014, han desarrollado un software de voz sintética basado en la inteligencia artificial que funciona como un complejo sistema neuronal. Este tipo de voces han formado parte del ecosistema de Google desde hace años, como en Google Search, pero conseguir más realismo y naturalidad ha supuesto todo un reto.

     

    Hasta ahora, el principal método de lectura virtual pasaba por la concatenación TTS (texto a voz). Este sistema combina distintos fragmentos grabados para construir palabras y oraciones. El principal inconveniente del TTS es que estos fragmentos no se pueden modificar, lo que produce un resultado robótico y artificial. Otra alternativa ha sido el TTS paramétrico, un método que envía el texto a un codificador de voz y que es, si cabe, todavía menos natural.

     

    WaveNet de DeepMind es completamente diferente. En lugar de limitarse a combinar y reproducir un audio, integra un sistema de inteligencia artificial que es capaz de aprender y adaptarse al contexto. Funciona a 16.000 muestras por segundo y puede generar sus propias secuencias de audio sin intervención humana. Además, recurre a la estadística para predecir lo que tendrá que decir después.

     

    WaveNet es más que una sucesión de fonemas, estas voces sintéticas incluso integran los sonidos del movimiento de la boca y de la respiración humana. Esto nos da una idea del potencial de este software y del gran realismo de las voces generadas por ordenador que llegarán en un futuro próximo.

     

    2

Usuarios navegando por este foro:

4 Anónimo