Grupo de tecnología del Habla: Ejemplos basados en concatenación
GTH

Grupo de tecnología del Habla: Ejemplos basados en concatenación


Hemos seleccionado algunos ejemplos que demuestran distintos aspectos del conversor. También se puede introducir el texto a sintetizar , en vez de utilizar estos archivos ya generados, u obtener algunos ejemplos de nuestro sistema de conversión texto-voz basado en klatt para castellano.

No olvide que la generación original se realiza utilizando muestras de 16 bits con signo a 16 KHz. La calidad de la voz podría degradarse al utilizar formatos con menos resolución. Las conversiones se realizaron utilizando al paquete de software SOX de Lance Norskog. Por favor, consulte las notas de aviso acerca de cada formato antes de seleccionar los ejemplos.

Desgraciadamente, no podemos comprobar todos los posibles formatos de archivo (sólo Sun AU (8 KHz), datos en bruto y Wav por el momento). Por favor, háganos saber si no puede obtener un sonido de calidad para el formato que ha seleccionado, de forma que podamos corregir el problema.


Notas acerca de los formatos de archivo de audio proporcionados

Estamos ofreciendo los siguientes formatos de archivo:

Datos en bruto (big-endian) (.rawb)
Datos en bruto generados directamente por nuestro software de conversión texto-voz. La frecuencia de muestreo es 16 KHz y las muestras son de 16 bits con signo lineales para máquinas big-endian (Sun 4 por ejemplo).
Datos en bruto little-endian (.rawl)
Datos en bruto generados directamente por nuestro software de conversión texto-voz. La frecuencia de muestreo es 16 KHz y las muestras son de 16 bits con signo lineales para máquinas little-endian (PC, VAX por ejemplo).
Formato WAV de MS-WINDOWS (.wav)
Archivos WAV estándar grabados a 16 KHz.
Formato AU de SUN tradicional (.au)
Archivos AU que utilizan muestras con ley a 8 KHz.
snd de Mac (.snd)
Archivos snd de Mac muestreados a 11 KHz.
aiff de Mac (.aiff)
hcom de Mac (.hcom) a 11025 Hz
Formato VOC de Soundblaster (.voc)
Archivos de Turtle Beach (.smp)


Párrafo largo

Un párrafo largo que muestra variaciones en frecuencia fundamental y velocidad:

Vamos a hacerles una demostración, acerca del funcionamiento, y las posibilidades de nuestro conversor texto habla. En primer lugar, podemos modificar la velocidad. Por ejemplo. [v:80] Vísteme despacio que tengo prisa. [v:250] Así por el contrario puedo ir más rápido. [v:180] A continuación oirán una frase con variaciones de entonación. [t:170] A Dios rogando. [t:60] Y con el mazo dando. [t:100] Se pueden reproducir ficheros de formato DOS y güindous. Por último, entiendo algunas abreviaturas, como excmo., Kg., kHz., km/h., tel., etc..

[rawb 1.1Mb] [rawl 1.1Mb] [wav 1.1Mb] [au 590Kb] [snd 406Kb] [aiff 1.1M] [hcom 150Kb] [voc 590Kb] [smp 1.1Mb]


Párrafo breve

Un párrafo un poco más breve.

Este es el conversor texto voz, del Departamento de Ingeniería Electrónica, adscrito a la Escuela Técnica Superior de Ingenieros de Telecomunicación, de la Universidad Politécnica de Madrid.

[rawb 374Kb] [rawl 374Kb] [wav 374Kb] [au 187Kb] [snd 128Kb] [aiff 374Kb] [hcom 51Kb] [voc 187Kb] [smp 374Kb]


Una sola frase enunciativa

Vas a ir a la Universidad.

[rawb 45Kb] [rawl 45Kb] [wav 45Kb] [au 22Kb] [snd 15Kb] [aiff 45Kb] [hcom 7.5Kb] [voc 22Kb] [smp 45Kb]


Una sola frase interrogativa

¿Vas a ir a la Universidad?

[rawb 63Kb] [rawl 63Kb] [wav 63Kb] [au 31Kb] [snd 22Kb] [aiff 63Kb] [hcom 8Kb] [voc 31Kb] [smp 64Kb]


Una sola frase con sonidos nasales

Mi mamá le cantó una nana al niño.

[rawb 66Kb] [rawl 66Kb] [wav 66Kb] [au 33Kb] [snd 22Kb] [aiff 66Kb] [hcom 10Kb] [voc 33Kb] [smp 66Kb]


Una sola frase con fricativas

Las fosas no dejan pasar con zuecos.

[rawb 78Kb] [rawl 78Kb] [wav 78Kb] [au 39Kb] [snd 27Kb] [aiff 78Kb] [hcom 11Kb] [voc 39b [smp 78Kb]


Una sola frase con sonidos BDG

La bodega de Diego.

[rawb 34Kb] [rawl 34Kb] [wav 34Kb] [au 17Kb] [snd 11Kb] [aiff 34Kb] [hcom 5Kb] [voc 17Kb] [smp 34Kb]


PREVIOUS PAGE HOME PAGE TOP

postscript