Grupo de tecnología del Habla: Ejemplos basados en concatenación
Hemos seleccionado algunos ejemplos que demuestran distintos aspectos
del conversor. También se puede
introducir el texto a sintetizar
, en vez de utilizar estos archivos ya generados, u obtener algunos
ejemplos de nuestro sistema de conversión texto-voz
basado en klatt
para castellano.
No olvide
que la generación original se realiza utilizando muestras de 16
bits con signo a 16 KHz. La calidad de la voz podría degradarse
al utilizar formatos con menos resolución.
Las conversiones se realizaron utilizando al paquete de software
SOX de Lance Norskog.
Por favor, consulte las notas de aviso acerca de cada formato antes de
seleccionar los ejemplos.
Desgraciadamente, no podemos comprobar todos los posibles formatos
de archivo (sólo Sun AU (8 KHz), datos en bruto y Wav por el momento).
Por favor, háganos saber si no puede obtener un sonido de calidad
para el formato que ha seleccionado, de forma que podamos corregir el problema.
Notas acerca de los formatos de archivo de audio proporcionados
Estamos ofreciendo los siguientes formatos de archivo:
- Datos en bruto (big-endian) (.rawb)
- Datos en bruto generados directamente por nuestro software de
conversión texto-voz. La frecuencia de muestreo es 16 KHz y las muestras
son de 16 bits con signo lineales para máquinas big-endian (Sun 4 por ejemplo).
- Datos en bruto little-endian (.rawl)
- Datos en bruto generados directamente por nuestro software de
conversión texto-voz. La frecuencia de muestreo es 16 KHz y las muestras
son de 16 bits con signo lineales para máquinas little-endian (PC, VAX por ejemplo).
- Formato WAV de MS-WINDOWS (.wav)
- Archivos WAV estándar grabados a 16 KHz.
- Formato AU de SUN tradicional (.au)
- Archivos AU que utilizan muestras con ley a 8 KHz.
- snd de Mac (.snd)
- Archivos snd de Mac muestreados a 11 KHz.
- aiff de Mac (.aiff)
- hcom de Mac (.hcom) a 11025 Hz
- Formato VOC de Soundblaster (.voc)
- Archivos de Turtle Beach (.smp)
Párrafo largo
Un párrafo largo que muestra variaciones en frecuencia fundamental y velocidad:
Vamos a hacerles una demostración, acerca del funcionamiento, y las
posibilidades de nuestro conversor texto habla. En primer lugar, podemos modificar la velocidad.
Por ejemplo.
[v:80] Vísteme despacio que tengo prisa.
[v:250] Así por el contrario puedo ir más rápido.
[v:180]
A continuación oirán una frase con variaciones de entonación.
[t:170] A Dios rogando. [t:60] Y con el mazo dando.
[t:100]
Se pueden reproducir ficheros de formato DOS y güindous.
Por último, entiendo algunas abreviaturas, como
excmo., Kg., kHz., km/h., tel., etc..
[rawb 1.1Mb]
[rawl 1.1Mb]
[wav 1.1Mb]
[au 590Kb]
[snd 406Kb]
[aiff 1.1M]
[hcom 150Kb]
[voc 590Kb]
[smp 1.1Mb]
Párrafo breve
Un párrafo un poco más breve.
Este es el conversor texto voz, del Departamento de
Ingeniería Electrónica, adscrito a la Escuela
Técnica Superior de Ingenieros de Telecomunicación, de la
Universidad Politécnica de Madrid.
[rawb 374Kb]
[rawl 374Kb]
[wav 374Kb]
[au 187Kb]
[snd 128Kb]
[aiff 374Kb]
[hcom 51Kb]
[voc 187Kb]
[smp 374Kb]
Una sola frase enunciativa
Vas a ir a la Universidad.
[rawb 45Kb]
[rawl 45Kb]
[wav 45Kb]
[au 22Kb]
[snd 15Kb]
[aiff 45Kb]
[hcom 7.5Kb]
[voc 22Kb]
[smp 45Kb]
Una sola frase interrogativa
¿Vas a ir a la Universidad?
[rawb 63Kb]
[rawl 63Kb]
[wav 63Kb]
[au 31Kb]
[snd 22Kb]
[aiff 63Kb]
[hcom 8Kb]
[voc 31Kb]
[smp 64Kb]
Una sola frase con sonidos nasales
Mi mamá le cantó una nana al niño.
[rawb 66Kb]
[rawl 66Kb]
[wav 66Kb]
[au 33Kb]
[snd 22Kb]
[aiff 66Kb]
[hcom 10Kb]
[voc 33Kb]
[smp 66Kb]
Una sola frase con fricativas
Las fosas no dejan pasar con zuecos.
[rawb 78Kb]
[rawl 78Kb]
[wav 78Kb]
[au 39Kb]
[snd 27Kb]
[aiff 78Kb]
[hcom 11Kb]
[voc 39b
[smp 78Kb]
Una sola frase con sonidos BDG
La bodega de Diego.
[rawb 34Kb]
[rawl 34Kb]
[wav 34Kb]
[au 17Kb]
[snd 11Kb]
[aiff 34Kb]
[hcom 5Kb]
[voc 17Kb]
[smp 34Kb]
postscript