4. EL SONIDO
EL SONIDO
Alteración física en un
medio. Se propaga en el
medio como una onda de
presión mediante el
movimiento de átomos o
moléculas
Sensación detectada por
el oído e interpretado por
nuestro cerebro de una
manera determinada.
11. AUDIO DIGITAL Y DISTRIBUCIÓN DE
LAPLACE
Distribución de
2900 muestras de
audio para el
fonema ‘a’
Distribución de las
diferencias para el
fonema ‘a’
Distribución de
2900 muestras
aleatorias
Distribución de las
diferencias para las
muestras aleatorias
12. Rango de frecuencias del oído
humano: 20Hz – 20000Hz
EL SISTEMA AUDITIVO HUMANO
No uniforme
Sensibilidad Máxima
Rango de la voz humana:
500Hz – 2000Hz
Eliminar cualquier muestra
de audio por debajo del
umbral
Compresión con Pérdidas
Conocer el espectro en
frecuencia del sonido
Enmascaramiento
de Frecuencia
Enmascaramiento
Temporal
13. Funciona bien con muestras
de 8 bits
Funciona bien cuando el
sonido tiene largas rachas
de muestras idénticas
MÉTODOS DE COMPRESIÓN
CONVENCIONALES
RLE
Para 8 bits→256 muestras→ distribución plana
16 bits→65000 muestras→ probabilidades sesgadas
Asignan códigos de tamaño
variables a las muestras de
acuerdo con su frecuencia
de ocurrencia
Estadístico
Partes que suenan igual, suelen digitalizarse de forma distinta y
entran en el diccionario como frases diferentes
Esperan encontrar las
mismas frases, una y otra
vez en los datos
Diccionarios
14. FORMATO DE AUDIO WAVE
Formato de Archivo Nativo del Sistema Operativo Windows para el almacenamiento
de datos de audio digital.
Se ejecuta en procesadores
Intel que utilizan el orden
de byte Little endian
Aspectos Técnicos
Normalmente contienen
cadenas de texto para
especificar los puntos de
referencia, etiquetas, notas
y otra información.
El formato de archivo Wav
es un caso especial, donde
no se utiliza compresión
La organización de un
archivo Wave se basa en la
estructura RIFF estándar
16. FORMATO DE AUDIO WAVE
Las especificaciones principales incluidas en el bloque de formato son las siguientes.
Código de
Compresión
Número de Canales
Frecuencia de
Muestreo
Promedio de Bytes
por segundo
Bloque de
alineación
Bits significativos
por muestra
Bytes de formatos
adicionales
El bloque de datos comienza con la cadena data, que es
seguida por el tamaño de los datos que siguen
(como un entero de 32 bits). Ésto es seguido por los
bytes de datos (muestras de audio).