SlideShare uma empresa Scribd logo
1 de 57
Análise Comparativa: 
MP3 e AAC 
Bernardo de Campos Vidal Camilo 
Pedro de Vasconcellos 
Rachel Gonçalves de Castro 
22/11/2014 Universidade Federal do Rio de Janeiro 1
Roteiro 
• Introdução 
– Motivação 
– MPEG 
– Janela 
• Codificador perceptivo 
• MP3 
• AAC 
• Conclusão 
– Vantagens e desvantagens 
• Bibliografia 
• Dúvidas 
22/11/2014 Universidade Federal do Rio de Janeiro 2
Introdução - Motivação 
• Grande evolução na codificação de áudio 
• Mais “populares” 
– MP3 e AAC 
• “Qual codec apresenta maior qualidade?” 
22/11/2014 Universidade Federal do Rio de Janeiro 3
Introdução - MPEG 
• Moving Pictures Expert Group 
– Organização Internacional de Normalização 
– Estabelecer normas internacioanis para codificação de 
áudio 
• MP3 
– MPEG-1 Layer 3 
• AAC 
– MPEG-2 
• Compressão com perdas 
– Irrelevância perceptiva do sistema auditivo 
– Redundância estatística 
22/11/2014 Universidade Federal do Rio de Janeiro 4
Introdução - MPEG 
• Evolução: 
22/11/2014 Universidade Federal do Rio de Janeiro 5
Introdução - MPEG 
• Aplicações: 
– Produção de áudio 
– Transmissão de som televiso 
– Armazenamento digital 
22/11/2014 Universidade Federal do Rio de Janeiro 6
Janela 
10Hz Senoidal 
22/11/2014 Universidade Federal do Rio de Janeiro 7
Janela 
FFT 10Hz Senoidal 
22/11/2014 Universidade Federal do Rio de Janeiro 8
Janela 
Senoidal 9.5Hz 
22/11/2014 Universidade Federal do Rio de Janeiro 9
Janela 
FFT Senoidal 9.5Hz 
22/11/2014 Universidade Federal do Rio de Janeiro 10
Janela 
Senoidal 9.5Hz Fim-a-Fim 
22/11/2014 Universidade Federal do Rio de Janeiro 11
Janela 
Hanning window 
22/11/2014 Universidade Federal do Rio de Janeiro 12
Janela 
Senoidal multiplicada pela janela 
22/11/2014 Universidade Federal do Rio de Janeiro 13
Janela 
FFT Senoidal 9.5Hz (após janela) 
22/11/2014 Universidade Federal do Rio de Janeiro 14
Janela 
FFT Senoidal 10Hz (após janela) 
22/11/2014 Universidade Federal do Rio de Janeiro 15
Janela 
Senoidal 10Hz, evento curto de 100Hz 
22/11/2014 Universidade Federal do Rio de Janeiro 16
Janela 
50% overlapping 
22/11/2014 Universidade Federal do Rio de Janeiro 17
Janela 
Spectro com 0% e 50% overlapping 
22/11/2014 Universidade Federal do Rio de Janeiro 18
Janela 
Janela curta: boa resolução por tempo 
22/11/2014 Universidade Federal do Rio de Janeiro 19
Janela 
Janela longa: boa resolução por frequência 
22/11/2014 Universidade Federal do Rio de Janeiro 20
Janela 
22/11/2014 Universidade Federal do Rio de Janeiro 21
Janela 
22/11/2014 Universidade Federal do Rio de Janeiro 22
Codificador Perceptivo 
Banco de Filtros: 
• Domínio do tempo  domínio da frequência 
Modelo perceptivo: 
• Computar estimativa do limiar de mascaramento usando regras da psico-acústica 
Quantização e Codificação: 
• Componentes espectrais são quantizados e codificados com o objetivo de manter o 
ruído, introduzido pela quantização, abaixo do limiar de mascaramento 
Codificação de bitstream: 
• Juntar o bitstream (coeficientes espectrais + outras informações) 
22/11/2014 Universidade Federal do Rio de Janeiro 23
MP3 
22/11/2014 Universidade Federal do Rio de Janeiro 24
MP3 
• Banco de Filtro polifásico 
– Divide o sinal em 32 sub-bandas 
22/11/2014 Universidade Federal do Rio de Janeiro 25
MP3 
• MDCT (Modified Discrete Cosine Transform) 
– Converte o sinal para o domínio da frequência 
– Divide cada sub-banda em 18 mais finas 
32 * 18 = 576 linhas de frequência 
– Melhor eliminação de redundância 
22/11/2014 Universidade Federal do Rio de Janeiro 26
MP3 
• FFT 1024 Points (Fast Fourier Transform) 
– Converte o sinal para o dimínio da frequência 
– Maior resolução da frequência 
– Cálculo do limiar de mascaramento 
22/11/2014 Universidade Federal do Rio de Janeiro 27
MP3 
• Modelo Psico-Acústico 
– Leva em consideração a sensibilidade do ouvido 
humano 
– Frequências entre 20Hz a 20KHz 
– Limiar de audição 
22/11/2014 Universidade Federal do Rio de Janeiro 28
MP3 
• Modelo Psico-Acústico 
– Mascaramento em frequência 
– Mascaramento temporal 
22/11/2014 Universidade Federal do Rio de Janeiro 29
MP3 
• Modelo Psico-Acústico 
– Limiar de mascaramento 
22/11/2014 Universidade Federal do Rio de Janeiro 30
MP3 
• Codificação de Huffman 
– Utiliza a probabilidade de ocorrência para 
construir uma árvore de codificação 
22/11/2014 Universidade Federal do Rio de Janeiro 31
MP3 
• Quantização e codificação 
– Codifica com menor precisão valores grandes 
– Dois loops: 
• Rate Control Loop 
• Distortion Control Loop 
22/11/2014 Universidade Federal do Rio de Janeiro 32
MP3 
• Rate Control Loop 
– Número de bits resultante deve ser menor que 
número de bits disponível 
– Passo de quantização aumenta  valores 
quantizados diminuem 
22/11/2014 Universidade Federal do Rio de Janeiro 33
MP3 
• Distortion Control Loop 
– Controla ruído causado pelo processo de 
quantização 
– Ruído abaixo do limiar de mascaramento 
– Fatores de escala 
22/11/2014 Universidade Federal do Rio de Janeiro 34
MP3 
• Formatação de Bitstream 
– Armazena o som codificado em frames 
– Cada frame contem informação de 1152 amostras 
de áudio 
22/11/2014 Universidade Federal do Rio de Janeiro 35
AAC 
Gain 
Control 
Filter 
Bank 
TNS 
Intensity 
/ 
Coupling 
Bitstream 
Output Data 
Bitstream Multiplexer 
Prediction M/S 
Scale 
Factors 
Quant. 
Control 
Noiseless 
Coding 
Rate/Distortion Control 
Input 
time 
signal Spectral Processing 
Perceptual Model 
Quantization and 
Noiseless Coding 
22/11/2014 Universidade Federal do Rio de Janeiro 36
AAC 
• Gain Control 
– Opcional 
– Normalmente não usado 
– PQF (filtro polifásico de quadratura) 
• 4 bandas de frequência igualmente espaçadas 
• Taxas de amostragem ajustáveis 
22/11/2014 Universidade Federal do Rio de Janeiro 37
AAC 
Gain 
Control 
Filter 
Bank 
TNS 
Intensity 
/ 
Coupling 
Bitstream 
Output Data 
Bitstream Multiplexer 
Prediction M/S 
Scale 
Factors 
Quant. 
Control 
Noiseless 
Coding 
Rate/Distortion Control 
Input 
time 
signal Spectral Processing 
Perceptual Model 
Quantization and 
Noiseless Coding 
22/11/2014 Universidade Federal do Rio de Janeiro 38
AAC 
• Filter Bank 
– MDCT Puro, 50% sobreposição 
• Aplicado diretamente sobre os frames, antes da divisão 
em 32 sub-bandas 
• Long window: 2048 amostras 
• Short window: 256 amostras (x8) 
– 1024 linhas de frequência 
22/11/2014 Universidade Federal do Rio de Janeiro 39
AAC 
Gain 
Control 
Filter 
Bank 
TNS 
Intensity 
/ 
Coupling 
Bitstream 
Output Data 
Bitstream Multiplexer 
Prediction M/S 
Scale 
Factors 
Quant. 
Control 
Noiseless 
Coding 
Rate/Distortion Control 
Input 
time 
signal Spectral Processing 
Perceptual Model 
Quantization and 
Noiseless Coding 
22/11/2014 Universidade Federal do Rio de Janeiro 40
AAC 
• TNS (Temporal Noise Shaping) 
– Opcional 
– Molda o ruído de quantização no domínio do 
tempo 
22/11/2014 Universidade Federal do Rio de Janeiro 41
AAC 
• TNS (Temporal Noise Shaping) 
Sinal Original Ruído quantizado com TNS Ruído quantizado sem TNS 
22/11/2014 Universidade Federal do Rio de Janeiro 42
AAC 
• TNS (Temporal Noise Shaping) 
Sinal Original 
Quantizado com TNS 
Quantizado sem TNS 
22/11/2014 Universidade Federal do Rio de Janeiro 43
AAC 
Gain 
Control 
Filter 
Bank 
TNS 
Intensity 
/ 
Coupling 
Bitstream 
Output Data 
Bitstream Multiplexer 
Prediction M/S 
Scale 
Factors 
Quant. 
Control 
Noiseless 
Coding 
Rate/Distortion Control 
Input 
time 
signal Spectral Processing 
Perceptual Model 
Quantization and 
Noiseless Coding 
22/11/2014 Universidade Federal do Rio de Janeiro 44
AAC 
• Intensity/Coupling 
– Opcional 
– Combina dois canais stereo (left/right) em um só 
(mono) 
– Explora redudâncias na região de alta frequência 
22/11/2014 Universidade Federal do Rio de Janeiro 45
AAC 
Gain 
Control 
Filter 
Bank 
TNS 
Intensity 
/ 
Coupling 
Bitstream 
Output Data 
Bitstream Multiplexer 
Prediction M/S 
Scale 
Factors 
Quant. 
Control 
Noiseless 
Coding 
Rate/Distortion Control 
Input 
time 
signal Spectral Processing 
Perceptual Model 
Quantization and 
Noiseless Coding 
22/11/2014 Universidade Federal do Rio de Janeiro 46
AAC 
• Prediction 
– Opcional 
– Usado para minimizar redundâncias 
– Eficiente em sinal estacionário/periódico 
– Aproveita semelhanças dos coeficientes 
quantizados de blocos adjacentes 
22/11/2014 Universidade Federal do Rio de Janeiro 47
AAC 
• Prediction 
2 frames seguidos com um mesmo padrão 
22/11/2014 Universidade Federal do Rio de Janeiro 48
AAC 
• Prediction 
Comparação 
22/11/2014 Universidade Federal do Rio de Janeiro 49
AAC 
• Prediction 
Transformada 
22/11/2014 Universidade Federal do Rio de Janeiro 50
AAC 
• Prediction 
Coeficientes 
divididos em 
bandas 
Resíduo enviado 
(acima) 
22/11/2014 Universidade Federal do Rio de Janeiro 51
AAC 
Gain 
Control 
Filter 
Bank 
TNS 
Intensity 
/ 
Coupling 
Bitstream 
Output Data 
Bitstream Multiplexer 
Prediction M/S 
Scale 
Factors 
Quant. 
Control 
Noiseless 
Coding 
Rate/Distortion Control 
Input 
time 
signal Spectral Processing 
Perceptual Model 
Quantization and 
Noiseless Coding 
22/11/2014 Universidade Federal do Rio de Janeiro 52
AAC 
• M/S 
– Opcional 
– Converte um sinal stereo em dois formatos: 
• Middle (soma, L + R) 
• Side (diferença, L – R) 
– Não altera o sinal de cada canal (diferentemente 
do intensity/coupling), que pode ser reconstruído 
– Aplicado o mascaramento, verifica qual 
codificação (L/R, M/S) exige menos bits 
22/11/2014 Universidade Federal do Rio de Janeiro 53
Conclusão 
• O AAC é, possivelmente, o sucessor do MP3 
A melhoria da compressão oferece resultados de alta qualidade 
com menores tamanhos de arquivo 
Suporte para multicanais de áudio (até 48 canais de 
frequência) 
Melhoria na eficiência da decodificação, requerendo menos 
potência 
22/11/2014 Universidade Federal do Rio de Janeiro 54
Conclusão 
• Por que o MP3 continua forte? 
Familiaridade com o formato 
Grande quantidade de música disponível no formato MP3 
Grande variedade de hardware e software que “tira vantagem” 
do formato 
Ausência de restrições DRM (Digital Rights Management) 
A maioria dos utilizadores não conhece ou ignora as 
desvantagens do formato 
22/11/2014 Universidade Federal do Rio de Janeiro 55
Dúvidas 
22/11/2014 Universidade Federal do Rio de Janeiro 56
Dúvidas 
Obrigado! 
22/11/2014 Universidade Federal do Rio de Janeiro 57

Mais conteúdo relacionado

Destaque

Design de Interação - Capítulo 8 - Design, Prototipação e Construção -
Design de Interação - Capítulo 8 - Design, Prototipação e Construção - Design de Interação - Capítulo 8 - Design, Prototipação e Construção -
Design de Interação - Capítulo 8 - Design, Prototipação e Construção - Pedro de Vasconcellos
 
cARdapp - cardápio em realidade aumentada
cARdapp - cardápio em realidade aumentadacARdapp - cardápio em realidade aumentada
cARdapp - cardápio em realidade aumentadaPedro de Vasconcellos
 
Curso de Java - Antonio Alves - Aula 01
Curso de Java - Antonio Alves - Aula 01Curso de Java - Antonio Alves - Aula 01
Curso de Java - Antonio Alves - Aula 01Antonio Alves
 
Managing Innovation - 3rd edition – Capítulos 10 e 11
Managing Innovation - 3rd edition – Capítulos 10 e 11Managing Innovation - 3rd edition – Capítulos 10 e 11
Managing Innovation - 3rd edition – Capítulos 10 e 11Pedro de Vasconcellos
 
Sistema gerenciadores de bancos de dados
Sistema gerenciadores de bancos de dadosSistema gerenciadores de bancos de dados
Sistema gerenciadores de bancos de dadosAntonio Alves
 
Trabalhando com Chromakey
Trabalhando com ChromakeyTrabalhando com Chromakey
Trabalhando com ChromakeyAntonio Alves
 
Lógica de programação em java
Lógica de programação em javaLógica de programação em java
Lógica de programação em javaAntonio Alves
 
Curso de java - Antonio Alves - aula 04
Curso de java - Antonio Alves -  aula 04Curso de java - Antonio Alves -  aula 04
Curso de java - Antonio Alves - aula 04Antonio Alves
 
Curso de Java - Antonio Alves - Aula 03
Curso de Java - Antonio Alves - Aula 03Curso de Java - Antonio Alves - Aula 03
Curso de Java - Antonio Alves - Aula 03Antonio Alves
 
Edição e Montagem - Aulas 6 e 7
Edição e Montagem - Aulas 6 e 7Edição e Montagem - Aulas 6 e 7
Edição e Montagem - Aulas 6 e 7Mauricio Fonteles
 

Destaque (20)

Design de Interação - Capítulo 8 - Design, Prototipação e Construção -
Design de Interação - Capítulo 8 - Design, Prototipação e Construção - Design de Interação - Capítulo 8 - Design, Prototipação e Construção -
Design de Interação - Capítulo 8 - Design, Prototipação e Construção -
 
FEBRL
FEBRLFEBRL
FEBRL
 
cARdapp - cardápio em realidade aumentada
cARdapp - cardápio em realidade aumentadacARdapp - cardápio em realidade aumentada
cARdapp - cardápio em realidade aumentada
 
Modelos de Cor
Modelos de CorModelos de Cor
Modelos de Cor
 
BitTorrent
BitTorrentBitTorrent
BitTorrent
 
Curso de Java - Antonio Alves - Aula 01
Curso de Java - Antonio Alves - Aula 01Curso de Java - Antonio Alves - Aula 01
Curso de Java - Antonio Alves - Aula 01
 
Managing Innovation - 3rd edition – Capítulos 10 e 11
Managing Innovation - 3rd edition – Capítulos 10 e 11Managing Innovation - 3rd edition – Capítulos 10 e 11
Managing Innovation - 3rd edition – Capítulos 10 e 11
 
Sistema gerenciadores de bancos de dados
Sistema gerenciadores de bancos de dadosSistema gerenciadores de bancos de dados
Sistema gerenciadores de bancos de dados
 
Efeitos Visuais
Efeitos VisuaisEfeitos Visuais
Efeitos Visuais
 
Trabalhando com Chromakey
Trabalhando com ChromakeyTrabalhando com Chromakey
Trabalhando com Chromakey
 
Edición de Video - Sony Vegas Pro
Edición de Video - Sony Vegas Pro Edición de Video - Sony Vegas Pro
Edición de Video - Sony Vegas Pro
 
Lógica de programação em java
Lógica de programação em javaLógica de programação em java
Lógica de programação em java
 
Curso de java - Antonio Alves - aula 04
Curso de java - Antonio Alves -  aula 04Curso de java - Antonio Alves -  aula 04
Curso de java - Antonio Alves - aula 04
 
Modelos de Cor
Modelos de Cor Modelos de Cor
Modelos de Cor
 
Escopo de variaveis
Escopo de variaveisEscopo de variaveis
Escopo de variaveis
 
Bluetooth Low Energy
Bluetooth Low EnergyBluetooth Low Energy
Bluetooth Low Energy
 
Curso de Java - Antonio Alves - Aula 03
Curso de Java - Antonio Alves - Aula 03Curso de Java - Antonio Alves - Aula 03
Curso de Java - Antonio Alves - Aula 03
 
Edição e Montagem - Aulas 6 e 7
Edição e Montagem - Aulas 6 e 7Edição e Montagem - Aulas 6 e 7
Edição e Montagem - Aulas 6 e 7
 
Multimedia
MultimediaMultimedia
Multimedia
 
Microsoft Word Avanzado UASF
Microsoft Word Avanzado UASFMicrosoft Word Avanzado UASF
Microsoft Word Avanzado UASF
 

Semelhante a Análise MP3 x AAC

Pcm manoella saraiva 20151630040
Pcm   manoella saraiva 20151630040Pcm   manoella saraiva 20151630040
Pcm manoella saraiva 20151630040Manoella Aluízio
 
He 2015-áudio-03
He 2015-áudio-03He 2015-áudio-03
He 2015-áudio-03FlavioCLima
 
História do Registro do Som: Áudio Digital
História do Registro do Som: Áudio DigitalHistória do Registro do Som: Áudio Digital
História do Registro do Som: Áudio DigitalEmanuel Limeira
 
Redes I - 2.1 - Camada Física e Tecnologias de Transmissão
Redes I - 2.1 - Camada Física e Tecnologias de TransmissãoRedes I - 2.1 - Camada Física e Tecnologias de Transmissão
Redes I - 2.1 - Camada Física e Tecnologias de TransmissãoMauro Tapajós
 
Qualidade de imagens em radiografia industrial
Qualidade de imagens em radiografia industrialQualidade de imagens em radiografia industrial
Qualidade de imagens em radiografia industrialWalmor Godoi
 
Capítulo 5 e 4 transmissão analógica e digital (2º unidade)
Capítulo 5 e 4   transmissão analógica e digital (2º unidade)Capítulo 5 e 4   transmissão analógica e digital (2º unidade)
Capítulo 5 e 4 transmissão analógica e digital (2º unidade)Faculdade Mater Christi
 
Aula 1 - Redes de Computadores A - Conceitos Básicos.
Aula 1 - Redes de Computadores A - Conceitos Básicos.Aula 1 - Redes de Computadores A - Conceitos Básicos.
Aula 1 - Redes de Computadores A - Conceitos Básicos.Filipo Mór
 
MODELO DE ALGORITMO PARA COMPRESSÃO DE ÁUDIO BASEADO NA TÉCNICA DPCM E ALGORI...
MODELO DE ALGORITMO PARA COMPRESSÃO DE ÁUDIO BASEADO NA TÉCNICA DPCM E ALGORI...MODELO DE ALGORITMO PARA COMPRESSÃO DE ÁUDIO BASEADO NA TÉCNICA DPCM E ALGORI...
MODELO DE ALGORITMO PARA COMPRESSÃO DE ÁUDIO BASEADO NA TÉCNICA DPCM E ALGORI...Fernando Barboza
 
Um Sistema De Detecção De Fogo Baseado Em Vídeo
Um Sistema De Detecção De Fogo Baseado Em VídeoUm Sistema De Detecção De Fogo Baseado Em Vídeo
Um Sistema De Detecção De Fogo Baseado Em VídeoCristiano Rafael Steffens
 

Semelhante a Análise MP3 x AAC (19)

Mp3
Mp3Mp3
Mp3
 
Pcm manoella saraiva 20151630040
Pcm   manoella saraiva 20151630040Pcm   manoella saraiva 20151630040
Pcm manoella saraiva 20151630040
 
He 2015-áudio-03
He 2015-áudio-03He 2015-áudio-03
He 2015-áudio-03
 
Audio Digital
Audio DigitalAudio Digital
Audio Digital
 
História do Registro do Som: Áudio Digital
História do Registro do Som: Áudio DigitalHistória do Registro do Som: Áudio Digital
História do Registro do Som: Áudio Digital
 
PCom_aula_11_2020.pptx
PCom_aula_11_2020.pptxPCom_aula_11_2020.pptx
PCom_aula_11_2020.pptx
 
Redes I - 2.1 - Camada Física e Tecnologias de Transmissão
Redes I - 2.1 - Camada Física e Tecnologias de TransmissãoRedes I - 2.1 - Camada Física e Tecnologias de Transmissão
Redes I - 2.1 - Camada Física e Tecnologias de Transmissão
 
Streaming de áudio
Streaming de áudioStreaming de áudio
Streaming de áudio
 
Som imagem vídeo
Som imagem vídeoSom imagem vídeo
Som imagem vídeo
 
Qualidade de imagens em radiografia industrial
Qualidade de imagens em radiografia industrialQualidade de imagens em radiografia industrial
Qualidade de imagens em radiografia industrial
 
Capítulo 5 e 4 transmissão analógica e digital (2º unidade)
Capítulo 5 e 4   transmissão analógica e digital (2º unidade)Capítulo 5 e 4   transmissão analógica e digital (2º unidade)
Capítulo 5 e 4 transmissão analógica e digital (2º unidade)
 
Som imagem video
Som imagem videoSom imagem video
Som imagem video
 
Aula 1 - Redes de Computadores A - Conceitos Básicos.
Aula 1 - Redes de Computadores A - Conceitos Básicos.Aula 1 - Redes de Computadores A - Conceitos Básicos.
Aula 1 - Redes de Computadores A - Conceitos Básicos.
 
Apresentação1
Apresentação1Apresentação1
Apresentação1
 
MODELO DE ALGORITMO PARA COMPRESSÃO DE ÁUDIO BASEADO NA TÉCNICA DPCM E ALGORI...
MODELO DE ALGORITMO PARA COMPRESSÃO DE ÁUDIO BASEADO NA TÉCNICA DPCM E ALGORI...MODELO DE ALGORITMO PARA COMPRESSÃO DE ÁUDIO BASEADO NA TÉCNICA DPCM E ALGORI...
MODELO DE ALGORITMO PARA COMPRESSÃO DE ÁUDIO BASEADO NA TÉCNICA DPCM E ALGORI...
 
Apresentacao tcc
Apresentacao tccApresentacao tcc
Apresentacao tcc
 
Um Sistema De Detecção De Fogo Baseado Em Vídeo
Um Sistema De Detecção De Fogo Baseado Em VídeoUm Sistema De Detecção De Fogo Baseado Em Vídeo
Um Sistema De Detecção De Fogo Baseado Em Vídeo
 
Intro filtros
Intro filtrosIntro filtros
Intro filtros
 
Antenas_aula1
Antenas_aula1Antenas_aula1
Antenas_aula1
 

Mais de Pedro de Vasconcellos

Mais de Pedro de Vasconcellos (6)

Gestão da Inovação - Produção acadêmica no Brasil
Gestão da Inovação - Produção acadêmica no BrasilGestão da Inovação - Produção acadêmica no Brasil
Gestão da Inovação - Produção acadêmica no Brasil
 
Redes Sociais
Redes SociaisRedes Sociais
Redes Sociais
 
Créditos de Carbono e MDL
Créditos de Carbono e MDLCréditos de Carbono e MDL
Créditos de Carbono e MDL
 
MapReduce
MapReduceMapReduce
MapReduce
 
Inteligência de enxames - Cardume (PSO + AFSA)
Inteligência de enxames - Cardume (PSO + AFSA)Inteligência de enxames - Cardume (PSO + AFSA)
Inteligência de enxames - Cardume (PSO + AFSA)
 
O computador e a contracultura
O computador e a contraculturaO computador e a contracultura
O computador e a contracultura
 

Análise MP3 x AAC

  • 1. Análise Comparativa: MP3 e AAC Bernardo de Campos Vidal Camilo Pedro de Vasconcellos Rachel Gonçalves de Castro 22/11/2014 Universidade Federal do Rio de Janeiro 1
  • 2. Roteiro • Introdução – Motivação – MPEG – Janela • Codificador perceptivo • MP3 • AAC • Conclusão – Vantagens e desvantagens • Bibliografia • Dúvidas 22/11/2014 Universidade Federal do Rio de Janeiro 2
  • 3. Introdução - Motivação • Grande evolução na codificação de áudio • Mais “populares” – MP3 e AAC • “Qual codec apresenta maior qualidade?” 22/11/2014 Universidade Federal do Rio de Janeiro 3
  • 4. Introdução - MPEG • Moving Pictures Expert Group – Organização Internacional de Normalização – Estabelecer normas internacioanis para codificação de áudio • MP3 – MPEG-1 Layer 3 • AAC – MPEG-2 • Compressão com perdas – Irrelevância perceptiva do sistema auditivo – Redundância estatística 22/11/2014 Universidade Federal do Rio de Janeiro 4
  • 5. Introdução - MPEG • Evolução: 22/11/2014 Universidade Federal do Rio de Janeiro 5
  • 6. Introdução - MPEG • Aplicações: – Produção de áudio – Transmissão de som televiso – Armazenamento digital 22/11/2014 Universidade Federal do Rio de Janeiro 6
  • 7. Janela 10Hz Senoidal 22/11/2014 Universidade Federal do Rio de Janeiro 7
  • 8. Janela FFT 10Hz Senoidal 22/11/2014 Universidade Federal do Rio de Janeiro 8
  • 9. Janela Senoidal 9.5Hz 22/11/2014 Universidade Federal do Rio de Janeiro 9
  • 10. Janela FFT Senoidal 9.5Hz 22/11/2014 Universidade Federal do Rio de Janeiro 10
  • 11. Janela Senoidal 9.5Hz Fim-a-Fim 22/11/2014 Universidade Federal do Rio de Janeiro 11
  • 12. Janela Hanning window 22/11/2014 Universidade Federal do Rio de Janeiro 12
  • 13. Janela Senoidal multiplicada pela janela 22/11/2014 Universidade Federal do Rio de Janeiro 13
  • 14. Janela FFT Senoidal 9.5Hz (após janela) 22/11/2014 Universidade Federal do Rio de Janeiro 14
  • 15. Janela FFT Senoidal 10Hz (após janela) 22/11/2014 Universidade Federal do Rio de Janeiro 15
  • 16. Janela Senoidal 10Hz, evento curto de 100Hz 22/11/2014 Universidade Federal do Rio de Janeiro 16
  • 17. Janela 50% overlapping 22/11/2014 Universidade Federal do Rio de Janeiro 17
  • 18. Janela Spectro com 0% e 50% overlapping 22/11/2014 Universidade Federal do Rio de Janeiro 18
  • 19. Janela Janela curta: boa resolução por tempo 22/11/2014 Universidade Federal do Rio de Janeiro 19
  • 20. Janela Janela longa: boa resolução por frequência 22/11/2014 Universidade Federal do Rio de Janeiro 20
  • 21. Janela 22/11/2014 Universidade Federal do Rio de Janeiro 21
  • 22. Janela 22/11/2014 Universidade Federal do Rio de Janeiro 22
  • 23. Codificador Perceptivo Banco de Filtros: • Domínio do tempo  domínio da frequência Modelo perceptivo: • Computar estimativa do limiar de mascaramento usando regras da psico-acústica Quantização e Codificação: • Componentes espectrais são quantizados e codificados com o objetivo de manter o ruído, introduzido pela quantização, abaixo do limiar de mascaramento Codificação de bitstream: • Juntar o bitstream (coeficientes espectrais + outras informações) 22/11/2014 Universidade Federal do Rio de Janeiro 23
  • 24. MP3 22/11/2014 Universidade Federal do Rio de Janeiro 24
  • 25. MP3 • Banco de Filtro polifásico – Divide o sinal em 32 sub-bandas 22/11/2014 Universidade Federal do Rio de Janeiro 25
  • 26. MP3 • MDCT (Modified Discrete Cosine Transform) – Converte o sinal para o domínio da frequência – Divide cada sub-banda em 18 mais finas 32 * 18 = 576 linhas de frequência – Melhor eliminação de redundância 22/11/2014 Universidade Federal do Rio de Janeiro 26
  • 27. MP3 • FFT 1024 Points (Fast Fourier Transform) – Converte o sinal para o dimínio da frequência – Maior resolução da frequência – Cálculo do limiar de mascaramento 22/11/2014 Universidade Federal do Rio de Janeiro 27
  • 28. MP3 • Modelo Psico-Acústico – Leva em consideração a sensibilidade do ouvido humano – Frequências entre 20Hz a 20KHz – Limiar de audição 22/11/2014 Universidade Federal do Rio de Janeiro 28
  • 29. MP3 • Modelo Psico-Acústico – Mascaramento em frequência – Mascaramento temporal 22/11/2014 Universidade Federal do Rio de Janeiro 29
  • 30. MP3 • Modelo Psico-Acústico – Limiar de mascaramento 22/11/2014 Universidade Federal do Rio de Janeiro 30
  • 31. MP3 • Codificação de Huffman – Utiliza a probabilidade de ocorrência para construir uma árvore de codificação 22/11/2014 Universidade Federal do Rio de Janeiro 31
  • 32. MP3 • Quantização e codificação – Codifica com menor precisão valores grandes – Dois loops: • Rate Control Loop • Distortion Control Loop 22/11/2014 Universidade Federal do Rio de Janeiro 32
  • 33. MP3 • Rate Control Loop – Número de bits resultante deve ser menor que número de bits disponível – Passo de quantização aumenta  valores quantizados diminuem 22/11/2014 Universidade Federal do Rio de Janeiro 33
  • 34. MP3 • Distortion Control Loop – Controla ruído causado pelo processo de quantização – Ruído abaixo do limiar de mascaramento – Fatores de escala 22/11/2014 Universidade Federal do Rio de Janeiro 34
  • 35. MP3 • Formatação de Bitstream – Armazena o som codificado em frames – Cada frame contem informação de 1152 amostras de áudio 22/11/2014 Universidade Federal do Rio de Janeiro 35
  • 36. AAC Gain Control Filter Bank TNS Intensity / Coupling Bitstream Output Data Bitstream Multiplexer Prediction M/S Scale Factors Quant. Control Noiseless Coding Rate/Distortion Control Input time signal Spectral Processing Perceptual Model Quantization and Noiseless Coding 22/11/2014 Universidade Federal do Rio de Janeiro 36
  • 37. AAC • Gain Control – Opcional – Normalmente não usado – PQF (filtro polifásico de quadratura) • 4 bandas de frequência igualmente espaçadas • Taxas de amostragem ajustáveis 22/11/2014 Universidade Federal do Rio de Janeiro 37
  • 38. AAC Gain Control Filter Bank TNS Intensity / Coupling Bitstream Output Data Bitstream Multiplexer Prediction M/S Scale Factors Quant. Control Noiseless Coding Rate/Distortion Control Input time signal Spectral Processing Perceptual Model Quantization and Noiseless Coding 22/11/2014 Universidade Federal do Rio de Janeiro 38
  • 39. AAC • Filter Bank – MDCT Puro, 50% sobreposição • Aplicado diretamente sobre os frames, antes da divisão em 32 sub-bandas • Long window: 2048 amostras • Short window: 256 amostras (x8) – 1024 linhas de frequência 22/11/2014 Universidade Federal do Rio de Janeiro 39
  • 40. AAC Gain Control Filter Bank TNS Intensity / Coupling Bitstream Output Data Bitstream Multiplexer Prediction M/S Scale Factors Quant. Control Noiseless Coding Rate/Distortion Control Input time signal Spectral Processing Perceptual Model Quantization and Noiseless Coding 22/11/2014 Universidade Federal do Rio de Janeiro 40
  • 41. AAC • TNS (Temporal Noise Shaping) – Opcional – Molda o ruído de quantização no domínio do tempo 22/11/2014 Universidade Federal do Rio de Janeiro 41
  • 42. AAC • TNS (Temporal Noise Shaping) Sinal Original Ruído quantizado com TNS Ruído quantizado sem TNS 22/11/2014 Universidade Federal do Rio de Janeiro 42
  • 43. AAC • TNS (Temporal Noise Shaping) Sinal Original Quantizado com TNS Quantizado sem TNS 22/11/2014 Universidade Federal do Rio de Janeiro 43
  • 44. AAC Gain Control Filter Bank TNS Intensity / Coupling Bitstream Output Data Bitstream Multiplexer Prediction M/S Scale Factors Quant. Control Noiseless Coding Rate/Distortion Control Input time signal Spectral Processing Perceptual Model Quantization and Noiseless Coding 22/11/2014 Universidade Federal do Rio de Janeiro 44
  • 45. AAC • Intensity/Coupling – Opcional – Combina dois canais stereo (left/right) em um só (mono) – Explora redudâncias na região de alta frequência 22/11/2014 Universidade Federal do Rio de Janeiro 45
  • 46. AAC Gain Control Filter Bank TNS Intensity / Coupling Bitstream Output Data Bitstream Multiplexer Prediction M/S Scale Factors Quant. Control Noiseless Coding Rate/Distortion Control Input time signal Spectral Processing Perceptual Model Quantization and Noiseless Coding 22/11/2014 Universidade Federal do Rio de Janeiro 46
  • 47. AAC • Prediction – Opcional – Usado para minimizar redundâncias – Eficiente em sinal estacionário/periódico – Aproveita semelhanças dos coeficientes quantizados de blocos adjacentes 22/11/2014 Universidade Federal do Rio de Janeiro 47
  • 48. AAC • Prediction 2 frames seguidos com um mesmo padrão 22/11/2014 Universidade Federal do Rio de Janeiro 48
  • 49. AAC • Prediction Comparação 22/11/2014 Universidade Federal do Rio de Janeiro 49
  • 50. AAC • Prediction Transformada 22/11/2014 Universidade Federal do Rio de Janeiro 50
  • 51. AAC • Prediction Coeficientes divididos em bandas Resíduo enviado (acima) 22/11/2014 Universidade Federal do Rio de Janeiro 51
  • 52. AAC Gain Control Filter Bank TNS Intensity / Coupling Bitstream Output Data Bitstream Multiplexer Prediction M/S Scale Factors Quant. Control Noiseless Coding Rate/Distortion Control Input time signal Spectral Processing Perceptual Model Quantization and Noiseless Coding 22/11/2014 Universidade Federal do Rio de Janeiro 52
  • 53. AAC • M/S – Opcional – Converte um sinal stereo em dois formatos: • Middle (soma, L + R) • Side (diferença, L – R) – Não altera o sinal de cada canal (diferentemente do intensity/coupling), que pode ser reconstruído – Aplicado o mascaramento, verifica qual codificação (L/R, M/S) exige menos bits 22/11/2014 Universidade Federal do Rio de Janeiro 53
  • 54. Conclusão • O AAC é, possivelmente, o sucessor do MP3 A melhoria da compressão oferece resultados de alta qualidade com menores tamanhos de arquivo Suporte para multicanais de áudio (até 48 canais de frequência) Melhoria na eficiência da decodificação, requerendo menos potência 22/11/2014 Universidade Federal do Rio de Janeiro 54
  • 55. Conclusão • Por que o MP3 continua forte? Familiaridade com o formato Grande quantidade de música disponível no formato MP3 Grande variedade de hardware e software que “tira vantagem” do formato Ausência de restrições DRM (Digital Rights Management) A maioria dos utilizadores não conhece ou ignora as desvantagens do formato 22/11/2014 Universidade Federal do Rio de Janeiro 55
  • 56. Dúvidas 22/11/2014 Universidade Federal do Rio de Janeiro 56
  • 57. Dúvidas Obrigado! 22/11/2014 Universidade Federal do Rio de Janeiro 57

Notas do Editor

  1. Limiar de audição: Outro fator utilizado pela codificação MP3 é a curva de percepção da audição humana dentro da faixa de freqüências audíveis, ou Limiar de Audição. Apesar da faixa de audição humana variar entre 20Hz e 20KHz, a sensibilidade para sons dentro desta faixa não é uniforme.
  2. O “formatador” de bits armazena o som codificado e alguns dados adicionais em frames, onde cada frame contém informação de 1152 amostras de áudio. Uma frame é composta por um cabeçalho e dados de áudio juntamente com CRC. O cabeçalho descreve entre outras coisas, qual camada (layer), taxa de bits e a frequência de amostragem estão a ser usadas pelo som codificado.