Padrões de Áudio
para TV Digital
Giovani Loschiavo
Prof.ª Ms. Elaine Cecília Gatto
Disciplina: Princípios de Telecomunicações
Engenharia de Computação

1
Agenda
•
•
•
•
•
•
•

Introdução
PCM
Compressor de Áudio Digital
Modelo Perceptual Básico
Padrões de Áudio Digital
Áudio Digital no Mundo
Referências

2
Introdução
• A TV digital, se utiliza de uma • Falarei um pouco sobre essas
modulação
e
uma compressões e codificações
compressão digital para de áudio, que faz com que
enviar vídeo, áudio e sinais nossas
experiências
em
aos
nossos
aparelhos frente a TVs e aparelhos
televisivos, fazendo com isso digitais sejam muito mais
uma
transmissão
e realistas e emocionantes do
recepção
de
maior que
as
antigas
quantidade de conteúdo por (tecnologicamente falando)
uma mesma freqüência formas de áudio analógicas.
(canal) podendo assim se
obter imagens e áudios de
maior qualidade em relação à
TV analógica.

3
Introdução
• A televisão iniciou com
som mono 1.0 (um canal de
áudio),
evoluiu
para
o estéreo 2.0 (dois canais,
esquerdo e direito). Com a TV
digital, passou para cinco e
seis canais, 5.1 e 6.1 (padrões
utilizados por sofisticados
equipamentos
de
som
e
home
theaters).
Atualmente já existem áudios
com 7 canais, 7.1 .
Esse 0.1 se refere a uma
pequena porção de banda

útil do canal que é usada
para transmitir freqüências
mais baixas (sons graves).

4
PCM (Pulse-Code Modulation)
• Pode ser qualificado como a
forma mais simples de áudio
digital. Digamos que exista
um sinal PCM para cada caixa
num sistema multi canal. O
resultado de uma mixagem
de estúdio (filme, por
exemplo), é um conjunto de
sinais
PCM.
Por outro lado, o PCM não é
um sinal compacto e há uma
complexidade muito grande
em manter os sinais PCM em
sincronia entre sí, daí foram

desenvolvidos formatos de
compressão de áudio digital,
que nada mais são do que
um conjunto de sinais PCM
juntos e comprimidos, para
assim produzir um único sinal
e de menor tamanho (bitstream).

5
Compressor de Áudio Digital
• Como o ser humano só capita
sons entre as freqüências,
16hz até 20.000hz, é possível
desenvolver modelos que
reduzam
a
informação
necessária para identificar e
caracterizar um sinal de
áudio. Sendo assim, podem
ser eliminadas informações
supérfluas a um determinado
som que simplesmente não
são perceptíveis ao ouvido
humano, ou mesmo que
podem ser ignoradas por

irrelevância ao resultado
sonoro final, diminuindo
notavelmente o espaço em
disco utilizado pelo arquivo
de som. Esse é o papel do
compressor de áudio, muito
importante para nos garantir
sons com baixa taxa de
transmissão (bit rate), com a
mesma qualidade do som
original e com isso uma
transmissão mais eficiente
para a nossa TV digital.

6
Compressor de Áudio Digital
• Há uma enorme variedade de • Exemplo: o algoritmo de
compressão de áudio digital compressão
digital
do
com
diferenças
em: AC-3, 5.1 do padrão Dolby,
complexidade, qualidade de comprimi uma taxa de fluxo
som
e
eficiência
da de áudio codificada em PCM
compressão, porém todos os de 5Mbit/s para 384Kbit/s.
algoritmos buscam a mesma
coisa, que é produzir um som
com pequenas informações
digitais de áudio que, depois
de
decodificado
tenha
pequena, ou nada, de
diferença em relação ao sinal
original.

7
Compressor de Áudio Digital
• Os padrões de áudio digital • Segunda
Parte,
MPEG, AAC e Dolby utilizam a decodificação: ler os “bitcompressão por Codificação streams” e expandi-lo como
Perceptual que basicamente um arquivo/ficheiro de áudio
é dividido em 2 etapas:
(não exatamente igual ao
• Primeira parte, a codificação: original).
transforma os dados do • Existem
2
tipos
de
áudio digital em PCM, compressão de áudio, as sem
armazenados
num perdas (lossless) e as com
arquivo/ficheiro de áudio, perdas (lossy).
para dentro duma estrutura
altamente
comprimida
denominada “bit-streams”.

8
Modelo Perceptual Básico
• Codificação do Áudio:

9
Modelo Perceptual Básico
• Codificação do Áudio:

Decompõe o sinal de áudio de entrada, junto com
seu filtro correspondente no decodificador.

10
Modelo Perceptual Básico
• Codificação do Áudio:

Estima uma limiar do mascaramento que é calculada com
as regras da Psicoacústica.
O efeito de mascaramento descreve o comportamento
do ouvido quando 2 ou mais sons diferentes o estimulam
simultaneamente ou num curto intervalo de tempo e consiste no
“apagamento” parcial ou total de algumas componentes do sinal de
áudio devido à frequencia de outras componentes

11
Modelo Perceptual Básico
• Codificação do Áudio:

O algoritmo tira proveito da incapacidade do
sistema auditivo de ouvir o ruído de
quantização
sobre
condições
de
mascaramento auditivo retirando assim o
som mais débil.

12
Modelo Perceptual Básico
• Decodificação do Áudio:

13
Padrões de Áudio Digital
• São 3 os principais utilizados
nas TVs digitais hoje em dia:
• MPEG áudio
• Advanced Audio Coding(AAC)
• Dolby

14
Padrões de Áudio Digital –
MPEG áudio
• Um padrão de alta fidelidade,
mesmo sendo um padrão
com perdas (lossy) o MPEG
áudio consegue se aproximar
de padrões sem perdas
(lossless)
sem
grandes
diferenças perceptíveis. É
Dividido em 3 fases: MPEG-1,
MPEG-2, MPEG-4.
• MPEG-1 – Criado em 1993
Essa norma teve
seu
desenvolvimento
voltado

para a codificação de sinais
em formato mono na 1ª fase
e estéreo na 2ª fase, possui
três camadas (layers) das
quais a terceira possui o
melhor e mais avançado
algoritmo de compressão
(MP3).

15
Padrões de Áudio Digital –
MPEG áudio
• MPEG-2
estabeleceu
estudos
de
padrões
apropriados a HDTV com a
inserção de 5 canais de áudio
e 1 de baixas freqüências, é a
principal diferença para o
MPEG-1, que tem apenas 2
canais
de
áudio.
Porém
pode
haver
compatibilidade entre esses
dois padrões que é o MPEG-2
BC (Backward Compatible)
que codifica os 5 canais de
áudio do MPEG-2 em dois

sons estéreos, L0 e R0, a
partir
desse
processo
chamado
matrixing
o
MPEG-1 pode decodificar e
transmitir os sons 5.1 em
formato
estéreo.

Outra variação é o MPEG-2
AAC ou NBC, esse já não tem
compatibilidade regressiva e
possui melhor desempenho e
qualidade em relação o BC
(menor taxa para uma dada
qualidade).

16
Padrões de Áudio Digital –
MPEG áudio
• MPEG-4 - É completamente
compatível com MPEG-2
AAC, ele suporta todas as
ferramentas definidas em
MPEG-2 AAC , e agrega
novas ferramentas como PNS
(Perceptual
Noise
Substitution) para diminuir os
efeitos do ruído e LTP (Long
Term Prediction) que é uma
ferramenta de predição e
utilizam muito menos poder
computacional que MPEG-2
com melhores resultados.

Inicialmente o MPEG-4 era
destinado a vídeos de baixo
bit-rate, entretanto, a sua
abrangência foi expandida
posteriormente para ser
muito mais que um padrão
de codificação multimídia. O
MPEG-4 é eficiente através
de uma variedade de bitrates indo desde poucos
kilobits por segundo até
dezenas de megabits por
segundo.

17
Padrões de Áudio Digital –
Advanced Audio Coding (AAC)
• Este é um padrão com perdas e tendo assim uma forma mais
segue
essencialmente
os eficiente de compressão que o
mesmos padrões de codificação MPEG.
que o MPEG-1 layer III, usando
novas
ferramentas
de • Foi desenvolvido para o MPEG-2
codificação,
de
forma
a e para o MPEG-4 e tem quatro
conseguir taxas de transmissão modos de funcionamento que
mais baixas mantendo a são definidos dependendo da
qualidade do sinal.
complexidade do áudio a ser
A estrutura do codificador AAC, codificado e da qualidade final
além da estrutura do codificador do
sinal
desejado:
MPEG áudio, contém um bloco 1- Low Complexity (LC), 2-MAIN,
de processamento espectral 3-Scalable Sample Rate (SSR),
antes do bloco de quantização, 4-Long Term Prediction (LTM)
utilizado para reduzir as
redundâncias do sinal de áudio,

18
Padrões de Áudio Digital –
Dolby
• Dolby AC-3 - Este sistema é comum aos dois canais traseiros
utilizado atualmente em discos do sistema 5.1 (direito e
no formato DVD (Digital Video esquerdo). O objetivo é reforçar
Disc), onde é possível selecionar os sons vindos de trás,
desde um canal mono de áudio melhorando a sensação de
até um sistema de som envolvimento.
envolvente caracterizado por
apresentar dois canais laterais • Dolby THX EX ou 7.1 - é o mais
frontais, dois canais laterais novo do mercado. Este formato
traseiros, um canal central e é capaz de reproduzir 8 canais, o
mais um canal de freqüências que resulta em um realismo
mais graves ou 5.1.
maior nos efeitos sonoros dos
filmes. Há ainda poucos filmes
• Dolby Digital EX ou 6.1 - cria um em DVD disponíveis para este
sexto
canal
traseiro formato.
central composto pelo conteúdo

19
Áudio Digital no Mundo
• Padrão Americano (E.U.A.) - Dolby AC-3
• Padrão Europeu - MPEG-2 BC
• Padrão Japonês - MPEG-2 AAC
• Padrão Nipo-Brasileiro - MPEG-4 AAC

20
Referências
• http://pt.scribd.com/doc/53952295/92/Modelo-PsicoAcustico
• http://www.teleco.com.br/tutoriais/tutorialaltvdiel1/pagina_3
.asp
• http://www.midiacom.uff.br/~debora/fsmm/trab-20082/audio.pdf
• http://pt.wikipedia.org/wiki/Dolby_Laboratories#Tecnologias
21

Audio Digital

  • 1.
    Padrões de Áudio paraTV Digital Giovani Loschiavo Prof.ª Ms. Elaine Cecília Gatto Disciplina: Princípios de Telecomunicações Engenharia de Computação 1
  • 2.
    Agenda • • • • • • • Introdução PCM Compressor de ÁudioDigital Modelo Perceptual Básico Padrões de Áudio Digital Áudio Digital no Mundo Referências 2
  • 3.
    Introdução • A TVdigital, se utiliza de uma • Falarei um pouco sobre essas modulação e uma compressões e codificações compressão digital para de áudio, que faz com que enviar vídeo, áudio e sinais nossas experiências em aos nossos aparelhos frente a TVs e aparelhos televisivos, fazendo com isso digitais sejam muito mais uma transmissão e realistas e emocionantes do recepção de maior que as antigas quantidade de conteúdo por (tecnologicamente falando) uma mesma freqüência formas de áudio analógicas. (canal) podendo assim se obter imagens e áudios de maior qualidade em relação à TV analógica. 3
  • 4.
    Introdução • A televisãoiniciou com som mono 1.0 (um canal de áudio), evoluiu para o estéreo 2.0 (dois canais, esquerdo e direito). Com a TV digital, passou para cinco e seis canais, 5.1 e 6.1 (padrões utilizados por sofisticados equipamentos de som e home theaters). Atualmente já existem áudios com 7 canais, 7.1 . Esse 0.1 se refere a uma pequena porção de banda útil do canal que é usada para transmitir freqüências mais baixas (sons graves). 4
  • 5.
    PCM (Pulse-Code Modulation) •Pode ser qualificado como a forma mais simples de áudio digital. Digamos que exista um sinal PCM para cada caixa num sistema multi canal. O resultado de uma mixagem de estúdio (filme, por exemplo), é um conjunto de sinais PCM. Por outro lado, o PCM não é um sinal compacto e há uma complexidade muito grande em manter os sinais PCM em sincronia entre sí, daí foram desenvolvidos formatos de compressão de áudio digital, que nada mais são do que um conjunto de sinais PCM juntos e comprimidos, para assim produzir um único sinal e de menor tamanho (bitstream). 5
  • 6.
    Compressor de ÁudioDigital • Como o ser humano só capita sons entre as freqüências, 16hz até 20.000hz, é possível desenvolver modelos que reduzam a informação necessária para identificar e caracterizar um sinal de áudio. Sendo assim, podem ser eliminadas informações supérfluas a um determinado som que simplesmente não são perceptíveis ao ouvido humano, ou mesmo que podem ser ignoradas por irrelevância ao resultado sonoro final, diminuindo notavelmente o espaço em disco utilizado pelo arquivo de som. Esse é o papel do compressor de áudio, muito importante para nos garantir sons com baixa taxa de transmissão (bit rate), com a mesma qualidade do som original e com isso uma transmissão mais eficiente para a nossa TV digital. 6
  • 7.
    Compressor de ÁudioDigital • Há uma enorme variedade de • Exemplo: o algoritmo de compressão de áudio digital compressão digital do com diferenças em: AC-3, 5.1 do padrão Dolby, complexidade, qualidade de comprimi uma taxa de fluxo som e eficiência da de áudio codificada em PCM compressão, porém todos os de 5Mbit/s para 384Kbit/s. algoritmos buscam a mesma coisa, que é produzir um som com pequenas informações digitais de áudio que, depois de decodificado tenha pequena, ou nada, de diferença em relação ao sinal original. 7
  • 8.
    Compressor de ÁudioDigital • Os padrões de áudio digital • Segunda Parte, MPEG, AAC e Dolby utilizam a decodificação: ler os “bitcompressão por Codificação streams” e expandi-lo como Perceptual que basicamente um arquivo/ficheiro de áudio é dividido em 2 etapas: (não exatamente igual ao • Primeira parte, a codificação: original). transforma os dados do • Existem 2 tipos de áudio digital em PCM, compressão de áudio, as sem armazenados num perdas (lossless) e as com arquivo/ficheiro de áudio, perdas (lossy). para dentro duma estrutura altamente comprimida denominada “bit-streams”. 8
  • 9.
    Modelo Perceptual Básico •Codificação do Áudio: 9
  • 10.
    Modelo Perceptual Básico •Codificação do Áudio: Decompõe o sinal de áudio de entrada, junto com seu filtro correspondente no decodificador. 10
  • 11.
    Modelo Perceptual Básico •Codificação do Áudio: Estima uma limiar do mascaramento que é calculada com as regras da Psicoacústica. O efeito de mascaramento descreve o comportamento do ouvido quando 2 ou mais sons diferentes o estimulam simultaneamente ou num curto intervalo de tempo e consiste no “apagamento” parcial ou total de algumas componentes do sinal de áudio devido à frequencia de outras componentes 11
  • 12.
    Modelo Perceptual Básico •Codificação do Áudio: O algoritmo tira proveito da incapacidade do sistema auditivo de ouvir o ruído de quantização sobre condições de mascaramento auditivo retirando assim o som mais débil. 12
  • 13.
    Modelo Perceptual Básico •Decodificação do Áudio: 13
  • 14.
    Padrões de ÁudioDigital • São 3 os principais utilizados nas TVs digitais hoje em dia: • MPEG áudio • Advanced Audio Coding(AAC) • Dolby 14
  • 15.
    Padrões de ÁudioDigital – MPEG áudio • Um padrão de alta fidelidade, mesmo sendo um padrão com perdas (lossy) o MPEG áudio consegue se aproximar de padrões sem perdas (lossless) sem grandes diferenças perceptíveis. É Dividido em 3 fases: MPEG-1, MPEG-2, MPEG-4. • MPEG-1 – Criado em 1993 Essa norma teve seu desenvolvimento voltado para a codificação de sinais em formato mono na 1ª fase e estéreo na 2ª fase, possui três camadas (layers) das quais a terceira possui o melhor e mais avançado algoritmo de compressão (MP3). 15
  • 16.
    Padrões de ÁudioDigital – MPEG áudio • MPEG-2 estabeleceu estudos de padrões apropriados a HDTV com a inserção de 5 canais de áudio e 1 de baixas freqüências, é a principal diferença para o MPEG-1, que tem apenas 2 canais de áudio. Porém pode haver compatibilidade entre esses dois padrões que é o MPEG-2 BC (Backward Compatible) que codifica os 5 canais de áudio do MPEG-2 em dois sons estéreos, L0 e R0, a partir desse processo chamado matrixing o MPEG-1 pode decodificar e transmitir os sons 5.1 em formato estéreo. Outra variação é o MPEG-2 AAC ou NBC, esse já não tem compatibilidade regressiva e possui melhor desempenho e qualidade em relação o BC (menor taxa para uma dada qualidade). 16
  • 17.
    Padrões de ÁudioDigital – MPEG áudio • MPEG-4 - É completamente compatível com MPEG-2 AAC, ele suporta todas as ferramentas definidas em MPEG-2 AAC , e agrega novas ferramentas como PNS (Perceptual Noise Substitution) para diminuir os efeitos do ruído e LTP (Long Term Prediction) que é uma ferramenta de predição e utilizam muito menos poder computacional que MPEG-2 com melhores resultados. Inicialmente o MPEG-4 era destinado a vídeos de baixo bit-rate, entretanto, a sua abrangência foi expandida posteriormente para ser muito mais que um padrão de codificação multimídia. O MPEG-4 é eficiente através de uma variedade de bitrates indo desde poucos kilobits por segundo até dezenas de megabits por segundo. 17
  • 18.
    Padrões de ÁudioDigital – Advanced Audio Coding (AAC) • Este é um padrão com perdas e tendo assim uma forma mais segue essencialmente os eficiente de compressão que o mesmos padrões de codificação MPEG. que o MPEG-1 layer III, usando novas ferramentas de • Foi desenvolvido para o MPEG-2 codificação, de forma a e para o MPEG-4 e tem quatro conseguir taxas de transmissão modos de funcionamento que mais baixas mantendo a são definidos dependendo da qualidade do sinal. complexidade do áudio a ser A estrutura do codificador AAC, codificado e da qualidade final além da estrutura do codificador do sinal desejado: MPEG áudio, contém um bloco 1- Low Complexity (LC), 2-MAIN, de processamento espectral 3-Scalable Sample Rate (SSR), antes do bloco de quantização, 4-Long Term Prediction (LTM) utilizado para reduzir as redundâncias do sinal de áudio, 18
  • 19.
    Padrões de ÁudioDigital – Dolby • Dolby AC-3 - Este sistema é comum aos dois canais traseiros utilizado atualmente em discos do sistema 5.1 (direito e no formato DVD (Digital Video esquerdo). O objetivo é reforçar Disc), onde é possível selecionar os sons vindos de trás, desde um canal mono de áudio melhorando a sensação de até um sistema de som envolvimento. envolvente caracterizado por apresentar dois canais laterais • Dolby THX EX ou 7.1 - é o mais frontais, dois canais laterais novo do mercado. Este formato traseiros, um canal central e é capaz de reproduzir 8 canais, o mais um canal de freqüências que resulta em um realismo mais graves ou 5.1. maior nos efeitos sonoros dos filmes. Há ainda poucos filmes • Dolby Digital EX ou 6.1 - cria um em DVD disponíveis para este sexto canal traseiro formato. central composto pelo conteúdo 19
  • 20.
    Áudio Digital noMundo • Padrão Americano (E.U.A.) - Dolby AC-3 • Padrão Europeu - MPEG-2 BC • Padrão Japonês - MPEG-2 AAC • Padrão Nipo-Brasileiro - MPEG-4 AAC 20
  • 21.
    Referências • http://pt.scribd.com/doc/53952295/92/Modelo-PsicoAcustico • http://www.teleco.com.br/tutoriais/tutorialaltvdiel1/pagina_3 .asp •http://www.midiacom.uff.br/~debora/fsmm/trab-20082/audio.pdf • http://pt.wikipedia.org/wiki/Dolby_Laboratories#Tecnologias 21