Mais conteúdo relacionado
Ev
- 1. VISÃO GERAL DA ARQUITETURA DO CODEC DE EVS
Martin Dietz
1
, Markus Multrus
2
, Vaclav Eksler
3
, Vladimir Malenovsky
3
, Erik Norvell
4
, Harald Pobloth
4
,
Lei Miao
5
, Wang Zhe
5
, Lasse Laaksonen
6
, Adriana Vasilache
6
, Yutaka Kamamoto
7
, Kei Kikuiri
8
,
Stephane Ragot
9
, Julien Faure
9
,
10
Hiroyuki Ehara , Vivek Rajendran
11
, Venkatraman Atti
11
,
Hosang Sung
12
, Eunmi Oh
12
, Hao Yuan
13
, Changbao Zhu
13
1
Consultor da Fraunhofer IIS,
2
Fraunhofer IIS,
3 da
VoiceAge,
4 da
Ericsson AB,
5 da
Huawei Technologies Co. Ltd.,
6
Nokia Technologies,
7
Nippon Telegraph e Telephone Corp,
8
NTT DOCOMO, INC.,
9
Orange,
10
Panasonic,
11
Qualcomm Technologies, Inc.,
12 da
Samsung Electronics Co., Ltd.,
13 da
ZTE Corporation
ABSTRATO um documento de visão geral de alto nível, detalhes específicos do codec são
descrito em vários documentos complementares [1] - [16].
O codec 3GPP recentemente padronizado para Enhanced Voice
2 PRINCIPAIS FUNCIONALIDADES NO CODEC DO EVS
Services (EVS) oferece novos recursos e melhorias para
atrasar os sistemas de comunicação em tempo real. Baseado em um romance,2.1. Discurso Comutado / Codificação de Áudio em Atraso Baixo
codec de voz / áudio com retardo baixo, o codec do EVS
Gerações anteriores de codecs 3GPP para serviços de voz, como
contém várias ferramentas para melhor eficiência de compressão e
AMR [30] e AMR-WB [20] baseiam-se nos princípios da
maior qualidade para fala limpa / ruidosa, conteúdo misto e música,
codificação de fala. O codec do EVS é o primeiro codec a ser implantado
incluindo suporte para banda larga, super-banda larga e banda larga
comutação on-the-fly orientada por conteúdo entre fala e áudio
conteúdo. O codec EVS opera em uma ampla gama de taxas de bits, é
compressão em atraso algorítmico baixo de 32 ms e taxas de bits
altamente robusto contra a perda de pacotes e fornece um AMR-WB
até 5,9 kbps (média) ou 7,2 kbps (constante) como usado em
modo interoperável para compatibilidade com sistemas existentes.
comunicação móvel, levando a uma melhoria significativa
Este artigo fornece uma visão geral da arquitetura subjacente como
codificação de conteúdo genérico (por exemplo, conteúdo misto).
bem como as novas tecnologias no codec EVS e apresenta
Enquanto o núcleo da fala é uma variante aprimorada do Algébrico
resultados de teste de escuta mostrando o desempenho do novo codec
Previsão Linear Excitada por Código(ACELP) estendido com
em termos de compressão e qualidade de fala / áudio.
Modos baseados em LP especializados para diferentes classes de fala
(Seção 3.1), a codificação baseada em MDCT em diferentes variantes é usada
Termos de indexação - codificação por voz, codificação de áudio,
para codificação de áudio. Foi dada especial atenção ao aumento do
comunicação
eficiência da codificação baseada em MDCT em taxas de bits baixas / baixas
(Seção 3.5) e na obtenção de comutação contínua e confiável
1 INTRODUÇÃO entre a fala e os núcleos de áudio (Seção 3.6). figura 1
O codec para Enhanced Voice Services (EVS), padronizado por mostra um diagrama de blocos de alto nível do codificador EVS e
3GPP em setembro de 2014, fornece uma ampla gama de novos decodificador.
funcionalidades e melhorias que permitem uma 2.2. Codificação Super-Wideband e Além
versatilidade e eficiência na comunicação móvel [1], [17]. isto
foi projetado principalmente para Voice over LTE (VoLTE) e Enquanto mais cedoCodecs de conversação 3GPP são limitados a
cumpre todos os objetivos definidos pelo 3GPP no item de trabalho do EVScompressão de banda estreita [30] ou sinais de banda larga [20],
descrição [18], nomeadamente: O EVS é o primeiro codec de conversação 3GPP a oferecer
Melhor qualidade e eficiência de codificação para banda estreita codificação de banda larga até 16 kHz de largura de banda a partir de taxas de
bits começando(NB) e serviços de fala de banda larga (WB); a 9,6 kbps em combinação com recursos como o descontínuo
Melhor qualidade pela introdução de banda ultralarga transmissão (DTX) e resiliência avançada de perda de pacotes
(Seção 2.4). O codec do EVS também pode oferecer banda completa (FB)Discurso (SWB);
codificação de até 20 kHz de largura de banda a partir de 16,4 kbps.Qualidade aprimorada para conteúdo misto e música em
Ao contrário dos codecs de fala / áudio anteriores, que usam umaplicações de conversação;
extensão de largura de banda independente do núcleo [19], o codec do EVSRobustez à perda de pacotes e atraso no jitter;
usa abordagens diferentes dependendo do núcleo usado. Para oCompatibilidade retroativa com o codec AMR-WB [20].
Codificação baseada em LP, a maior largura de banda de áudio é obtida
O codec do EVS baseia-se em padrões anteriores do tecnologias de extensão de largura de banda, nomeadamente um domínio do
tempo
discurso e codificação de áudio do mundo, mas acrescenta novo importanteA tecnologia de extensão de largura de banda (TBE) é usada durante a fala
funcionalidades e melhorias descritas em [2] Para os núcleos MDCT, a codificação de maior largura de banda é
Seções 2 e 3, enquanto a seção 4 foca nos resultados dos testes integrado nos respectivos algoritmos. O resultado é maior
confirmando o desempenho do codec. Este papel serve como eficiência em todos os tipos de conteúdo, em particular para fala.
978-1-4673-6997-8 / 15 / $ 31,00 © 2015 IEEE 5698 ICASSP 2015
P RE - PROCESSAMENTO E NCODER D ECODER P OST -
Informação de sinalização
EM PROCESSAMENTOInformação de sinalização
Filtro HP (20 Hz) (largura de banda, núcleo, tipo de quadro,…)
Banco de filtros e reamostragem Intensificador de música
SVE P RIMARY M ODES SVE P RIMARY M ODES
Pré-ênfase, Spectral UV / inativo
análise Baseado em LP Baseado em LP pós-processamentoBWE BWEcodificador decodificadorcodificador decodificadorDetecção de atividade de sinal @ 12.8 / 16 kHz @ 12.8 / 16 kHz Ruído de conforto
Adição
file:///home/adilson/Música/bh.html
1 of 2 26/05/2018 20:13