SlideShare uma empresa Scribd logo
1 de 287
Baixar para ler offline
MPEG Audio

"Tecniche di manipolazione
     dell'informazione
sonora compressa mediante
    codifica MUSICAM"




                      Davide Cilano
INTRODUZIONE



Negli ultimi anni, con la diffusione dell'audio digitale (soprattutto grazie al Compact Disc), sono
aumentate le esigenze degli ascoltatori in termini di fedeltà di riproduzione del suono.
La percezione dei suoni è un fenomeno molto complesso in cui vengono coinvolti organi fisici ed
aspetti psicologici.
Proprio la dipendenza da fattori psicologici permette l'affinarsi delle capacità percettive degli
ascoltatori e quindi l'aumentare della richiesta di qualità del suono.

In campo digitale la qualità di un suono può essere mantenuta con una accurata rappresentazione che,
se fatta con metodi tradizionali, porta inevitabilmente a grandi quantità di dati da memorizzare o
trasmettere.
Queste grandi quantità di dati possono essere gestite solo con apparecchiature altamente affidabili e
dai costi proibitivi per la distribuzione su larga scala.
Per fare un esempio basti pensare alla richiesta di 768 KBit/sec. per sequenze monofoniche della
codifica PCM (Pulse Code Modulation) che, per essere distribuite su larga scala, hanno richiesto lo
sviluppo del Compact Disc.

La richiesta di alta qualità a basso costo ha indotto numerosi enti di ricerca allo studio di codifiche
ottimizzate che permettano di ridurre le dimensioni della rappresentazione digitale.
Tali ricerche, hanno individuato una possibile soluzione al problema applicando i risultati degli studi
sul comportamento dell'apparato uditivo ed ottenendo la compressione sfruttando le capacità fisico-
percettive dell'orecchio.

Tra tutte le codifiche proposte si è distinta, per la sua flessibilità e qualità, il sistema MUSICAM
(Masking pattern Universal Subband Integrated Coding And Multiplexing, 1992).
La codifica MUSICAM ottiene, tramite una analisi psicoacustica del suono, la compressione delle
informazioni necessarie per rappresentare segnali audio eliminando le componenti percettivamente
irrilevanti e codificando quelle numericamente ridondanti.
Tale operazione permette di conservare la qualità originaria del suono pur riducendo la quantità di dati
di un fattore tipico di 1:8.
La soppressione delle informazioni psicoacusticamente irrilevanti è possibile grazie alle recenti
scoperte sul funzionamento dell'apparato uditivo umano, che hanno permesso la costruzione di
modelli matematici implementabili in tempo reale, che approssimano le capacità acustico-percettive
umane.
Il modello percettivo partendo da una rappresentazione temporale del segnale audio, studia l'influenza
tra toni mascheranti e toni mascherati nel dominio frequenziale, individuando le componenti del
segnale percepibili, che sono le uniche informazioni essenziali da codificare.

Il sistema MUSICAM è stato inizialmente progettato per il DAB (Digital Audio Broadcasting), una
rete di distribuzione radiofonica via etere che dovrà sostituire le attuali trasmissioni FM.
In seguito il MUSICAM è stato standardizzato a livello mondiale dall' ISO-IEC/ JCT1/ SC29/ WG11/
MPEG-Audio ed adottato per la distribuzione su supporti magnetici (DCC - Digital Compact
Cassette - Philips) e televisiva (HDTV - Televisione ad alta definizione-).

L'uso della codifica per la distribuzione radiofonica e televisiva ha fatto sorgere la richiesta di
elaborare i segnali audio in tempo reale.
Adottando la codifica MPEG le elaborazioni del segnale possono essere eseguite sui decodificati
PCM oppure direttamente nella forma codificata, che è l'argomento trattato nei capitoli seguenti.
L'elaborazione in forma PCM permette l'uso di tecniche e strumentazioni già disponibili sul mercato
ma richiede l'operazione di decodifica che introduce il ritardo dei filtri ed una certa indeterminazione
sui campioni ricostruiti.
L'elaborazione direttamente nella forma compressa non richiede i processi di codifica e decodifica,
riducendo la complessità computazionale dell'operazione e non introduce il ritardo intrinseco dei filtri.

La richiesta di limitare il ritardo è indispensabile in molte applicazioni, ad esempio per l'aggiunta di
contributi in tempo reale come il commento degli inviati di un telegiornale: il ritardo sul commento
audio può comportare la mancata sincronizzazione con le immagini con effetti disturbanti
nell'ascoltatore, anche da queste richieste è nato lo stimolo al lavoro di tesi.

Lo studio di tecniche di elaborazione di segnali compressi viene esposto dopo aver richiamato i
concetti alla base dei segnali audio sia fisici: capitolo 1.1 "Il fenomeno suono"; che psicoacustici:
capitolo 1.2 "La percezione del suono".
Si riportano le definizioni delle unità di misura fisiche e psicoacustiche ed i risultati di alcuni studi
sulla percezione dei segnali audio da parte dell'apparato uditivo umano.

Nel capitolo 1.3 "L'audio digitale" vengono riassunti i principi base della codifica digitale per
segnali audio e si indica dove si collocano i sistemi di compressione nelle catene di registrazione e
riproduzione.

Dopo la parte introduttiva di richiami, i capitoli 2 "La codifica MPEG_Audio" e capitolo 3
"Sintassi della codifica MPEG_Audio" espongono dettagliatamente il principio di funzionamento e
le specifiche sintattiche della codifica MUSICAM (alias MPEG layer II), tale capitolo è stato tratto
dalle specifiche 11172 rev.3 di MPEG ma riorganizzato ed arricchito da spiegazioni per una
esposizione più immediata.
Il sistema di codifica come già detto si basa sui risultati del modello percettivo che calcola il valore (in
dB) della soglia di mascheramento di porzioni del segnale.
I modelli percettivi proposti da MPEG sono descritti al capitolo 4 "Modelli percettivi" esponendone
dettagliatamente (data la loro importanza) le specifiche ed il funzionamento.

Dal capitolo 5 "Introduzione alle Elaborazioni" comincia l'esposizione del lavoro di tesi vero e
proprio, sfruttando definizioni, risultati e concetti esposti nei capitoli precedenti.
Le tecniche di elaborazione dei segnali compressi vengono introdotte con alcune osservazioni sulla
sintassi di codifica e affrontando il problema della valutazione dei risultati.
La mancanza di modelli oggettivi affidabili, di valutazione della qualità audio codificata
percettivamente, ha reso necessario lo studio di criteri per valutare i risultati delle elaborazioni.

Nel capitolo 6 "Elaborazioni numeriche ", sono riportate le prime tecniche per l'elaborazione di
segnali MUSICAM in modo numerico, con questi metodi anche se non si ottengono risultati
soddisfacenti, si conferma la possibilità di elaborare i segnali compressi, ottenendo interessanti
informazioni sui vincoli da imporre per ottenere elaborazioni sufficientemente accurate e quale è il
comportamento della codifica.
Comportamento che è stato studiato ed osservato sperimentalmente nel capitolo 7 "Comportamento
codifica".

Nel capitolo 8 "Elaborazioni psicoacustiche" si espongono le tecniche definite psicoacustiche che
utilizzano i risultati del modello percettivo per elaborare una o più sequenze cercando di mantenere
inalterata la qualità.
Tali tecniche sono quelle che hanno dato i migliori risultati ma necessitano delle informazioni
psicoacustiche che possono essere trasmesse in un canale separato oppure nella trama codificata,
argomento affrontato nel capitolo 9 "Trasmissione MNR".

Il capitolo 10 "Appunti sulla codifica" riporta una analisi delle regole sintattiche dello standard
MUSICAM e si propone una possibile modifica della sintassi che permette una ulteriore compressione
del segnale.

Per la complessità della codifica (il cui sviluppo ha richiesto 360 anni-uomo) il lavoro di tesi potrebbe
essere ulteriormente ampliato, studiando e raffinando i criteri di elaborazione individuati,
approfondendo lo studio alla codifica multicanale (usata in HDTV), trovando una implementazione
efficiente delle tecniche definite.
INDICE



Capitolo 1.1
                      IL FENOMENO "SUONO"
1.1.1. NATURA E DIFFUSIONE DEL SUONO ......................................................................................1
1.1.2. LE CARATTERISTICHE DEL SUONO .........................................................................................3
       1.1.2.1. Ampiezza..........................................................................................................................3
                 1.1.2.1.1. DeciBel........................................................................................................4
       1.1.2.2. Frequenza e Timbro .......................................................................................................5
1.1.3. LA DIVISIONE IN OTTAVE ..........................................................................................................7
1.1.4. IL RUMORE...................................................................................................................................8
1.1.5. COMPONENTI TONALI................................................................................................................9




Capitolo 1.2
                                                           LA PERCEZIONE
                                                               DEL SUONO
1.2.1. ORECCHIO UMANO E SENSIBILITÀ IN FREQUENZA .............................................................1
1.2.2. LA PERCEZIONE ..........................................................................................................................4
1.2.3. UNITÀ DI MISURA PERCETTIVE................................................................................................4
       1.2.3.1. Il Bark..............................................................................................................................4
       1.2.3.2. Loudness..........................................................................................................................5
       1.2.3.3. Il Phon.............................................................................................................................6
       1.2.3.4. Il Sone..............................................................................................................................7
1.2.4. IL MASCHERAMENTO .................................................................................................................8
       1.2.4.1. ... Nella Frequenza ..........................................................................................................9
       1.2.4.2. ... Nel Tempo ...................................................................................................................11
       1.2.4.3. ... Nel Tempo e Frequenza...............................................................................................12
1.2.5. PERCEZIONE DI VARIAZIONI DI INTENSITÀ ...........................................................................13




Capitolo 1.3
L'AUDIO DIGITALE
1.3.1. INTRODUZIONE .........................................................................................................................1
1.3.2. IL CAMPIONAMENTO................................................................................................................2
1.3.3. LA QUANTIZZAZIONE ...............................................................................................................3
1.3.4. L'SNR (Signal to Noise Ratio) ......................................................................................................3
1.3.5. LA CODIFICA PCM (Pulse Code Modulation)...........................................................................4
1.3.6. COMPRESSIONE DI SEGNALI CON LEGGE A_LAW E µ_LAW...........................................5
1.3.7. I SISTEMI PCM NELLA REGISTRAZIONE DIGITALE .............................................................6
1.3.8. I SISTEMI PCM NELLA RIPRODUZIONE DIGITALE ..............................................................8
1.3.9. PARAMETRI PER LA QUALITÀ DI UN SISTEMA AUDIO .......................................................10
1.3.10. I SISTEMI DI COMPRESSIONE NELLA CATENA PCM ...........................................................11




Capitolo 2
        LA CODIFICA MPEG_Audio
2.1.     LE CODIFICHE COMPRESSE .....................................................................................................2
2.2.     RIDONDANZA E IRRILEVANZA ..................................................................................................4
2.3.     LA CODIFICA MPEG_Audio ........................................................................................................4
         2.3.1. Introduzione ....................................................................................................................5
         2.3.2. La Codifica e i FRAME ..................................................................................................6
         2.3.3. La Rappresentazione frequenziale ..................................................................................7
         2.3.4. Memorizzazione...............................................................................................................9
         2.3.5. Decodifica .......................................................................................................................9
2.4.     CARATTERISTICHE......................................................................................................................10
         2.4.1. Layer ...............................................................................................................................10
         2.4.2. Frequenze di Campionamento.........................................................................................11
         2.4.3. Modalità ..........................................................................................................................11
         2.4.4. Bitrate..............................................................................................................................13
2.5.     STRUTTURE DATI Layer II .........................................................................................................14
         2.5.1. Bit Allocation...................................................................................................................14
         2.5.2. Fattori di Scala................................................................................................................16
         2.5.3. SCFSI (Struttura Codifica Fattori di Scala su Intervalli) ...............................................17
         2.5.4. I Campioni.......................................................................................................................17
         2.5.5. Osservazioni Sulle Strutture Dati ....................................................................................18
2.6.     LA SEQUENZA CODIFICATA Layer II ........................................................................................18
         2.6.1. Il FRAME ........................................................................................................................19
         2.6.2. L'HEADER ......................................................................................................................20
         2.6.3. IL CRC [Cyclic Redundancy Code] ................................................................................23
         2.6.4. I Dati_Ausiliari (Ancillary) ............................................................................................24
         2.6.5. Sintassi ............................................................................................................................24
2.7.     VALUTAZIONE DELLA CODIFICA .............................................................................................29
2.8.     POSSIBILI APPLICAZIONI ..........................................................................................................31
2.9.     UNA APPLICAZIONE :IL DAB.....................................................................................................32
         2.9.1. Caratteristiche del DAB ..................................................................................................33




Capitolo 3
SPECIFICHE TECNICHE
                             MPEG_Audio l a y e r I I
3.1.   INTRODUZIONE ...........................................................................................................................2
3.2.   BIBLIOGRAFIA PER I RIFERIMENTI TECNICI:....................................................................2
3.3.   GLOSSARIO TECNICO MPEG_Audio .........................................................................................2
3.4.   IL PROCESSO DI CODIFICA Layer II.........................................................................................4
       3.4.1. Diagramma di Flusso......................................................................................................7
       3.4.2. Filtro Passa Alto in Ingresso...........................................................................................8
       3.4.3. Banco di Filtri di Analisi.................................................................................................8
       3.4.4. FFT (Fast Fourier Transform) ........................................................................................9
       3.4.5. Modello Psicoacustico ....................................................................................................10
       3.4.6. Codifica Fattori di Scala.................................................................................................10
       3.4.7. Calcolo Struttura Codifica Fattori di Scala Su Intervalli ...............................................10
       3.4.8. Allocazione Dinamica Bit................................................................................................11
                3.4.8.1. Diagramma di Flusso .................................................................................14
       3.4.9. Normalizzazione e Quantizzazione Campioni Frequenziali...........................................15
       3.4.10. Protezione Errori ............................................................................................................16
3.5.   IL PROCESSO DI DECODIFICA Layer II....................................................................................16
       3.5.1. Diagramma di Flusso......................................................................................................17
       3.5.2. Sincronizzazione Frame ..................................................................................................18
       3.5.3. Decodifica Header ..........................................................................................................18
       3.5.4. Decodifica CRC Errori....................................................................................................19
       3.5.5. Decodifica Bit Allocation ................................................................................................19
       3.5.6. Decodifica SCFSI ............................................................................................................19
       3.5.7. Decodifica Fattori di Scala .............................................................................................19
       3.5.8. Dequantizzazione Campioni............................................................................................20
       3.5.9. Denormalizzazione Campioni .........................................................................................20
       3.5.10. Filtro di Sintesi di Sottobanda.........................................................................................21




Capitolo 4
                               MODELLI PERCETTIVI
4.1.   INTRODUZIONE............................................................................................................................1
4.2.   MODELLO PSICOACUSTICO 1 ...................................................................................................2
        4.2.1. ALGORITMO DI CALCOLO.............................................................................................2
                 4.2.1.1... FFT ................................................................................................................3
                 4.2.1.2... Determinazione Spl (livello segnale) .............................................................4
                 4.2.1.3... Confronto Soglia in Quiete (statica)..............................................................4
                 4.2.1.4... Identificazione delle Componenti Tonali e Non Tonali .................................4
                                      4.2.1.4.1.... Massimo Locale .....................................................................5
                                      4.2.1.4.2.... componenti Tonali..................................................................5
                                      4.2.1.4.3.... componenti Non Tonali..........................................................6
                 4.2.1.5... Decimazione delle Componenti Tonali e Non Tonali ....................................7
                 4.2.1.6... Calcolo della Soglia di Mascheramento Individuale.....................................7
                 4.2.1.7... Calcolo della Soglia di Mascheramento Globale ..........................................9
                 4.2.1.8... Determinazione della Soglia Minima di Mascheramento..............................9
                 4.2.1.9... Calcolo del Rapporto Segnale-Maschera......................................................9
        4.2.2 .Accuratezza del Modello....................................................................................................10
4.3.   CENNI MODELLO PSICOACUSTICO 2.......................................................................................10
4.4.   RELAZIONE TRA SMR, SNR E MNR.............................................................................................10
4.5.   RISULTATI .....................................................................................................................................13
Capitolo 5
                                INTRODUZIONE ALLE
                                     ELABORAZIONI
5.1.   INTRODUZIONE ...........................................................................................................................1
5.2.   POSSIBILI APPLICAZIONI ..........................................................................................................4
       5.2.1. Modifica del Bitrate.........................................................................................................4
       5.2.2. Sincronizzazione..............................................................................................................6
5.3.   SEQUENZE AUDIO PER LE PROVE ...........................................................................................7
5.4.   BITRATE USATI PER LE PROVE.................................................................................................8
5.5.   TEMPI DI CO-DECODIFICA .......................................................................................................9
5.6.   APPARECCHIATURE USATE IN ASCOLTO ...............................................................................9
5.7.   VALUTAZIONE RISULTATI..........................................................................................................10
       5.7.1. ... regole per valutazioni "oggettive" ..............................................................................12
       5.7.2. Criteri di Confronto.........................................................................................................13
       5.7.3. Valutazioni di Basso Livello............................................................................................14
                 5.7.3.1. .LBA e .RBA ................................................................................................15
                 5.7.3.2. .MNR :.........................................................................................................16
                 5.7.3.3. .SMR............................................................................................................17
                 5.7.3.4. .TAB ............................................................................................................18
       5.7.4. Valutazioni di Alto Livello...............................................................................................18
5.8.   RITARDO INTRODOTTO DAI FILTRI .........................................................................................20
5.9.   NOTE SULL'ELABORAZIONE......................................................................................................21
       5.9.1. Formule di Quantizzazione e Normalizzazione ...............................................................21
       5.9.2. Calcolo Fattori di Scala ..................................................................................................21
       5.9.3. Da Fattore di Scala a Intensità (dB) ...............................................................................22
       5.9.4. Incremento Livelli per Segnali Quantizzati .....................................................................23
       5.9.5. Normalizzazione Segnali Audio.......................................................................................23
       5.9.6. Aliasing per Bande Soppresse.........................................................................................24
                 5.9.6.1. Bande Soppresse a Bassi Bitrate ................................................................25




Capitolo 6
 ELABORAZIONI NUMERICHE
6.1.   FORMA NUMERICA DEL FRAME...............................................................................................1
6.2.   PROBLEMI AFFRONTATI............................................................................................................5
6.3.   SCHEMA ELABORAZIONE ..........................................................................................................5
6.4.   DIFFICOLTÀ DI UNA ANALISI PSICOACUSTICA.....................................................................6
6.5.   MPEG E IL JOINT_STEREO.........................................................................................................7
6.6.   MODIFICA E COSTRUZIONE DELLA BIT_ALLOCATION........................................................8
       6.6.1. Modifica Bit_Allocation:.................................................................................................8
       6.6.2. Costruzione Bit_Allocation: ............................................................................................9
6.7.   ELABORAZIONI NUMERICHE ....................................................................................................9
Capitolo 7
                                             COMPORTAMENTO
                                                   CODIFICA
7.1.   CALCOLO TEORICO INDETERMINAZIONE MEDIA ................................................................2
       7.1.1. Indeterminazione sui campioni di sottobanda.................................................................2
       7.1.2. Indeterminazione sui Fattori di scala..............................................................................4
       7.1.3. Indeterminazione raggruppamento Fattori di Scala .......................................................4
       7.1.4. Conclusioni......................................................................................................................5
7.2.   EFFETTI DELLA FASE.................................................................................................................6
       7.2.1. Risultati Sperimentali ......................................................................................................6
       7.2.2. Algoritmo.........................................................................................................................7
       7.2.3. Grafici .............................................................................................................................7
       7.2.4. Analisi Risultati ...............................................................................................................11
7.3.   CO-DECODIFICHE IN CASCATA SENZA SFASAMENTO .........................................................13
       7.3.1. Effetti delle co-decodifiche..............................................................................................13
       7.3.2. Risultati Sperimentali ......................................................................................................13
       7.3.3. Algoritmo.........................................................................................................................14
       7.3.4. Grafici .............................................................................................................................14
       7.3.5. Analisi Risultati ...............................................................................................................18
7.4.   ANALISI CO-DECODIFICHE IN CASCATA SFASATE ...............................................................20
       7.4.1. Algoritmo.........................................................................................................................20
       7.4.2. Grafici .............................................................................................................................20
       7.4.3. Analisi Risultati ...............................................................................................................24




Capitolo 8
                                                   ELABORAZIONI
                                                 PSICOACUSTICHE
8.1.   ENTROPIA MNR = ENTROPIA SMR ...........................................................................................1
8.2.   TRASMISSIONE MNR IN UN CANALE SEPARATO ....................................................................2
8.3.   MODIFICA BITRATE ....................................................................................................................3
8.4.   MIXING SEQUENZE .....................................................................................................................3
       8.4.1. Studio Mascheramento ....................................................................................................4
       8.4.2. Applicazione alle Elaborazioni MPEG ...........................................................................5
       8.4.3. Stima Livello di Mascheramento .....................................................................................5
       8.4.4. Mascheramento tra Bande adiacenti...............................................................................8
       8.4.5. Corrispondenza Bande - Bark.........................................................................................9
       8.4.6. Applicazione Formule di Pendenza.................................................................................11
       8.4.7. Localizzazione Mascheranti e loro intensità ...................................................................16
       8.4.8. Confronto con la Soglia Statica ......................................................................................17
       8.4.9. Algoritmo.........................................................................................................................19
8.5.   SINCRONIZZAZIONE....................................................................................................................21
       8.5.1. Studio del Problema ........................................................................................................21
       8.5.2. Rappresentazione Grafica ...............................................................................................22
Capitolo 9
                                       TRASMISSIONE MNR
9.1.    CANALE PER MEMORIZZARE L' MNR........................................................................................1
9.2.    STIMA E TRASMISSIONE ............................................................................................................3
9.3.    STIMA SMR....................................................................................................................................4
         9.3.1. Valore di Riferimento ......................................................................................................5
9.4.    TRASMISSIONE MNR ...................................................................................................................5
9.5.    UNA TECNICA IBRIDA.................................................................................................................6
9.6.    USO DEI PAD................................................................................................................................8




Capitolo 10
                                                             APPUNTI SULLA
                                                                  CODIFICA
10.1. SOTTOBANDE ALLOCATE ..........................................................................................................1
      10.1.1. Analisi Occupazione Canale ...........................................................................................2
      10.1.2. Tabella Guadagni............................................................................................................3
      10.1.3. Proposta Nuova Sintassi .................................................................................................5
10.2. CAMPIONI NON SIGNIFICATIVI ................................................................................................5
      10.2.1. Risparmio Bit...................................................................................................................7
      10.2.2. Algoritmo.........................................................................................................................8




Appendice A
                                        IL SOFTWARE MPEG
                                                                                                       (versione 3.5)
A.1.   MODULI E LIBRERIE .....................................................................................................................1
A.2.   AUTORI............................................................................................................................................2
A.3.   SCOPO DISTRIBUZIONE ...............................................................................................................3
A.4.   DESCRIZIONE SORGENTI .............................................................................................................5
A.5.   STRUTTURE DATI ..........................................................................................................................5
A.6.   MACRODEFINIZIONI .....................................................................................................................9
A.7.   VARIABILI GLOBALI ......................................................................................................................9
A.8.   FUNZIONI........................................................................................................................................10




Appendice B
ANALISI DEL SOFTWARE
B.1.   INTRODUZIONE ............................................................................................................................1
B.2.   PROCEDURA DI ALLOCAZIONE .................................................................................................1
B.3.   DIVERSA MAPPATURA CAMPIONI .............................................................................................6
B.4.   INVERSIONE MSB CAMPIONI FREQUENZIALI .........................................................................10
B.5.   SHORT PCM : HI ⇔ LO ...............................................................................................................11
B.6.   DIAGRAMMA CODIFICATORE ....................................................................................................11
B.7.   DIAGRAMMA DECODIFICATORE...............................................................................................13




Appendice C
                                           SOFTWARE DI
                                       POST_PRODUZIONE
C.1.    SCOPO DELLE FUNZIONI ..........................................................................................................1
C.2.    SORGENTI LETTURA/SCRITTURA FRAME................................................................................2
C.3.    SORGENTI CONTEGGIO BIT ......................................................................................................5
C.4.    SORGENTI TRASFORMAZIONE IN DECIBEL............................................................................6
Capitolo 1.1
                       IL FENOMENO "SUONO"
   1.1.1. NATURA E DIFFUSIONE DEL SUONO ......................................................................................1
   1.1.2. LE CARATTERISTICHE DEL SUONO .........................................................................................3
          1.1.2.1. Ampiezza..........................................................................................................................3
                    1.1.2.1.1. DeciBel........................................................................................................4
          1.1.2.2. Frequenza e Timbro .......................................................................................................5
   1.1.3. LA DIVISIONE IN OTTAVE ..........................................................................................................7
   1.1.4. IL RUMORE...................................................................................................................................8
   1.1.5. COMPONENTI TONALI................................................................................................................9

Il capitolo riporta una sintesi dei concetti base e delle caratteristiche fisiche del "suono".
Vengono riportate alcune definizioni ed unità di misura che saranno usate in seguito per la descrizione
del sistema di compressione dell'audio MPEG_Audio1.


1.1.1. NATURA E DIFFUSIONE DEL SUONO
Il suono è un fenomeno ondulatorio prodotto da movimenti vibratori di un corpo (detto sorgente) e si
diffonde con perturbazioni di pressione in un mezzo solido, liquido o gassoso.
Le molecole del mezzo propagano il disturbo compiendo degli spostamenti lungo la direzione di
propagazione .
Tutti i movimenti vibratori con una frequenza che rientra nell' intervallo udibile dall'uomo sono
definiti suoni.
La frequenza è definita come l'inverso del periodo ovvero del tempo di ripetizione di un fenomeno
periodico.
La sua unità di misura è l'Hertz, indicato con Hz, ed esprime il numero di periodi compiuti dal segnale
in un secondo:
                                                                         1
                                                                  f =
                                                                         T




                                                                                         SECONDI




                                             PERIODO
                                                   T
                  Fig. 1.1.1 Periodo di un onda sinusoidale




   1MPEG : (Moving Pictures Expert Group) ha definito le specifiche
        di una codifica che ottiene la compressione dell'audio
        digitale ovvero la riduzione del numero di simboli usati.
Capitolo 1.1 "Il fenomeno suono " Davide Cilano



Le frequenze di vibrazione percepite dall'uomo come suoni coprono l'intervallo tra 20 e 20000 Hz, le
frequenze al di sotto dei 20 Hertz non possono essere udite e sono percepite come vibrazioni, quelle
sopra i 20000 Hz sono invece dette ultrasuoni.

                    INTERVALLO DI FREQUENZA                   FENOMENO PERCEPITO
                                 Hz
                              0 ... 20                                    Vibrazioni
                            20 ... 20000                                    Suoni
                          20000 ... 40000                                 Ultrasuoni
               Tab. 1.1.1 Corrispondenza tra frequenze di fenomeni fisici e percezione umana.

Per altri esseri viventi le frequenze udibili possono variare notevolmente, come ad esempio per il cane
(20 : 30000Hz) o il pipistrello (20 : 90000 Hz).

Il fenomeno acustico dal punto di vista fisico coinvolge sempre tre elementi:

            .... la sorgente             corpo vibrante
            .... il mezzo                qualsiasi mezzo elastico
            .... il ricevitore           l'apparato uditivo

La sorgente genera il suono, il mezzo lo trasmette ed il ricevitore percepisce le variazioni di pressione.

In generale le sorgenti sonore possono essere raggruppate in [Lazzarin]:

       .. Corpi solidi oscillanti (strumenti a corda, Diaframmi per altoparlanti o strumenti a
               percussione)
       .. Colonne d'aria oscillanti (strumenti a fiato, organi)
       .. Corpi in movimento rapido (eliche , fruste)
       .. Gas rapidamente fuoriuscenti (razzi, reattori)
       .. Incrementi rapidi di pressione (detonazioni)

La voce umana è una complessa combinazione dei primi due meccanismi.

Nelle applicazioni ingegneristiche il mezzo o canale di trasmissione può comprendere apparecchiature
per la trasmissione sotto altre forme energetiche come ad esempio la distribuzione radiofonica che
avviene nell'etere sotto forma di onde elettromagnetiche.
Indipendentemente dalla forma di trasmissione un suono può essere percepito e generato solo sotto
forma di variazioni di pressione.




                        Trasformazione                              Trasformazione
 Sorgente               in altra forma        Trasmissione          in variazioni
                        energetica                                  di pressione




               Fig. 1.1.2 I suoni possono essere prodotti solo sotto forma di variazioni di
                       pressione così come l' uomo può percepire i suoni solo come variazioni di
                       pressione.
                       La trasmissione dei segnali sonori può invece avvenire anche sotto altre
                       forme energetiche.




                                                                                                Pag. 1.1-2
Capitolo 1.1 "Il fenomeno suono " Davide Cilano



1.1.2. LE CARATTERISTICHE DEL SUONO
Il suono è un particolare tipo di segnale che può essere rilevato dall'apparato uditivo umano ed è
caratterizzato da :

       ... intensità         o ampiezza
       ... acutezza          o frequenza
       ... timbro            carattere che distingue lo stesso suono generato da sorgenti diverse



1.1.2.1.           Ampiezza
È una delle caratteristiche fondamentali del segnale sonoro e può essere espressa con diverse unità di
misura come ad esempio potenza, intensità o pressione sonora.
Il massimo intervallo entro cui variano le ampiezze del segnale è detto DINAMICA o INTERVALLO
DI DINAMICA del sistema.

Alcune misure di ampiezza sono:

       Potenza sonora (P) è l'energia totale emessa dalle sorgente nell'unità di tempo e si misura in
                           Watt.

       Pressione sonora (p) è la variazione di pressione prodotta dal fenomeno sonoro rispetto alla
                           quiete e può assumere valori sia positivi che negativi e si misura in BAR o
                           Newton/m2 .

       Intensità sonora (I) è il flusso di energia trasmesso attraverso un'area di sezione unitaria
                            perpendicolare alla direzione di propagazione del suono si misura in
                            Watt/m2.

La relazione tra pressione sonora (p) e potenza sonora (P) è [Cosa]:
                                           Pρc
                                   p=                                      [1.1.1]
                                           4 πr 2
dove r è la distanza,   ρ   è l'indice di densità del mezzo e c è la velocità di propagazione del suono nel
mezzo2.

La relazione tra intensità sonora (I) e potenza sonora (P) è [Lazzarin]:
                                                      P
                                             I=                  [1.1.2]
                                                    4 πr 2
dove r indica la distanza tra sorgente e ricevitore.

Di seguito è riportata una tabella con alcuni valori tipici di potenza sonora:




   2Per la propagazione nell'aria la velocità del suono dipende
       fortemente dalla temperatura (t) secondo la formula
       approssimata [Lazzarin]:
                                 c = 331, 4 + 0 , 6 t ( ° C ) m / sec.


                                                                                            Pag. 1.1-3
Capitolo 1.1 "Il fenomeno suono " Davide Cilano



                                FENOMENO                    POTENZA SONORA
                                                                [WATT]
                        Aereo al decollo               100
                        Martello pneumatico              1
                        Automobile in corsa              0,1
                        Ventilatore industriale          0,01
                        Voce forte                       0,001
                        Lavastoviglie                    0,0001
                        Piccolo ventilatore              0,00001
                        Sussurro                         0,000000001
              Tab 1.1.2 Alcuni valori di potenza sonora espressi in Watt [Lazzarin]

Per misurare l'ampiezza di segnali audio in un intervallo temporale si può fare riferimento al massimo
valore assunto dal segnale (come pressione, potenza o intensità) detto valore di picco (peak) che
rappresenta il livello massimo trattabile dal sistema.

Il valore di picco è però una misura ingegneristica che poco si adatta alle caratteristiche percettive
dell'uomo in quanto il segnale può raggiungere tale valore solo in brevi istanti e rimanere più basso
nella maggior parte dell'intervallo di ascolto.

Una misura più rappresentativa potrebbe essere il valore medio dell'ampiezza dell'onda sonora sullo
stesso intervallo, anche tale misura è però poco significativa in quanto i risultati di alcuni studi
indicano che l'orecchio è maggiormente sensibile al segnale integrato su brevi periodi temporali
(tipicamente 0.25 secondi) ed è fortemente dipendente dalla frequenza del segnale, segue quindi che le
tradizionali misure fisiche non si prestano ad un dimensionamento valido dei fenomeni acustici così
come sono percepiti e bisogna ricorrere ad unità di misura 'ad hoc' come il deciBel.


1.1.2.1.1.        DeciBel
Il grande intervallo di potenze sonore udibili è evidenziato dalla Tab 1.1.1 che si estende in un
rapporto 1:1.000.000.000 così come i valori in pressione sonora che variano da 2 x 10-4µbar a 200µ
bar in un rapporto 1:1.000.000.
Per evitare di dover usare numeri troppo grandi è stata proposta una misura logaritmica della potenza
sonora: il BEL, che, tra l'altro, si adatta perfettamente alle caratteristiche percettive dell'orecchio
umano.

Il BEL è definito come il logaritmo in base 10 del rapporto di due quantità con le stesse caratteristiche
dimensionali, cioè è adimensionale e esprime un raffronto tra due valori: quello da misurare ed un
livello di riferimento.
Tenendo presente le [1.1.1] e [1.1.2] il BEL viene definito come:
                                                       2
                                           æ p ö            I
                              BEL = Log 10 ç     = Log 10                       [1.1.3]
                                           çp             I rif
                                           è rif

Per il nostro scopo però il BEL è ancora una misura troppo grande e per questo viene diviso in
DECIBEL.
                                                   2
                                   æ p ö              p                  I
               DECIBEL = 10 Log 10 ç     = 20 Log 10       = 10 Log 10                       [1.1.4]
                                   çp                p rif             I rif
                                   è rif

Il valore di riferimento (Irif , prif) può essere fissato arbitrariamente (in quanto il BEL esprime solo la
differenza di livelli) e nel caso si usi il valore della minima intensità udibile di IRif=10-12 W/m2 o della
minima pressione rilevabile di 2x10-5N/m2 prende il nome di dB SPL (Sound Pressure Level o
Livello di pressione sonora).

Il dB è in tal modo una misura appropriata per esprimere intensità sonore , ad esempio le intensità
della Tab 1.1.1 coprono un intervallo di circa 180 dB.



                                                                                            Pag. 1.1-4
Capitolo 1.1 "Il fenomeno suono " Davide Cilano




                           140 dB     Aereo
                           130 dB     Soglia del dolore
                           110 dB     Moto in accelerazione
                            90 dB     Strada urbana
                            80 dB     Locale pubblico
                            60 dB     Traffico automobilistico
                            50 dB     Voce di conversazione
                            20 dB     Ticchettio orologio
                            10 dB     Fruscio foglie
                 Tab 1.1.3 Alcuni valori di intensità sonora in dB SPL [Lazzarin]


Essendo il dB una unità logaritmica non è possibile sommare direttamente valori espressi in dB,
per ottenere l'intensità risultante dalla somma di I1 e I2 :
                                                                I1
                                              A = 10 Log10
                                                               I rif
                                                               I2
                                              B = 10 Log10
                                                              I rif

si ricava:
                                 I1 = I rif 10 10 A

                                 I 2 = I rif 10 10 B
e quindi :
                                           I1 + I 2            æ 10 10 A + 10 10 B ö
        C = (I1 + I 2 )dB = 10 Log10                = 10 Log10 ç                          [1.1.5]
                                             I rif             ç        I rif
                                                               è
Si noti che un aumento di 3 dB del livello sonoro in intensità o 6 dB in pressione sonora equivale al
raddoppio dell'energia.

In modo del tutto simile se una intensità sonora espressa in dB deve essere moltiplicata per un livello:


                             ( A * liv )dB = 10 Log10 (10 10 A * liv )       [1.1.6]

In generale N sorgenti con la stessa intensità Ls producono un segnale :
                          L tot = Ls + Log 10 (2 N )                   [1.1.7]



1.1.2.2.            Frequenza e Timbro
Percettivamente la frequenza definisce l'acutezza di un suono; le basse frequenze sono proprie di
suoni gravi le alte frequenze di suoni acuti.

La forma d'onda periodica più semplice è la funzione seno, tutte le onde sinusoidali con qualsiasi
frequenza nel campo dell'udibile sono dette TONI PURI (o TONI SEMPLICI) mentre quelle non
riconducibili a toni puri sono dette TONI COMPLESSI.
Per analizzare la struttura frequenziale di un segnale si possono usare diverse tecniche tra cui :

             •    filtri a scansione
             •    banchi di filtri
             •    filtri polifase
             •    trasformata di Fourier




                                                                                         Pag. 1.1-5
Capitolo 1.1 "Il fenomeno suono " Davide Cilano



Dalla scomposizione di Fourier si ottengono informazioni riguardo all'ampiezza e alla fase delle
singole componenti , informazioni di vitale importanza per la ricostruzione del segnale.


       TEOREMA DI FOURIER :

       Una funzione del tempo f(t) che nel proprio campo di definizione (-T/2, +T/2)
       soddisfi alle due seguenti condizioni (Dirichlet):

       a) nell'intervallo di definizione possa essere scomposta in un numero finito di
                      subintervalli in cui f(t) sia continua e monotona;
       b) se t0 è un punto di discontinuità esistono e sono definiti i limiti f(t0 + 0) e f(t0 -
                      0);

       può essere rappresentata nel modo seguente :

                                                    ∞
                                         f (t ) =        F (ω )e jωt dω
                                                    −∞


       dove :
                                                          ∞
                                                     1
                                      F (ω ) =                 f (t )e − jωt dt
                                                    2π    −∞




Nel caso di segnali discreti l'operazione di integrale viene sostituita dalla sommatoria e la trasformata
di Fourier si indica DFT.
Il calcolo della DFT comporta un numero di operazioni molto elevato dell'ordine di N2. Per ridurne
la complessità algoritmica ne è stata realizzata una versione ottimizzata (FFT Fast Fourier Transform)
che richiede un numero di operazioni pari a N log2N.

La rappresentazione frequenziale (forma scomposta in sinusoidi) di un segnale è detta SPETTRO.
Il calcolo dello spettro pur essendo una operazione concettualmente semplice può comportare delle
difficoltà per segnali che cambiano continuamente nel tempo.
Infatti il segnale è un'entità temporale mentre lo spettro è frequenziale, essendo tra loro inversamente
proporzionali (f = 1/t) più ampio è l'intervallo di analisi e minore è la risoluzione frequenziale ovvero
minore è l'accuratezza.
Quindi l'analisi spettrale è un compromesso tra ampiezza temporale e risoluzione frequenziale a
seconda dell'applicazione specifica.




                                                SECONDI                                          FREQUENZA
                                                                             100 Hz =1/0.01sec


                     T = 0.01 sec.


                Fig. 1.1.3 Funzione seno e suo spettro.

La scomposizione di un TONO COMPLESSO porta ad identificare la frequenza fondamentale, che,
per definizione, è il tono di frequenza minore tra tutte le componenti.
La frequenza fondamentale determina l'acutezza del suono ovvero la collocazione nella banda
dell'udibile mentre l'ampiezza e la fase delle armoniche determinano il timbro del suono.
Se alla stessa fondamentale si somma una stessa armonica ma con fase diversa il suono apparirà dello
stesso tipo ma con assonanza diversa.
A parità di livello l'orecchio è maggiormente sensibile ai toni puri piuttosto che a suoni estesi su larga
banda.

                                                                                                   Pag. 1.1-6
Capitolo 1.1 "Il fenomeno suono " Davide Cilano




L'intervallo tra la minima e la massima frequenza trattabile da un sistema viene detto LARGHEZZA
DI BANDA.


1.1.3. LA DIVISIONE IN OTTAVE
L'intervallo di frequenze udibili dall'uomo è stato indicato numericamente dai valori tra 20 e 20000 Hz
, tali limiti sono solo indicativi in quanto i valori reali dipendono da molti fattori sia fisici che
psicologici :

                    .. le caratteristiche genetiche dell'individuo
                    .. la "dotazione fisica" dell'apparato uditivo
                    .. l' età
                    .. l' affaticamento acustico
                    .. l' esperienza in ascolto

Tutti gli individui rilevano però una sensazione di "similitudine" tra toni fondamentali di frequenza
doppia, tripla, quadrupla, ecc. Per tale motivo è stata introdotta la divisione in ottave dello spettro di
frequenze udibili.

Un'ottava è definita come l'intervallo di frequenza tra due fenomeni di cui uno abbia frequenza doppia
dell'altro.
Le frequenze udibili hanno un'estensione di circa 11 ottave e può essere interessante confrontarlo con
l'intervallo delle onde visibili che coprono meno di una ottava.
Per definizione ogni banda in ottave è individuata dalla media geometrica delle frequenze che la
delimitano, detta frequenza caratteristica o nominale.
                                  f alta = 2 f bassa
                                  f caratteristica =   f alta f bassa

                  N.BANDA         FREQUENZA                   FREQUENZA         FREQUENZA
                                CARATTERISTICA                INFERIORE         SUPERIORE
                       1                    16                      11,2           22,5
                       2                   31,5                     22,5             45
                       3                    63                       45              90
                       4                  125                        90             180
                       5                  250                      180             355
                       6                  500                      355             710
                       7                 1000                      710             1400
                       8                 2000                     1400             2800
                       9                 4000                     2800             5600
                      10                 8000                     5600            11200
                      11                16000                    11200            22400
              Tab 1.1.4 Divisione in ottave delle frequenze udibili.
                     La frequenza superiore è sempre il doppio di quella inferiore e quindi la
                     larghezza di banda di ogni ottava aumenta con l'aumentare della
                     frequenza.

Un'altra divisione della banda di frequenze udibili può essere fatta in 1/3 di ottava , in tal caso si
ottengono 31 bande ognuna delle quali è compresa tra due frequenze che sono in un rapporto di 3          2:
                                         f alta = 2 f bassa
                                                   3


                                         f caratteristica =    f alta f bassa


1.1.4. IL RUMORE
Il rumore è definito [ANSI S 1.1] come la somma di oscillazioni irregolari, intermittenti o
statisticamente casuali. Percettivamente è un suono innaturale e disturbante.


                                                                                                 Pag. 1.1-7
Capitolo 1.1 "Il fenomeno suono " Davide Cilano




Un rumore può essere classificato in base alle sue caratteristiche in [Cosa] :

       .. continuo o discontinuo     riferito alla durata nel tempo
       .. stazionario o fluttuante   in base all'intensità
       .. casuale                    se la durata e l'intensità sono irregolari
       .. impulsivo                  se la sua energia è concentrata in brevi intervalli temporali

L'unità di misura del rumore più usata è l'incremento di pressione sonora indotta, espressa in
Newton/m2.
La soglia di percezione del rumore dipende dall'intensità, dalla frequenza e , per rumori di tipo
impulsivo anche dalla durata.
Tipicamente la soglia di percezione dipende fortemente dalla frequenza ed è tra -1 e 3 dB SPL per le
frequenze centrali, aumenta a 10-20 dB SPL alle alte frequenze e a 40-70dB SPL per le basse.
La soglia temporale di percezione del rumore è di circa 100ms.

Alcuni rumori tipici possono essere identificati dal rapporto tra potenza e frequenza [Cosa]; ad
esempio si indica con il termine rumore bianco un rumore la cui densità spettrale di potenza sonora è
distribuita in modo costante su tutte le frequenze udibili; si definisce rumore rosa, un rumore che ha
potenza per singola frequenza inversamente proporzionale alle frequenze comprese in un determinato
campo.
Quindi per il rumore bianco l'intensità di pressione sonora decresce di 3 dB per ogni banda di ottava,
mentre per quello rosa rimane costante pur diminuendo la ripartizione sulle singole frequenze.

Un suono si differenzia dal rumore solo per le sensazioni di piacere o sgradevolezza che suscita e non
ne esiste una distinzione oggettiva.


1.1.5. COMPONENTI TONALI
Le componenti tonali sono quelle componenti di un tono complesso che più 'assomigliano a toni puri.
Un metodo semplificato per valutare la presenza di componenti tonali in una emissione sonora è di
effettuarne una analisi per bande di 1/3 di ottava [Cosa]:

              "se il livello di pressione sonora di una o più bande di 1/3 di ottava
              dello spettro sonoro supera per più di 5 dB quello delle due bande
              adiacenti, si è in presenza di componenti tonali."

Tutte le componenti del segnale sonoro che dall'analisi non risultano essere tonali
vengono dette NON TONALI e possono essere assimilate a rumore.




                                                                                           Pag. 1.1-8
Capitolo 1.2
                                                             LA PERCEZIONE
                                                                 DEL SUONO
   1.2.1. ORECCHIO UMANO E SENSIBILITÀ IN FREQUENZA .............................................................1
   1.2.2. LA PERCEZIONE ..........................................................................................................................4
   1.2.3. UNITÀ DI MISURA PERCETTIVE................................................................................................4
          1.2.3.1. Il Bark..............................................................................................................................4
          1.2.3.2. Loudness..........................................................................................................................5
          1.2.3.3. Il Phon.............................................................................................................................6
          1.2.3.4. Il Sone..............................................................................................................................7
   1.2.4. IL MASCHERAMENTO .................................................................................................................8
          1.2.4.1. ... Nella Frequenza ..........................................................................................................9
          1.2.4.2. ... Nel Tempo ...................................................................................................................11
          1.2.4.3. ... Nel Tempo e Frequenza...............................................................................................12
   1.2.5. PERCEZIONE DI VARIAZIONI DI INTENSITÀ ...........................................................................13

L'orecchio è sensibile ai segnali in funzione della frequenza e dell'ampiezza, due suoni di diversa
frequenza e pari intensità vengono percepiti di intensità diversa.
Questo capitolo è un' introduzione alla terminologia ed ai fenomeni coinvolti nel processo di
percezione dei suoni, vengono definite alcune unità di misura percettive, si riporta una breve
descrizione del funzionamento dell'apparato uditivo e si introduce il fenomeno di mascheramento tra
suoni.


1.2.1. ORECCHIO UMANO E SENSIBILITÀ IN FREQUENZA




                  Fig.1.2.1 Struttura schematica dell'orecchio umano esterno e medio.

L'orecchio può essere diviso dal punto di vista funzionale in [Lazzarin] :

   .. orecchio esterno
             .. padiglione auricolare
             .. condotto uditivo esterno
             .. membrana timpanica
Capitolo 1.2 "La percezione del suono" Davide Cilano




   .. orecchio medio
             .. cavità ossea con tre ossicini : martello, incudine e staffa
             .. finestra ovale
             .. due muscoli di smorzamento dei movimenti dei tre ossicini
             .. un canale di comunicazione con l'atmosfera per compensare le pressioni sulle due
                      superfici della membrana timpanica (Tromba di Eustacchio)

   .. orecchio interno
             .. vestibolo
             .. canali semicircolari detti labirinto
             .. coclea , canale colmo di un materiale elastico




            Orecchio Esterno                  Orecchio Medio                      Orecchio Interno




                Fig 1.2.2 Struttura interna dell'orecchio umano, sono indicati i principali organi
                        coinvolti nel processo di percezione.


Il canale cocleare è la parte che più influenza la percezione sonora.
La coclea è un canale lungo circa 35mm. a fondo cieco che è diviso per tutta la sua lunghezza in tre
camere dalla membrana basilare.
Queste tre parti sono:

 .. superiore       : o vestibolare comunica con l'orecchio medio attraverso la finestra ovale
 .. inferiore       : o timpanica comunica con la superiore verso l'apice della coclea
 .. media           : che contiene una sostanza detta endolinfa


                                                                                                     Pag. 1.2-2
Capitolo 1.2 "La percezione del suono" Davide Cilano




              Fig 1.2.3 Rappresentazione della coclea srotolata. Si può notare la divisione per
                      tutta la lunghezza in tre camere.


Sulla membrana basilare si trova l'organo di Corti in cui sono situate le cellule recettrici il cui
compito è di trasformare le differenze di pressione in impulsi elettrochimici da inviare al cervello.

Segue una descrizione sintetica del fenomeno della percezione sonora :

   -- l'orecchio esterno funzionando da risonatore per le frequenze tra 1000 e 7000 Hz
        (maggiormente efficace intorno a 3000 Hz) produce un incremento di circa 10-12dB delle
        pressioni sonore fra l'esterno ed il timpano

   -- nell'orecchio medio la membrana timpanica mette in vibrazione martello, incudine e staffa, che,
       funzionando come un sistema di leve triplicano la forza applicata sulla finestra ovale (la cui
       superficie è 1/30 di quella del timpano)

   -- a questo punto la pressione originaria esercitata sul timpano è stata amplificata di circa 90 volte
       e viene impressa sulla finestra ovale

   -- dalla finestra ovale il suono (sotto forma di variazione di pressione) giunge all'orecchio interno
       dove attraverso il movimento del liquido cocleare dei canali vestibolare e timpanico la
       membrana base mette in risonanza le cellule situate nell'organo di Corti.

   -- le cellule del Corti producono dei segnali di tipo elettrochimico che attraverso il nervo uditivo
        giungono al cervello secondo un processo non ancora ben conosciuto.

In tutto il processo di percezione uditiva vengono coinvolti numerosi fenomeni soggettivi che possono
produrre in individui diversi sensazioni differenti in presenza dello stesso suono esterno.
Inoltre sono presenti altri fenomeni di "autodifesa" che modificano la caratteristica dell'informazione
trasmessa nell'apparato uditivo.
Ad esempio i tre ossicini martello, incudine e staffa sono controllati da dei piccoli muscoli che in
presenza di alte intensità sonore ne riducono il potere amplificante (solo per suoni di durata superiore
ai 200ms.).

La percezione di un suono può avvenire anche per via ossea (soprattutto per quello auto prodotto).

L'orecchio è in grado di percepire tutte le caratteristiche del suono tranne la sua localizzazione.
Per sopperire a tale mancanza, il soggetto umano si basa su confronti tra i suoni percepiti dall'orecchio
destro e dal sinistro con spostamenti della testa.


1.2.2. LA PERCEZIONE
I recenti studi in campo psicoacustico hanno evidenziato che l'apparato uditivo umano è in grado di
rilevare solo alcune caratteristiche del segnale audio ed in particolare:

                                                                                                  Pag. 1.2-3
Capitolo 1.2 "La percezione del suono" Davide Cilano




             Caratteristica FISICA                                Fenomeno PERCEPITO
                  Frequenza                                                  Pitch
                    Intensità                                   Livello percepito o Loudness
   Forma spettrale, Modulazione ,Frequenza                    Intensità, Fluttuazioni, Rigidezza
                     Tempo                                            Durata soggettiva
              Tab 1.2.1 Caratteristiche fisiche del suono e corrispondente fenomeno percepito
                     dall'uomo.

La descrizione di come vengono percepiti i suoni può essere semplificata se al posto delle unità di
misura "fisiche" si usano unità di misura "percettive" ovvero costruite "ad hoc" sulla capacità di
risoluzione dell'apparato uditivo.
Così al posto della frequenza conviene usare le bande critiche o Bark, e al posto dell'intensità si usa il
loudness misurato in Phon o Sone.

In definitiva la percezione umana può essere ben descritta in uno spazio a tre dimensioni:




              Fig. 1.2.4 Spazio tempo - frequenza - intensità in cui può convenientemente
                      essere descritto e studiato il fenomeno della percezione sonora umana.




1.2.3. UNITÀ DI MISURA PERCETTIVE
Nei paragrafi che seguono si riportano le definizioni delle unità di misura percettive di uso comune e
se ne spiega il significato e l'uso.
Tali unità di misura essendo percettive sono valide solo su base statistica e sono state ottenute da studi
compiuti negli anni passati su grandi campioni di individui acusticamente sani.
Ne segue che sono valide per ascoltatori che rientrano nella media e non per soggetti affetti da
patologie o dotati di particolare acutezza.
Le unità di misura esposte sono state soggette all'approvazione e standardizzazione dell'ISO
(International Standard Organization).


1.2.3.1.          Il Bark
Il Bark è una unità di misura non lineare che viene usata per dividere l'intera banda di frequenze
udibili in sottobande confinanti non sovrapposte che ben modellizzano il processo di percezione dei
suoni da parte dell'uomo.
Il concetto delle bande critiche è basato sulla comprovata assunzione che il nostro sistema uditivo
analizza lo spettro di un segnale audio dividendolo in sottobande (dette bande critiche).

       Banda Critica [Aarts]: La banda di frequenze più larga in cui l'intensità di un rumore
                    distribuito casualmente nella stessa banda di intensità energetica costante (SPL)
                    è indipendente dalla sua larghezza di banda.

Aggiungendo una banda critica alla successiva, in modo che il limite superiore della più bassa
coincida con quello inferiore della più alta, si ottiene la scala di banda critiche che è non lineare in


                                                                                                Pag. 1.2-4
Capitolo 1.2 "La percezione del suono" Davide Cilano



quanto le bande critiche hanno un'ampiezza variabile in funzione della frequenza e seguono
un'andamento pressoché logaritmico.




              Fig 1.2.5 Rappresentazione delle frequenze coperte dai bark:
                      in ascissa è rappresentata la frequenza,
                      in ordinata le bande critiche 0:24 .
                      La curva rappresenta l'intervallo di frequenza coperto dalle bande
                      critiche.


L'ampiezza delle bande critiche è di circa 100 Hz fino a 500 Hz mentre al di sopra questo valore
hanno un'ampiezza relativa che aumenta del 20%, le bande critiche sono strettamente correlate alla
frequenza.
La divisione in bande critiche è stata ottenuta da esperimenti percettivi che hanno misurato i confini in
frequenza entro cui due toni distinti vengono percepiti come un unico suono.

La formula di conversione da frequenza a Bark è [Kapust]:
                                                                                    2

                                           (
                       Bark = 13 arctg 7.6 *10        −4
                                                            )           æ f ö
                                                           f + 3.5 arctgç
                                                                        è 7500

dove f è la frequenza espressa in Hertz.

La larghezza di ogni banda critica banda critica è invece data da [Zwicker]:

                                                                             0.69
                            Larghezza Hz = 25 + 75 1 + 1. 4 f centro
                                                               2



Zwicker indica che le bande critiche sono mobili nel dominio della frequenza e si dimensionano in
modo tale che l'orecchio umano percepisca il massimo dell'informazione.


1.2.3.2.          Loudness
Indica l'intensità percepita di un suono e dipende dall'intensità energetica e dalla frequenza, in
particolare le definizioni sono [Aarts]:




                                                                                           Pag. 1.2-5
Capitolo 1.2 "La percezione del suono" Davide Cilano



       Loudness: Attributo di sensazione uditiva secondo cui un suono può essere ordinato in una
                     scala da lieve a intenso
       Livello di Loudness: livello della pressione sonora di riferimento, scelta come un'onda
                          sinusoidale di frequenza 1KHz proveniente dal fronte dell'ascoltatore e che
                          è giudicato da una persona con udito sano di uguale intensità al suono di
                          raffronto.

La scala dei loudness è stata costruita sperimentalmente basandosi sul livello di riferimento di un tono
di 1KHz a 40 dB (suono di riferimento standard in elettroacustica). Il loudness può essere misurato in
Phon o Sone che sono definiti di seguito.


1.2.3.3.          Il Phon
La sensibilità uditiva varia in funzione della frequenza ed in particolare è massima per le frequenze
centrali e minima per le estreme (alte e basse).
Il PHON è la misura dell'intensità soggettiva del suono (LOUDNESS) e rappresenta l'intensità
necessaria per produrre ad una certa frequenza la stessa sensazione uditiva in deciBel, di quella di un
tono alla frequenza di 1000 Hz, a tale frequenza i livelli di Phon e dB si equivalgono.




              Fig. 1.2.5 Audiogramma in PHON ISO R 226 di Robinson e Dadson, riporta in
                      funzione della frequenza l'intensità necessaria in dB per produrre la
                      stessa sensazione in intensità di un tono a 1KHz; le linee di isosensazione
                      esprimono l'intensità in dB che un suono deve avere in funzione della
                      frequenza per essere percepito ad una intensità costante in PHON.


L'audiogramma riportato nella Fig 1.2.6 riporta le curve di ISOSENSAZIONE (intensità soggettiva
del suono) e si riferisce a toni puri.
I risultati tabulati sono l'esito di prove eseguite da Robinson e Dadson su un campione di individui
sani.
La scala dei PHON è stata costruita sperimentalmente e come per i deciBel un raddoppio dell'energia
produce un aumento di 3 Phon.

Dalla figura si può notare che:




                                                                                                Pag. 1.2-6
Capitolo 1.2 "La percezione del suono" Davide Cilano



      .. la sensibilità è massima alle frequenze 20:3000Hz corrispondenti al parlato (l'orecchio
                esterno amplifica per risonanza queste frequenze)
      .. le basse frequenze vengono percepite solo a grandi intensità (l'orecchio esterno riflette
                parzialmente i suoni con grandi lunghezze d'onda)
      .. le alte frequenze per essere udite devono essere molto intense (i tre ossicini dell'orecchio
                medio ne limitano la trasmissione)
      .. la curva dei phon tende ad appiattirsi con l'aumentare dell'intensità (i due muscoli collegati
                a martello, incudine e staffa ne smorzano il potere amplificante ).


1.2.3.4.           Il Sone
Per ridurre la complessità dovuta all'uso della scala logaritmica dei phon, sperimentalmente è stata
costruita la scala dei SONE.
Il livello di 1 SONE è definito [ANSI S 3.4] come l'intensità sonora soggettiva (loudness) uguale ad un
livello di 40 PHON.
In prima approssimazione ogni aumento di 10 phon corrisponde ad un raddoppio del livello di SONE.
Dunque nella scala dei SONE (unità di misura soggettiva del suono) una intensità di 4 SONE è due
volte più "rumorosa" di un suono di 2 SONE.

Le relazioni tra PHON e SONE sono le seguenti [Cosa]:
                                  Sone = 0.03(Phon − 40 )
                                         1.2 Log 10 Sone                    [1.2.1]
                                  Phon =
                                              0.03
Per calcolare i livelli di SONE in funzione della pressione sonora [Aarts]:
                                        Sone = 0.01( p − p 0 )
                                                                      0.6



dove p0 = 45 µPascal approssima la soglia statica e p è la pressione in micropascal .
Per valori di p>>p0 le formule [1.2.1] possono essere ben approssimate dalle seguenti [Aarts]:
                                                   ( Phon − 40 )
                                        Sone = 2        10


                                        Phon = 40 + log 2 Sone

Il loudness di suoni complessi viene calcolato in funzione della loro scomposizione spettrale
sommando il loudness di tutti i toni entro una banda critica che è l'equivalente psicologico di sommare
l'attività delle cellule recettrici sulla membrana basilare.
Questo corrisponde all'assunzione che le sollecitazioni sulla membrana base si sommino per formare il
loudness totale, ovvero che l'apparato uditivo ne operi l'integrale. Se tale integrale viene fatto in Sone
,il risultato finale si esprime in Sone per Bark e si indica con N'
                                                  24 Bark
                                            N=          N ' ( z )dz
                                                    0
Il suono esteso a tutte le bande che produce un loudness di 1 Sone corrisponde ad una eccitazione
uniforme nelle bande critiche di 30dB.

Il loudness prodotto da un tono a 1 KHz è molto inferiore al loudness prodotto da una eccitazione
uniforme su tutti i Bark, soprattutto per livelli intensi mentre sono pressoché uguali a bassi livelli.


1.2.4. IL MASCHERAMENTO
Non tutte le vibrazioni entro la banda dell'udibile sono percepite dall'orecchio umano, la loro
rilevazione da parte dell'apparato uditivo dipende in prima approssimazione dall'intensità e dalla
frequenza e da analisi più accurate anche dai segnali adiacenti sia nel dominio del tempo che della
frequenza; tale fenomeno è noto con il nome di mascheramento.

Il mascheramento è definito come il livello di pressione sonora o dB SPL di un tono di riferimento
necessario perché questo possa essere udito in presenza di uno mascherante.

                                                                                            Pag. 1.2-7
Capitolo 1.2 "La percezione del suono" Davide Cilano




La percettibilità di un tono puro in assenza di altri segnali dipende principalmente della frequenza e
intensità dando origine a quella che viene detta soglia statica di mascheramento o in quiete.
Altri fattori che influiscono nella determinazione della soglia di mascheramento sono:

          .. durata
          .. dotazione fisica dell'individuo
          .. età
          .. affaticamento
          .. stato fisico
          .. stato psichico dell'individuo




              Fig. 1.2.6 Soglia di percezione in quiete in funzione della frequenza e
                      dell'intensità sonora.
                      Ad esempio la soglia può essere approssimata ad una pressione di soglia
                      di 0 dB per le frequenze tra 800 e 5000 Hz per ascoltatori composti da
                      adulti normali in giovane età (0 dB SPL).
                      Oltre i 5000 Hz la soglia aumenta rapidamente fino a coincidere con la
                      soglia di dolore a circa 16000 Hz. Il limite superiore per la pressione
                      sonora è stabilito in 120 dB ed è pressoché indipendente dalla frequenza.
                      Suoni di questa intensità provocano una forte sensazione di fastidio.
                      La soglia di dolore è posta a circa 130 dB; a tale livello il suono causa
                      sensazioni dolorose. Valori più elevati comportano sordità temporanea o
                      permanente anche per breve esposizione. È interessante considerare la
                      grande estensione del campo di variazione dell'ampiezza di vibrazione
                      timpanica; esso infatti va da circa 10-9 cm per la soglia uditiva (0 dB
                      SPL) a 10-2 cm a 140 dB (valori rilevati a 2000 Hz).

La soglia minima del suono percepibile (soglia statica) rappresentata in figura 1.2.7 è stata ottenuta da
esperimenti su un grande campione di individui.
La sua espressione matematica approssimata è [Zwicker]:

               Soglia dB = 3.64( f KHz )          − 6.5e −0.6( f KHz −3.2 ) + 10 −3 ( f KHz )
                                           −0.8                         2
                                                                                                4



La soglia di mascheramento per toni complessi è detta soglia di mascheramento dinamica ed è
fortemente dipendente dalla microstruttura del segnale in quanto i toni componenti interagiscono
mascherandosi a vicenda e contribuendo alla forma finale della maschera.

La maschera può essere studiata sia nel dominio del tempo che della frequenza; nel dominio del tempo
il mascheramento può essere simultaneo e non simultaneo mentre in quello della frequenza un tono
maschera quelli di frequenza adiacente a seconda dell'intensità.




                                                                                                    Pag. 1.2-8
Capitolo 1.2 "La percezione del suono" Davide Cilano



1.2.4.1.          ... Nella Frequenza
Nel dominio della frequenza il mascheramento è molto intenso in prossimità dei toni mascheranti, che
alzano in modo significativo i valori di soglia statica, in particolare se l'orecchio percepisce un suono
di una certa frequenza, presenta minore sensibilità per le frequenze vicine ad essa. La conoscenza di
tale fenomeno permette la costruzione della soglia di mascheramento.

In generale un suono ad una certa frequenza maschera tanto più i suoni di frequenza adiacente quanto
più è intenso.

La figura 1.2.8 riporta la curva di mascheramento per toni a 0.5, 1.2, 4, 8 KHz con livello di 60 dB
SPL, la scala delle frequenze è lineare.




              Fig 1.2.7 Curve di mascheramento in funzione della frequenza su scala lineare,
                      la curva inferiore rappresenta la soglia statica.
                      Per determinare tali curve si usa un tono di riferimento e si trova
                      l'intensità affinché sia udibile in presenza di un mascherante.

Nella Fig 1.2.8 si nota una gran diversità tra le curve di mascheramento al variare della frequenza.
Risultati non diversi si ottengono dalla rappresentazione su scala logaritmica (fig 1.2.9) :




              Fig. 1.2.8 Rappresentazione su scala logaritmica degli effetti di toni mascheranti
                      di intensità pari a 60 dB.

Anche in scala logaritmica la forma delle curve risulta dipendente dalla frequenza, però si può notare
come le curve su scala lineare sotto i 500 Hz siano uguali a quelle su scala logaritmica sopra i 500 Hz.
Ciò suggerisce che si potrebbe ottenere l'indipendenza della forma della maschera dalla frequenza
scegliendo una scala lineare sotto i 500 Hz e logaritmica al di sopra.




                                                                                               Pag. 1.2-9
Capitolo 1.2 "La percezione del suono" Davide Cilano



Una tale scala di frequenze è già stata illustrata ed è quella dei Bark ; infatti la rappresentazione dello
stesso fenomeno usando la scala dei bark evidenzia una forma di mascheramento costante:




               Fig 1.2.9 Rappresentazione della forma della curva di mascheramento di toni
                       puri con livello di 60dB usando per la frequenza la scala dei Bark.
                       Il vantaggio introdotto è evidente rendendo indipendente la forma della
                       maschera dalla frequenza a meno di intersezioni con la soglia statica di
                       mascheramento.
                       Si noti che la funzione di mascheramento è molto più ripida a sinistra che
                       a destra.


Dunque, con la scala dei Bark lo studio dei fenomeni di mascheramento è molto semplificato
permettendo la costruzione della soglia con una funzione dipendente solo dall'intensità.

In particolare la dipendenza dall' intensità provoca l'allungamento della curva di mascheramento con
l'aumentare del livello, tale fenomeno è dovuto alla saturazione delle cellule recettrici dell'orecchio
interno.




               Fig 1.2.10 Variazione della forma della curva di mascheramento in funzione
                       dell'intensità del tono mascherante




                                                                                              Pag. 1.2-10
Capitolo 1.2 "La percezione del suono" Davide Cilano



1.2.4.2.         ... Nel Tempo
Nel dominio del tempo un tono viene mascherato notevolmente dalle sollecitazioni sonore temporali
precedenti (specialmente per quelle più immediate); ed in modo molto meno evidente e motivabile per
quelle immediatamente future (per cui non è ancora stata trovata una valida spiegazione), tale
fenomeno è noto come mascheramento temporale e si distingue in simultaneo e NON simultaneo.

   Un esempio della condizione di simultaneità potrebbe essere il caso in cui noi abbiamo una
   conversazione con un vicino mentre passa un treno. La nostra conversazione risulta disturbata e
   per poterla continuare è necessario "alzare la voce" per produrre più potenza e quindi una
   maggiore sonorità. Nella musica si ha un comportamento analogo. I differenti strumenti si
   possono mascherare tra di loro, gli strumenti più tenui possono essere uditi solo quando non sono
   presenti quelli più forti.

NON SIMULTANEO
Fenomeno secondo cui un tono "copre" quelli vicini nel tempo sia passato che futuro.
La soppressione nel tempo futuro può essere ben spiegata dagli studi sulle proprietà meccaniche degli
apparati dell'udito interni mentre non è ancora stata trovata una valida spiegazione (sono state solo
fatte delle supposizioni) del fenomeno del pre-mascheramento ; vale a dire che un tono maschera non
solo i suoni che seguono ma anche quelli che lo precedono.

La supposizione più avvalorata è che a livello neurale venga compiuta una analisi del suono, come se
fosse ritardato e analizzato prima di trasmetterne gli impulsi al cervello per la vera e propria
"audizione".




              Fig 1.2.11 Rappresentazione schematica del fenomeno di mascheramento non
                      simultaneo nel dominio del tempo, si può notare che il pre-
                      mascheramento ha effetti minori del post-mascheramento.


SIMULTANEO
Riguardo al mascheramento simultaneo da esperimenti su animali si è trovato che ha luogo
nell'orecchio interno, prima della trasmissione a livello neurale.
La curva di mascheramento è stata trovata anche da esperimenti comparativi servendosi di toni puri
fissi.
Il mascheramento simultaneo ha come effetto l'aumento della soglia di mascheramento ad una
composizione delle due che può essere ottenuto in modo approssimato, per toni puri, come somma
energetica secondo la :

                                                    1/α
                                        æ n    αö
                               M tot   =ç Mi                    con a<2
                                        è i =1

e dove Mi è la maschera dell' i-esimo impulso simultaneo.

Tale formula è valida sia per mascheramenti simultanei che per i non simultanei e il parametro α
assume valori diversi nel dominio temporale e frequenziale.




                                                                                         Pag. 1.2-11
Capitolo 1.2 "La percezione del suono" Davide Cilano



1.2.4.3.          ... Nel Tempo e Frequenza




              Fig 1.2.12 Rappresentazione schematica del fenomeno di mascheramento di un
                      tono puro nel dominio della frequenza.

Una prima approssimazione delle curve di salita e discesa con delle rette è data da [Kapust]:

              S1 = 31dB / Bark


                    æ         æ 230 ö                  ö
              S 2 = ç 22 + minç
                    ç         ç f ,10 ÷ − 0,2 LivellodB dB / Bark
                                      ÷
                    è         è




              Fig 1.2.13. Rappresentazione schematica del mascheramento temporale di un
                      impulso di durata finita.
                      Una espressione della formula di decadimento di post-masking viene data
                      da Zwicker :


                                              1       æ      t        ö
                                D = 1.0 −        arctgç
                                                      ç 13.2(d )−0.25
                                            1.35      è
                     Dove t è il tempo trascorso da quando il segnale è cessato e d è la durata
                                                 del mascherante.

Il post-masking si verifica come rilascio graduale degli effetti di mascheramento ovvero il
mascherante non si arresta subito dopo il suo manifestarsi ma decresce gradatamente.
L'effetto di post-masking dipende in modo non lineare anche dalla durata del mascherante.
Gli effetti di durata e di mascheramento possono essere ben definiti in due dimensioni (Bark,
loudness)




                                                                                            Pag. 1.2-12
Capitolo 1.2 "La percezione del suono" Davide Cilano




               Fig 1.2.14. Rappresentazione del fenomeno di mascheramento nei domini di
                       tempo e frequenza.

Non solo il mascheramento può essere descritto più semplicemente in termini di Bark ma anche molti
altri effetti, come la tonalità, le differenze di frequenza udibili distintamente e la crescita dell'intensità
sonora in funzione della larghezza di banda.


1.2.5. PERCEZIONE DI VARIAZIONI DI INTENSITÀ
Le variazioni in intensità vengono percepite solo se superiori a 5 dB (più di un raddoppio dell'energia
sonora1).
La sensazione di raddoppio dell'intensità soggettiva corrisponde ad un incremento di 10 dB
(corrispondente a un'amplificazione dell'energia iniziale di 10 volte !).

L'amplificazione della sorgente (N) per ottenere un dato incremento in deciBel è:
                                        dBincremento = 10 Log10 N


                                             N = 10 10 dBincremento




   1Si ricorda che un raddoppio dell'energia sonora corrisponde
       all'aumento di 3 dB .
        Con 6 dB di aumento, si ha un quadruplicamento dell'energia
       sonora.


                                                                                             Pag. 1.2-13
Capitolo 1.3
                                              L'AUDIO DIGITALE
   1.3.1. INTRODUZIONE ...........................................................................................................................1
   1.3.2. IL CAMPIONAMENTO..................................................................................................................2
   1.3.3. LA QUANTIZZAZIONE .................................................................................................................3
   1.3.4. L'SNR (Signal to Noise Ratio) ........................................................................................................3
   1.3.5. LA CODIFICA PCM (Pulse Code Modulation).............................................................................4
   1.3.6. COMPRESSIONE DI SEGNALI CON LEGGE A_LAW E m_LAW............................................5
   1.3.7. I SISTEMI PCM NELLA REGISTRAZIONE DIGITALE ...............................................................6
   1.3.8. I SISTEMI PCM NELLA RIPRODUZIONE DIGITALE ................................................................8
   1.3.9. PARAMETRI PER LA QUALITÀ DI UN SISTEMA AUDIO .........................................................10
   1.3.10.I SISTEMI DI COMPRESSIONE NELLA CATENA PCM ............................................................11


Il presente capitolo è una introduzione alle tecniche ed ai sistemi per la memorizzazione e
riproduzione di audio digitale.
Vengono descritti i dispositivi necessari in una catena di registrazione di digitale per meglio chiarire
dove e perché è utile una codifica in formato compresso quale la codifica MPEG_Audio.


1.3.1. INTRODUZIONE
Il termine "Audio digitale" indica la tecnica usata per la registrazione, la memorizzazione o la
trasmissione dell'informazione sonora, che dovrà venire riportata in analogico per permetterne
l'ascolto.
Il suono infatti è per sua natura analogico e può essere prodotto e percepito solo sotto forma di
variazioni di pressione; una sua rappresentazione (codifica) può invece essere fatta in forma analogica
o digitale.
Il termine digitale indica dunque solo un modo per "trasportare" (trasmettere o registrare) il segnale:




                 Fig. 1.3.1 L'audio digitale è una alternativa alla forma analogica per la rappresentazione
                         dell'informazione sonora, si tenga presente che un suono può essere prodotto e percepito
                         solo sotto forma analogica.


L'introduzione dell'audio digitale ha cambiato il modo di riprodurre ed ascoltare il "suono", l'audio
digitale è infatti ben lontano come fedeltà di riproduzione dall'audio analogico, la qualità di
Capitolo 1.3 "L'audio Digitale" Davide Cilano



riproduzione ottenibile con la tecnica digitale è notevolmente superiore alla analogica in quanto in
generale l'accuratezza dei sistemi è una funzione del rumore introdotto dal sistema stesso; nei sistemi
analogici tale rumore non è facilmente controllabile perché è difficile ottenere componenti con
tolleranze inferiori all'1% [Malcangi].
In digitale invece adottando la necessaria precisione numerica è possibile ottenere qualsiasi
accuratezza che rimane (al contrario dell'analogico) invariante nel tempo.
Altra caratteristica dei sistemi digitali è la possibilità di essere programmati ottenendo una maggior
versatilità rispetto agli analogici.

Si fa notare che il preferire l'audio digitale o analogico sia solo una scelta dettata dalle sensazioni
soggettive che si hanno ascoltando l'audio in una o l'altra forma.


1.3.2. IL CAMPIONAMENTO
I principi base per la codifica digitale di un segnale analogico sono il campionamento e la
quantizzazione .
Il segnale sonoro può essere rappresentato in un diagramma tempo - intensità; dove entrambi i
parametri variano in un'insieme continuo di valori.
L'operazione di campionamento consiste nel rilevare l'ampiezza del segnale solo ad intervalli discreti
equiampi attraverso la discretizzazione dell'asse dei tempi


                     Intensità
                             B



                             A
                                                                                    Tempo
                     Intensità
                             B



                             A
                                                                                     Tempo
               Fig 1.3.2 Campionamento di un segnale analogico.
                       La scala dei tempi viene discretizzata e si valuta l'intensità del segnale solo in
                       un numero finito di istanti temporali. Ciò che si ottiene è la rappresentazione
                       campionata del segnale che ha una forma a gradini di valori continui
                       nell'intervallo [A,B].

Il campionamento è un processo che non introduce perdita di informazione se si pone riguardo al fatto
che le uniche variazioni che possono sfuggire sono quelle più rapide del campionatore stesso.
Questa osservazione è l'enunciato del teorema di Nyquist:


Teorema di NYQUIST o del CAMPIONAMENTO :

Non si perde informazione nella rappresentazione discreta di un segnale continuo se la frequenza
massima contenuta nel segnale è inferiore o al più uguale alla metà della frequenza di
campionamento.


Se la frequenza di campionamento è inferiore al doppio della banda del segnale, si verifica il
fenomeno di aliasing generato da una intermodulazione tra il segnale stesso e il segnale di
campionamento.
Da un punto di vista frequenziale questo effetto produce un ribaltamento di spettro che crea una
porzione di spettro fittizio nella banda del segnale.




                                                                                                    Pag. 1.3-2
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio
Mpeg Audio Codifiche Percettive - Compressione Audio

Mais conteúdo relacionado

Semelhante a Mpeg Audio Codifiche Percettive - Compressione Audio

NunzioMeliTesi-up1
NunzioMeliTesi-up1NunzioMeliTesi-up1
NunzioMeliTesi-up1Nunzio Meli
 
Sviluppo del sistema di controllo dell'assetto di un quadricottero con proces...
Sviluppo del sistema di controllo dell'assetto di un quadricottero con proces...Sviluppo del sistema di controllo dell'assetto di un quadricottero con proces...
Sviluppo del sistema di controllo dell'assetto di un quadricottero con proces...Andrea Gulberti
 
Algoritmo probabilistico di tipo montecarlo per il list decoding elaborato
Algoritmo probabilistico di tipo montecarlo per il list decoding   elaboratoAlgoritmo probabilistico di tipo montecarlo per il list decoding   elaborato
Algoritmo probabilistico di tipo montecarlo per il list decoding elaboratodanielenicassio
 
Analisi e prototipazione di un sistema di streaming per la localizzazione in ...
Analisi e prototipazione di un sistema di streaming per la localizzazione in ...Analisi e prototipazione di un sistema di streaming per la localizzazione in ...
Analisi e prototipazione di un sistema di streaming per la localizzazione in ...TiborRacman
 
Digitalizzazione audio-dal segnale analogico allo streaming
Digitalizzazione audio-dal segnale analogico allo streamingDigitalizzazione audio-dal segnale analogico allo streaming
Digitalizzazione audio-dal segnale analogico allo streamingCory sky
 
a1dddf507ce838f51f5349d2b2c25241
a1dddf507ce838f51f5349d2b2c25241a1dddf507ce838f51f5349d2b2c25241
a1dddf507ce838f51f5349d2b2c25241Nunzio Meli
 
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...michael_mozzon
 
Realizzazione di un modello di router ottico in ambiente open source.
Realizzazione di un modello di router ottico in ambiente open source.Realizzazione di un modello di router ottico in ambiente open source.
Realizzazione di un modello di router ottico in ambiente open source.Raul Cafini
 
Publish/Subscribe EDI with Content-Based Routing
Publish/Subscribe EDI with Content-Based RoutingPublish/Subscribe EDI with Content-Based Routing
Publish/Subscribe EDI with Content-Based RoutingNicola Mezzetti
 
Progettazione e Sviluppo di un Sistema per Migliorare il Codice Generato da u...
Progettazione e Sviluppo di un Sistema per Migliorare il Codice Generato da u...Progettazione e Sviluppo di un Sistema per Migliorare il Codice Generato da u...
Progettazione e Sviluppo di un Sistema per Migliorare il Codice Generato da u...DamianoRavalico
 
Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...
Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...
Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...shadykal
 
Studio del limite superiore del tasso di errore nei codici LDPC con relazione...
Studio del limite superiore del tasso di errore nei codici LDPC con relazione...Studio del limite superiore del tasso di errore nei codici LDPC con relazione...
Studio del limite superiore del tasso di errore nei codici LDPC con relazione...FlavioEllero
 
Lo standard MPEG-7 per la definizione di metadati di oggetti multimediali
Lo standard MPEG-7 per la definizione di metadati di oggetti multimedialiLo standard MPEG-7 per la definizione di metadati di oggetti multimediali
Lo standard MPEG-7 per la definizione di metadati di oggetti multimedialidelfinostefano
 

Semelhante a Mpeg Audio Codifiche Percettive - Compressione Audio (20)

Lezioni 2009
Lezioni 2009Lezioni 2009
Lezioni 2009
 
NunzioMeliTesi-up1
NunzioMeliTesi-up1NunzioMeliTesi-up1
NunzioMeliTesi-up1
 
Sviluppo del sistema di controllo dell'assetto di un quadricottero con proces...
Sviluppo del sistema di controllo dell'assetto di un quadricottero con proces...Sviluppo del sistema di controllo dell'assetto di un quadricottero con proces...
Sviluppo del sistema di controllo dell'assetto di un quadricottero con proces...
 
Andrea_Gangemi_tesi
Andrea_Gangemi_tesiAndrea_Gangemi_tesi
Andrea_Gangemi_tesi
 
Algoritmo probabilistico di tipo montecarlo per il list decoding elaborato
Algoritmo probabilistico di tipo montecarlo per il list decoding   elaboratoAlgoritmo probabilistico di tipo montecarlo per il list decoding   elaborato
Algoritmo probabilistico di tipo montecarlo per il list decoding elaborato
 
Cisco voice over ip - Scheda corso LEN
Cisco voice over ip - Scheda corso LENCisco voice over ip - Scheda corso LEN
Cisco voice over ip - Scheda corso LEN
 
Tesi Federico Ruzzier
Tesi Federico RuzzierTesi Federico Ruzzier
Tesi Federico Ruzzier
 
Analisi e prototipazione di un sistema di streaming per la localizzazione in ...
Analisi e prototipazione di un sistema di streaming per la localizzazione in ...Analisi e prototipazione di un sistema di streaming per la localizzazione in ...
Analisi e prototipazione di un sistema di streaming per la localizzazione in ...
 
Digitalizzazione audio-dal segnale analogico allo streaming
Digitalizzazione audio-dal segnale analogico allo streamingDigitalizzazione audio-dal segnale analogico allo streaming
Digitalizzazione audio-dal segnale analogico allo streaming
 
a1dddf507ce838f51f5349d2b2c25241
a1dddf507ce838f51f5349d2b2c25241a1dddf507ce838f51f5349d2b2c25241
a1dddf507ce838f51f5349d2b2c25241
 
Chiarimenti ipsos su sistema encoding e meter sw media cell
Chiarimenti ipsos su sistema encoding e meter sw media cellChiarimenti ipsos su sistema encoding e meter sw media cell
Chiarimenti ipsos su sistema encoding e meter sw media cell
 
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
Implementazione di protocolli e simulatori MATLAB per lo sviluppo del livello...
 
Realizzazione di un modello di router ottico in ambiente open source.
Realizzazione di un modello di router ottico in ambiente open source.Realizzazione di un modello di router ottico in ambiente open source.
Realizzazione di un modello di router ottico in ambiente open source.
 
Presentazione_2015
Presentazione_2015Presentazione_2015
Presentazione_2015
 
Publish/Subscribe EDI with Content-Based Routing
Publish/Subscribe EDI with Content-Based RoutingPublish/Subscribe EDI with Content-Based Routing
Publish/Subscribe EDI with Content-Based Routing
 
Progettazione e Sviluppo di un Sistema per Migliorare il Codice Generato da u...
Progettazione e Sviluppo di un Sistema per Migliorare il Codice Generato da u...Progettazione e Sviluppo di un Sistema per Migliorare il Codice Generato da u...
Progettazione e Sviluppo di un Sistema per Migliorare il Codice Generato da u...
 
Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...
Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...
Sviluppo di un sistema a microonde finalizzato alla misura del livello dell'a...
 
Studio del limite superiore del tasso di errore nei codici LDPC con relazione...
Studio del limite superiore del tasso di errore nei codici LDPC con relazione...Studio del limite superiore del tasso di errore nei codici LDPC con relazione...
Studio del limite superiore del tasso di errore nei codici LDPC con relazione...
 
Lo standard MPEG-7 per la definizione di metadati di oggetti multimediali
Lo standard MPEG-7 per la definizione di metadati di oggetti multimedialiLo standard MPEG-7 per la definizione di metadati di oggetti multimediali
Lo standard MPEG-7 per la definizione di metadati di oggetti multimediali
 
Standard
StandardStandard
Standard
 

Último

Esame finale - riunione genitori 2024.pptx
Esame finale - riunione genitori 2024.pptxEsame finale - riunione genitori 2024.pptx
Esame finale - riunione genitori 2024.pptxfedericodellacosta2
 
La produzione e la gestione degli Open Data
La produzione e la gestione degli Open DataLa produzione e la gestione degli Open Data
La produzione e la gestione degli Open DataGianluigi Cogo
 
La seconda guerra mondiale per licei e scuole medie
La seconda guerra mondiale per licei e scuole medieLa seconda guerra mondiale per licei e scuole medie
La seconda guerra mondiale per licei e scuole medieVincenzoPantalena1
 
lezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldilezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldivaleriodinoia35
 
Ticonzero news 148.pdf aprile 2024 Terza cultura
Ticonzero news 148.pdf aprile 2024 Terza culturaTiconzero news 148.pdf aprile 2024 Terza cultura
Ticonzero news 148.pdf aprile 2024 Terza culturaPierLuigi Albini
 
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla CresimaIL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla CresimaRafael Figueredo
 
Esperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superioreEsperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superiorevaleriodinoia35
 
Storia dell’Inghilterra nell’Età Moderna.pptx
Storia dell’Inghilterra nell’Età Moderna.pptxStoria dell’Inghilterra nell’Età Moderna.pptx
Storia dell’Inghilterra nell’Età Moderna.pptxOrianaOcchino
 

Último (8)

Esame finale - riunione genitori 2024.pptx
Esame finale - riunione genitori 2024.pptxEsame finale - riunione genitori 2024.pptx
Esame finale - riunione genitori 2024.pptx
 
La produzione e la gestione degli Open Data
La produzione e la gestione degli Open DataLa produzione e la gestione degli Open Data
La produzione e la gestione degli Open Data
 
La seconda guerra mondiale per licei e scuole medie
La seconda guerra mondiale per licei e scuole medieLa seconda guerra mondiale per licei e scuole medie
La seconda guerra mondiale per licei e scuole medie
 
lezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldilezione di fisica_I moti nel piano_Amaldi
lezione di fisica_I moti nel piano_Amaldi
 
Ticonzero news 148.pdf aprile 2024 Terza cultura
Ticonzero news 148.pdf aprile 2024 Terza culturaTiconzero news 148.pdf aprile 2024 Terza cultura
Ticonzero news 148.pdf aprile 2024 Terza cultura
 
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla CresimaIL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
IL CHIAMATO ALLA CONVERSIONE - catechesi per candidati alla Cresima
 
Esperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superioreEsperimenti_laboratorio di fisica per la scuola superiore
Esperimenti_laboratorio di fisica per la scuola superiore
 
Storia dell’Inghilterra nell’Età Moderna.pptx
Storia dell’Inghilterra nell’Età Moderna.pptxStoria dell’Inghilterra nell’Età Moderna.pptx
Storia dell’Inghilterra nell’Età Moderna.pptx
 

Mpeg Audio Codifiche Percettive - Compressione Audio

  • 1. MPEG Audio "Tecniche di manipolazione dell'informazione sonora compressa mediante codifica MUSICAM" Davide Cilano
  • 2. INTRODUZIONE Negli ultimi anni, con la diffusione dell'audio digitale (soprattutto grazie al Compact Disc), sono aumentate le esigenze degli ascoltatori in termini di fedeltà di riproduzione del suono. La percezione dei suoni è un fenomeno molto complesso in cui vengono coinvolti organi fisici ed aspetti psicologici. Proprio la dipendenza da fattori psicologici permette l'affinarsi delle capacità percettive degli ascoltatori e quindi l'aumentare della richiesta di qualità del suono. In campo digitale la qualità di un suono può essere mantenuta con una accurata rappresentazione che, se fatta con metodi tradizionali, porta inevitabilmente a grandi quantità di dati da memorizzare o trasmettere. Queste grandi quantità di dati possono essere gestite solo con apparecchiature altamente affidabili e dai costi proibitivi per la distribuzione su larga scala. Per fare un esempio basti pensare alla richiesta di 768 KBit/sec. per sequenze monofoniche della codifica PCM (Pulse Code Modulation) che, per essere distribuite su larga scala, hanno richiesto lo sviluppo del Compact Disc. La richiesta di alta qualità a basso costo ha indotto numerosi enti di ricerca allo studio di codifiche ottimizzate che permettano di ridurre le dimensioni della rappresentazione digitale. Tali ricerche, hanno individuato una possibile soluzione al problema applicando i risultati degli studi sul comportamento dell'apparato uditivo ed ottenendo la compressione sfruttando le capacità fisico- percettive dell'orecchio. Tra tutte le codifiche proposte si è distinta, per la sua flessibilità e qualità, il sistema MUSICAM (Masking pattern Universal Subband Integrated Coding And Multiplexing, 1992). La codifica MUSICAM ottiene, tramite una analisi psicoacustica del suono, la compressione delle informazioni necessarie per rappresentare segnali audio eliminando le componenti percettivamente irrilevanti e codificando quelle numericamente ridondanti. Tale operazione permette di conservare la qualità originaria del suono pur riducendo la quantità di dati di un fattore tipico di 1:8. La soppressione delle informazioni psicoacusticamente irrilevanti è possibile grazie alle recenti scoperte sul funzionamento dell'apparato uditivo umano, che hanno permesso la costruzione di modelli matematici implementabili in tempo reale, che approssimano le capacità acustico-percettive umane. Il modello percettivo partendo da una rappresentazione temporale del segnale audio, studia l'influenza tra toni mascheranti e toni mascherati nel dominio frequenziale, individuando le componenti del segnale percepibili, che sono le uniche informazioni essenziali da codificare. Il sistema MUSICAM è stato inizialmente progettato per il DAB (Digital Audio Broadcasting), una rete di distribuzione radiofonica via etere che dovrà sostituire le attuali trasmissioni FM. In seguito il MUSICAM è stato standardizzato a livello mondiale dall' ISO-IEC/ JCT1/ SC29/ WG11/ MPEG-Audio ed adottato per la distribuzione su supporti magnetici (DCC - Digital Compact Cassette - Philips) e televisiva (HDTV - Televisione ad alta definizione-). L'uso della codifica per la distribuzione radiofonica e televisiva ha fatto sorgere la richiesta di elaborare i segnali audio in tempo reale. Adottando la codifica MPEG le elaborazioni del segnale possono essere eseguite sui decodificati PCM oppure direttamente nella forma codificata, che è l'argomento trattato nei capitoli seguenti. L'elaborazione in forma PCM permette l'uso di tecniche e strumentazioni già disponibili sul mercato ma richiede l'operazione di decodifica che introduce il ritardo dei filtri ed una certa indeterminazione sui campioni ricostruiti.
  • 3. L'elaborazione direttamente nella forma compressa non richiede i processi di codifica e decodifica, riducendo la complessità computazionale dell'operazione e non introduce il ritardo intrinseco dei filtri. La richiesta di limitare il ritardo è indispensabile in molte applicazioni, ad esempio per l'aggiunta di contributi in tempo reale come il commento degli inviati di un telegiornale: il ritardo sul commento audio può comportare la mancata sincronizzazione con le immagini con effetti disturbanti nell'ascoltatore, anche da queste richieste è nato lo stimolo al lavoro di tesi. Lo studio di tecniche di elaborazione di segnali compressi viene esposto dopo aver richiamato i concetti alla base dei segnali audio sia fisici: capitolo 1.1 "Il fenomeno suono"; che psicoacustici: capitolo 1.2 "La percezione del suono". Si riportano le definizioni delle unità di misura fisiche e psicoacustiche ed i risultati di alcuni studi sulla percezione dei segnali audio da parte dell'apparato uditivo umano. Nel capitolo 1.3 "L'audio digitale" vengono riassunti i principi base della codifica digitale per segnali audio e si indica dove si collocano i sistemi di compressione nelle catene di registrazione e riproduzione. Dopo la parte introduttiva di richiami, i capitoli 2 "La codifica MPEG_Audio" e capitolo 3 "Sintassi della codifica MPEG_Audio" espongono dettagliatamente il principio di funzionamento e le specifiche sintattiche della codifica MUSICAM (alias MPEG layer II), tale capitolo è stato tratto dalle specifiche 11172 rev.3 di MPEG ma riorganizzato ed arricchito da spiegazioni per una esposizione più immediata. Il sistema di codifica come già detto si basa sui risultati del modello percettivo che calcola il valore (in dB) della soglia di mascheramento di porzioni del segnale. I modelli percettivi proposti da MPEG sono descritti al capitolo 4 "Modelli percettivi" esponendone dettagliatamente (data la loro importanza) le specifiche ed il funzionamento. Dal capitolo 5 "Introduzione alle Elaborazioni" comincia l'esposizione del lavoro di tesi vero e proprio, sfruttando definizioni, risultati e concetti esposti nei capitoli precedenti. Le tecniche di elaborazione dei segnali compressi vengono introdotte con alcune osservazioni sulla sintassi di codifica e affrontando il problema della valutazione dei risultati. La mancanza di modelli oggettivi affidabili, di valutazione della qualità audio codificata percettivamente, ha reso necessario lo studio di criteri per valutare i risultati delle elaborazioni. Nel capitolo 6 "Elaborazioni numeriche ", sono riportate le prime tecniche per l'elaborazione di segnali MUSICAM in modo numerico, con questi metodi anche se non si ottengono risultati soddisfacenti, si conferma la possibilità di elaborare i segnali compressi, ottenendo interessanti informazioni sui vincoli da imporre per ottenere elaborazioni sufficientemente accurate e quale è il comportamento della codifica. Comportamento che è stato studiato ed osservato sperimentalmente nel capitolo 7 "Comportamento codifica". Nel capitolo 8 "Elaborazioni psicoacustiche" si espongono le tecniche definite psicoacustiche che utilizzano i risultati del modello percettivo per elaborare una o più sequenze cercando di mantenere inalterata la qualità. Tali tecniche sono quelle che hanno dato i migliori risultati ma necessitano delle informazioni psicoacustiche che possono essere trasmesse in un canale separato oppure nella trama codificata, argomento affrontato nel capitolo 9 "Trasmissione MNR". Il capitolo 10 "Appunti sulla codifica" riporta una analisi delle regole sintattiche dello standard MUSICAM e si propone una possibile modifica della sintassi che permette una ulteriore compressione del segnale. Per la complessità della codifica (il cui sviluppo ha richiesto 360 anni-uomo) il lavoro di tesi potrebbe essere ulteriormente ampliato, studiando e raffinando i criteri di elaborazione individuati, approfondendo lo studio alla codifica multicanale (usata in HDTV), trovando una implementazione efficiente delle tecniche definite.
  • 4. INDICE Capitolo 1.1 IL FENOMENO "SUONO" 1.1.1. NATURA E DIFFUSIONE DEL SUONO ......................................................................................1 1.1.2. LE CARATTERISTICHE DEL SUONO .........................................................................................3 1.1.2.1. Ampiezza..........................................................................................................................3 1.1.2.1.1. DeciBel........................................................................................................4 1.1.2.2. Frequenza e Timbro .......................................................................................................5 1.1.3. LA DIVISIONE IN OTTAVE ..........................................................................................................7 1.1.4. IL RUMORE...................................................................................................................................8 1.1.5. COMPONENTI TONALI................................................................................................................9 Capitolo 1.2 LA PERCEZIONE DEL SUONO 1.2.1. ORECCHIO UMANO E SENSIBILITÀ IN FREQUENZA .............................................................1 1.2.2. LA PERCEZIONE ..........................................................................................................................4 1.2.3. UNITÀ DI MISURA PERCETTIVE................................................................................................4 1.2.3.1. Il Bark..............................................................................................................................4 1.2.3.2. Loudness..........................................................................................................................5 1.2.3.3. Il Phon.............................................................................................................................6 1.2.3.4. Il Sone..............................................................................................................................7 1.2.4. IL MASCHERAMENTO .................................................................................................................8 1.2.4.1. ... Nella Frequenza ..........................................................................................................9 1.2.4.2. ... Nel Tempo ...................................................................................................................11 1.2.4.3. ... Nel Tempo e Frequenza...............................................................................................12 1.2.5. PERCEZIONE DI VARIAZIONI DI INTENSITÀ ...........................................................................13 Capitolo 1.3
  • 5. L'AUDIO DIGITALE 1.3.1. INTRODUZIONE .........................................................................................................................1 1.3.2. IL CAMPIONAMENTO................................................................................................................2 1.3.3. LA QUANTIZZAZIONE ...............................................................................................................3 1.3.4. L'SNR (Signal to Noise Ratio) ......................................................................................................3 1.3.5. LA CODIFICA PCM (Pulse Code Modulation)...........................................................................4 1.3.6. COMPRESSIONE DI SEGNALI CON LEGGE A_LAW E µ_LAW...........................................5 1.3.7. I SISTEMI PCM NELLA REGISTRAZIONE DIGITALE .............................................................6 1.3.8. I SISTEMI PCM NELLA RIPRODUZIONE DIGITALE ..............................................................8 1.3.9. PARAMETRI PER LA QUALITÀ DI UN SISTEMA AUDIO .......................................................10 1.3.10. I SISTEMI DI COMPRESSIONE NELLA CATENA PCM ...........................................................11 Capitolo 2 LA CODIFICA MPEG_Audio 2.1. LE CODIFICHE COMPRESSE .....................................................................................................2 2.2. RIDONDANZA E IRRILEVANZA ..................................................................................................4 2.3. LA CODIFICA MPEG_Audio ........................................................................................................4 2.3.1. Introduzione ....................................................................................................................5 2.3.2. La Codifica e i FRAME ..................................................................................................6 2.3.3. La Rappresentazione frequenziale ..................................................................................7 2.3.4. Memorizzazione...............................................................................................................9 2.3.5. Decodifica .......................................................................................................................9 2.4. CARATTERISTICHE......................................................................................................................10 2.4.1. Layer ...............................................................................................................................10 2.4.2. Frequenze di Campionamento.........................................................................................11 2.4.3. Modalità ..........................................................................................................................11 2.4.4. Bitrate..............................................................................................................................13 2.5. STRUTTURE DATI Layer II .........................................................................................................14 2.5.1. Bit Allocation...................................................................................................................14 2.5.2. Fattori di Scala................................................................................................................16 2.5.3. SCFSI (Struttura Codifica Fattori di Scala su Intervalli) ...............................................17 2.5.4. I Campioni.......................................................................................................................17 2.5.5. Osservazioni Sulle Strutture Dati ....................................................................................18 2.6. LA SEQUENZA CODIFICATA Layer II ........................................................................................18 2.6.1. Il FRAME ........................................................................................................................19 2.6.2. L'HEADER ......................................................................................................................20 2.6.3. IL CRC [Cyclic Redundancy Code] ................................................................................23 2.6.4. I Dati_Ausiliari (Ancillary) ............................................................................................24 2.6.5. Sintassi ............................................................................................................................24 2.7. VALUTAZIONE DELLA CODIFICA .............................................................................................29 2.8. POSSIBILI APPLICAZIONI ..........................................................................................................31 2.9. UNA APPLICAZIONE :IL DAB.....................................................................................................32 2.9.1. Caratteristiche del DAB ..................................................................................................33 Capitolo 3
  • 6. SPECIFICHE TECNICHE MPEG_Audio l a y e r I I 3.1. INTRODUZIONE ...........................................................................................................................2 3.2. BIBLIOGRAFIA PER I RIFERIMENTI TECNICI:....................................................................2 3.3. GLOSSARIO TECNICO MPEG_Audio .........................................................................................2 3.4. IL PROCESSO DI CODIFICA Layer II.........................................................................................4 3.4.1. Diagramma di Flusso......................................................................................................7 3.4.2. Filtro Passa Alto in Ingresso...........................................................................................8 3.4.3. Banco di Filtri di Analisi.................................................................................................8 3.4.4. FFT (Fast Fourier Transform) ........................................................................................9 3.4.5. Modello Psicoacustico ....................................................................................................10 3.4.6. Codifica Fattori di Scala.................................................................................................10 3.4.7. Calcolo Struttura Codifica Fattori di Scala Su Intervalli ...............................................10 3.4.8. Allocazione Dinamica Bit................................................................................................11 3.4.8.1. Diagramma di Flusso .................................................................................14 3.4.9. Normalizzazione e Quantizzazione Campioni Frequenziali...........................................15 3.4.10. Protezione Errori ............................................................................................................16 3.5. IL PROCESSO DI DECODIFICA Layer II....................................................................................16 3.5.1. Diagramma di Flusso......................................................................................................17 3.5.2. Sincronizzazione Frame ..................................................................................................18 3.5.3. Decodifica Header ..........................................................................................................18 3.5.4. Decodifica CRC Errori....................................................................................................19 3.5.5. Decodifica Bit Allocation ................................................................................................19 3.5.6. Decodifica SCFSI ............................................................................................................19 3.5.7. Decodifica Fattori di Scala .............................................................................................19 3.5.8. Dequantizzazione Campioni............................................................................................20 3.5.9. Denormalizzazione Campioni .........................................................................................20 3.5.10. Filtro di Sintesi di Sottobanda.........................................................................................21 Capitolo 4 MODELLI PERCETTIVI 4.1. INTRODUZIONE............................................................................................................................1 4.2. MODELLO PSICOACUSTICO 1 ...................................................................................................2 4.2.1. ALGORITMO DI CALCOLO.............................................................................................2 4.2.1.1... FFT ................................................................................................................3 4.2.1.2... Determinazione Spl (livello segnale) .............................................................4 4.2.1.3... Confronto Soglia in Quiete (statica)..............................................................4 4.2.1.4... Identificazione delle Componenti Tonali e Non Tonali .................................4 4.2.1.4.1.... Massimo Locale .....................................................................5 4.2.1.4.2.... componenti Tonali..................................................................5 4.2.1.4.3.... componenti Non Tonali..........................................................6 4.2.1.5... Decimazione delle Componenti Tonali e Non Tonali ....................................7 4.2.1.6... Calcolo della Soglia di Mascheramento Individuale.....................................7 4.2.1.7... Calcolo della Soglia di Mascheramento Globale ..........................................9 4.2.1.8... Determinazione della Soglia Minima di Mascheramento..............................9 4.2.1.9... Calcolo del Rapporto Segnale-Maschera......................................................9 4.2.2 .Accuratezza del Modello....................................................................................................10 4.3. CENNI MODELLO PSICOACUSTICO 2.......................................................................................10 4.4. RELAZIONE TRA SMR, SNR E MNR.............................................................................................10 4.5. RISULTATI .....................................................................................................................................13
  • 7. Capitolo 5 INTRODUZIONE ALLE ELABORAZIONI 5.1. INTRODUZIONE ...........................................................................................................................1 5.2. POSSIBILI APPLICAZIONI ..........................................................................................................4 5.2.1. Modifica del Bitrate.........................................................................................................4 5.2.2. Sincronizzazione..............................................................................................................6 5.3. SEQUENZE AUDIO PER LE PROVE ...........................................................................................7 5.4. BITRATE USATI PER LE PROVE.................................................................................................8 5.5. TEMPI DI CO-DECODIFICA .......................................................................................................9 5.6. APPARECCHIATURE USATE IN ASCOLTO ...............................................................................9 5.7. VALUTAZIONE RISULTATI..........................................................................................................10 5.7.1. ... regole per valutazioni "oggettive" ..............................................................................12 5.7.2. Criteri di Confronto.........................................................................................................13 5.7.3. Valutazioni di Basso Livello............................................................................................14 5.7.3.1. .LBA e .RBA ................................................................................................15 5.7.3.2. .MNR :.........................................................................................................16 5.7.3.3. .SMR............................................................................................................17 5.7.3.4. .TAB ............................................................................................................18 5.7.4. Valutazioni di Alto Livello...............................................................................................18 5.8. RITARDO INTRODOTTO DAI FILTRI .........................................................................................20 5.9. NOTE SULL'ELABORAZIONE......................................................................................................21 5.9.1. Formule di Quantizzazione e Normalizzazione ...............................................................21 5.9.2. Calcolo Fattori di Scala ..................................................................................................21 5.9.3. Da Fattore di Scala a Intensità (dB) ...............................................................................22 5.9.4. Incremento Livelli per Segnali Quantizzati .....................................................................23 5.9.5. Normalizzazione Segnali Audio.......................................................................................23 5.9.6. Aliasing per Bande Soppresse.........................................................................................24 5.9.6.1. Bande Soppresse a Bassi Bitrate ................................................................25 Capitolo 6 ELABORAZIONI NUMERICHE 6.1. FORMA NUMERICA DEL FRAME...............................................................................................1 6.2. PROBLEMI AFFRONTATI............................................................................................................5 6.3. SCHEMA ELABORAZIONE ..........................................................................................................5 6.4. DIFFICOLTÀ DI UNA ANALISI PSICOACUSTICA.....................................................................6 6.5. MPEG E IL JOINT_STEREO.........................................................................................................7 6.6. MODIFICA E COSTRUZIONE DELLA BIT_ALLOCATION........................................................8 6.6.1. Modifica Bit_Allocation:.................................................................................................8 6.6.2. Costruzione Bit_Allocation: ............................................................................................9 6.7. ELABORAZIONI NUMERICHE ....................................................................................................9
  • 8. Capitolo 7 COMPORTAMENTO CODIFICA 7.1. CALCOLO TEORICO INDETERMINAZIONE MEDIA ................................................................2 7.1.1. Indeterminazione sui campioni di sottobanda.................................................................2 7.1.2. Indeterminazione sui Fattori di scala..............................................................................4 7.1.3. Indeterminazione raggruppamento Fattori di Scala .......................................................4 7.1.4. Conclusioni......................................................................................................................5 7.2. EFFETTI DELLA FASE.................................................................................................................6 7.2.1. Risultati Sperimentali ......................................................................................................6 7.2.2. Algoritmo.........................................................................................................................7 7.2.3. Grafici .............................................................................................................................7 7.2.4. Analisi Risultati ...............................................................................................................11 7.3. CO-DECODIFICHE IN CASCATA SENZA SFASAMENTO .........................................................13 7.3.1. Effetti delle co-decodifiche..............................................................................................13 7.3.2. Risultati Sperimentali ......................................................................................................13 7.3.3. Algoritmo.........................................................................................................................14 7.3.4. Grafici .............................................................................................................................14 7.3.5. Analisi Risultati ...............................................................................................................18 7.4. ANALISI CO-DECODIFICHE IN CASCATA SFASATE ...............................................................20 7.4.1. Algoritmo.........................................................................................................................20 7.4.2. Grafici .............................................................................................................................20 7.4.3. Analisi Risultati ...............................................................................................................24 Capitolo 8 ELABORAZIONI PSICOACUSTICHE 8.1. ENTROPIA MNR = ENTROPIA SMR ...........................................................................................1 8.2. TRASMISSIONE MNR IN UN CANALE SEPARATO ....................................................................2 8.3. MODIFICA BITRATE ....................................................................................................................3 8.4. MIXING SEQUENZE .....................................................................................................................3 8.4.1. Studio Mascheramento ....................................................................................................4 8.4.2. Applicazione alle Elaborazioni MPEG ...........................................................................5 8.4.3. Stima Livello di Mascheramento .....................................................................................5 8.4.4. Mascheramento tra Bande adiacenti...............................................................................8 8.4.5. Corrispondenza Bande - Bark.........................................................................................9 8.4.6. Applicazione Formule di Pendenza.................................................................................11 8.4.7. Localizzazione Mascheranti e loro intensità ...................................................................16 8.4.8. Confronto con la Soglia Statica ......................................................................................17 8.4.9. Algoritmo.........................................................................................................................19 8.5. SINCRONIZZAZIONE....................................................................................................................21 8.5.1. Studio del Problema ........................................................................................................21 8.5.2. Rappresentazione Grafica ...............................................................................................22
  • 9. Capitolo 9 TRASMISSIONE MNR 9.1. CANALE PER MEMORIZZARE L' MNR........................................................................................1 9.2. STIMA E TRASMISSIONE ............................................................................................................3 9.3. STIMA SMR....................................................................................................................................4 9.3.1. Valore di Riferimento ......................................................................................................5 9.4. TRASMISSIONE MNR ...................................................................................................................5 9.5. UNA TECNICA IBRIDA.................................................................................................................6 9.6. USO DEI PAD................................................................................................................................8 Capitolo 10 APPUNTI SULLA CODIFICA 10.1. SOTTOBANDE ALLOCATE ..........................................................................................................1 10.1.1. Analisi Occupazione Canale ...........................................................................................2 10.1.2. Tabella Guadagni............................................................................................................3 10.1.3. Proposta Nuova Sintassi .................................................................................................5 10.2. CAMPIONI NON SIGNIFICATIVI ................................................................................................5 10.2.1. Risparmio Bit...................................................................................................................7 10.2.2. Algoritmo.........................................................................................................................8 Appendice A IL SOFTWARE MPEG (versione 3.5) A.1. MODULI E LIBRERIE .....................................................................................................................1 A.2. AUTORI............................................................................................................................................2 A.3. SCOPO DISTRIBUZIONE ...............................................................................................................3 A.4. DESCRIZIONE SORGENTI .............................................................................................................5 A.5. STRUTTURE DATI ..........................................................................................................................5 A.6. MACRODEFINIZIONI .....................................................................................................................9 A.7. VARIABILI GLOBALI ......................................................................................................................9 A.8. FUNZIONI........................................................................................................................................10 Appendice B
  • 10. ANALISI DEL SOFTWARE B.1. INTRODUZIONE ............................................................................................................................1 B.2. PROCEDURA DI ALLOCAZIONE .................................................................................................1 B.3. DIVERSA MAPPATURA CAMPIONI .............................................................................................6 B.4. INVERSIONE MSB CAMPIONI FREQUENZIALI .........................................................................10 B.5. SHORT PCM : HI ⇔ LO ...............................................................................................................11 B.6. DIAGRAMMA CODIFICATORE ....................................................................................................11 B.7. DIAGRAMMA DECODIFICATORE...............................................................................................13 Appendice C SOFTWARE DI POST_PRODUZIONE C.1. SCOPO DELLE FUNZIONI ..........................................................................................................1 C.2. SORGENTI LETTURA/SCRITTURA FRAME................................................................................2 C.3. SORGENTI CONTEGGIO BIT ......................................................................................................5 C.4. SORGENTI TRASFORMAZIONE IN DECIBEL............................................................................6
  • 11. Capitolo 1.1 IL FENOMENO "SUONO" 1.1.1. NATURA E DIFFUSIONE DEL SUONO ......................................................................................1 1.1.2. LE CARATTERISTICHE DEL SUONO .........................................................................................3 1.1.2.1. Ampiezza..........................................................................................................................3 1.1.2.1.1. DeciBel........................................................................................................4 1.1.2.2. Frequenza e Timbro .......................................................................................................5 1.1.3. LA DIVISIONE IN OTTAVE ..........................................................................................................7 1.1.4. IL RUMORE...................................................................................................................................8 1.1.5. COMPONENTI TONALI................................................................................................................9 Il capitolo riporta una sintesi dei concetti base e delle caratteristiche fisiche del "suono". Vengono riportate alcune definizioni ed unità di misura che saranno usate in seguito per la descrizione del sistema di compressione dell'audio MPEG_Audio1. 1.1.1. NATURA E DIFFUSIONE DEL SUONO Il suono è un fenomeno ondulatorio prodotto da movimenti vibratori di un corpo (detto sorgente) e si diffonde con perturbazioni di pressione in un mezzo solido, liquido o gassoso. Le molecole del mezzo propagano il disturbo compiendo degli spostamenti lungo la direzione di propagazione . Tutti i movimenti vibratori con una frequenza che rientra nell' intervallo udibile dall'uomo sono definiti suoni. La frequenza è definita come l'inverso del periodo ovvero del tempo di ripetizione di un fenomeno periodico. La sua unità di misura è l'Hertz, indicato con Hz, ed esprime il numero di periodi compiuti dal segnale in un secondo: 1 f = T SECONDI PERIODO T Fig. 1.1.1 Periodo di un onda sinusoidale 1MPEG : (Moving Pictures Expert Group) ha definito le specifiche di una codifica che ottiene la compressione dell'audio digitale ovvero la riduzione del numero di simboli usati.
  • 12. Capitolo 1.1 "Il fenomeno suono " Davide Cilano Le frequenze di vibrazione percepite dall'uomo come suoni coprono l'intervallo tra 20 e 20000 Hz, le frequenze al di sotto dei 20 Hertz non possono essere udite e sono percepite come vibrazioni, quelle sopra i 20000 Hz sono invece dette ultrasuoni. INTERVALLO DI FREQUENZA FENOMENO PERCEPITO Hz 0 ... 20 Vibrazioni 20 ... 20000 Suoni 20000 ... 40000 Ultrasuoni Tab. 1.1.1 Corrispondenza tra frequenze di fenomeni fisici e percezione umana. Per altri esseri viventi le frequenze udibili possono variare notevolmente, come ad esempio per il cane (20 : 30000Hz) o il pipistrello (20 : 90000 Hz). Il fenomeno acustico dal punto di vista fisico coinvolge sempre tre elementi: .... la sorgente corpo vibrante .... il mezzo qualsiasi mezzo elastico .... il ricevitore l'apparato uditivo La sorgente genera il suono, il mezzo lo trasmette ed il ricevitore percepisce le variazioni di pressione. In generale le sorgenti sonore possono essere raggruppate in [Lazzarin]: .. Corpi solidi oscillanti (strumenti a corda, Diaframmi per altoparlanti o strumenti a percussione) .. Colonne d'aria oscillanti (strumenti a fiato, organi) .. Corpi in movimento rapido (eliche , fruste) .. Gas rapidamente fuoriuscenti (razzi, reattori) .. Incrementi rapidi di pressione (detonazioni) La voce umana è una complessa combinazione dei primi due meccanismi. Nelle applicazioni ingegneristiche il mezzo o canale di trasmissione può comprendere apparecchiature per la trasmissione sotto altre forme energetiche come ad esempio la distribuzione radiofonica che avviene nell'etere sotto forma di onde elettromagnetiche. Indipendentemente dalla forma di trasmissione un suono può essere percepito e generato solo sotto forma di variazioni di pressione. Trasformazione Trasformazione Sorgente in altra forma Trasmissione in variazioni energetica di pressione Fig. 1.1.2 I suoni possono essere prodotti solo sotto forma di variazioni di pressione così come l' uomo può percepire i suoni solo come variazioni di pressione. La trasmissione dei segnali sonori può invece avvenire anche sotto altre forme energetiche. Pag. 1.1-2
  • 13. Capitolo 1.1 "Il fenomeno suono " Davide Cilano 1.1.2. LE CARATTERISTICHE DEL SUONO Il suono è un particolare tipo di segnale che può essere rilevato dall'apparato uditivo umano ed è caratterizzato da : ... intensità o ampiezza ... acutezza o frequenza ... timbro carattere che distingue lo stesso suono generato da sorgenti diverse 1.1.2.1. Ampiezza È una delle caratteristiche fondamentali del segnale sonoro e può essere espressa con diverse unità di misura come ad esempio potenza, intensità o pressione sonora. Il massimo intervallo entro cui variano le ampiezze del segnale è detto DINAMICA o INTERVALLO DI DINAMICA del sistema. Alcune misure di ampiezza sono: Potenza sonora (P) è l'energia totale emessa dalle sorgente nell'unità di tempo e si misura in Watt. Pressione sonora (p) è la variazione di pressione prodotta dal fenomeno sonoro rispetto alla quiete e può assumere valori sia positivi che negativi e si misura in BAR o Newton/m2 . Intensità sonora (I) è il flusso di energia trasmesso attraverso un'area di sezione unitaria perpendicolare alla direzione di propagazione del suono si misura in Watt/m2. La relazione tra pressione sonora (p) e potenza sonora (P) è [Cosa]: Pρc p= [1.1.1] 4 πr 2 dove r è la distanza, ρ è l'indice di densità del mezzo e c è la velocità di propagazione del suono nel mezzo2. La relazione tra intensità sonora (I) e potenza sonora (P) è [Lazzarin]: P I= [1.1.2] 4 πr 2 dove r indica la distanza tra sorgente e ricevitore. Di seguito è riportata una tabella con alcuni valori tipici di potenza sonora: 2Per la propagazione nell'aria la velocità del suono dipende fortemente dalla temperatura (t) secondo la formula approssimata [Lazzarin]: c = 331, 4 + 0 , 6 t ( ° C ) m / sec. Pag. 1.1-3
  • 14. Capitolo 1.1 "Il fenomeno suono " Davide Cilano FENOMENO POTENZA SONORA [WATT] Aereo al decollo 100 Martello pneumatico 1 Automobile in corsa 0,1 Ventilatore industriale 0,01 Voce forte 0,001 Lavastoviglie 0,0001 Piccolo ventilatore 0,00001 Sussurro 0,000000001 Tab 1.1.2 Alcuni valori di potenza sonora espressi in Watt [Lazzarin] Per misurare l'ampiezza di segnali audio in un intervallo temporale si può fare riferimento al massimo valore assunto dal segnale (come pressione, potenza o intensità) detto valore di picco (peak) che rappresenta il livello massimo trattabile dal sistema. Il valore di picco è però una misura ingegneristica che poco si adatta alle caratteristiche percettive dell'uomo in quanto il segnale può raggiungere tale valore solo in brevi istanti e rimanere più basso nella maggior parte dell'intervallo di ascolto. Una misura più rappresentativa potrebbe essere il valore medio dell'ampiezza dell'onda sonora sullo stesso intervallo, anche tale misura è però poco significativa in quanto i risultati di alcuni studi indicano che l'orecchio è maggiormente sensibile al segnale integrato su brevi periodi temporali (tipicamente 0.25 secondi) ed è fortemente dipendente dalla frequenza del segnale, segue quindi che le tradizionali misure fisiche non si prestano ad un dimensionamento valido dei fenomeni acustici così come sono percepiti e bisogna ricorrere ad unità di misura 'ad hoc' come il deciBel. 1.1.2.1.1. DeciBel Il grande intervallo di potenze sonore udibili è evidenziato dalla Tab 1.1.1 che si estende in un rapporto 1:1.000.000.000 così come i valori in pressione sonora che variano da 2 x 10-4µbar a 200µ bar in un rapporto 1:1.000.000. Per evitare di dover usare numeri troppo grandi è stata proposta una misura logaritmica della potenza sonora: il BEL, che, tra l'altro, si adatta perfettamente alle caratteristiche percettive dell'orecchio umano. Il BEL è definito come il logaritmo in base 10 del rapporto di due quantità con le stesse caratteristiche dimensionali, cioè è adimensionale e esprime un raffronto tra due valori: quello da misurare ed un livello di riferimento. Tenendo presente le [1.1.1] e [1.1.2] il BEL viene definito come: 2 æ p ö I BEL = Log 10 ç = Log 10 [1.1.3] çp I rif è rif Per il nostro scopo però il BEL è ancora una misura troppo grande e per questo viene diviso in DECIBEL. 2 æ p ö p I DECIBEL = 10 Log 10 ç = 20 Log 10 = 10 Log 10 [1.1.4] çp p rif I rif è rif Il valore di riferimento (Irif , prif) può essere fissato arbitrariamente (in quanto il BEL esprime solo la differenza di livelli) e nel caso si usi il valore della minima intensità udibile di IRif=10-12 W/m2 o della minima pressione rilevabile di 2x10-5N/m2 prende il nome di dB SPL (Sound Pressure Level o Livello di pressione sonora). Il dB è in tal modo una misura appropriata per esprimere intensità sonore , ad esempio le intensità della Tab 1.1.1 coprono un intervallo di circa 180 dB. Pag. 1.1-4
  • 15. Capitolo 1.1 "Il fenomeno suono " Davide Cilano 140 dB Aereo 130 dB Soglia del dolore 110 dB Moto in accelerazione 90 dB Strada urbana 80 dB Locale pubblico 60 dB Traffico automobilistico 50 dB Voce di conversazione 20 dB Ticchettio orologio 10 dB Fruscio foglie Tab 1.1.3 Alcuni valori di intensità sonora in dB SPL [Lazzarin] Essendo il dB una unità logaritmica non è possibile sommare direttamente valori espressi in dB, per ottenere l'intensità risultante dalla somma di I1 e I2 : I1 A = 10 Log10 I rif I2 B = 10 Log10 I rif si ricava: I1 = I rif 10 10 A I 2 = I rif 10 10 B e quindi : I1 + I 2 æ 10 10 A + 10 10 B ö C = (I1 + I 2 )dB = 10 Log10 = 10 Log10 ç [1.1.5] I rif ç I rif è Si noti che un aumento di 3 dB del livello sonoro in intensità o 6 dB in pressione sonora equivale al raddoppio dell'energia. In modo del tutto simile se una intensità sonora espressa in dB deve essere moltiplicata per un livello: ( A * liv )dB = 10 Log10 (10 10 A * liv ) [1.1.6] In generale N sorgenti con la stessa intensità Ls producono un segnale : L tot = Ls + Log 10 (2 N ) [1.1.7] 1.1.2.2. Frequenza e Timbro Percettivamente la frequenza definisce l'acutezza di un suono; le basse frequenze sono proprie di suoni gravi le alte frequenze di suoni acuti. La forma d'onda periodica più semplice è la funzione seno, tutte le onde sinusoidali con qualsiasi frequenza nel campo dell'udibile sono dette TONI PURI (o TONI SEMPLICI) mentre quelle non riconducibili a toni puri sono dette TONI COMPLESSI. Per analizzare la struttura frequenziale di un segnale si possono usare diverse tecniche tra cui : • filtri a scansione • banchi di filtri • filtri polifase • trasformata di Fourier Pag. 1.1-5
  • 16. Capitolo 1.1 "Il fenomeno suono " Davide Cilano Dalla scomposizione di Fourier si ottengono informazioni riguardo all'ampiezza e alla fase delle singole componenti , informazioni di vitale importanza per la ricostruzione del segnale. TEOREMA DI FOURIER : Una funzione del tempo f(t) che nel proprio campo di definizione (-T/2, +T/2) soddisfi alle due seguenti condizioni (Dirichlet): a) nell'intervallo di definizione possa essere scomposta in un numero finito di subintervalli in cui f(t) sia continua e monotona; b) se t0 è un punto di discontinuità esistono e sono definiti i limiti f(t0 + 0) e f(t0 - 0); può essere rappresentata nel modo seguente : ∞ f (t ) = F (ω )e jωt dω −∞ dove : ∞ 1 F (ω ) = f (t )e − jωt dt 2π −∞ Nel caso di segnali discreti l'operazione di integrale viene sostituita dalla sommatoria e la trasformata di Fourier si indica DFT. Il calcolo della DFT comporta un numero di operazioni molto elevato dell'ordine di N2. Per ridurne la complessità algoritmica ne è stata realizzata una versione ottimizzata (FFT Fast Fourier Transform) che richiede un numero di operazioni pari a N log2N. La rappresentazione frequenziale (forma scomposta in sinusoidi) di un segnale è detta SPETTRO. Il calcolo dello spettro pur essendo una operazione concettualmente semplice può comportare delle difficoltà per segnali che cambiano continuamente nel tempo. Infatti il segnale è un'entità temporale mentre lo spettro è frequenziale, essendo tra loro inversamente proporzionali (f = 1/t) più ampio è l'intervallo di analisi e minore è la risoluzione frequenziale ovvero minore è l'accuratezza. Quindi l'analisi spettrale è un compromesso tra ampiezza temporale e risoluzione frequenziale a seconda dell'applicazione specifica. SECONDI FREQUENZA 100 Hz =1/0.01sec T = 0.01 sec. Fig. 1.1.3 Funzione seno e suo spettro. La scomposizione di un TONO COMPLESSO porta ad identificare la frequenza fondamentale, che, per definizione, è il tono di frequenza minore tra tutte le componenti. La frequenza fondamentale determina l'acutezza del suono ovvero la collocazione nella banda dell'udibile mentre l'ampiezza e la fase delle armoniche determinano il timbro del suono. Se alla stessa fondamentale si somma una stessa armonica ma con fase diversa il suono apparirà dello stesso tipo ma con assonanza diversa. A parità di livello l'orecchio è maggiormente sensibile ai toni puri piuttosto che a suoni estesi su larga banda. Pag. 1.1-6
  • 17. Capitolo 1.1 "Il fenomeno suono " Davide Cilano L'intervallo tra la minima e la massima frequenza trattabile da un sistema viene detto LARGHEZZA DI BANDA. 1.1.3. LA DIVISIONE IN OTTAVE L'intervallo di frequenze udibili dall'uomo è stato indicato numericamente dai valori tra 20 e 20000 Hz , tali limiti sono solo indicativi in quanto i valori reali dipendono da molti fattori sia fisici che psicologici : .. le caratteristiche genetiche dell'individuo .. la "dotazione fisica" dell'apparato uditivo .. l' età .. l' affaticamento acustico .. l' esperienza in ascolto Tutti gli individui rilevano però una sensazione di "similitudine" tra toni fondamentali di frequenza doppia, tripla, quadrupla, ecc. Per tale motivo è stata introdotta la divisione in ottave dello spettro di frequenze udibili. Un'ottava è definita come l'intervallo di frequenza tra due fenomeni di cui uno abbia frequenza doppia dell'altro. Le frequenze udibili hanno un'estensione di circa 11 ottave e può essere interessante confrontarlo con l'intervallo delle onde visibili che coprono meno di una ottava. Per definizione ogni banda in ottave è individuata dalla media geometrica delle frequenze che la delimitano, detta frequenza caratteristica o nominale. f alta = 2 f bassa f caratteristica = f alta f bassa N.BANDA FREQUENZA FREQUENZA FREQUENZA CARATTERISTICA INFERIORE SUPERIORE 1 16 11,2 22,5 2 31,5 22,5 45 3 63 45 90 4 125 90 180 5 250 180 355 6 500 355 710 7 1000 710 1400 8 2000 1400 2800 9 4000 2800 5600 10 8000 5600 11200 11 16000 11200 22400 Tab 1.1.4 Divisione in ottave delle frequenze udibili. La frequenza superiore è sempre il doppio di quella inferiore e quindi la larghezza di banda di ogni ottava aumenta con l'aumentare della frequenza. Un'altra divisione della banda di frequenze udibili può essere fatta in 1/3 di ottava , in tal caso si ottengono 31 bande ognuna delle quali è compresa tra due frequenze che sono in un rapporto di 3 2: f alta = 2 f bassa 3 f caratteristica = f alta f bassa 1.1.4. IL RUMORE Il rumore è definito [ANSI S 1.1] come la somma di oscillazioni irregolari, intermittenti o statisticamente casuali. Percettivamente è un suono innaturale e disturbante. Pag. 1.1-7
  • 18. Capitolo 1.1 "Il fenomeno suono " Davide Cilano Un rumore può essere classificato in base alle sue caratteristiche in [Cosa] : .. continuo o discontinuo riferito alla durata nel tempo .. stazionario o fluttuante in base all'intensità .. casuale se la durata e l'intensità sono irregolari .. impulsivo se la sua energia è concentrata in brevi intervalli temporali L'unità di misura del rumore più usata è l'incremento di pressione sonora indotta, espressa in Newton/m2. La soglia di percezione del rumore dipende dall'intensità, dalla frequenza e , per rumori di tipo impulsivo anche dalla durata. Tipicamente la soglia di percezione dipende fortemente dalla frequenza ed è tra -1 e 3 dB SPL per le frequenze centrali, aumenta a 10-20 dB SPL alle alte frequenze e a 40-70dB SPL per le basse. La soglia temporale di percezione del rumore è di circa 100ms. Alcuni rumori tipici possono essere identificati dal rapporto tra potenza e frequenza [Cosa]; ad esempio si indica con il termine rumore bianco un rumore la cui densità spettrale di potenza sonora è distribuita in modo costante su tutte le frequenze udibili; si definisce rumore rosa, un rumore che ha potenza per singola frequenza inversamente proporzionale alle frequenze comprese in un determinato campo. Quindi per il rumore bianco l'intensità di pressione sonora decresce di 3 dB per ogni banda di ottava, mentre per quello rosa rimane costante pur diminuendo la ripartizione sulle singole frequenze. Un suono si differenzia dal rumore solo per le sensazioni di piacere o sgradevolezza che suscita e non ne esiste una distinzione oggettiva. 1.1.5. COMPONENTI TONALI Le componenti tonali sono quelle componenti di un tono complesso che più 'assomigliano a toni puri. Un metodo semplificato per valutare la presenza di componenti tonali in una emissione sonora è di effettuarne una analisi per bande di 1/3 di ottava [Cosa]: "se il livello di pressione sonora di una o più bande di 1/3 di ottava dello spettro sonoro supera per più di 5 dB quello delle due bande adiacenti, si è in presenza di componenti tonali." Tutte le componenti del segnale sonoro che dall'analisi non risultano essere tonali vengono dette NON TONALI e possono essere assimilate a rumore. Pag. 1.1-8
  • 19. Capitolo 1.2 LA PERCEZIONE DEL SUONO 1.2.1. ORECCHIO UMANO E SENSIBILITÀ IN FREQUENZA .............................................................1 1.2.2. LA PERCEZIONE ..........................................................................................................................4 1.2.3. UNITÀ DI MISURA PERCETTIVE................................................................................................4 1.2.3.1. Il Bark..............................................................................................................................4 1.2.3.2. Loudness..........................................................................................................................5 1.2.3.3. Il Phon.............................................................................................................................6 1.2.3.4. Il Sone..............................................................................................................................7 1.2.4. IL MASCHERAMENTO .................................................................................................................8 1.2.4.1. ... Nella Frequenza ..........................................................................................................9 1.2.4.2. ... Nel Tempo ...................................................................................................................11 1.2.4.3. ... Nel Tempo e Frequenza...............................................................................................12 1.2.5. PERCEZIONE DI VARIAZIONI DI INTENSITÀ ...........................................................................13 L'orecchio è sensibile ai segnali in funzione della frequenza e dell'ampiezza, due suoni di diversa frequenza e pari intensità vengono percepiti di intensità diversa. Questo capitolo è un' introduzione alla terminologia ed ai fenomeni coinvolti nel processo di percezione dei suoni, vengono definite alcune unità di misura percettive, si riporta una breve descrizione del funzionamento dell'apparato uditivo e si introduce il fenomeno di mascheramento tra suoni. 1.2.1. ORECCHIO UMANO E SENSIBILITÀ IN FREQUENZA Fig.1.2.1 Struttura schematica dell'orecchio umano esterno e medio. L'orecchio può essere diviso dal punto di vista funzionale in [Lazzarin] : .. orecchio esterno .. padiglione auricolare .. condotto uditivo esterno .. membrana timpanica
  • 20. Capitolo 1.2 "La percezione del suono" Davide Cilano .. orecchio medio .. cavità ossea con tre ossicini : martello, incudine e staffa .. finestra ovale .. due muscoli di smorzamento dei movimenti dei tre ossicini .. un canale di comunicazione con l'atmosfera per compensare le pressioni sulle due superfici della membrana timpanica (Tromba di Eustacchio) .. orecchio interno .. vestibolo .. canali semicircolari detti labirinto .. coclea , canale colmo di un materiale elastico Orecchio Esterno Orecchio Medio Orecchio Interno Fig 1.2.2 Struttura interna dell'orecchio umano, sono indicati i principali organi coinvolti nel processo di percezione. Il canale cocleare è la parte che più influenza la percezione sonora. La coclea è un canale lungo circa 35mm. a fondo cieco che è diviso per tutta la sua lunghezza in tre camere dalla membrana basilare. Queste tre parti sono: .. superiore : o vestibolare comunica con l'orecchio medio attraverso la finestra ovale .. inferiore : o timpanica comunica con la superiore verso l'apice della coclea .. media : che contiene una sostanza detta endolinfa Pag. 1.2-2
  • 21. Capitolo 1.2 "La percezione del suono" Davide Cilano Fig 1.2.3 Rappresentazione della coclea srotolata. Si può notare la divisione per tutta la lunghezza in tre camere. Sulla membrana basilare si trova l'organo di Corti in cui sono situate le cellule recettrici il cui compito è di trasformare le differenze di pressione in impulsi elettrochimici da inviare al cervello. Segue una descrizione sintetica del fenomeno della percezione sonora : -- l'orecchio esterno funzionando da risonatore per le frequenze tra 1000 e 7000 Hz (maggiormente efficace intorno a 3000 Hz) produce un incremento di circa 10-12dB delle pressioni sonore fra l'esterno ed il timpano -- nell'orecchio medio la membrana timpanica mette in vibrazione martello, incudine e staffa, che, funzionando come un sistema di leve triplicano la forza applicata sulla finestra ovale (la cui superficie è 1/30 di quella del timpano) -- a questo punto la pressione originaria esercitata sul timpano è stata amplificata di circa 90 volte e viene impressa sulla finestra ovale -- dalla finestra ovale il suono (sotto forma di variazione di pressione) giunge all'orecchio interno dove attraverso il movimento del liquido cocleare dei canali vestibolare e timpanico la membrana base mette in risonanza le cellule situate nell'organo di Corti. -- le cellule del Corti producono dei segnali di tipo elettrochimico che attraverso il nervo uditivo giungono al cervello secondo un processo non ancora ben conosciuto. In tutto il processo di percezione uditiva vengono coinvolti numerosi fenomeni soggettivi che possono produrre in individui diversi sensazioni differenti in presenza dello stesso suono esterno. Inoltre sono presenti altri fenomeni di "autodifesa" che modificano la caratteristica dell'informazione trasmessa nell'apparato uditivo. Ad esempio i tre ossicini martello, incudine e staffa sono controllati da dei piccoli muscoli che in presenza di alte intensità sonore ne riducono il potere amplificante (solo per suoni di durata superiore ai 200ms.). La percezione di un suono può avvenire anche per via ossea (soprattutto per quello auto prodotto). L'orecchio è in grado di percepire tutte le caratteristiche del suono tranne la sua localizzazione. Per sopperire a tale mancanza, il soggetto umano si basa su confronti tra i suoni percepiti dall'orecchio destro e dal sinistro con spostamenti della testa. 1.2.2. LA PERCEZIONE I recenti studi in campo psicoacustico hanno evidenziato che l'apparato uditivo umano è in grado di rilevare solo alcune caratteristiche del segnale audio ed in particolare: Pag. 1.2-3
  • 22. Capitolo 1.2 "La percezione del suono" Davide Cilano Caratteristica FISICA Fenomeno PERCEPITO Frequenza Pitch Intensità Livello percepito o Loudness Forma spettrale, Modulazione ,Frequenza Intensità, Fluttuazioni, Rigidezza Tempo Durata soggettiva Tab 1.2.1 Caratteristiche fisiche del suono e corrispondente fenomeno percepito dall'uomo. La descrizione di come vengono percepiti i suoni può essere semplificata se al posto delle unità di misura "fisiche" si usano unità di misura "percettive" ovvero costruite "ad hoc" sulla capacità di risoluzione dell'apparato uditivo. Così al posto della frequenza conviene usare le bande critiche o Bark, e al posto dell'intensità si usa il loudness misurato in Phon o Sone. In definitiva la percezione umana può essere ben descritta in uno spazio a tre dimensioni: Fig. 1.2.4 Spazio tempo - frequenza - intensità in cui può convenientemente essere descritto e studiato il fenomeno della percezione sonora umana. 1.2.3. UNITÀ DI MISURA PERCETTIVE Nei paragrafi che seguono si riportano le definizioni delle unità di misura percettive di uso comune e se ne spiega il significato e l'uso. Tali unità di misura essendo percettive sono valide solo su base statistica e sono state ottenute da studi compiuti negli anni passati su grandi campioni di individui acusticamente sani. Ne segue che sono valide per ascoltatori che rientrano nella media e non per soggetti affetti da patologie o dotati di particolare acutezza. Le unità di misura esposte sono state soggette all'approvazione e standardizzazione dell'ISO (International Standard Organization). 1.2.3.1. Il Bark Il Bark è una unità di misura non lineare che viene usata per dividere l'intera banda di frequenze udibili in sottobande confinanti non sovrapposte che ben modellizzano il processo di percezione dei suoni da parte dell'uomo. Il concetto delle bande critiche è basato sulla comprovata assunzione che il nostro sistema uditivo analizza lo spettro di un segnale audio dividendolo in sottobande (dette bande critiche). Banda Critica [Aarts]: La banda di frequenze più larga in cui l'intensità di un rumore distribuito casualmente nella stessa banda di intensità energetica costante (SPL) è indipendente dalla sua larghezza di banda. Aggiungendo una banda critica alla successiva, in modo che il limite superiore della più bassa coincida con quello inferiore della più alta, si ottiene la scala di banda critiche che è non lineare in Pag. 1.2-4
  • 23. Capitolo 1.2 "La percezione del suono" Davide Cilano quanto le bande critiche hanno un'ampiezza variabile in funzione della frequenza e seguono un'andamento pressoché logaritmico. Fig 1.2.5 Rappresentazione delle frequenze coperte dai bark: in ascissa è rappresentata la frequenza, in ordinata le bande critiche 0:24 . La curva rappresenta l'intervallo di frequenza coperto dalle bande critiche. L'ampiezza delle bande critiche è di circa 100 Hz fino a 500 Hz mentre al di sopra questo valore hanno un'ampiezza relativa che aumenta del 20%, le bande critiche sono strettamente correlate alla frequenza. La divisione in bande critiche è stata ottenuta da esperimenti percettivi che hanno misurato i confini in frequenza entro cui due toni distinti vengono percepiti come un unico suono. La formula di conversione da frequenza a Bark è [Kapust]: 2 ( Bark = 13 arctg 7.6 *10 −4 ) æ f ö f + 3.5 arctgç è 7500 dove f è la frequenza espressa in Hertz. La larghezza di ogni banda critica banda critica è invece data da [Zwicker]: 0.69 Larghezza Hz = 25 + 75 1 + 1. 4 f centro 2 Zwicker indica che le bande critiche sono mobili nel dominio della frequenza e si dimensionano in modo tale che l'orecchio umano percepisca il massimo dell'informazione. 1.2.3.2. Loudness Indica l'intensità percepita di un suono e dipende dall'intensità energetica e dalla frequenza, in particolare le definizioni sono [Aarts]: Pag. 1.2-5
  • 24. Capitolo 1.2 "La percezione del suono" Davide Cilano Loudness: Attributo di sensazione uditiva secondo cui un suono può essere ordinato in una scala da lieve a intenso Livello di Loudness: livello della pressione sonora di riferimento, scelta come un'onda sinusoidale di frequenza 1KHz proveniente dal fronte dell'ascoltatore e che è giudicato da una persona con udito sano di uguale intensità al suono di raffronto. La scala dei loudness è stata costruita sperimentalmente basandosi sul livello di riferimento di un tono di 1KHz a 40 dB (suono di riferimento standard in elettroacustica). Il loudness può essere misurato in Phon o Sone che sono definiti di seguito. 1.2.3.3. Il Phon La sensibilità uditiva varia in funzione della frequenza ed in particolare è massima per le frequenze centrali e minima per le estreme (alte e basse). Il PHON è la misura dell'intensità soggettiva del suono (LOUDNESS) e rappresenta l'intensità necessaria per produrre ad una certa frequenza la stessa sensazione uditiva in deciBel, di quella di un tono alla frequenza di 1000 Hz, a tale frequenza i livelli di Phon e dB si equivalgono. Fig. 1.2.5 Audiogramma in PHON ISO R 226 di Robinson e Dadson, riporta in funzione della frequenza l'intensità necessaria in dB per produrre la stessa sensazione in intensità di un tono a 1KHz; le linee di isosensazione esprimono l'intensità in dB che un suono deve avere in funzione della frequenza per essere percepito ad una intensità costante in PHON. L'audiogramma riportato nella Fig 1.2.6 riporta le curve di ISOSENSAZIONE (intensità soggettiva del suono) e si riferisce a toni puri. I risultati tabulati sono l'esito di prove eseguite da Robinson e Dadson su un campione di individui sani. La scala dei PHON è stata costruita sperimentalmente e come per i deciBel un raddoppio dell'energia produce un aumento di 3 Phon. Dalla figura si può notare che: Pag. 1.2-6
  • 25. Capitolo 1.2 "La percezione del suono" Davide Cilano .. la sensibilità è massima alle frequenze 20:3000Hz corrispondenti al parlato (l'orecchio esterno amplifica per risonanza queste frequenze) .. le basse frequenze vengono percepite solo a grandi intensità (l'orecchio esterno riflette parzialmente i suoni con grandi lunghezze d'onda) .. le alte frequenze per essere udite devono essere molto intense (i tre ossicini dell'orecchio medio ne limitano la trasmissione) .. la curva dei phon tende ad appiattirsi con l'aumentare dell'intensità (i due muscoli collegati a martello, incudine e staffa ne smorzano il potere amplificante ). 1.2.3.4. Il Sone Per ridurre la complessità dovuta all'uso della scala logaritmica dei phon, sperimentalmente è stata costruita la scala dei SONE. Il livello di 1 SONE è definito [ANSI S 3.4] come l'intensità sonora soggettiva (loudness) uguale ad un livello di 40 PHON. In prima approssimazione ogni aumento di 10 phon corrisponde ad un raddoppio del livello di SONE. Dunque nella scala dei SONE (unità di misura soggettiva del suono) una intensità di 4 SONE è due volte più "rumorosa" di un suono di 2 SONE. Le relazioni tra PHON e SONE sono le seguenti [Cosa]: Sone = 0.03(Phon − 40 ) 1.2 Log 10 Sone [1.2.1] Phon = 0.03 Per calcolare i livelli di SONE in funzione della pressione sonora [Aarts]: Sone = 0.01( p − p 0 ) 0.6 dove p0 = 45 µPascal approssima la soglia statica e p è la pressione in micropascal . Per valori di p>>p0 le formule [1.2.1] possono essere ben approssimate dalle seguenti [Aarts]: ( Phon − 40 ) Sone = 2 10 Phon = 40 + log 2 Sone Il loudness di suoni complessi viene calcolato in funzione della loro scomposizione spettrale sommando il loudness di tutti i toni entro una banda critica che è l'equivalente psicologico di sommare l'attività delle cellule recettrici sulla membrana basilare. Questo corrisponde all'assunzione che le sollecitazioni sulla membrana base si sommino per formare il loudness totale, ovvero che l'apparato uditivo ne operi l'integrale. Se tale integrale viene fatto in Sone ,il risultato finale si esprime in Sone per Bark e si indica con N' 24 Bark N= N ' ( z )dz 0 Il suono esteso a tutte le bande che produce un loudness di 1 Sone corrisponde ad una eccitazione uniforme nelle bande critiche di 30dB. Il loudness prodotto da un tono a 1 KHz è molto inferiore al loudness prodotto da una eccitazione uniforme su tutti i Bark, soprattutto per livelli intensi mentre sono pressoché uguali a bassi livelli. 1.2.4. IL MASCHERAMENTO Non tutte le vibrazioni entro la banda dell'udibile sono percepite dall'orecchio umano, la loro rilevazione da parte dell'apparato uditivo dipende in prima approssimazione dall'intensità e dalla frequenza e da analisi più accurate anche dai segnali adiacenti sia nel dominio del tempo che della frequenza; tale fenomeno è noto con il nome di mascheramento. Il mascheramento è definito come il livello di pressione sonora o dB SPL di un tono di riferimento necessario perché questo possa essere udito in presenza di uno mascherante. Pag. 1.2-7
  • 26. Capitolo 1.2 "La percezione del suono" Davide Cilano La percettibilità di un tono puro in assenza di altri segnali dipende principalmente della frequenza e intensità dando origine a quella che viene detta soglia statica di mascheramento o in quiete. Altri fattori che influiscono nella determinazione della soglia di mascheramento sono: .. durata .. dotazione fisica dell'individuo .. età .. affaticamento .. stato fisico .. stato psichico dell'individuo Fig. 1.2.6 Soglia di percezione in quiete in funzione della frequenza e dell'intensità sonora. Ad esempio la soglia può essere approssimata ad una pressione di soglia di 0 dB per le frequenze tra 800 e 5000 Hz per ascoltatori composti da adulti normali in giovane età (0 dB SPL). Oltre i 5000 Hz la soglia aumenta rapidamente fino a coincidere con la soglia di dolore a circa 16000 Hz. Il limite superiore per la pressione sonora è stabilito in 120 dB ed è pressoché indipendente dalla frequenza. Suoni di questa intensità provocano una forte sensazione di fastidio. La soglia di dolore è posta a circa 130 dB; a tale livello il suono causa sensazioni dolorose. Valori più elevati comportano sordità temporanea o permanente anche per breve esposizione. È interessante considerare la grande estensione del campo di variazione dell'ampiezza di vibrazione timpanica; esso infatti va da circa 10-9 cm per la soglia uditiva (0 dB SPL) a 10-2 cm a 140 dB (valori rilevati a 2000 Hz). La soglia minima del suono percepibile (soglia statica) rappresentata in figura 1.2.7 è stata ottenuta da esperimenti su un grande campione di individui. La sua espressione matematica approssimata è [Zwicker]: Soglia dB = 3.64( f KHz ) − 6.5e −0.6( f KHz −3.2 ) + 10 −3 ( f KHz ) −0.8 2 4 La soglia di mascheramento per toni complessi è detta soglia di mascheramento dinamica ed è fortemente dipendente dalla microstruttura del segnale in quanto i toni componenti interagiscono mascherandosi a vicenda e contribuendo alla forma finale della maschera. La maschera può essere studiata sia nel dominio del tempo che della frequenza; nel dominio del tempo il mascheramento può essere simultaneo e non simultaneo mentre in quello della frequenza un tono maschera quelli di frequenza adiacente a seconda dell'intensità. Pag. 1.2-8
  • 27. Capitolo 1.2 "La percezione del suono" Davide Cilano 1.2.4.1. ... Nella Frequenza Nel dominio della frequenza il mascheramento è molto intenso in prossimità dei toni mascheranti, che alzano in modo significativo i valori di soglia statica, in particolare se l'orecchio percepisce un suono di una certa frequenza, presenta minore sensibilità per le frequenze vicine ad essa. La conoscenza di tale fenomeno permette la costruzione della soglia di mascheramento. In generale un suono ad una certa frequenza maschera tanto più i suoni di frequenza adiacente quanto più è intenso. La figura 1.2.8 riporta la curva di mascheramento per toni a 0.5, 1.2, 4, 8 KHz con livello di 60 dB SPL, la scala delle frequenze è lineare. Fig 1.2.7 Curve di mascheramento in funzione della frequenza su scala lineare, la curva inferiore rappresenta la soglia statica. Per determinare tali curve si usa un tono di riferimento e si trova l'intensità affinché sia udibile in presenza di un mascherante. Nella Fig 1.2.8 si nota una gran diversità tra le curve di mascheramento al variare della frequenza. Risultati non diversi si ottengono dalla rappresentazione su scala logaritmica (fig 1.2.9) : Fig. 1.2.8 Rappresentazione su scala logaritmica degli effetti di toni mascheranti di intensità pari a 60 dB. Anche in scala logaritmica la forma delle curve risulta dipendente dalla frequenza, però si può notare come le curve su scala lineare sotto i 500 Hz siano uguali a quelle su scala logaritmica sopra i 500 Hz. Ciò suggerisce che si potrebbe ottenere l'indipendenza della forma della maschera dalla frequenza scegliendo una scala lineare sotto i 500 Hz e logaritmica al di sopra. Pag. 1.2-9
  • 28. Capitolo 1.2 "La percezione del suono" Davide Cilano Una tale scala di frequenze è già stata illustrata ed è quella dei Bark ; infatti la rappresentazione dello stesso fenomeno usando la scala dei bark evidenzia una forma di mascheramento costante: Fig 1.2.9 Rappresentazione della forma della curva di mascheramento di toni puri con livello di 60dB usando per la frequenza la scala dei Bark. Il vantaggio introdotto è evidente rendendo indipendente la forma della maschera dalla frequenza a meno di intersezioni con la soglia statica di mascheramento. Si noti che la funzione di mascheramento è molto più ripida a sinistra che a destra. Dunque, con la scala dei Bark lo studio dei fenomeni di mascheramento è molto semplificato permettendo la costruzione della soglia con una funzione dipendente solo dall'intensità. In particolare la dipendenza dall' intensità provoca l'allungamento della curva di mascheramento con l'aumentare del livello, tale fenomeno è dovuto alla saturazione delle cellule recettrici dell'orecchio interno. Fig 1.2.10 Variazione della forma della curva di mascheramento in funzione dell'intensità del tono mascherante Pag. 1.2-10
  • 29. Capitolo 1.2 "La percezione del suono" Davide Cilano 1.2.4.2. ... Nel Tempo Nel dominio del tempo un tono viene mascherato notevolmente dalle sollecitazioni sonore temporali precedenti (specialmente per quelle più immediate); ed in modo molto meno evidente e motivabile per quelle immediatamente future (per cui non è ancora stata trovata una valida spiegazione), tale fenomeno è noto come mascheramento temporale e si distingue in simultaneo e NON simultaneo. Un esempio della condizione di simultaneità potrebbe essere il caso in cui noi abbiamo una conversazione con un vicino mentre passa un treno. La nostra conversazione risulta disturbata e per poterla continuare è necessario "alzare la voce" per produrre più potenza e quindi una maggiore sonorità. Nella musica si ha un comportamento analogo. I differenti strumenti si possono mascherare tra di loro, gli strumenti più tenui possono essere uditi solo quando non sono presenti quelli più forti. NON SIMULTANEO Fenomeno secondo cui un tono "copre" quelli vicini nel tempo sia passato che futuro. La soppressione nel tempo futuro può essere ben spiegata dagli studi sulle proprietà meccaniche degli apparati dell'udito interni mentre non è ancora stata trovata una valida spiegazione (sono state solo fatte delle supposizioni) del fenomeno del pre-mascheramento ; vale a dire che un tono maschera non solo i suoni che seguono ma anche quelli che lo precedono. La supposizione più avvalorata è che a livello neurale venga compiuta una analisi del suono, come se fosse ritardato e analizzato prima di trasmetterne gli impulsi al cervello per la vera e propria "audizione". Fig 1.2.11 Rappresentazione schematica del fenomeno di mascheramento non simultaneo nel dominio del tempo, si può notare che il pre- mascheramento ha effetti minori del post-mascheramento. SIMULTANEO Riguardo al mascheramento simultaneo da esperimenti su animali si è trovato che ha luogo nell'orecchio interno, prima della trasmissione a livello neurale. La curva di mascheramento è stata trovata anche da esperimenti comparativi servendosi di toni puri fissi. Il mascheramento simultaneo ha come effetto l'aumento della soglia di mascheramento ad una composizione delle due che può essere ottenuto in modo approssimato, per toni puri, come somma energetica secondo la : 1/α æ n αö M tot =ç Mi con a<2 è i =1 e dove Mi è la maschera dell' i-esimo impulso simultaneo. Tale formula è valida sia per mascheramenti simultanei che per i non simultanei e il parametro α assume valori diversi nel dominio temporale e frequenziale. Pag. 1.2-11
  • 30. Capitolo 1.2 "La percezione del suono" Davide Cilano 1.2.4.3. ... Nel Tempo e Frequenza Fig 1.2.12 Rappresentazione schematica del fenomeno di mascheramento di un tono puro nel dominio della frequenza. Una prima approssimazione delle curve di salita e discesa con delle rette è data da [Kapust]: S1 = 31dB / Bark æ æ 230 ö ö S 2 = ç 22 + minç ç ç f ,10 ÷ − 0,2 LivellodB dB / Bark ÷ è è Fig 1.2.13. Rappresentazione schematica del mascheramento temporale di un impulso di durata finita. Una espressione della formula di decadimento di post-masking viene data da Zwicker : 1 æ t ö D = 1.0 − arctgç ç 13.2(d )−0.25 1.35 è Dove t è il tempo trascorso da quando il segnale è cessato e d è la durata del mascherante. Il post-masking si verifica come rilascio graduale degli effetti di mascheramento ovvero il mascherante non si arresta subito dopo il suo manifestarsi ma decresce gradatamente. L'effetto di post-masking dipende in modo non lineare anche dalla durata del mascherante. Gli effetti di durata e di mascheramento possono essere ben definiti in due dimensioni (Bark, loudness) Pag. 1.2-12
  • 31. Capitolo 1.2 "La percezione del suono" Davide Cilano Fig 1.2.14. Rappresentazione del fenomeno di mascheramento nei domini di tempo e frequenza. Non solo il mascheramento può essere descritto più semplicemente in termini di Bark ma anche molti altri effetti, come la tonalità, le differenze di frequenza udibili distintamente e la crescita dell'intensità sonora in funzione della larghezza di banda. 1.2.5. PERCEZIONE DI VARIAZIONI DI INTENSITÀ Le variazioni in intensità vengono percepite solo se superiori a 5 dB (più di un raddoppio dell'energia sonora1). La sensazione di raddoppio dell'intensità soggettiva corrisponde ad un incremento di 10 dB (corrispondente a un'amplificazione dell'energia iniziale di 10 volte !). L'amplificazione della sorgente (N) per ottenere un dato incremento in deciBel è: dBincremento = 10 Log10 N N = 10 10 dBincremento 1Si ricorda che un raddoppio dell'energia sonora corrisponde all'aumento di 3 dB . Con 6 dB di aumento, si ha un quadruplicamento dell'energia sonora. Pag. 1.2-13
  • 32. Capitolo 1.3 L'AUDIO DIGITALE 1.3.1. INTRODUZIONE ...........................................................................................................................1 1.3.2. IL CAMPIONAMENTO..................................................................................................................2 1.3.3. LA QUANTIZZAZIONE .................................................................................................................3 1.3.4. L'SNR (Signal to Noise Ratio) ........................................................................................................3 1.3.5. LA CODIFICA PCM (Pulse Code Modulation).............................................................................4 1.3.6. COMPRESSIONE DI SEGNALI CON LEGGE A_LAW E m_LAW............................................5 1.3.7. I SISTEMI PCM NELLA REGISTRAZIONE DIGITALE ...............................................................6 1.3.8. I SISTEMI PCM NELLA RIPRODUZIONE DIGITALE ................................................................8 1.3.9. PARAMETRI PER LA QUALITÀ DI UN SISTEMA AUDIO .........................................................10 1.3.10.I SISTEMI DI COMPRESSIONE NELLA CATENA PCM ............................................................11 Il presente capitolo è una introduzione alle tecniche ed ai sistemi per la memorizzazione e riproduzione di audio digitale. Vengono descritti i dispositivi necessari in una catena di registrazione di digitale per meglio chiarire dove e perché è utile una codifica in formato compresso quale la codifica MPEG_Audio. 1.3.1. INTRODUZIONE Il termine "Audio digitale" indica la tecnica usata per la registrazione, la memorizzazione o la trasmissione dell'informazione sonora, che dovrà venire riportata in analogico per permetterne l'ascolto. Il suono infatti è per sua natura analogico e può essere prodotto e percepito solo sotto forma di variazioni di pressione; una sua rappresentazione (codifica) può invece essere fatta in forma analogica o digitale. Il termine digitale indica dunque solo un modo per "trasportare" (trasmettere o registrare) il segnale: Fig. 1.3.1 L'audio digitale è una alternativa alla forma analogica per la rappresentazione dell'informazione sonora, si tenga presente che un suono può essere prodotto e percepito solo sotto forma analogica. L'introduzione dell'audio digitale ha cambiato il modo di riprodurre ed ascoltare il "suono", l'audio digitale è infatti ben lontano come fedeltà di riproduzione dall'audio analogico, la qualità di
  • 33. Capitolo 1.3 "L'audio Digitale" Davide Cilano riproduzione ottenibile con la tecnica digitale è notevolmente superiore alla analogica in quanto in generale l'accuratezza dei sistemi è una funzione del rumore introdotto dal sistema stesso; nei sistemi analogici tale rumore non è facilmente controllabile perché è difficile ottenere componenti con tolleranze inferiori all'1% [Malcangi]. In digitale invece adottando la necessaria precisione numerica è possibile ottenere qualsiasi accuratezza che rimane (al contrario dell'analogico) invariante nel tempo. Altra caratteristica dei sistemi digitali è la possibilità di essere programmati ottenendo una maggior versatilità rispetto agli analogici. Si fa notare che il preferire l'audio digitale o analogico sia solo una scelta dettata dalle sensazioni soggettive che si hanno ascoltando l'audio in una o l'altra forma. 1.3.2. IL CAMPIONAMENTO I principi base per la codifica digitale di un segnale analogico sono il campionamento e la quantizzazione . Il segnale sonoro può essere rappresentato in un diagramma tempo - intensità; dove entrambi i parametri variano in un'insieme continuo di valori. L'operazione di campionamento consiste nel rilevare l'ampiezza del segnale solo ad intervalli discreti equiampi attraverso la discretizzazione dell'asse dei tempi Intensità B A Tempo Intensità B A Tempo Fig 1.3.2 Campionamento di un segnale analogico. La scala dei tempi viene discretizzata e si valuta l'intensità del segnale solo in un numero finito di istanti temporali. Ciò che si ottiene è la rappresentazione campionata del segnale che ha una forma a gradini di valori continui nell'intervallo [A,B]. Il campionamento è un processo che non introduce perdita di informazione se si pone riguardo al fatto che le uniche variazioni che possono sfuggire sono quelle più rapide del campionatore stesso. Questa osservazione è l'enunciato del teorema di Nyquist: Teorema di NYQUIST o del CAMPIONAMENTO : Non si perde informazione nella rappresentazione discreta di un segnale continuo se la frequenza massima contenuta nel segnale è inferiore o al più uguale alla metà della frequenza di campionamento. Se la frequenza di campionamento è inferiore al doppio della banda del segnale, si verifica il fenomeno di aliasing generato da una intermodulazione tra il segnale stesso e il segnale di campionamento. Da un punto di vista frequenziale questo effetto produce un ribaltamento di spettro che crea una porzione di spettro fittizio nella banda del segnale. Pag. 1.3-2