La séparation des sources aveugle avec les méthodes DUET et DESPRIT a reçu beaucoup d'attention en raison de ses applications potentielles sur le traitement du signal.
3. 1.
INTRODUCTION
3
La séparation des sources aveugle avec les méthodes DUET et DESPRIT a reçu beaucoup
d'attention en raison de ses applications potentielles sur le traitement du signal:
Télécommunication
Systèmes d'amélioration de la parole
Ingénierie biomédicale
7. 7
Séparation
Déterminée :
Nombre de sources à estimer est égale au nombre de microphones N = M
Sur-déterminée :
Nombre de sources à estimer est inférieur au nombre de microphones N < M
Sous-déterminée :
Nombre de sources à estimer est supérieur au nombre de microphones N > M
Déterminée :
Nombre de sources à estimer est égale au nombre de microphones N = M
Sur-déterminée :
Nombre de sources à estimer est inférieur au nombre de microphones N < M
Sous-déterminée :
Nombre de sources à estimer est supérieur au nombre de microphones N > M
9. 9
DUET
L’algorithme DUET ( Degenerate Unmixing Estimation Technique )
permet de démixter un nombre arbitraire de signaux de source vocale pour seulement
2 mélanges anéchoïques des signaux , à condition que ces signaux soient W-disjoint orthogonal.
10. 10
DUET
DUET utilise deux mélanges (M=2) : 𝒙 𝟏 𝒕 𝒆𝒕 𝒙 𝟐 𝒕
𝑿 𝟏 (𝝎)
𝑿 𝟐(𝝎)
=
𝟏 … 𝟏
𝜶 𝟏 𝒆−𝒋𝝎𝜹 𝟏 … 𝜶 𝑵 𝒆−𝒋𝝎𝜹 𝑵
𝑨 𝟏 𝝎 𝑺 𝟏 𝝎
.
.
.
𝑨 𝑵(𝝎)𝑺 𝑵(𝝎)
+
𝑽 𝟏 𝝎
𝑽 𝟐(𝝎)
𝑨 𝒏 𝝎 = 𝒂 𝒏 𝒆−𝒊𝝎𝒅 𝒏
𝒅 𝒏 et 𝒂 𝒏 : 𝒔𝒐𝒏t l'atténuation et le retard subis par le nième signal lorsqu'il se propage au 1er capteur,
𝜶 𝒏 et 𝜹 𝒏 ∶sont l'atténuation et le retard subis par le nième signal se déplace entre deux capteurs adjacents,
𝑽 𝟏 𝝎 𝐞𝐭 𝑽 𝟐 𝝎 : sont des termes de bruit distribués indépendamment et de manière identique.
11. 11
DUET
Cas sans bruit
les N coefficients de canal 𝑨 𝟏 𝝎 , . . ., 𝑨 𝒏 𝝎 , peut être absorbé par les N sources, c’est-à-dire, 𝑨 𝒏 𝝎 𝑺 𝒏 𝝎 → 𝑺 𝒏 𝝎 :
𝑿 𝟏 (𝝎)
𝑿 𝟐(𝝎)
=
𝟏
𝜶 𝒏 𝒆−𝒋𝝎𝜹 𝒏
𝑺 𝒏(𝝎)
𝜶 𝒏 et 𝜹 𝒏 ∶sont l'atténuation et le retard subis par le nième signal se déplace entre deux capteurs adjacents,
12. 12
DUET
Propriété W-disjoint orthogonale (WDO) peut être formulée de manière suivant :
𝑺 𝒏 𝝉, 𝝎 𝑺𝒍 𝝉, 𝝎 = 𝟎 ∀ 𝝉, 𝝎 ; n≠l
La représentation temps-fréquence du signal Sn(t) est donnée par la transformée de Fourier fenêtrée :
𝑺 𝒏 𝝉, 𝝎 = −∞
+∞
𝑾 𝒕 − 𝝉 𝑺 𝒏 𝒕 𝒆−𝒋𝝎𝒕
𝒅𝒕
W (t) est une fonction de fenêtre
Propriété W-disjoint orthogonale (WDO) peut être formulée de manière suivant :
𝑺 𝒏 𝝉, 𝝎 𝑺𝒍 𝝉, 𝝎 = 𝟎 ∀ 𝝉, 𝝎 ; n≠l
La représentation temps-fréquence du signal Sn(t) est donnée par la transformée de Fourier fenêtrée :
𝑺 𝒏 𝝉, 𝝎 = −∞
+∞
𝑾 𝒕 − 𝝉 𝑺 𝒏 𝒕 𝒆−𝒋𝝎𝒕
𝒅𝒕
W (t) est une fonction de fenêtre
Propriété W-disjoint orthogonale (WDO) peut être formulée de manière suivant :
𝑺 𝒏 𝝉, 𝝎 𝑺𝒍 𝝉, 𝝎 = 𝟎 ∀ 𝝉, 𝝎 ; n≠l
La représentation temps-fréquence du signal Sn(t) est donnée par la transformée de Fourier fenêtrée :
𝑺 𝒏 𝝉, 𝝎 = −∞
+∞
𝑾 𝒕 − 𝝉 𝑺 𝒏 𝒕 𝒆−𝒋𝝎𝒕
𝒅𝒕
W (t) est une fonction de fenêtre
13. 13
DUET
les paramètres d'atténuation et de retard pour la nième source peuvent être déterminés par :
𝜶 𝒏 =
𝑿 𝟐(𝝎)
𝑿 𝟏(𝝎)
et 𝜹 𝒏 = −
𝟏
𝝎
𝑿 𝟐(𝝎)
𝑿 𝟏(𝝎)
Dans le domaine temps-fréquence l’expression précédente donnés par :
𝜶 𝒏 =
𝑿 𝟐(𝝎,𝝉)
𝑿 𝟏(𝝎,𝝉)
et 𝜹 𝒏 = −
𝟏
𝝎
𝑿 𝟐(𝝎,𝝉)
𝑿 𝟏(𝝎,𝝉)
les paramètres d'atténuation et de retard pour la nième source peuvent être déterminés par :
𝜶 𝒏 =
𝑿 𝟐(𝝎)
𝑿 𝟏(𝝎)
et 𝜹 𝒏 = −
𝟏
𝝎
𝑿 𝟐(𝝎)
𝑿 𝟏(𝝎)
Dans le domaine temps-fréquence l’expression précédente donnés par :
𝜶 𝒏 =
𝑿 𝟐(𝝎,𝝉)
𝑿 𝟏(𝝎,𝝉)
et 𝜹 𝒏 = −
𝟏
𝝎
𝑿 𝟐(𝝎,𝝉)
𝑿 𝟏(𝝎,𝝉)
les paramètres d'atténuation et de retard pour la nième source peuvent être déterminés par :
𝜶 𝒏 =
𝑿 𝟐(𝝎)
𝑿 𝟏(𝝎)
et 𝜹 𝒏 = −
𝟏
𝝎
𝑿 𝟐(𝝎)
𝑿 𝟏(𝝎)
Dans le domaine temps-fréquence l’expression précédente donnés par :
𝜶 𝒏 =
𝑿 𝟐(𝝎,𝝉)
𝑿 𝟏(𝝎,𝝉)
et 𝜹 𝒏 = −
𝟏
𝝎
𝑿 𝟐(𝝎,𝝉)
𝑿 𝟏(𝝎,𝝉)
15. 15
Méthode ESPRIT
Estime les directions d'arrivées des signaux par rapport à une translation d'un système de capteur.
c
Vise à trouver les N angles d'arrivée de N signaux à bande étroite non corrélés
𝑺 𝟏 𝒕 , 𝑺 𝟐 𝒕 , … , 𝑺 𝒏(𝒕) à l’aide de mélanges de capteurs anéchoïques 𝑴 ≥ 𝑵 à partir d’un
réseau linéaire uniforme.
16. 16
Principe d’ESPRIT
Repose sur deux sous-réseaux de capteurs. Chaque élément du premier sous-réseau est déplacé dans l'espace à partir
de l'élément correspondant du deuxième sous-réseau par le même vecteur de déplacement.
𝒙 𝟏 𝒕
𝒙 𝟐 𝒕
𝒙 𝟏 𝒕
𝒙 𝟐 𝒕
M = m / 2 m / 2 < M < m-1
𝒙 𝟏 𝒕
𝒙 𝟐 𝒕
M = m-1
M 2 1m-1
17. 17
Etapes Principaux d’Algorithme ESPRIT
M mélanges à bande étroite x1(t), . . ., xM(t) de fréquence centrale ω0 sont échantillonnés
aux K points temporels adjacents t1 , . . ., tK
Etape 2
La décomposition de la matrice de covariance spatiale en valeurs singulières
est calculée :
Ȓ 𝒁𝒁 = 𝒁𝒁 𝑯
𝒁 =
𝒙 𝟏 𝒕 𝟏 … 𝒙 𝟏 𝒕 𝑲
⋮ ⋱ ⋮
𝒙 𝑴−𝟏 𝒕 𝟏 … 𝒙 𝑴−𝟏 𝒕 𝑲
𝒙 𝟐 𝒕 𝟏 … 𝒙 𝟐 𝒕 𝑲
⋮ ⋱ ⋮
𝒙 𝑴 𝒕 𝟏 … 𝒙 𝑴 𝒕 𝑴
=
𝑬 𝟏
𝑬 𝟐
Les N paramètres de mélange sont estimés via une décomposition en
valeurs propres:
𝝓 𝟏 𝝎 𝟎 , … , 𝝓 𝑵 𝝎 𝟎 = 𝒆𝒊𝒈𝒔{𝑬 𝟏
𝒕
𝑬 𝟐
Etape 3
Etape 1
18. 18
Limitations d'ESPRIT
L’autre limite d’ESPRIT est qu’elle exige que le nombre de mélanges M > N
L'implémentation initiale d'ESPRIT se limitait aux signaux à bande étroite
20. 20
Combinant DUET et ESPRIT
estime le retard (de manière équivalente l’angle d’arrivée) et l’atténuation de N signaux WDO, éventuellement large bande, lorsqu’ils
traversent un réseau de paires de capteurs de type ESPRIT à l’aide de deux mélanges anéchoïques ou plus dans le domaine
temps-fréquence.
L’algorithme DESPRIT
Ces estimations sont utilisées pour générer un histogramme à deux dimensions qui est pondéré par la puissance des
estimations de source correspondant au point temps-fréquence.
Une fois les N paramètres de mélange identifiés, la démixtion est réalisée par inversion de matrice
à chaque point temps-fréquence avec la matrice de démixtion correspondant aux pics les plus
proches du paramètre estimé pour ce point temps-fréquence.
21. 21
Types de combinaison DESPRIT
On a trois types de combinaison entre DUET-ESPRIT :
1. Hard DESPRIT : Extension de DUET a Multicanal M ≥ 2
2. Soft DESPRIT : WDO affaiblie
3. Echoic DESPRIT : Mélange échogène
23. 23
Hard DESPRIT
Technique hard DESPRIT utilisée pour le traitement des mélanges M > 2, mais suppose toujours au plus
une source active à tout point temps-fréquence et le modèle de mélange anéchoique.
La matrice de covariance spatiale temps-fréquence peut être définie comme :
𝑹 𝒛𝒛 = 𝑬{𝒁 𝝎, 𝝉 𝒁 𝑯
(𝝎, 𝝉
𝒁 𝝎, 𝝉 =
)𝑿 𝟏(𝝎, 𝝉
⋮
)𝑿 𝑴−𝟏(𝝎, 𝝉
)𝑿 𝟐(𝝎, 𝝉
⋮
)𝑿 𝑴(𝝎, 𝝉
Par conséquent la décomposition de la matrice de covariance RZZ en valeur singulière est calculé :
𝑹 𝒁𝒁 =
𝑬 𝟏
𝑬 𝟐
𝑬 𝟏
𝑯
𝑬 𝟐
𝑯
24. 24
Hard DESPRIT
Lorsque l’opérateur d’attente est approché en utilisant une estimation instantanée, 𝝋 𝒏(ω, τ) est donné par
Dans le cas M = 2, cette expression correspond à l’étape d’estimation du paramètre DUET
∅ 𝒏 𝝎, 𝝉 = )𝒙 𝟏(𝝎, 𝝉 𝒕 )𝒙 𝟐(𝝎, 𝝉 ∀ 𝝎, 𝝉 ∈ 𝜴 𝒏
𝒙 𝟏 𝝎, 𝝉 = )𝑿 𝟏 𝝎, 𝝉 , … , 𝑿 𝑴−𝟏(𝝎, 𝝉 𝑻
𝒙 𝟐 𝝎, 𝝉 = )𝑿 𝟐 𝝎, 𝝉 , … , 𝑿 𝑴(𝝎, 𝝉 𝑻
26. 26
Soft DESPRIT
La technique Soft DESPRIT utilisée pour le traitement des mélanges M > 2, et permet
également à plusieurs sources d'être actives à un point de temps-fréquence donné. Et le
mélange anéchoïque
Cette hypothèse WDO affaiblie permet aux signaux source de se chevaucher dans le domaine temps-fréquence.
𝑺 𝒏 𝟏
𝝎, 𝝉 × ⋯ × 𝑺 𝒏 𝒌
𝝎, 𝝉 = 𝟎
Soft DESPRIT est une implémentation de DESPRIT sous une hypothèse WDO affaiblie :
La matrice de covariance spatiale peut être approximée comme :
𝑹 𝒁𝒁 ≈
𝟏
𝟐𝒌 + 𝟏
𝒌=−𝑲
𝒌=𝑲
)𝒁(𝝎, 𝝉 + 𝒌∆𝑻 )𝒁(𝝎, 𝝉 + 𝒌∆𝑻 𝑯
29. 29
Echoic DESPRIT
L'extension écho DESPRIT s'appuie sur M > 2 mélanges pour démixter jusqu'à [M/2] ≥ P sources de
chaque point de fréquence, et permet également à plusieurs sources d'être actives à un point de
temps-fréquence donné.
Estimation des paramètres de mélange de signaux sources cohérents
Le modèle de mélange échogène part du principe qu'un signal source 𝑺 𝒏(𝒕) se propage sur des
chemins échogènes distincts 𝑷 𝒏 au réseau de capteurs. Afin de démixter avec succès des mélanges d'écho,
il s'ensuit qu'une étape d'estimation de paramètre doit permettre la cohérence des signaux source.
30. 30
Echoic DESPRIT
M mélange x1(t), . . ., xM (t) sont utilisés pour construire les matrices :
𝑬 𝟏 =
𝒙 𝟏 𝒕 … 𝒙 𝑴/𝟐 𝒕
⋮ ⋱ ⋮
𝒙 𝑴/𝟐 𝒕 … 𝒙 𝑴−𝟏 𝒕
𝑬 𝟐 =
𝒙 𝟐 𝒕 … 𝒙 𝑴/𝟐 +𝟏 𝒕
⋮ ⋱ ⋮
𝒙 𝑴/𝟐 +𝟏 𝒕 … 𝒙 𝑴 𝒕
Les estimations des paramètres de mélange M / 2 sont obtenues via une décomposition en valeurs
propres :
𝝓 𝟏 𝝎 𝟎 , … , 𝝓 𝑴 𝟐 𝝎 𝟎 = 𝒆𝒊𝒈𝒔{𝑬 𝟐 𝑬 𝟏
𝒕
37. 37
Extension soft DESPRIT
Nombres des sources vocaux 5
Nombre de mélange 2 , 3 et 4
Durée (seconde ) 1.7
Fréquence d'échantillonnage ( KHz) 16
Espace entre des microphones (Cm) 20
Paramètres de mélange (α1,. . . , α5 ) (-0.45, 0.87, 0.32, -0.92, -0.11)
paramètres de mélange (δ1,. . . , δ5 ) (0.24, 0.29, 0.5, -0.85, 0.17)
Expérience
38. 38
Extension soft DESPRIT
M=2 M=3 M=4
Histogrammes Soft DESPRIT :
L’axe des x avec les unités -2,5 ≤ δ ≤ 2,5 échantillons
et l’axe des ordonnées avec des unités −2,5 ≤ log (α) ≤ 2,5.
Résultats
47. 47
6.
CONCLUSION
Trois extensions ont été proposées, toutes combinant la méthode DUET et la technique d'estimation
de la direction d'arrivée ESPRIT :
Hard DESPRIT
Soft DESPRIT
Echoic DESPRIT