Présentation Devoxx France 2014
Les nouvelles perspectives offertes par la reconnaissance vocale vont tôt ou tard nous confronter à l'usage de librairies spécialisées dont le fonctionnement interne nous échappe totalement. Comment dès lors les évaluer, les utiliser correctement et en tirer le meilleur parti ?
Cette présentation ludique et pratique a pour objectif de démystifier les arcanes de l'analyse de la voix humaine et ses contraintes en vous présentant les rouages internes du logiciel libre "Recognito", créé par le conférencier et permettant l'identification d'un locuteur à partir de son empreinte vocale.
20. @AmauryCrickx#dv14ievn
• Linear Predictive Coding – LPC
Utilisé pour compresser la voix dans la téléphonie
double[20]
• Fenêtres de 25ms
• Empreinte vocale = moyenne des double[20]
Extraction des caractéristiques
…
Empreinte vocale
Fen. 1
Fen. 2 Moyenne
27. @AmauryCrickx#dv14ievn
Une poignée de classes
Recognito
Voice
Activity
Detector
Normalizer
Features
Extractor
Window
Function
LPC
Distance
Calculator
Voice
Print
39. @AmauryCrickx#dv14ievn
Modalités d’authentification
• Vérificateur humain
• Encore plus difficile à contrefaire
• Détection de traitements numériques
• Sensible au bruit environnant
3. En continu au cours d’une conversation
Enrôlement : première conversation vérifiée
44. @AmauryCrickx#dv14ievn
Crédit image / Creative Commons
• Rue pavée — By-Nc-Sa
•http://www.flickr.com/photos/22914687@N05/4957591422/sizes/l/
• Sous la Tour Eiffel — By-Nc-Sa
•http://www.flickr.com/photos/stewiedewie/244850735/sizes/l/in/photostream/
• Sous le pont — photo par B.Monginoux - By-Nc-Nd
•http://www.landscape-photo.net/displayimage.php?pid=5194
• Le Louvre – Photo par Anthony Gaudun - By-Nc-Sa
•http://www.flickr.com/photos/anthonygaudun/7474397964/sizes/o/in/photostream/
• Slide template created by @glaforge, completed by @nmartignole for Devoxx FR2014