SlideShare uma empresa Scribd logo
1 de 27
Soutenance du Stage d’application

Mise en place d’une API de
reconnaissance vocale
Présenté par :
Salma ES-SALMANI
Encadré par :
Abdelwahed El Mourabit
02/11/2013

Soutenu devant les membres de jury

• Pr Mohammed Berrada
• Pr Nour Houda Chaoui Mejhed
Stage d'application Soft Centre
Présentation de l’organisme d’accueil

Contexte du projet et problématique

Principe de la reconnaissance vocale

Démarche de réalisation du projet

Présentation de l’outil réalisé

Conclusion

02/11/2013

Stage d'application Soft Centre

2
Présentation
de
l’organisme d’accueil

Contexte du projet La reconnaissance
& Problématique
vocale

Démarche de
réalisation du projet

Présentation de
l’outil

Conclusion

Centre de R&D spécialisé dans le développement logiciel
Fondé en 2010

02/11/2013

Stage d'application Soft Centre

3
Présentation
de
l’organisme d’accueil

02/11/2013

Contexte du projet
Reconnaissance Démarche de
& Problématique
vocale
réalisation du projet

Stage d'application Soft Centre

Présentation de
l’outil

Conclusion

4
Présentation
de
l’organisme d’accueil

Contexte du projet
Reconnaissance Démarche de
& Problématique
vocale
réalisation du projet

Présentation de
l’outil

Conclusion

Mode de fonctionnement

02/11/2013

Stage d'application Soft Centre

5
Présentation de
l’organisme d’accueil

Contexte du projet
& Problématique

Reconnaissance Démarche de
vocale
réalisation du projet

Présentation de
l’outil

Conclusion

• Les Interfaces Homme-Machine (IHM) évoluent vers une
communication plus large et pervasive
• La reconnaissance vocale permet de réaliser des interfaces vocales où
l’interaction se fait via la voix. L’interface devient alors plus intuitive et
moins encombrante pour l’utilisateur dans son quotidien.

02/11/2013

Stage d'application Soft Centre

6
Présentation de
l’organisme d’accueil

Contexte du projet
& Problématique

Reconnaissance Démarche de
vocale
réalisation du projet

Présentation de
l’outil

Conclusion

Problématique

• Comment offrir aux développeurs une API simple et robuste capable de
reconnaître des mots prononcés dans n’importe quelle langue ?
• Dans le cas d’une application mobile, comment reconnaître n’importe
quelle voix dans des conditions acoustiques variables et souvent bruyantes
?

02/11/2013

Stage d'application Soft Centre

7
Présentation de
l’organisme d’accueil

Contexte du projet
& Problématique

Reconnaissance Démarche de
vocale
réalisation du projet

Présentation de
l’outil

Conclusion

Réalisation d’une API Java de reconnaissance vocale

Reconnaissance de plusieurs dictionnaires de mots
(sélecteur de menus)
Optimisation des performances pour un niveau de
qualité à la hauteur d’un déploiement industriel

02/11/2013

Stage d'application Soft Centre

8
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Démarche de réalisation Présentation de
l’outil
La reconnaissance du projet
vocale

Conclusion

• Problème de base : identifier le sens d’un flux de paroles
prononcées souvent dans un bruit de fond plus ou moins important
• Approche probabiliste :

02/11/2013

Stage d'application Soft Centre

9
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Démarche de réalisation Présentation de
l’outil
La reconnaissance du projet
vocale

Conclusion

Les modèles de Markov cachés
• Les Modèles de Markov Discrets sont
basés sur une suite (ou boucle) d’états

dans lesquels on navigue par des
probabilités de transition et suivant
des observations

• Grâce à ces modèles, on peu
connaître, sachant l’observation
passée quelle va être la probabilité des
observations futures.

02/11/2013

Stage d'application Soft Centre

10
Présentation de
l’organisme d’accueil

02/11/2013

Contexte du
projet &
Problématique

Démarche de réalisation
Reconnaissance du projet
vocale

Stage d'application Soft Centre

Présentation de
l’outil

Conclusion

11
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Démarche de réalisation
Reconnaissance du projet
vocale

Présentation de
l’outil

Conclusion

HTK
Hidden Markov Model Toolkit est un ensemble
d’outils portables permettant la création et la
manipulation des modèles de Markov cachés.
HTK est principalement utilisé dans le domaine de
la recherche de la reconnaissance vocale bien
qu’il soit tout à fait utilisable dans de nombreuses
autres applications telles que la synthèse
vocale, la reconnaissance de l’écriture ou la
reconnaissance de séquences d’ADN.

02/11/2013

Stage d'application Soft Centre

12
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Démarche de réalisation
Reconnaissance du projet
vocale

Présentation de
l’outil

Conclusion

Sphinx 4
Sphinx-4 est une librairie de reconnaissance
vocale écrite entièrement en Java.
Sphinx-4 est hautement configurable. La
reconnaissance de Sphinx-4 supporte notamment
les mots isolés et les phrases (utilisation de
grammaires). L’architecture de Sphinx-4 est
modulable pour permettre de nouvelles
recherches et pour tester de nouveaux
algorithmes.

02/11/2013

Stage d'application Soft Centre

13
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Reconnaissance
Présentation de
Démarche de réalisation du
vocale
l’outil
projet

Conclusion

Outil de reconnaissance
HTK a été choisi parmi les 2 logiciels grâce à son architecture flexible et sa
disponibilité en ligne de commande, ce qui lui permet de s’intégrer
facilement dans n’importe quelle architecture logicielle.

La documentation détaillée disponible ainsi que le support de Microsoft est
un autre plus pour justifier ce choix.

02/11/2013

Stage d'application Soft Centre

14
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Reconnaissance
Présentation de
Démarche de réalisation du
vocale
l’outil
projet

Conclusion

Language de programmation
On a choisi le langage Java pour l’API alors que le C++ est plus naturel avec
l’outil HTK :
• Garbage Collector qui donne un meilleur time to market et moins de bugs

• Process de build dure en moyenne 7 minutes, par rapport à 20h pour C++ à
cause des outils tels que Ant et Maven
• Portabilité du code source qui pourra s’exécuter aisément sur un poste local
équipé de Windows ou un serveur en Linux
• Meilleur support pour l’I/O, networking, XML/HTML, database connectivity ...

02/11/2013

Stage d'application Soft Centre

15
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Reconnaissance
Présentation de
Démarche de réalisation du
vocale
l’outil
projet

Conclusion

ORM
Hibernate est un ORM qui apporte une solution aux
problèmes d'adaptation entre le paradigme objet et

les SGBD en remplaçant les accès à la base de
données par des appels à des méthodes objet de
haut niveau.

La quantité de code ainsi épargnée est très
importante d'autant que ce code est généralement
fastidieux et redondant.
02/11/2013

Stage d'application Soft Centre

16
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Reconnaissance
Présentation de
Démarche de réalisation du
vocale
l’outil
projet

Conclusion

Persistance
MySQL est un serveur de bases de données
relationnelles SQL développé dans un souci de

performances élevées en lecture. Il est multi-thread
et multi-utilisateur.

Le schéma simple des tables de la base de donnée
permet une transition éventuelle en format clé-valeur
(NoSQL) pour assurer une meilleure scalabilité du
service
02/11/2013

Stage d'application Soft Centre

17
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Reconnaissance
Présentation de
Démarche de réalisation du
vocale
l’outil
projet

Conclusion

Audio Input
Audacity est un logiciel libre pour la manipulation de données audio numériques. Il

permet d'enregistrer du son numérique par le biais des entrées ligne/micro/cd des
cartes sons. Il permet d'éditer (copier, coller, sectionner…) les sons sur plusieurs
pistes, et il est accompagné de divers filtres et effets : pitch, tempo, réduction de
bruit, égaliseur, filtres de Fourier, …

Ce logiciel a été utilisé pour la capture et la préparation des samples à mettre dans
la base d’apprentissage et de test

02/11/2013

Stage d'application Soft Centre

18
Présentation
de Contexte du projet Reconnaissance Démarche de
l’organisme d’accueil & Problématique
vocale
réalisation du projet

02/11/2013

Stage d'application Soft Centre

Présentation de
l’outil

Conclusion

19
Présentation de
l’organisme d’accueil

02/11/2013

Contexte du
projet &
Problématique

Reconnaissance
vocale

Présentation de
l’application

Stage d'application Soft Centre

Présentation de l’outil

Conclusion

20
Présentation de
l’organisme d’accueil

02/11/2013

Contexte du
projet &
Problématique

Reconnaissance
vocale

Démarche de
réalisation du projet

Stage d'application Soft Centre

Présentation de
l’application

Conclusion

21
Présentation de
l’organisme d’accueil

02/11/2013

Contexte du
projet &
Problématique

Reconnaissance
vocale

Démarche de réalisation
Présentation de
du projet

Stage d'application Soft Centre

Conclusion

l’application

22
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Reconnaissance
vocale

Démarche de réalisation
Présentation de
du projet

Conclusion

l’application

Pour satisfaire le seuil défini dans le cahier
de charges, il a fallu optimiser les
paramètres de traitement du signal sonore
(échantillonnage, …) et les adapter aux
spécifités du locuteur (origine
ethnique, bruit de fond …)
On propose alors au développeur le choix
entre 2 algorithmes pour améliorer le taux
de reconnaissance :

• A* qui utilise l’évaluation heuristique
pour estimer le meilleur chemin entre 2
nœuds.

02/11/2013

Stage d'application Soft Centre

23
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Reconnaissance
vocale

Démarche de réalisation
Présentation de
du projet

Conclusion

l’application

• Un algorithme génétique
qui, grâce à un procédé de
sélection naturelle appliqué
à une population de
solutions
potentielles, approche la
solution par bonds
successifs (brassage).

02/11/2013

Stage d'application Soft Centre

24
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Reconnaissance Démarche de
vocale
réalisation du projet

Présentation de
l’application

Conclusion

Perspectives

Automatiser l’étape d’alimentation des bases de données d’apprentissage
et de test, via une application mobile par exemple, pour un meilleur taux
de reconnaissance

Héberger l’API dans le Cloud (IAAS/PAAS) pour une gestion
transparente de la montée en charge, surtout dans un environnement
distribué

02/11/2013

Stage d'application Soft Centre

25
Présentation de
l’organisme d’accueil

Contexte du
projet &
Problématique

Reconnaissance Démarche de
vocale
réalisation du projet

Présentation de
l’application

Conclusion

Conclusion

• Bilan professionnel : interface entre la recherche académique et les
industriels du secteur TI pour produire du logiciel innovant

• Bilan personnel : expérience intéressante, rencontres enrichissantes

02/11/2013

Stage d'application Soft Centre

26
?
02/11/2013

Questions - Réponses

Stage d'application Soft Centre

27

Mais conteúdo relacionado

Mais procurados

Plateforme d’e learning
Plateforme d’e learningPlateforme d’e learning
Plateforme d’e learningEl Aber Haythem
 
Rapport- Conception et réalisation d'une plateforme social learning
Rapport- Conception et réalisation d'une plateforme social learningRapport- Conception et réalisation d'une plateforme social learning
Rapport- Conception et réalisation d'une plateforme social learningRouâa Ben Hammouda
 
Rapport PFE : Développement D'une application de gestion des cartes de fidéli...
Rapport PFE : Développement D'une application de gestion des cartes de fidéli...Rapport PFE : Développement D'une application de gestion des cartes de fidéli...
Rapport PFE : Développement D'une application de gestion des cartes de fidéli...Riadh K.
 
Rapport de stage développement informatique
Rapport de stage développement informatique Rapport de stage développement informatique
Rapport de stage développement informatique MehdiOuqas
 
Rapport pfe talan_2018_donia_hammami
Rapport pfe talan_2018_donia_hammamiRapport pfe talan_2018_donia_hammami
Rapport pfe talan_2018_donia_hammamiDonia Hammami
 
Réalisation d’un site web pour la Clinique des Oasis Ghardaïa
Réalisation d’un site web pour la Clinique des Oasis GhardaïaRéalisation d’un site web pour la Clinique des Oasis Ghardaïa
Réalisation d’un site web pour la Clinique des Oasis GhardaïaBachir Benyammi
 
Conception et réalisation d'une application de gestion intégrée au sein de la...
Conception et réalisation d'une application de gestion intégrée au sein de la...Conception et réalisation d'une application de gestion intégrée au sein de la...
Conception et réalisation d'une application de gestion intégrée au sein de la...Addi Ait-Mlouk
 
Conception d’une plateforme web d’e-Commerce au sein d’une entreprise commerc...
Conception d’une plateforme web d’e-Commerce au sein d’une entreprise commerc...Conception d’une plateforme web d’e-Commerce au sein d’une entreprise commerc...
Conception d’une plateforme web d’e-Commerce au sein d’une entreprise commerc...Symphorien Niyonzima
 
Modèle en v
 Modèle en v Modèle en v
Modèle en vbouye2209
 
Conception et Réalisation d’une Plateforme Web de Gestion des achats
Conception et Réalisation d’une Plateforme Web de Gestion des achats Conception et Réalisation d’une Plateforme Web de Gestion des achats
Conception et Réalisation d’une Plateforme Web de Gestion des achats Ayed CHOKRI
 
Rapport mini-projet Gestion Commerciale D’un Supermarché
Rapport mini-projet  Gestion Commerciale D’un SupermarchéRapport mini-projet  Gestion Commerciale D’un Supermarché
Rapport mini-projet Gestion Commerciale D’un SupermarchéMouad Lousimi
 
Application de gestion des projets en J2EE (Spring-Hibernate) avec architectu...
Application de gestion des projets en J2EE (Spring-Hibernate) avec architectu...Application de gestion des projets en J2EE (Spring-Hibernate) avec architectu...
Application de gestion des projets en J2EE (Spring-Hibernate) avec architectu...Saâd Zerhouni
 
[PFE] Master - Génie logiciel
[PFE] Master - Génie logiciel  [PFE] Master - Génie logiciel
[PFE] Master - Génie logiciel Louati Aicha
 
Présentation (Mémoire fin étude )
Présentation (Mémoire  fin étude )Présentation (Mémoire  fin étude )
Présentation (Mémoire fin étude )Ramzi Noumairi
 
Projet de fin étude ( LFIG : Conception et Développement d'une application W...
Projet de fin étude  ( LFIG : Conception et Développement d'une application W...Projet de fin étude  ( LFIG : Conception et Développement d'une application W...
Projet de fin étude ( LFIG : Conception et Développement d'une application W...Ramzi Noumairi
 

Mais procurados (20)

Plateforme d’e learning
Plateforme d’e learningPlateforme d’e learning
Plateforme d’e learning
 
Rapport- Conception et réalisation d'une plateforme social learning
Rapport- Conception et réalisation d'une plateforme social learningRapport- Conception et réalisation d'une plateforme social learning
Rapport- Conception et réalisation d'une plateforme social learning
 
Rapport PFE : Développement D'une application de gestion des cartes de fidéli...
Rapport PFE : Développement D'une application de gestion des cartes de fidéli...Rapport PFE : Développement D'une application de gestion des cartes de fidéli...
Rapport PFE : Développement D'une application de gestion des cartes de fidéli...
 
Rapport de stage développement informatique
Rapport de stage développement informatique Rapport de stage développement informatique
Rapport de stage développement informatique
 
Rapport pfe talan_2018_donia_hammami
Rapport pfe talan_2018_donia_hammamiRapport pfe talan_2018_donia_hammami
Rapport pfe talan_2018_donia_hammami
 
E-learning
E-learningE-learning
E-learning
 
Réalisation d’un site web pour la Clinique des Oasis Ghardaïa
Réalisation d’un site web pour la Clinique des Oasis GhardaïaRéalisation d’un site web pour la Clinique des Oasis Ghardaïa
Réalisation d’un site web pour la Clinique des Oasis Ghardaïa
 
Conception et réalisation d'une application de gestion intégrée au sein de la...
Conception et réalisation d'une application de gestion intégrée au sein de la...Conception et réalisation d'une application de gestion intégrée au sein de la...
Conception et réalisation d'une application de gestion intégrée au sein de la...
 
Conception d’une plateforme web d’e-Commerce au sein d’une entreprise commerc...
Conception d’une plateforme web d’e-Commerce au sein d’une entreprise commerc...Conception d’une plateforme web d’e-Commerce au sein d’une entreprise commerc...
Conception d’une plateforme web d’e-Commerce au sein d’une entreprise commerc...
 
MEMOIRE DE STAGE
MEMOIRE DE STAGEMEMOIRE DE STAGE
MEMOIRE DE STAGE
 
Modèle en v
 Modèle en v Modèle en v
Modèle en v
 
Conception et Réalisation d’une Plateforme Web de Gestion des achats
Conception et Réalisation d’une Plateforme Web de Gestion des achats Conception et Réalisation d’une Plateforme Web de Gestion des achats
Conception et Réalisation d’une Plateforme Web de Gestion des achats
 
Rapport mini-projet Gestion Commerciale D’un Supermarché
Rapport mini-projet  Gestion Commerciale D’un SupermarchéRapport mini-projet  Gestion Commerciale D’un Supermarché
Rapport mini-projet Gestion Commerciale D’un Supermarché
 
Application de gestion des projets en J2EE (Spring-Hibernate) avec architectu...
Application de gestion des projets en J2EE (Spring-Hibernate) avec architectu...Application de gestion des projets en J2EE (Spring-Hibernate) avec architectu...
Application de gestion des projets en J2EE (Spring-Hibernate) avec architectu...
 
iRecruite
iRecruiteiRecruite
iRecruite
 
Pfe 2015
Pfe 2015Pfe 2015
Pfe 2015
 
[PFE] Master - Génie logiciel
[PFE] Master - Génie logiciel  [PFE] Master - Génie logiciel
[PFE] Master - Génie logiciel
 
Présentation (Mémoire fin étude )
Présentation (Mémoire  fin étude )Présentation (Mémoire  fin étude )
Présentation (Mémoire fin étude )
 
Projet de fin étude ( LFIG : Conception et Développement d'une application W...
Projet de fin étude  ( LFIG : Conception et Développement d'une application W...Projet de fin étude  ( LFIG : Conception et Développement d'une application W...
Projet de fin étude ( LFIG : Conception et Développement d'une application W...
 
Rapport de stage du fin d'étude
Rapport de stage du fin d'étudeRapport de stage du fin d'étude
Rapport de stage du fin d'étude
 

Destaque

La reconnaissance vocale comme outil de rédaction scientifique
La reconnaissance vocale comme outil de rédaction scientifiqueLa reconnaissance vocale comme outil de rédaction scientifique
La reconnaissance vocale comme outil de rédaction scientifiqueAurélien Fiévez
 
Siri logiciel reconnaissance vocale
Siri logiciel reconnaissance vocaleSiri logiciel reconnaissance vocale
Siri logiciel reconnaissance vocalejojolapin2
 
Kaldi-voice: Your personal speech recognition server using open source code
Kaldi-voice: Your personal speech recognition server using open source codeKaldi-voice: Your personal speech recognition server using open source code
Kaldi-voice: Your personal speech recognition server using open source codeXavier Anguera
 
Design Thinking Assignment
Design Thinking AssignmentDesign Thinking Assignment
Design Thinking AssignmentSalma ES-Salmani
 
OCCIware, an extensible, standard-based XaaS consumer platform to manage ever...
OCCIware, an extensible, standard-based XaaS consumer platform to manage ever...OCCIware, an extensible, standard-based XaaS consumer platform to manage ever...
OCCIware, an extensible, standard-based XaaS consumer platform to manage ever...OCCIware
 
Ressource numérique Circuit électrique au primaire
Ressource numérique Circuit électrique au primaire Ressource numérique Circuit électrique au primaire
Ressource numérique Circuit électrique au primaire Erradi Mohamed
 
النشاط العلمي - الكهرباء
النشاط العلمي  -   الكهرباءالنشاط العلمي  -   الكهرباء
النشاط العلمي - الكهرباءErradi Mohamed
 
OCL Specification Status
OCL Specification StatusOCL Specification Status
OCL Specification StatusEdward Willink
 
Model Transformation A Personal Perspective
Model Transformation A Personal PerspectiveModel Transformation A Personal Perspective
Model Transformation A Personal PerspectiveEdward Willink
 
La & edm in practice
La & edm in practiceLa & edm in practice
La & edm in practicebharati k
 
The Importance of Opposites
The Importance of OppositesThe Importance of Opposites
The Importance of OppositesEdward Willink
 
Collaboration and Governance of Open Source Projects
Collaboration and Governance of Open Source ProjectsCollaboration and Governance of Open Source Projects
Collaboration and Governance of Open Source ProjectsJordi Cabot
 
SysML adoption in France
SysML adoption in FranceSysML adoption in France
SysML adoption in FrancePascal Roques
 
Local Optimizations in Eclipse QVTc and QVTr using the Micro-Mapping Model of...
Local Optimizations in Eclipse QVTc and QVTr using the Micro-Mapping Model of...Local Optimizations in Eclipse QVTc and QVTr using the Micro-Mapping Model of...
Local Optimizations in Eclipse QVTc and QVTr using the Micro-Mapping Model of...Edward Willink
 
Be serious with sirius your journey from first experimentation to large deplo...
Be serious with sirius your journey from first experimentation to large deplo...Be serious with sirius your journey from first experimentation to large deplo...
Be serious with sirius your journey from first experimentation to large deplo...Etienne Juliot
 
Developpement mobile vs open source
Developpement mobile vs open sourceDeveloppement mobile vs open source
Developpement mobile vs open sourceKorteby Farouk
 

Destaque (20)

La reconnaissance vocale comme outil de rédaction scientifique
La reconnaissance vocale comme outil de rédaction scientifiqueLa reconnaissance vocale comme outil de rédaction scientifique
La reconnaissance vocale comme outil de rédaction scientifique
 
Siri logiciel reconnaissance vocale
Siri logiciel reconnaissance vocaleSiri logiciel reconnaissance vocale
Siri logiciel reconnaissance vocale
 
Kaldi-voice: Your personal speech recognition server using open source code
Kaldi-voice: Your personal speech recognition server using open source codeKaldi-voice: Your personal speech recognition server using open source code
Kaldi-voice: Your personal speech recognition server using open source code
 
What fUML can bring to MBSE?
What fUML can bring to MBSE?What fUML can bring to MBSE?
What fUML can bring to MBSE?
 
Design Thinking Assignment
Design Thinking AssignmentDesign Thinking Assignment
Design Thinking Assignment
 
OCCIware, an extensible, standard-based XaaS consumer platform to manage ever...
OCCIware, an extensible, standard-based XaaS consumer platform to manage ever...OCCIware, an extensible, standard-based XaaS consumer platform to manage ever...
OCCIware, an extensible, standard-based XaaS consumer platform to manage ever...
 
Ressource numérique Circuit électrique au primaire
Ressource numérique Circuit électrique au primaire Ressource numérique Circuit électrique au primaire
Ressource numérique Circuit électrique au primaire
 
Mix
MixMix
Mix
 
Cvl
CvlCvl
Cvl
 
النشاط العلمي - الكهرباء
النشاط العلمي  -   الكهرباءالنشاط العلمي  -   الكهرباء
النشاط العلمي - الكهرباء
 
OCL Specification Status
OCL Specification StatusOCL Specification Status
OCL Specification Status
 
Model Transformation A Personal Perspective
Model Transformation A Personal PerspectiveModel Transformation A Personal Perspective
Model Transformation A Personal Perspective
 
La & edm in practice
La & edm in practiceLa & edm in practice
La & edm in practice
 
The Importance of Opposites
The Importance of OppositesThe Importance of Opposites
The Importance of Opposites
 
Collaboration and Governance of Open Source Projects
Collaboration and Governance of Open Source ProjectsCollaboration and Governance of Open Source Projects
Collaboration and Governance of Open Source Projects
 
SysML adoption in France
SysML adoption in FranceSysML adoption in France
SysML adoption in France
 
Local Optimizations in Eclipse QVTc and QVTr using the Micro-Mapping Model of...
Local Optimizations in Eclipse QVTc and QVTr using the Micro-Mapping Model of...Local Optimizations in Eclipse QVTc and QVTr using the Micro-Mapping Model of...
Local Optimizations in Eclipse QVTc and QVTr using the Micro-Mapping Model of...
 
UMLX and QVT and ATL
UMLX and QVT and ATLUMLX and QVT and ATL
UMLX and QVT and ATL
 
Be serious with sirius your journey from first experimentation to large deplo...
Be serious with sirius your journey from first experimentation to large deplo...Be serious with sirius your journey from first experimentation to large deplo...
Be serious with sirius your journey from first experimentation to large deplo...
 
Developpement mobile vs open source
Developpement mobile vs open sourceDeveloppement mobile vs open source
Developpement mobile vs open source
 

Semelhante a Speech Recognition API

Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetiteGab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetiteAZUG FR
 
OpenStack & DevOps, l'Open Source au service du Cloud
OpenStack & DevOps, l'Open Source au service du CloudOpenStack & DevOps, l'Open Source au service du Cloud
OpenStack & DevOps, l'Open Source au service du CloudMichel-Marie Maudet
 
Industrialiser PHP - Open World Forum 2011
Industrialiser PHP - Open World Forum 2011Industrialiser PHP - Open World Forum 2011
Industrialiser PHP - Open World Forum 2011Jean-Marc Fontaine
 
Solution Linux 2012 : Utilisateurs du Libre ne restez pas dans votre coin
Solution Linux 2012 : Utilisateurs du Libre ne restez pas dans votre coinSolution Linux 2012 : Utilisateurs du Libre ne restez pas dans votre coin
Solution Linux 2012 : Utilisateurs du Libre ne restez pas dans votre coinAnne Nicolas
 
memoire sur la technologie de RIA
memoire sur la technologie de RIAmemoire sur la technologie de RIA
memoire sur la technologie de RIAifis
 
defuzeme_documentation_technique.pdf
defuzeme_documentation_technique.pdfdefuzeme_documentation_technique.pdf
defuzeme_documentation_technique.pdfSami Asmar
 
Présentation Sollan I-Expo 2008
Présentation Sollan I-Expo 2008Présentation Sollan I-Expo 2008
Présentation Sollan I-Expo 2008mlefebvre
 
OCCIware presentation au groupe de travail Big Data du SCS
OCCIware presentation au groupe de travail Big Data du SCSOCCIware presentation au groupe de travail Big Data du SCS
OCCIware presentation au groupe de travail Big Data du SCSOCCIware
 
conception et réalisation plateforme collaboratif basant sur la methode agile...
conception et réalisation plateforme collaboratif basant sur la methode agile...conception et réalisation plateforme collaboratif basant sur la methode agile...
conception et réalisation plateforme collaboratif basant sur la methode agile...Sid Ahmed Benkraoua
 
OpenStack - open source au service du Cloud
OpenStack - open source au service du CloudOpenStack - open source au service du Cloud
OpenStack - open source au service du CloudLINAGORA
 
CV Saddam ZEMMALI Professionel Fr
CV Saddam ZEMMALI Professionel FrCV Saddam ZEMMALI Professionel Fr
CV Saddam ZEMMALI Professionel FrSaddam ZEMMALI ☁
 
Présentation programme OREE
Présentation programme OREEPrésentation programme OREE
Présentation programme OREECYB@RDECHE
 
Compte rendu oscon 2013
Compte rendu oscon 2013Compte rendu oscon 2013
Compte rendu oscon 2013Jean Desbiens
 
Innover sans contrainte, intégrer sans rupture
Innover sans contrainte, intégrer sans ruptureInnover sans contrainte, intégrer sans rupture
Innover sans contrainte, intégrer sans ruptureGuillaume Laforge
 
Amener vos applications Dockerisées jusqu’en production avec XebiaLabs
Amener vos applications Dockerisées jusqu’en production avec XebiaLabs �Amener vos applications Dockerisées jusqu’en production avec XebiaLabs �
Amener vos applications Dockerisées jusqu’en production avec XebiaLabs XebiaLabs
 
Presentation du socle technique Java open source Scub Foundation
Presentation du socle technique Java open source Scub FoundationPresentation du socle technique Java open source Scub Foundation
Presentation du socle technique Java open source Scub FoundationStéphane Traumat
 
La gouvernance, ou comment rapprocher les équipes de développement et d'infra...
La gouvernance, ou comment rapprocher les équipes de développement et d'infra...La gouvernance, ou comment rapprocher les équipes de développement et d'infra...
La gouvernance, ou comment rapprocher les équipes de développement et d'infra...PimpMySharePoint
 
Production logicielle, outils et pratiques
Production logicielle, outils et pratiquesProduction logicielle, outils et pratiques
Production logicielle, outils et pratiquesJohan Moreau
 

Semelhante a Speech Recognition API (20)

Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetiteGab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite
Gab17 lyon-rex build dev ops sur une infra iaas-paas multisite-by-matthieupetite
 
OpenStack & DevOps, l'Open Source au service du Cloud
OpenStack & DevOps, l'Open Source au service du CloudOpenStack & DevOps, l'Open Source au service du Cloud
OpenStack & DevOps, l'Open Source au service du Cloud
 
Industrialiser PHP - Open World Forum 2011
Industrialiser PHP - Open World Forum 2011Industrialiser PHP - Open World Forum 2011
Industrialiser PHP - Open World Forum 2011
 
Solution Linux 2012 : Utilisateurs du Libre ne restez pas dans votre coin
Solution Linux 2012 : Utilisateurs du Libre ne restez pas dans votre coinSolution Linux 2012 : Utilisateurs du Libre ne restez pas dans votre coin
Solution Linux 2012 : Utilisateurs du Libre ne restez pas dans votre coin
 
memoire sur la technologie de RIA
memoire sur la technologie de RIAmemoire sur la technologie de RIA
memoire sur la technologie de RIA
 
defuzeme_documentation_technique.pdf
defuzeme_documentation_technique.pdfdefuzeme_documentation_technique.pdf
defuzeme_documentation_technique.pdf
 
Présentation Sollan I-Expo 2008
Présentation Sollan I-Expo 2008Présentation Sollan I-Expo 2008
Présentation Sollan I-Expo 2008
 
OCCIware presentation au groupe de travail Big Data du SCS
OCCIware presentation au groupe de travail Big Data du SCSOCCIware presentation au groupe de travail Big Data du SCS
OCCIware presentation au groupe de travail Big Data du SCS
 
cv_hamidi
cv_hamidicv_hamidi
cv_hamidi
 
conception et réalisation plateforme collaboratif basant sur la methode agile...
conception et réalisation plateforme collaboratif basant sur la methode agile...conception et réalisation plateforme collaboratif basant sur la methode agile...
conception et réalisation plateforme collaboratif basant sur la methode agile...
 
OpenStack - open source au service du Cloud
OpenStack - open source au service du CloudOpenStack - open source au service du Cloud
OpenStack - open source au service du Cloud
 
CV Saddam ZEMMALI Professionel Fr
CV Saddam ZEMMALI Professionel FrCV Saddam ZEMMALI Professionel Fr
CV Saddam ZEMMALI Professionel Fr
 
Présentation programme OREE
Présentation programme OREEPrésentation programme OREE
Présentation programme OREE
 
Diapo PFE
Diapo PFEDiapo PFE
Diapo PFE
 
Compte rendu oscon 2013
Compte rendu oscon 2013Compte rendu oscon 2013
Compte rendu oscon 2013
 
Innover sans contrainte, intégrer sans rupture
Innover sans contrainte, intégrer sans ruptureInnover sans contrainte, intégrer sans rupture
Innover sans contrainte, intégrer sans rupture
 
Amener vos applications Dockerisées jusqu’en production avec XebiaLabs
Amener vos applications Dockerisées jusqu’en production avec XebiaLabs �Amener vos applications Dockerisées jusqu’en production avec XebiaLabs �
Amener vos applications Dockerisées jusqu’en production avec XebiaLabs
 
Presentation du socle technique Java open source Scub Foundation
Presentation du socle technique Java open source Scub FoundationPresentation du socle technique Java open source Scub Foundation
Presentation du socle technique Java open source Scub Foundation
 
La gouvernance, ou comment rapprocher les équipes de développement et d'infra...
La gouvernance, ou comment rapprocher les équipes de développement et d'infra...La gouvernance, ou comment rapprocher les équipes de développement et d'infra...
La gouvernance, ou comment rapprocher les équipes de développement et d'infra...
 
Production logicielle, outils et pratiques
Production logicielle, outils et pratiquesProduction logicielle, outils et pratiques
Production logicielle, outils et pratiques
 

Speech Recognition API

  • 1. Soutenance du Stage d’application Mise en place d’une API de reconnaissance vocale Présenté par : Salma ES-SALMANI Encadré par : Abdelwahed El Mourabit 02/11/2013 Soutenu devant les membres de jury • Pr Mohammed Berrada • Pr Nour Houda Chaoui Mejhed Stage d'application Soft Centre
  • 2. Présentation de l’organisme d’accueil Contexte du projet et problématique Principe de la reconnaissance vocale Démarche de réalisation du projet Présentation de l’outil réalisé Conclusion 02/11/2013 Stage d'application Soft Centre 2
  • 3. Présentation de l’organisme d’accueil Contexte du projet La reconnaissance & Problématique vocale Démarche de réalisation du projet Présentation de l’outil Conclusion Centre de R&D spécialisé dans le développement logiciel Fondé en 2010 02/11/2013 Stage d'application Soft Centre 3
  • 4. Présentation de l’organisme d’accueil 02/11/2013 Contexte du projet Reconnaissance Démarche de & Problématique vocale réalisation du projet Stage d'application Soft Centre Présentation de l’outil Conclusion 4
  • 5. Présentation de l’organisme d’accueil Contexte du projet Reconnaissance Démarche de & Problématique vocale réalisation du projet Présentation de l’outil Conclusion Mode de fonctionnement 02/11/2013 Stage d'application Soft Centre 5
  • 6. Présentation de l’organisme d’accueil Contexte du projet & Problématique Reconnaissance Démarche de vocale réalisation du projet Présentation de l’outil Conclusion • Les Interfaces Homme-Machine (IHM) évoluent vers une communication plus large et pervasive • La reconnaissance vocale permet de réaliser des interfaces vocales où l’interaction se fait via la voix. L’interface devient alors plus intuitive et moins encombrante pour l’utilisateur dans son quotidien. 02/11/2013 Stage d'application Soft Centre 6
  • 7. Présentation de l’organisme d’accueil Contexte du projet & Problématique Reconnaissance Démarche de vocale réalisation du projet Présentation de l’outil Conclusion Problématique • Comment offrir aux développeurs une API simple et robuste capable de reconnaître des mots prononcés dans n’importe quelle langue ? • Dans le cas d’une application mobile, comment reconnaître n’importe quelle voix dans des conditions acoustiques variables et souvent bruyantes ? 02/11/2013 Stage d'application Soft Centre 7
  • 8. Présentation de l’organisme d’accueil Contexte du projet & Problématique Reconnaissance Démarche de vocale réalisation du projet Présentation de l’outil Conclusion Réalisation d’une API Java de reconnaissance vocale Reconnaissance de plusieurs dictionnaires de mots (sélecteur de menus) Optimisation des performances pour un niveau de qualité à la hauteur d’un déploiement industriel 02/11/2013 Stage d'application Soft Centre 8
  • 9. Présentation de l’organisme d’accueil Contexte du projet & Problématique Démarche de réalisation Présentation de l’outil La reconnaissance du projet vocale Conclusion • Problème de base : identifier le sens d’un flux de paroles prononcées souvent dans un bruit de fond plus ou moins important • Approche probabiliste : 02/11/2013 Stage d'application Soft Centre 9
  • 10. Présentation de l’organisme d’accueil Contexte du projet & Problématique Démarche de réalisation Présentation de l’outil La reconnaissance du projet vocale Conclusion Les modèles de Markov cachés • Les Modèles de Markov Discrets sont basés sur une suite (ou boucle) d’états dans lesquels on navigue par des probabilités de transition et suivant des observations • Grâce à ces modèles, on peu connaître, sachant l’observation passée quelle va être la probabilité des observations futures. 02/11/2013 Stage d'application Soft Centre 10
  • 11. Présentation de l’organisme d’accueil 02/11/2013 Contexte du projet & Problématique Démarche de réalisation Reconnaissance du projet vocale Stage d'application Soft Centre Présentation de l’outil Conclusion 11
  • 12. Présentation de l’organisme d’accueil Contexte du projet & Problématique Démarche de réalisation Reconnaissance du projet vocale Présentation de l’outil Conclusion HTK Hidden Markov Model Toolkit est un ensemble d’outils portables permettant la création et la manipulation des modèles de Markov cachés. HTK est principalement utilisé dans le domaine de la recherche de la reconnaissance vocale bien qu’il soit tout à fait utilisable dans de nombreuses autres applications telles que la synthèse vocale, la reconnaissance de l’écriture ou la reconnaissance de séquences d’ADN. 02/11/2013 Stage d'application Soft Centre 12
  • 13. Présentation de l’organisme d’accueil Contexte du projet & Problématique Démarche de réalisation Reconnaissance du projet vocale Présentation de l’outil Conclusion Sphinx 4 Sphinx-4 est une librairie de reconnaissance vocale écrite entièrement en Java. Sphinx-4 est hautement configurable. La reconnaissance de Sphinx-4 supporte notamment les mots isolés et les phrases (utilisation de grammaires). L’architecture de Sphinx-4 est modulable pour permettre de nouvelles recherches et pour tester de nouveaux algorithmes. 02/11/2013 Stage d'application Soft Centre 13
  • 14. Présentation de l’organisme d’accueil Contexte du projet & Problématique Reconnaissance Présentation de Démarche de réalisation du vocale l’outil projet Conclusion Outil de reconnaissance HTK a été choisi parmi les 2 logiciels grâce à son architecture flexible et sa disponibilité en ligne de commande, ce qui lui permet de s’intégrer facilement dans n’importe quelle architecture logicielle. La documentation détaillée disponible ainsi que le support de Microsoft est un autre plus pour justifier ce choix. 02/11/2013 Stage d'application Soft Centre 14
  • 15. Présentation de l’organisme d’accueil Contexte du projet & Problématique Reconnaissance Présentation de Démarche de réalisation du vocale l’outil projet Conclusion Language de programmation On a choisi le langage Java pour l’API alors que le C++ est plus naturel avec l’outil HTK : • Garbage Collector qui donne un meilleur time to market et moins de bugs • Process de build dure en moyenne 7 minutes, par rapport à 20h pour C++ à cause des outils tels que Ant et Maven • Portabilité du code source qui pourra s’exécuter aisément sur un poste local équipé de Windows ou un serveur en Linux • Meilleur support pour l’I/O, networking, XML/HTML, database connectivity ... 02/11/2013 Stage d'application Soft Centre 15
  • 16. Présentation de l’organisme d’accueil Contexte du projet & Problématique Reconnaissance Présentation de Démarche de réalisation du vocale l’outil projet Conclusion ORM Hibernate est un ORM qui apporte une solution aux problèmes d'adaptation entre le paradigme objet et les SGBD en remplaçant les accès à la base de données par des appels à des méthodes objet de haut niveau. La quantité de code ainsi épargnée est très importante d'autant que ce code est généralement fastidieux et redondant. 02/11/2013 Stage d'application Soft Centre 16
  • 17. Présentation de l’organisme d’accueil Contexte du projet & Problématique Reconnaissance Présentation de Démarche de réalisation du vocale l’outil projet Conclusion Persistance MySQL est un serveur de bases de données relationnelles SQL développé dans un souci de performances élevées en lecture. Il est multi-thread et multi-utilisateur. Le schéma simple des tables de la base de donnée permet une transition éventuelle en format clé-valeur (NoSQL) pour assurer une meilleure scalabilité du service 02/11/2013 Stage d'application Soft Centre 17
  • 18. Présentation de l’organisme d’accueil Contexte du projet & Problématique Reconnaissance Présentation de Démarche de réalisation du vocale l’outil projet Conclusion Audio Input Audacity est un logiciel libre pour la manipulation de données audio numériques. Il permet d'enregistrer du son numérique par le biais des entrées ligne/micro/cd des cartes sons. Il permet d'éditer (copier, coller, sectionner…) les sons sur plusieurs pistes, et il est accompagné de divers filtres et effets : pitch, tempo, réduction de bruit, égaliseur, filtres de Fourier, … Ce logiciel a été utilisé pour la capture et la préparation des samples à mettre dans la base d’apprentissage et de test 02/11/2013 Stage d'application Soft Centre 18
  • 19. Présentation de Contexte du projet Reconnaissance Démarche de l’organisme d’accueil & Problématique vocale réalisation du projet 02/11/2013 Stage d'application Soft Centre Présentation de l’outil Conclusion 19
  • 20. Présentation de l’organisme d’accueil 02/11/2013 Contexte du projet & Problématique Reconnaissance vocale Présentation de l’application Stage d'application Soft Centre Présentation de l’outil Conclusion 20
  • 21. Présentation de l’organisme d’accueil 02/11/2013 Contexte du projet & Problématique Reconnaissance vocale Démarche de réalisation du projet Stage d'application Soft Centre Présentation de l’application Conclusion 21
  • 22. Présentation de l’organisme d’accueil 02/11/2013 Contexte du projet & Problématique Reconnaissance vocale Démarche de réalisation Présentation de du projet Stage d'application Soft Centre Conclusion l’application 22
  • 23. Présentation de l’organisme d’accueil Contexte du projet & Problématique Reconnaissance vocale Démarche de réalisation Présentation de du projet Conclusion l’application Pour satisfaire le seuil défini dans le cahier de charges, il a fallu optimiser les paramètres de traitement du signal sonore (échantillonnage, …) et les adapter aux spécifités du locuteur (origine ethnique, bruit de fond …) On propose alors au développeur le choix entre 2 algorithmes pour améliorer le taux de reconnaissance : • A* qui utilise l’évaluation heuristique pour estimer le meilleur chemin entre 2 nœuds. 02/11/2013 Stage d'application Soft Centre 23
  • 24. Présentation de l’organisme d’accueil Contexte du projet & Problématique Reconnaissance vocale Démarche de réalisation Présentation de du projet Conclusion l’application • Un algorithme génétique qui, grâce à un procédé de sélection naturelle appliqué à une population de solutions potentielles, approche la solution par bonds successifs (brassage). 02/11/2013 Stage d'application Soft Centre 24
  • 25. Présentation de l’organisme d’accueil Contexte du projet & Problématique Reconnaissance Démarche de vocale réalisation du projet Présentation de l’application Conclusion Perspectives Automatiser l’étape d’alimentation des bases de données d’apprentissage et de test, via une application mobile par exemple, pour un meilleur taux de reconnaissance Héberger l’API dans le Cloud (IAAS/PAAS) pour une gestion transparente de la montée en charge, surtout dans un environnement distribué 02/11/2013 Stage d'application Soft Centre 25
  • 26. Présentation de l’organisme d’accueil Contexte du projet & Problématique Reconnaissance Démarche de vocale réalisation du projet Présentation de l’application Conclusion Conclusion • Bilan professionnel : interface entre la recherche académique et les industriels du secteur TI pour produire du logiciel innovant • Bilan personnel : expérience intéressante, rencontres enrichissantes 02/11/2013 Stage d'application Soft Centre 26
  • 27. ? 02/11/2013 Questions - Réponses Stage d'application Soft Centre 27