5. L’ a r b r e c o m p l e t c o m p r e n d 3 294 mots et marques de ponctuation.
animation créée grâce à ManyEyes (IBM)
à partir du texte descriptif de la subvention de recherche CRSNG du LiNCS
TEXTES
extraire, analyser, visualiser, comprendre
8. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
9. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
10. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
11. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
12. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
13. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
14. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
15. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
16. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
17. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
18. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
19. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
20. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
21. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
22. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
23. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
24. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
25. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
26. Applications multiples
• Expansion d’abréviations SMS sur cellulaire
• Moteur de recherche intelligent
• Web sémantique
• Filtre anti-spam
• Classification de fils de nouvelles RSS
• Extraction de patrons dans les articles
scientifiques
• et plus encore ...
28. Domaines multiples
• biologie Capture Relations in Biomedical Text Analyzing Gap between Workflows and NL Descriptions Finding Defects in NL Confidentiality Requirements
Characterizing Trajectories of Moving Objects Processing NL Requirements
Mobile Medecine: Drug Information through NL SMS Texts for a Cognitive Vision System
• médecine Intelligent User Interfaces for Wikis Mapping Natural Language to Imagery Automation of Requirements Analysis
Integrating Requirements and Model-Driven Engineering NL Interface for Crime-related Queries
• génie logiciel Text Mining for Clinical Medical Records Automatic Construction of UML Diagrams Web 2.0 and NLP
Translation NL into Temporal and Dynamic Logic Mapping NL to Imagery Dependability Analysis in Industrial Use Cases
• sciences cognitives Event Model for Analysis of Verb Sense
Integrating BPM and Governing Documents Automated Identification of LTL Patterns
Automatic Diagram Drawing Animated Agent that Understand NL
SMS Text Normalization Automated Conceptual Data Modeling Extracting Causation Knowledge
• informatique mobile Fact Extraction from Source Code Multilingual Understanding of Natural Business Rules
User-Friendly Interface for Fingerprint Systems
• communication et média Intelligent Decision Support System
• ingénierie des connaissance
33. le journaliste et Bush ?
le ministre et le journaliste ?
Pourquoi est-ce difficile?
Bush et le ministre?
Qui serrait la main du ministre ?
• les langues naturelles sont ambiguës
Le bureau de qui?
• les références pas toujours évidentes
Georges W. Bush pensait qu’il allait tranquillement finir son mandat après une
tournée en Irak. Lors d’une conférence de presse un journaliste lui a lancé, sans
l'atteindre, deux chaussures et l'a insulté au moment où ce dernier serrait la
main du Premier ministre irakien dans son bureau à Bagdad.
Alors que les deux hommes se rencontraient dans le bureau privé du Premier
ministre Nouri al-Maliki, un journaliste irakien, assis au troisième rang, a bondi
et lancé ses chaussures sur le président américain.
34. Pourquoi est-ce difficile?
• les langues naturelles sont ambiguës
• les références pas toujours évidentes
• les documents comportent toutes
sortes d’objets
35. Pourquoi est-ce difficile?
• les langues naturelles sont ambiguës des titres des images
• les références pas toujours évidentes
• les documents comportent toutes des tableaux
sortes d’objets
et bien sûr...
des graphiques du texte
36. Pourquoi est-ce difficile?
• les langues naturelles sont ambiguës
• les références pas toujours évidentes
• les documents comportent toutes
sortes d’objets
• les concepts peuvent s’exprimer de
plusieurs manières
37. Pourquoi est-ce difficile?
• les langues naturelles sont ambiguës
• les références pas toujours évidentes
• les documents comportent toutes
sortes d’objets
OVNI
• les concepts peuvent s’exprimer de
plusieurs manières hallucination
soucoupe volante
engin extraterrestre
40. Extraire pour comprendre et pour constuire
des groupes/des classifications
• Donner un sens à l’information
• Selon les domaines...
• Selon les spécialisations...
• Selon les préférences de l’utilisateur...
• Selon les besoins...
41. Extraire pour comprendre et pour constuire
• Donner un sens à l’information
• Selon les domaines...
• Selon les spécialisations...
• Selon les préférences de l’utilisateur...
• Selon les besoins...
42. Extraire pour comprendre et pour constuire
des alertes/des identifications
• Donner un sens à l’information
• Selon les domaines...
• Selon les spécialisations...
• Selon les préférences de l’utilisateur...
• Selon les besoins...
43. Extraire pour comprendre et pour constuire
• Donner un sens à l’information
• Selon les domaines...
• Selon les spécialisations...
• Selon les préférences de l’utilisateur...
• Selon les besoins...
44. Extraire pour comprendre et pour constuire
des domaines
• Donner un sens à l’information
• Selon les domaines...
• Selon les spécialisations...
• Selon les préférences de l’utilisateur...
• Selon les besoins...
45. Extraire pour comprendre et pour constuire
• Donner un sens à l’information
• Selon les domaines...
• Selon les spécialisations...
• Selon les préférences de l’utilisateur...
• Selon les besoins...
46. Extraire pour comprendre et pour constuire
des processus
• Donner un sens à l’information
• Selon les domaines...
• Selon les spécialisations...
• Selon les préférences de l’utilisateur...
• Selon les besoins...
47. Extraire pour comprendre et pour constuire
• Donner un sens à l’information
• Selon les domaines...
• Selon les spécialisations...
• Selon les préférences de l’utilisateur...
• Selon les besoins...
48. Extraire pour comprendre et pour constuire
des besoins
• Donner un sens à l’information
• Selon les domaines...
• Selon les spécialisations...
• Selon les préférences de l’utilisateur...
• Selon les besoins...
49. Extraire pour comprendre et pour constuire
• Donner un sens à l’information
• Selon les domaines...
• Selon les spécialisations...
• Selon les préférences de l’utilisateur...
• Selon les besoins...
50. Extraire pour comprendre et pour constuire
... des interactions
• Donner un sens à l’information
• Selon les domaines...
• Selon les spécialisations...
• Selon les préférences de l’utilisateur...
• Selon les besoins...
52. Clustering
• Leclustering consiste à former des
groupes naturels.
• Lesdocuments similaires se
retrouvent dans les mêmes groupes.
• Lestechniques de clustering
permettent d’identifier rapidement
des classifications possibles.
53. Clustering
• Leclustering consiste à former des
groupes naturels.
• Lesdocuments similaires se
retrouvent dans les mêmes groupes.
• Lestechniques de clustering
permettent d’identifier rapidement
des classifications possibles.
55. Réduction de la dimensionalité
• Prenons un ensemble de 3 petits textes.
• Total: 3 mots différents A le gros chat chat chat
• Construisons un tableau qui contient le
nombre de fois que chaque mot B le ... le gros chat!
apparaît dans chaque texte. C le gros gros gros gros chat
• Chaque ligne représente gros le chat
en fait un point
dans l’espace.
(1,1,3)
A 1 1 3
• Pour réduire le nombre (4,1,1) B 1 2 1
de dimensions, il faudra
choisir un plan 2D.
(1,2,1)
C 4 1 1
58. Réduction de la dimensionalité
• Pour passer de 3 à 2 dimensions, on
choisit deux composantes.
• Pour passer de 500 à 10 dimensions, on
choisit 10 composantes.
59. Réduction de la dimensionalité
• Pour passer de 3 à 2 dimensions, on
choisit deux composantes.
• Pour passer de 500 à 10 dimensions, on
choisit 10 composantes.
et la bonne projection
61. Élimination des mots «vides»
Pour obtenir des résultats intéressants, il arrive souvent que l’on doive
éliminer ce que l’on appelle des mots « vides » (mots outils, mots
fonctionnels, ou « stop words »): de, à, la, les, etc.
Constatez la différence.
63. Analyse syntaxique
• consisteà construire une structure Phrase
permettant de repérer les éléments SV
constitutifs des phrases.
SV
SV SP SP
SN SV SN SN SN
• L’analyse pourra être complète...
le Colonel Mustard a étranglé Madame Peacock sur le balcon avec la corde.
• ou partielle («shallow»).
SN SV SN SN SN
65. Interprétation sémantique
• Dans les deux cas, l’étape suivante le Colonel Mustard a étranglé Madame Peacock sur le balcon avec la corde.
consiste à identifier les éléments Colonel Mustard Madame Peacock balcon corde
signifiants...
• ... et leur donner une représentation... t_colonel_mustard
étrangle
t_madame_peacock
• ...adaptée au domaine...
cm
• ...aux points de vue... étr mp
• ...aux utilisateurs.
cor
balcon
67. Binocle
Analyse automatique de documents en génie
logiciel : de la langue naturelle à la représentation
visuelle
68. Binocle
Analyse automatique de documents en génie
Réaliser le prototype d'un système logiciel : de la langue naturelle à la représentation
visuelle
permettant de traduire visuellement
des textes corporatifs de définition
de règles d'affaires dans le contexte
du génie logiciel. Cette preuve de
concept vise à établir une mise en
contexte fonctionnelle à partir de
laquelle des recherches plus
avancées pourront être élaborées.
70. A.A.R.TIC
Apprentissage - Adaptatif - Repères - Technologies
de l’information et des communications
Développer un environnement informatique
d’apprentissage humain (EIAH) qui assiste
l’étudiant dans l’assimilation des concepts
théoriques à travers des exemples les
illustrant. L’EIAH proposé s’adapte aux
expériences des étudiants grâce à deux
agents intelligents: l’accompagnateur, associé
à l’étudiant, et l’observateur, associé à
l’enseignant.
71.
72. Les Co.Lab.Orateurs du LiNCS
Pierre André Ménard
L’occasion pour les étudiants de rencontrer Frédéric Monchamp
leurs collègues et d’échanger sur leurs Felipe Padilla
projets de recherche respectifs. Otilia Alejandro
Exposer un problème Montrer l’avancement de son Paul Laurier
projet Tester une présentation de conférence Tester Ludovic Niepce
un poster Demander une rétroaction Combattre le
syndrome de la page blanche Youness Fareh
Alexandra Gonzalez
1 orateur + 1 public Faten Mhiri
Benoît Borrel
Présentation de [ 10 .. 30 ] min.
Manuelle Gagnon
73. Département de génie logiciel et des TI
École de technologie supérieure
Sylvie.Ratte@etsmtl.ca
A-3440
74. Lincs.etsmtl.ca
lin
CS
Département de génie logiciel et des TI
École de technologie supérieure
Sylvie.Ratte@etsmtl.ca
A-3440