SlideShare uma empresa Scribd logo
1 de 74
fysop.files.wordpress.com/2009/06/words-12.jpg
LINCS
                                                Laboratoire d’ingénierie Cognitive et Sémantique
fysop.files.wordpress.com/2009/06/words-12.jpg
Compréhension
 Modélisation
 Signification
 Information
  Animation
  Extraction
  Cognition
   Domaine
   Humain
   Analyse
    Texte
L’ a r b r e c o m p l e t c o m p r e n d    3 294 mots et marques de ponctuation.




    animation créée grâce à ManyEyes (IBM)
    à partir du texte descriptif de la subvention de recherche CRSNG du LiNCS



                                             TEXTES
                             extraire, analyser, visualiser, comprendre
LES APPLICATIONS
Applications multiples
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
• Expansion    d’abréviations SMS sur cellulaire

• Moteur     de recherche intelligent

• Web      sémantique

• Filtre   anti-spam

• Classification   de fils de nouvelles RSS

• Extraction de patrons dans les articles
  scientifiques

• et   plus encore ...
Applications multiples
Analyzing Gap between Workflows and NL Descriptions
Domaines multiples
• biologie               Capture Relations in Biomedical Text Analyzing Gap between Workflows and NL Descriptions           Finding Defects in NL Confidentiality Requirements
                                          Characterizing Trajectories of Moving Objects     Processing NL Requirements
                                               Mobile Medecine: Drug Information through NL SMS Texts for a Cognitive Vision System
• médecine             Intelligent User Interfaces for Wikis   Mapping Natural Language to Imagery      Automation of Requirements Analysis

                                           Integrating Requirements and Model-Driven Engineering      NL Interface for Crime-related Queries
• génie   logiciel      Text Mining for Clinical Medical Records   Automatic Construction of UML Diagrams       Web 2.0 and NLP
                           Translation NL into Temporal and Dynamic Logic       Mapping NL to Imagery     Dependability Analysis in Industrial Use Cases

• sciences   cognitives Event Model for Analysis of Verb Sense
                                           Integrating BPM and Governing Documents        Automated Identification of LTL Patterns
                                                                          Automatic Diagram Drawing       Animated Agent that Understand NL
                                  SMS Text Normalization       Automated Conceptual Data Modeling       Extracting Causation Knowledge
• informatique       mobile                                    Fact Extraction from Source Code    Multilingual Understanding of Natural Business Rules

                                      User-Friendly Interface for Fingerprint Systems

• communication          et média               Intelligent Decision Support System




• ingénierie   des connaissance
LES DÉFIS
Pourquoi est-ce difficile?
Pourquoi est-ce difficile?
•   les langues naturelles sont ambiguës
Pourquoi est-ce difficile?
• les   langues naturelles sont ambiguës

•   les références pas toujours évidentes
le journaliste et Bush ?
         le ministre et le journaliste ?
                                            Pourquoi est-ce difficile?
              Bush et le ministre?
                                                    Qui serrait la main du ministre ?
• les   langues naturelles sont ambiguës
                                                Le bureau de qui?
•   les références pas toujours évidentes

Georges W. Bush pensait qu’il allait tranquillement finir son mandat après une
tournée en Irak. Lors d’une conférence de presse un journaliste lui a lancé, sans
l'atteindre, deux chaussures et l'a insulté au moment où ce dernier serrait la
main du Premier ministre irakien dans son bureau à Bagdad.
Alors que les deux hommes se rencontraient dans le bureau privé du Premier
ministre Nouri al-Maliki, un journaliste irakien, assis au troisième rang, a bondi
et lancé ses chaussures sur le président américain.
Pourquoi est-ce difficile?
• les   langues naturelles sont ambiguës

• les   références pas toujours évidentes

•   les documents comportent toutes
    sortes d’objets
Pourquoi est-ce difficile?
• les   langues naturelles sont ambiguës          des titres   des images
• les   références pas toujours évidentes

•   les documents comportent toutes                             des tableaux
    sortes d’objets


                                                                et bien sûr...
                                            des graphiques        du texte
Pourquoi est-ce difficile?
• les   langues naturelles sont ambiguës

• les   références pas toujours évidentes

• les  documents comportent toutes
    sortes d’objets

•   les concepts peuvent s’exprimer de
    plusieurs manières
Pourquoi est-ce difficile?
• les   langues naturelles sont ambiguës

• les   références pas toujours évidentes

• les  documents comportent toutes
    sortes d’objets
                                                                      OVNI
•   les concepts peuvent s’exprimer de
    plusieurs manières                        hallucination
                                                                 soucoupe volante
                                              engin extraterrestre
LES REPRÉSENTATIONS
Extraire pour comprendre et pour constuire
Extraire pour comprendre et pour constuire
                                                des groupes/des classifications

• Donner    un sens à l’information

• Selon   les domaines...

• Selon   les spécialisations...

• Selon   les préférences de l’utilisateur...

• Selon   les besoins...
Extraire pour comprendre et pour constuire

• Donner    un sens à l’information

• Selon   les domaines...

• Selon   les spécialisations...

• Selon   les préférences de l’utilisateur...

• Selon   les besoins...
Extraire pour comprendre et pour constuire
                                                des alertes/des identifications

• Donner    un sens à l’information

• Selon   les domaines...

• Selon   les spécialisations...

• Selon   les préférences de l’utilisateur...

• Selon   les besoins...
Extraire pour comprendre et pour constuire

• Donner    un sens à l’information

• Selon   les domaines...

• Selon   les spécialisations...

• Selon   les préférences de l’utilisateur...

• Selon   les besoins...
Extraire pour comprendre et pour constuire
                                                des domaines

• Donner    un sens à l’information

• Selon   les domaines...

• Selon   les spécialisations...

• Selon   les préférences de l’utilisateur...

• Selon   les besoins...
Extraire pour comprendre et pour constuire

• Donner    un sens à l’information

• Selon   les domaines...

• Selon   les spécialisations...

• Selon   les préférences de l’utilisateur...

• Selon   les besoins...
Extraire pour comprendre et pour constuire
                                                des processus

• Donner    un sens à l’information

• Selon   les domaines...

• Selon   les spécialisations...

• Selon   les préférences de l’utilisateur...

• Selon   les besoins...
Extraire pour comprendre et pour constuire

• Donner    un sens à l’information

• Selon   les domaines...

• Selon   les spécialisations...

• Selon   les préférences de l’utilisateur...

• Selon   les besoins...
Extraire pour comprendre et pour constuire
                                                des besoins

• Donner    un sens à l’information

• Selon   les domaines...

• Selon   les spécialisations...

• Selon   les préférences de l’utilisateur...

• Selon   les besoins...
Extraire pour comprendre et pour constuire

• Donner    un sens à l’information

• Selon   les domaines...

• Selon   les spécialisations...

• Selon   les préférences de l’utilisateur...

• Selon   les besoins...
Extraire pour comprendre et pour constuire
                                                ... des interactions

• Donner    un sens à l’information

• Selon   les domaines...

• Selon   les spécialisations...

• Selon   les préférences de l’utilisateur...

• Selon   les besoins...
LES TECHNIQUES ET LES ALGORITHMES
Clustering


• Leclustering consiste à former des
 groupes naturels.

• Lesdocuments similaires se
 retrouvent dans les mêmes groupes.

• Lestechniques de clustering
 permettent d’identifier rapidement
 des classifications possibles.
Clustering


• Leclustering consiste à former des
 groupes naturels.

• Lesdocuments similaires se
 retrouvent dans les mêmes groupes.

• Lestechniques de clustering
 permettent d’identifier rapidement
 des classifications possibles.
Réduction de la dimensionalité
Réduction de la dimensionalité
• Prenons   un ensemble de 3 petits textes.
• Total: 3 mots différents                                  A       le gros chat chat chat
• Construisons un tableau qui contient le
 nombre de fois que chaque mot                              B         le ... le gros chat!
 apparaît dans chaque texte.                                C   le gros gros gros gros chat
• Chaque   ligne représente                                         gros      le        chat
  en fait un point
  dans l’espace.
                                        (1,1,3)
                                                                A    1         1         3

• Pour  réduire le nombre                         (4,1,1)       B    1         2         1

  de dimensions, il faudra
  choisir un plan 2D.
                              (1,2,1)
                                                                C    4         1         1
Réduction de la dimensionalité
Réduction de la dimensionalité
             ... comment ?
Réduction de la dimensionalité

• Pour passer de 3 à 2 dimensions, on
 choisit deux composantes.
• Pour passer de 500 à 10 dimensions, on
 choisit 10 composantes.
Réduction de la dimensionalité

• Pour passer de 3 à 2 dimensions, on
 choisit deux composantes.
• Pour passer de 500 à 10 dimensions, on
 choisit 10 composantes.




                                           et la bonne projection
Élimination des mots «vides»
Élimination des mots «vides»




Pour obtenir des résultats intéressants, il arrive souvent que l’on doive
  éliminer ce que l’on appelle des mots « vides » (mots outils, mots
           fonctionnels, ou « stop words »): de, à, la, les, etc.

                        Constatez la différence.
Analyse syntaxique
Analyse syntaxique
• consisteà construire une structure                                        Phrase

 permettant de repérer les éléments                                                   SV
 constitutifs des phrases.
                                                                                 SV


                                                                    SV                     SP            SP


                                                 SN          SV             SN              SN            SN

• L’analyse   pourra être complète...
                                        le Colonel Mustard a étranglé Madame Peacock sur le balcon avec la corde.
• ou   partielle («shallow»).
                                               SN            SV            SN               SN            SN
Interprétation sémantique
Interprétation sémantique
• Dans les deux cas, l’étape suivante    le Colonel Mustard a étranglé Madame Peacock sur le balcon avec la corde.
 consiste à identifier les éléments         Colonel Mustard                  Madame Peacock        balcon        corde
 signifiants...

• ... et   leur donner une représentation...      t_colonel_mustard
                                                                             étrangle
                                                                                             t_madame_peacock




• ...adaptée     au domaine...
                                                               cm
• ...aux    points de vue...                                                   étr           mp
• ...aux    utilisateurs.
                                                                      cor
                                                        balcon
LES PROJETS
Binocle, S-Cue, Aartic, Formica, Coreff, Équi-libre...
Binocle
  Analyse automatique de documents en génie
logiciel : de la langue naturelle à la représentation
                        visuelle
Binocle
                                          Analyse automatique de documents en génie
Réaliser le prototype d'un système      logiciel : de la langue naturelle à la représentation
                                                                visuelle
permettant de traduire visuellement
des textes corporatifs de définition
de règles d'affaires dans le contexte
du génie logiciel. Cette preuve de
concept vise à établir une mise en
contexte fonctionnelle à partir de
laquelle des recherches plus
avancées pourront être élaborées.
A.A.R.TIC
Apprentissage - Adaptatif - Repères - Technologies
    de l’information et des communications
A.A.R.TIC
                                                 Apprentissage - Adaptatif - Repères - Technologies
                                                     de l’information et des communications
Développer un environnement informatique
d’apprentissage humain (EIAH) qui assiste
l’étudiant dans l’assimilation des concepts
théoriques à travers des exemples les
illustrant. L’EIAH proposé s’adapte aux
expériences des étudiants grâce à deux
agents intelligents: l’accompagnateur, associé
à l’étudiant, et l’observateur, associé à
l’enseignant.
Les Co.Lab.Orateurs du LiNCS

                                                               Pierre André Ménard
L’occasion pour les étudiants de rencontrer                    Frédéric Monchamp
   leurs collègues et d’échanger sur leurs                          Felipe Padilla
      projets de recherche respectifs.                            Otilia Alejandro
 Exposer un problème  Montrer l’avancement de son                  Paul Laurier
projet  Tester une présentation de conférence  Tester           Ludovic Niepce
un poster  Demander une rétroaction  Combattre le
              syndrome de la page blanche                          Youness Fareh
                                                               Alexandra Gonzalez
           1 orateur + 1 public                                      Faten Mhiri
                                                                   Benoît Borrel
    Présentation de [ 10 .. 30 ] min.
                                                                 Manuelle Gagnon
Département de génie logiciel et des TI
      École de technologie supérieure
                Sylvie.Ratte@etsmtl.ca
                               A-3440
Lincs.etsmtl.ca


   lin
     CS
          Département de génie logiciel et des TI
                École de technologie supérieure
                          Sylvie.Ratte@etsmtl.ca
                                         A-3440

Mais conteúdo relacionado

Semelhante a Portesouvertes2010 V4 Without Video

Présentation des APIs cognitives IBM Watson
Présentation des APIs cognitives IBM WatsonPrésentation des APIs cognitives IBM Watson
Présentation des APIs cognitives IBM WatsonBeMyApp
 
Comprendre, utiliser et créer une API
Comprendre, utiliser et créer une APIComprendre, utiliser et créer une API
Comprendre, utiliser et créer une APIOlivia Reaney
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applicationsAffinity Engine
 
ASFWS 2012 - Sécurité des applications web, analyse technique vs. analyse con...
ASFWS 2012 - Sécurité des applications web, analyse technique vs. analyse con...ASFWS 2012 - Sécurité des applications web, analyse technique vs. analyse con...
ASFWS 2012 - Sécurité des applications web, analyse technique vs. analyse con...Cyber Security Alliance
 
OWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceOWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceParis Open Source Summit
 
Comment choisir un moteur de recherche ?
Comment choisir un moteur de recherche  ?Comment choisir un moteur de recherche  ?
Comment choisir un moteur de recherche ?Gilles Balmisse
 
La recherche sur Internet: devenez un super chercheur
La recherche sur Internet: devenez un super chercheurLa recherche sur Internet: devenez un super chercheur
La recherche sur Internet: devenez un super chercheurElium
 
Concepts de Recherche dans un environnement WSS et MOSS
Concepts de Recherche dans un environnement WSS et MOSSConcepts de Recherche dans un environnement WSS et MOSS
Concepts de Recherche dans un environnement WSS et MOSSDesjardins
 
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le KioskComment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le KioskJedha Bootcamp
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
Analysez vos textes avec Cognitive Services
Analysez vos textes avec Cognitive ServicesAnalysez vos textes avec Cognitive Services
Analysez vos textes avec Cognitive ServicesAZUG FR
 
Les moteurs de recherche sémantique
Les moteurs de recherche sémantiqueLes moteurs de recherche sémantique
Les moteurs de recherche sémantiqueSylvain Gateau
 
Les bénéfices d'une stratégie de contenu
Les bénéfices d'une stratégie de contenuLes bénéfices d'une stratégie de contenu
Les bénéfices d'une stratégie de contenuTechnofutur TIC
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4jNeo4j
 
IBM Paris Bluemix Meetup #12 - Ecole 42 - 9 décembre 2015
IBM Paris Bluemix Meetup #12 - Ecole 42 - 9 décembre 2015IBM Paris Bluemix Meetup #12 - Ecole 42 - 9 décembre 2015
IBM Paris Bluemix Meetup #12 - Ecole 42 - 9 décembre 2015IBM France Lab
 

Semelhante a Portesouvertes2010 V4 Without Video (20)

Offre Search
Offre SearchOffre Search
Offre Search
 
Application d'analyses des Tweets
Application d'analyses des TweetsApplication d'analyses des Tweets
Application d'analyses des Tweets
 
Présentation des APIs cognitives IBM Watson
Présentation des APIs cognitives IBM WatsonPrésentation des APIs cognitives IBM Watson
Présentation des APIs cognitives IBM Watson
 
Comprendre, utiliser et créer une API
Comprendre, utiliser et créer une APIComprendre, utiliser et créer une API
Comprendre, utiliser et créer une API
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applications
 
ASFWS 2012 - Sécurité des applications web, analyse technique vs. analyse con...
ASFWS 2012 - Sécurité des applications web, analyse technique vs. analyse con...ASFWS 2012 - Sécurité des applications web, analyse technique vs. analyse con...
ASFWS 2012 - Sécurité des applications web, analyse technique vs. analyse con...
 
OWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceOWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysance
 
Comment choisir un moteur de recherche ?
Comment choisir un moteur de recherche  ?Comment choisir un moteur de recherche  ?
Comment choisir un moteur de recherche ?
 
Search2010 v1
Search2010 v1Search2010 v1
Search2010 v1
 
La recherche sur Internet: devenez un super chercheur
La recherche sur Internet: devenez un super chercheurLa recherche sur Internet: devenez un super chercheur
La recherche sur Internet: devenez un super chercheur
 
Concepts de Recherche dans un environnement WSS et MOSS
Concepts de Recherche dans un environnement WSS et MOSSConcepts de Recherche dans un environnement WSS et MOSS
Concepts de Recherche dans un environnement WSS et MOSS
 
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le KioskComment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk
Comment devenir Data Scientist - Nicolas Garcia, Data Scientist @ Le Kiosk
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
ontologie de capteurs
ontologie de capteursontologie de capteurs
ontologie de capteurs
 
Analysez vos textes avec Cognitive Services
Analysez vos textes avec Cognitive ServicesAnalysez vos textes avec Cognitive Services
Analysez vos textes avec Cognitive Services
 
Les moteurs de recherche sémantique
Les moteurs de recherche sémantiqueLes moteurs de recherche sémantique
Les moteurs de recherche sémantique
 
Les bénéfices d'une stratégie de contenu
Les bénéfices d'une stratégie de contenuLes bénéfices d'une stratégie de contenu
Les bénéfices d'une stratégie de contenu
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 
IBM Paris Bluemix Meetup #12 - Ecole 42 - 9 décembre 2015
IBM Paris Bluemix Meetup #12 - Ecole 42 - 9 décembre 2015IBM Paris Bluemix Meetup #12 - Ecole 42 - 9 décembre 2015
IBM Paris Bluemix Meetup #12 - Ecole 42 - 9 décembre 2015
 
Big data
Big dataBig data
Big data
 

Portesouvertes2010 V4 Without Video

  • 2. LINCS Laboratoire d’ingénierie Cognitive et Sémantique fysop.files.wordpress.com/2009/06/words-12.jpg
  • 3.
  • 4. Compréhension Modélisation Signification Information Animation Extraction Cognition Domaine Humain Analyse Texte
  • 5. L’ a r b r e c o m p l e t c o m p r e n d 3 294 mots et marques de ponctuation. animation créée grâce à ManyEyes (IBM) à partir du texte descriptif de la subvention de recherche CRSNG du LiNCS TEXTES extraire, analyser, visualiser, comprendre
  • 8. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 9. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 10. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 11. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 12. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 13. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 14. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 15. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 16. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 17. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 18. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 19. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 20. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 21. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 22. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 23. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 24. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 25. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 26. Applications multiples • Expansion d’abréviations SMS sur cellulaire • Moteur de recherche intelligent • Web sémantique • Filtre anti-spam • Classification de fils de nouvelles RSS • Extraction de patrons dans les articles scientifiques • et plus encore ...
  • 27. Applications multiples Analyzing Gap between Workflows and NL Descriptions
  • 28. Domaines multiples • biologie Capture Relations in Biomedical Text Analyzing Gap between Workflows and NL Descriptions Finding Defects in NL Confidentiality Requirements Characterizing Trajectories of Moving Objects Processing NL Requirements Mobile Medecine: Drug Information through NL SMS Texts for a Cognitive Vision System • médecine Intelligent User Interfaces for Wikis Mapping Natural Language to Imagery Automation of Requirements Analysis Integrating Requirements and Model-Driven Engineering NL Interface for Crime-related Queries • génie logiciel Text Mining for Clinical Medical Records Automatic Construction of UML Diagrams Web 2.0 and NLP Translation NL into Temporal and Dynamic Logic Mapping NL to Imagery Dependability Analysis in Industrial Use Cases • sciences cognitives Event Model for Analysis of Verb Sense Integrating BPM and Governing Documents Automated Identification of LTL Patterns Automatic Diagram Drawing Animated Agent that Understand NL SMS Text Normalization Automated Conceptual Data Modeling Extracting Causation Knowledge • informatique mobile Fact Extraction from Source Code Multilingual Understanding of Natural Business Rules User-Friendly Interface for Fingerprint Systems • communication et média Intelligent Decision Support System • ingénierie des connaissance
  • 31. Pourquoi est-ce difficile? • les langues naturelles sont ambiguës
  • 32. Pourquoi est-ce difficile? • les langues naturelles sont ambiguës • les références pas toujours évidentes
  • 33. le journaliste et Bush ? le ministre et le journaliste ? Pourquoi est-ce difficile? Bush et le ministre? Qui serrait la main du ministre ? • les langues naturelles sont ambiguës Le bureau de qui? • les références pas toujours évidentes Georges W. Bush pensait qu’il allait tranquillement finir son mandat après une tournée en Irak. Lors d’une conférence de presse un journaliste lui a lancé, sans l'atteindre, deux chaussures et l'a insulté au moment où ce dernier serrait la main du Premier ministre irakien dans son bureau à Bagdad. Alors que les deux hommes se rencontraient dans le bureau privé du Premier ministre Nouri al-Maliki, un journaliste irakien, assis au troisième rang, a bondi et lancé ses chaussures sur le président américain.
  • 34. Pourquoi est-ce difficile? • les langues naturelles sont ambiguës • les références pas toujours évidentes • les documents comportent toutes sortes d’objets
  • 35. Pourquoi est-ce difficile? • les langues naturelles sont ambiguës des titres des images • les références pas toujours évidentes • les documents comportent toutes des tableaux sortes d’objets et bien sûr... des graphiques du texte
  • 36. Pourquoi est-ce difficile? • les langues naturelles sont ambiguës • les références pas toujours évidentes • les documents comportent toutes sortes d’objets • les concepts peuvent s’exprimer de plusieurs manières
  • 37. Pourquoi est-ce difficile? • les langues naturelles sont ambiguës • les références pas toujours évidentes • les documents comportent toutes sortes d’objets OVNI • les concepts peuvent s’exprimer de plusieurs manières hallucination soucoupe volante engin extraterrestre
  • 39. Extraire pour comprendre et pour constuire
  • 40. Extraire pour comprendre et pour constuire des groupes/des classifications • Donner un sens à l’information • Selon les domaines... • Selon les spécialisations... • Selon les préférences de l’utilisateur... • Selon les besoins...
  • 41. Extraire pour comprendre et pour constuire • Donner un sens à l’information • Selon les domaines... • Selon les spécialisations... • Selon les préférences de l’utilisateur... • Selon les besoins...
  • 42. Extraire pour comprendre et pour constuire des alertes/des identifications • Donner un sens à l’information • Selon les domaines... • Selon les spécialisations... • Selon les préférences de l’utilisateur... • Selon les besoins...
  • 43. Extraire pour comprendre et pour constuire • Donner un sens à l’information • Selon les domaines... • Selon les spécialisations... • Selon les préférences de l’utilisateur... • Selon les besoins...
  • 44. Extraire pour comprendre et pour constuire des domaines • Donner un sens à l’information • Selon les domaines... • Selon les spécialisations... • Selon les préférences de l’utilisateur... • Selon les besoins...
  • 45. Extraire pour comprendre et pour constuire • Donner un sens à l’information • Selon les domaines... • Selon les spécialisations... • Selon les préférences de l’utilisateur... • Selon les besoins...
  • 46. Extraire pour comprendre et pour constuire des processus • Donner un sens à l’information • Selon les domaines... • Selon les spécialisations... • Selon les préférences de l’utilisateur... • Selon les besoins...
  • 47. Extraire pour comprendre et pour constuire • Donner un sens à l’information • Selon les domaines... • Selon les spécialisations... • Selon les préférences de l’utilisateur... • Selon les besoins...
  • 48. Extraire pour comprendre et pour constuire des besoins • Donner un sens à l’information • Selon les domaines... • Selon les spécialisations... • Selon les préférences de l’utilisateur... • Selon les besoins...
  • 49. Extraire pour comprendre et pour constuire • Donner un sens à l’information • Selon les domaines... • Selon les spécialisations... • Selon les préférences de l’utilisateur... • Selon les besoins...
  • 50. Extraire pour comprendre et pour constuire ... des interactions • Donner un sens à l’information • Selon les domaines... • Selon les spécialisations... • Selon les préférences de l’utilisateur... • Selon les besoins...
  • 51. LES TECHNIQUES ET LES ALGORITHMES
  • 52. Clustering • Leclustering consiste à former des groupes naturels. • Lesdocuments similaires se retrouvent dans les mêmes groupes. • Lestechniques de clustering permettent d’identifier rapidement des classifications possibles.
  • 53. Clustering • Leclustering consiste à former des groupes naturels. • Lesdocuments similaires se retrouvent dans les mêmes groupes. • Lestechniques de clustering permettent d’identifier rapidement des classifications possibles.
  • 54. Réduction de la dimensionalité
  • 55. Réduction de la dimensionalité • Prenons un ensemble de 3 petits textes. • Total: 3 mots différents A le gros chat chat chat • Construisons un tableau qui contient le nombre de fois que chaque mot B le ... le gros chat! apparaît dans chaque texte. C le gros gros gros gros chat • Chaque ligne représente gros le chat en fait un point dans l’espace. (1,1,3) A 1 1 3 • Pour réduire le nombre (4,1,1) B 1 2 1 de dimensions, il faudra choisir un plan 2D. (1,2,1) C 4 1 1
  • 56. Réduction de la dimensionalité
  • 57. Réduction de la dimensionalité ... comment ?
  • 58. Réduction de la dimensionalité • Pour passer de 3 à 2 dimensions, on choisit deux composantes. • Pour passer de 500 à 10 dimensions, on choisit 10 composantes.
  • 59. Réduction de la dimensionalité • Pour passer de 3 à 2 dimensions, on choisit deux composantes. • Pour passer de 500 à 10 dimensions, on choisit 10 composantes. et la bonne projection
  • 61. Élimination des mots «vides» Pour obtenir des résultats intéressants, il arrive souvent que l’on doive éliminer ce que l’on appelle des mots « vides » (mots outils, mots fonctionnels, ou « stop words »): de, à, la, les, etc. Constatez la différence.
  • 63. Analyse syntaxique • consisteà construire une structure Phrase permettant de repérer les éléments SV constitutifs des phrases. SV SV SP SP SN SV SN SN SN • L’analyse pourra être complète... le Colonel Mustard a étranglé Madame Peacock sur le balcon avec la corde. • ou partielle («shallow»). SN SV SN SN SN
  • 65. Interprétation sémantique • Dans les deux cas, l’étape suivante le Colonel Mustard a étranglé Madame Peacock sur le balcon avec la corde. consiste à identifier les éléments Colonel Mustard Madame Peacock balcon corde signifiants... • ... et leur donner une représentation... t_colonel_mustard étrangle t_madame_peacock • ...adaptée au domaine... cm • ...aux points de vue... étr mp • ...aux utilisateurs. cor balcon
  • 66. LES PROJETS Binocle, S-Cue, Aartic, Formica, Coreff, Équi-libre...
  • 67. Binocle Analyse automatique de documents en génie logiciel : de la langue naturelle à la représentation visuelle
  • 68. Binocle Analyse automatique de documents en génie Réaliser le prototype d'un système logiciel : de la langue naturelle à la représentation visuelle permettant de traduire visuellement des textes corporatifs de définition de règles d'affaires dans le contexte du génie logiciel. Cette preuve de concept vise à établir une mise en contexte fonctionnelle à partir de laquelle des recherches plus avancées pourront être élaborées.
  • 69. A.A.R.TIC Apprentissage - Adaptatif - Repères - Technologies de l’information et des communications
  • 70. A.A.R.TIC Apprentissage - Adaptatif - Repères - Technologies de l’information et des communications Développer un environnement informatique d’apprentissage humain (EIAH) qui assiste l’étudiant dans l’assimilation des concepts théoriques à travers des exemples les illustrant. L’EIAH proposé s’adapte aux expériences des étudiants grâce à deux agents intelligents: l’accompagnateur, associé à l’étudiant, et l’observateur, associé à l’enseignant.
  • 71.
  • 72. Les Co.Lab.Orateurs du LiNCS Pierre André Ménard L’occasion pour les étudiants de rencontrer Frédéric Monchamp leurs collègues et d’échanger sur leurs Felipe Padilla projets de recherche respectifs. Otilia Alejandro Exposer un problème  Montrer l’avancement de son Paul Laurier projet  Tester une présentation de conférence  Tester Ludovic Niepce un poster  Demander une rétroaction  Combattre le syndrome de la page blanche Youness Fareh Alexandra Gonzalez 1 orateur + 1 public Faten Mhiri Benoît Borrel Présentation de [ 10 .. 30 ] min. Manuelle Gagnon
  • 73. Département de génie logiciel et des TI École de technologie supérieure Sylvie.Ratte@etsmtl.ca A-3440
  • 74. Lincs.etsmtl.ca lin CS Département de génie logiciel et des TI École de technologie supérieure Sylvie.Ratte@etsmtl.ca A-3440

Notas do Editor