SlideShare une entreprise Scribd logo
1  sur  42
Télécharger pour lire hors ligne
Journée OSIDMESH
    Montpellier – 23/10/2009


Analyses de textes avec
 TreeCloud et Lexico3

      Philippe Gambette
Plan

• Nuages de mots
• Nuages améliorés
• Analyses plus fines
Plan

• Nuages de mots
• Nuages améliorés
• Analyses plus fines
Nuages de mots

• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle
• Donnent un bon aperçu d'un texte




                                                  Nuages Wordle des mots les plus utilisés
                                                   début 2009 dans les blogs des Top 100
                                                            politique et high-tech de Wikio
                     http://aixtal.blogspot.com/2009/04/web-de-quoi-parlent-les-blogs.html
Nuages de mots

• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle
• Donnent un bon aperçu d'un texte
Nuages de mots

• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle
• Donnent un bon aperçu d'un texte




GoogleImage(obama inaugural address wordle)
Nuages de mots
• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle




GoogleImage(obama inaugural address wordle)
Nuages de mots
• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle




GoogleImage(obama inaugural address wordle)
Plan

• Nuages de mots
• Nuages améliorés
• Analyses plus fines
Nuages de mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Nuages de tags/mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Nuages de tags/mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Nuages de tags/mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Nuages de tags/mots améliorés

Ajouter de l'information extraite du texte :
• pâleur pour exprimer la désuétude dans Amazon
• tags partagés en rouge dans del.icio.us
• regrouper les tags cooccurrents sur la même ligne
                        Hassan-Montero & Herrero-Solana, InScit'06
• optimiser l'espace vide et la proximité sémantique
                                         Kaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrence
       Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                            Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                    Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                 Véronis (Hyperlex)


                                              Mayaffre, Quand travail, famille,
                                                et patrie cooccurrent dans le
                                                          discours de Nicolas
                                                            Sarkozy, JADT'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                  Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)




                                              Brunet, Les séquences (suite),
                                                                  JADT'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                  Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)


                                                              Barry, Viprey,
                                                    Approche comparative
                                                 des résultats d'exploration
                                                     textuelle des discours
                                                  de deux leaders africains
                                                             Keita et Touré,
                                                                   JADT'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                 Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)




                                                           Peyrat-Guillard,
                                                     Analyse du discours
                                                  syndical sur l’entreprise,
                                                                   JADT'08
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                                    Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                                              Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
                       Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                                   Véronis (Hyperlex)


                                                                    Visualisation PhraseNet de
                                                                            paroles des Beatles
                                                                    créé avec Many Eyes (IBM)
                                                                          http://many-eyes.com




http://visualthinkmap.ning.com/photo/phrasenet_beatles-many-eyes
Extraire l'information sémantique d'un texte
• analyse littéraire :
approche philologique : se concentrer sur le texte
                                                                 Brody
• analyse du discours :
analyse arborée, graphe de cooc., projection géodésique
                             Brunet (Hyperbase), Viprey (Astartex)
• fouille de texte :
graphe sémantique
              Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• traitement des langues naturelles :
désambiguïsation
                                                Véronis (Hyperlex)




                                                 Désambiguïsation du mot
                                                               “barrage”.

                                                        Véronis, HyperLex:
                                                    Lexical Cartography for
                                                Information Retrieval, 2004
Nuage de tags + arbre = nuage arboré




                            SplitsTree : Huson 1998,
                               Huson & Bryant 2006
Construit avec
TreeCloud et                 TreeCloud en Python, license GPL
                           disponible sur http://www.treecloud.fr
Nuage arboré des discours d'Obama

couleur : chronologie
ancien
récent




Les 150 mots les plus fréquents dans   Construit avec
les discours de campagne d'Obama,      TreeCloud et
winsize=30, distance=oddsratio,
color=chronology, NJ-tree.
Plan

• Nuages de mots
• Nuages améliorés
• Analyses plus fines
Analyses textuelles fines

Lexico 3
• Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle
• Logiciel pour PC sous Windows
• Version d'évaluation gratuite
• Analyses fines, retour au texte




                                    http://www.cavi.univ-paris3.fr/Ilpga/ilpga/tal/lexicoWWW/
Analyses textuelles fines

Lexico 3
• Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle
• Logiciel pour PC sous Windows
• Version d'évaluation gratuite
• Analyses fines, retour au texte
• Démo sur les avis cinéma de Monique Pantel




                                                   http://monique.pantel.free.fr
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines




                  glisser-déposer
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines
Analyses textuelles fines




                            sélection puis
                            clic sur Spécifs
Analyses textuelles fines
Analyses textuelles fines




                            retour au texte

Contenu connexe

En vedette

Les outils de data visualisation
Les outils de data visualisationLes outils de data visualisation
Les outils de data visualisationUNITEC
 
Base de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreBase de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreMICHRAFY MUSTAFA
 
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"Petit Web
 
NoSQL Databases: Why, what and when
NoSQL Databases: Why, what and whenNoSQL Databases: Why, what and when
NoSQL Databases: Why, what and whenLorenzo Alberton
 
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...Serge Courrier
 
Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
Dataviz  : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...Dataviz  : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...Serge Courrier
 
DeciLogic exemple d'application Web de geolocalisation
DeciLogic exemple d'application Web de geolocalisationDeciLogic exemple d'application Web de geolocalisation
DeciLogic exemple d'application Web de geolocalisationEric Mauvais
 
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"Sophie Gironi
 
Outils de veille - catalogue
Outils de veille - catalogueOutils de veille - catalogue
Outils de veille - catalogueRaphaël Rey
 

En vedette (10)

Les outils de data visualisation
Les outils de data visualisationLes outils de data visualisation
Les outils de data visualisation
 
Base de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreBase de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvre
 
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
Présentation Renaud Ménérat au Petit Club "Simplifier le mobile"
 
NoSQL Databases: Why, what and when
NoSQL Databases: Why, what and whenNoSQL Databases: Why, what and when
NoSQL Databases: Why, what and when
 
La datavisualisation
La datavisualisationLa datavisualisation
La datavisualisation
 
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
A TELECHARGER ! Schéma d’une plateforme de veille "modulaire" 100% RSS (MAJ l...
 
Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
Dataviz  : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...Dataviz  : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (1...
 
DeciLogic exemple d'application Web de geolocalisation
DeciLogic exemple d'application Web de geolocalisationDeciLogic exemple d'application Web de geolocalisation
DeciLogic exemple d'application Web de geolocalisation
 
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
ConféR3nce "Géolocalisation Sociale et Marketing Mobile"
 
Outils de veille - catalogue
Outils de veille - catalogueOutils de veille - catalogue
Outils de veille - catalogue
 

Plus de Philippe Gambette

Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudNuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudPhilippe Gambette
 
Practical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPractical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPhilippe Gambette
 
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesMéthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesPhilippe Gambette
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Philippe Gambette
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesPhilippe Gambette
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksPhilippe Gambette
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarPhilippe Gambette
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsPhilippe Gambette
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Philippe Gambette
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloudPhilippe Gambette
 

Plus de Philippe Gambette (10)

Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloudNuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
Nuages arborés et analyse textuelle - Présentation de l’outil TreeCloud
 
Practical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstructionPractical use of combinatorial methods for phylogenetic network reconstruction
Practical use of combinatorial methods for phylogenetic network reconstruction
 
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiquesMéthodes combinatoires de reconstruction de réseaux phylogénétiques
Méthodes combinatoires de reconstruction de réseaux phylogénétiques
 
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
Codage des voisinages et parcours en largeur en temps O(n) des graphes d'inte...
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiques
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic Networks
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues Carambar
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphs
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloud
 

Dernier

Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxabdououanighd
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesMohammedAmineHatoch
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxhamzagame
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxikospam0
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLElebaobabbleu
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfAmgdoulHatim
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkRefRama
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesUnidad de Espiritualidad Eudista
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaireTxaruka
 
python-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdfpython-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdftrendingv83
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKNassimaMdh
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...Universidad Complutense de Madrid
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetJeanYvesMoine
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcourshalima98ahlmohamed
 

Dernier (16)

Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
python-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdfpython-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdf
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcours
 

Analyse de textes avec TreeCloud et Lexico3

  • 1. Journée OSIDMESH Montpellier – 23/10/2009 Analyses de textes avec TreeCloud et Lexico3 Philippe Gambette
  • 2. Plan • Nuages de mots • Nuages améliorés • Analyses plus fines
  • 3. Plan • Nuages de mots • Nuages améliorés • Analyses plus fines
  • 4. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle • Donnent un bon aperçu d'un texte Nuages Wordle des mots les plus utilisés début 2009 dans les blogs des Top 100 politique et high-tech de Wikio http://aixtal.blogspot.com/2009/04/web-de-quoi-parlent-les-blogs.html
  • 5. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle • Donnent un bon aperçu d'un texte
  • 6. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle • Donnent un bon aperçu d'un texte GoogleImage(obama inaugural address wordle)
  • 7. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle GoogleImage(obama inaugural address wordle)
  • 8. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle GoogleImage(obama inaugural address wordle)
  • 9. Plan • Nuages de mots • Nuages améliorés • Analyses plus fines
  • 10. Nuages de mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 11. Nuages de tags/mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 12. Nuages de tags/mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 13. Nuages de tags/mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 14. Nuages de tags/mots améliorés Ajouter de l'information extraite du texte : • pâleur pour exprimer la désuétude dans Amazon • tags partagés en rouge dans del.icio.us • regrouper les tags cooccurrents sur la même ligne Hassan-Montero & Herrero-Solana, InScit'06 • optimiser l'espace vide et la proximité sémantique Kaser & Lemire, WWW'07 • “topigraphy”: placement 2D d'après la cooccurrence Fujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
  • 15. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex)
  • 16. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Mayaffre, Quand travail, famille, et patrie cooccurrent dans le discours de Nicolas Sarkozy, JADT'08
  • 17. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Brunet, Les séquences (suite), JADT'08
  • 18. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Barry, Viprey, Approche comparative des résultats d'exploration textuelle des discours de deux leaders africains Keita et Touré, JADT'08
  • 19. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Peyrat-Guillard, Analyse du discours syndical sur l’entreprise, JADT'08
  • 20. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Visualisation PhraseNet de paroles des Beatles créé avec Many Eyes (IBM) http://many-eyes.com http://visualthinkmap.ning.com/photo/phrasenet_beatles-many-eyes
  • 21. Extraire l'information sémantique d'un texte • analyse littéraire : approche philologique : se concentrer sur le texte Brody • analyse du discours : analyse arborée, graphe de cooc., projection géodésique Brunet (Hyperbase), Viprey (Astartex) • fouille de texte : graphe sémantique Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes) • traitement des langues naturelles : désambiguïsation Véronis (Hyperlex) Désambiguïsation du mot “barrage”. Véronis, HyperLex: Lexical Cartography for Information Retrieval, 2004
  • 22. Nuage de tags + arbre = nuage arboré SplitsTree : Huson 1998, Huson & Bryant 2006 Construit avec TreeCloud et TreeCloud en Python, license GPL disponible sur http://www.treecloud.fr
  • 23. Nuage arboré des discours d'Obama couleur : chronologie ancien récent Les 150 mots les plus fréquents dans Construit avec les discours de campagne d'Obama, TreeCloud et winsize=30, distance=oddsratio, color=chronology, NJ-tree.
  • 24. Plan • Nuages de mots • Nuages améliorés • Analyses plus fines
  • 25. Analyses textuelles fines Lexico 3 • Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle • Logiciel pour PC sous Windows • Version d'évaluation gratuite • Analyses fines, retour au texte http://www.cavi.univ-paris3.fr/Ilpga/ilpga/tal/lexicoWWW/
  • 26. Analyses textuelles fines Lexico 3 • Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle • Logiciel pour PC sous Windows • Version d'évaluation gratuite • Analyses fines, retour au texte • Démo sur les avis cinéma de Monique Pantel http://monique.pantel.free.fr
  • 34. Analyses textuelles fines glisser-déposer
  • 40. Analyses textuelles fines sélection puis clic sur Spécifs
  • 42. Analyses textuelles fines retour au texte