2. Visualisation des réseaux
1 Visualisation de graphe : rappels sémiologiques de base
Variables visuelles
Légende
2 Visualisation de réseaux
Des principes de base aux force-directed layouts
Réseaux denses et grands réseaux
3 Choisir un logiciel
4 Démo : Cytoscape, R
3. Visualisation des réseaux
Introduction
Analyse de réseaux ne nécessite pas a priori de visualisation
Les images de réseaux sont le plus souvent inecaces (pas de
message clair)
Fossé entre moyens techniques et capacités cognitives
Il n'existe pas de logiciel idéal...
4. Visualisation des réseaux
sémiologie
Le graphe comme image : exploration vs communication
Exploration
esthétique superue
légende inutile
plus les données sont complètes et précises, mieux c'est
5. Visualisation des réseaux
sémiologie
Le graphe pour communiquer
nécessité d'une légende claire, précise, complète
transparence sur l'outil et la méthode (quel logiciel ? quel
algorithme de visualisation ?)
plus le graphe reète vos données, moins il est lisible :
sélection indispensable
6. Interactivité : communication sans message ou exploration ?
http://www.global-migration.info/ - *tous les liens ont été visités en mars 2017.
7. Visualisation des réseaux
sémiologie
Variables visuelles
Sémiologie graphique selon J. Bertin : trois implantations
(ponctuelle, linéaire et surfacique) et six variables visuelles (forme,
taille, valeur, couleur, orientation, texture ou grain).
http://margaux.ipt.univ-paris8.fr/vgodard/enseigne/carto2/memocart/mem12car.htm
8. Visualisation des réseaux
sémiologie
Variables visuelles
Pour les graphes : deux implantations (ponctuelle et zonale) et
quatre variables pertinentes (orientation peu adaptée, grain en voie
de disparition).
Selon Bertin (et les bertiniens orthodoxes):
variable taille = variables quantitatives absolues (stock)
valeur = variables quantitatives relatives (taux) et qualitatives
ordonnées (petit, moyen, grand)
couleur et forme = variable qualitative nominale
10. Visualisation des réseaux
Visualisation de réseaux
Des principes de base aux force-directed layouts
Principes élaborés par J. Moreno (1934)
sommets les plus connectés au centre
sommets les moins connectés en périphérie
éviter les croisements de lien
longueur des liens équivalente pour des liens équivalents*
*très vite impossible pour des raisons géométriques
13. Visualisation des réseaux
Visualisation de réseaux
Des principes de base aux force-directed layouts
Développement de la SNA dans les années 70 : perte de qualité
graphique
15. Visualisation des réseaux
Visualisation de réseaux
Des principes de base aux force-directed layouts
Innovations majeures en écologie : souci clarté graphique et mode
représentation des propriétés des réseaux (graphique log-log)
1982 1987
16. Visualisation des réseaux
Visualisation de réseaux
Des principes de base aux force-directed layouts
Placements manuels puis automatiques (70s)
Premiers placements : aléatoire, géométrique (circle), basés sur des
propriétés statistiques (analyse factorielle, MDS)
Apparition des force-based layouts dans les 90s : Kamadakawai
(89), Fruchterman-Reingold (91)
Depuis 90s : développement capacités informatiques et dataviz
(data visualisation)
18. Visualisation des réseaux
Visualisation de réseaux
Des principes de base aux force-directed layouts
Exemples de spacialisation
extrait de Cruz et Tamassia, 2003
23. Graphe ou matrice : déjà en 1946...
E. Forsyth and L. Katz, A Matrix Approach to the Analysis of Sociometric Data: Preliminary Report,
Sociometry, 9(4): 340-347
24. Visualisation des réseaux
Visualisation de réseaux
Réseaux denses et grands réseaux
Combiner les approches
Visualisation mixte graphe - matrice (logiciel NodeTrix)
http://www.aviz.fr/wiki/uploads/Research/NodeTrix.png
25. Visualisation des réseaux
Visualisation de réseaux
Réseaux denses et grands réseaux
Coup de génie des physiciens (emprunté aux écologues) :
graphiques révélant les propriétés du réseau
Moyenne des plus courts chemins et clustering coecient
(transitivité)
Watts et Strogatz, 1998
26. Visualisation des réseaux
Visualisation de réseaux
Réseaux denses et grands réseaux
Moyenne des plus courts chemins et clustering coecient (transitivité)
Watts et Strogatz, 1998
28. Visualisation des réseaux
Choisir un logiciel
Des dizaines de logiciels existent et
il est impossible de connaître tous les logiciels ;
il est impossible de suivre leur actualité ;
maîtriser un logiciel est un processus (plus ou moins)
chronophage.
Bilinguisme (français-anglais et SNA-physique-informatique)
indispensable
29. Visualisation des réseaux
Choisir un logiciel
Critères pour eectuer un choix raisonné
critères liés à l'utilisateur ou à l'utilisatrice ;
critères liés aux données ;
critères liés aux traitements souhaités ;
critères liés au logiciel lui-même.
30. Visualisation des réseaux
Choisir un logiciel
Critères liés à l'utilisateur ou à l'utilisatrice
objectifs
système d'exploitation
libre / gratuit / payant
réseau personnel
degré de geekitude (de NodeXL à networkX)
connecté.e en permanence ou non
31. Visualisation des réseaux
Choisir un logiciel
Critères liés aux données (liste de logiciels non exhaustive)
taille et ordre du réseau à étudier
graphe simple (one-mode, pas de boucle, pas de liens
multiplexes)
graphe biparti (R, package bipartite et tnet)
graphe multiplexe (Cytoscape, R)
ego-network (Vennmaker, EgoNet, E-Net)
réseaux longitudinaux (Siena, RSiena, networkDynamic dans
R)
réseaux spatiaux/planaires (QGis, Network Analyst dans
ArcGis, Pigale)
32. Visualisation des réseaux
Choisir un logiciel
Critères liés aux traitements à eectuer
visualisation (Cytoscape, Gephi, Tulip)
mesures standards (à peu près tous les logiciels...)
modéles statistiques (statnet dans R, PNet)
33. Visualisation des réseaux
Choisir un logiciel
Critères liés au logiciel
date de la dernière version (ex. Visone, mai 2011...)
portabilité entre OS
format de données
logiciel porté par une équipe ? une seule personne ?
34. Visualisation des réseaux
Choisir un logiciel
Format de données
pas de format universel
x formats spéciques (.net, .paj, .cysj...)
préférer format .csv, encodage utf-8 (avoir un bon éditeur de
texte ! Notepad++, Geany, etc.)
une liste de sommets (Id, attributs)
une liste de liens (Origine, destination, attributs)
35. Visualisation des réseaux
Démo : Cytoscape, R
Deux logiciels libres, gratuits, multi-plateformes : interface vs script
Jeux de données
D. rerio (Zebrash interactome) - Cytoscape
Liens entre médias - igraph, package R, d'après Katya
Ognyanova
Plus un mini jeu de données (import) : une liste de liens, une liste
de sommets (.csv, encodage utf-8)