Tour d'horizon des personnes morales adhérentes à l'APRIL
IC05 cours 1
1. IC 05 / semestre printemps 2008 IC 05 / semestre printemps 2008 Franck.ghitalla Département TSH Président de WebAtlas [email_address]
2.
3. Cadres conceptuels A.-L. BARABASI linked - the new science of networks , new ed. 2005. S. JONHSON - emergence: the connected lives of ants, brains, cities, and software, 2002. Théorie des graphes D. WATTS six degrees - the science of a connected age , 2004. S. STROGATZ - sync: the emerging science of spontaneous order , 2004. M. NEWMAN - the structure and dynamics of networks, 2003. Web-Mining S. CHAKRABARTI mining the web , 2002. J. KLEINBERG - algorithm design, 2006. InfoViz B. SHNEIDERMAN - readings in information visualization: using vision to think, 1999. Ouvrages de référence en Network Sciences IC 05 / semestre printemps 2008
4. IC 05 / semestre printemps 2008 The problem : in social networks, web graphs or cells organisation (and even each complex system), we have to understand the presence of two contradictory properties . « On the one hand, the network should display a large culstering coefficient , meaning that on average a person’s friends are far more likely to know each other than two people chosen at random. On the other hand, it should be possible to connect two people chosen at random via a chain of only a few intermediaries .» (D; Watts, p77, Six Degrees)
5. IC 05 / semestre printemps 2008 « Most of networks (not only social networks) display what we call clustering, which is really just to say that most people’s friends are also to some extent friends of each other »… » (D. Watts, p40, Six Degrees ) 1) Clusters, proximity and long distances
6. Dans un réseau social, si chaque agent a 100 amis, et eux-mêmes 100, etc...A 5 degrés de distance, on arrive à 9 milliards. A priori, mathématiquement, ce type d'expansion permet de comprendre les fameux « 6 degrees » constants (à gauche). Cependant, dans les réseaux sociaux ou sur le web pour les sites/pages, il existe une forte redondance en termes de structure : mes amis ont de grandes chances d'être aussi les amis de mes amis (disons, dans le même « cluster social » ou communauté). IC 05 / semestre printemps 2008 Most of real networks (web, biology, social organization…) are highly clustered
7. IC 05 / semestre printemps 2008 Graphe de sites Graphe de mots-clef
8. La structure très clusterisée du web se mesure aisément à partir de calculs de densité pour la distribution de la connectivité hypertexte entre sites. C'est l'un des principes développés par J. Kleinberg dès 1996 pour la conception de l'algorithme HITS (Hypertext Induced Topic Search). IC 05 / semestre printemps 2008
9. IC 05 / semestre printemps 2008 « Some of the properties of extremely complicated systems can be understood without knowing anything about their detailed structure or governing rules… » (D. Watts, p65, Six Degrees ) 2) Randomness, universality and complex systems
10. (gauche) Random Graphe (non-orienté et orienté) (droite) Random Graph - (Rényi) IC 05 / semestre printemps 2008 « A random graph is, as the name might suggest, a network of nodes connected by links in a purely random fashion » (D. Watts)
11. IC 05 / semestre printemps 2008 « All we needed to do was find a way to tune each network between complete order and complete disorder in a way that it traced through all the various intermediate stages » (D. Watts, p86, Six Degrees ) 3) Small World
12. IC 05 / semestre printemps 2008 Clustering Degree = High Distance Degree = High Clustering Degree = Low Distance Degree = Low Clustering Degree = High Distance Degree = Low
13. IC 05 / semestre printemps 2008 A space of possible worlds – the parameter we can tune from 0 to 1, from randomness to order – in wich, at one end of the spectrum individuals always make new friends through thier current friends and, at the other end, they never do. « …in the middle, there is a version of reality. » (D. Watts). The « Beta Model , the order-randomness-spectrum » (D. Watts, S. Strogatz) Order from 0 to 1 Randomness from 0 to 1 En moyenne, pour un network de 1 million de nœuds distribué en mode régulier (avec pour chaque nœud 100 voisins proches (« 50 à gauche, 50 à droite »), la distribution de 5 liens en mode random fait chuter les distances moyennes de 50%. Il faut multiplier ce chiffre par 10 (soit 5x10 = 50) pour faire chuter la moyenne encore de 50 %. Et ainsi de suite…Les effets sont donc décroissants.
14. IC 05 / semestre printemps 2008 3 propriétés des web-graphs a) de forme b) de distribution de l’ordre c) de domaines (mots, liens, acteurs)