1. School of Information
University of Michigan
A menos que se indique lo contrario, el contenido de este material
del curso es bajo licencia 3.0 Licencia Creative Commons
Atribución.
http://creativecommons.org/licenses/by/3.0/
Copyright 2008, Lada adamic
Usted asume toda la responsabilidad por el uso y la posible responsabilidad asociada con cualquier uso del material. Material contiene
contenido con derechos de autor, se utiliza de acuerdo con la legislación estadounidense. Los titulares de derechos de autor de
contenidos incluidos en este material deben comunicarse open.michigan@umich.edu con cualquier pregunta, correcciones o
aclaraciones relacionadas con el uso de los contenidos. Los Regentes de la Universidad de Michigan no autorizar el uso de los
contenidos de terceros publicados en este sitio a menos que dicha licencia se concede específicamente en relación con determinados
objetos de contenido. Los usuarios de contenido son responsables de su cumplimiento con la ley aplicable. La mención de productos
específicos en esta grabación sólo representa la opinión del orador y no representa un respaldo por parte de la Universidad de Michigan.
Para obtener más información acerca de cómo citar estos materiales visitan http://michigan.educommons.net/about/terms-of-use.
3. Contorno
¿Qué es una red?
un grupo de nodos y bordes
¿Cómo lo caracterizan?
con algunos indicadores básicos de la red
¿Cómo comenzó el análisis de redes
fueron los matemáticos
¿Cómo analiza las redes de hoy en día?
con pajek u otro software
4. ¿Cuáles son las redes?
Las redes son colecciones de
puntos unidos por líneas.
"Red" ≡ "Gráfico"
puntos líneas
vértices bordes, arcos matemáticas
nodos enlaces ciencias de la
computación
sitios bonos física
actores corbatas, las
relaciones
sociología
nodo
borde
5. Elementos de la red: bordes
Dirigida (también llamados arcos)
A -> B
Una talla B, A hizo un regalo al B, A es hijo de B
Sin dirección
A <-> B o A - B
A y B se gustan
A y B son hermanos
A y B son co-autores
Atributos Edge
peso (por ejemplo, la frecuencia de la comunicación)
rango (mejor amigo, segundo mejor amigo ...)
Tipo (amigo, familiar, compañero de trabajo)
propiedades dependiendo de la estructura del resto de el grafo:
por ejemplo, intermediación
7. Pesos de las aristas pueden tener valores positivos o
negativos
Un gen se activa /
inhibe otra
Una persona de
confianza /
desconfiando otro
Desafío de
investigación: ¿Cómo
se puede "propagar"
sentimientos negativos
en una red social? ¿Es
el enemigo de mi
enemigo mi amigo?
Transcripción reglamentario
red en la levadura de panadero
Fuente: indeterminado
8. Matrices de adyacencia
En representación de los bordes (que se encuentra junto
a los cuales) como una matriz
Laij = 1 si el nodo i tiene una ventaja al nodo j
= 0 si el nodo i no tiene una ventaja a j
Laii = 0 a menos que la red tiene la libre bucles
Laij = Aji Si se dejaría en la red,
o si iyj comparten un borde correspondido
yo
j
yo
yo
j
1
2
3
4
Ejemplo:
5
0 0 0 0 0
0 0 1 1 0
0 1 0 1 0
0 0 0 0 1
1 1 0 0 0
A =
9. Listas de adyacencia
Lista Edge
2 3
2 4
3 2
3 4
4 5
5 2
5 1
Lista de Adyacencia
es más fácil trabajar con si la red es
grande
escaso
recuperar rápidamente todos los
vecinos de un nodo
1:
2: 3 4
3: 2 4
4: 5
5: 1 2
1
2
3
4
5
10. Contorno
¿Qué es una red?
un grupo de nodos y bordes
¿Cómo lo caracterizan?
con algunos indicadores básicos de la red
¿Cómo comenzó el análisis de redes
fueron los matemáticos
¿Cómo analiza las redes de hoy en día?
con pajek u otro software
12. Nodos
Propiedades de la red de nodos
de conexiones inmediatas
indegree
cuántas aristas dirigidas (arcos) inciden en un nodo
grado de salida
cuántas aristas dirigidas (arcos) se originan en un nodo
grado (dentro o fuera)
número de aristas incidentes en un nodo
de todo el grafo
centralidad (intermediación, cercanía)
grado de salida = 2
indegree = 3
grado = 5
13. Grado Nodo de valores de la matriz
Outdegree o Grado de salida =
0 0 0 0 0
0 0 1 1 0
0 1 0 1 0
0 0 0 0 1
1 1 0 0 0
A =
n
j
ij
A
1
ejemplo: grado de salida para el nodo 3 es 2, lo que
se obtiene sumando el número de entradas que no son
cero en el 3rd fila :
Indegree o Grado de entrada =
0 0 0 0 0
0 0 1 1 0
0 1 0 1 0
0 0 0 0 1
1 1 0 0 0
A =
n
i
ij
A
1
ejemplo: el grado de entrada para el nodo 3 es 1,
que se obtiene sumando el número de entradas que no
son cero en el 3rd columna :
n
i
i
A
1
3
n
j
j
A
1
3
1
2
3
4
5
14. Métricas de red: secuencia de grado y grado de
distribución
Secuencia Grado: Una lista ordenada de la (in, out) el grado de cada nodo
En grados secuencia:
[2, 2, 2, 1, 1, 1, 1, 0]
Secuencia Out-grado:
[2, 2, 2, 2, 1, 1, 1, 0]
(No dirigida) secuencia de grado:
[3, 3, 3, 2, 2, 1, 1, 1]
Distribución Grado: Un conteo de frecuencia de ocurrencia de cada grado
En grados distribución:
[(2,3) (1,4) (0,1)]
Fuera grado de distribución:
[(2,4) (1,3) (0,1)]
(No dirigida) Distribución:
[(3,3) (2,2) (1,3)]
0 1 2
0
1
2
3
4
5
indegree
frequency
16. Métricas de red: los componentes conectados
Componentes fuertemente conectados
Cada nodo dentro del componente se puede llegar desde cualquier otro
nodo en el componente siguiendo los enlaces dirigidos
Componentes fuertemente conectados
B C D E
La
G H
F
Débilmente componentes conectados: cada nodo se puede llegar desde
cualquier otro nodo siguientes enlaces en cualquier dirección
La
B
C
D
E
F
G
H
La
B
C
D
E
F
G
H
Componentes débilmente conectados
A B C D E
G H F
En las redes no dirigidos se habla
simplemente de "componentes conectados '
17. métricas de red: tamaño de componente
gigante(giant component)
si el componente más grande abarca una fracción significativa de el
grafo, se llama la componente gigante (giant component)
18. métricas de red: modelo de corbata de moño
de la web
La Web es un grafo dirigido:
páginas enlazan a otras
páginas web
Los componentes conectados
nos dicen qué conjunto de
páginas se puede acceder
desde cualquier otro sólo por
el surf (no "saltar" en torno al
escribir una URL o usando un
motor de búsqueda)
Broder et al. 1999 - rastreo de
más de 200 millones de
páginas y 1,5 mil millones de
enlaces.
SCC - 27.5%
IN y OUT - 21.5%
Zarcillos y tubos - 21.5%
Disconnected - 8%
20. Métricas de red: rutas más cortas
Camino más corto (también llamado un camino geodésico o geodesic path)
La secuencia más corta de enlaces que conecta dos nodos
No siempre es único
A y C están conectados por 2 caminos
más cortos
A - E - B - C
A - E - D - C
Diámetro: la distancia geodésica más grande de la gráfica
A
B
C
D
E
La distancia entre A y C es la distancia máxima para el grafo: 3
Atención: algunas personas usan el término "diámetro" ser la distancia
media del camino más corto, en esta clase vamos a utilizar sólo para
referirse a la distancia máxima
1
2
2
3
3
22. métricas de red: densidad grafo
De las conexiones que puedan existir entre los n nodos
grafo dirigido
emax = N * (n-1)
cada uno de los n nodos puede conectarse a (n-1) otros nodos
grafo no dirigido
emax = N * (n-1) / 2
ya que los bordes no son dirigidas, cuente cada uno una sola vez
¿Qué fracción están presentes?
densidad = e / emax
Por ejemplo, de 12
posibles conexiones, este grafo
tiene 7, lo que supone una densidad de
7/12 = 0,583
¿Sería esta medida será útil para
redes que comparan de diferentes tamaños
(diferentes números de nodos)?
23. (Two-Mode) redes bipartitas
bordes se producen sólo entre dos grupos de nodos, no
dentro de esos grupos
por ejemplo, podemos tener los individuos y eventos
directivos y consejos de administración
los clientes y los artículos que compran
metabolitos y las reacciones en que participan
24. pasando de una a un gráfico bipartito de un
modo de
Un modo de
proyección
dos nodos del primer
grupo están conectados
si se ligan al mismo
nodo en el segundo
grupo
cierta pérdida de
información
naturalmente alta
Red de dos modos
grupo 1
grupo 2
25. Contorno
¿Qué es una red?
un grupo de nodos y bordes
¿Cómo lo caracterizan?
con algunos indicadores básicos de la red
¿Cómo comenzó el análisis de redes
fueron los matemáticos
¿Cómo analiza las redes de hoy en día?
con pajek u otro software
26. Historia: La teoría de grafos
Euler Siete Puentes de Königsberg - Uno de los primeros
problemas en la teoría de grafos
¿Existe una ruta que atraviesa cada puente una sola vez y vuelve al
punto de partida?
Fuente: http://en.wikipedia.org/wiki/Seven_Bridges_of_Königsberg
Imagen 1 - v1.2 GNU: Bogdan, Wikipedia; http://commons.wikimedia.org/wiki/Commons:GNU_Free_Documentation_License
Image 2 - GNU v1.2: Booyabazooka, Wikipedia; http://commons.wikimedia.org/wiki/Commons:GNU_Free_Documentation_License
Imagen 3 - GNU v1.2: Riojajar, Wikipedia; http://commons.wikimedia.org/wiki/Commons:GNU_Free_Documentation_License
27. Caminos de Euler
Si el punto de partida y el punto final son los mismos:
sólo es posible si no hay nodos tienen un grado impar
cada ruta debe visitar y dejar a cada orilla
Si no es necesario volver a punto de partida
puede tener 0 o 2 nodos con un grado impar
Ciclo euleriano: travesía cada
borde exactamente una vez
Camino de Hamilton: visita
cada vértice exactamente una vez
28. Bi-camarillas (camarillas en grafos bipartitos)
Km, n es el grafo bipartito completo con m y n vértices de los dos
tipos diferentes
K3,3 mapas a la gráfica de utilidad
¿Hay una manera de conectar tres utilidades, por ejemplo, gas,
agua, electricidad a tres casas sin tener ninguna de las tuberías
cruzan?
K3,3
Utilidad gráfica
29. Grafos planos
Un grafo es planar si se puede dibujar en un plano sin
ningún cruce bordes
30. Cuando gráficos no son planas
Dos gráficos son homeomorfo si se puede hacer uno
en el otro mediante la adición de un vértice de grado 2
31. Camarillas y gráficos completos
Knes el grafo completo (pandilla) con vértices K
cada vértice está conectado a cada otro vértice
hay n * (n-1) / 2 bordes no dirigidos
K5 K8
K3
33. Contracciones borde definido
Un gráfico finito G es plano si y sólo si no tiene subgrafo que es
homeomorfo o de punta contráctil a la gráfica completa en cinco vértices
(K5) O el gráfico bipartito completa K3, 3.(Teorema de Kuratowski)
34. #s de grafos planos de diferentes tamaños
1: 1
2: 2
3: 4
04:11
Cada grafo plano
tiene una línea recta
incrustar
36. ejemplos de árboles
En la naturaleza
El hombre hizo
Ciencias de la Computación
El análisis de redes
37. Contorno
¿Qué es una red?
un grupo de nodos y bordes
¿Cómo lo caracterizan?
con algunos indicadores básicos de la red
¿Cómo comenzó el análisis de redes?
fueron los matemáticos
¿Cómo analiza las redes de hoy en día?
con pajek u otro software
38. visión general de las herramientas de análisis
de red
Pajek
análisis de redes y la visualización,
menús, adecuado para grandes redes
plataformas: Windows (en
Linux a través del vino)
descargar
Netlogo
modelado basado en agentes
Recientemente añadido capacidades de
modelado de red
plataformas: cualquier (Java)
descargar
GUESS
análisis de redes y la visualización,
extensible, guión impulsado (jython)
plataformas: cualquier (Java)
descargar
Otras herramientas de software que nosotros no vamos a utilizar pero que pueden serle de utilidad:
visualización y análisis:
Ucinet - Fácil de usar visualización de la red social y el software de análisis (redes más pequeñas adecuadas)
IGRAPH - Si usted está familiarizado con R, se puede utilizar IGRAPH como un módulo para analizar o crear redes de gran tamaño, o puede utilizar dir
Jung - Amplia biblioteca de Java de las rutinas de análisis de redes, creación y visualización
Paquete de gráficos para Matlab (No probado?) - Si Matlab es el entorno en el que se sienta más cómodo en, aquí hay algunas rutinas básicas
SIENA - Para p * modelos y análisis longitudinal
Paquete SNA para R - Todo tipo de análisis + pesados estadísticas para arrancar
NetworkX - Python basado paquete gratuito para el análisis de grandes gráficos
InfoVis Ciberinfraestructura - Gran aglomeración de análisis de redes herramientas / rutinas, en parte a través de menús
sólo la visualización:
GraphViz - Software de visualización de la red de código abierto (puede manejar grandes redes / especializados)
TouchGraph - Necesidad de crear rápidamente una visualización interactiva para la web?
yEd -, Visualización gráfica libre y edición software
especializada:
algoritmo hallazgo comunidad de rápido
perfiles con motivos
Biblioteca CLAIR - PNL y la biblioteca IR (Perl Based) incluye las rutinas de análisis de redes
finalmente: INSNA larga lista de paquetes S
39. herramientas usaremos
Pajek: amplia funcionalidad basada en menús,
incluyendo muchas, muchas métricas de red y
manipulaciones
pero ... no extensible
Guess: extensibles, herramientas de secuencias de
comandos de análisis exploratorio de datos, pero la
selección más limitada de métodos incorporados en
comparación con Pajek
NetLogo: plataforma general agente basado en la
simulación con el apoyo de modelado excelente red
muchos de los demos en este curso fueron construidos con
NetLogo
IGRAPH: utilizado en la versión de nivel de doctorado
de este curso. bibliotecas se puede acceder a través de
R o Python. Rutinas escalan a millones de nodos.
40. otras herramientas: herramienta de
visualización: Gephi
http://gephi.org
principalmente para la visualización, tiene algunos
toques agradables
41. herramienta de visualización: GraphViz
Toma descripciones de gráficos en los lenguajes de
texto simples
Genera imágenes en formatos útiles
Opciones de formas y colores
Independiente o utilizar como una biblioteca
dot: dibujos jerárquicos o capas de grafos dirigidos,
evitando los cruces de borde y la reducción de longitud
de borde
neato (Kamada-Kawai) y el FDP (Fruchterman-Reinhold
con la heurística para manejar gráficos de mayor
tamaño)
DosPi - diseño radial
circo - diseño circular
http://www.graphviz.org/
47. Otras herramientas de
visualización: Morsa
desarrollado en CAIDA disponible bajo la GNU GPL.
"... El más adecuado para la visualización de gráficos de
tamaño moderado que son casi los árboles. Un gráfico con
unos pocos cientos de miles de nodos y sólo ligeramente
mayor número de enlaces es probable que sea cómodo para
trabajar con ".
Basada en Java
Características implementadas
la prestación a una velocidad garantizada, independientemente
del tamaño gráfico
nodos para colorear y enlaces con un color fijo, o por valores
RGB almacenados en los atributos
nodos de etiquetado
recoger los nodos para examinar los valores de atributos
mostrar un subconjunto de nodos o enlaces basado en un
atributo booleano suministrada por el usuario
poda interactivo de la gráfica para reducir temporalmente el
desorden y la oclusión
zoom dentro y fuera
Fuente: CAIDA, http://www.caida.org/tools/visualization/walrus/
48. herramientas de visualización: YED - Java ™ del editor de
gráficos
http://www.yworks.com/en/products_yed_about.htm
(Bueno sobre todo para los diseños, tal vez gratis)
50. herramientas de visualización: Prefuse
(Gratis) conjunto de herramientas de interfaz de usuario para la
visualización interactiva de información
construido en Java usando Java2D biblioteca de gráficos
estructuras de datos y algoritmos
arquitectura de canalización que ofrece, módulos componibles
reutilizables
animación y apoyo renderizado
técnicas arquitectónicas de escalabilidad
requiere conocimientos de programación Java
página web: http://prefuse.sourceforge.net/
Papel CHI http://guir.berkeley.edu/pubs/chi2005/prefuse.pdf
52. Ejemplos de las aplicaciones Prefuse: mapas
de flujo
Un mapa de flujo de la migración desde
California a partir de 1995-2000, generado
automáticamente por nuestro sistema
mediante el enrutamiento de borde pero no
el ajuste de maquetación.
http://graphics.stanford.edu/papers/flow_map_layout/
53. Ejemplos de las aplicaciones Prefuse: vizster
http://jheer.org/vizster/
54. Contorno
Métricas de red pueden ayudar a caracterizar las redes
Esto tiene es raíces en la teoría de grafos
Hoy en día existen muchas herramientas de análisis de
red para elegir
aunque la mayoría de ellos están en fase beta!
En el laboratorio: análisis de redes exploratorio con
Pajek