- O documento discute redes sociais e sistemas complexos, incluindo análise de redes sociais, ferramentas como NodeXL e Gephi, métricas de redes, detecção de comunidades, e sistemas complexos emergentes em redes.
13. Redes sociais
• Actores (nós, vértices, etc)
• Relações (lados, arestas, etc)
• Direccionadas ou não direccionadas
– Seguir, gostar, ser amigo, serem co-autores, etc
• Com atributos diversos (actores e relações)
2013-09-25 13
14. Representação
• Podem ser representadas por matrizes ou por
listas de lados, por exemplo
A B C D E
A 0 1 1 1 0
B 1 0 1 0 1
C 0 0 0 1 0
D 0 1 1 0 0
E 1 1 0 0 0
A B
A C
A D
B A
B C
B E
C D
D B
D C
E A
E B
2013-09-25 14
15. Atributos
• Os nós e os lados podem ter atributos
• Associados a propriedades próprias
• Ou a métricas da rede
2013-09-25 15
16. Métricas globais
• Número de vértices 5
• Número de lados 11
• Número de componentes 1
• Diâmetro 2
• Densidade 0.55
2013-09-25 16
17. • Distância ao nó mais distante
A B
D
G
E
C
F
A B C D E F G
A
B
C
D
E
F
G
1 2 1 1 1 2
3 2 2 2 3
1 1 3 2
1 2 1
2 2
3
E(A)=2
E(B)=3
E(C)=3
etc
Excentricidade (de um nó)
2013-09-25 17
18. A B H
I
J
K
D
G
E
C
F
Diâmetro e raio
• Diâmetro = Máxima excentricidade 5
• Raio = Mínima excentricidade 3
2013-09-25 18
19. A B
D
G
E
C
F
A B C D E F G
A
B
C
D
E
F
G
1 2 1 1 1 2
3 2 2 2 3
1 1 3 2
1 2 1
2 2
3
|D(1)|=8
|D(2)|=9
|D(3)|=4
L=(8x1+9x2+4x3)/(8+9+4) L=1.8
Distância média
2013-09-25 19
20. Métricas dos nós
• Grau
– In/Out
• Centralidade
– Proximidade/distância
– Intermediação
• PageRank
2013-09-25 20
21. A B
D
G
E
C
F
4 – 4 – 3 – 2 – 1 – 1 - 1
Sequência de graus
2013-09-25 21
4
4
3
2
1
1
1
22. C= Distância média aos vizinhos
A B H
I
J
K
D
G
E
C
F
N=11
C(G)=1/10(1+2*3+2*3+4+3*5)
C(G)=3.2
C(A)=1/10(4+2*3+3*3)
C(A)=1.9
C(B)=1/10(2+2*6+2*3)
C(B)=2
Centralidade de proximidade
2013-09-25 22
closeness
23. BC= múmero de caminhos mais
curtos que passam pelo nó.
A B H
I
J
K
D
G
E
C
F
BC(G)=0
N=11
BC(D)=9+7/2=12.5
BC(B)=4*6=24BC(A)=5*5+4=29
Centralidade de intermediação
2013-09-25 23
betweenness
24. PR=Probabilidade de um visitante visitar o nó.
PR=Cada página vota nos seus vizinhos.
A E F
G
H
I
B
K
C
J
D
PR(A)=PR(B)/4 + PR(C)/3 + PR(D)+PR(E)/2
O navegador aleatório parará de navegar algures
PR(X)=(1-d)/N + d( PR(y)/k(y))
PageRank
2013-09-25 24
random walker
praça mais visitada
F 2.028
A 1.656
B 1.615
C 1.199
E 0.933
J 0.833
G 0.581
H 0.581
I 0.581
D 0.502
K 0.493
PageRank:
27. Experimentar…
• Notar que em NodeXL apenas se introduzem
– Os lados
– Os atributos dos lados
– Os atributos dos vértices (uma vez criados)
• Notar que existem vários separadores na folha
• Respeitar as colunas pré-definidas
• Aprender uma coisa de cada vez…
2013-09-25 27
29. Mais métricas dos vértices
• Grau
• Centralidade
• Eigenvector
• PageRank
• Clustering
2013-09-25 29
30. Eigenvector
• Definição recursiva: centralidade de um nó é a
soma das centralidades de todos os seus
vizinhos
• Corresponde à definição matemática de
vector próprio da matriz de adjacências
Ax= x
2013-09-25 30
31. Matriz de adjacências
2013-09-25
A B H
I
J
K
D
G
E
C
F
A B C D E F G H I J K
A 1 1 1 1 1
B 1 1
C 1
D 1 1 1
E 1 1 1
F 1 1
G 1 1
H 1 1 1 1 1
I 1
J 1
K 1
A 0.218
D 0.166
E 0.166
F 0.125
G 0.125
B 0.087
H 0.049
C 0.016
I 0.016
J 0.016
K 0.016
Eigenvector:
31
melhores citações
33. Coeficiente de clustering
• Numa comunidade, há uma certa
transitividade:
se A está ligado a B e B está ligado a C, então
é bastante provável que A esteja ligado a C
(amigo do amigo)
• Coeficiente de clustering de um nó
número de ligações entre os seus vizinhos /
máximo de ligações possível
2013-09-25 33
35. Comunidades
• Densidade de rede:
número de lados / máximo número de lados
• Comunidades:
grupos de nós em que a densidade do seu interior é
maior que a densidade entre eles
2013-09-25 35
36. Detecção de comunidades
• Usam-se muitos algoritmos
– Clauset-Newman-Moore
– Wakita-Tsurumi
– Girvan-Newman
2013-09-25 36
54. Complexidade
• As colónias de insectos
• O cérebro
• O sistema imunitário
• O mercado
• A World Wide Web
Sistemas constituídos por um grande número de
unidades muito simples, de onde emerge
“inteligência”, “consciência”, uma vida própria
2013-09-25 54
55. Sistemas complexos
• Sistemas baseados em redes de componentes
• Sem controlo central
• Com regras de operação simples
• Um sistema de informação sofisticado
• Capacidade de adaptação por aprendizagem ou
evolução
• Comportamentos emergentes
• Auto-organização
2013-09-25 55
56. Pode medir-se a complexidade?
• Há várias propostas
• Ainda não há uma ciência/teoria da
complexidade
• Estão-se a definir os conceitos básicos:
informação, computação, ordem, vida …
2013-09-25 56
58. Organizações
• São sistemas complexos
• Com um grande dilema
– Centralizar / descentralizar
– Conservar / inovar
• No mundo global
2013-09-25 58
59. Detecção de situações anormais
• Alterações climáticas
• Mudanças de hábitos de consumo
• Segurança
• O padrão escondido por detrás de tudo o que
fazemos…
2013-09-25 59
75. Há aqui muitos desafios
• Estudar um tópico
– Detecção de comunidades
– Desconvolução (onde começou?)
• Estudar uma rede grande
– Há muitos datasets disponíveis
– Stanford Large Network Dataset Collection
– Tore Opsahl’s Datasets
– Gephi sample datasets
2013-09-25 75