O documento descreve métricas de análise de redes que podem ser medidas pelo software Gephi. Essas métricas incluem grau médio, diâmetro da rede, e coeficiente de grupalização para caracterizar a rede como um todo ou nós individuais. Algoritmos como PageRank e centralidade eigenvector medem a importância dos nós.
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Matemática das redes - parte II
1. Matemática das redes – parte II
Prof. Dalton Martins
dmartins@gmail.com
FATEC – São Paulo
Depto. de Tecnologia da Informação
Aula 04 – Projeto de Redes de Computadores
2. Gephi: Ferramenta de Análise
Utilizaremos ao longo deste
curso o software Gephi para
análise de redes:
https://gephi.org/
O Gephi oferece um conjunto
de métricas padrão que iremos
avaliar com
mais atenção nesta aula sobre
a matemática das redes.
O Gephi oferece em 3 níveis
inicialmente:
1. Nível rede: mostra
características da rede como
um todo
2. Nível nó: mostra
características específicas de
cada nó
3. Nível link: mostra
características do modo como
os links se conectam.
3. Nível rede
● Average degree (grau médio):
– O grau médio representa o número de
conexões que, em média, os nós de uma
rede possuem;
– É uma medida que exige atenção na hora de interpretar,
pois as redes normalmente não possuem uma distribuição
normal de grau, ou seja, os valores não se distribuem em
torno da média e sim exponencialmente, ou seja, com
poucos nós com grau alto e muitos nós com grau baixo.
– No entanto, esse valor pode ser útil quando da
comparação entre diferentes redes, atentando para o
exposto acima.
4. Nível rede
●
Average weighted degree (grau médio ponderado):
– O grau médio ponderado representa o número de
conexões ponderadas que, em média, os nós de uma
rede possuem;
– É uma medida que leva em consideração o peso/intensidade das
conexões entre os nós. Logo, não avalia apenas se há conexão entre
eles, mas sim a intensidade dessa conexão. Exemplo: quantas vezes uma
pessoa trocou mensagens com a outra!
– É também preciso atenção em sua interpretação, pois a distribuição do
grau médio ponderado por nó também não tende a ser uma distribuição
normal e sim exponencial.
5. Nível rede
●
Network Diameter (diâmetro da
rede):
– O diâmetro de uma rede
representa a maior distância
existente entre dois nós nessa
rede;
– Por distância, entendemos o
número de conexões
intermediárias existentes entre
esses nós.
– Essa medida é útil para
compararmos redes e avaliar, em
uma certa medida, a maior
distância que seus nós
precisariam percorrer para se
conectarem.
6. Nível rede
● Graph Density (densidade do grafo):
– A densidade do grafo mostra a taxa de quantas conexões
existem no grafo em relação a todas as conexões
possíveis, considerando que todos os nós estivem ligados a
todos diretamente;
– É uma medida que mostra o quão conectados entre si estão
os nós de uma rede;
– Pode ser útil, em alguns casos, para comparar diferentes
redes, sobretudo pequenas redes. No entanto, tende a ser
uma medida muito baixa para a maioria das redes e, quanto
maior forem, mais baixa será, não sendo muito útil para
análise.
7. Nível rede
● HITS - Hyperlink-Induced Topic Search (Busca de tópicos
induzida por links):
– É um algoritmo que determina dois valores para cada nó:
● Hubs (conector): estima o valor dos links que saem de
um nó em direção aos outros em que está conectado.
Quanto mais um nó conecta diferentes “pedaços” da
rede, maior será seu valor como conector nessa rede;
● Authority (autoridade): o valor de autoridade é calculado
somando-se todos os valores Hubs(conector) dos nós
com os quais o nó em questão está conectado. Isso pode
ser interpretado como um nó que se conecta diretamente
com mais hubs tem maior autoridade na rede, pois
articula com esses hubs.
– O HITS é considerado de nível rede pois ele usa toda a rede
para calcular suas duas métricas.
– Os valores da Autoridade e Hubs podem ser utilizados para
determinar o tamanho de um nó na imagem da rede.
8. Nível rede
● HITS - Hyperlink-Induced Topic Search (Busca de tópicos
induzida por links)
O valor dos hubs depende dos links apontados para um nó
O valor da autoridade depende dos nós
com quem um nó tem conexão.
9. Nível rede
● Modularity (modularidade):
– É uma medida que mostra o quão
bem uma rede poderia ser
decomposta em comunidades
modulares.
– Um alto valor de modularidade
indica uma rede com uma complexa
estrutura de comunidades internas.
– É uma medida interessante para
comparar estrutura de diferentes
redes se buscamos mapear seus
modos de organização em
comunidades de nós.
10. Nível rede
● Page rank (ranqueamento
de página):
– É um algoritmo que mede
a importância de cada nó
na rede baseado na
estrutura de conexões
dessa rede;
– Quanto mais links um nó
receber e quanto mais
links de nós que já
possuem muitos links
receber, maior será o seu
valor de Page Rank;
– É uma métrica que pode
também ser utilizada para
definir o tamanho de um
nó em uma visualização
de rede.
11. Nível rede
● Connected components
(componentes
conectados):
– Determina o número de
componentes conectados
em uma rede;
– Por componente
conectado, entendemos
um conjunto de nós no
qual há pelo menos um
caminho de conexção
entre todos eles.
– Não há nenhum nó ou
conjunto de nós isolados.
Os conjuntos isolados
formam diferentes
componentes.
12. Nível nó
● Average Clustering
Coefficient (Coeficiente
médio de grupalização):
– Determina o coeficiente
médio em que os nós de
uma rede formam
grupalidade entre si, ou
seja, estão mais ou
menos conectados
formando grupos de
conexões diretas;
– É uma métrica muito útil
para comparar redes e
percebermos o grau de
articulação existente
entre seus nós.
13. Nível nó
●
Eigenvector Centrality
(centralidade eigenvector):
– É uma medida de
centralidade que considera
as conexões de um nó para
calcular seu grau de
importância;
– Essa medida considera que
nós conectados com nós
de maior centralidade
receberão também maior
centralidade do que se
estiverem conectados com
nós de menor centralidade.
– O algoritmo Page Rank é
um tipo de centralidade por
Eigenvector.
14. Nível link
● Average Path Length (Comprimento do caminho médio):
– Representa o comprimento médio do caminho entre dois nós
em uma rede;
– Significa a distância que dois nós estão um do outro, em
média, para uma rede;
– Pode ser útil para comparar questões de difusão de
informações/recursos em diferentes redes a partir de seus
caminhos.
15. Nível link
● Link Communities
(Comunidades conectadas):
– O algoritmo propõe reveltar
comunidades em redes com
links não direcionados e não
ponderados.
– É um algoritmo que compara
dois links e, se sua
similaridade for acima de um
valor de referência, ele
coloca esses links na mesma
comunidade.
– Esse método permite
sobreposição de
comunidades, pois um nó
pode pertencer a múltiplos
links e a múltiplas
comunidades.