ARS - Análise de Redes Sociais - VIII ERI MG

896 visualizações

Publicada em

Slides do minicurso de Análise de Redes Sociais para a VIII Escola Regional de Informática de Minas Gerais - Unimontes/Montes Claros

Publicada em: Dados e análise
0 comentários
4 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
896
No SlideShare
0
A partir de incorporações
0
Número de incorporações
13
Ações
Compartilhamentos
0
Downloads
29
Comentários
0
Gostaram
4
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

ARS - Análise de Redes Sociais - VIII ERI MG

  1. 1. ARS - Análise de Redes Sociais Prof. Petrônio Cândido de Lima e Silva
  2. 2. Agenda 1. Contextualização 2. Fundamentos Teóricos a. Teoria dos Grafos b. Redes Sociais c. Métricas e Algoritmos de ARS 3. Prática a. Extração de Dados de Redes Sociais b. Análise
  3. 3. Introdução e Contextualização
  4. 4. Redes Sociais “Diga-me com quem tu andas e eu te direi que és” Pessoas e Relacionamentos Pessoas → Pessoas Pessoas ← Pessoas
  5. 5. Redes Sociais ● Incapacidade de abstrair em toda a sua complexidade o emaranhado de relacionamentos em que estamos envolvidos ○ Qual o seu impacto nos outros ? ○ Qual o impacto dos outros em você ? ○ Quem você conhece? ○ Como você classifica quem conhece?
  6. 6. Redes Sociais ● TUDO está conectado ○ Grande emaranhado de inter-relacionamentos de todas as naturezas; ○ Influências se propagam na rede; ○ Protagonistas ○ Coadjuvantes
  7. 7. Redes Sociais ● Complexas ● Dinâmicas ● Redundantes ● Localizadas ● Difusas ● Recursivas ● Incompletude ● Limites nebulosos
  8. 8. Redes Sociais ● Resistência / Resiliência ○ Tolerante à falhas ○ Laços isolados entre pessoas são frágeis ○ A rede em si é extremamente resistente à desconexão: ■ Quando perde pessoas ■ Quando perde relacionamentos
  9. 9. Redes Sociais ● GRANOVETTER (1973) ● Laços Fortes (Strong Ties) ○ Interligam pessoas próximas/íntimas, de um mesmo grupo ou comunidade; ○ São pessoas basicamente parecidas;
  10. 10. Redes Sociais ● Laços Fracos (Weak Ties) ○ Interligam conhecidos e pessoas que freqüentam outros grupos ou comunidades; ○ Conhecidos, convivência ocasional e esporádica; ○ Elos de ligação entre grupos diferentes, garantindo a diversidade;
  11. 11. Redes Sociais ● Com quem é melhor procurar emprego? Entre os amigos próximos (strong ties) ou com os distantes (weak ties) ? ● strong ties: Possivelmente também são seus concorrentes ● weak ties: Elo com outros mercados!
  12. 12. Aplicações ● Redes de Contágio Emocional ● Redes de Poder/Influência ● Redes Terroristas ● Redes Científicas
  13. 13. Redes de Contágio Emocional ● Modelos de contágio ○ ABDO (2009) ● Modelo de contágio emocional no Facebook ○ KRAMER, GUILLORY e HANCOCK (2014) ○ COVIELLO et al (2014) ● #VemPraRua ○ CANCIAN, FALCÃO e MALINI (2013) ● #ProtestoRJ ○ CALMON, BRUNO e ANTOUN (2014)
  14. 14. Redes de Contágio Emocional
  15. 15. Redes de Poder / Influência ● NSA espiona a presidente DILMA ○ GLOBO (2013) ● Redes de financiamento político ○ HOROCHOVSKI et al (2014)
  16. 16. NSA espiona Dilma
  17. 17. Redes Terroristas e Criminosas ● Terroristas do 11/09 e rede Al Qaeda ○ KREBS (2002) ○ XU e CHEN (2005)
  18. 18. Redes Científicas ● VANZ (2009) ● BALANCIERI et al. (2005) ● ROSSONI, SILVA e JÚNIOR (2008)
  19. 19. Fundamentos Teóricos
  20. 20. Agenda 1. Grafos 2. Redes Complexas 3. Redes Sociais 4. Métricas de Redes Sociais 5. ARS versus Mineração de Grafos
  21. 21. Teoria dos Grafos
  22. 22. Grafos G = { V , E } V = {a1, a2, a3, ... , an} E = {(ai,ak) | ai, aj ∈ V } n = | V | m = | E |
  23. 23. Grafos B J A F C I H G D
  24. 24. Grafos ● Simples - Arestas simétricas ( ai , ak ) = ( ak , ai ) ● Direcionados (Dígrafos) - Arestas assimétricas ( ai , ak ) ≠ ( ak , ai )
  25. 25. Grafos B J A F C I H G D
  26. 26. Grafos - Matriz de Adjacências A B C D E F G H I J A 0 0 1 0 0 0 0 0 0 0 B 0 0 1 0 0 0 1 0 0 0 C 1 1 0 0 0 1 1 0 0 0 D 0 0 0 0 0 0 0 0 0 0 E 0 0 0 0 0 0 0 0 0 0 F 0 0 1 1 0 0 0 0 0 0 G 0 1 1 0 0 0 0 0 0 0 H 0 0 0 0 0 0 0 0 0 1 I 0 0 0 0 0 0 0 0 0 1 J 0 0 0 0 0 0 0 1 1 0 wi,j ∈ V A(G) = [wij] 0, se não há aresta entre i e j x >0, se há aresta entre i e j Wij é conhecido como Peso ou Custo da aresta
  27. 27. Grafos - Matriz de Adjacências ● Multigrafos ○ Permite mais de uma aresta entre dois vértices ● Hipergrafos ○ Uma mesma aresta pode conectar mais de dois vértices
  28. 28. Grafos ● Grau - Degree ○ Número de arestas que estão conectadas à um vértice: d(i) = Σj∈V wij (considerando wij binária)
  29. 29. Digrafos ● Grau de Entrada / Incidente (InDegree) ○ din(v) = Σj∈V wvj ● Grau de Saída (outDegree) ○ dout(v) = Σj∈V wjv
  30. 30. Grafos ● Soma dos Graus d(G) = Σv∈V d(v) = 2m ● Grau Médio do Grafo d(G) = 1/n Σv∈V d(v) = 2m/n
  31. 31. Digrafos ● Base - Conjunto de Vertedores ○ É um subconjunto dos vértices de um dígrafo tal que: B ⊆ V | ∀v ∈ B, din(v) = 0, dout(v) > 0 ● Anti-Base - Conjunto dos Sorvedores ○ É um subconjunto dos vértices de um dígrafo tal que: AB ⊆ V | ∀v ∈ AB, din(v) > 0, dout(v) = 0
  32. 32. Grafos B H A E C I G F D B = {A, E, G} AB = {D, I, F}
  33. 33. Grafos ● cij - Caminho ○ Partindo de i, uma lista de n vértices que o interligam ao vértice j, existindo arestas entre eles. ● Menor Caminho (Shortest Path) ○ Caminho de Custo Mínimo ○ DIJKSTRA (1959) ○ O(m log n)
  34. 34. l(i,j) - Distância Geodésica O custo (ou tamanho) do menor caminho entre i e j; l(i,j) = Σx,y ∈ Cij wxy ● l(G) - Distância Geodésica Média ○ O tamanho médio dos caminhos dos grafo G l(G) = 1/n Σi,j ∈ V l(i,j) Grafos
  35. 35. Grafos - Matriz de Vizinhança A B C D E F G H I J A 0 0 1 0 0 0 0 0 0 0 B 0 0 1 0 0 0 1 0 0 0 C 1 1 0 0 0 1 1 0 0 0 D 0 0 0 0 0 0 0 0 0 0 E 0 0 0 0 0 0 0 0 0 0 F 0 0 1 1 0 0 0 0 0 0 G 0 1 1 0 0 0 0 0 0 0 H 0 0 0 0 0 0 0 0 0 1 I 0 0 0 0 0 0 0 0 0 1 J 0 0 0 0 0 0 0 1 1 0 A(G) = [wij] wi,j ∈ V = l(i,j) Wij é a distância entre i e j
  36. 36. Grafos ● Conexo ○ Existe um caminho entre quaisquer dois vértices do grafo: ∃cij ∀i,j∈ V ● Desconexo ○ ∄cij ∀i,j∈ V
  37. 37. Grafos ● Sub-grafos Gs = (Vs,Es) | Vs ⊂ V, Es ⊂ E ● Componentes ○ Sub grafos conexos de um grafo desconexo
  38. 38. Grafos ● Conjunto de Corte ○ Conjunto mínimo de vértices ou arestas que se removidos do grafo causam sua desconexão ou aumentam o número de componentes; ○ Ponto de Articulação / Vértice de Corte (Cut-Edge) ○ Aresta de Corte (Cut-Arc)
  39. 39. Grafos ● Resistência ○ Capacidade de uma rede tem de perder nós e continuar conectada; ○ Próximo ao conceito de Densidade, que será estudado adiante.
  40. 40. Grafos ● Grafos Completos - Kn Kn = [n(n-1)]/2 ● Clique ○ Subgrafo completo de um grafo
  41. 41. Grafos ● Árvores ● Árvore Geradora Mínima ○ Um subgrafo em forma de árvore, de custo mínimo, que conecte todos os vértices com o mínimo de arestas
  42. 42. Redes Complexas
  43. 43. Redes Complexas ● Grafos de alta dimensionalidade ● Propriedades comuns: ○ Aleatórios ○ Distribuição de Grau ○ Estruturas de comunidade
  44. 44. Redes Complexas ● Tipos de Redes ○ Biológicas ○ Sociais ○ Informacionais ○ Tecnológicas
  45. 45. Grafos Aletórios de Erdös-Rény ● ERDÖS e RÉNY (1961) ● Dado um conjunto de vértices V, as arestas entre esses vértices são calculadas por uma probabilidade k; GERnk = (V, E) | n = |n| , k = |E|
  46. 46. Grafos Aletórios de Erdös-Rény 1. Inicia com os n vértices isolados ( E = ∅ ) 2. Para i = 0 até K a. Selecione dois nós aleatoriamente: i e j b. E ← (i, j) ● Resultados interessantes: d(GERnk) ≈ k l(GERnk) ≈ logkn
  47. 47. Grafos Aletórios de Erdös-Rény B H A E C I G F D B H A E C I G F D B H A E C I G F D
  48. 48. Modelo de Watts-Strogatz ● WATTS e STROGATZ (1998) ● Todos os vértices se conectam aos seus vizinhos mais próximos; ● Existe uma probabilidade de reconexão da aresta com outro vértice
  49. 49. Grafos Aletórios de Erdös-Rény B H A E C I G F D B H A E C I G F D B H A E C I G F D
  50. 50. Distribuição de Grau ● Uma distribuição de grau é a distribuição de frequências de vértices (nk) com um determinado grau (k) em relação à n fk = nk / n Freq (fk) Grau (k)
  51. 51. Lei de Potência P(x) =

×