1. #1
EXTRAIR, MINERAR
E VISUALIZAR
CONTROVÉRSIAS
EM REDES SOCIAIS
Rede VemPrarua: junho a outubro de 2013
Prof. Dr. Fábio Malini
Universidade Federal
do Espírito Santo
curso na
Câmara dos Deputados
Laboratório Hacker
2. #1
objetivos
Prof. Dr. Fábio Malini :: curso
Câmara dos Deputados
Compreender os Termos e Medidas
básicos utilizados na análise de redes
sociais.
Extração de redes para analisar as métricas
dentro de uma rede social.
Capacitação no uso do software Gephi e
em análise semântica de controvérsias na
rede.
3. #1
objetivos
Prof. Dr. Fábio Malini :: curso
Câmara dos Deputados
Compreender os Termos e Medidas
básicos utilizados na análise de redes
sociais.
Realização de atividade prática para
consolidar o conhecimento teórico
adquirido.
Capacitação no uso do software Gephi e
em análise semântica de controvérsias na
rede.
4. #1.1
Termos e definições
na análise de redes
sociais.
Prof. Dr. Fábio Malini
UFES
- Nó. Representado, numa
rede, por pontos. Em redes
sociais, os nós representam o
nome do perfis.
fabiomalini
ufeslabic
ufesonline
francisodre
5. #1.1
Termos e definições
na análise de redes
sociais.
Prof. Dr. Fábio Malini
UFES
- Aresta. Representado,
numa rede, por linhas. Em
redes sociais, as linhas
revelam as ações dos perfis:
compartilhamento (RTs) ou
comentários (ATs) de uma
mensagem.
fabiomalini
ufeslabic
6. #1.1
Nós e arestas. A B
uma aresta
(RTs, Shares, Replies, Ligação...)
Nós
humanos ou bots
Nós e arestas possuem
atributos. Ex: conteúdo
de um tweet é atributo
de uma aresta.
Rede direcional Rede não-direcional
5
O peso da rede
(valor atribuído nas arestas)
7. #1.1
arestas.
Importante:
As arestas podem
ser de tipo Simples
ou de tipo
Ponderada.
simples: quando a
ligação não possui peso
ponderada: quando diferentes
arestas possuem pesos distintos.
5
3
1Quando o peso da aresta
entre dois nós é forte,
conceituamos a relação de
“laços fortes”.
8. #1.1
Clusters.
É um conjunto de
nós fortemente
conectado.
Cluster 04
Cluster 02
Cluster 03
Cluster 01
Clusters, em termos
sociais, são grupos de
interesses comuns. São
estruturas de afinidades.
Perspectividades.
9. #1.1
Grafo.
Cluster 04
Cluster 02
Cluster 03
Cluster 01
É a representação gráfica
de uma
rede interativa.
Ele pode ser:
- Direcional ou dirigido: quando um nó possui ligação
com outro não necessariamente recíproca (ex:
Instagram, Twitter);
- Não direcional ou não dirigido: quando a ligação
entre dois nós é necessariamente recíproca (ex:
Facebook e Orkut).
11. #1.1
Estatísticas
As medidas ajudam no
entendimento dos papéis
sociais (em sentido amplo,
nas subjetivações)
constituído pela ação dos
perfis nas redes sociais.
12. #1.1
Estatísticas
GRAU MÉDIO
Define o peso dos nós de acordo
com a quantidade de suas
conexões.
Grau de entrada: número de
conexões que um nó recebe de
outro.
Grau de saída: número de
conexões que sai de um nó para
outro.
13. #1.1
Estatísticas
GRAU PONDERADO MÉDIO
Similar ao grau médio, mas, para
a sua medida, utiliza-se dos pesos
das arestas em seu algoritmo para
então definir o peso dos nós.
A recebeu 50 Retweets de B
C recebeu 10 Retweets de B, 10
de D, 5 de E, 5 de F,
14. João recebeu doação de R$ 50 mil da
empresa Slide.
Maria recebeu doação de R$ 50 mil reais
de 50 empresas diferentes, no valor de
R$ 1 mil.
Qual é a diferença de GRAU e
GRAU PONDERADO MÉDIO?
João e Maria possuem o mesmo Grau.
Mas Maria possui um valor maior em
seu grau Ponderado Médio, por conta
da diversidade de suas relações.
20. #1.2
Extraindo dados
para identificar o
grau de um nó
numa rede social.
Prof. Dr. Fábio Malini
UFES
Crawl: importado do inglês, o verbo
“crawlear” (“to crawl”) neste
contexto significa minerar/coletar
dados da web, de mídias, de redes
sociais etc.
21. Prof. Dr. Fábio Malini
UFES
Flocker
Webapp que age como estruturador de
redes de retweets em tempo real. Permite
exportar o grafo criado para GEXF, PNG e
SVG.
http://flocker.outliers.es/
Netvizz
Aplicativo do Facebook de fácil utilização que
possibilita extrair redes de amigos, páginas e
grupos a que o usuário está conectado.
https://apps.facebook.com/netvizz/
#1.2
Crawlers
22. Prof. Dr. Fábio Malini
UFES
NodeXL
Extensão para o Microsoft Excel que permite
extrair dados de redes como
Facebook, Flickr, Twitter e Youtube, assim
como posterior exportação para Gephi.
http://nodexl.codeplex.com/
GNIP
Permite extrair dados da rede do Twitter. É o
único que não possui limite de tempo de
publicação do tweet nem limite de
requisições ao servidor.
http://gnip.com/
#1.2
Crawlers
23. Prof. Dr. Fábio Malini
UFES
YourTwapperKeeper
Permite a configuração de diferentes
keywords para monitoração,
captura e armazenamento de tweets
em tempo real. Necessita de
instalação.
https://github.com/540co/yourTwap
perKeeper
#1.2
Crawlers
24. TELA DO YTK
AS PRIMEIRAS EXTRAÇÕES DO LABIC/UFES E CIBERCULT E MEDIALAB / UFRJ
(processo de pesquisa Cartografia das Controvérsias políticas na internet – CNPq/CAPES)
25. Prof. Dr. Fábio Malini
UFES
Analisando um arquivo de grafos no
Twitter: o caso do #MarcoCivil.
#1.3
Atividade Prática