COLETA DE
nas mídias sociais
Marcelo alves
COLETA DE
nas mídias sociais
instrutor
•Doutorando pelo PPGCOM/UFF;
• Estuda comunicação política em rede;
• Sócio-diretor da Vértice Inteligência;
• Pesquisador do laboratório de mídia e democracia
(LAMIDE/UFF), orientado por Afonso de Albuquerque;
• Publica textos no blog www.marceloalves.org
N = 532 fan-pages
A = 8.654 arestas
Rede antipetista na
eleição de 2014
COLETA DE
nas mídias sociais
c
Quais objetos ou
temas de
pesquisa dos
alunos para
coleta de dados?
COLETA DE
nas mídias sociais
O que você vai aprender
•O básico da concepção teórica da análise de redes;
• Processos de coletas de dados relacionais;
• Leitura da documentação da Graph API do Facebook
• Métodos de construções de queries;
• Funcionamento e prática com Facepager;
• Extrair dados das pesquisas dos alunos;
• Tratamento e manipulação de dados relacionais;
• Importar dados no Gephi.
COLETA DE
nas mídias sociais
c
CONCEITOS
TEÓRICOS GERAIS
(prometoser
breve)
COLETA DE
nas mídias sociais
Lógicasdacomunicaçãopolíticaemmassaeemrede-KlingereSvensson(2014)
COLETA DE
nas mídias sociais
Lógicasdacomunicaçãopolíticaemmassaeemrede-KlingereSvensson(2014)
• Lógicas de rede não estão tomando o lugar da lógica de
massa;
• As plataformas de mídias sociais seguem outras regras do
jogo;
• A mídia de massa e o conteúdo jornalístico continuam sendo
uma das principais fontes de informação;
• As duas lógicas não são estáticas, mas estão em evolução
COLETA DE
nas mídias sociais
Sistemasmidiáticoshíbridos–Chadwick(2013)
• “O sistema midiático híbrido é baseado em conflito e cooperaçãoentre lógicas novas e antigas; mas
também possui considerável grau de interdependênciaentre estas lógicas” (Chadwick, 2013, p. 207)
• Convergência midiática – ambos os sistemas estão entrelaçados
• Partidos, imprensa e movimentos sociais tradicionais estão se adaptando às lógicas de rede
“Conteúdo nas plataformas de mídias sociais nem sempre é gerado pelo usuário, mas frequentemente
envolve referências aos meios de massa. A mídia tradicional também busca aprender distribuições
virais como uma base de um novo modelo de negócios. Usuários de mídia diversificaram suas dietas
noticiosas e começam a navegar em sistemas midiáticos híbridos. No entanto, a sobreposição não
torna as lógicas midiáticas indistinguíveis, porque são modus operandi muitos distintos. É tarefa dos
estudos empíricos distinguir e medir as lógicas de massa e de rede em casos específicos” (Klinger e
Svensson, 2014, p. 12).
COLETA DE
nas mídias sociais
Repertóriosdigitaisemredesehibridismoorganizacional(Chadwick,2007)
Duas tendências paralelas
1) Organizações políticas tradicionais estão adotando e modificando seletivamente características de
movimentos sociais;
Quatro repertórios principais: (a) mobilizando formas online de ação dos cidadãos; (b) articulando
ligações entre diferentes grupos; fundindo discurso políticos e subculturais e (d) aproveitando-se de
redes sedimentárias.
“Há sinais crescentes de que organizações tradicionais, mais hierárquicas, menos inovadoras –
como grupos de interesse e partidos – estão começando a se adaptar e adotar repertórios digitais em
rede” (Chadwick, 2007, p. 286)
2) Novas formas organizacionais que só podem existir na internet estão surgindo.
“Organizações ainda mais radicais estão surgindo, como o MoveOn, que mistura repertórios ou
rapidamente troca de um conjunto de ações para outras. Quando se trata de ação coletiva
potencializada pela internet, a imitação é parte da inovação. O conceito que melhor da conta deste
resultado é a hibridez organizacional”
COLETA DE
nas mídias sociais
Ociclodeinformaçãopolítica–Chadwick(2011)
Ciclo noticioso = período do dia previsível no qual se produzem as notícias, o tempo para selecionar,
apurar, escrever, editar, compilar e apresentar material jornalístico.
• Fenômeno explorado pelos autores de sociologia do jornalismo e da comunicação sobre os ciclos
produtivos das redações e a noticiabilidade
• Construção da notícia é um processo rigidamente controlado e envolve negociações entre a elite
política e midiática
Ciclo de informação política = bricolagem entre lógicas de massa e de rede na produção de informação
política.
• Maior número e maior diversidade de atores
• Estruturas temporais mais rápidas e complexas
• Inclui participantes que tangenciam as elites políticas e midiáticas
• Diversificação das fontes de informação
•Deslocamento do jornalismo, ou do jornalismo liberal, como balizador da produção de informação.
COLETA DE
nas mídias sociais
Oquetemosatéaqui?
• Uma série de mudanças tecnológicas, sociais e organizacionais na comunicação política.
• As elites perdem a exclusividade do acesso e do controle de meios de criação de
informação.
• Diversos repertórios de expressão política surgem para além das burocracias partidárias e
jornalísticas.
• Tudo isso está em permanente movimento e relacionamento.
A delimitação dos corpus de pesquisa em meios de massa é bastante simples. As notícias
publicadas no jornal X ou as peças publicitárias televisivas durante o período eleitoral. O objeto
é a cobertura da imprensa ou propagandas políticas oficiais.
Frequentemente, os estudos mais recentes escolhem um ator e dedicam-se apenas a ele, por
exemplo, a produção da Mídia Ninja. Porém, essa abordagem perde as dinâmicas relacionais
criadas em torno daquele agente e todas as negociações com os demais envolvidos.
COLETA DE
nas mídias sociais
c
Contudo, num ambiente midiático
híbrido, com surgimento de blogs,
lideranças de opinião nativas digitais
e uma infinidade de outros
fenômenos,
Como delimitar o corpus de
pesquisa?
COLETA DE
nas mídias sociais
Esferapúblicaemrede(Benkleretal.2013,p.04)–conceitoprovisório
• A esfera pública em rede é uma arena alternativa para o discurso e debate público,
uma arena que é menos dominada pelas grandes organizações midiáticas, menos
sujeita ao controle do governo e mais aberta a participação ampla.
• A esfera pública em rede é manifesta como um ecossistema complexo de canais de
comunicação que coletivamente oferecem um ambiente que conduz a expressão
política e a criação de diversas formas organizacionais.
• Uma série de estudos já evidenciou que elites políticas e midiáticas continuam
dominando o centro das esferas públicas em rede (Soon e Cho, 2011; Asserhofer e
Maireder, 2012; Kocks, 2016 . No entanto, aceitam a abertura para ações de
indivíduos não organizados.
COLETA DE
nas mídias sociais
Oquesãoredessociais?(WASSERMAN eFAUST,1994)
• A diferença fundamental entre análise de redes e análise estatística é a inclusão de
conceitos e de informações sobre os relacionamentos entre as unidades de análise do
estudo.
• Em vez de focar nos atributos das unidades individualmente, estuda as
características como emergentes do processo de relacionamento social.
• O conceito de redes enfatiza que cada indivíduo tem ligações com outros
indivíduos;
• As Redes Sociais referem-se a um conjunto de atores e as relações entre eles;
• Modelar a estrutura e buscar compreender sua influência no grupo
COLETA DE
nas mídias sociais
Componentesbásicosdaanálisederedes
cator
claços
cclusters
crede
Componente individual
Ligações entre atores
Subconjuntos identificados pela densidade
Totalidade de atores e ligações da amostra
COLETA DE
nas mídias sociais
c
O que são dados relacionais?
Duas informações distintas
Atributos dos atores
Arestas de saída e chegada
COLETA DE
nas mídias sociais
Métodosdigitais–RichardRogers(2004)
• A web como fonte de dados;
• Virada computacional nas
ciências sociais;
• Rastros gerados
espontaneamente
• Análises de hiperlinks
• Blogosferas políticas
• Repercussão no Twitter
• Comunidades no Facebook
COLETA DE
nas mídias sociais
Doistipos deredesnainternet(recuero,2009)
• Redes associativas ou de filiação – possuem ligações mais
estáveis, duradouras. Gera o efeito de filiação a um grupo.
Exemplo: seguir páginas e fazer amizades;
• Redes emergentes – são compostas por ligações
circunstanciais, criadas a partir de ações comunicativas ad
hoc. Exemplo: menções, retuítes, compartilhamentos.
COLETA DE
nas mídias sociais
c
O que são APIs?
Application
programming
interface
COLETA DE
nas mídias sociais
Políticasdecessãodedadosdafacebookgraphapi
• As políticas de cessão de dados de cada plataforma são
documentadas nas APIs;
• APIs são tanto documentos técnicos, quanto reflexos das diretrizes
empresariais de fornecimento de dados;
• APIs são modificadas frequentemente, de acordo com as necessidades
e interesses mercadológicos das organizações;
• As documentações mostram quais requisições são possíveis (queries),
em qual volume (rate limit) e com quais parâmetros.
Versionamento das apis do facebook
COLETA DE
nas mídias sociais
Vamos praticar?
https://developers.facebook.com/tools/explorer/
COLETA DE
nas mídias sociais
COLETA DE
nas mídias sociais
Comoconstruirumaquery?Orientaçãoaid
• {id} + fields = {campos}
• Retorno em Javascript Object Notation (JSON)
• JSON é exibido na tela e convertido para tabulação
• Construindo query no navegador
• https://graph.facebook.com/v2.6/ + id / {requisição}
?access_token= {token de acesso}
https://graph.facebook.com/v2.6/dilmarousseff/likes?access_token=EAACEdEose0cBAErGN0ycFbkfEzlhW8o0whxulUmELq3y0bZBVh0sxbNUtUvddk
uF0vQmoz9zlUln9QG9oRypH75VEEI2HI39HlsN6rYA9vZCXWYvaVTkPRN585mUqS07AeCW9HHVOvo5wIiGDgfTtu8jNioAof51U4v1n5YQYZBr0tChVs
QiblwFj6KOhkZD
Aplicativos acadêmicos
COLETA DE
nas mídias sociais
c
Qual ferramenta
utilizar?
COLETA DE
nas mídias sociais
Diferençasnasapisdefacebooketwitter
COLETA DE
nas mídias sociais
Técnicasdeamostragememmétodosdigitais(rieder,2012)
• População – volume completo de usuários e publicações de uma determinada plataforma.
Geralmente, é adquirido a partir da compra do banco de dados da empresa. Estudo utilizando
dados populacionais= (Freelon et al., 2016);
• Amostra aleatória: forma mais utilizada para garantir representatividade dos dados digitais. No
entanto, como não se sabe a população, há uma série de problemas derivados;
• Amostra por tópicos: queries por palavras-chave e hashtags. É o método mais comum no Twitter.
Todavia, não funciona no Facebook desde a descontinuidade da Graph API 1.0 em 2015.
• Amostrar por marcações: compilada a partir de marcadores geográficos ou linguísticos oferecidos
pela API.
• Amostra por atores: seleciona determinados canais para coleta de dados. Frequentemente
utilizado para estudo de campanhas eleitorais, focando nos candidatos ou partidos.
• Amostra por grafos: Examina relações entre uma série de agentes e faz seleções baseado no
resultado. Minha dissertação e tese.
• Amostra manual: utilizada para projetos qualitaitivos, geralmente são amostras de conveniência.
COLETA DE
nas mídias sociais
AdaptandoosmétodosparacoletarelacionalnoFacebook(cf.BRUNSEBURGESS,2014)
• A API do Facebook não permite a coleta de dados por palavras-chave ou por hashtags.
Método mais utilizado no Twitter, esta é uma das principais razões porque o Facebook é
plataforma pouco utilizada em pesquisas de métodos digitais.
• No entanto, o Facebook é a plataforma mais utilizada pela elite político-midiática e pelos
cidadãos comuns. Não estudar o Facebook é ignorar a ferramenta de mídias sociais que
concentra maior público.
• Assim, surge a questão, como realizar desenhos de pesquisa especificamente para o
Facebook?
• A estratégia mais comum é focar em poucos atores, como as fan-pages de candidatos
durante períodos eleitorais. Embora viável do ponto de vista metodológico, essa opção
ignora todas as dinâmicas relacionais que acontecem em torno daqueles candidatos.
• É isso que pretendo captar com meus projetos.
• Para tanto, aposto no método de amostragem por grafos e bola de neve.
COLETA DE
nas mídias sociais
Facepager-TillKeylingejakobjunger
• Ferramenta desenvolvida para a dissertação;
• Código aberto;
• Programando em Python 2.7;
• Introduz boa parte dos conceitos de data mining, como query, data
munging, data storage, log de processos...
• É uma interface para se comunicar com a API e fazer o trabalho
pesado;
• Alto grau de liberdade para os usuários operarem as requisições;
• Funciona com Facebook e Twitter;
Vamospraticar?
retorno
metadados
Jsonkey
Sistema
query
COLETA DE
nas mídias sociais
Etapasdomapeamentodefan-pages(BRUNS,2007; ADAMetal.,2015)
• Lista de nós-sementes;
• Nós-sementes devem ser temáticos e homogêneos.
• Bola de neve – crawling com 1 ou 2 graus de profundidade;
• Limpeza do resultado;
• Manipulação de dados – lista de nós e arestas;
• Importação no Gephi;
• Categorização dos atores
Como montar uma lista de sementes?
COLETA DE
nas mídias sociais
Afunçãosearch
Notação: /search ? type= {user, page, event, group, place} & q=
{palavra+chave} & fields=
search?type=page&q=dilma+rousseff&fields=id,name,link,description,
category
Fazer testes de acordo com as pesquisas dos alunos
COLETA DE
nas mídias sociais
Afunçãouserlike
Notação: id ? fields = likes {aninhamento de parâmetros}
dilmarousseff?fields=likes{name, category, id, link, about}
Fazer testes de acordo com as pesquisas dos alunos
COLETA DE
nas mídias sociais
Documentaçãodasfan-pages
Query
<user>/likes?fields=name,username,about,talking_about_count,fan_co
unt,category,link,bio,description,emails,location,new_like_count,start_inf
o,website,id JSON keys
name
id
username
category
about
bio
description
fan_count
talking_about_count
emails.0
website
link
location.city
location.state
location.longitude
location.latitude
COLETA DE
nas mídias sociais
c
Prática de
mapeamento de
fan-pages
COLETA DE
nas mídias sociais
TRATAMENTODEDADOS
Filtros para limpeza de logs;
Preparação das listas de nós e arestas
Arestas
Funçao PROC (=PROC(B684;$A$3:$A$506;$E$3:$E$506)
Criar source e target
Nós – Eliminar duplicatas
COLETA DE
nas mídias sociais
Mesolevel-aDocumentaçãodaspublicações
Query
comments.limit(1).summary(true),likes.limit(1).summary(true),picture,sto
ry,from,to,description,source,link,created_time,message,type,id,status_t
ype,name,story_tags,caption, reactions.limit(1).summary(true), shares
name
from.name
from.category
from.id
to.data.*.id
to.data.*.name
story_tags
sharedposts.data
posts.data
story
link
caption
message_tags
message
status_type
type
shares.count
created_time
updated_time
reactions.summary.total_count
likes.summary.total_count
comments.summary.total_count
shares.count
COLETA DE
nas mídias sociais
Fluxodecomuinicaçãoentreaspáginas
Endpoints
Links – referentes aos links compartilhados nas publicações. Só
registrando quando a postagem é de tipo LINK;
Caption – referente ao domónio do link;
Message_tags – perfis marcados na mensagem (similar a @mention);
Status_type – identificar compartilhamentos e links;
Story_tags – fluxo de compartilhamento
To – Perfis mencionados
With_tags – Com quem estou.
COLETA DE
nas mídias sociais
c
Prática de
fluxos de
publicações
COLETA DE
nas mídias sociais
Referências
ADAM, Silke et al. Identifying and Analyzing Hyperlink Issue Networks, In: VOWE ,Gerhard, HENN, Philipp.
Political Communication in the Online World (Orgs), Routledge: New York, London, p. 233-247, 2015.
ALVES, Marcelo. Coleta de dados nas mídias sociais. In: SILVA, Tarcízio; STABILE, Max (orgs.), Monitoramento e
Pesquisa em Mídias Sociais: metodologias, aplicações e inovações, Uva Limão, 2016.
BENKLER, Yochai. Political Freedom part 2: Emergence of the networked public sphere. The Wealth of
Networks: How Social Production Transforms Markets and Freedom, 2006.
BRUNS, Axel. Methodologies for mapping the political blogosphere: An exploration using the IssueCrawler
research tool. First Monday, v. 12, n. 5, 2007.
CHADWICK, Andrew. Digital network repertoires and organizational hybridity. Political Communication, v. 24, n.
3, p. 283-301, 2007.
CHADWICK, Andrew. The political information cycle in a hybrid news system: The British prime minister and the
“Bullygate” affair. The International Journal of Press/Politics, v. 16, n. 1, p. 3-29, 2011.
CHADWICK, Andrew. The hybrid media system: Politics and power. Oxford University Press, 2013.
FREELON, Deen; MCILWAIN, Charlton D.; CLARK, Meredith D. Beyond the hashtags:# Ferguson,#
Blacklivesmatter, and the online struggle for offline justice. 2016.
KLINGER, Ulrike; SVENSSON, Jakob. The emergence of network media logic in political communication: A
theoretical approach. New media & society, v. 17, n. 8, p. 1241-1257, 2015.
RECUERO, Raquel. Redes sociais na internet. Sulina, 2009.
RIEDER, Bernhard. The refraction chamber: Twitter as sphere and network. First Monday, v. 17, n. 11, 2012.
ROGERS, Richard. Information politics on the Web. MIT Press, 2004.
WASSERMAN, Stanley; FAUST, Katherine. Social network analysis: Methods and applications. Cambridge
university press, 1994.
COLETA DE
nas mídias sociais
Obrigado!
marceloalves.ufsj@hotmail.com

#VEM Coleta de dados relacionais

  • 1.
    COLETA DE nas mídiassociais Marcelo alves
  • 2.
    COLETA DE nas mídiassociais instrutor •Doutorando pelo PPGCOM/UFF; • Estuda comunicação política em rede; • Sócio-diretor da Vértice Inteligência; • Pesquisador do laboratório de mídia e democracia (LAMIDE/UFF), orientado por Afonso de Albuquerque; • Publica textos no blog www.marceloalves.org
  • 3.
    N = 532fan-pages A = 8.654 arestas Rede antipetista na eleição de 2014
  • 7.
    COLETA DE nas mídiassociais c Quais objetos ou temas de pesquisa dos alunos para coleta de dados?
  • 8.
    COLETA DE nas mídiassociais O que você vai aprender •O básico da concepção teórica da análise de redes; • Processos de coletas de dados relacionais; • Leitura da documentação da Graph API do Facebook • Métodos de construções de queries; • Funcionamento e prática com Facepager; • Extrair dados das pesquisas dos alunos; • Tratamento e manipulação de dados relacionais; • Importar dados no Gephi.
  • 9.
    COLETA DE nas mídiassociais c CONCEITOS TEÓRICOS GERAIS (prometoser breve)
  • 10.
    COLETA DE nas mídiassociais Lógicasdacomunicaçãopolíticaemmassaeemrede-KlingereSvensson(2014)
  • 11.
    COLETA DE nas mídiassociais Lógicasdacomunicaçãopolíticaemmassaeemrede-KlingereSvensson(2014) • Lógicas de rede não estão tomando o lugar da lógica de massa; • As plataformas de mídias sociais seguem outras regras do jogo; • A mídia de massa e o conteúdo jornalístico continuam sendo uma das principais fontes de informação; • As duas lógicas não são estáticas, mas estão em evolução
  • 12.
    COLETA DE nas mídiassociais Sistemasmidiáticoshíbridos–Chadwick(2013) • “O sistema midiático híbrido é baseado em conflito e cooperaçãoentre lógicas novas e antigas; mas também possui considerável grau de interdependênciaentre estas lógicas” (Chadwick, 2013, p. 207) • Convergência midiática – ambos os sistemas estão entrelaçados • Partidos, imprensa e movimentos sociais tradicionais estão se adaptando às lógicas de rede “Conteúdo nas plataformas de mídias sociais nem sempre é gerado pelo usuário, mas frequentemente envolve referências aos meios de massa. A mídia tradicional também busca aprender distribuições virais como uma base de um novo modelo de negócios. Usuários de mídia diversificaram suas dietas noticiosas e começam a navegar em sistemas midiáticos híbridos. No entanto, a sobreposição não torna as lógicas midiáticas indistinguíveis, porque são modus operandi muitos distintos. É tarefa dos estudos empíricos distinguir e medir as lógicas de massa e de rede em casos específicos” (Klinger e Svensson, 2014, p. 12).
  • 13.
    COLETA DE nas mídiassociais Repertóriosdigitaisemredesehibridismoorganizacional(Chadwick,2007) Duas tendências paralelas 1) Organizações políticas tradicionais estão adotando e modificando seletivamente características de movimentos sociais; Quatro repertórios principais: (a) mobilizando formas online de ação dos cidadãos; (b) articulando ligações entre diferentes grupos; fundindo discurso políticos e subculturais e (d) aproveitando-se de redes sedimentárias. “Há sinais crescentes de que organizações tradicionais, mais hierárquicas, menos inovadoras – como grupos de interesse e partidos – estão começando a se adaptar e adotar repertórios digitais em rede” (Chadwick, 2007, p. 286) 2) Novas formas organizacionais que só podem existir na internet estão surgindo. “Organizações ainda mais radicais estão surgindo, como o MoveOn, que mistura repertórios ou rapidamente troca de um conjunto de ações para outras. Quando se trata de ação coletiva potencializada pela internet, a imitação é parte da inovação. O conceito que melhor da conta deste resultado é a hibridez organizacional”
  • 14.
    COLETA DE nas mídiassociais Ociclodeinformaçãopolítica–Chadwick(2011) Ciclo noticioso = período do dia previsível no qual se produzem as notícias, o tempo para selecionar, apurar, escrever, editar, compilar e apresentar material jornalístico. • Fenômeno explorado pelos autores de sociologia do jornalismo e da comunicação sobre os ciclos produtivos das redações e a noticiabilidade • Construção da notícia é um processo rigidamente controlado e envolve negociações entre a elite política e midiática Ciclo de informação política = bricolagem entre lógicas de massa e de rede na produção de informação política. • Maior número e maior diversidade de atores • Estruturas temporais mais rápidas e complexas • Inclui participantes que tangenciam as elites políticas e midiáticas • Diversificação das fontes de informação •Deslocamento do jornalismo, ou do jornalismo liberal, como balizador da produção de informação.
  • 15.
    COLETA DE nas mídiassociais Oquetemosatéaqui? • Uma série de mudanças tecnológicas, sociais e organizacionais na comunicação política. • As elites perdem a exclusividade do acesso e do controle de meios de criação de informação. • Diversos repertórios de expressão política surgem para além das burocracias partidárias e jornalísticas. • Tudo isso está em permanente movimento e relacionamento. A delimitação dos corpus de pesquisa em meios de massa é bastante simples. As notícias publicadas no jornal X ou as peças publicitárias televisivas durante o período eleitoral. O objeto é a cobertura da imprensa ou propagandas políticas oficiais. Frequentemente, os estudos mais recentes escolhem um ator e dedicam-se apenas a ele, por exemplo, a produção da Mídia Ninja. Porém, essa abordagem perde as dinâmicas relacionais criadas em torno daquele agente e todas as negociações com os demais envolvidos.
  • 16.
    COLETA DE nas mídiassociais c Contudo, num ambiente midiático híbrido, com surgimento de blogs, lideranças de opinião nativas digitais e uma infinidade de outros fenômenos, Como delimitar o corpus de pesquisa?
  • 17.
    COLETA DE nas mídiassociais Esferapúblicaemrede(Benkleretal.2013,p.04)–conceitoprovisório • A esfera pública em rede é uma arena alternativa para o discurso e debate público, uma arena que é menos dominada pelas grandes organizações midiáticas, menos sujeita ao controle do governo e mais aberta a participação ampla. • A esfera pública em rede é manifesta como um ecossistema complexo de canais de comunicação que coletivamente oferecem um ambiente que conduz a expressão política e a criação de diversas formas organizacionais. • Uma série de estudos já evidenciou que elites políticas e midiáticas continuam dominando o centro das esferas públicas em rede (Soon e Cho, 2011; Asserhofer e Maireder, 2012; Kocks, 2016 . No entanto, aceitam a abertura para ações de indivíduos não organizados.
  • 18.
    COLETA DE nas mídiassociais Oquesãoredessociais?(WASSERMAN eFAUST,1994) • A diferença fundamental entre análise de redes e análise estatística é a inclusão de conceitos e de informações sobre os relacionamentos entre as unidades de análise do estudo. • Em vez de focar nos atributos das unidades individualmente, estuda as características como emergentes do processo de relacionamento social. • O conceito de redes enfatiza que cada indivíduo tem ligações com outros indivíduos; • As Redes Sociais referem-se a um conjunto de atores e as relações entre eles; • Modelar a estrutura e buscar compreender sua influência no grupo
  • 19.
    COLETA DE nas mídiassociais Componentesbásicosdaanálisederedes cator claços cclusters crede Componente individual Ligações entre atores Subconjuntos identificados pela densidade Totalidade de atores e ligações da amostra
  • 20.
    COLETA DE nas mídiassociais c O que são dados relacionais? Duas informações distintas Atributos dos atores Arestas de saída e chegada
  • 21.
    COLETA DE nas mídiassociais Métodosdigitais–RichardRogers(2004) • A web como fonte de dados; • Virada computacional nas ciências sociais; • Rastros gerados espontaneamente • Análises de hiperlinks • Blogosferas políticas • Repercussão no Twitter • Comunidades no Facebook
  • 22.
    COLETA DE nas mídiassociais Doistipos deredesnainternet(recuero,2009) • Redes associativas ou de filiação – possuem ligações mais estáveis, duradouras. Gera o efeito de filiação a um grupo. Exemplo: seguir páginas e fazer amizades; • Redes emergentes – são compostas por ligações circunstanciais, criadas a partir de ações comunicativas ad hoc. Exemplo: menções, retuítes, compartilhamentos.
  • 25.
    COLETA DE nas mídiassociais c O que são APIs? Application programming interface
  • 26.
    COLETA DE nas mídiassociais Políticasdecessãodedadosdafacebookgraphapi • As políticas de cessão de dados de cada plataforma são documentadas nas APIs; • APIs são tanto documentos técnicos, quanto reflexos das diretrizes empresariais de fornecimento de dados; • APIs são modificadas frequentemente, de acordo com as necessidades e interesses mercadológicos das organizações; • As documentações mostram quais requisições são possíveis (queries), em qual volume (rate limit) e com quais parâmetros.
  • 27.
    Versionamento das apisdo facebook COLETA DE nas mídias sociais
  • 28.
  • 29.
    COLETA DE nas mídiassociais Comoconstruirumaquery?Orientaçãoaid • {id} + fields = {campos} • Retorno em Javascript Object Notation (JSON) • JSON é exibido na tela e convertido para tabulação • Construindo query no navegador • https://graph.facebook.com/v2.6/ + id / {requisição} ?access_token= {token de acesso} https://graph.facebook.com/v2.6/dilmarousseff/likes?access_token=EAACEdEose0cBAErGN0ycFbkfEzlhW8o0whxulUmELq3y0bZBVh0sxbNUtUvddk uF0vQmoz9zlUln9QG9oRypH75VEEI2HI39HlsN6rYA9vZCXWYvaVTkPRN585mUqS07AeCW9HHVOvo5wIiGDgfTtu8jNioAof51U4v1n5YQYZBr0tChVs QiblwFj6KOhkZD
  • 31.
  • 32.
    COLETA DE nas mídiassociais c Qual ferramenta utilizar?
  • 33.
    COLETA DE nas mídiassociais Diferençasnasapisdefacebooketwitter
  • 34.
    COLETA DE nas mídiassociais Técnicasdeamostragememmétodosdigitais(rieder,2012) • População – volume completo de usuários e publicações de uma determinada plataforma. Geralmente, é adquirido a partir da compra do banco de dados da empresa. Estudo utilizando dados populacionais= (Freelon et al., 2016); • Amostra aleatória: forma mais utilizada para garantir representatividade dos dados digitais. No entanto, como não se sabe a população, há uma série de problemas derivados; • Amostra por tópicos: queries por palavras-chave e hashtags. É o método mais comum no Twitter. Todavia, não funciona no Facebook desde a descontinuidade da Graph API 1.0 em 2015. • Amostrar por marcações: compilada a partir de marcadores geográficos ou linguísticos oferecidos pela API. • Amostra por atores: seleciona determinados canais para coleta de dados. Frequentemente utilizado para estudo de campanhas eleitorais, focando nos candidatos ou partidos. • Amostra por grafos: Examina relações entre uma série de agentes e faz seleções baseado no resultado. Minha dissertação e tese. • Amostra manual: utilizada para projetos qualitaitivos, geralmente são amostras de conveniência.
  • 35.
    COLETA DE nas mídiassociais AdaptandoosmétodosparacoletarelacionalnoFacebook(cf.BRUNSEBURGESS,2014) • A API do Facebook não permite a coleta de dados por palavras-chave ou por hashtags. Método mais utilizado no Twitter, esta é uma das principais razões porque o Facebook é plataforma pouco utilizada em pesquisas de métodos digitais. • No entanto, o Facebook é a plataforma mais utilizada pela elite político-midiática e pelos cidadãos comuns. Não estudar o Facebook é ignorar a ferramenta de mídias sociais que concentra maior público. • Assim, surge a questão, como realizar desenhos de pesquisa especificamente para o Facebook? • A estratégia mais comum é focar em poucos atores, como as fan-pages de candidatos durante períodos eleitorais. Embora viável do ponto de vista metodológico, essa opção ignora todas as dinâmicas relacionais que acontecem em torno daqueles candidatos. • É isso que pretendo captar com meus projetos. • Para tanto, aposto no método de amostragem por grafos e bola de neve.
  • 37.
    COLETA DE nas mídiassociais Facepager-TillKeylingejakobjunger • Ferramenta desenvolvida para a dissertação; • Código aberto; • Programando em Python 2.7; • Introduz boa parte dos conceitos de data mining, como query, data munging, data storage, log de processos... • É uma interface para se comunicar com a API e fazer o trabalho pesado; • Alto grau de liberdade para os usuários operarem as requisições; • Funciona com Facebook e Twitter;
  • 38.
  • 39.
    COLETA DE nas mídiassociais Etapasdomapeamentodefan-pages(BRUNS,2007; ADAMetal.,2015) • Lista de nós-sementes; • Nós-sementes devem ser temáticos e homogêneos. • Bola de neve – crawling com 1 ou 2 graus de profundidade; • Limpeza do resultado; • Manipulação de dados – lista de nós e arestas; • Importação no Gephi; • Categorização dos atores Como montar uma lista de sementes?
  • 40.
    COLETA DE nas mídiassociais Afunçãosearch Notação: /search ? type= {user, page, event, group, place} & q= {palavra+chave} & fields= search?type=page&q=dilma+rousseff&fields=id,name,link,description, category Fazer testes de acordo com as pesquisas dos alunos
  • 41.
    COLETA DE nas mídiassociais Afunçãouserlike Notação: id ? fields = likes {aninhamento de parâmetros} dilmarousseff?fields=likes{name, category, id, link, about} Fazer testes de acordo com as pesquisas dos alunos
  • 44.
    COLETA DE nas mídiassociais Documentaçãodasfan-pages Query <user>/likes?fields=name,username,about,talking_about_count,fan_co unt,category,link,bio,description,emails,location,new_like_count,start_inf o,website,id JSON keys name id username category about bio description fan_count talking_about_count emails.0 website link location.city location.state location.longitude location.latitude
  • 45.
    COLETA DE nas mídiassociais c Prática de mapeamento de fan-pages
  • 46.
    COLETA DE nas mídiassociais TRATAMENTODEDADOS Filtros para limpeza de logs; Preparação das listas de nós e arestas Arestas Funçao PROC (=PROC(B684;$A$3:$A$506;$E$3:$E$506) Criar source e target Nós – Eliminar duplicatas
  • 48.
    COLETA DE nas mídiassociais Mesolevel-aDocumentaçãodaspublicações Query comments.limit(1).summary(true),likes.limit(1).summary(true),picture,sto ry,from,to,description,source,link,created_time,message,type,id,status_t ype,name,story_tags,caption, reactions.limit(1).summary(true), shares name from.name from.category from.id to.data.*.id to.data.*.name story_tags sharedposts.data posts.data story link caption message_tags message status_type type shares.count created_time updated_time reactions.summary.total_count likes.summary.total_count comments.summary.total_count shares.count
  • 49.
    COLETA DE nas mídiassociais Fluxodecomuinicaçãoentreaspáginas Endpoints Links – referentes aos links compartilhados nas publicações. Só registrando quando a postagem é de tipo LINK; Caption – referente ao domónio do link; Message_tags – perfis marcados na mensagem (similar a @mention); Status_type – identificar compartilhamentos e links; Story_tags – fluxo de compartilhamento To – Perfis mencionados With_tags – Com quem estou.
  • 52.
    COLETA DE nas mídiassociais c Prática de fluxos de publicações
  • 58.
    COLETA DE nas mídiassociais Referências ADAM, Silke et al. Identifying and Analyzing Hyperlink Issue Networks, In: VOWE ,Gerhard, HENN, Philipp. Political Communication in the Online World (Orgs), Routledge: New York, London, p. 233-247, 2015. ALVES, Marcelo. Coleta de dados nas mídias sociais. In: SILVA, Tarcízio; STABILE, Max (orgs.), Monitoramento e Pesquisa em Mídias Sociais: metodologias, aplicações e inovações, Uva Limão, 2016. BENKLER, Yochai. Political Freedom part 2: Emergence of the networked public sphere. The Wealth of Networks: How Social Production Transforms Markets and Freedom, 2006. BRUNS, Axel. Methodologies for mapping the political blogosphere: An exploration using the IssueCrawler research tool. First Monday, v. 12, n. 5, 2007. CHADWICK, Andrew. Digital network repertoires and organizational hybridity. Political Communication, v. 24, n. 3, p. 283-301, 2007. CHADWICK, Andrew. The political information cycle in a hybrid news system: The British prime minister and the “Bullygate” affair. The International Journal of Press/Politics, v. 16, n. 1, p. 3-29, 2011. CHADWICK, Andrew. The hybrid media system: Politics and power. Oxford University Press, 2013. FREELON, Deen; MCILWAIN, Charlton D.; CLARK, Meredith D. Beyond the hashtags:# Ferguson,# Blacklivesmatter, and the online struggle for offline justice. 2016. KLINGER, Ulrike; SVENSSON, Jakob. The emergence of network media logic in political communication: A theoretical approach. New media & society, v. 17, n. 8, p. 1241-1257, 2015. RECUERO, Raquel. Redes sociais na internet. Sulina, 2009. RIEDER, Bernhard. The refraction chamber: Twitter as sphere and network. First Monday, v. 17, n. 11, 2012. ROGERS, Richard. Information politics on the Web. MIT Press, 2004. WASSERMAN, Stanley; FAUST, Katherine. Social network analysis: Methods and applications. Cambridge university press, 1994.
  • 59.
    COLETA DE nas mídiassociais Obrigado! marceloalves.ufsj@hotmail.com