Encarando o Big Data: Tornando
a Sociologia Relevante
Sophie Mutzel
Eduardo Silva
Grupo de Estudos sobre Métodos Digitais
Contexto Inicial
• Interesses
‫־‬ Análise de redes sociais e sua contribuição teórica para a sociologia.
‫־‬ Sociologia econômica.
‫־‬ Sociologia Empírica do Lazer(cultura).
‫־‬ Processo de criação de significado**
• A criação de significa dos jornais da Alemanha na década de 90 onde
a capital política do país estava em transição.
• Estudo de criação de significado de atores econômicos.
Encarando o Big Data
• Obtenção massiva de dados sem a possibilidade de tratá-los.
• 9000 editoriais;
• Ler cerca de 5 jornais por dia durante 2 anos;
• Identificar a posição narrativa de diferentes jornais em diferentes editoriais;
• Surgem problemas ao se encarar o Big Data.
• Falta de habilidades computacionais;
• Inabilidade de modelar os dados obtidos;
• Impossibilidade de gerar uma visão macro do problema ou resultado;
Metodologias
• Análise Textual e de Conteúdo;
• Análise de Redes;
• Modelagem/Categorização de dados. (Encountering topic modeling)
• Processamento de Línguagem Natural;
• Aprendizado de Máquina.
Estruturação de Dados
1. Transformar os dados em legíveis e adaptáves.
• "Isso envolve enviar os textos e fotografias scaneados para um leitor optico
de reconhecimento de caracteres e depois corrigir os erros utilizando OCR“
2. O que será analisado e o que será negligenciado.
• Processo de curadoria de dados, limpeza do corpus de dados, e informações
desnecessárias.
“Estamos longe do conceito de automação: pesquisa informatizada não é fácil
nem rápida.”
Estruturação de Dados
• Como sociologos nós sabemos que tanto a abordagem qualitativa
quanto a quantitativa envolvem montagem, analise e registro de
dados. Ao fazê-lo, fazemos importantes decisões sobre como iremos
vislumbrar o social. Na "limpeza de dados" eu também os fiz
"algorithm ready“;
Teoria, Dados e Métodos
• Os métodos já utilizados se complementam ao Big Data;
• A formação acadêmica na sociologia traz uma visão raza a respeito
de métodos estatísticos e quantitativos;
• Alunos com uma formação ou interesse maior nesses métodos
normalmente trabalham para empresas em pesquisa de mídias e
marketing industrial.
Teoria, Dados e Métodos
• “Projetos que utilizam o Big Data tem pouco engajamento com a
sociologia.”
“Como esses pontos indicam, Big Data e seus métodos de análise
desafiam a práxis de se fazer sociologia. Mas, com certeza, a sociologia
tem muito a contribuir para as novas áreas da pesquisa em ciências
sociais: por causa de seus conhecimentos e técnicas para estudar
significado e como o social é estruturado, a sociologia torna-se muito
relevante para projetos de ciência e mineração de grandes conjuntos
de dados.”
Conclusão
• O big data causa uma ruptura trazendo novos conceitos e métodos;
• O seu uso auxília técnicas que já são utilizadas a muito tempo na
sociologia;
• É necessário estudo e melhor compreensão para encarar todos
desafios e aprendizados do Big Data.
Obrigado!!

Encarando o Big Data: Tornando a Sociologia Relevante

  • 1.
    Encarando o BigData: Tornando a Sociologia Relevante Sophie Mutzel Eduardo Silva Grupo de Estudos sobre Métodos Digitais
  • 2.
    Contexto Inicial • Interesses ‫־‬Análise de redes sociais e sua contribuição teórica para a sociologia. ‫־‬ Sociologia econômica. ‫־‬ Sociologia Empírica do Lazer(cultura). ‫־‬ Processo de criação de significado** • A criação de significa dos jornais da Alemanha na década de 90 onde a capital política do país estava em transição. • Estudo de criação de significado de atores econômicos.
  • 3.
    Encarando o BigData • Obtenção massiva de dados sem a possibilidade de tratá-los. • 9000 editoriais; • Ler cerca de 5 jornais por dia durante 2 anos; • Identificar a posição narrativa de diferentes jornais em diferentes editoriais; • Surgem problemas ao se encarar o Big Data. • Falta de habilidades computacionais; • Inabilidade de modelar os dados obtidos; • Impossibilidade de gerar uma visão macro do problema ou resultado;
  • 4.
    Metodologias • Análise Textuale de Conteúdo; • Análise de Redes; • Modelagem/Categorização de dados. (Encountering topic modeling) • Processamento de Línguagem Natural; • Aprendizado de Máquina.
  • 5.
    Estruturação de Dados 1.Transformar os dados em legíveis e adaptáves. • "Isso envolve enviar os textos e fotografias scaneados para um leitor optico de reconhecimento de caracteres e depois corrigir os erros utilizando OCR“ 2. O que será analisado e o que será negligenciado. • Processo de curadoria de dados, limpeza do corpus de dados, e informações desnecessárias. “Estamos longe do conceito de automação: pesquisa informatizada não é fácil nem rápida.”
  • 6.
    Estruturação de Dados •Como sociologos nós sabemos que tanto a abordagem qualitativa quanto a quantitativa envolvem montagem, analise e registro de dados. Ao fazê-lo, fazemos importantes decisões sobre como iremos vislumbrar o social. Na "limpeza de dados" eu também os fiz "algorithm ready“;
  • 7.
    Teoria, Dados eMétodos • Os métodos já utilizados se complementam ao Big Data; • A formação acadêmica na sociologia traz uma visão raza a respeito de métodos estatísticos e quantitativos; • Alunos com uma formação ou interesse maior nesses métodos normalmente trabalham para empresas em pesquisa de mídias e marketing industrial.
  • 8.
    Teoria, Dados eMétodos • “Projetos que utilizam o Big Data tem pouco engajamento com a sociologia.” “Como esses pontos indicam, Big Data e seus métodos de análise desafiam a práxis de se fazer sociologia. Mas, com certeza, a sociologia tem muito a contribuir para as novas áreas da pesquisa em ciências sociais: por causa de seus conhecimentos e técnicas para estudar significado e como o social é estruturado, a sociologia torna-se muito relevante para projetos de ciência e mineração de grandes conjuntos de dados.”
  • 9.
    Conclusão • O bigdata causa uma ruptura trazendo novos conceitos e métodos; • O seu uso auxília técnicas que já são utilizadas a muito tempo na sociologia; • É necessário estudo e melhor compreensão para encarar todos desafios e aprendizados do Big Data.
  • 10.