SlideShare uma empresa Scribd logo
1 de 104
Eu sou você amanhã:
diálogos entre o Cientista de Dados e o Cientista Social
Renato Rocha Souza
Sociedade
Industrial
Sociedade da
Informação
“Eu e meu novo
marido…”
Big Data!
• Mais de 3000 livros publicados diariamente
• Uma edição de domingo do NYT contém mais
informação do que um cidadão do século XVIII
leria durante toda a vida
+de 100 bilhões de
buscas no Google
por mês (~40.000
por segundo).
Quem tratava
destas
necessidades de
informação há 18
anos, antes do
Google existir?
Photo by “HVX Silverstar”www.HurstAssociates.com
• Big Data se refere usualmente a datasets com tamanho além da capacidade
de processamento por ferramentas usuais de software, em tempo hábil
• O “tamanho” do que é considerado Big Data é fugidio. Em 2012 eram poucos
terabytes; hoje já são muitos petabytes.
• Big Data é também um conjunto de técnicas e tecnologias que requerem
novas abordagens e métodos para se buscar valor em conjuntos de dados
diversificados, complexos e em escala massiva.
O que é
Big Data?
• Como transformar 12TB de tweets
diários em um produto de análise
de sentimento e marketing digital?
• Como converter dezenas de
gigabytes de notícias em insight
sobre oportunidade de negócios?
• Milhares de operações no Bovespa a
cada segundo;
• Milhares de acessos aos repositórios
por segundo
• Centenas de tentativas de ataque
por minuto aos servidores da FGV
durante eventos como concursos.
Fonte: IBM Corporation
• Dados estruturados e não estruturados;
• Bancos de dados, texto, áudio, vídeo,
logs de servidores, streams de redes
sociais, câmeras de vigilância,
shapefiles, dados de sensores;
• 70% do tempo de análise gasto na
limpeza de dados.
Tamanho importa. Mas não é só tamanho…
Estimativas obtidas através da
energia consumida indicam que a
Google possua 2.4 M servidores e
15 exabytes de dados (2013)
IDC Brazil BI & Big Data Conference 2013
Quem é “Big”?
E no Brasil?
500 TB por dia (2013)
E a Ciência?
‘Fourth paradigm’
–science led from
Big Data
Data Science
Data Science ou e-Science
Jim Gray: e-Science is where
“IT meets scientists.”
http://research.microsoft.com/en-us/collaboration/fourthparadigm
• Há mais de mil anos: a ciência era empírica
• Baseada na descrição de fenômenos naturais
• Há algumas centenas de anos: surgem ramos
teóricos
• Uso de modelos e generalizações
• Há algumas décadas: surgem ramos
computacionais
• simulação de fenômenos complexos
• Hoje: exploração de dados (eScience)
• Unificação de teoria, experimentos e simulação
• Dados capturados por instrumentos ou gerados por
simuladores
• Processamento intensivo via software científico
• Informação e Conhecimento armazenados no computador
• Cientistas analisam bancos de dados e arquivos usando
ferramentas analíticas e estatísticas
Paradigmas científicos
http://flowingdata.com/2009/06/04/rise-of-the-data-scientist/
Rise of the Data Scientist
• Statistics - traditional analysis you're used to thinking about
• Data Munging - parsing, scraping, and formatting data
• Visualization - graphs, tools, etc.
http://berkeleysciencereview.com/article/first-rule-data-science/
Data Science ou e-Science
Design: Natalia Bilenko, modified from Drew Conway: https://s3.amazonaws.com/aws.drewconway.com/viz/venn_diagram/data_science.html
Data Driven Research
?!
E os cientistas sociais?
Máquinas aprendentes e IA
Decision Trees Clustering Time Series
Sequence
Clustering
Association Naive Bayes
Neural Net
Análise de redes sociais
Análise de Redes Sociais
• Atividade relacionada à Recuperação de Informação, mas com o objetivo de extração
de informações estruturadas de documentos semi-estruturados ou não estruturados
através de técnicas de PLN, utilizando lógica e ontologias;
• Funciona em Domínios Restritos;
• Exemplo: extrair a estrutura (Companhia, Comportamento das ações, percentual) de
frases como: “As ações da Petrobras cairam fortemente ontem devido a queda do
preço do Petróleo”.
Extração de Informações
Extração de Informações baseada em ontologia
Linked Open Data
• Utiliza as técnicas anteriores para extrair informações sobre as relações afetivas e
estados emocionais do autor;
• Busca também identificar as polaridades (negativa, neutra, positiva) em relação ao
objeto estudado, que pode ser um produto consumido sobre o qual se está
manifestando uma opinião;
• Domínios restritos e problemas: ironia, sarcasmo, sinonímias, duplos-sentidos, etc.
Análise de Sentimentos
Clustering de documentos e Topic Modelling
Geografic Information Systems (GIS)
Geografic Information Systems (GIS)
Novas questões para os
Cientistas Sociais
What about the future?
Diálogos entre cientistas de dados e cientistas sociais

Mais conteúdo relacionado

Mais procurados

Big Data, o que é isso?
Big Data, o que é isso?Big Data, o que é isso?
Big Data, o que é isso?Ambiente Livre
 
Big data: Conceitos e Desafios
Big data: Conceitos e DesafiosBig data: Conceitos e Desafios
Big data: Conceitos e DesafiosFlávio Sousa
 
Ativando Inteligência com Big Data
Ativando Inteligência com Big DataAtivando Inteligência com Big Data
Ativando Inteligência com Big DataHélio Silva
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoHélio Silva
 
BigData, Datamining e NoSql - A Combinação Perfeita
BigData, Datamining e NoSql - A Combinação PerfeitaBigData, Datamining e NoSql - A Combinação Perfeita
BigData, Datamining e NoSql - A Combinação PerfeitaFranklin Dias
 
Big Data: Seus problemas estão apenas começando
Big Data: Seus problemas estão apenas começandoBig Data: Seus problemas estão apenas começando
Big Data: Seus problemas estão apenas começandoThiago Gonzaga
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RNMarcos Luiz Lins Filho
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosFrancisco Oliveira
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaHélio Silva
 
BIG DATA
BIG DATA BIG DATA
BIG DATA ABEP123
 
Bigdata alexandre v2
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2alexculpado
 
Novas ferramentas Python para Análise de Dados
Novas ferramentas Python para Análise de DadosNovas ferramentas Python para Análise de Dados
Novas ferramentas Python para Análise de DadosCiência e Dados
 
Novas Tecnologias, Novos Dados e Novas Informações
Novas Tecnologias, Novos Dados e Novas InformaçõesNovas Tecnologias, Novos Dados e Novas Informações
Novas Tecnologias, Novos Dados e Novas InformaçõesWilliam Lesnik
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Carlos Barbieri
 

Mais procurados (20)

Big Data, o que é isso?
Big Data, o que é isso?Big Data, o que é isso?
Big Data, o que é isso?
 
Big Data
Big DataBig Data
Big Data
 
Big data: Conceitos e Desafios
Big data: Conceitos e DesafiosBig data: Conceitos e Desafios
Big data: Conceitos e Desafios
 
Ativando Inteligência com Big Data
Ativando Inteligência com Big DataAtivando Inteligência com Big Data
Ativando Inteligência com Big Data
 
Big Data
Big DataBig Data
Big Data
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
BigData, Datamining e NoSql - A Combinação Perfeita
BigData, Datamining e NoSql - A Combinação PerfeitaBigData, Datamining e NoSql - A Combinação Perfeita
BigData, Datamining e NoSql - A Combinação Perfeita
 
O que é Data Science?
O que é Data Science?O que é Data Science?
O que é Data Science?
 
Big Data: Seus problemas estão apenas começando
Big Data: Seus problemas estão apenas começandoBig Data: Seus problemas estão apenas começando
Big Data: Seus problemas estão apenas começando
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados Massivos
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e Tecnologia
 
BIG DATA
BIG DATA BIG DATA
BIG DATA
 
BigData
BigDataBigData
BigData
 
Bigdata alexandre v2
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2
 
Abralic 11 agosto_2917
Abralic 11 agosto_2917Abralic 11 agosto_2917
Abralic 11 agosto_2917
 
Novas ferramentas Python para Análise de Dados
Novas ferramentas Python para Análise de DadosNovas ferramentas Python para Análise de Dados
Novas ferramentas Python para Análise de Dados
 
Novas Tecnologias, Novos Dados e Novas Informações
Novas Tecnologias, Novos Dados e Novas InformaçõesNovas Tecnologias, Novos Dados e Novas Informações
Novas Tecnologias, Novos Dados e Novas Informações
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02
 
Big data Workshop
Big data WorkshopBig data Workshop
Big data Workshop
 

Semelhante a Diálogos entre cientistas de dados e cientistas sociais

aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdfCyberboy11
 
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angolaalexculpado
 
Apresentacao ForumRNP 2015 - Daniela Brauner
Apresentacao ForumRNP 2015 - Daniela BraunerApresentacao ForumRNP 2015 - Daniela Brauner
Apresentacao ForumRNP 2015 - Daniela BraunerDaniela Brauner
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big dataFelipe Ferraz
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Arthur Souza
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowareMarcos Vinicius Fidelis
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataFabrício Barth
 
Introducão à Ciência de Dados
Introducão à Ciência de DadosIntroducão à Ciência de Dados
Introducão à Ciência de DadosJoão Pedro Albino
 
Overview of Data Science e Machine Learning
Overview of Data Science e Machine Learning Overview of Data Science e Machine Learning
Overview of Data Science e Machine Learning Gleydson Lima
 
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abreBig Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abreVivaldo Jose Breternitz
 
Big Data e Seus Impactos
Big Data e Seus ImpactosBig Data e Seus Impactos
Big Data e Seus ImpactosAlex Silva
 
BIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaBIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaDaniel Checchia
 

Semelhante a Diálogos entre cientistas de dados e cientistas sociais (20)

aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdf
 
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Apresentacao ForumRNP 2015 - Daniela Brauner
Apresentacao ForumRNP 2015 - Daniela BraunerApresentacao ForumRNP 2015 - Daniela Brauner
Apresentacao ForumRNP 2015 - Daniela Brauner
 
Aula BigData.pptx
Aula BigData.pptxAula BigData.pptx
Aula BigData.pptx
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big data
 
BigData
BigDataBigData
BigData
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
 
Introducão à Ciência de Dados
Introducão à Ciência de DadosIntroducão à Ciência de Dados
Introducão à Ciência de Dados
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
Overview of Data Science e Machine Learning
Overview of Data Science e Machine Learning Overview of Data Science e Machine Learning
Overview of Data Science e Machine Learning
 
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abreBig Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
 
Big Data e Seus Impactos
Big Data e Seus ImpactosBig Data e Seus Impactos
Big Data e Seus Impactos
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
Big Data
Big DataBig Data
Big Data
 
Treinamento hadoop - dia1
Treinamento hadoop - dia1Treinamento hadoop - dia1
Treinamento hadoop - dia1
 
BIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaBIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à Pratica
 
Hackathon UOL
Hackathon  UOL Hackathon  UOL
Hackathon UOL
 

Mais de Simposio Internacional Network Science

ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICAS
ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICASACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICAS
ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICASSimposio Internacional Network Science
 
Utilizando a programação em blocos na educação como proposta da cultura maker
Utilizando a programação em blocos na educação como proposta da cultura makerUtilizando a programação em blocos na educação como proposta da cultura maker
Utilizando a programação em blocos na educação como proposta da cultura makerSimposio Internacional Network Science
 
IMPLEMENTAÇÃO DA PLATAFORMA COMPUTACIONAL PAYOFF MATRIX: UMA FERRAMENTA PARA ...
IMPLEMENTAÇÃO DA PLATAFORMA COMPUTACIONAL PAYOFF MATRIX: UMA FERRAMENTA PARA ...IMPLEMENTAÇÃO DA PLATAFORMA COMPUTACIONAL PAYOFF MATRIX: UMA FERRAMENTA PARA ...
IMPLEMENTAÇÃO DA PLATAFORMA COMPUTACIONAL PAYOFF MATRIX: UMA FERRAMENTA PARA ...Simposio Internacional Network Science
 
APLICAÇÃO DE CENTRALIDADES DE GRAFOS EM COMPETIÇÕES COM ELIMINATÓRIAS NO MODE...
APLICAÇÃO DE CENTRALIDADES DE GRAFOS EM COMPETIÇÕES COM ELIMINATÓRIAS NO MODE...APLICAÇÃO DE CENTRALIDADES DE GRAFOS EM COMPETIÇÕES COM ELIMINATÓRIAS NO MODE...
APLICAÇÃO DE CENTRALIDADES DE GRAFOS EM COMPETIÇÕES COM ELIMINATÓRIAS NO MODE...Simposio Internacional Network Science
 
Ativos Intangíveis Culturais e Produção de Valor em Fluxos Informacionais
Ativos Intangíveis Culturais e Produção de Valor em Fluxos InformacionaisAtivos Intangíveis Culturais e Produção de Valor em Fluxos Informacionais
Ativos Intangíveis Culturais e Produção de Valor em Fluxos InformacionaisSimposio Internacional Network Science
 
KMAP CANVAS - UMA PROPOSTA DE PRÁTICA PARA MAPEAR CONHECIMENTO APLICANDO DESI...
KMAP CANVAS - UMA PROPOSTA DE PRÁTICA PARA MAPEAR CONHECIMENTO APLICANDO DESI...KMAP CANVAS - UMA PROPOSTA DE PRÁTICA PARA MAPEAR CONHECIMENTO APLICANDO DESI...
KMAP CANVAS - UMA PROPOSTA DE PRÁTICA PARA MAPEAR CONHECIMENTO APLICANDO DESI...Simposio Internacional Network Science
 
Vigilância cega, o que as pegadas digitais podem revelar sobre o indivíduo
Vigilância cega, o que as pegadas digitais podem revelar sobre o indivíduoVigilância cega, o que as pegadas digitais podem revelar sobre o indivíduo
Vigilância cega, o que as pegadas digitais podem revelar sobre o indivíduoSimposio Internacional Network Science
 
Blockchain para Transparência e Eficiência no Uso dos Recursos Públicos
Blockchain para Transparência e Eficiência no Uso dos Recursos PúblicosBlockchain para Transparência e Eficiência no Uso dos Recursos Públicos
Blockchain para Transparência e Eficiência no Uso dos Recursos PúblicosSimposio Internacional Network Science
 

Mais de Simposio Internacional Network Science (20)

Censo: Redes de Conhecimento
Censo: Redes de ConhecimentoCenso: Redes de Conhecimento
Censo: Redes de Conhecimento
 
Big data exploration and information metrics exams
Big data exploration and information metrics examsBig data exploration and information metrics exams
Big data exploration and information metrics exams
 
Organização do Conhecimento para a Memória Empresarial Sebrae -RJ
Organização do Conhecimento para a Memória Empresarial Sebrae -RJOrganização do Conhecimento para a Memória Empresarial Sebrae -RJ
Organização do Conhecimento para a Memória Empresarial Sebrae -RJ
 
ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICAS
ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICASACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICAS
ACESSO ABERTO A DADOS DE PESQUISA NO BRASIL: PRÁTICAS E SOLUÇÕES TECNOLÓGICAS
 
Recuperação de Informação em Processos do MPSC
Recuperação de Informação em Processos do MPSCRecuperação de Informação em Processos do MPSC
Recuperação de Informação em Processos do MPSC
 
Orçamento Popular: Estatística, Transparência e Tecnologia
Orçamento Popular: Estatística, Transparência e TecnologiaOrçamento Popular: Estatística, Transparência e Tecnologia
Orçamento Popular: Estatística, Transparência e Tecnologia
 
Utilizando a programação em blocos na educação como proposta da cultura maker
Utilizando a programação em blocos na educação como proposta da cultura makerUtilizando a programação em blocos na educação como proposta da cultura maker
Utilizando a programação em blocos na educação como proposta da cultura maker
 
IMPLEMENTAÇÃO DA PLATAFORMA COMPUTACIONAL PAYOFF MATRIX: UMA FERRAMENTA PARA ...
IMPLEMENTAÇÃO DA PLATAFORMA COMPUTACIONAL PAYOFF MATRIX: UMA FERRAMENTA PARA ...IMPLEMENTAÇÃO DA PLATAFORMA COMPUTACIONAL PAYOFF MATRIX: UMA FERRAMENTA PARA ...
IMPLEMENTAÇÃO DA PLATAFORMA COMPUTACIONAL PAYOFF MATRIX: UMA FERRAMENTA PARA ...
 
APLICAÇÃO DE CENTRALIDADES DE GRAFOS EM COMPETIÇÕES COM ELIMINATÓRIAS NO MODE...
APLICAÇÃO DE CENTRALIDADES DE GRAFOS EM COMPETIÇÕES COM ELIMINATÓRIAS NO MODE...APLICAÇÃO DE CENTRALIDADES DE GRAFOS EM COMPETIÇÕES COM ELIMINATÓRIAS NO MODE...
APLICAÇÃO DE CENTRALIDADES DE GRAFOS EM COMPETIÇÕES COM ELIMINATÓRIAS NO MODE...
 
Ativos Intangíveis Culturais e Produção de Valor em Fluxos Informacionais
Ativos Intangíveis Culturais e Produção de Valor em Fluxos InformacionaisAtivos Intangíveis Culturais e Produção de Valor em Fluxos Informacionais
Ativos Intangíveis Culturais e Produção de Valor em Fluxos Informacionais
 
KMAP CANVAS - UMA PROPOSTA DE PRÁTICA PARA MAPEAR CONHECIMENTO APLICANDO DESI...
KMAP CANVAS - UMA PROPOSTA DE PRÁTICA PARA MAPEAR CONHECIMENTO APLICANDO DESI...KMAP CANVAS - UMA PROPOSTA DE PRÁTICA PARA MAPEAR CONHECIMENTO APLICANDO DESI...
KMAP CANVAS - UMA PROPOSTA DE PRÁTICA PARA MAPEAR CONHECIMENTO APLICANDO DESI...
 
Vigilância cega, o que as pegadas digitais podem revelar sobre o indivíduo
Vigilância cega, o que as pegadas digitais podem revelar sobre o indivíduoVigilância cega, o que as pegadas digitais podem revelar sobre o indivíduo
Vigilância cega, o que as pegadas digitais podem revelar sobre o indivíduo
 
My Health Data
My Health Data My Health Data
My Health Data
 
Grand Challenges Exploration - CNPQ
Grand Challenges Exploration - CNPQGrand Challenges Exploration - CNPQ
Grand Challenges Exploration - CNPQ
 
Grand Challenge Brasil
Grand Challenge BrasilGrand Challenge Brasil
Grand Challenge Brasil
 
Data Science em Humanidades Digitais
Data Science em Humanidades Digitais Data Science em Humanidades Digitais
Data Science em Humanidades Digitais
 
Para onde nos leva a sociedade das redes
Para onde nos leva a sociedade das redesPara onde nos leva a sociedade das redes
Para onde nos leva a sociedade das redes
 
Blockchain para Transparência e Eficiência no Uso dos Recursos Públicos
Blockchain para Transparência e Eficiência no Uso dos Recursos PúblicosBlockchain para Transparência e Eficiência no Uso dos Recursos Públicos
Blockchain para Transparência e Eficiência no Uso dos Recursos Públicos
 
Bolsonaro uma epifania digital em rede
Bolsonaro uma epifania digital em redeBolsonaro uma epifania digital em rede
Bolsonaro uma epifania digital em rede
 
Sociedade das redes - Joaquim Fialho
Sociedade das redes - Joaquim FialhoSociedade das redes - Joaquim Fialho
Sociedade das redes - Joaquim Fialho
 

Último

11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...licinioBorges
 
Construção (C)erta - Nós Propomos! Sertã
Construção (C)erta - Nós Propomos! SertãConstrução (C)erta - Nós Propomos! Sertã
Construção (C)erta - Nós Propomos! SertãIlda Bicacro
 
A horta do Senhor Lobo que protege a sua horta.
A horta do Senhor Lobo que protege a sua horta.A horta do Senhor Lobo que protege a sua horta.
A horta do Senhor Lobo que protege a sua horta.silves15
 
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptxAULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptxLaurindo6
 
Aula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdfAula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdfFernandaMota99
 
Manual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManuais Formação
 
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)Mary Alvarenga
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividadeMary Alvarenga
 
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptxSlides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptxLuizHenriquedeAlmeid6
 
Noções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdfNoções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdflucassilva721057
 
Slide língua portuguesa português 8 ano.pptx
Slide língua portuguesa português 8 ano.pptxSlide língua portuguesa português 8 ano.pptx
Slide língua portuguesa português 8 ano.pptxssuserf54fa01
 
CRUZADINHA - Leitura e escrita dos números
CRUZADINHA   -   Leitura e escrita dos números CRUZADINHA   -   Leitura e escrita dos números
CRUZADINHA - Leitura e escrita dos números Mary Alvarenga
 
historia Europa Medieval_7ºano_slides_aula12.ppt
historia Europa Medieval_7ºano_slides_aula12.ppthistoria Europa Medieval_7ºano_slides_aula12.ppt
historia Europa Medieval_7ºano_slides_aula12.pptErnandesLinhares1
 
DESAFIO LITERÁRIO - 2024 - EASB/ÁRVORE -
DESAFIO LITERÁRIO - 2024 - EASB/ÁRVORE -DESAFIO LITERÁRIO - 2024 - EASB/ÁRVORE -
DESAFIO LITERÁRIO - 2024 - EASB/ÁRVORE -Aline Santana
 
activIDADES CUENTO lobo esta CUENTO CUARTO GRADO
activIDADES CUENTO  lobo esta  CUENTO CUARTO GRADOactivIDADES CUENTO  lobo esta  CUENTO CUARTO GRADO
activIDADES CUENTO lobo esta CUENTO CUARTO GRADOcarolinacespedes23
 
Dicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelDicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelGilber Rubim Rangel
 
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdfPortfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdfjanainadfsilva
 
A poesia - Definições e Característicass
A poesia - Definições e CaracterísticassA poesia - Definições e Característicass
A poesia - Definições e CaracterísticassAugusto Costa
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...azulassessoria9
 

Último (20)

11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
 
Construção (C)erta - Nós Propomos! Sertã
Construção (C)erta - Nós Propomos! SertãConstrução (C)erta - Nós Propomos! Sertã
Construção (C)erta - Nós Propomos! Sertã
 
A horta do Senhor Lobo que protege a sua horta.
A horta do Senhor Lobo que protege a sua horta.A horta do Senhor Lobo que protege a sua horta.
A horta do Senhor Lobo que protege a sua horta.
 
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptxAULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
AULA SOBRE AMERICA LATINA E ANGLO SAXONICA.pptx
 
Aula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdfAula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdf
 
Manual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envio
 
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividade
 
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptxSlides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
 
Noções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdfNoções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdf
 
Slide língua portuguesa português 8 ano.pptx
Slide língua portuguesa português 8 ano.pptxSlide língua portuguesa português 8 ano.pptx
Slide língua portuguesa português 8 ano.pptx
 
CRUZADINHA - Leitura e escrita dos números
CRUZADINHA   -   Leitura e escrita dos números CRUZADINHA   -   Leitura e escrita dos números
CRUZADINHA - Leitura e escrita dos números
 
historia Europa Medieval_7ºano_slides_aula12.ppt
historia Europa Medieval_7ºano_slides_aula12.ppthistoria Europa Medieval_7ºano_slides_aula12.ppt
historia Europa Medieval_7ºano_slides_aula12.ppt
 
DESAFIO LITERÁRIO - 2024 - EASB/ÁRVORE -
DESAFIO LITERÁRIO - 2024 - EASB/ÁRVORE -DESAFIO LITERÁRIO - 2024 - EASB/ÁRVORE -
DESAFIO LITERÁRIO - 2024 - EASB/ÁRVORE -
 
activIDADES CUENTO lobo esta CUENTO CUARTO GRADO
activIDADES CUENTO  lobo esta  CUENTO CUARTO GRADOactivIDADES CUENTO  lobo esta  CUENTO CUARTO GRADO
activIDADES CUENTO lobo esta CUENTO CUARTO GRADO
 
Dicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelDicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim Rangel
 
Bullying, sai pra lá
Bullying,  sai pra láBullying,  sai pra lá
Bullying, sai pra lá
 
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdfPortfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
 
A poesia - Definições e Característicass
A poesia - Definições e CaracterísticassA poesia - Definições e Característicass
A poesia - Definições e Característicass
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
 

Diálogos entre cientistas de dados e cientistas sociais

  • 1. Eu sou você amanhã: diálogos entre o Cientista de Dados e o Cientista Social Renato Rocha Souza
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24. “Eu e meu novo marido…”
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 39.
  • 40.
  • 41.
  • 42.
  • 43.
  • 44.
  • 45.
  • 46.
  • 47.
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.
  • 54. • Mais de 3000 livros publicados diariamente • Uma edição de domingo do NYT contém mais informação do que um cidadão do século XVIII leria durante toda a vida +de 100 bilhões de buscas no Google por mês (~40.000 por segundo). Quem tratava destas necessidades de informação há 18 anos, antes do Google existir?
  • 55.
  • 56.
  • 57.
  • 58.
  • 59.
  • 60. Photo by “HVX Silverstar”www.HurstAssociates.com
  • 61.
  • 62.
  • 63. • Big Data se refere usualmente a datasets com tamanho além da capacidade de processamento por ferramentas usuais de software, em tempo hábil • O “tamanho” do que é considerado Big Data é fugidio. Em 2012 eram poucos terabytes; hoje já são muitos petabytes. • Big Data é também um conjunto de técnicas e tecnologias que requerem novas abordagens e métodos para se buscar valor em conjuntos de dados diversificados, complexos e em escala massiva. O que é Big Data?
  • 64. • Como transformar 12TB de tweets diários em um produto de análise de sentimento e marketing digital? • Como converter dezenas de gigabytes de notícias em insight sobre oportunidade de negócios? • Milhares de operações no Bovespa a cada segundo; • Milhares de acessos aos repositórios por segundo • Centenas de tentativas de ataque por minuto aos servidores da FGV durante eventos como concursos. Fonte: IBM Corporation • Dados estruturados e não estruturados; • Bancos de dados, texto, áudio, vídeo, logs de servidores, streams de redes sociais, câmeras de vigilância, shapefiles, dados de sensores; • 70% do tempo de análise gasto na limpeza de dados. Tamanho importa. Mas não é só tamanho…
  • 65. Estimativas obtidas através da energia consumida indicam que a Google possua 2.4 M servidores e 15 exabytes de dados (2013) IDC Brazil BI & Big Data Conference 2013 Quem é “Big”? E no Brasil? 500 TB por dia (2013)
  • 66.
  • 67.
  • 69. ‘Fourth paradigm’ –science led from Big Data Data Science
  • 70. Data Science ou e-Science Jim Gray: e-Science is where “IT meets scientists.” http://research.microsoft.com/en-us/collaboration/fourthparadigm
  • 71. • Há mais de mil anos: a ciência era empírica • Baseada na descrição de fenômenos naturais • Há algumas centenas de anos: surgem ramos teóricos • Uso de modelos e generalizações • Há algumas décadas: surgem ramos computacionais • simulação de fenômenos complexos • Hoje: exploração de dados (eScience) • Unificação de teoria, experimentos e simulação • Dados capturados por instrumentos ou gerados por simuladores • Processamento intensivo via software científico • Informação e Conhecimento armazenados no computador • Cientistas analisam bancos de dados e arquivos usando ferramentas analíticas e estatísticas Paradigmas científicos
  • 72. http://flowingdata.com/2009/06/04/rise-of-the-data-scientist/ Rise of the Data Scientist • Statistics - traditional analysis you're used to thinking about • Data Munging - parsing, scraping, and formatting data • Visualization - graphs, tools, etc.
  • 73. http://berkeleysciencereview.com/article/first-rule-data-science/ Data Science ou e-Science Design: Natalia Bilenko, modified from Drew Conway: https://s3.amazonaws.com/aws.drewconway.com/viz/venn_diagram/data_science.html
  • 74.
  • 75.
  • 77. ?! E os cientistas sociais?
  • 78.
  • 79.
  • 80.
  • 81.
  • 82.
  • 84. Decision Trees Clustering Time Series Sequence Clustering Association Naive Bayes Neural Net
  • 85. Análise de redes sociais Análise de Redes Sociais
  • 86. • Atividade relacionada à Recuperação de Informação, mas com o objetivo de extração de informações estruturadas de documentos semi-estruturados ou não estruturados através de técnicas de PLN, utilizando lógica e ontologias; • Funciona em Domínios Restritos; • Exemplo: extrair a estrutura (Companhia, Comportamento das ações, percentual) de frases como: “As ações da Petrobras cairam fortemente ontem devido a queda do preço do Petróleo”. Extração de Informações
  • 87. Extração de Informações baseada em ontologia
  • 89. • Utiliza as técnicas anteriores para extrair informações sobre as relações afetivas e estados emocionais do autor; • Busca também identificar as polaridades (negativa, neutra, positiva) em relação ao objeto estudado, que pode ser um produto consumido sobre o qual se está manifestando uma opinião; • Domínios restritos e problemas: ironia, sarcasmo, sinonímias, duplos-sentidos, etc. Análise de Sentimentos
  • 90. Clustering de documentos e Topic Modelling
  • 93.
  • 94.
  • 95. Novas questões para os Cientistas Sociais
  • 96.
  • 97.
  • 98.
  • 99.
  • 100.
  • 101.
  • 102.
  • 103. What about the future?