SlideShare uma empresa Scribd logo
1 de 20
Baixar para ler offline
José Roberto Motta Garcia
garcia.cptec@gmail.comNov/2016
Fases da análise de dados – Tratamento de dados
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Resumo estatístico dos dados - comandos
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Resumo estatístico dos dados - resultados
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Agrupamento pela soma (via função) e ordenação de resultados - 1
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Lê-se: somatória dos votos em função do estado e candidato
Agrupamento pela soma (via função) e ordenação de resultados - 2
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Soma por candidato + estado
Soma por candidato Soma por candidato
(ordenado)
Agrupamento pela média (via data.table)
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Data.table possui recursos para fazer agregações
Agrupamento pela média (via data.table)
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Data.table possui recursos para fazer agregações
Tipos de variáveis
QUALITATIVA QUANTITATIVA
NOMINAL ORDINAL DISCRETA CONTÍNUA
“não pode
ordenar”
“pode ordenar” “Contável” “Não contável”
Quantidades Medidas
Estado civil Nível educação Idade Peso
Religião Classe social Capacidade de
passageiros
Altura
Sexo Faixa de idade Núm. de filhos Largura
Região Núm. De carros Produção de
leite
Raça Salário
Cor dos olhos
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Tabela de
Contingência
(ou de frequência)
Contabiliza (conta)
obs de duas ou
mais variáveis
(normalmente
qualitativas)
Tabela de contingência - univariável
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Tabela de contingência - multivariável
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
cilindros
hp
`
Visualização de séries temporais
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Visualização de séries temporais multivariada
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Histograma e densidade – análise univariada
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Gráfico de barras e pizza – análise univariada
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Gráfico de barras – análise multivariada
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Long
Shape
Scatterplot - Distribuição de uma variável em relação a outra (bivariada)
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Conceito - Correlacionamento
-1 .8 .6 .4 .2 0 .2 .4 .6 .8 1
Perfeita
Negativa
Perfeita
Positiva
Bem
forte
forte mod
frac
a
Bem
frac
a
nula
Bem
frac
a
frac
a
mod forte
Bem
forte
As duas distribuições variam
em sentidos inversos.
Enquanto uma aumenta a outra diminui.
As duas distribuições variam
no mesmo sentido.
Uma aumenta e a outra também.
Fonte:
www.simplypsychology.or
g/correlation.html
Métodos:
- Pearson
- Spearman
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Scatterplot 3D
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
Scatter PLot of Matrix (SPLOM)
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R

Mais conteúdo relacionado

Destaque

Startup Activity in America -- A Look at Startup Policy and the Kauffman Index
Startup Activity in America -- A Look at Startup Policy and the Kauffman IndexStartup Activity in America -- A Look at Startup Policy and the Kauffman Index
Startup Activity in America -- A Look at Startup Policy and the Kauffman IndexArnobio Morelix
 
Minicurso de estatística experimental com o R - III SIC IFNMG
Minicurso de estatística experimental com o R  - III SIC IFNMGMinicurso de estatística experimental com o R  - III SIC IFNMG
Minicurso de estatística experimental com o R - III SIC IFNMGPetronio Candido
 
Empreendedorismo em Brasília Teimosa - maio de 2015
Empreendedorismo em Brasília Teimosa - maio de 2015Empreendedorismo em Brasília Teimosa - maio de 2015
Empreendedorismo em Brasília Teimosa - maio de 2015Jornal do Commercio
 
Aula de Empreendedorismo Social Unibrasil - Terceiro Setor
Aula de Empreendedorismo Social Unibrasil - Terceiro SetorAula de Empreendedorismo Social Unibrasil - Terceiro Setor
Aula de Empreendedorismo Social Unibrasil - Terceiro SetorProf. Leonardo Rocha
 
Análise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionaisAnálise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionaisRodrigo Rodrigues
 
Orientação a Objetos em Python
Orientação a Objetos em PythonOrientação a Objetos em Python
Orientação a Objetos em PythonLuciano Ramalho
 
Aula 01 empreendedorismo
Aula 01 empreendedorismoAula 01 empreendedorismo
Aula 01 empreendedorismoNJS Consultoria
 
Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3Marcel Caraciolo
 

Destaque (15)

Dica R - Quadrilátero gradiente
Dica R - Quadrilátero gradienteDica R - Quadrilátero gradiente
Dica R - Quadrilátero gradiente
 
Startup Activity in America -- A Look at Startup Policy and the Kauffman Index
Startup Activity in America -- A Look at Startup Policy and the Kauffman IndexStartup Activity in America -- A Look at Startup Policy and the Kauffman Index
Startup Activity in America -- A Look at Startup Policy and the Kauffman Index
 
Dissertação cap3 v12_corrigido
Dissertação cap3 v12_corrigidoDissertação cap3 v12_corrigido
Dissertação cap3 v12_corrigido
 
Minicurso de estatística experimental com o R - III SIC IFNMG
Minicurso de estatística experimental com o R  - III SIC IFNMGMinicurso de estatística experimental com o R  - III SIC IFNMG
Minicurso de estatística experimental com o R - III SIC IFNMG
 
Empreendedorismo em Brasília Teimosa - maio de 2015
Empreendedorismo em Brasília Teimosa - maio de 2015Empreendedorismo em Brasília Teimosa - maio de 2015
Empreendedorismo em Brasília Teimosa - maio de 2015
 
Introdução ao R
Introdução ao RIntrodução ao R
Introdução ao R
 
Apresentação senac
Apresentação senacApresentação senac
Apresentação senac
 
Aula de Empreendedorismo Social Unibrasil - Terceiro Setor
Aula de Empreendedorismo Social Unibrasil - Terceiro SetorAula de Empreendedorismo Social Unibrasil - Terceiro Setor
Aula de Empreendedorismo Social Unibrasil - Terceiro Setor
 
Análise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionaisAnálise de Regressão: aspectos teóricos e computacionais
Análise de Regressão: aspectos teóricos e computacionais
 
EIA 2015 The Art of Start-Up Finance
EIA 2015 The Art of Start-Up FinanceEIA 2015 The Art of Start-Up Finance
EIA 2015 The Art of Start-Up Finance
 
Orientação a Objetos em Python
Orientação a Objetos em PythonOrientação a Objetos em Python
Orientação a Objetos em Python
 
Aula 01 empreendedorismo
Aula 01 empreendedorismoAula 01 empreendedorismo
Aula 01 empreendedorismo
 
Aula empreendedorismo
Aula empreendedorismoAula empreendedorismo
Aula empreendedorismo
 
Aprendendo python
Aprendendo pythonAprendendo python
Aprendendo python
 
Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3
 

Curso Intro à Ciência de Dados com R - 1.3 - Análise Exploratória de Dados

  • 1. José Roberto Motta Garcia garcia.cptec@gmail.comNov/2016
  • 2. Fases da análise de dados – Tratamento de dados José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
  • 3. Resumo estatístico dos dados - comandos José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
  • 4. Resumo estatístico dos dados - resultados José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
  • 5. Agrupamento pela soma (via função) e ordenação de resultados - 1 José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R Lê-se: somatória dos votos em função do estado e candidato
  • 6. Agrupamento pela soma (via função) e ordenação de resultados - 2 José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R Soma por candidato + estado Soma por candidato Soma por candidato (ordenado)
  • 7. Agrupamento pela média (via data.table) José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R Data.table possui recursos para fazer agregações
  • 8. Agrupamento pela média (via data.table) José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R Data.table possui recursos para fazer agregações
  • 9. Tipos de variáveis QUALITATIVA QUANTITATIVA NOMINAL ORDINAL DISCRETA CONTÍNUA “não pode ordenar” “pode ordenar” “Contável” “Não contável” Quantidades Medidas Estado civil Nível educação Idade Peso Religião Classe social Capacidade de passageiros Altura Sexo Faixa de idade Núm. de filhos Largura Região Núm. De carros Produção de leite Raça Salário Cor dos olhos José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R Tabela de Contingência (ou de frequência) Contabiliza (conta) obs de duas ou mais variáveis (normalmente qualitativas)
  • 10. Tabela de contingência - univariável José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
  • 11. Tabela de contingência - multivariável José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R cilindros hp `
  • 12. Visualização de séries temporais José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
  • 13. Visualização de séries temporais multivariada José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
  • 14. Histograma e densidade – análise univariada José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
  • 15. Gráfico de barras e pizza – análise univariada José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
  • 16. Gráfico de barras – análise multivariada José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R Long Shape
  • 17. Scatterplot - Distribuição de uma variável em relação a outra (bivariada) José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
  • 18. Conceito - Correlacionamento -1 .8 .6 .4 .2 0 .2 .4 .6 .8 1 Perfeita Negativa Perfeita Positiva Bem forte forte mod frac a Bem frac a nula Bem frac a frac a mod forte Bem forte As duas distribuições variam em sentidos inversos. Enquanto uma aumenta a outra diminui. As duas distribuições variam no mesmo sentido. Uma aumenta e a outra também. Fonte: www.simplypsychology.or g/correlation.html Métodos: - Pearson - Spearman José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
  • 19. Scatterplot 3D José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
  • 20. Scatter PLot of Matrix (SPLOM) José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R