2. Fases da análise de dados – Aplicações
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
3. Boxplot – Distribuição e detecção de anomalias
Valor discrepante superior (extremo, outlier, anomalia)
Maior valor não-discrepante
Terceiro quartil (75% da qtd de dados)
Média (pelos valores)
Mediana (divide qtd de dados pela metade, 50%)
Primeiro quartil (25% da qtd de dados)
Menor valor não-discrepante
Valores discrepantes inferiores (extremos, outliers, anomalia)
50% dos
dados
(interquartil)
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
4. Boxplot – Distribuição e detecção de anomalias
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
5. Detecção de anomalias em séries temporais
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
VERIFICA
PADRÕES
DE
VARIAÇÃO
6. Mineração de redes sociais (Twitter)
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
1. Create an application at
dev.twitter
2. Authenticate
3. Gets Tweets from Twitter
4. Clean the data
7. Mineração de texto – Nuvem de palavras - Código
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
8. Mineração de texto – Nuvem de palavras - Resultado
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
9. Agrupamento por similaridade (clustering) - Código
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
10. Agrupamento por similaridade (clustering) – Resultado gráfico
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
11. Agrupamento por similaridade (clustering) – Outros plots
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R
04.03-Agrupamento2.R
3D
12. Agrupamento por similaridade (hierárquico) - dendograma
José Roberto M. Garcia Nov/2016Introdução à Ciência de Dados com R