Estatística Básica - Variância

32.110 visualizações

Publicada em

Uma introdução a amplitude e variância. Baseado no livro Head First Statistics.

4 comentários
11 gostaram
Estatísticas
Notas
Sem downloads
Visualizações
Visualizações totais
32.110
No SlideShare
0
A partir de incorporações
0
Número de incorporações
55
Ações
Compartilhamentos
0
Downloads
0
Comentários
4
Gostaram
11
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide



  • Enviesado para Direita ou Esquerda
  • Enviesado para Direita ou Esquerda
  • Enviesado para Direita ou Esquerda
  • Enviesado para Direita ou Esquerda
  • Enviesado para Direita ou Esquerda
  • Exemplo da Aula de Bale para Mãe e Filhas (Modas de 5 de 40 anos)





  • Range
    Lower Bound
    Upper Bound



  • Não basta removê-los é preciso eliminá-los de forma consistente!
  • Não basta removê-los é preciso eliminá-los de forma consistente!


  • Também chamado de MiniRange
    Quartil Inferior, Médio Superior
  • Também chamado de MiniRange
    Quartil Inferior, Médio Superior





















  • O Desvio Padrão te dá uma idéia geral de quão distantes os valores estão da média.
    Em outras palavras quanto maior for, maior é a variação.
  • O Desvio Padrão te dá uma idéia geral de quão distantes os valores estão da média.
    Em outras palavras quanto maior for, maior é a variação.
  • O Desvio Padrão te dá uma idéia geral de quão distantes os valores estão da média.
    Em outras palavras quanto maior for, maior é a variação.
  • O Desvio Padrão te dá uma idéia geral de quão distantes os valores estão da média.
    Em outras palavras quanto maior for, maior é a variação.










  • Comparamos o jogador com relação a seus próprios dados.
    Ambos estão acima da média.
    ZScore dá um novo conjunto de dados para COMPARAÇÃO.
    Se for 0 é igual a média, maior que 0 maior que a média...

  • Outro exemplo seria tempo de Entrega de Pizza!
  • Outro exemplo seria tempo de Entrega de Pizza!

  • Estatística Básica - Variância

    1. 1. ESTATÍSTICA BÁSICA André Faria Gomes Variância
    2. 2. Relembrando Média Simples Outliers Mediana Moda
    3. 3. RelembrandoMédia Simples
    4. 4. RelembrandoOutliers
    5. 5. RelembrandoMediana 19 19 20 20 21 21 100 102 19 20 20 20 21 100 102 20 20,5
    6. 6. RelembrandoModa Média e Mediana
    7. 7. Médias só contam uma parte da estória!
    8. 8. Treinador Bolha Pontos por Jogo 3 6 7 10 11 13 30 Frequência 2 1 2 3 1 1 1 Pontos por Jogo 7 9 10 11 13 Frequência 1 2 4 2 1 Pontos por Jogo 7 8 9 10 11 12 13 Frequência 1 1 2 2 2 1 1 M esm a M édia, M ediana e M oda!
    9. 9. Amplitude 7 13 7 13 3 30 6 6 27
    10. 10. Amplitude CuidadoA amplitude descreve a largura dos dados, mas não conta como os dados estão espalhados! 2 18 182 Outliers Atacam Novamente
    11. 11. 2 18 Outliers 2 40 Sem o Outlier os Dados seriam idênticos
    12. 12. Como posso me livrar dos Outliers de forma consistente?? Sei que simplesmente ignorá-los não seria científico!
    13. 13. Q1 Quartil Superior P25 Q2 Quartil Médio P50 Q3 Quartil Inferior P75 1 1 1 1 2 2 2 2 3 3 3 3 3 3 4 4 4 5 5 25Q1 Q2 Q3 QUARTIS 1 1 1 1 2 2 2 2 3 3 3 3 3 3 4 4 4 5 5 25
    14. 14. INTERQUARTIL 1 1 1 1 2 2 2 2 3 3 3 3 3 3 4 4 4 5 5 25Q1 Q2 Q3 Yup! O interquartil é bem menos sensível a outliers! !
    15. 15. Mas, e se eu precisar de um range um pouco maior? Relaxa Bolhão, é só usar Percentil! ?
    16. 16. 11 1 1 2 2 2 2 3 3 3 3 3 3 4 4 4 5 5 25 PERCENTILDecil (10%) Beleza! Então na verdade o quartil é um tipo de percentil ! k30 = 30(20/100) k% k30 = k(n/100)Pk k30 = 6 K30 -> Entre o n6 e n7
    17. 17. BOX PLOT * Whisker = Bigode de Gato Mediana Interquartil Amplitude Limite Superior Limite Inferior 2 4 6 8
    18. 18. BOXPLOTS 2 6 10 14 18 22 26 30
    19. 19. VARIABILIDADE Observe a distancia da média! Ok. Já sei o como os dados estão espalhados, mas ainda preciso entender a variabilidade deles.
    20. 20. DISTANCIA MÉDIA DA MÉDIA É Sempre Zero! Notas do Robson na Aula de Inglês: 3,4,8 0 1053 84 D = 5 até 3 + 5 até 4 + 5 até 8 D = 2 + 1 - 3 = 0 D= 5-3+5-4+5-8
    21. 21. Oh... E agora quem poderá me defender? Ah. Dá um tempo! Eleva ao quadrado.
    22. 22. VARIÂNCIA (5-3)² + (5-4)² + (5-8)² (2)² + (1)² + (-3)² 4 + 2 + 9 15 / 3 = 5 A Variância é uma forma de medir a dispersão. Ela é a média da distancia dos valores ao quadrado. ∑(x-μ)² n ∑x ² n - μ ²
    23. 23. Mas é difícil pensar em números ao quadrado! Tem outra forma? O realmente precisamos é um número que nos de a dispersão em termos de distância da média, não distancia ao quadrado! Oras, use o desvio padrão!
    24. 24. DESVIO PADRÃO O Desvio padrão é a raiz quadrada da variância. σ ² = variancia σ = √variancia σ = √5 = 2,23 Os valores estão a uma distancia de 2,23 da média.
    25. 25. Isso isso isso! Quando menor o σ, mais confiável o jogador!
    26. 26. Treinador Bolha Pontos por Jogo 3 6 7 10 11 13 30 Frequência 2 1 2 3 1 1 1 Pontos por Jogo 7 9 10 11 13 Frequência 1 2 4 2 1 Pontos por Jogo 7 8 9 10 11 12 13 Frequência 1 1 2 2 2 1 1 σ =1,48 σ =1,73 σ =7,02
    27. 27. Ok, eu me ajudem a comparar as notas desses dois malas. Acerta em média 70% σ = 20% Hoje acertou 75% Acerta em média 40% σ = 10% Hoje acertou 55%
    28. 28. COMPARANDO σ = 20% σ = 10% μ = 70 μ = 40 Como vou comparar se as médias e desvios são diferentes?
    29. 29. STANDARD SCORE (Z-SCORE) Assim dá para comparar dados com diferentes médias e desvios como se fossem do mesmo conjunto de dados x-μ σZ = O Z-Score, Nada mais é do que o número de desvios da média!
    30. 30. Acerta em média 70% σ = 20% Hoje acertou 75% Cesta em média 40% σ = 10% Hoje acertou 55% z1 = (75 - 70) / 20 z1 = 5 / 20 z1 = 0,25 z2 = (55 -40) / 10 z2 = 15 / 10 z2 = 1,5 x-μ σZ =
    31. 31. z2 =1,50 z1 = 0,25 Isso mostra que apesar de o China ter notas maiores, o Wendola teve melhor em performance relação aos seus próprios números. Wendola China μ =0
    32. 32. STANDARD SCORE (Z-SCORE) Quando há mais de 3 desvios é um sinal de que há outliers! Mas saiba que Estatísticos divergem um pouco sobre isso...
    33. 33. STANDARD SCORE (Z-SCORE)
    34. 34. Obrigado!

    ×