1) O documento discute vários conceitos estatísticos básicos como média, mediana, moda, amplitude, outliers, quartis e percentis.
2) Introduz a noção de variância e desvio padrão como medidas de variabilidade dos dados em relação à média.
3) Explica como o z-score permite comparar conjuntos de dados com diferentes médias e desvios padrões, transformando os valores em unidades de desvio padrão.
8. Treinador Bolha
Pontos por Jogo 3 6 7 10 11 13 30
Frequência 2 1 2 3 1 1 1
Pontos por Jogo 7 9 10 11 13
Frequência 1 2 4 2 1
Pontos por Jogo 7 8 9 10 11 12 13
Frequência 1 1 2 2 2 1 1
M
esm
a
M
édia, M
ediana
e
M
oda!
19. VARIABILIDADE
Observe a distancia da média!
Ok. Já sei o como os
dados estão espalhados, mas
ainda preciso entender a
variabilidade deles.
20. DISTANCIA MÉDIA
DA MÉDIA
É Sempre Zero!
Notas do Robson na Aula de Inglês: 3,4,8
0 1053 84
D = 5 até 3 + 5 até 4 + 5 até 8
D = 2 + 1 - 3 = 0
D= 5-3+5-4+5-8
21. Oh... E agora
quem poderá
me defender?
Ah. Dá um tempo!
Eleva ao quadrado.
22. VARIÂNCIA
(5-3)² + (5-4)² + (5-8)²
(2)² + (1)² + (-3)²
4 + 2 + 9
15 / 3 = 5
A Variância é uma
forma de medir a
dispersão. Ela é a
média da distancia
dos valores ao
quadrado.
∑(x-μ)²
n
∑x ²
n
- μ ²
23. Mas é difícil
pensar em números
ao quadrado! Tem
outra forma?
O realmente precisamos é um número que nos de a
dispersão em termos de distância da média, não
distancia ao quadrado!
Oras, use o
desvio
padrão!
24. DESVIO PADRÃO
O Desvio padrão é a raiz
quadrada da variância.
σ ² = variancia
σ = √variancia
σ = √5 = 2,23
Os valores estão a uma
distancia de 2,23 da média.
26. Treinador Bolha
Pontos por Jogo 3 6 7 10 11 13 30
Frequência 2 1 2 3 1 1 1
Pontos por Jogo 7 9 10 11 13
Frequência 1 2 4 2 1
Pontos por Jogo 7 8 9 10 11 12 13
Frequência 1 1 2 2 2 1 1
σ =1,48
σ =1,73
σ =7,02
27. Ok, eu me
ajudem a comparar as
notas desses dois
malas.
Acerta em média 70%
σ = 20%
Hoje acertou 75%
Acerta em média 40%
σ = 10%
Hoje acertou 55%
28. COMPARANDO
σ = 20% σ = 10%
μ = 70 μ = 40
Como vou
comparar se as médias
e desvios são
diferentes?
29. STANDARD SCORE
(Z-SCORE)
Assim dá para comparar dados
com diferentes médias e desvios
como se fossem do mesmo
conjunto de dados
x-μ
σZ = O Z-Score, Nada mais
é do que o número de
desvios da média!
30. Acerta em média 70%
σ = 20%
Hoje acertou 75%
Cesta em média 40%
σ = 10%
Hoje acertou 55%
z1 = (75 - 70) / 20
z1 = 5 / 20
z1 = 0,25
z2 = (55 -40) / 10
z2 = 15 / 10
z2 = 1,5
x-μ
σZ =
31. z2 =1,50
z1 = 0,25
Isso mostra que apesar
de o China ter notas maiores, o
Wendola teve melhor em
performance relação aos seus
próprios números.
Wendola
China
μ =0
32. STANDARD SCORE
(Z-SCORE)
Quando há mais de 3
desvios é um sinal de que há
outliers! Mas saiba que
Estatísticos divergem um
pouco sobre isso...
Exemplo da Aula de Bale para Mãe e Filhas (Modas de 5 de 40 anos)
Range
Lower Bound
Upper Bound
Não basta removê-los é preciso eliminá-los de forma consistente!
Não basta removê-los é preciso eliminá-los de forma consistente!
Também chamado de MiniRange
Quartil Inferior, Médio Superior
Também chamado de MiniRange
Quartil Inferior, Médio Superior
O Desvio Padrão te dá uma idéia geral de quão distantes os valores estão da média.
Em outras palavras quanto maior for, maior é a variação.
O Desvio Padrão te dá uma idéia geral de quão distantes os valores estão da média.
Em outras palavras quanto maior for, maior é a variação.
O Desvio Padrão te dá uma idéia geral de quão distantes os valores estão da média.
Em outras palavras quanto maior for, maior é a variação.
O Desvio Padrão te dá uma idéia geral de quão distantes os valores estão da média.
Em outras palavras quanto maior for, maior é a variação.
Comparamos o jogador com relação a seus próprios dados.
Ambos estão acima da média.
ZScore dá um novo conjunto de dados para COMPARAÇÃO.
Se for 0 é igual a média, maior que 0 maior que a média...