Aula 3 medidas resumo - parte 1

12.152 visualizações

Publicada em

1 comentário
1 gostou
Estatísticas
Notas
Sem downloads
Visualizações
Visualizações totais
12.152
No SlideShare
0
A partir de incorporações
0
Número de incorporações
4
Ações
Compartilhamentos
0
Downloads
95
Comentários
1
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Aula 3 medidas resumo - parte 1

  1. 1. Aula 3 Medidas Resumo Profa. Dra. Juliana Garcia Cespedes Dep. de Matemática e Computação UNIFEI - Itajubá
  2. 2. Medidas de posição Vimos como resumir os dados por meio de tabelas de frequências e gráficos. Desta forma obtemos informações sobre o comportamento de uma variável. Mas, muitas vezes, queremos resumir ainda mais estes dados, apresentando um ou alguns valores que sejam representativos da série toda. Quando usamos um só valor, reduzimos drasticamente os dados. Geralmente, emprega-se as medidas de posição (localização) central: média, mediana ou moda
  3. 3. Média • Conceito familiar: É a soma das observações dividia pelo número total delas. • Conceito formal: Se x1, ..., xn são os n valores da variável X, a média aritmética de X pode ser escrita: n x i X i 1 n
  4. 4. Média • Se os dados estiverem resumidos em uma tabela de frequências, então a média de X pode ser escrita: k fx i i X i 1 n • Ou, usando a frequência relativa: k X   fri xi i 1
  5. 5. N. Filhos Freq. Abs. Freq. rela. Freq. Acum. % 0 4 0.2 0.2 20% 1 5 0.25 0.45 25% 2 7 0.35 0.8 35% 3 3 0.15 0.95 15% 4 0 0 0.95 0% 5 1 0.05 1 5% Total 20 1 100% 4 * 0  5 *1  7 * 2  ...  1* 5 X  1,65 20 X  0,2 * 0  0,25 *1  0,35 * 2  ...  0,05 * 5  1,65
  6. 6. Classe de Freq Freq relativa Freq acum Porcentagem salários [4,00; 8,00) 10 10/36 =0,278 0,278 27,78% [8,00; 12,00) 12 12/36 =0,333 0,611 33,33% [12,00; 16,00) 8 8/36 =0,222 0,833 22,22% [16,00; 20,00) 5 5/36 =0,139 0,972 13,89% [20,00; 24,00) 1 1/36 =0,029 1,000 2,78% Total 36 1 100% 10 * 6,00  12 *10,00  8 *14,00  ...  1* 22,00 X  11,22 36 X  0,27 * 6,0  0,33 *10,0  0,22 *14,0  ...  0,03 * 22,0  11,22
  7. 7. Mediana • A Mediana é a realização que ocupa a posição central da série de observações, quando estão ordenadas em ordem crescente. • Se o número de observações for ímpar o mediana é a posição central da série: 3, 4, 7, 8, 8 • Se o número de observações for par, usa-se como mediana a média aritmética das duas observações centrais: 3, 4, 7, 8 (4+7)/2 = 5,5
  8. 8. Mediana • Conceito formal: Considere as estatísticas de ordem x(1)  x(2) ...  x(n) • A mediana da variável X pode ser definida como:  x n 1     , se n ímpar;   2  md ( X )   x n   x n   1    2   2  , se n par.     2
  9. 9. 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 x 20   x 20     2   1   2  x10  x11 22 md ( X )    2 2 2 2 N. Filhos Freq. Abs. Freq. rela. Freq. Acum. % 0 4 0.2 0.2 20% 1 5 0.25 0.45 25% 2 7 0.35 0.8 35% 3 3 0.15 0.95 15% 4 0 0 0.95 0% 5 1 0.05 1 5% Total 20 1 100%
  10. 10. Classe de Freq Freq relativa Freq acum Porcentagem salários [4,00; 8,00) 10 10/36 =0,278 0,278 27,78% [8,00; 12,00) 12 12/36 =0,333 0,611 33,33% [12,00; 16,00) 8 8/36 =0,222 0,833 22,22% [16,00; 20,00) 5 5/36 =0,139 0,972 13,89% [20,00; 24,00) 1 1/36 =0,029 1,000 2,78% Total 36 1 100% Pm18  Pm19 10,00  10,00 md ( X )    10,00 2 2
  11. 11. Moda • A moda é definida como a realização mais frequente do conjunto de valores observados. • Pode haver mais de uma moda, ou seja, a distribuições dos valores pode ser bimodal, trimodal, ..., multimodal.
  12. 12. 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 mo( X )  2 N. Filhos Freq. Abs. Freq. rela. Freq. Acum. % 0 4 0.2 0.2 20% 1 5 0.25 0.45 25% 2 7 0.35 0.8 35% 3 3 0.15 0.95 15% 4 0 0 0.95 0% 5 1 0.05 1 5% Total 20 1 100%
  13. 13. Classe de Freq Freq relativa Freq acum Porcentagem salários [4,00; 8,00) 10 10/36 =0,278 0,278 27,78% [8,00; 12,00) 12 12/36 =0,333 0,611 33,33% [12,00; 16,00) 8 8/36 =0,222 0,833 22,22% [16,00; 20,00) 5 5/36 =0,139 0,972 13,89% [20,00; 24,00) 1 1/36 =0,029 1,000 2,78% Total 36 1 100% mo( X )  10,00
  14. 14. Medidas resumo • Para calcular a moda precisamos apenas da tabela de frequências. (Variáveis qualitativas e quantitativas) • Para calcular a mediana, precisamos ordenar as realizações da variável. (Variáveis qualitativas ordinal e quantitativas) • Para a média precisamos que as variáveis sejam mensuráveis. (Variáveis quantitativas)
  15. 15. Medidas de dispersão • O resumo de um conjunto de dados por uma única medida de posição central esconde toda a informação sobre a variabilidade do conjunto de observações. • Considere a nota de cinco grupos de alunos: Grupo A (Variável X): 3,4,5,6,7 Grupo B (Variável Y): 1,3,5,7,9 X Y  Z  Grupo C (Variável Z): 5,5,5,5,5 W V  5 Grupo D (Variável W): 3,5,5,7 Grupo E (Variável V): 3,5,5,6,6
  16. 16. Medidas de dispersão • A média de cada grupo é igual, e com isso não conseguimos informação sobre sua variabilidade. • Para resumir a variabilidade de um conjunto de dados utiliza-se a dispersão dos dados em torno da média, e as medidas mais usadas são a variância e o desvio padrão. • Os desvios da média para o grupo A são -2, -1, 0, 1, 2. (Para qualquer conjunto de dados a soma destes desvios é zero!!!)
  17. 17. Medidas de dispersão • Opções: • Considerar o total dos módulos dos desvios: n | x  X | i 1 i • Considerar o total dos quadrados dos desvios  x  X  n 2 i i 1
  18. 18. Medidas de dispersão • Mas como comparar essas medidas quando os conjuntos de dados tem tamanhos diferentes? • É melhor exprimir as medidas como médias:  x  X  n n | x  X | 2 i i dm( X )  i 1 var( X )  i 1 n n Desvio médio Variância
  19. 19. Medidas de dispersão As medidas de variabilidade indicam o quão homogêneo é um conjunto de dados. Para os grupos A e E tem-se: 2 1 0 1 2 dm( X )   1,2 5 4 1 0 1 4 var( X )   2,0 5 2  0  0 11 dm(V )   0,8 5 4  0  0 11 var(V )   1,2 5
  20. 20. Medidas de dispersão A variância é uma medida de dispersão igual ao quadrado da dimensão dos dados, pode causar problemas de interpretação. Costuma-se usar, então o desvio padrão, que é definido como a raiz quadrada positiva da variância.  x  X  n 2 i dp( X )  var( X )  i 1 n
  21. 21. Medidas de dispersão A medida de dispersão, desvio padrão, indica em média qual será o “erro” (desvio) cometido ao tentar substituir cada observação pela medida resumo do conjunto de dados (Média). Se os dados estiverem agrupados em tabelas de frequências, as medidas de dispersão são dadas por:  f x  X  k 2   fri xi  X  i i k 2 var( X )  i 1 n i 1
  22. 22. Medidas de dispersão Uma maneira equivalente de calcular a variância, computacionalmente mais eficiente, é: n x 2 i var( X )  i 1 X 2 n k  f i xi2  i 1 X 2 n k   fri xi  X 2 2 i 1
  23. 23. Exercício Quer se estudar o número de erros de impressão de um livro. Para isso escolheu-se uma amostra de 50 páginas, encontrando-se o número de erros por página. • Qual o número médio de erros? E o número mediano? • Qual é o desvio padrão? • Se o livro tem 500 páginas, qual o número total de erros esperado no livro? Erros Freq 0 25 1 20 2 3 3 1 4 1
  24. 24. Solução • Média = 0,66 • Mediana = 0,5 • Desvio padrão = 0,8393 • Valor esperado = 330

×