Teste para Inferência de Simetria de Distribuições

978 visualizações

Publicada em

0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
978
No SlideShare
0
A partir de incorporações
0
Número de incorporações
1
Ações
Compartilhamentos
0
Downloads
2
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Teste para Inferência de Simetria de Distribuições

  1. 1. UNIVERSIDADE FEDERAL DE ALFENAS Introdução à Estatística Não-ParamétricaTeste Para Inferência de Simetrias de Distribuições Discente: João A. Silva Docente: Eric Batista Ferreira Disciplina: Introdução à Estatística Não-Paramétrica 25 de setembro de 2012 João (Unifal-MG) 25 de setembro de 2012 1 / 19
  2. 2. IntroduçãoO Teste Para Inferência de Simetrias de Distribuições é um teste parasimetria distribucional e permite inferir se um conjunto de dados foigerado por uma distribuição desconhecida, porém simétrica.Consiste no exame de subconjuntos de três variáveis e uma boaquantidade de cálculos, mas é relativamente direto. João (Unifal-MG) 25 de setembro de 2012 2 / 19
  3. 3. Introdução H0 : As observações são de uma mesma distribuição simétrica com uma mediana desconhecida. H : A distribuição não é simétrica. 1 João (Unifal-MG) 25 de setembro de 2012 3 / 19
  4. 4. Procedimento Para cada subconjunto de tamanho 3 na sequência de observações, determine se ela é uma tripla direita, esquerda, ou nenhuma. Tripla direita: (xi + xj + xk )/3 > med(xi , xj , xk ) Tripla esquerda: (xi + xj + xk )/3 < med(xi , xj , xk ) Nenhuma: (xi + xj + xk )/3 = med(xi , xj , xk ) Cada uma das n(n − 1)(n − 2)/6 triplas possíveis devem ser codificada como direita, esquerda ou nenhuma. João (Unifal-MG) 25 de setembro de 2012 4 / 19
  5. 5. Procedimento Calcule as quantidades Bi e Bjk para cada variável xi e o par de variáveis xj e xk : Bi = triplas direitas envolvendo xi - triplas esquerdas envolvendo xi Bjk = triplas direitas envolvendo xj e xk - triplas esquerdas envolvendo xj e xk João (Unifal-MG) 25 de setembro de 2012 5 / 19
  6. 6. Procedimento Calcule T e sua variância: T = triplas direitas - triplas esquerdas n 2 (n−3)(n−4) (n−3) n(n−1)(n−2) σT = (n−1)(n−2) Bi2 + (n−4) 2 Bjk + 6 − i=1 1≤j<k ≤n (n−3)(n−4)(n−5) 1− n(n−1)(n−2) T2 João (Unifal-MG) 25 de setembro de 2012 6 / 19
  7. 7. Procedimento T Teste H0 usando a estatística z = σT . A significância de T pode ser encontrada usando a tabela da distribuição normal padrão. Como a hipótese alternativa é bilateral, o valor crítico de T é determinado usando α . 2 João (Unifal-MG) 25 de setembro de 2012 7 / 19
  8. 8. ExemploEm um acordo de supressão de sensação de salgado, sujeitos testamuma mistura de sal e sacarose com o propósito de escalonarjulgamentos de sensação de salgado como uma função daconcentração de sal na solução. Havia diferenças individuaissubstanciais no julgamento de sensação de salgado. O pesquisadorestava interessado na distribuição dos julgamentos de sensação desalgado. Quatro concentrações diferentes foram usadas e os sujeitosexperimentaram, separadamente, cada uma delas. Os dados estãoresumidos na Tabela 1. Para fins de ilustrar o teste de distribuiçãosimétrica, os dados para a taxa de 0,5 de concentração de sal serãoanalisados. João (Unifal-MG) 25 de setembro de 2012 8 / 19
  9. 9. Exemplo Tabela 1: Julgamentos sobre a sensação de salgado para um nível de concentração de sal 13,53 28,42 48,11 48,64 51,40 59,91 67,98 79,13 103,05 João (Unifal-MG) 25 de setembro de 2012 9 / 19
  10. 10. Exemplo - Hipóteses H0 : A distribuição dos julgamentos de sensação de salgado é simétrica. H1 : A distribuição dos julgamentos é assimétrica. João (Unifal-MG) 25 de setembro de 2012 10 / 19
  11. 11. Exemplo - Teste Estatístico O número de observações é n=9. O primeiro passo consiste no cálculo das triplas e a determinação sobre elas serem direitas, esquerdas ou nenhuma das duas. Note que para n = 9 temos: n(n−1)(n−2) 9(9−1)(9−2) 6 = 6 = 84 triplas. João (Unifal-MG) 25 de setembro de 2012 11 / 19
  12. 12. Exemplo - Teste Estatístico Classificação dos três primeiros pontos (13,53; 28,42; 48,11) mediana = 28,42 < 30,03 = média −→ tripla direita. Classificação dos pontos (13,53; 48,11; 48,64) mediana = 48,11 > 36,76 = média −→ tripla esquerea. João (Unifal-MG) 25 de setembro de 2012 12 / 19
  13. 13. Exemplo - Teste Estatístico Após a verificação das 84 triplas, temos o número de triplas direitas = 44 e o número de triplas esquerdas = 40. Então T = 44 − 40 = 4 João (Unifal-MG) 25 de setembro de 2012 13 / 19
  14. 14. Exemplo - Teste Estatístico O próximo passo é o cálculo da variância de T . Para isso, deve-se calcular os valores intermediário de Bi e Bjk . As duas somas dos quadrados no exemplo são: n n Bi2 = 320 e 2 Bjk = 364 i=1 i≤j<k ≤n João (Unifal-MG) 25 de setembro de 2012 14 / 19
  15. 15. Exemplo - Teste Estatístico A variância é então: n 2 (n−3)(n−4) (n−3) n(n−1)(n−2) σT = (n−1)(n−2) Bi2 + (n−4) 2 Bjk + 6 − i=1 1≤j<k ≤n (n−3)(n−4)(n−5) 1− n(n−1)(n−2) T2 (9−3)(9−4) (9−3) 9(9−1)(9−2) = (9−1)(9−2) ∗ 320 + (9−4) ∗ 364 + 6 − 1 − (n−3)(n−4)(n−5) n(n−1)(n−2) ∗ 42 = 680, 04 João (Unifal-MG) 25 de setembro de 2012 15 / 19
  16. 16. Exemplo - Teste Estatístico Finalmente, a estatística T 4 z= σT =√ = 0, 154 680,04 João (Unifal-MG) 25 de setembro de 2012 16 / 19
  17. 17. Exemplo - Nível de significância e decisão Seja α = 0,05. Zc = 0, 154 e Z(0,025) ≈ 2, 81 Logo, não podemos rejeitar a hipóstese de simetria, ou seja, a distribuição dos julgamentos da sensação de salgado é simétrica. João (Unifal-MG) 25 de setembro de 2012 17 / 19
  18. 18. Considerações finais O teste para inferência de simetrias de distribuições é razoavelmente bom para n ≥ 20, isto é, ele mantém o nível de significância escolhido e ao mesmo tempo mantém bom poder para detectar distribuições assimétricas. Devido ao grande número de cálculos envolvidos na determinação das triplas, recomenda-se o uso de um programa computacional. O poder do teste de simetria tem sido estudado e apresentado um poder razoável para amostras maiores do que 20. Outros testes tem sido propostos, mas a maioria tem poder muito baixo. João (Unifal-MG) 25 de setembro de 2012 18 / 19
  19. 19. Bibliografia SIEGEL, S.; CASTELLAN, JR., N.J Estatística não-paramétrica para ciências do comportamento. Artmed, Porto Alegre, 2006. pages 75 - 78 João (Unifal-MG) 25 de setembro de 2012 19 / 19

×