Este documento discute testes estatísticos não paramétricos alternativos aos testes paramétricos tradicionais. Apresenta os testes U de Wilcoxon-Mann-Whitney, T de Wilcoxon, de McNemar e de Kruskal-Wallis, explicando quando cada um deve ser usado e como são calculados. Também discute o coeficiente de correlação de Spearman, uma alternativa ao coeficiente de Pearson para dados não normais.
2. Porque “Outros” Testes Não-Paramétricos? Porque já vimos os seguintes testes não-paramétricos: Chi-quadrado Teste exato de Fisher 2
3. Porque “não-paramétricos”? Porque não dependem que os valores da variável estudada tenham distribuição normal ou aproximadamente normal A distribuição normal é determinada pelos parâmetros média e desvio-padrão Amostras pequenas muitas vezes não permitem conhecer o tipo de distribuição da variável Testes de distribuição livre ou testes não-paramétricos 3
4. Vantagens dos testes não-paramétricos Quando não se conhece a distribuição dos dados na população Quando essa distribuição é assimétrica Quando existe heterocedasticidade Quando a variável é medida em escala ordinal Em resumo: são testes de aplicação mais ampla, que podem ser utilizados quando as exigências das técnicas clássicas não são satisfeitas 4
5. Desvantagens dos testes não-paramétricos Operações tediosas (não para os computadores!) Extraem menos informação do experimento, porque substituem o valor real medido pelo posto ocupado na ordenação de valores obtidos, o que resulta em perda de informação relativa à variabilidade da característica (uma diferença numericamente grande pode representar apenas uma mudança para o posto seguinte) Quando utilizados em dados que satisfazem as exigências das técnicas clássicas, estes métodos apresentam uma eficiência menor Ex: enquanto o teste U de Wilcoxon-Mann-Whitney precisaria de n = 100 para revelar uma diferença, o teste t de Student necessitaria de n = 95. 5
7. Teste U de Wilcoxon-Mann-Whitney Desenvolvido por F. Wilcoxon em 1945 para comparar as tendências centrais de duas amostras independentes de tamanhos iguais Em 1947, H.B. Mann e D.R. Whitney generalizaram a técnica para amostras de tamanhos diferentes Mais conhecido como teste de Mann-Whitney Pressupostos: Amostras aleatórias Observações independentes Variável de interesse tem característica contínua (mesmo que os dados não sejam. Ex. conceito de A até E para medir conhecimento em um determinado assunto) Substituto do teste t de Student 7
8. Quando usar o teste U WMW em vez do teste t de Student? nma < 8 (GLANTZ) nme ou nma < 20 (DANIEL) nme + nma < 30 (SPSS) 8
9. Racional do teste U de WMW Organizar os valores das amostras A e B juntas em ordem crescente Substituir os valores reais pelos postos ocupados Verificar se há diferença significativa entre os postos médios das duas amostras 9
10. Exemplo Mattos et al. estudaram a morfologia das regiões organizadoras do nucléolo (RON) em células da cérvice uterina de mulheres com e sem câncer. De cada mulher, foram examinadas 100 células e computou-se um escore (% observada) para cada padrão morfológico. No padrão 1ª, as RON apresentam-se como manchas sólidas, redondas e de tamanhos diferentes. 10
11. Tabela. Escore 1 A (% de células tipo 1) em 9 controles e 8 pacientes com carcinoma invasor Fonte: Sidia M. Callegari-Jacques. BIOESTATÍSTICA: Princípios e Aplicações. 11
12. Tabela. Escore 1 A (% de células tipo 1) em 9 controles e 8 pacientes com carcinoma invasor Se a ordenação está correta, (R1 + R2) = N (N+1)/2 Onde N = n1 + n2 12
13. Hipóteses H0: as duas amostras não diferem quanto à locação HA: as duas amostras diferem quanto à locação 13
14.
15. Denomina-se o menor destes dois valores de Ucalc, que deverá então ser comparado ao valor crítico da tabela.
16. Uα;n1;n2 é o valor crítico tabelado. Para α = 0,05; n1 = 8; n2 = 9, U0,05;8;9= 15
17. Diferente dos testes vistos até aqui, rejeita-se H0 se Ucalcfor menor ou igual ao valor crítico. Como Ucalc= 9,5 < U0,05;8;9= 15, rejeita-se H014
19. Teste T de Wilcoxon Desenvolvido por F. Wilcoxon em 1945 Substituto do teste t para amostras emparelhadas Baseia-se nos postos das diferenças intra-pares, dando maior importância às diferenças maiores O que não é feito pelo Teste do Sinal, outro teste não-paramétrico para amostras emparelhadas Racional: se o tratamento A produz valores maiores que o tratamento B, as diferenças (A-B) de sinal positivo serão maiores (em número e grau) do que as diferenças de sinal negativo. Se ambos tratamentos produzem o mesmo efeito, as diferenças positivas e negativas devem se anular. 16
20. Exemplo Foi medida a colinesterase sérica em agricultores que aplicaram inseticidas em plantas. Foram feitas duas coletas de sangue em cada agricultor: uma antes e outra 24 horas após a aplicação do inseticida. H0: o nível de colinesterase é o mesmo antes e após a aplicação do inseticida. 17
23. Teste de McNemar Comparação de variáveis dicotômicas entre 2 amostras Interdependência entre as amostras Uso do qui-quadrado é ilícito! O teste de McNemar é um teste qui-quadrado de ajustamento, que compara as frequências observadas com as esperadas supondo igualdade de efeito para ambos tratamentos (ou ausência de associação entre as variáveis). 20
24. Organizaçao dos resultados obtidos com a aplicação das loções I e II em 70 pacientes com irritações cutâneas nos braços (uma locação em cada braço, ao acaso) Forma Correta Forma Incorreta No teste de McNemar, os resultados devem ser avaliados no par e os dados organizados quanto à concordância dentro do par. Neste exemplo, o par é constituído pelos dois braços de cada pessoa. 21
25. Organizaçao dos resultados obtidos com a aplicação das loções I e II em 70 pacientes com irritações cutâneas nos braços (uma locação em cada braço, ao acaso) F e I: respostas concordantes (alívio ou ausência de alívio com ambas loções). Não fornecem informação que permita decidir qual loção é a melhor, portanto, não são considerados no teste de McNemar. G e H: respostas discordantes, portanto, informativas. n = 33. H0: as duas loções têm o mesmo efeito. Se H0 é verdadeira, espera-se o mesmo número de pessoas discordantes do tipo “sim para I / não para II” que do tipo “não para I / sim para II” (isto é, frequências iguais nas células G e H, ou seja, 33/2 = 16,5 em cada célula). 22
26. Teste de McNemar O valor crítico de qui-quadrado para 1 grau de liberdade e nível de significância de 5% é 3,84. Como o valor calculado de qui-quadrado é maior que o crítico, rejeita-se H0. 23
28. Teste de Kruskal-Wallis Não se pode confiar no resultado de uma ANOVA quando os pressupostos de normalidade e homocedasticidade são violados. Alternativa: teste de Kruskal-Wallis Generalização do teste de Wilcoxon-Mann-Whitney 25
29. Racional Ordena-se os valores de todas as amostras juntas Atribui-se postos a cada valor Postos empatados recebem o valor do posto médio Soma-se os postos Deve ser igual à N(N+1)/2 26
31. Número de ovos depositados por fêmeas da borboleta Heliconiuseratophyllisem 3 espécies de Passiflora 3 empates no posto 9, então CE = (33 – 3) = 24 28
32. Estatística Como H calculado é maior que o H crítico tabelado, rejeita-se H0. 29
35. Coeficiente de correlação para postos de Spearman Mais antiga estatística baseada em postos (1904) Utilizado para avaliar o grau de correlação entre variáveis quantitativas quando as exigências para o teste de Pearson não são satisfeitas Distribuição bivariada normal Homocedasticidade 32
36. Coeficiente de correlação de Spearman rs = 0, ausência de correlação rs = -1, correlação negativa perfeita rs = +1, correlação positiva perfeita O cálculo de rs baseia-se nas diferenças entre os postos de x e y 33
37. Exemplo Um pesquisador procurou correlacionar os níveis de nitrato na água com a profundidade de uma lagoa. 34
38. Variaçao temporal do nitrato (μg/L) e da profunidade (m) da lagoa <: abaixo do limite de detecção, que é 10 μg/L 35
40. Fórmula com correção para empates O valor tabelado de rs para um teste bilateral, α = 0,01 e n = 13 é 0,703. Portanto, o coeficiente de correlação obtido é estatisticamente significativo. 37