Outros Testes Não-ParamétricosPaulo Novis Rochapaulonrocha@ufba.br1
Porque “Outros” Testes Não-Paramétricos?Porque já vimos os seguintes testes não-paramétricos:Chi-quadradoTeste exato de Fisher2
Porque “não-paramétricos”?Porque não dependem que os valores da variável estudada tenham distribuição normal ou aproximadamente normalA distribuição normal é determinada pelos parâmetros média e desvio-padrãoAmostras pequenas muitas vezes não permitem conhecer o tipo de distribuição da variável Testes de distribuição livre ou testes não-paramétricos3
Vantagens dos testes não-paramétricosQuando não se conhece a distribuição dos dados na populaçãoQuando essa distribuição é assimétricaQuando existe heterocedasticidadeQuando a variável é medida em escala ordinalEm resumo: são testes de aplicação mais ampla, que podem ser utilizados quando as exigências das técnicas clássicas não são satisfeitas4
Desvantagens dos testes não-paramétricosOperações tediosas (não para os computadores!)Extraem menos informação do experimento, porque substituem o valor real medido pelo posto ocupado na ordenação de valores obtidos, o que resulta em perda de informação relativa à variabilidade da característica (uma diferença numericamente grande pode representar apenas uma mudança para o posto seguinte)Quando utilizados em dados que satisfazem as exigências das técnicas clássicas, estes métodos apresentam uma eficiência menorEx: enquanto o teste U de Wilcoxon-Mann-Whitney precisaria de n = 100 para revelar uma diferença, o teste t de Student necessitaria de n = 95.5
Testes não-paramétricos mais utilizados:6
Teste U de Wilcoxon-Mann-WhitneyDesenvolvido por F. Wilcoxon em 1945 para comparar as tendências centrais de duas amostras independentes de tamanhos iguaisEm 1947, H.B. Mann e D.R. Whitney generalizaram a técnica para amostras de tamanhos diferentesMais conhecido como teste de Mann-WhitneyPressupostos:Amostras aleatóriasObservações independentesVariável de interesse tem característica contínua (mesmo que os dados não sejam. Ex. conceito de A até E para medir conhecimento em um determinado assunto)Substituto do teste t de Student7
Quando usar o teste U WMW em vez do teste t de Student?nma < 8 (GLANTZ)nme ou nma < 20 (DANIEL)nme + nma < 30 (SPSS)8
Racional do teste U de WMWOrganizar os valores das amostras A e B juntas em ordem crescenteSubstituir os valores reais pelos postos ocupadosVerificar se há diferença significativa entre os postos médios das duas amostras9
ExemploMattos et al. estudaram a morfologia das regiões organizadoras do nucléolo (RON) em células da cérvice uterina de mulheres com e sem câncer.De cada mulher, foram examinadas 100 células e computou-se um escore (% observada) para cada padrão morfológico.No padrão 1ª, as RON apresentam-se como manchas sólidas, redondas e de tamanhos diferentes.10
Tabela. Escore 1 A (% de células tipo 1) em 9 controles e 8 pacientes com carcinoma invasorFonte: Sidia M. Callegari-Jacques. BIOESTATÍSTICA: Princípios e Aplicações.11
Tabela. Escore 1 A (% de células tipo 1) em 9 controles e 8 pacientes com carcinoma invasorSe a ordenação está correta, (R1 + R2) = N (N+1)/2Onde N = n1 + n212
HipótesesH0: as duas amostras não diferem quanto à locaçãoHA: as duas amostras diferem quanto à locação13
Estatística do teste de WMW U = 62,5 e U’ = 9,5
 Denomina-se o menor destes dois valores de Ucalc, que deverá então ser comparado ao valor crítico da tabela.
 Uα;n1;n2 é o valor crítico tabelado. Para α = 0,05; n1 = 8; n2 = 9, U0,05;8;9= 15
 Diferente dos testes vistos até aqui, rejeita-se H0 se Ucalcfor menor ou igual ao valor crítico. Como Ucalc= 9,5 < U0,05;8;9= 15, rejeita-se H014
Exemplo no SPSS15
Teste T de WilcoxonDesenvolvido por F. Wilcoxon em 1945Substituto do teste t para amostras emparelhadasBaseia-se nos postos das diferenças intra-pares, dando maior importância às diferenças maioresO que não é feito pelo Teste do Sinal, outro teste não-paramétrico para amostras emparelhadasRacional: se o tratamento A produz valores maiores que o tratamento B, as diferenças (A-B) de sinal positivo serão maiores (em número e grau) do que as diferenças de sinal negativo. Se ambos tratamentos produzem o mesmo efeito, as diferenças positivas e negativas devem se anular.16
ExemploFoi medida a colinesterase sérica em agricultores que aplicaram inseticidas em plantas.Foram feitas duas coletas de sangue em cada agricultor: uma antes e outra 24 horas após a aplicação do inseticida.H0: o nível de colinesterase é o mesmo antes e após a aplicação do inseticida.17
Tabela. Colinesterase total (μmol/ml de plasma) em 17 agricultores do sexo masculino18
Exemplo no SPSS19
Teste de McNemarComparação de variáveis dicotômicas entre 2 amostras Interdependência entre as amostrasUso do qui-quadrado é ilícito!O teste de McNemar é um teste qui-quadrado de ajustamento, que compara as frequências observadas com as esperadas supondo igualdade de efeito para ambos tratamentos (ou ausência de associação entre as variáveis).20
Organizaçao dos resultados obtidos com a aplicação das loções I e II em 70 pacientes com irritações cutâneas nos braços (uma locação em cada braço, ao acaso)Forma CorretaForma IncorretaNo teste de McNemar, os resultados devem ser avaliados no par e os dados organizados quanto à concordância dentro do par.Neste exemplo, o par é constituído pelos dois braços de cada pessoa.21
Organizaçao dos resultados obtidos com a aplicação das loções I e II em 70 pacientes com irritações cutâneas nos braços (uma locação em cada braço, ao acaso)F e I: respostas concordantes (alívio ou ausência de alívio com ambas loções). Não fornecem informação que permita decidir qual loção é a melhor, portanto, não são considerados no teste de McNemar.G e H: respostas discordantes, portanto, informativas. n = 33.H0: as duas loções têm o mesmo efeito.Se H0 é verdadeira, espera-se o mesmo número de pessoas discordantes do tipo “sim para I / não para II”  que do tipo “não para I / sim para II” (isto é, frequências iguais nas células G e H, ou seja, 33/2 = 16,5 em cada célula).22
Teste de McNemarO valor crítico de qui-quadrado para 1 grau de liberdade e nível de significância de 5% é 3,84. Como o valor calculado de qui-quadrado é maior que o crítico, rejeita-se H0.23
Exemplo no SPSS24
Teste de Kruskal-WallisNão se pode confiar no resultado de uma ANOVA quando os pressupostos de normalidade e homocedasticidade são violados.Alternativa: teste de Kruskal-WallisGeneralização do teste de Wilcoxon-Mann-Whitney25
RacionalOrdena-se os valores de todas as amostras juntasAtribui-se postos a cada valorPostos empatados recebem o valor do posto médioSoma-se os postosDeve ser igual à N(N+1)/226
Estatística27
Número de ovos depositados por fêmeas da borboleta Heliconiuseratophyllisem 3 espécies de Passiflora3 empates no posto 9, então CE = (33 – 3) = 2428
EstatísticaComo H calculado é maior que o H crítico tabelado, rejeita-se H0.29
Pós-testesTeste de Dunn30
Exemplo no SPSS31
Coeficiente de correlação para postos de SpearmanMais antiga estatística baseada em postos (1904)Utilizado para avaliar o grau de correlação entre variáveis quantitativas quando as exigências para o teste de Pearson não são satisfeitasDistribuição bivariada normalHomocedasticidade32
Coeficiente de correlação de Spearmanrs = 0, ausência de correlaçãors = -1, correlação negativa perfeitars = +1, correlação positiva perfeitaO cálculo de rs baseia-se nas diferenças entre os postos de x e y33
ExemploUm pesquisador procurou correlacionar os níveis de nitrato na água com a profundidade de uma lagoa.34
Variaçao temporal do nitrato (μg/L) e da profunidade (m) da lagoa<: abaixo do limite de detecção, que é 10 μg/L35

Outros testes não-paramétricos

  • 1.
    Outros Testes Não-ParamétricosPauloNovis Rochapaulonrocha@ufba.br1
  • 2.
    Porque “Outros” TestesNão-Paramétricos?Porque já vimos os seguintes testes não-paramétricos:Chi-quadradoTeste exato de Fisher2
  • 3.
    Porque “não-paramétricos”?Porque nãodependem que os valores da variável estudada tenham distribuição normal ou aproximadamente normalA distribuição normal é determinada pelos parâmetros média e desvio-padrãoAmostras pequenas muitas vezes não permitem conhecer o tipo de distribuição da variável Testes de distribuição livre ou testes não-paramétricos3
  • 4.
    Vantagens dos testesnão-paramétricosQuando não se conhece a distribuição dos dados na populaçãoQuando essa distribuição é assimétricaQuando existe heterocedasticidadeQuando a variável é medida em escala ordinalEm resumo: são testes de aplicação mais ampla, que podem ser utilizados quando as exigências das técnicas clássicas não são satisfeitas4
  • 5.
    Desvantagens dos testesnão-paramétricosOperações tediosas (não para os computadores!)Extraem menos informação do experimento, porque substituem o valor real medido pelo posto ocupado na ordenação de valores obtidos, o que resulta em perda de informação relativa à variabilidade da característica (uma diferença numericamente grande pode representar apenas uma mudança para o posto seguinte)Quando utilizados em dados que satisfazem as exigências das técnicas clássicas, estes métodos apresentam uma eficiência menorEx: enquanto o teste U de Wilcoxon-Mann-Whitney precisaria de n = 100 para revelar uma diferença, o teste t de Student necessitaria de n = 95.5
  • 6.
  • 7.
    Teste U deWilcoxon-Mann-WhitneyDesenvolvido por F. Wilcoxon em 1945 para comparar as tendências centrais de duas amostras independentes de tamanhos iguaisEm 1947, H.B. Mann e D.R. Whitney generalizaram a técnica para amostras de tamanhos diferentesMais conhecido como teste de Mann-WhitneyPressupostos:Amostras aleatóriasObservações independentesVariável de interesse tem característica contínua (mesmo que os dados não sejam. Ex. conceito de A até E para medir conhecimento em um determinado assunto)Substituto do teste t de Student7
  • 8.
    Quando usar oteste U WMW em vez do teste t de Student?nma < 8 (GLANTZ)nme ou nma < 20 (DANIEL)nme + nma < 30 (SPSS)8
  • 9.
    Racional do testeU de WMWOrganizar os valores das amostras A e B juntas em ordem crescenteSubstituir os valores reais pelos postos ocupadosVerificar se há diferença significativa entre os postos médios das duas amostras9
  • 10.
    ExemploMattos et al.estudaram a morfologia das regiões organizadoras do nucléolo (RON) em células da cérvice uterina de mulheres com e sem câncer.De cada mulher, foram examinadas 100 células e computou-se um escore (% observada) para cada padrão morfológico.No padrão 1ª, as RON apresentam-se como manchas sólidas, redondas e de tamanhos diferentes.10
  • 11.
    Tabela. Escore 1A (% de células tipo 1) em 9 controles e 8 pacientes com carcinoma invasorFonte: Sidia M. Callegari-Jacques. BIOESTATÍSTICA: Princípios e Aplicações.11
  • 12.
    Tabela. Escore 1A (% de células tipo 1) em 9 controles e 8 pacientes com carcinoma invasorSe a ordenação está correta, (R1 + R2) = N (N+1)/2Onde N = n1 + n212
  • 13.
    HipótesesH0: as duasamostras não diferem quanto à locaçãoHA: as duas amostras diferem quanto à locação13
  • 14.
    Estatística do testede WMW U = 62,5 e U’ = 9,5
  • 15.
    Denomina-se omenor destes dois valores de Ucalc, que deverá então ser comparado ao valor crítico da tabela.
  • 16.
    Uα;n1;n2 éo valor crítico tabelado. Para α = 0,05; n1 = 8; n2 = 9, U0,05;8;9= 15
  • 17.
    Diferente dostestes vistos até aqui, rejeita-se H0 se Ucalcfor menor ou igual ao valor crítico. Como Ucalc= 9,5 < U0,05;8;9= 15, rejeita-se H014
  • 18.
  • 19.
    Teste T deWilcoxonDesenvolvido por F. Wilcoxon em 1945Substituto do teste t para amostras emparelhadasBaseia-se nos postos das diferenças intra-pares, dando maior importância às diferenças maioresO que não é feito pelo Teste do Sinal, outro teste não-paramétrico para amostras emparelhadasRacional: se o tratamento A produz valores maiores que o tratamento B, as diferenças (A-B) de sinal positivo serão maiores (em número e grau) do que as diferenças de sinal negativo. Se ambos tratamentos produzem o mesmo efeito, as diferenças positivas e negativas devem se anular.16
  • 20.
    ExemploFoi medida acolinesterase sérica em agricultores que aplicaram inseticidas em plantas.Foram feitas duas coletas de sangue em cada agricultor: uma antes e outra 24 horas após a aplicação do inseticida.H0: o nível de colinesterase é o mesmo antes e após a aplicação do inseticida.17
  • 21.
    Tabela. Colinesterase total(μmol/ml de plasma) em 17 agricultores do sexo masculino18
  • 22.
  • 23.
    Teste de McNemarComparaçãode variáveis dicotômicas entre 2 amostras Interdependência entre as amostrasUso do qui-quadrado é ilícito!O teste de McNemar é um teste qui-quadrado de ajustamento, que compara as frequências observadas com as esperadas supondo igualdade de efeito para ambos tratamentos (ou ausência de associação entre as variáveis).20
  • 24.
    Organizaçao dos resultadosobtidos com a aplicação das loções I e II em 70 pacientes com irritações cutâneas nos braços (uma locação em cada braço, ao acaso)Forma CorretaForma IncorretaNo teste de McNemar, os resultados devem ser avaliados no par e os dados organizados quanto à concordância dentro do par.Neste exemplo, o par é constituído pelos dois braços de cada pessoa.21
  • 25.
    Organizaçao dos resultadosobtidos com a aplicação das loções I e II em 70 pacientes com irritações cutâneas nos braços (uma locação em cada braço, ao acaso)F e I: respostas concordantes (alívio ou ausência de alívio com ambas loções). Não fornecem informação que permita decidir qual loção é a melhor, portanto, não são considerados no teste de McNemar.G e H: respostas discordantes, portanto, informativas. n = 33.H0: as duas loções têm o mesmo efeito.Se H0 é verdadeira, espera-se o mesmo número de pessoas discordantes do tipo “sim para I / não para II” que do tipo “não para I / sim para II” (isto é, frequências iguais nas células G e H, ou seja, 33/2 = 16,5 em cada célula).22
  • 26.
    Teste de McNemarOvalor crítico de qui-quadrado para 1 grau de liberdade e nível de significância de 5% é 3,84. Como o valor calculado de qui-quadrado é maior que o crítico, rejeita-se H0.23
  • 27.
  • 28.
    Teste de Kruskal-WallisNãose pode confiar no resultado de uma ANOVA quando os pressupostos de normalidade e homocedasticidade são violados.Alternativa: teste de Kruskal-WallisGeneralização do teste de Wilcoxon-Mann-Whitney25
  • 29.
    RacionalOrdena-se os valoresde todas as amostras juntasAtribui-se postos a cada valorPostos empatados recebem o valor do posto médioSoma-se os postosDeve ser igual à N(N+1)/226
  • 30.
  • 31.
    Número de ovosdepositados por fêmeas da borboleta Heliconiuseratophyllisem 3 espécies de Passiflora3 empates no posto 9, então CE = (33 – 3) = 2428
  • 32.
    EstatísticaComo H calculadoé maior que o H crítico tabelado, rejeita-se H0.29
  • 33.
  • 34.
  • 35.
    Coeficiente de correlaçãopara postos de SpearmanMais antiga estatística baseada em postos (1904)Utilizado para avaliar o grau de correlação entre variáveis quantitativas quando as exigências para o teste de Pearson não são satisfeitasDistribuição bivariada normalHomocedasticidade32
  • 36.
    Coeficiente de correlaçãode Spearmanrs = 0, ausência de correlaçãors = -1, correlação negativa perfeitars = +1, correlação positiva perfeitaO cálculo de rs baseia-se nas diferenças entre os postos de x e y33
  • 37.
    ExemploUm pesquisador procuroucorrelacionar os níveis de nitrato na água com a profundidade de uma lagoa.34
  • 38.
    Variaçao temporal donitrato (μg/L) e da profunidade (m) da lagoa<: abaixo do limite de detecção, que é 10 μg/L35