+
Bioestatística - Universidade Católica de Brasília
Testes
Prof. Dr. Gabriel da Rocha Fernandes
Universidade Católica de Brasília
gabrielf@ucb.br - fernandes.gabriel@gmail.com
+
Introdução
2
nInferência estatística
n estimativa de parâmetros
n testes de hipóteses
nLevantamentos a fim de determinar o grau de aceitação de
hipóteses baseadas em teorias do comportamento.
nColeta de dados empíricos.
nCom base nestes dados decide-se então sobre a validade ou
não da hipótese.
nA decisão sobre a hipótese pode levar a rejeição, revisão ou
aceitação da teoria que a originou.
+
Metodologia
nConclusão é baseada na informação proporcionada pelos
dados.
nEnvolvem apenas parte da população que se pretende atingir.
n Definir a hipótese de igualdade (H0).
n Escolher a prova estatística (com o modelo estatístico associado) para
tentar rejeitar H0.
n Definir o nível de significância (α) e um tamanho de amostra (n).
n Determinar a distribuição amostral da prova estatística sob a hipótese
de nulidade.
n Definir a região de rejeição.
n Calcular o valor da prova estatística.
3
+
Hipóteses
nÉ uma suposição ou afirmação que pode ou não ser
verdadeira, relativa a uma ou mais populações.
nA veracidade ou falsidade sobre uma hipótese só pode ser dita
com certeza se estudarmos toda a população.
nA decisão de que a amostra é provavelmente verdadeira ou
falsa utiliza as distribuições amostrais.
nDuas hipóteses:
n Nula (H0)
n Alternativa (H1)
4
+
Hipóteses
nA hipótese nula é a hipótese de igualdade.
nFormulada com o objetivo de ser rejeitada.
nA rejeição da hipótese nula envolve a aceitação de outra
hipótese.
nHipótese alternativa é a definição operacional da hipótese de
pesquisa que se deseja comprovar.
nA natureza do estudo define a hipótese alternativa.
nEm um teste paramétrico de parâmetro θ
n H1 : θ = θ1 (Hipótese alternativa simples)
n H1: θ ≠ θ0 ; θ > θ0 ou θ < θ0. (Hipóteses alternativas compostas)
5
+
Escolha do teste
nParamétricos e não paramétricos.
nConjunto valores numéricos.
nTamanho da amostra disponível.
nO teste é válido somente para aquelas condições.
nDefinição do nível de significância.
6
+
Distribuição amostral
nTestes de hipótese obedecem modelos específicos.
nDistribuição normal > shapiro.test()
nDistribuição T Student
nDistribuição Qui-quadrado
nDistribuição F
7
+
Hipoteses
nH1: θ = θ2 (hipótese simples)
nH1: θ > θ0 (teste unilateral ou unicaudal à direita)
nθ < θ0 (teste unilateral ou unicaudal à esquerda)
nθ ≠ θ0 (teste bilateral ou bicaudal)
8
+
Testes paramétricos
nLower Tail Test da média populacional com variância
conhecida
nHipótese nula:
n > xbar = 9900            # sample mean 
n> mu0 = 10000            # hypothesized value 
n> sigma = 120            # population standard deviation 
n> n = 30                 # sample size 
n> z = (xbar−mu0)/(sigma/sqrt(n)) 
n> z                      # test statistic 
n> alpha = .05 
n> z.alpha = qnorm(1−alpha) 
n> −z.alpha               # critical value 
9
+
Testes paramétricos
nTwo tailed test com variância conhecida
n> xbar = 14.6            # sample mean 
n> mu0 = 15.4             # hypothesized value 
n> sigma = 2.5            # population standard deviation 
n> n = 35                 # sample size 
n> z = (xbar−mu0)/(sigma/sqrt(n)) 
n> z                      # test statistic 
n> alpha = .05 
n> z.half.alpha = qnorm(1−alpha/2) 
n> c(−z.half.alpha, z.half.alpha) 
n> pval = 2 ∗ pnorm(z)    # lower tail 
n> pval                   # two−tailed p−value 
10
+
Não conheço a variância
n> xbar = 9900            # sample mean 
n> mu0 = 10000            # hypothesized value 
n> s = 125                # sample standard deviation 
n> n = 30                 # sample size 
n> t = (xbar−mu0)/(s/sqrt(n)) 
n> t                      # test statistic 
n> alpha = .05 
n> t.alpha = qt(1−alpha, df=n−1) 
n> −t.alpha               # critical value 
n> pval = pt(t, df=n−1) 
n> pval                   # lower tail p−value 
11
+
Parâmetro: proporção
n> pbar = 85/148          # sample proportion 
n> p0 = .6                # hypothesized value 
n> n = 148                # sample size 
n> z = (pbar−p0)/sqrt(p0∗(1−p0)/n) 
n> z                      # test statistic 
n> alpha = .05 
n> z.alpha = qnorm(1−alpha) 
n> −z.alpha               # critical value 
n> pval = pnorm(z) 
n> pval                   # lower tail p−value 
n> prop.test(85, 148, p=.6, alt="less", correct=FALSE) 
12
+
Teste T para amostras
independentes
nUtilizamos a distribuição de t quando não temos os parâmetros
populacionais (σ e µ).
nPremissas: Normalidade, Homocedasticidade (razão das
variâncias = 1 ou variâncias iguais), Independência dos dados
13
Premissas do teste t Alternativa caso haja violação de
premissas
Independência Amostras Pareadas
Variâncias Iguais Correção dos Graus de Liberdade
Normalidade Testes não-paramétricos
+
Teste T pareado
nUtilizado com duas amostras retiradas do mesmo objeto.
nTratamento em pessoas (antes e depois), ou peso de animais
(seca e chuva)
nDesde que sejam os mesmos indivíduos os dados podem ser
tratados como pareados.
nTeste não paramétrico do teste t é o Teste de Mann-Whitney.
nPara teste t pareado, o não paramétrico é Wilcoxon
14
+
Exemplo
n> raposa = read.table("/var/www/Pseudalopex.txt",
head=TRUE)
n>attach (raposa)
n>qt (p,df) # valor critico
n> shapiro.test(raposa$chuva)
n>var.test(chuva,seca)
n> t.test(chuva,seca)
n> t.test(chuva,seca,alternative="greater")
n> wilcox.test(chuva,seca,alternative="greater")
15
+
Exemplos
n Utiliza o teste t pareado para testar a hipótese de que a estação do ano
influenciou o peso dos mesmos indivíduos (considerando agora que os
mesmos indivíduos foram pesados nas duas estações)
n >t.test(chuva, seca, paired=T)
n Testa se a massa na chuva é maior ou igual à massa na seca, considerando
que os dados são pareados
n >t.test(chuva, seca, paired=T, alternative=c(“l”))
n Testa se a massa na chuva é menor ou igual à massa na seca,
considerando que os dados são pareados
n >t.test(chuva, seca, paired=T, alternative=c(“g”))
n Testa a igualdade das medias da massa nas duas estações, com o método
não-paramétrico, considerando que os dados são pareados
n >wilcox.test(chuva,seca,paired=T)
16

Estatística - Aula 6

  • 1.
    + Bioestatística - UniversidadeCatólica de Brasília Testes Prof. Dr. Gabriel da Rocha Fernandes Universidade Católica de Brasília gabrielf@ucb.br - fernandes.gabriel@gmail.com
  • 2.
    + Introdução 2 nInferência estatística n estimativade parâmetros n testes de hipóteses nLevantamentos a fim de determinar o grau de aceitação de hipóteses baseadas em teorias do comportamento. nColeta de dados empíricos. nCom base nestes dados decide-se então sobre a validade ou não da hipótese. nA decisão sobre a hipótese pode levar a rejeição, revisão ou aceitação da teoria que a originou.
  • 3.
    + Metodologia nConclusão é baseadana informação proporcionada pelos dados. nEnvolvem apenas parte da população que se pretende atingir. n Definir a hipótese de igualdade (H0). n Escolher a prova estatística (com o modelo estatístico associado) para tentar rejeitar H0. n Definir o nível de significância (α) e um tamanho de amostra (n). n Determinar a distribuição amostral da prova estatística sob a hipótese de nulidade. n Definir a região de rejeição. n Calcular o valor da prova estatística. 3
  • 4.
    + Hipóteses nÉ uma suposiçãoou afirmação que pode ou não ser verdadeira, relativa a uma ou mais populações. nA veracidade ou falsidade sobre uma hipótese só pode ser dita com certeza se estudarmos toda a população. nA decisão de que a amostra é provavelmente verdadeira ou falsa utiliza as distribuições amostrais. nDuas hipóteses: n Nula (H0) n Alternativa (H1) 4
  • 5.
    + Hipóteses nA hipótese nulaé a hipótese de igualdade. nFormulada com o objetivo de ser rejeitada. nA rejeição da hipótese nula envolve a aceitação de outra hipótese. nHipótese alternativa é a definição operacional da hipótese de pesquisa que se deseja comprovar. nA natureza do estudo define a hipótese alternativa. nEm um teste paramétrico de parâmetro θ n H1 : θ = θ1 (Hipótese alternativa simples) n H1: θ ≠ θ0 ; θ > θ0 ou θ < θ0. (Hipóteses alternativas compostas) 5
  • 6.
    + Escolha do teste nParamétricose não paramétricos. nConjunto valores numéricos. nTamanho da amostra disponível. nO teste é válido somente para aquelas condições. nDefinição do nível de significância. 6
  • 7.
    + Distribuição amostral nTestes dehipótese obedecem modelos específicos. nDistribuição normal > shapiro.test() nDistribuição T Student nDistribuição Qui-quadrado nDistribuição F 7
  • 8.
    + Hipoteses nH1: θ =θ2 (hipótese simples) nH1: θ > θ0 (teste unilateral ou unicaudal à direita) nθ < θ0 (teste unilateral ou unicaudal à esquerda) nθ ≠ θ0 (teste bilateral ou bicaudal) 8
  • 9.
    + Testes paramétricos nLower TailTest da média populacional com variância conhecida nHipótese nula: n > xbar = 9900            # sample mean  n> mu0 = 10000            # hypothesized value  n> sigma = 120            # population standard deviation  n> n = 30                 # sample size  n> z = (xbar−mu0)/(sigma/sqrt(n))  n> z                      # test statistic  n> alpha = .05  n> z.alpha = qnorm(1−alpha)  n> −z.alpha               # critical value  9
  • 10.
    + Testes paramétricos nTwo tailedtest com variância conhecida n> xbar = 14.6            # sample mean  n> mu0 = 15.4             # hypothesized value  n> sigma = 2.5            # population standard deviation  n> n = 35                 # sample size  n> z = (xbar−mu0)/(sigma/sqrt(n))  n> z                      # test statistic  n> alpha = .05  n> z.half.alpha = qnorm(1−alpha/2)  n> c(−z.half.alpha, z.half.alpha)  n> pval = 2 ∗ pnorm(z)    # lower tail  n> pval                   # two−tailed p−value  10
  • 11.
    + Não conheço avariância n> xbar = 9900            # sample mean  n> mu0 = 10000            # hypothesized value  n> s = 125                # sample standard deviation  n> n = 30                 # sample size  n> t = (xbar−mu0)/(s/sqrt(n))  n> t                      # test statistic  n> alpha = .05  n> t.alpha = qt(1−alpha, df=n−1)  n> −t.alpha               # critical value  n> pval = pt(t, df=n−1)  n> pval                   # lower tail p−value  11
  • 12.
  • 13.
    + Teste T paraamostras independentes nUtilizamos a distribuição de t quando não temos os parâmetros populacionais (σ e µ). nPremissas: Normalidade, Homocedasticidade (razão das variâncias = 1 ou variâncias iguais), Independência dos dados 13 Premissas do teste t Alternativa caso haja violação de premissas Independência Amostras Pareadas Variâncias Iguais Correção dos Graus de Liberdade Normalidade Testes não-paramétricos
  • 14.
    + Teste T pareado nUtilizadocom duas amostras retiradas do mesmo objeto. nTratamento em pessoas (antes e depois), ou peso de animais (seca e chuva) nDesde que sejam os mesmos indivíduos os dados podem ser tratados como pareados. nTeste não paramétrico do teste t é o Teste de Mann-Whitney. nPara teste t pareado, o não paramétrico é Wilcoxon 14
  • 15.
    + Exemplo n> raposa =read.table("/var/www/Pseudalopex.txt", head=TRUE) n>attach (raposa) n>qt (p,df) # valor critico n> shapiro.test(raposa$chuva) n>var.test(chuva,seca) n> t.test(chuva,seca) n> t.test(chuva,seca,alternative="greater") n> wilcox.test(chuva,seca,alternative="greater") 15
  • 16.
    + Exemplos n Utiliza oteste t pareado para testar a hipótese de que a estação do ano influenciou o peso dos mesmos indivíduos (considerando agora que os mesmos indivíduos foram pesados nas duas estações) n >t.test(chuva, seca, paired=T) n Testa se a massa na chuva é maior ou igual à massa na seca, considerando que os dados são pareados n >t.test(chuva, seca, paired=T, alternative=c(“l”)) n Testa se a massa na chuva é menor ou igual à massa na seca, considerando que os dados são pareados n >t.test(chuva, seca, paired=T, alternative=c(“g”)) n Testa a igualdade das medias da massa nas duas estações, com o método não-paramétrico, considerando que os dados são pareados n >wilcox.test(chuva,seca,paired=T) 16