Teste de hipóteses - unilateral

     Profa. Dra. Juliana Garcia
             Cespedes
Inferência
                Inferir certas características da
                                      população
                amostra



 Distribuição             estimar
desconhecida         X              
      ou                  estimar
                                         Intervalo
 Parâmetros          S2             2      de
desconhecidos                            confiança
                     ^    estimar
                     p              p
Teste de hipóteses

                      amostra
                      X  107,56

                                    Uma população com
                                   média =100 conhecida
    = 100                          poderia produzir uma
                                     amostra com média
                                          107,56?


O objetivo do teste de hipóteses é verificar se os dados
  amostrais trazem evidências que contrariam ou não uma
  hipótese estatística formulada.
Teste de hipóteses
 Suponha que entre pessoas sadias, a concentração de
  uma certa substância no sangue se comporta segundo
  um modelo Normal com média 14 unidades/ml e desvio
  padrão 6 unidades/ml. Em pessoas doentes a
  concentração média se alterada para 18 unidades/ml
  com mesmo desvio padrão.


                                     Sadios: N(14,36)
                                     Doentes: N(18,36)
Teste de hipóteses para a média
 Desejamos verificar se um determinado
    tratamento é eficaz a essa doença.

 Uma amostra aleatória de 31 pessoas doentes que
  foram submetidas ao tratamento é selecionada.

            X1, X2, ... Xn       Xi ~ N( , 36)


 O valor da média desta amostra vai indicar se o
 tratamento foi eficaz (=14) ou não foi eficaz (=18)
Teste de hipóteses para a média
Pelo teorema do limite central, sabe-se que:


                   36 
             X ~ N  , 
                   31 


Um critério que pode ser utilizado para
 decidir a qual população (=14 ou =18)
 pertence a amostra é determinar um valor
 crítico xc
Teste de hipóteses para a média
Se X>xc concluímos que a amostra pertence
 à população doente (=18), ou seja o
 tratamento não é eficaz;

Se X  xc concluímos que a amostra
 pertence à população sadia (=14) sendo o
 tratamento considerado eficiente.


        = 14            = 18
                                    xobs
                 xc
Teste de hipóteses para a média
    Podemos formular duas hipóteses para esse
     problema:
                 Hipótese nula

    H0: O tratamento NÃO é eficaz;
    Ha: O tratamento é eficaz.
              Hipótese alternativa



Hipótese simples                                Hipótese composta
 H0:  = 18                        H0:  = 18                  H0:  = 18
 Ha:  = 14                        Ha:  < 18                  Ha:   18
                                 Teste unilateral             Teste bilateral
Teste de hipóteses para a média
TESTE UNILATERAL:
No caso do tratamento ser eficaz é razoável
 assumirmos que ele foi capaz de fazer com
 que as pessoas ficassem curadas, ou seja,
 que mudassem para uma população que
 X<18
          H0:  = 18 versus Ha:  < 18

TESTE BILATERAL
Para verificar se o tratamento produziu algum
  efeito benéfico X<18 ou danoso X>18
          H0:  = 18 versus Ha:   18
Teste de hipóteses para a média
Como X é uma estimativa (é apenas 1 de
 infinitas amostras possíveis) pode-se correr o
 risco de concluir incorretamente que o
 tratamento é eficaz, ou decidir que o tratamento
 não é eficiente quando na verdade ele é.

Devemos quantificar os possíveis erros
 associados a essa decisão.
Teste de hipóteses
                             Erro tipo I

 Rejeitar a hipótese H0, quando tal hipótese é
  verdadeira
                            Erro tipo II
 Não rejeitar a hipótese H0, quando ela deveria
  ser rejeitada
                                             Situação


                             H0 verdadeira                H0 falsa

          Rejeitar H0       Erro tipo I                 Sem erro
Decisão
          Não rejeitar H0   Sem erro                    Erro tipo II
Teste de hipóteses
    = P(erro tipo I) = P(Rejeitar H0| H0 é verdadeira)
    = P(erro tipo II) = P(Não rejeitar H0| H0 é falsa)
                      Nível de significância
No exemplo:
 = P(concluir que o tratamento é eficaz | na verdade ele não é)
 = P(concluir que o tratamento não é eficaz | na verdade ele é)


 Qual é o erro mais
 importante de ser                                    
 evitado?
                                                      
                                   
                                       
Teste de hipóteses para a média
Com determinar o valor crítico xc?
         P(erro I )  P(rejeitar H 0 | H 0 verd.)
          P( X  xc |   18)
                             
             X   xc  18 
          P                
                       6    
                 n        31 
          P( Z  zc )

Sendo que Z ~ N(0,1)
Teste de hipóteses para a média
O valor de zc é obtido na tabela da distribuição
 normal, dado um valor para  e o valor crítico é
 calculado como:
                     xc  18
                zc 
                      6
                         31
                             6      Intervalo de confiança
                xc  18  zc        para  com n>30!!!
                             31

Para =0,05:
                 0,05  P( Z  zc )
                 zc  1,64
Teste de hipóteses para a média
Logo
                         6
          xc  18  1,64     16,23
                         31

Se Xobs < 16,23 rejeitamos H0 concluindo que o
 tratamento é eficaz.

 Região crítica:
 RC={x  : x<xc}
 RC={x  : x<16,23}
Teste de hipóteses para a média
Se a amostra forneceu estimativa da média
 16,04 então 16,04<16,23 e rejeitamos H0 ao
 nível de significância =0,05 ou =5%.

Portanto o tratamento é eficaz.
Passos para construção do TH.
Passo 1: Estabelecer as hipótese nula e
 alternativa;

Passo 2: Definir a forma da região crítica, com
 base na hipótese alternativa;

Passo 3: Identificar a distribuição do estimador
 e obter sua estimativa;

Passo 4: Fixar  e obter a região crítica;

Passo 5: Concluir o teste com base na
 estimativa e na região crítica.
Exercício
Uma variável aleatória tem distribuição
 normal com desvio padrão igual a 12.
 Estamos testando se sua média é igual ou
 menor que 20 e coletamos uma amostra de
 100 valores dessa variável, obtendo uma
 média amostral de 17,4.
Formule as hipóteses.
Obtenha a região crítica e dê a conclusão do
 teste para os seguintes níveis de
 significância: 1%, 4% e 8%.
Teste de hipóteses - bilateral

     Profa. Dra. Juliana Garcia
             Cespedes
Teste de hipóteses
 Suponha que entre pessoas sadias, a concentração de
  uma certa substância no sangue se comporta segundo
  um modelo Normal com média 14 unidades/ml e desvio
  padrão 6 unidades/ml. Em pessoas doentes a
  concentração média se alterada para 18 unidades/ml
  com mesmo desvio padrão.


                                     Sadios: N(14,36)
                                     Doentes: N(18,36)
Teste de hipóteses - bilateral
 NOVO OBJETIVO:
Verificar se o tratamento produziu algum efeito
  benéfico X<18 ou danoso X>18

H0: O tratamento NÃO é eficaz
Ha: O tratamento produz algum efeito (benéfico ou
  danoso)


         H0:  = 18 versus Ha:   18
Teste de hipóteses - bilateral
A região crítica, ou região de rejeição para
 o teste de hipóteses bilateral será dada
 por:
         RC  {x   : x  xc1 ou x  xc 2 }

A região de aceitação é o completar da
 região crítica:

         RA  {x   : xc1  x  xc 2 }
Teste de hipóteses - bilateral
Para  fixo, encontramos os ponto críticos xc1 e xc2:

    P(erro I )  P(rejeitar H 0 | H 0 verd.)
     P( X  RC |   18)  P( X  xc1 ou X  xc 2 |   18)
                                                       
        X  18 xc1                  X  18 xc 2  18 
     P                   ou                         
        6                            6       6        
            31       n                   31        31 
     P( Z  zc1 ou Z  zc 2 )
                                               
     P( Z  zc1 )        e P ( Z  zc 2 ) 
                       2                        2
Teste de hipóteses - bilateral
Os valores de zc1 e zc2 são obtidos na tabela da
 distribuição normal, dado um valor para  e o
 valor crítico é calculado como:

                                   6       Intervalo de confiança
                  xci  18  zci           para  com n > 30!!!
                                   31
Para =0,05:
 0,025  P( Z  zc1 )              0,025  P( Z  zc 2 )
 zc1  1,96                       zc 2  1,96
Teste de hipóteses - bilateral
Logo                       6
           xc1  18  1,96      15,89
                            31
                            6
           xc 2  18  1,96     20,11
                            31

A região crítica para =0,05 é:


        RC  {x   : x  15,89 ou x  20,11}
Teste de hipóteses - bilateral




Como Xobs não pertence a RC, aceitamos H0 a
 um nível de 5% de significância. Concluímos
 que o tratamento não é eficaz.
Teste de hipóteses - bilateral
Também podemos calcular a probabilidade de
 acontecer o erro tipo II

Para calcular , nós conhecemos o valor de :


           P(erro I )
            P(rejeitar H 0 | H 0 verd.)
            P( X  RC |   18)
Teste de hipóteses - bilateral
Mas para calcular a probabilidade de ocorrer o
 erro tipo II não sabemos quem é .

          P(erro II )
          P( Não rejeitar H 0 | H 0 falsa )
          P( X  RC |   18)


                                       Quem é o
                                      verdadeiro
                                      valor de ?
Teste de hipóteses - bilateral
Desta forma  será uma função dos valores de
  definido na região da hipótese alternativa.
 Então a probabilidade do erro tipo II será
 denotada por ().

Por exemplo, se  verdadeiro for =16
        (16)  P(erro tipo II )
              P( X  RC |   16)
              P(15,89  X  20,11 |   16)
Teste de hipóteses - bilateral
                                             
                15,89  16 X  16 20,11  16 
     (16)  P                             
                36           36      36      
                      31        31      31 
            P(0,10  Z  3,81)
            0,0398  0,499
            0,5397

Se o verdadeiro =16, estamos concluindo
 equivocadamente, com probabilidade de
 0,5397, que H0 é verdadeiro.
Exercício
Um relatório de uma companhia afirma que 40%
 de toda a água obtida, através de poços
 artesianos no nordeste, é salobra.
Mas alguns dizem que a proporção é maior,
 outros que é menor.
Para diminuir as dúvidas, sortearam 400 poços
 e observou-se, em 120 deles, água salobra.
Qual seria a conclusão, ao nível de 3%?

Aula 13 teste de hipóteses

  • 1.
    Teste de hipóteses- unilateral Profa. Dra. Juliana Garcia Cespedes
  • 3.
    Inferência Inferir certas características da população amostra Distribuição estimar desconhecida X  ou estimar Intervalo Parâmetros S2 2 de desconhecidos confiança ^ estimar p p
  • 4.
    Teste de hipóteses amostra X  107,56 Uma população com média =100 conhecida  = 100 poderia produzir uma amostra com média 107,56? O objetivo do teste de hipóteses é verificar se os dados amostrais trazem evidências que contrariam ou não uma hipótese estatística formulada.
  • 5.
    Teste de hipóteses Suponha que entre pessoas sadias, a concentração de uma certa substância no sangue se comporta segundo um modelo Normal com média 14 unidades/ml e desvio padrão 6 unidades/ml. Em pessoas doentes a concentração média se alterada para 18 unidades/ml com mesmo desvio padrão. Sadios: N(14,36) Doentes: N(18,36)
  • 6.
    Teste de hipótesespara a média Desejamos verificar se um determinado tratamento é eficaz a essa doença.  Uma amostra aleatória de 31 pessoas doentes que foram submetidas ao tratamento é selecionada. X1, X2, ... Xn Xi ~ N( , 36) O valor da média desta amostra vai indicar se o tratamento foi eficaz (=14) ou não foi eficaz (=18)
  • 7.
    Teste de hipótesespara a média Pelo teorema do limite central, sabe-se que:  36  X ~ N  ,   31  Um critério que pode ser utilizado para decidir a qual população (=14 ou =18) pertence a amostra é determinar um valor crítico xc
  • 8.
    Teste de hipótesespara a média Se X>xc concluímos que a amostra pertence à população doente (=18), ou seja o tratamento não é eficaz; Se X  xc concluímos que a amostra pertence à população sadia (=14) sendo o tratamento considerado eficiente.  = 14  = 18 xobs xc
  • 9.
    Teste de hipótesespara a média Podemos formular duas hipóteses para esse problema: Hipótese nula H0: O tratamento NÃO é eficaz; Ha: O tratamento é eficaz. Hipótese alternativa Hipótese simples Hipótese composta H0:  = 18 H0:  = 18 H0:  = 18 Ha:  = 14 Ha:  < 18 Ha:   18 Teste unilateral Teste bilateral
  • 10.
    Teste de hipótesespara a média TESTE UNILATERAL: No caso do tratamento ser eficaz é razoável assumirmos que ele foi capaz de fazer com que as pessoas ficassem curadas, ou seja, que mudassem para uma população que X<18 H0:  = 18 versus Ha:  < 18 TESTE BILATERAL Para verificar se o tratamento produziu algum efeito benéfico X<18 ou danoso X>18 H0:  = 18 versus Ha:   18
  • 11.
    Teste de hipótesespara a média Como X é uma estimativa (é apenas 1 de infinitas amostras possíveis) pode-se correr o risco de concluir incorretamente que o tratamento é eficaz, ou decidir que o tratamento não é eficiente quando na verdade ele é. Devemos quantificar os possíveis erros associados a essa decisão.
  • 12.
    Teste de hipóteses Erro tipo I Rejeitar a hipótese H0, quando tal hipótese é verdadeira Erro tipo II Não rejeitar a hipótese H0, quando ela deveria ser rejeitada Situação H0 verdadeira H0 falsa Rejeitar H0 Erro tipo I Sem erro Decisão Não rejeitar H0 Sem erro Erro tipo II
  • 13.
    Teste de hipóteses  = P(erro tipo I) = P(Rejeitar H0| H0 é verdadeira)  = P(erro tipo II) = P(Não rejeitar H0| H0 é falsa) Nível de significância No exemplo:  = P(concluir que o tratamento é eficaz | na verdade ele não é)  = P(concluir que o tratamento não é eficaz | na verdade ele é) Qual é o erro mais importante de ser   evitado?    
  • 14.
    Teste de hipótesespara a média Com determinar o valor crítico xc?   P(erro I )  P(rejeitar H 0 | H 0 verd.)  P( X  xc |   18)    X   xc  18   P     6   n 31   P( Z  zc ) Sendo que Z ~ N(0,1)
  • 15.
    Teste de hipótesespara a média O valor de zc é obtido na tabela da distribuição normal, dado um valor para  e o valor crítico é calculado como: xc  18 zc  6 31 6 Intervalo de confiança xc  18  zc para  com n>30!!! 31 Para =0,05: 0,05  P( Z  zc ) zc  1,64
  • 16.
    Teste de hipótesespara a média Logo 6 xc  18  1,64  16,23 31 Se Xobs < 16,23 rejeitamos H0 concluindo que o tratamento é eficaz. Região crítica: RC={x  : x<xc} RC={x  : x<16,23}
  • 17.
    Teste de hipótesespara a média Se a amostra forneceu estimativa da média 16,04 então 16,04<16,23 e rejeitamos H0 ao nível de significância =0,05 ou =5%. Portanto o tratamento é eficaz.
  • 18.
    Passos para construçãodo TH. Passo 1: Estabelecer as hipótese nula e alternativa; Passo 2: Definir a forma da região crítica, com base na hipótese alternativa; Passo 3: Identificar a distribuição do estimador e obter sua estimativa; Passo 4: Fixar  e obter a região crítica; Passo 5: Concluir o teste com base na estimativa e na região crítica.
  • 19.
    Exercício Uma variável aleatóriatem distribuição normal com desvio padrão igual a 12. Estamos testando se sua média é igual ou menor que 20 e coletamos uma amostra de 100 valores dessa variável, obtendo uma média amostral de 17,4. Formule as hipóteses. Obtenha a região crítica e dê a conclusão do teste para os seguintes níveis de significância: 1%, 4% e 8%.
  • 20.
    Teste de hipóteses- bilateral Profa. Dra. Juliana Garcia Cespedes
  • 21.
    Teste de hipóteses Suponha que entre pessoas sadias, a concentração de uma certa substância no sangue se comporta segundo um modelo Normal com média 14 unidades/ml e desvio padrão 6 unidades/ml. Em pessoas doentes a concentração média se alterada para 18 unidades/ml com mesmo desvio padrão. Sadios: N(14,36) Doentes: N(18,36)
  • 22.
    Teste de hipóteses- bilateral  NOVO OBJETIVO: Verificar se o tratamento produziu algum efeito benéfico X<18 ou danoso X>18 H0: O tratamento NÃO é eficaz Ha: O tratamento produz algum efeito (benéfico ou danoso) H0:  = 18 versus Ha:   18
  • 23.
    Teste de hipóteses- bilateral A região crítica, ou região de rejeição para o teste de hipóteses bilateral será dada por: RC  {x   : x  xc1 ou x  xc 2 } A região de aceitação é o completar da região crítica: RA  {x   : xc1  x  xc 2 }
  • 24.
    Teste de hipóteses- bilateral Para  fixo, encontramos os ponto críticos xc1 e xc2:   P(erro I )  P(rejeitar H 0 | H 0 verd.)  P( X  RC |   18)  P( X  xc1 ou X  xc 2 |   18)    X  18 xc1   X  18 xc 2  18   P  ou    6  6 6   31 n 31 31   P( Z  zc1 ou Z  zc 2 )    P( Z  zc1 )  e P ( Z  zc 2 )  2 2
  • 25.
    Teste de hipóteses- bilateral Os valores de zc1 e zc2 são obtidos na tabela da distribuição normal, dado um valor para  e o valor crítico é calculado como: 6 Intervalo de confiança xci  18  zci para  com n > 30!!! 31 Para =0,05: 0,025  P( Z  zc1 ) 0,025  P( Z  zc 2 ) zc1  1,96 zc 2  1,96
  • 26.
    Teste de hipóteses- bilateral Logo 6 xc1  18  1,96  15,89 31 6 xc 2  18  1,96  20,11 31 A região crítica para =0,05 é: RC  {x   : x  15,89 ou x  20,11}
  • 27.
    Teste de hipóteses- bilateral Como Xobs não pertence a RC, aceitamos H0 a um nível de 5% de significância. Concluímos que o tratamento não é eficaz.
  • 28.
    Teste de hipóteses- bilateral Também podemos calcular a probabilidade de acontecer o erro tipo II Para calcular , nós conhecemos o valor de :   P(erro I )  P(rejeitar H 0 | H 0 verd.)  P( X  RC |   18)
  • 29.
    Teste de hipóteses- bilateral Mas para calcular a probabilidade de ocorrer o erro tipo II não sabemos quem é .   P(erro II )  P( Não rejeitar H 0 | H 0 falsa )  P( X  RC |   18) Quem é o verdadeiro valor de ?
  • 30.
    Teste de hipóteses- bilateral Desta forma  será uma função dos valores de  definido na região da hipótese alternativa. Então a probabilidade do erro tipo II será denotada por (). Por exemplo, se  verdadeiro for =16  (16)  P(erro tipo II )  P( X  RC |   16)  P(15,89  X  20,11 |   16)
  • 31.
    Teste de hipóteses- bilateral    15,89  16 X  16 20,11  16   (16)  P     36 36 36   31 31 31   P(0,10  Z  3,81)  0,0398  0,499  0,5397 Se o verdadeiro =16, estamos concluindo equivocadamente, com probabilidade de 0,5397, que H0 é verdadeiro.
  • 32.
    Exercício Um relatório deuma companhia afirma que 40% de toda a água obtida, através de poços artesianos no nordeste, é salobra. Mas alguns dizem que a proporção é maior, outros que é menor. Para diminuir as dúvidas, sortearam 400 poços e observou-se, em 120 deles, água salobra. Qual seria a conclusão, ao nível de 3%?