SlideShare uma empresa Scribd logo
1 de 31
Baixar para ler offline
Teste de hipóteses para
comparação de duas médias
Comparação de duas médias
• Objetivo: Comparar as médias amostrais de
  duas populações.

• 1º passo: Verificar se as variáveis estão ou não
  relacionadas.
• 2º passo: Considerar a variabilidade associada
  aos valores populacionais e amostrais.
dependentes

2 amostras

                             variâncias iguais
             independentes

                             variâncias diferentes
Amostras dependentes (teste t-pareado)
• São comparadas duas médias populacionais sendo
  que, para cada unidade amostral, realizou-se duas
  medições da característica de interesse.
  Correspondem a medidas tomadas antes e após uma
  dada intervenção.

• Ex: Uma distribuidora de combustíveis deseja verificar se
  um novo tipo de gasolina é eficaz na revitalização de
  motores velhos. Selecionou-se 12 automóveis de um
  mesmo modelo com mais de 8 anos de uso e, após
  regulagem dos motores, verifica-se o consumo de
  combustível. Em seguida, o carro é abastecido com o
  novo tipo de combustível durante 15 semanas e uma
  nova aferição é feita.
• Como o desempenho dos automóveis foi
  medido antes e depois das 15 semanas, é
  razoável assumir que exista alguma
  dependência entre as variáveis.
• Essa é a típica situação que o teste t-pareado
  deve ser utilizado.

• As medidas tomadas antes e após a
  intervenção realizada serão representadas
  pelas v.a.s Xi e Yi.

• O efeito produzido pelo i-ésimo indivíduo,
  pode ser representado pela variável Di= Yi - Xi.
• Supondo, para i=1,...,n, “ASSUMIMOS”, por
  hipótese, que:
                 Di ~ N(D ,2D)

Queremos testar as hipóteses:
H0: A intervenção não produz efeito (D = 0)
Ha: A intervenção produziu algum efeito (D  0)

A hipótese alternativa também pode ser
  unilateral!!!!
• O parâmetro D é estimado pela média amostral de
  D e sua variância é estimada por:
                          n
                 1
            S 
              2
              D       ( Di  D ) .
                n  1 i 1
                                 2



• O teste de hipóteses é realizado utilizando-se a
  quantidade :
                       D  D
                    t
                       SD
                            n
• Que sob H0, segue uma distribuição t-Student com n-
  1 graus de liberdade.
• Valores observados para os 12 automóveis:

Autom.      1      2     3     4     5      6     7      8      9      10     11     12
Após (Y)    11,6   8,8   9,9   9,5   11,6   9,1   10,6   10,8   13,4   10,6   10,5   11,4
Antes (X)   8,1    7,9   6,8   7,8   7,6    7,9   5,7    8,4    8,0    9,5    8,0    6,8
D=Y-X       3,5    0,9   3,1   1,7   4,0    1,2   4,9    2,4    5,4    1,1    2,5    4,6

 • A média e a variância amostrais de D são:
                     Dm=2,9 e S2=2,4.

 • 1º Passo: Definir as hipóteses nula e alternativa:
 H0: D = 0 (O novo combustível não aumenta o rendimento)
 Há: D > 0 (o novo combustível aumenta o rendimento)
• 2 Passo: Definir a região crítica com base na
  hipótese alternativa:
         Teste unilateral, RC:{xR|x>xc}
• 3 Passo: Identificar a distribuição do
  estimador e encontrar a estimativa:

                     D
                        d     i

                           n
    Por “HIPÓTESE”, tem-se: D~N(D , 2D/n)
• 4 Passo: Fixar  e determinar a região crítica.
               =5%  t=1,796
xc  0
 tc 
       2,4
           12
                           RC={x  : x>0,80}
                2,4
 xc  0  1,796
                12
 xc  0,80


• 5 Passo: Conclusão
Como Dobs = 2,9 e Dobs>0,80, rejeitamos H0 e
  concluímos que o novo combustível é eficaz
  na melhora do rendimento.
Amostras independentes
             Variâncias IGUAIS
• Geralmente não se tem informações a respeito do
  valor das variâncias das populações. Entretanto,
  alguns processos nos levam a crer que, apesar de
  desconhecidas, as variâncias são iguais para duas
  populações.

• Ex.: Digitadores são treinados em uma empresa em duas
  turmas distintas. Na primeira (TURMA J) utiliza-se um método
  japonês, na segunda (TURMA A) utiliza-se um método
  alemão. Deseja-se comparar os dois métodos. Foram
  escolhidas duas amostras aleatoriamente (uma de cada
  turma) e mediu-se o tempo gasto na realização de uma tarefa
  para cada aluno.
• Apesar de não conhecidas, as variâncias
  populacionais para as duas turmas são consideradas
  iguais com base em estudos anteriores.
• Os dados obtidos foram:

 Turma                                 Tempos (min)

 J       10   13   9    10   14   13     10   15   12   10   9    10   13   14
 A       15   12   18   16   15   17     17   15   16   17   11   17   14



• Formalizando o problema temos:
• Supomos que os dados apresentados para as turmas
  J e A são variáveis aleatórias independentes (X1,...,Xn)
  e (Y1,...Yn), respectivamente e que seguem a
  distribuição Normal.
• Portanto
             Xi ~ N(X, 2), i= 1, 2, ..., n1
             Yj ~ N(Y, 2), j= 1, 2, ..., n2

OBS: Para ambas as populações temos a mesma
 variância (desconhecida!!!)

Queremos testar se existe diferença entre o tempo
 médio de digitação dos dois métodos, ou seja:
    H0: X = Y
    Ha: X  Y     ou (Ha: X < Y | Ha: X > Y)
• Testar se as médias populacionais são iguais é
  equivalente a testar se a diferença entre elas é
  “estatisticamente” igual a 0.

• Logo podemos reescrever as hipóteses em
  termos de D = X - Y
     H0: D = 0
     Ha: D  0 ou (Ha: D < 0 | Ha: D > 0)

Desta forma usaremos o estimador (intuitivo)
                  D=X-Y
• Do TLC tem-se que se n>30

                       2
                                       
                                         2
          X ~ N   X ,  e Y ~ N  Y , 
                
                      n1 
                                  
                                       n2 
                                           
• Se n30 usaremos a distribuição t-Student !!!
• Como as amostras são independentes:
E(D) = E(X-Y) = E(X + (-1)Y) = E(X) + (-1)E(Y) = E(X) - E(Y)
  = X - Y

Var(D) = Var(X-Y) = Var(X + (-1)Y) = Var(X) + Var(-1Y) =
                                           2       2
Var(X) + (-1)2Var(Y) = Var(X) + Var(Y) =        
                                           n1       n2
• Como X e Y têm distribuição normal (se n>30)
  então:
                                2  2 
          D ~ N   X  Y , 
                               n       
                
                               1    n2  
                                         
• Se n  30 usa-se a distribuição t–Student
  (cuidado com os graus de liberdade!!!)

• Como 2 é desconhecida, precisará ser
  estimada. Como SX2 e SY2 são estimadores não
  viciados dessa variância, usaremos como
  estimativa para 2 uma combinação deles
  dada por:
S 
 2  (n1  1) S  (n2  1) S
             2
             X
                           2
                           Y
                            
                                    ( X i  X ) 2  (Y j  Y ) 2
       (n1  1)  (n2  1)                    n1  n2  2
 C




 SC2 é uma média ponderada entre SX2 e SY2 e é um
   estimador não viciado!!!

 Se n30
                      D  (  X  Y )
                 t                      ~ t( n1  n2 2)
                               2
                             S C
                           n1  n2
• Logo
     =P(Rejeitar H0|H0 verd) = P(t<-tc ou t>tc|H0)

tc é obtido pela tabela da distribuição t-Student com
   n1+n2 -2 graus de liberdade.

A região crítica será dada por:
                  RC={tR|t<-tc ou t>tc}
Obtidas as amostras, substituindo as estimativas de D e
  Sc na expressão de t, obtém-se o valor tobs.

• Rejeita-se H0 se tobs pertencer à região crítica.
Se n>30

                      D  (  X  Y )
                 z                      ~ N (0,1)
                              2
                             SC
                           n1  n2

Então
        =P(Rejeitar H0|H0 verd) = P(z<-zc ou z>zc|H0)

zc é obtido pela tabela da distribuição Normal (0,1)

A região crítica será dada por:
                   RC={zR|z<-zc ou z>zc}
Obtidas as amostras, substituindo as estimativas de D e
  Sc na expressão de t, obtém-se o valor zobs.

• Rejeita-se H0 se zobs pertencer à região crítica.

• Voltando ao exemplo: Digitadores são treinados em uma
  empresa em duas turmas distintas. Na primeira (TURMA J)
  utiliza-se um método japonês, na segunda (TURMA A) utiliza-
  se um método alemão. Deseja-se comparar os dois métodos.
  Foram escolhidas duas amostras aleatoriamente (uma de cada
  turma) e mediu-se o tempo gasto na realização de uma tarefa
  para cada aluno.
Turma                                 Tempos (min)

 J       10   13   9    10   14   13     10   15   12   10   9    10   13   14

 A       15   12   18   16   15   17     17   15   16   17   11   17   14


• As amostras forneceram os seguintes valores:
        Turma J: n1=14, Xobs=11,57e SX2=4,1
       Turma A: n2=13, Yobs= 15,38 e SY2= 4,3

Então:
 Dobs = 11,57 – 15,38 = -3,81
      (n1  1) S X  (n2  1) SY 13 * 4,1  12 * 4,3
                 2             2
 SC 
  2
                                                     4,2
         (n1  1)  (n2  1)             25
• Como a hipótese alternativa é bilateral e n<30, a
  região crítica tem a forma:
                  RC={tR|t<-tc ou t>tc}.

Logo para =0,01, temos:
     =P(Rejeitar H0|H0 verd) = P(t<-tc ou t>tc|H0).

Da tabela da t-Student com 25 graus de liberdade,
  obtemos tc=2,787.

Então RC={tR|t<-2,787 ou t>2,787}.
• Usando a estatística do teste temos:
           D  (  X  Y )      3,81  0
      t                                   4,83
                   2
                  SC
                                    4,2
                n1  n2           14  13



• Como -4,83 pertence a região crítica,
  concluímos que os métodos de fato diferem a
  um nível de significância de 1%.
Amostras independentes
           Variâncias DIFERENTES
• O teste para o caso com as variâncias desconhecidas
  e desiguais é semelhante ao anterior, mas a
  quantidade a ser usada para aceitar ou rejeitar H0 se
  n30 será:

                 D  (  X  Y )
            t                      ~t 
                       2      2
                     S   S
                       
                       X      y

                     n1 n2
• Mas os graus de liberdade  são corrigidos
  pela expressão:

                              2
                SX S 
                   2      2
                       y
               n       n2 
              1         
                            2 2
             SX   Sy 
                 2   2

                    
             n  n 
             1   2 
              n1  1     n2  1
• Se n>30


             D  (  X  Y )
        z                      ~ N (0,1)
                  2      2
                 S   S
                  X
                        y

                 n1 n2


• A seqüência do teste é igual aos casos
  anteriores.
RESUMO
1) Amostras relacionadas (teste t-pareado)
• Estimadores:

    D
         Di            SD 
                          2     ( Di  D ) 2
          n                        n 1
• Estatística do teste:
   Para todo n                Por aprox. se n  120
        D  D                     D  D
   t            ~ t( n 1)   z            ~ N (0,1)
            2                         2
          S D                        SD
           n                          n
2) Amostras independentes com variâncias
  desconhecidas e iguais
• Estimadores:
                                        (n1  1) S X  (n2  1) SY
                                                   2             2

       D  X Y                    SC 
                                    2

                                           (n1  1)  (n2  1)

• Estatística do teste:
Se n  30                              Se n  30
     D  D                                  D  D
t             ~ t( n1  n2  2)        z              ~ N (0,1)
         2                                        2
       SC                                       SC
     n1  n2                                  n1  n2
3) Amostras independentes com variâncias
  desconhecidas e desiguais
• Estimadores:
                                   2   2
                                 S X SY
       D  X Y             SD 
                             2
                                     
                                 n1 n2

• Estatística do teste:
  Se n  30                       S 2
                                         S 
                                           2   2

                                    X
                                         y
                                  n     n2 
        D  D                   1       
  t                 ~t                     2 2
          2
             S   2
                                SX   Sy 
                                    2 2
         SX
                y                    
                                n  n 
         n1 n2                  1   2 
                                 n1  1   n2  1
Se n  30
     D  D
z               ~ N (0,1)
      2      2
     S      Sy
      X
       
     n1 n2
Exercício: Num estudo sobre doenças infantis, desejamos
investigar se a incidência de casos de contaminação por
vermes é afetada pela idade. Dois grupos de crianças, um
com idades de 2 a 4 anos (GRUPO I) e outro, com idades
de 7 a 9 anos (GRUPO II) foram escolhidos para serem
examinados quanto à ocorrência de vermes. Os dados são
apresentados:
              Grupo Amostra Proporção com Verminose
                I     120             0,085
                II    260             0,103


Para saber se as duas faixas etárias acima tem o mesmo
comportamento, realize um teste de hipóteses
envolvendo a proporção de crianças com verminose.
Considere =5% e variâncias iguais.

Mais conteúdo relacionado

Mais procurados

amostragem
amostragemamostragem
amostragemsocram01
 
Lista de exercícios produto vetorial produto misto
Lista de exercícios produto vetorial produto mistoLista de exercícios produto vetorial produto misto
Lista de exercícios produto vetorial produto mistoProf Paulo Roberto Batista
 
Exercicios amostragem e tamanho amostra
Exercicios amostragem e tamanho amostraExercicios amostragem e tamanho amostra
Exercicios amostragem e tamanho amostramorozo
 
Aula 3 testes de hipóteses e anova
Aula 3   testes de hipóteses e anovaAula 3   testes de hipóteses e anova
Aula 3 testes de hipóteses e anovaRodrigo Rodrigues
 
34 nucleo e imagem de uma transformacao linear
34 nucleo e imagem de uma transformacao linear34 nucleo e imagem de uma transformacao linear
34 nucleo e imagem de uma transformacao linearAndressa Leite Rodrigues
 
Outros testes não-paramétricos
Outros testes não-paramétricosOutros testes não-paramétricos
Outros testes não-paramétricosguest422f98
 
Apresentação geometria analítica
Apresentação geometria analíticaApresentação geometria analítica
Apresentação geometria analíticaprofluizgustavo
 

Mais procurados (20)

Variáveis aleatórias contínuas - Estatística II
Variáveis aleatórias contínuas - Estatística IIVariáveis aleatórias contínuas - Estatística II
Variáveis aleatórias contínuas - Estatística II
 
amostragem
amostragemamostragem
amostragem
 
Aula 30 testes de hipóteses
Aula 30   testes de hipótesesAula 30   testes de hipóteses
Aula 30 testes de hipóteses
 
Lista de exercícios produto vetorial produto misto
Lista de exercícios produto vetorial produto mistoLista de exercícios produto vetorial produto misto
Lista de exercícios produto vetorial produto misto
 
Aula inferencia
Aula inferenciaAula inferencia
Aula inferencia
 
distribuição-t-student
distribuição-t-studentdistribuição-t-student
distribuição-t-student
 
Amostragem
AmostragemAmostragem
Amostragem
 
Exercicios de estatistica resolvido.4
Exercicios de estatistica resolvido.4Exercicios de estatistica resolvido.4
Exercicios de estatistica resolvido.4
 
Exercicios amostragem e tamanho amostra
Exercicios amostragem e tamanho amostraExercicios amostragem e tamanho amostra
Exercicios amostragem e tamanho amostra
 
Aula 02 população amostra e dados
Aula 02   população amostra e dadosAula 02   população amostra e dados
Aula 02 população amostra e dados
 
Aula 11 estimação
Aula 11   estimaçãoAula 11   estimação
Aula 11 estimação
 
Aula 3 testes de hipóteses e anova
Aula 3   testes de hipóteses e anovaAula 3   testes de hipóteses e anova
Aula 3 testes de hipóteses e anova
 
Aula 7 variáveis aleatórias
Aula 7   variáveis aleatóriasAula 7   variáveis aleatórias
Aula 7 variáveis aleatórias
 
Aula 17 medidas separatrizes
Aula 17   medidas separatrizesAula 17   medidas separatrizes
Aula 17 medidas separatrizes
 
Analise dimensional 11 usj-2012-of
Analise dimensional  11 usj-2012-ofAnalise dimensional  11 usj-2012-of
Analise dimensional 11 usj-2012-of
 
Regressão Linear I
Regressão Linear IRegressão Linear I
Regressão Linear I
 
Amostragem - estatistica
Amostragem - estatisticaAmostragem - estatistica
Amostragem - estatistica
 
34 nucleo e imagem de uma transformacao linear
34 nucleo e imagem de uma transformacao linear34 nucleo e imagem de uma transformacao linear
34 nucleo e imagem de uma transformacao linear
 
Outros testes não-paramétricos
Outros testes não-paramétricosOutros testes não-paramétricos
Outros testes não-paramétricos
 
Apresentação geometria analítica
Apresentação geometria analíticaApresentação geometria analítica
Apresentação geometria analítica
 

Destaque (17)

Aula 5 probabilidade
Aula 5   probabilidadeAula 5   probabilidade
Aula 5 probabilidade
 
Aula 4 medidas resumo - parte 2
Aula 4   medidas resumo - parte 2Aula 4   medidas resumo - parte 2
Aula 4 medidas resumo - parte 2
 
Aula 3 medidas resumo - parte 1
Aula 3   medidas resumo - parte 1Aula 3   medidas resumo - parte 1
Aula 3 medidas resumo - parte 1
 
Exerccios aula13
Exerccios aula13Exerccios aula13
Exerccios aula13
 
Aula 2 resumo de dados
Aula 2   resumo de dadosAula 2   resumo de dados
Aula 2 resumo de dados
 
Aula 6 probabilidade condicional
Aula 6   probabilidade condicionalAula 6   probabilidade condicional
Aula 6 probabilidade condicional
 
Aula 1 data de provas e apresentações
Aula 1   data de provas e apresentaçõesAula 1   data de provas e apresentações
Aula 1 data de provas e apresentações
 
Aula 9 variáveis aleatória contínua - parte 2
Aula 9   variáveis aleatória contínua - parte 2Aula 9   variáveis aleatória contínua - parte 2
Aula 9 variáveis aleatória contínua - parte 2
 
1. intervalo de confiança parte i
1. intervalo de confiança   parte i1. intervalo de confiança   parte i
1. intervalo de confiança parte i
 
Aula 10 planejamento da amostra
Aula 10   planejamento da amostraAula 10   planejamento da amostra
Aula 10 planejamento da amostra
 
Tópico 2 Intervalo de Confiança
Tópico 2   Intervalo de ConfiançaTópico 2   Intervalo de Confiança
Tópico 2 Intervalo de Confiança
 
Noções de probabilidade
Noções de probabilidadeNoções de probabilidade
Noções de probabilidade
 
Introdução à teoria das probabilidades
Introdução à teoria das probabilidadesIntrodução à teoria das probabilidades
Introdução à teoria das probabilidades
 
Aula 12 intervalo de confiança
Aula 12   intervalo de confiançaAula 12   intervalo de confiança
Aula 12 intervalo de confiança
 
Probabilidades
ProbabilidadesProbabilidades
Probabilidades
 
Probabilidade Profa. Lucia M. Carvalho
Probabilidade Profa. Lucia M. CarvalhoProbabilidade Profa. Lucia M. Carvalho
Probabilidade Profa. Lucia M. Carvalho
 
Probabilidades
ProbabilidadesProbabilidades
Probabilidades
 

Semelhante a Aula 14 new

Aula 2 - Sistemas de informação
Aula 2 - Sistemas de informaçãoAula 2 - Sistemas de informação
Aula 2 - Sistemas de informaçãoCaroline Godoy
 
Aula 9-intervalo-de-confiança para a média
Aula 9-intervalo-de-confiança para a médiaAula 9-intervalo-de-confiança para a média
Aula 9-intervalo-de-confiança para a médiaCarlos Alberto Monteiro
 
matematica para o ensino medio I
 matematica para o ensino medio I matematica para o ensino medio I
matematica para o ensino medio IJailson Nascimento
 
Formulario estatistica descritiva univariada e bivariava 2013
Formulario estatistica descritiva univariada e bivariava  2013Formulario estatistica descritiva univariada e bivariava  2013
Formulario estatistica descritiva univariada e bivariava 2013Pedro Casquilho
 
Capitulo 8 gujarati resumo
Capitulo 8 gujarati resumoCapitulo 8 gujarati resumo
Capitulo 8 gujarati resumoMonica Barros
 
Expoente 12 prova modelo de exame-enunciado
Expoente 12 prova modelo de exame-enunciadoExpoente 12 prova modelo de exame-enunciado
Expoente 12 prova modelo de exame-enunciadoSusana Figueiredo
 
Aula 5 - Sistemas de informação
Aula 5 - Sistemas de informaçãoAula 5 - Sistemas de informação
Aula 5 - Sistemas de informaçãoCaroline Godoy
 
Coment obf nivel3_3fase
Coment obf nivel3_3faseComent obf nivel3_3fase
Coment obf nivel3_3faseThommas Kevin
 
Prova p1 calc4_2011_2_eng
Prova p1 calc4_2011_2_engProva p1 calc4_2011_2_eng
Prova p1 calc4_2011_2_engVitobno
 
Slides da aula sobre Coordenadas Polares e Integrais Duplas em Coordenadas Po...
Slides da aula sobre Coordenadas Polares e Integrais Duplas em Coordenadas Po...Slides da aula sobre Coordenadas Polares e Integrais Duplas em Coordenadas Po...
Slides da aula sobre Coordenadas Polares e Integrais Duplas em Coordenadas Po...Izabela Marques
 
Formulario inferencia estatistica - 1 e 2 populacoes
Formulario   inferencia estatistica - 1 e 2 populacoesFormulario   inferencia estatistica - 1 e 2 populacoes
Formulario inferencia estatistica - 1 e 2 populacoesPedro Casquilho
 
Aula 6 - Sistemas de informação
Aula 6 - Sistemas de informaçãoAula 6 - Sistemas de informação
Aula 6 - Sistemas de informaçãoCaroline Godoy
 
Www.uff.br gma informacoes disciplinas_calc 03 -a- 2012-2_lista 3
Www.uff.br gma informacoes disciplinas_calc 03 -a- 2012-2_lista 3Www.uff.br gma informacoes disciplinas_calc 03 -a- 2012-2_lista 3
Www.uff.br gma informacoes disciplinas_calc 03 -a- 2012-2_lista 3Bowman Guimaraes
 
Otimização no Armazenamento de Imagens por meio da Decomposição em Valores Si...
Otimização no Armazenamento de Imagens por meio da Decomposição em Valores Si...Otimização no Armazenamento de Imagens por meio da Decomposição em Valores Si...
Otimização no Armazenamento de Imagens por meio da Decomposição em Valores Si...Agnaldo Coelho
 
Redes Neurais: Estimação de Densidades
Redes Neurais: Estimação de DensidadesRedes Neurais: Estimação de Densidades
Redes Neurais: Estimação de DensidadesRenato Vicente
 
Teste para Inferência de Simetria de Distribuições
Teste para Inferência de Simetria de DistribuiçõesTeste para Inferência de Simetria de Distribuições
Teste para Inferência de Simetria de DistribuiçõesJoao Silva
 

Semelhante a Aula 14 new (20)

Aula 2 - Sistemas de informação
Aula 2 - Sistemas de informaçãoAula 2 - Sistemas de informação
Aula 2 - Sistemas de informação
 
Aula 9-intervalo-de-confiança para a média
Aula 9-intervalo-de-confiança para a médiaAula 9-intervalo-de-confiança para a média
Aula 9-intervalo-de-confiança para a média
 
Provas passadas calculo2
Provas passadas calculo2Provas passadas calculo2
Provas passadas calculo2
 
matematica para o ensino medio I
 matematica para o ensino medio I matematica para o ensino medio I
matematica para o ensino medio I
 
Tutorial03 - Teste de Duas Médias
Tutorial03 - Teste de Duas MédiasTutorial03 - Teste de Duas Médias
Tutorial03 - Teste de Duas Médias
 
Formulario estatistica descritiva univariada e bivariava 2013
Formulario estatistica descritiva univariada e bivariava  2013Formulario estatistica descritiva univariada e bivariava  2013
Formulario estatistica descritiva univariada e bivariava 2013
 
Ex
ExEx
Ex
 
Ex
ExEx
Ex
 
Capitulo 8 gujarati resumo
Capitulo 8 gujarati resumoCapitulo 8 gujarati resumo
Capitulo 8 gujarati resumo
 
Expoente 12 prova modelo de exame-enunciado
Expoente 12 prova modelo de exame-enunciadoExpoente 12 prova modelo de exame-enunciado
Expoente 12 prova modelo de exame-enunciado
 
Aula 5 - Sistemas de informação
Aula 5 - Sistemas de informaçãoAula 5 - Sistemas de informação
Aula 5 - Sistemas de informação
 
Coment obf nivel3_3fase
Coment obf nivel3_3faseComent obf nivel3_3fase
Coment obf nivel3_3fase
 
Prova p1 calc4_2011_2_eng
Prova p1 calc4_2011_2_engProva p1 calc4_2011_2_eng
Prova p1 calc4_2011_2_eng
 
Slides da aula sobre Coordenadas Polares e Integrais Duplas em Coordenadas Po...
Slides da aula sobre Coordenadas Polares e Integrais Duplas em Coordenadas Po...Slides da aula sobre Coordenadas Polares e Integrais Duplas em Coordenadas Po...
Slides da aula sobre Coordenadas Polares e Integrais Duplas em Coordenadas Po...
 
Formulario inferencia estatistica - 1 e 2 populacoes
Formulario   inferencia estatistica - 1 e 2 populacoesFormulario   inferencia estatistica - 1 e 2 populacoes
Formulario inferencia estatistica - 1 e 2 populacoes
 
Aula 6 - Sistemas de informação
Aula 6 - Sistemas de informaçãoAula 6 - Sistemas de informação
Aula 6 - Sistemas de informação
 
Www.uff.br gma informacoes disciplinas_calc 03 -a- 2012-2_lista 3
Www.uff.br gma informacoes disciplinas_calc 03 -a- 2012-2_lista 3Www.uff.br gma informacoes disciplinas_calc 03 -a- 2012-2_lista 3
Www.uff.br gma informacoes disciplinas_calc 03 -a- 2012-2_lista 3
 
Otimização no Armazenamento de Imagens por meio da Decomposição em Valores Si...
Otimização no Armazenamento de Imagens por meio da Decomposição em Valores Si...Otimização no Armazenamento de Imagens por meio da Decomposição em Valores Si...
Otimização no Armazenamento de Imagens por meio da Decomposição em Valores Si...
 
Redes Neurais: Estimação de Densidades
Redes Neurais: Estimação de DensidadesRedes Neurais: Estimação de Densidades
Redes Neurais: Estimação de Densidades
 
Teste para Inferência de Simetria de Distribuições
Teste para Inferência de Simetria de DistribuiçõesTeste para Inferência de Simetria de Distribuições
Teste para Inferência de Simetria de Distribuições
 

Mais de Ariel Rennó Chaves

Mais de Ariel Rennó Chaves (7)

Módulo 1 - Piscicultura.pdf
Módulo 1 - Piscicultura.pdfMódulo 1 - Piscicultura.pdf
Módulo 1 - Piscicultura.pdf
 
Lista6
Lista6Lista6
Lista6
 
Lista 5 modelos de probabilidade
Lista 5   modelos de probabilidadeLista 5   modelos de probabilidade
Lista 5 modelos de probabilidade
 
Lista 4 variáveis aleatórias discretas
Lista 4   variáveis aleatórias discretasLista 4   variáveis aleatórias discretas
Lista 4 variáveis aleatórias discretas
 
Lista 3 probabilidade
Lista 3   probabilidadeLista 3   probabilidade
Lista 3 probabilidade
 
Lista 2 coeficiente de correlação
Lista 2   coeficiente de correlaçãoLista 2   coeficiente de correlação
Lista 2 coeficiente de correlação
 
Lista 1 tabela de frequencias e medidas resumo
Lista 1   tabela de frequencias e medidas resumoLista 1   tabela de frequencias e medidas resumo
Lista 1 tabela de frequencias e medidas resumo
 

Aula 14 new

  • 1. Teste de hipóteses para comparação de duas médias
  • 2. Comparação de duas médias • Objetivo: Comparar as médias amostrais de duas populações. • 1º passo: Verificar se as variáveis estão ou não relacionadas. • 2º passo: Considerar a variabilidade associada aos valores populacionais e amostrais.
  • 3. dependentes 2 amostras variâncias iguais independentes variâncias diferentes
  • 4. Amostras dependentes (teste t-pareado) • São comparadas duas médias populacionais sendo que, para cada unidade amostral, realizou-se duas medições da característica de interesse. Correspondem a medidas tomadas antes e após uma dada intervenção. • Ex: Uma distribuidora de combustíveis deseja verificar se um novo tipo de gasolina é eficaz na revitalização de motores velhos. Selecionou-se 12 automóveis de um mesmo modelo com mais de 8 anos de uso e, após regulagem dos motores, verifica-se o consumo de combustível. Em seguida, o carro é abastecido com o novo tipo de combustível durante 15 semanas e uma nova aferição é feita.
  • 5. • Como o desempenho dos automóveis foi medido antes e depois das 15 semanas, é razoável assumir que exista alguma dependência entre as variáveis. • Essa é a típica situação que o teste t-pareado deve ser utilizado. • As medidas tomadas antes e após a intervenção realizada serão representadas pelas v.a.s Xi e Yi. • O efeito produzido pelo i-ésimo indivíduo, pode ser representado pela variável Di= Yi - Xi.
  • 6. • Supondo, para i=1,...,n, “ASSUMIMOS”, por hipótese, que: Di ~ N(D ,2D) Queremos testar as hipóteses: H0: A intervenção não produz efeito (D = 0) Ha: A intervenção produziu algum efeito (D  0) A hipótese alternativa também pode ser unilateral!!!!
  • 7. • O parâmetro D é estimado pela média amostral de D e sua variância é estimada por: n 1 S  2 D  ( Di  D ) . n  1 i 1 2 • O teste de hipóteses é realizado utilizando-se a quantidade : D  D t SD n • Que sob H0, segue uma distribuição t-Student com n- 1 graus de liberdade.
  • 8. • Valores observados para os 12 automóveis: Autom. 1 2 3 4 5 6 7 8 9 10 11 12 Após (Y) 11,6 8,8 9,9 9,5 11,6 9,1 10,6 10,8 13,4 10,6 10,5 11,4 Antes (X) 8,1 7,9 6,8 7,8 7,6 7,9 5,7 8,4 8,0 9,5 8,0 6,8 D=Y-X 3,5 0,9 3,1 1,7 4,0 1,2 4,9 2,4 5,4 1,1 2,5 4,6 • A média e a variância amostrais de D são: Dm=2,9 e S2=2,4. • 1º Passo: Definir as hipóteses nula e alternativa: H0: D = 0 (O novo combustível não aumenta o rendimento) Há: D > 0 (o novo combustível aumenta o rendimento)
  • 9. • 2 Passo: Definir a região crítica com base na hipótese alternativa: Teste unilateral, RC:{xR|x>xc} • 3 Passo: Identificar a distribuição do estimador e encontrar a estimativa: D d i n Por “HIPÓTESE”, tem-se: D~N(D , 2D/n) • 4 Passo: Fixar  e determinar a região crítica. =5%  t=1,796
  • 10. xc  0 tc  2,4 12 RC={x  : x>0,80} 2,4 xc  0  1,796 12 xc  0,80 • 5 Passo: Conclusão Como Dobs = 2,9 e Dobs>0,80, rejeitamos H0 e concluímos que o novo combustível é eficaz na melhora do rendimento.
  • 11. Amostras independentes Variâncias IGUAIS • Geralmente não se tem informações a respeito do valor das variâncias das populações. Entretanto, alguns processos nos levam a crer que, apesar de desconhecidas, as variâncias são iguais para duas populações. • Ex.: Digitadores são treinados em uma empresa em duas turmas distintas. Na primeira (TURMA J) utiliza-se um método japonês, na segunda (TURMA A) utiliza-se um método alemão. Deseja-se comparar os dois métodos. Foram escolhidas duas amostras aleatoriamente (uma de cada turma) e mediu-se o tempo gasto na realização de uma tarefa para cada aluno.
  • 12. • Apesar de não conhecidas, as variâncias populacionais para as duas turmas são consideradas iguais com base em estudos anteriores. • Os dados obtidos foram: Turma Tempos (min) J 10 13 9 10 14 13 10 15 12 10 9 10 13 14 A 15 12 18 16 15 17 17 15 16 17 11 17 14 • Formalizando o problema temos: • Supomos que os dados apresentados para as turmas J e A são variáveis aleatórias independentes (X1,...,Xn) e (Y1,...Yn), respectivamente e que seguem a distribuição Normal.
  • 13. • Portanto Xi ~ N(X, 2), i= 1, 2, ..., n1 Yj ~ N(Y, 2), j= 1, 2, ..., n2 OBS: Para ambas as populações temos a mesma variância (desconhecida!!!) Queremos testar se existe diferença entre o tempo médio de digitação dos dois métodos, ou seja: H0: X = Y Ha: X  Y ou (Ha: X < Y | Ha: X > Y)
  • 14. • Testar se as médias populacionais são iguais é equivalente a testar se a diferença entre elas é “estatisticamente” igual a 0. • Logo podemos reescrever as hipóteses em termos de D = X - Y H0: D = 0 Ha: D  0 ou (Ha: D < 0 | Ha: D > 0) Desta forma usaremos o estimador (intuitivo) D=X-Y
  • 15. • Do TLC tem-se que se n>30   2     2 X ~ N   X ,  e Y ~ N  Y ,    n1    n2   • Se n30 usaremos a distribuição t-Student !!! • Como as amostras são independentes: E(D) = E(X-Y) = E(X + (-1)Y) = E(X) + (-1)E(Y) = E(X) - E(Y) = X - Y Var(D) = Var(X-Y) = Var(X + (-1)Y) = Var(X) + Var(-1Y) = 2 2 Var(X) + (-1)2Var(Y) = Var(X) + Var(Y) =  n1 n2
  • 16. • Como X e Y têm distribuição normal (se n>30) então:    2  2  D ~ N   X  Y ,  n      1 n2    • Se n  30 usa-se a distribuição t–Student (cuidado com os graus de liberdade!!!) • Como 2 é desconhecida, precisará ser estimada. Como SX2 e SY2 são estimadores não viciados dessa variância, usaremos como estimativa para 2 uma combinação deles dada por:
  • 17. S  2 (n1  1) S  (n2  1) S 2 X 2 Y   ( X i  X ) 2  (Y j  Y ) 2 (n1  1)  (n2  1) n1  n2  2 C SC2 é uma média ponderada entre SX2 e SY2 e é um estimador não viciado!!! Se n30 D  (  X  Y ) t ~ t( n1  n2 2) 2 S C n1  n2
  • 18. • Logo =P(Rejeitar H0|H0 verd) = P(t<-tc ou t>tc|H0) tc é obtido pela tabela da distribuição t-Student com n1+n2 -2 graus de liberdade. A região crítica será dada por: RC={tR|t<-tc ou t>tc} Obtidas as amostras, substituindo as estimativas de D e Sc na expressão de t, obtém-se o valor tobs. • Rejeita-se H0 se tobs pertencer à região crítica.
  • 19. Se n>30 D  (  X  Y ) z ~ N (0,1) 2 SC n1  n2 Então =P(Rejeitar H0|H0 verd) = P(z<-zc ou z>zc|H0) zc é obtido pela tabela da distribuição Normal (0,1) A região crítica será dada por: RC={zR|z<-zc ou z>zc}
  • 20. Obtidas as amostras, substituindo as estimativas de D e Sc na expressão de t, obtém-se o valor zobs. • Rejeita-se H0 se zobs pertencer à região crítica. • Voltando ao exemplo: Digitadores são treinados em uma empresa em duas turmas distintas. Na primeira (TURMA J) utiliza-se um método japonês, na segunda (TURMA A) utiliza- se um método alemão. Deseja-se comparar os dois métodos. Foram escolhidas duas amostras aleatoriamente (uma de cada turma) e mediu-se o tempo gasto na realização de uma tarefa para cada aluno.
  • 21. Turma Tempos (min) J 10 13 9 10 14 13 10 15 12 10 9 10 13 14 A 15 12 18 16 15 17 17 15 16 17 11 17 14 • As amostras forneceram os seguintes valores: Turma J: n1=14, Xobs=11,57e SX2=4,1 Turma A: n2=13, Yobs= 15,38 e SY2= 4,3 Então: Dobs = 11,57 – 15,38 = -3,81 (n1  1) S X  (n2  1) SY 13 * 4,1  12 * 4,3 2 2 SC  2   4,2 (n1  1)  (n2  1) 25
  • 22. • Como a hipótese alternativa é bilateral e n<30, a região crítica tem a forma: RC={tR|t<-tc ou t>tc}. Logo para =0,01, temos: =P(Rejeitar H0|H0 verd) = P(t<-tc ou t>tc|H0). Da tabela da t-Student com 25 graus de liberdade, obtemos tc=2,787. Então RC={tR|t<-2,787 ou t>2,787}.
  • 23. • Usando a estatística do teste temos: D  (  X  Y )  3,81  0 t   4,83 2 SC 4,2 n1  n2 14  13 • Como -4,83 pertence a região crítica, concluímos que os métodos de fato diferem a um nível de significância de 1%.
  • 24. Amostras independentes Variâncias DIFERENTES • O teste para o caso com as variâncias desconhecidas e desiguais é semelhante ao anterior, mas a quantidade a ser usada para aceitar ou rejeitar H0 se n30 será: D  (  X  Y ) t ~t  2 2 S S  X y n1 n2
  • 25. • Mas os graus de liberdade  são corrigidos pela expressão: 2  SX S  2 2   y n n2    1  2 2  SX   Sy  2 2      n  n   1   2  n1  1 n2  1
  • 26. • Se n>30 D  (  X  Y ) z ~ N (0,1) 2 2 S S X  y n1 n2 • A seqüência do teste é igual aos casos anteriores.
  • 27. RESUMO 1) Amostras relacionadas (teste t-pareado) • Estimadores: D  Di SD  2  ( Di  D ) 2 n n 1 • Estatística do teste: Para todo n Por aprox. se n  120 D  D D  D t ~ t( n 1) z ~ N (0,1) 2 2 S D SD n n
  • 28. 2) Amostras independentes com variâncias desconhecidas e iguais • Estimadores: (n1  1) S X  (n2  1) SY 2 2 D  X Y SC  2 (n1  1)  (n2  1) • Estatística do teste: Se n  30 Se n  30 D  D D  D t ~ t( n1  n2  2) z ~ N (0,1) 2 2 SC SC n1  n2 n1  n2
  • 29. 3) Amostras independentes com variâncias desconhecidas e desiguais • Estimadores: 2 2 S X SY D  X Y SD  2  n1 n2 • Estatística do teste: Se n  30 S 2 S  2 2  X  y n n2  D  D   1  t ~t  2 2 2 S 2  SX   Sy  2 2 SX  y      n  n  n1 n2  1   2  n1  1 n2  1
  • 30. Se n  30 D  D z ~ N (0,1) 2 2 S Sy X  n1 n2
  • 31. Exercício: Num estudo sobre doenças infantis, desejamos investigar se a incidência de casos de contaminação por vermes é afetada pela idade. Dois grupos de crianças, um com idades de 2 a 4 anos (GRUPO I) e outro, com idades de 7 a 9 anos (GRUPO II) foram escolhidos para serem examinados quanto à ocorrência de vermes. Os dados são apresentados: Grupo Amostra Proporção com Verminose I 120 0,085 II 260 0,103 Para saber se as duas faixas etárias acima tem o mesmo comportamento, realize um teste de hipóteses envolvendo a proporção de crianças com verminose. Considere =5% e variâncias iguais.