Tópico 3 Testes de Hipóteses - 2 amostras

1.826 visualizações

Publicada em

Testes de Hipóteses para Duas Amostras:
Testes de Média
Testes para Proporções

Publicada em: Educação
0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
1.826
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
97
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Tópico 3 Testes de Hipóteses - 2 amostras

  1. 1. Estatística II UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS FACULDADE DE ECONOMIA Prof. Dr. Ricardo Bruno Nascimento dos Santos
  2. 2. TESTES DE HIPÓTESES COM DUAS AMOSTRAS
  3. 3. TESTES DE HIPÓTESES para DUAS amostras A questão agora se baseia em verificarmos se duas amostras distintas possuem ou não as mesmas características. Ou seja, podemos inferir para comparar duas populações distintas. Vamos partir do exemplo sobre dois grupos que fazem exercícios físicos e outro que não realiza temos as seguintes informações: Praticantes de Atividades Físicas (n=1.593) Característica Frequência Proporção 40 a 49 anos 367 0,2304 Renda de R$ 5,000 a 10,000 239 0,1500 Não fumam 1.322 0,8299 Não Praticantes de Atividades Físicas (n=29.948) Característica Frequência Proporção 40 a 49 anos 6.290 0,2104 Renda de R$ 5,000 a 10,000 5.990 0,2000 Não fumam 23.360 0,7800
  4. 4. TESTES DE HIPÓTESES para DUAS amostras A pergunta que fica é: Podemos concluir que existe uma proporção significativamente maior de pessoas que praticam ou não atividades físicas entre 40 e 49 anos, com renda entre 5 a 10 mil e que não fumam? Deve-se, diante desses elementos fazer alguns questionamentos com relação a amostra que será observado a seguir.
  5. 5. TESTES DE HIPÓTESES para DUAS amostras Antes devemos verificar se as amostras são ou não independentes. Duas amostras serão consideradas independentes se a amostra selecionada de uma das populações não é relacionada à amostra da segunda população. Elas podem ser consideradas dependentes se cada informação de uma amostra corresponde a um membro da outra amostra. Amostras dependentes também são chamadas de amostras emparelhadas ou amostras relacionadas. Diferença entre médias (amostras grandes e independentes)
  6. 6. TESTES DE HIPÓTESES para DUAS amostras Já foi frisado que trabalhar com a população é algo trabalhoso, cansativo e demorado, por esse motivo inferimos sobre amostras. Teste de médias visa identificar se amostras diferentes possuem comportamentos ou características semelhantes. Para visualizar essa diferença podemos assumir que não há diferenças na médias das duas populações, ou seja 𝜇1 − 𝜇2 = 0, evidentemente que expressando isso para amostras teríamos 𝑥1 − 𝑥2. Imagine que tenhamos os seguintes resultados: Diferença entre médias (amostras grandes e independentes)
  7. 7. TESTES DE HIPÓTESES para DUAS amostras A situação anterior pode ser representada no gráfico da normal a seguir. A situação a que se segue tem a característica de mostrar 𝜇1 − 𝜇2 = 0. Pelo gráfico verifica-se que seja bem improvável obter médias amostrais que se difiram por 4 minutos se a diferença real é zero. A diferença amostral entre médias seria de mais de 2,5 desvios padrões da diferença hipotética de 0! Então podemos concluir que existe uma diferença significativa na quantidade de tempo que estudantes universitários do sexo masculino e do sexo feminino passam conectados no dia. Diferença entre médias (amostras grandes e independentes)
  8. 8. TESTES DE HIPÓTESES para DUAS amostrasDiferença entre médias (amostras grandes e independentes)
  9. 9. TESTES DE HIPÓTESES para DUAS amostras Já sabemos como são formadas as hipóteses nulas e alternativas. Lembrando sempre que as alternativas de hipóteses abrangem: TESTE Z DE DUAS AMOSTRAS PARA A DIFERENÇA ENTRE MÉDIAS O que devemos verificar então seria: 1. As amostras devem ser selecionadas aleatoriamente 2. As amostras devem ser INDEPENDENTES 3. Cada tamanho de amostra deve ser pelo menos 30 ou, se não, cada população deve ter uma distribuição normal com o  conhecido. Diferença entre médias (amostras grandes e independentes)
  10. 10. TESTES DE HIPÓTESES para DUAS amostrasDiferença entre médias (amostras grandes e independentes)
  11. 11. TESTES DE HIPÓTESES para DUAS amostras Então podemos proceder com o teste da seguinte forma: 𝑧 = 𝐷𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎 − 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 ℎ𝑖𝑝𝑜𝑡é𝑡𝑖𝑐𝑎 𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 Assim formalmente o teste z para duas amostras para grandes amostras (n>30), e considerando que as amostras são independentes será dado por: 𝑧 = 𝑥1 − 𝑥2 − 𝜇1 − 𝜇2 𝜎𝑥1− 𝑥2 Com 𝜎𝑥1− 𝑥2 = 𝜎1 𝑛1 + 𝜎2 𝑛2 Diferença entre médias (amostras grandes e independentes)
  12. 12. TESTES DE HIPÓTESES para DUAS amostrasDiferença entre médias (amostras grandes e independentes)
  13. 13. TESTES DE HIPÓTESES para DUAS amostras Exemplo: Teste z de duas amostras para diferenças de médias. Um grupo de cartão de crédito quer testar se a diferença entre a média de cartões de débito das famílias do Rio de Janeiro e de São Paulo. O resultado da amostra aleatória de 250 famílias para cada estado são mostradas na tabela abaixo: As duas amostras são independentes. Assuma que 𝜎1 = 𝑅$ 1.045 para Rio de Janeiro e 𝜎2 = 𝑅$ 1.350 para São Paulo. Os resultados suportam a afirmação do grupo? Teste a 𝛼 = 0,05 Diferença entre médias (amostras grandes e independentes)
  14. 14. TESTES DE HIPÓTESES para DUAS amostras As hipóteses nula e alternativa são: Pelo fato de o teste de bicaudal e o nível de significância ser de 5%, os valores críticos serão −𝑧0 = −1,96 𝑒 𝑧0 = 1,96 . A região de rejeição será 𝑧 < −1,96 𝑒 𝑧 > 1,96. A estatística de teste padronizada será: Diferença entre médias (amostras grandes e independentes) Intepretação: Não há evidência a 5% de significância sobre a afirmação do grupo que exista diferença entre o uso do cartão de débito das famílias do Rio e São Paulo.
  15. 15. TESTES DE HIPÓTESES para DUAS amostras Se o pressuposto de que as duas distribuições sã normais, então podemos usar o teste de diferença de médias para populações menores que 30 observações. Porém o que será retratado agora é de que ambas devem ser independentes. Dessa forma: 1. Os desvios padrões populacionais são desconhecidos; 2. As amostras devem ser selecionadas aleatoriamente; 3. As amostras são independentes. 4. As populações são normalmente distribuídas ou cada tamanho da amostra é de pelo menos 30. Diferença entre médias (amostras pequenas e independentes)
  16. 16. TESTES DE HIPÓTESES para DUAS amostras
  17. 17. TESTES DE HIPÓTESES para DUAS amostras Assim os requisitos para o teste t serão: Diferença entre médias (amostras pequenas e independentes)
  18. 18. TESTES DE HIPÓTESES para DUAS amostras
  19. 19. TESTES DE HIPÓTESES para DUAS amostras Exemplo: Teste t de duas amostras para diferença entre médias O resultado de um teste matemático para amostras aleatórias simples de estudantes para dois professores diferentes na mesma escola é mostrado abaixo: Podemos concluir que existe uma diferença na média das notas de matemática dos estudantes para os dois professores? Use 𝛼 = 10%. Assuma que as populações são normalmente distribuídas para os dois professores. Diferença entre médias (amostras pequenas e independentes)
  20. 20. TESTES DE HIPÓTESES para DUAS amostrasDiferença entre médias (amostras pequenas e independentes) No nível de significância de 10% não existe evidências que de suporte para a afirmação de que a média das notas de matemática dos estudantes sejam diferentes para os dois professores
  21. 21. TESTES DE HIPÓTESES para DUAS amostras Exemplo: teste t para duas amostras para a diferença entre médias A Renaut supõe o custo médio operacional por Km de um sedã é menor que o custo de seu principal concorrente. Você é contratado para conduzir um estudo usando uma amostra aleatória de 30 sedãs da empresa Renaut e 32 amostras (aleatórias) do concorrente. Os resultados podem ser observados na tabela abaixo: A 𝛼 = 0,05, podemos afirmar a hipótese da Renaut? Assuma que as variâncias das populações são iguais. Diferença entre médias (amostras pequenas e independentes)
  22. 22. TESTES DE HIPÓTESES para DUAS amostrasDiferença entre médias (amostras pequenas e independentes)
  23. 23. TESTES DE HIPÓTESES para DUAS amostras A 5% de significância, podemos afirmar estatisticamente que existe evidência de que a afirmação da Renaut está correta que o custo operacional do sedã deles é menor que o concorrente. Diferença entre médias (amostras pequenas e independentes)
  24. 24. TESTES DE HIPÓTESES para DUAS amostras Quando as amostras são dependentes Nessa situação devemos utilizar um procedimento diferente e encontrar uma diferença entre médias para dados emparelhados dado por 𝑑 = 𝑥1 − 𝑥2 A estatística do teste é a média 𝑑 dessas diferenças: 𝑑 = 𝑑 𝑛 As seguinte condições devem ser satisfeitas: 1. As amostras devem ser selecionadas aleatoriamente 2. As amostras devem ser dependentes 3. Ambas populações devem ser normalmente distribuídas. Diferença entre médias (amostras dependentes)
  25. 25. TESTES DE HIPÓTESES para DUAS amostras Graficamente o teste se baseará na condição que: Diferença entre médias (amostras dependentes)
  26. 26. TESTES DE HIPÓTESES para DUAS amostras Diferença entre médias (amostras dependentes)
  27. 27. TESTES DE HIPÓTESES para DUAS amostras Diferença entre médias (amostras dependentes)
  28. 28. TESTES DE HIPÓTESES para DUAS amostras O teste t para diferença de médias então será dado por: Diferença entre médias (amostras dependentes)
  29. 29. TESTES DE HIPÓTESES para DUAS amostras Diferença entre médias (amostras dependentes)
  30. 30. TESTES DE HIPÓTESES para DUAS amostras Exemplo: A fabricante de calçados afirma que os atletas podem aumentar suas alturas de salto vertical usando sapatos de treinamento do fabricante. As alturas de salto vertical de oito atletas selecionados aleatoriamente foram medidos. Depois que os atletas usaram os sapatos por 8 meses, suas alturas de salto vertical foram medidas novamente. As alturas de impulsão vertical (em polegadas) para cada atleta são mostrados na tabela abaixo. Diferença entre médias (amostras dependentes)
  31. 31. TESTES DE HIPÓTESES para DUAS amostras A um α = 0,10, há evidência suficiente para apoiar a afirmação do fabricante? Assuma as alturas de salto vertical são normalmente distribuídas. Diferença entre médias (amostras dependentes)
  32. 32. TESTES DE HIPÓTESES para DUAS amostras Diferença entre médias (amostras dependentes) Podemos afirmar que a nível 10% de significância, que existe evidências que dão suporte a afirmação do fabricante.
  33. 33. TESTES DE HIPÓTESES para DUAS amostras Lembrando que as hipóteses serão: Considerando que: 1. As amostras são aleatoriamente selecionadas 2. As amostras são independentes 3. As amostras são grandes ou normalmente distribuídas, lembrando que a regra 𝑛𝑝 ≥ 5 e 𝑛𝑞 ≥ 5 ainda deve ser observada. Caso a hipótese indique 𝒑 𝟏 = 𝒑 𝟐, 𝒑 𝟏 ≤ 𝒑 𝟐 𝒐𝒖 𝒑 𝟏 ≥ 𝒑 𝟐, então 𝒑 𝟏 = 𝒑 𝟐 é assumida a expressão 𝒑 𝟏 − 𝒑 𝟐 = 𝟎 Diferença entre proporções
  34. 34. TESTES DE HIPÓTESES para DUAS amostras Então as possibilidades serão: A hipótese pautando-se em 𝜇 𝑝1− 𝑝2 = 𝑝1 − 𝑝2 O desvio padrão para proporção de duas amostras será: Diferença entre proporções
  35. 35. TESTES DE HIPÓTESES para DUAS amostras Repare que precisamos conhecer a variância da proporção da população calculada. Podemos calcular o peso da estimativa de 𝑝1 𝑒 𝑝2 usando: Onde 𝑥1 = 𝑛1 𝑝1 e 𝑥2 = 𝑛2 𝑝2. Com o peso da estimativa 𝑝, o desvio padrão amostral da distribuição para 𝑝1 − 𝑝2 será Assim o teste z será dado por 𝑧 = 𝑝1 − 𝑝2 − 𝑝1 − 𝑝2 𝑝 𝑞 1 𝑛1 + 1 𝑛2 Diferença entre proporções
  36. 36. TESTES DE HIPÓTESES para DUAS amostras Diferença entre proporções
  37. 37. TESTES DE HIPÓTESES para DUAS amostras Diferença entre proporções
  38. 38. TESTES DE HIPÓTESES para DUAS amostras Exemplo: Um estudo de 150 ocupantes selecionados aleatoriamente em carros de passageiros e 200 ocupantes selecionados aleatoriamente em picapes mostra que 86% dos ocupantes de veículos de passageiros e 74% dos ocupantes em picapes usam cintos de segurança. A um nível de significância de 10%, podemos rejeitar a alegação de que a proporção de ocupantes que usam cintos de segurança é o mesmo para carros de passeio e picapes? Ver dados na tabela abaixo: Diferença entre proporções
  39. 39. TESTES DE HIPÓTESES para DUAS amostras Diferença entre proporções
  40. 40. TESTES DE HIPÓTESES para DUAS amostras Diferença entre proporções Há evidência suficiente a nível de 10% de significância para rejeitar a alegação de que a proporção de ocupantes que usam cintos de segurança é a mesma para carros de passeio e caminhonetes.
  41. 41. APLICAÇÃO NO R (Clique na Figura para ir ao vídeo Prático do R)
  42. 42. PRÓXIMA AULA REGRESSÃO LINEAR SIMPLES

×