2. Teste de Hipótese
Última aula
• Teste para a variância com uma constante;
2 (n 1) / S 2 2
c 2
~ n 1
0
• Teste para a variância de duas populações
(n1 1) S12 2
U
U ~ (n1 1)
2
S12 (n1 1)
2
~ F (n1 1, n2 1)
2
(n2 1) S 2 2 S2 V
V 2
~ (n2 1)
(n2 1)
3. Teste de Hipótese
Última aula
• Comparação de duas populações:
• Planejamento Aleatorizado (amostras independentes)
Pop. 1: Perda de peso dos indivíduos submetidos à dieta A;
(amostra de n1 valores)
Pop. 2: Perda de peso dos indivíduos submetidos à dieta B.
(amostra de n2 valores)
• Planejamento Pareado (amostras dependentes)
Pop. 1: Peso dos indivíduos antes da dieta A
Pop. 2: Peso dos indivíduos depois da dieta A.
(amostra única de tamanho n)
4. Teste de Hipótese
Última aula
• Questões iniciais:
1. As duas populações são normais?
Verificar por gráficos como Box Plot ou Histograma já vistos.
2. As variâncias são iguais ou diferentes?
Realizar o Teste F já visto.
3. As variâncias da população são conhecidas ou desconhecidas?
5. Teste de Hipótese
Última aula – Amostras independentes
• Considerando as duas populações Normais ; variâncias iguais e
desconhecidas temos a estatística de teste pelo teste da Razão de
Verossimilhança:
H 0: A B
H 0: B A
2 2
(YB YA ) ( B ) (n A 1) S A (nB 1) S B
tc A onde Sp
n A nB 2
1 1
Sp
nA nB
6. Teste de Hipótese
Comparação de Duas Populações ou
Tratamentos – Amostras independentes
• Considerando as duas populações Normais ; variâncias diferentes e
desconhecidas temos a estatística de teste pelo teste da Razão de
Verossimilhança:
H 0: 1 2
H 1: 1 2
ni
(Y2 Y1 ) ( 1
2 1) onde Si2 ( yi y j )2
tc nj 1 i
2 2 1
S 1 S2
n1 n2
7. Teste de Hipótese
Comparação de Duas Populações ou
Tratamentos – Amostras independentes
• Considerando as duas populações Normais ; variâncias diferentes e
desconhecidas temos a estatística de teste pelo teste da Razão de
Verossimilhança:
tc tv; /2 tc H1 : B A
• Rejeita-se H0 se:
tc tv; H1 : B A
tc tv; H1 : B A
2
2 2
S 1 S2
• onde n1 n2
v 2 2
2 2
S1 S 2
n1 n2
n1 1 n2 1
8. Teste de Hipótese
Exemplo 1
• Considerando dois diferentes métodos submetidos aleatoriamente a um
grupo de unidades experimentais, deseja-se saber: B é mais eficiente que
A?
Tratamentos
Estatísticas
A B
Amostra ni 8 8
Média y 5,0 7,0
Variância S2 4,0 1,71
y1 j nota do m étodoA
y2 j nota do m étodoB
9. Teste de Hipótese
Comparação de Duas Populações ou
Tratamentos – Amostras dependentes
• Considerando um exemplo de uma nova droga para emagrecimento
proposta com N indivíduos observados com relação ao seu peso inicial.
Após o tratamento com a nova droga o peso é novamente observado.
• A droga pode ser considerada eficiente?
• Hipótese Científica:
H0: A droga não é eficiente
H1: A droga é eficiente
y1 j peso antes da droga j 1,...n
y2 j peso depoisda droga
• Para os testes é considerada a diferença entre antes depois do
tratamento e quanto mais distante de zero, maior a presença do efeito
do tratamento em estudo.
10. Teste de Hipótese
Comparação de Duas Populações ou
Tratamentos – Amostras dependentes
• Então, podemos definir:
dj y2 j y1 j j 1,...n
• Suposição:
2
d j ~ N( d; d )
• Hipóteses a serem testadas
H 0: d 0
H 1: d 0
H 1: d 0
H 1: d 0
11. Teste de Hipótese
Comparação de Duas Populações ou
Tratamentos – Amostras dependentes
• A estatística de teste para as hipóteses é
d
td ~ tn 1
Sd
n
• onde
n n
1 1
d di Sd (d i d )2
n i 1 n 1i 1
12. Teste de Hipótese
Comparação de Duas Populações ou
Tratamentos – Amostras dependentes
• Rejeita-se H0 se
i)
ii)
iii)
• Se quiséssemos calcular um IC:
Sd
IC( d ;1 ): d t /2
n
13. Teste de Hipótese
Exemplo 2:
• Já foi dito que ouvir Mozart melhora o desempenho dos alunos em
testes. Na história “Floral Scents and Learning”, os pesquisadores
questionam cheiros agradáveis tem efeito semelhante. Vinte e um
sujeitos resolveram um labirinto de papel e lápis enquanto usavam uma
máscara que não tinha nenhum perfume ou tinha um aroma floral. A
variável resposta é o tempo médio deles em 3 ensaios.
• O experimento analisou o tempo médio sem perfume e o tempo médio
com perfume para cada sujeito. Na tabela consta as diferenças dos
tempos médios com perfume menos o tempo médio sem perfume.
14. Teste de Hipótese
Exemplo 2:
-7,37 -10,48 14,30 -10,77
-3,14 -0,87 -24,57 24,97
4,1 8,7 16,17 -4,47
-4,4 2,94 -7,84 11,9
19,47 -17,24 8,6 -6,26
6,67
• O primeiro sujeito por exemplo foi 7,37 segundos mais rápido usando a
máscara perfumada, logo a diferença é negativa. Como tempos mais
curtos representam um desempenho melhor, difereças negativas
mostram que o sujeito teve um melhor desempenho quando usou a
máscara perfumada.
15. Teste de Hipótese
Comparação de Duas Populações ou
Tratamentos – Proporção
• Vimos o teste para a proporção, comparado com uma constante, um
valor fixo. Agora veremos como comparar duas populações quando nos
referimos à proporção.
População Proporção Tamanho Proporção
ou populacional da amostral
Tratamento amostra
1 p1 n1 ˆ
p1
2 p2 n2 ˆ
p2
• Hipóteses a serem testadas:
H 0: p1 p 2
H 1: p1 p 2 p1 p 2 0
H 1: p1 p 2 p1 p 2 0
H 1: p1 p 2 p1 p 2 0
16. Teste de Hipótese
Comparação de Duas Populações ou
Tratamentos – Proporção
• Estatística de teste: ˆ ˆ
p1 p2
Zc
ˆ ˆ ˆ ˆ
p1 (1 p1 ) p2 (1 p2 )
n1 n2
• Rejeita-se H0 se:
i) | Z c | z 2 (teste bilateral)
ii) Z c z (teste unilateralà direita)
iii) Z c z (teste unilateralà esquerda)
i)
ii)
iii)
17.
18. Anova
ANOVA com um fator
Vimos até agora comparações de médias com uma
constante e comparações de médias de duas
populações verificando se eles diferem ou não
significativamente;
Porém, frequentemente existe a necessidade de
comparar mais que duas médias, isto é comparação de
várias populações, vários grupos.
19. Anova
Situação 1
Um estudo foi conduzido, no período de um ano, para
acompanhar três grupos de alunos de Sistemas de
Informação com excesso de peso.
No primeiro grupo, aplicou-se dieta, com redução no
consumo de calorias.
No segundo, a prática de exercícios regularmente.
No terceiro, mantiveram-se os hábitos alimentares e o
nível de atividade física.
A massa corpórea foi mensurada no início e no final do
período. Como avaliar se há alguma evidência de que
exista diferença na variação média da massa corpórea
nessas três populações?
Comparação de Vários Grupos!!
20. Anova
Comparando 3 populações
Grupo Grupo Grupo
A B C
1 , 1 2 , 2 3 , 3
X 1 , s12 X 2 , s22 X 3 , s32
Populações independentes e normalmente distribuídas.
21. Anova
Como Comparar as Médias?
Teste z ou t duas a duas:
3 3!
Para 3 amostras teremos: 2 3 testes
2!1!
6 6!
Para 6 amostras teremos: 15 testes
2 2!4!
22. Anova
Problemas ...
1) A quantidade de testes “explode”, quando a quantidade de
amostras aumenta.
2) A condução de múltiplos testes t para duas amostras, duas a
duas, pode levar a uma conclusão incorreta!
Suponha que 1 2 3 e = 0,05 em cada teste t. Então:
p(conclusão correta em todos os testes) = (0,95)3 = 0,857 e
p(rejeitar H0 em pelo menos um teste) = 1 - 0,857 = 0,143.
Portanto, ao realizar múltiplos testes t, aumentamos a chance de
cometer um Erro Tipo I !!
3) Uma vez que os testes são conduzidos com o mesmo
conjunto de dados, eles não são mais todos independentes.
23. Anova
Deseja-se um teste para comparar as
diversas médias, no qual a probabilidade
de cometermos um Erro Tipo I seja igual a
algum valor predeterminado .
ANOVA
24. Anova
Conceitos
Estudos observacionais – observação de indivíduos ou
objetos de interesse, mas não procura influenciar as
respostas;
Experimentos – impõe tratamentos aos indivíduos ou
objetos de interesse para observar suas respostas;
Fatores – variáveis explicativas, independentes, ou
controláveis em um experimento que se deseja verificar seu
efeito sob a variável de interesse observada;
Níveis – os diferentes valores que o fator pode assumir no
experimento;
Tratamento – condição experimental específica aplicada
aos sujeitos (combinação dos níveis com cada fator);
Plano – descreve a escolha de tratamentos e a maneira pela
qual os sujeitos são alocados;
25. Anova
Conceitos
Aleatorização usa o acaso para alocar os ‘sujeitos’ aos
tratamentos.
Aleatorização + Comparação evitam o vício, ou
favoritismo sistemático
Quanto mais ‘sujeitos’ pegamos mais
fica sensível a diferença entre os
tratamentos, ou seja, mais fácil de
identificar quais as diferenças.
26. Anova
Conceitos - Exemplo
Um pesquisador está interessado em investigar o efeito
de vários tipos de ração que diferem pela quantidade de
potássio no aumento do peso de determinado tipo de
animal.
Hipótese Científica: Verificar o efeito dos diferentes tipos de ração
para engorda de animais;
Hipótese Estatística: Comparar as médias de ganho de peso obtido
pelos animais submetidos aos diferentes tipos de ração;
Variável independente / Fator – tipo de ração
Níveis – diferentes tipos de ração (ex: tipo de ração A, tipo de ração B)
27. Anova
Conceitos – Exemplo 2
Estudo do efeito de quatro fertilizantes e três variedades
de feijão quanto à sua produção.
Hipótese Científica: Verificar o efeito dos diferentes tipos de
fertilizantes e diferentes tipos de feijão quanto à produção;
Hipótese Estatística: Comparar as médias de produção obtidas;
Variável independente / Fator – 1) tipo de fertilizante 2) tipo de feijão;
Níveis – 1) diferentes tipos de fertilizante (A, B, C e D); 2) diferentes
tipos de feijão (alpha, beta, gama);
Tratamentos – (A, alpha), (A, beta), (A, gama), (B, alpha), (B, beta),
(B, gama), (C, alpha), (C, beta), (C, gama), (D, alpha), (D, beta), (D,
gama) (12)
28. Anova
Conceitos
1. Uma indústria de parafusos adquiriu 5 máquinas de uma determinada
marca para produzir parafusos, e está interessada em realizar um
experimento para investigar se as 5 máquinas são homogêneas com
relação à resistência média dos parafusos por ela produzidos.
2. A indústria das máquinas acima está interessada em realizar um
experimento para investigar se as máquinas produzidas por ela são
homogêneas com relação à resistência média dos parafusos que estas
máquinas vão produzir. Como a população das máquinas produzidas é
muito grande, o pesquisador quer realizar o experimento com uma
amostra de máquinas (5), mas as conclusões devem ser tomadas para
toda a população.
29. Anova
Conceitos
No item 1 máquina é um efeito fixo e no item 2 é um
efeito aleatório;
Refere-se aos
níveis
Refere-se à
população de
níveis
30. Anova
Procedimento de aleatorização
Experimentos completamente aleatorizados
Tratamentos atribuídos aleatoriamente à todas as
unidades experimentais (cada u.e. tem igual
probabilidade de receber qqr um dos tratamentos)
Experimentos com restrição na aleatorização
As u.e. apresentam uma fonte de variabilidade que pode
influenciar nos resultados de sua execução. (Blocos)
31. Anova
Tipos de Experimentos
Experimentos com uma única fonte de variação: ONEWAY (com
um fator)
Exemplo: Comparar a produtividade de 4 novas variedades de feijão;
Fonte de variação – variedades de feijão / Tratamentos: variedades A,
B, C e D
Experimentos com duas ou mais fontes de variação: FATORIAIS
(dois ou mais fatores)
Exemplo: Numa determinada indústria química deseja-se verificar
qual a combinação de adubo e inseticida maximiza a produção de
uma dada cultura. Fonte de variação: A-Adubos: A1,A2 e A3 ;
B-Inseticidas: B1 e B2 / Tratamentos: A1B1, A1B2, A2B1, A2B2, A3B1,
A3B2 FATORES
CRUZADOS
32. Exemplo
Um experimento foi conduzido com a finalidade de
comparar os tempos de transmissão de dados de
quatro servidores (A, B, C e D). Os dados abaixo
referem-se ao tempo de transmissão de dados em
milissegundos dos servidores.
Servidores
A B C D
64 78 75 55
72 91 93 66
68 97 78 49
77 82 71 64
56 85 63 70
95 77 76 68
Total 432 510 456 372 1770
Média 72 85 76 62 73.75
33. Exemplo
Desenho esquemático do tempo de transmissão de cada servidor
Existe uma forte suspeita de
que há diferença entre os
quatro servidores.
Distribuições assimétricas.
Valor discrepante.
34. 1-2 A Análise de Variância
Para descrever situações com apresentado neste exemplo, adota-se um modelo do tipo:
y ij μi ε ij μ τ i ε ij i=1,2,...,4,
j=1,2,...,6
μi
yij= é o j-ésimo tempo de transmissão do i-ésimo servidor
ié média do i-ésimo servidor
é uma constante para todas as observações (média geral);
i é o efeito do i-ésimo servidor;
ijé o erro aleatório(erros de medida, fatores não controláveis,
diferenças entre as unidades experimentais, etc.).
Objetivo: testar se existe diferenças nos tempos médias de transmissão entre
a=4 servidores.
Hipóteses: H0: 1= 2=...= 4 =
Ha: i ᵥ para pelo menos um par (i,v) ,
(i≠v= 1, 2,..,4)
35. 1-2 A Análise de Variância
Em geral
Tabela 1-2 Dados gerais de um experimento com um único fator
Tratamentos Observações Totais Médias
(níveis)
1 y11 y12 . . . y1r y1. y1
2 y21 y22 . . . y2r y2. y2
. . . . . . . . .
. . . . . . . . .
a ya1 ya2 . . . yar ya. ya
35
36. Modelo estatístico (one-way):
y ij μi ε ij μ τ i ε ij i=1,2,...,a,
j=1,2,...,r
μi
yij= é a j-ésima observação do i-ésimo tratamento;
ié média do i-ésimo tratamento
é uma constante para todas as observações (média geral);
i é o efeito do i-ésimo tratamento;
ijé o erro aleatório(erros de medida, fatores não controláveis,
diferenças entre as unidades experimentais, etc.).
Pressuposições: 1) os erros aleatórios são independentes;
2) os erros aleatórios são normalmente distribuídos;
3) os erros aleatórios tem média 0 (zero) e variância 2;
2
Ou, então: yij ~ N ( i; ) e independen
tes
36
37. 1-3 Análise de Variância
Hipóteses: H0: 1= 2=...= a =
Ha: i ᵥ para pelo menos um par (i,v)
Equivalentemente
Hipóteses: H0: 1= 2=...= a =0
Ha: i 0 para pelo menos um i
37