SlideShare uma empresa Scribd logo
1 de 27
ANOVA 2 fatores (two-way)
Introdução♥
Em muitos trabalhos, que envolvem a realização de experimentos, é comum os
pesquisadores se depararem com a questão: como avaliar se os resultados obtidos são
confiáveis? Sabemos que qualquer medida realizada é sempre afetada por erros. Erros muito
pequenos não trarão grandes implicações. Contudo, se forem significativos, poderão prejudicar
seriamente os resultados levando a falsas conclusões. Portanto conhecer a natureza dos erros e
preparar planejamentos que possam minimizá-los é uma estratégia que deve estar presente no
dia-a-dia de todo pesquisador.
Existem dois tipos de erros, o erro sistemático e o erro aleatório. O primeiro tem como
característica afetar os resultados dos experimentos sempre na mesma direção, seja para mais
ou para menos. Um exemplo simples deste tipo de situação é o caso de uma balança
descalibrada que pode indicar sempre massas maiores que as reais. Mas vale notar que os erros
sistemáticos podem ser identificados e, portanto, evitados. Por outro lado, há um tipo de erro
que afeta as medidas sem nenhuma tendência clara. As medidas podem oscilar, ora para mais,
ora para menos. Este tipo e erro é chamado de erro aleatório e, infelizmente, sempre estará
presente em maior ou menor grau.
Ao fazer um estudo é sempre interessante fazer replicatas, repetições, pois permite que o
erro presente nas medidas seja investigado. Além disso, com a realização de várias replicatas
aumentam as chances de se aproximar mais do valor exato. Isto é evidenciado por um
importante princípio da estatística: o teorema do limite central, que comprova que o erro no
valor médio é menor que o erro de uma observação individual (referência: Barros Neto, B,
Scarminio, I.S., Bruns, R.E. Como fazer experimentos: pesquisa e desenvolvimento na ciência e na indústria.
Ed. da Unicamp; Campinas, 2001).
Muitas vezes as características do procedimento experimental dificultam muito a
execução de replicatas autênticas. Não é correto simplesmente realizar duas medidas do
mesmo experimento de forma seqüencial, pois um erro que afetar a primeira medida
certamente irá, de forma sistemática, afetar a seguinte.

nessa introdução as idéias expostas foram copiadas do artigo: Conseqüências da análise incorreta de experimentos
blocados, sob autoria de João Alexandre Bortoloti e Roy Edward Bruns. Artigo publicado na revista Química Nova, vol.
30, nº 2, págs. 436-440, 2007.
Não são raros os casos em que o ajuste das condições experimentais é extremamente
trabalhoso ou lento. Portanto, parece haver um dilema, realizar medidas com duplicatas e arcar
com o custo do trabalho envolvido, mas garantir a qualidade das medidas, ou evitar um grande
esforço no laboratório, mas correr o risco de ter todo o seu trabalho prejudicado. É neste
contexto que surge uma interessante possibilidade, a blocagem dos experimentos.
continuação da aula sobre Anova 1 fator
Ao analisar os dados classificados em dupla-entrada, temos de aplicar o método da
classificação 1 fator duas vezes: - uma vez para cada sistema de classificação. Em resumo, a
anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na linha).
Veremos a aplicação desse método (anova 2 fatores) em dois tipos de delineamentos:
CRD e CRBD sob presença ou ausência de repetições, replicatas. Por repetição (replicata) se
entende um teste completo de todos os tratamentos no experimento (a replication is a
complete run for all treatments to be tested in the experiment).
1º) experimento inteiramente ao acaso (completely randomized design, CRD) sem
repetições;
2º) experimento em blocos ao acaso (randomized complete block design (CRBD) sem
repetições;
3º) experimento em blocos ao acaso (CRBD) com repetições;
4º) experimento inteiramente casualizado (CRD) com repetições.
2
1º) CRD. Experimento inteiramente ao acaso♣
, sem repetições.
Exemplo 1.
Por exemplo, 12 jovens foram classificados em três grupos de acordo com a idade deles.
Ao mesmo tempo eles foram classificados de acordo com o sexo em dois grupos: masculino e
feminino. Assim, cada jovem esteve sujeito a dois sistemas de classificação simultaneamente,
Tabela 1.
Tabela 1. Dados obtidos no experimento tipo CRD.
colunas
linhas
1 2 3 4 total
linha
média
linha
efeito
linha
1 6 2 9 3 20 5 -2
2 8 9 11 12 40 10 +3♥
3 4 4 10 6 24 6 -1
total coluna 18 15 30 21 84
média coluna 6 5 10 7 7
efeito coluna -1♠
-2 +3 0 0
♠
(-1) = efeito coluna = média coluna 1(=6) – média geral (=7)
♥
(+3) = efeito linha = média linha 2(=10) – média geral (=7)
Análise dos dados segundo a classificação do fator “linha”.
anova 1 fator.
SQ linha = 4{(-2)2
+ (3)2
+ (-1)2
} = 56
Análise dos dados segundo a classificação do fator “coluna”.
anova 1 fator.
SQ coluna = 3{(-1)2
+ (-2)2
+ (3)2
+(0)2
} = 42
Cálculo da Soma de Quadrados Total
SQ Total*= ∑x2
– (∑X)2
/ n =
* dedução dessa fórmula = SQ = ∑(x-μ)2
= ∑(x2
-2xμ +μ2
) = ∑(x2
)-2μ∑x +∑(μ2
)= ∑x2
-2μ2
n +n μ2
=∑x2
- nμ2
=
∑x2
- n(∑x)2
/ n2
= ∑x2
–(∑x)2
/ n que é a forma usual do cálculo da soma de quadrados total.
{(52
+22
+92
+32
+82
+92
+112
+122
+42
+42
+102
+62
)-(5+2+9+3+8+9+11+12+4+4+10+6)2
/ 12 }=
SQTotal = 120
Cálculo da Soma de Quadrados Resíduo (há dois métodos)
a) por meio da diferença (método mais fácil)

Denomina-se experimento inteiramente ao acaso quando os tratamentos (fatores) são designados às unidades
experimentais sem qualquer restrição. Esse tipo de delineamento só pode ser conduzido quando as unidades experimentais
(corpos-de-prova, pessoas, etc...) são similares. Por similares deve-se entender: não no sentido de igualdade, mas no
sentido de que essas unidades respondem ao tratamento da mesma forma.
3
SQ Total = SQ LINHA + SQ COLUNA + SQ RESÍDUO
assim, SQ RESÍDUO = SQ Total – (SQ LINHA + SQ COLUNA)
SQ RESÍDUO = 120 – (56+42) = 120 – 98 = 22
b) por meio do cálculo direto (método mais trabalhoso)
22
+(-1) 2
+12
+(-2)2
+(-1)2
+12
+(-2)2
+22
+(-1)2
+02
+12
+02
= 4+1+1+4+1+1+4+4+1+0+1+0 = 22
Cálculo dos Graus de Liberdade (gl)
Fator Linha = Blocos = b-1 e no nosso exemplo é 3 – 1 = 2
Fator Coluna = G-1 e no nosso exemplo é 4 – 1 = 3
Total é N-1 e no nosso exemplo é 12 – 1 = 11
Resíduo é ( N-1 ) - [ (B-1) +(G-1) ] = ( BK-1 ) - [ (B-1) +(G-1) ] = (B-1)(G-1)
e no nosso exemplo o gl resíduo é igual a 11-(2+3) = 6 = (3-1)(4-1) = (2)(3)
Tabela 2. ANOVA 2 fatores para os dados da Tabela 1.
Efeito
(ou fonte de
variação)
gl SQ QM razão F p-valor
Linhas 3-1= 2 56 56/2= 28 28/3,67= 7,64 0,0224150*
Colunas 4-1=3 42 42/3= 14 14/3,67= 3,82 0,0764059
Resíduo 6 22 22/6= 3,67
Total 12-1= 11 120
*p<0,05
Conclusão. Apenas o efeito fator (Linhas) é estatisticamente significante. Os valores médios dos
três níveis diferem. Há pelo menos uma diferença entre as três médias. Não temos condições, por meio
do teste anova, de dizer se a diferença se encontra entre a linha 1 e a linha 2 ou entre a 1 e a 3 ou entre
a 2 e a 3. O teste de comparação múltipla de Tukey, por exemplo, poderá nos indicar qual desses três
pares de médias apresenta diferença estatística.
..................................................................................................................
4
2º) CBRD. Experimento em blocos ao acaso•
, sem repetições.
Vamos considerar, agora, os experimentos casualizados. Nesse delineamento os
tratamentos são designados às unidades experimentais com certa restrição: são sorteados
dentro de cada bloco.
Neste item ao considerar os CBRD vamos estudar os casos sem repetição, ou seja, com
apenas uma aplicação dos tratamentos às unidades experimentais.
Para a análise dos dados em planejamentos desse tipo, convém recordar o que foi dito
anteriormente: “ao analisar os dados classificados em dupla-entrada, temos de aplicar o
método da classificação 1 fator duas vezes: - uma vez para cada sistema de classificação. Em
resumo, a anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na
linha)”.
Quando as unidades experimentais não são similares, devia ser intuitivamente claro que
as variações nas unidades por si mesmas poderiam ofuscar (obscurecer) os verdadeiros efeitos
do tratamento. O método de blocagem considera forma de avaliar as unidades heterogêneas
em todos os tipos de experimentação.

O CBRD é um delineamento no qual as unidades - às quais os tratamentos são aplicados - são subdivididas em grupos
homogêneos (chamados de blocos), de modo que o número de unidades em um bloco seja igual ao número (ou algum
múltiplo do número) de tratamentos que esteja sendo estudado. Os tratamentos são então designados ao acaso às unidades
experimentais dentro de cada bloco. Deve-se enfatizar que cada tratamento aparece em cada um dos blocos, e cada bloco
recebe cada um dos tratamentos em estudo. Assim, cada um dos blocos inclui todos os tratamentos. Dentro de cada bloco
os tratamentos são atribuídos às parcelas inteiramente ao acaso. Para que o experimento seja eficiente (aumente em
precisão, diminuição da variância erro ou resíduo), deverá cada bloco ser tão uniforme quanto possível, mas os blocos
poderão diferir bastante uns dos outros.
O pesquisador só deve optar por experimento tipo CRD quando dispõe de número suficientemente grande de unidades
experimentais similares. Como isso nem sempre acontece na prática, é preciso um delineamento que permita comparar
adequadamente os tratamentos, mesmo que as unidades apresentem certa heterogeneidade. Unidades similares são
agrupadas (dá-se o nome de blocos a esse conjunto de unidades similares). Os experimentos em blocos ao acaso surgiram
na área agrícola. O campo era dividido em blocos e os blocos eram divididos em parcelas que recebiam os tratamentos
(adubo, por exemplo) em investigação. Então o termo bloco designava originalmente, uma faixa de terra de mesma
fertilidade. Esse tipo de delineamento surgiu em 1925 na Inglaterra por R. A. Fisher que foi, também, o idealizador do
método ANOVA.
O bloco pode ser uma faixa de terra, uma ala de estufa, um período de tempo, uma ninhada, uma partida de produtos
industriais, uma faixa de idade – tudo depende do que está em experimentação. O CBRD pode ser empregado de forma
muito eficiente quando um experimento deve ser efetuado em mais de um laboratório (blocos) ou quando vários dias
(blocos) são necessários para a sua realização.
O essencial é que os blocos reúnem unidades similares e que haja variabilidade entre blocos. Não teria sentido organizar
esses blocos se não houvesse variabilidade entre eles. Quem vai decidir se a variabilidade entre as unidades justifica ou não
a formação de blocos é o pesquisador, não o estatístico. Embora o bloco deva reunir unidades similares, isso não significa
que essa reunião deva ser física. Por exemplo, se um médico pretende comparar duas drogas hipotensoras, A e B, e
considerar que a pressão arterial do paciente, no início do tratamento, é importante na resposta do paciente à droga, deve
organizar blocos. Cada bloco será formado por um par de pacientes com pressões arteriais similares, mas, para formar os
blocos, o médico não precisa colocar seus pacientes em fila, nem juntá-los aos pares. Basta reunir os dados numéricos.
Dois pacientes do mesmo bloco não precisam nem mesmo se conhecer.
O objetivo do CBRD é isolar e remover do termo resíduo (erro) a variação atribuível aos blocos, aumentando assim a
precisão do experimento sem aumentar o número de unidades experimentais.
5
Historicamente, os blocos casualizados é o primeiro delineamento válido para estimar o
erro experimental e testar a significância dos efeitos de tratamento apesar da heterogeneidade
das unidades experimentais sobre as quais as observações são realizadas. Esse delineamento
revolucionou os experimentos na agricultura no mundo todo. Não seria um exagero afirmar
que ele é ainda a espinha dorsal do delineamento da ciência experimental. Porém, nenhum
delineamento torna-se popular e aceito para uso geral, não importa quão bem fundamentado do
ponto de vista estatístico que ele seja, se for complicado e difícil de empreendê-lo. A beleza
desse planejamento em blocos é a feliz combinação de validade, simplicidade e flexibilidade.
O planejamento em blocos consiste de duas etapas. A primeira é a de coletar, reunir, as
unidades afins, similares para juntas formarem um grupo homogêneo; esse grupo formado é
chamado de bloco. Essa operação é conhecida como blocagem. A segunda etapa é a de
designar os vários tratamentos ao acaso às unidades dentro de cada bloco. Essa é a principal
diferença entre o delineamento em blocos e o delineamento inteiramente casualizado. Em
termos de casualização pode-se considerar que, em blocos, há uma restrição.
Veremos, a seguir, a aplicação desse método para um experimento onde a unidade
experimental é “a pessoa que vira bloco”. Ela recebe, sob aplicação aleatória, dois tratamentos
A e B. Convém recordar que, experimentos desse tipo, onde a unidade experimental é a pessoa
que recebe todos os tratamentos em comparação, é um caso especial de experimento em blocos
casualizados♠
. “Toda vez que a pessoa que participa do experimento recebe todos os
tratamentos em comparação, essa pessoa é um bloco – não uma unidade”. Esse tipo de
experimento é muito criticado. Por exemplo, a diferença que se mede na pessoa, antes e depois
de uma série de exercícios físicos, só seria explicada pelos próprios exercícios físicos? De
qualquer forma, são feitos experimentos em que cada pessoa é um bloco. O pesquisador
precisa apenas estar alerta para o fato – que é possível – de a pessoa se modificar por qualquer
outro motivo, que não o tratamento. Embora os experimentos em que se toma cada indivíduo
como bloco sejam bastante comuns é preciso muito senso crítico para planejá-los. Muitas
vezes esses experimentos não têm qualquer validade.
O pesquisador planeja um experimento em blocos ao acaso quando pretende eliminar
uma causa de variação. Por exemplo, para testar o efeito de um hormônio sobre o crescimento

Muitas idéias aqui apresentadas foram selecionadas do livro: Estatística Experimental. Autores: S. Vieira & R.
Hoffmann. Ed. Atlas. Ano 1989.
6
de ratos – se os ratos disponíveis são de diferentes idades – o pesquisador deve organizar
blocos que correspondam às idades.
Os blocos também ampliam a validade da conclusão. Por exemplo, se um entomologista
quer comparar a eficiência de diversos inseticidas, tanto pode usar insetos de uma única
espécie como fazer a comparação usando insetos de várias espécies. O experimento seria em
blocos ap acaso se cada espécie fosse um bloco. Os blocos teriam a vantagem de ampliar a
validade da conclusão. Isto porque o entomologista poderia, com base em um só experimento,
estabelecer conclusões para várias espécies.
Em termos de eficiência, ou seja, de uma comparação de tratamentos qual seria o melhor
delineamento: CRD ou CBRD? Qual seria a conseqüência de uma má escolha? Para responder
temos de considerar o número de graus de liberdade do resíduo. Vamos, então, realizar uma
comparação entre o número de graus de liberdade do resíduo de um experimento CRD frente a
um experimento tipo CRBD. Na tabela ANOVA obtém-se um valor igual a (k-1)(r-1) para um
experimento em blocos; enquanto, para um experimento CRD, o gl do resíduo será igual a k(r-
1), onde r é o número de réplicas (ou repetições). Se k for igual a 3 e r = 20, então, o gl de
resíduo do CBRD seria igual a (3-1)(20-1) = 2 x 19 = 38 e o gl do CRD seria igual a 3(20-1) =
3 x 19 = 57. Essa diferença de 57 – 38 = 19 representa r-1 graus de liberdade, em geral.
Em termos de notação, temos inicialmente no CRD k(r-1) e depois no CBRD (k-1)(r-1),
isto é,
k(r-1) – (k-1)(r-1) = r-1 graus de liberdade a menos sob a escolha de um possível mau
delineamento. Como o valor de F na tabela (F, de valores críticos) aumenta quando diminui o
número de graus de liberdade de resíduo, é fácil entender que o uso indevido de blocos torna o
teste menos sensível.
Fcalculado = QM Trat / QM resíduo ; assim, quanto menor ↓Fcalc e maior o ↑F tabela mais difícil
para que se estabeleça a condição de rejeitar Ho, ou seja, de que Fcalc > F tabelado .
QM resíduo = SQ res / gl res ; assim, quanto menor ↓gl res implica ⇒ aumento de↑ QM resíduo
que traz como conseqüência uma diminuição de ↓ Fcalc.
7
Exemplo 1. Experimento em blocos (CBRD), sem repetições.
Numa pesquisa sobre o efeito do óleo de milho no teor de colesterol do sangue, o médico
Dr. Bem Hur obteve os seguintes dados, de 7 pacientes, Tabela 3.
Tabela 3. Teor de colesterol no sangue, em mg por 100g, de sete pacientes.
Pacientes
Tratamentos (dois tipos de dietas) Totais dos blocos Médias dos
blocosA B
1 270 175 445 222,5
2 410 308 718 359,0
3 350 248 598 299,0
4 360 231 591 295,5
5 350 196 546 273,0
6 430 190 620 310,0
7 268 252 520 260,0
Totais de Tratamentos 2438 1600
Médias de Tratamentos 348,286 228,571
A análise é feita tomando-se os pacientes como blocos. Para casos desse tipo, pode-se
dizer em termos gerais, que é a mesma análise dos delineamentos tipo ANOVA de medidas
repetidas e, nesse especial caso, é a mesma análise que se obtém com o teste t-Student de
amostras pareadas (estatística t = 4,66; vale a relação estatística F da anova é igual ao valor da
estatística t-Student ao quadrado, ou seja, F = t2
= 4,662
= 21,71).
Pelo mesmo procedimento do caso anterior obtém-se o seguinte resultado do teste
ANOVA 2 fatores, Tabela 4.
Tabela 4. ANOVA 2 fatores pata os dados da Tabela 3.
Efeito
(ou fonte de
variação)
gl SQ QM razão F p-valor
Blocos 7-1= 6 22000,40 22000,40/6= 3666,70
Tratamentos 2-1=1 50160,30 50160,30/1= 50160,30 50160,30/2310,
50= 21,71
0,003*
Resíduo 6 13862,70 13862,70/6= 2310,50
Total 14-1= 13 86023,40
*p<0,05
Conclusão. O efeito fator Tratamento (colunas) é estatisticamente significante. Os valores
médios dos dois níveis diferem (A: 348,3±62,2mg; B: 228,6±45,9mg). O teste de comparação múltipla
de Tukey, não precisa ser efetuado porque são apenas dois níveis do fator Tratamento. O cálculo de F
8
para blocos é desnecessário. Os experimentos tipo CRBD são feitos, essencialmente, para comparar
tratamentos – a comparação de blocos é secundária.
Exemplo 2. Experimento em blocos (CBRD), sem repetições.
Um experimento foi delineado para estudar o desempenho de quatro diferentes
detergentes de tecidos de roupas. Os seguintes índices de limpeza, Tabela 5, foram obtidos
(maior o índice maior a limpeza) por meio de um instrumento especial para três diferentes
tipos comuns de manchas. A hipótese da pesquisa é saber se há diferença entre os detergentes?
Tabela 5. Índice de limpeza de 12 tecidos manchados segundo tipo de detergente e tipo
de mancha.
Manchas
Detergentes Total (média: x )
1 2 3 4
1 45 47 48 42 182 (45,50)
2 43 46 50 37 176 (44,00)
3 51 52 55 49 207 (51,75)
Total
(média: x )
139 145 153 128 565
46,333 48,333 51,000 42,667
média geral:
565/12 = 47,083
Resolução
Vamos aplicar a mesma fórmula, porém, com outra forma♣
, mais direta, para se obter
as somas de quadrados entre grupos (referente às colunas e/ou às linhas).
SQE = (∑T2
/n) - (FC); onde T... é o total da coluna (ou linha); n ... é o tamanho da
amostra e FC é o chamado fator de correção dado pela soma dos valores ao quadrado
dividido pelo tamanho amostral total, ou seja, FC = (∑x)2
/ N.
Análise dos dados segundo a classificação do fator Detergente “coluna”.
anova 1 fator.
SQ coluna = [ (1392
/3) + (1452
/3) +(1532
/3)+(1282
/3) ]– (182+176+207)2
/12 =
SQ coluna = 26713,000 – 26602,083 = 110,917
Análise dos dados segundo a classificação do fator Mancha “linha” (blocos).
anova 1 fator.
SQ linha = 1822
/4 + 1762
/4 +2072
/4– (182+176+207)2
/12 = 135,167
Cálculo da Soma de Quadrados Total
SQ Total = ∑x2
– FC = ∑x2
– (∑x)2
/ n

SQ = ∑(x-μ)2
= ∑(x2
-2xμ +μ2
) = ∑(x2
)-2μ∑x +∑(μ2
)= ∑x2
-2μ2
n +n μ2
=∑x2
- nμ2
= ∑x2
- n(∑x)2
/ n2
= ∑x2
–
(∑x)2
/ n que é a forma usual do cálculo da soma de quadrados total. Dessa forma usual vem
SQfator coluna = n∑( x -μ)2
= n∑ x 2
–(∑x)2
/ n = n(∑x)2
/n2
–(∑x)2
/ n = (Total)2
/n –(∑x)2
/ n = ∑ (T2
/n) – FC.
9
SQ Total = (452
+432
+512
+472
+462
+522
+482
+502
+552
+422
+372
+492
) – (565)2
/12 = 264,917
SQ Total = 26867,000 – 26602,083 = 264,917
SQ Total = SQ LINHA + SQ COLUNA + SQ RESÍDUO
assim, SQ RESÍDUO = SQ Total – (SQ LINHA + SQ COLUNA)
SQ RESÍDUO = 264,917 – (135,167+110,917) = 264,917 – 246,084 = 18,833
Tabela 6. ANOVA 2 fatores para os dados da Tabela 5.
Efeito gl SQ QM F P
Detergente 3 110,917 36,972 11,78 0,006*
Manchas 2 135,167 67,583
Erro 6 18,833 3,139
Total 11 264,917
*p<0,05
Conclusão: Há diferença estatisticamente significante entre os quatro detergentes.
A hipótese H0(μ1 = μ2 = μ3 = μ4 ) é rejeitada.
Os valores médios diferem!
Teste de comparação múltipla de Tukey (5%) para o efeito Detergente
Por meio do Teste de Tukey (5%) obtém-se o valor HSD
MSW = QM resíduo = 3,139 ; n = 3; q crítico = 4,897; HSD = 5,0095
valores das diferenças a serem comparadas com o valor HSD ou dms.(=5,0095)
Detergente Média 1( x =46,33) 2( x =48,333) 3( x =51)
1 46,333
2 48,333 2,000
3 51,000 4,667 2,667
4 42,667 3,667 5,667* 8,333*
Alfa (nível de significância) 0,05 Valor Crítico Q 4,897
Valor Crítico para Comparação = 5,0095
Graus de liberdade do termo Erro (resíduo) = 6
Formação de grupos homogêneos após a aplicação do teste de Tukey(5%)
Detergente Média Grupos Homogêneos*
3 51,000 A
2 48,333 A
1 46,333 AB
4 42,667 B
10
* médias seguidas de letras diferentes diferem estatisticamente
Alfa (nível de significância) 0,05 Valor Crítico Q 4,897
Valor Crítico para Comparação = dms = HSD = 5,0095
Graus de liberdade do termo Erro (resíduo) = 6
Conclusão:
Grupos 1 e 4 (letra A e AB) não diferem entre si (letra B comum).
Grupo 4 (letra B) difere dos grupos 2 e 3 (letra A).
Grupo 1 (letra AB) não difere do grupo 4 e, também, não difere dos grupos 2 e 3, ou seja,
o detergente 1 ocupa um comportamento intermediário em relação aos outros três detergentes.
Quanto à limpeza o pior detergente é o tipo 4.
Os detergentes tipo 1, 2 e 3 não apresentaram diferença do ponto de vista estatístico.
........................................................................................................................................................
Exemplo 3. Experimento em blocos (CBRD), sem repetições.
Supõe-se que a impureza de um produto químico é afetada pela pressão. Optou-se por utilizar a
temperatura como fator de blocagem. Os dados são apresentados na Tabela 7 mostrada a seguir.
Tabela 7. Quinze valores de impureza, sob condições de temperatura (ºC) e pressão (mmHg),
obtidos num experimento em blocos ao acaso.
Temperatura
Pressão Total Média x
25 30 35 40 45
100 5 4 6 3 5 23 4,60
125 3 1 4 2 3 13 2,60
150 1 1 3 1 2 8 1,60
Total 9 6 13 6 10 44 geral: 2,93
Média x 3,00 2,00 4,33 2,00 3,33
Resolução
FC = fator de correção da soma de quadrados = (44)2
/15 = 129,067
SQ Total = SQ Total = ∑x2
– (∑X)2
/ n = 166 – (44)2
/15= 166 – 129,067 = 36,933
SQ linha = SQ temperatura = SQ blocos = (232
+132
+82
) / 5 – FC = 152,400-129,067 = 23,333
SQ coluna = SQ pressão = (92
+62
+132
+62
+102
) / 3 – FC = 140,667-129,067 = 11,600
SQ Total = SQ LINHA + SQ COLUNA + SQ RESÍDUO
assim, SQ RESÍDUO = SQ Total – (SQ LINHA + SQ COLUNA)
SQ RESÍDUO = 36,933– (23,333+11,600) = 36,933– 34,933 = 2,000
Cálculo dos Graus de Liberdade (gl)
Fator Linha = Blocos = b-1 e no nosso exemplo é 3 – 1 = 2
11
Fator Coluna = Pressão = G-1 e no nosso exemplo é 5 – 1 = 4
Total é N-1 e no nosso exemplo é 15 – 1 = 14
Resíduo é ( N-1 ) - [ (B-1) +(G-1) ] = ( BG-1 ) - [ (B-1) +(G-1) ] = (B-1)(G-1)
e no nosso exemplo é gl resíduo = 14-(2+4) = 8 = (3-1)(5-1) = (2)(4)
Cálculo da estatística F
Variância Efeito Coluna (pressão) = QM colunas / gl colunas = (11,600/4) = 2,900
Variância Resíduo = QM resíduo / gl resíduo = (2,00/8) = 0,250
F calculado = Var Coluna / Var resíduo = Var Pressão/ Var resíduo = 2,900/0,25 = 11,60
Comando no Minitab para se obter o p-valor associado ao F calculado é
após Edit >> Command Line Editor (ou Ctrl+L) digitamos
cdf 11.60 k1;
F 4 8.
let k2 = 1-k1
print k2
K2 0.00206337
clicar no (X) Submit Commands
Tabela 8. ANOVA 2 fatores para os dados da Tabela 7.
Efeito gl SQ QM F P
Pressão 4 11,600 2,900 11,60 0,002*
Temperatura 2 23,333 11,667
Erro 8 2,000 0,250
Total 14 36,933
*p<0,05
.......................................................................................................................................................
12
3º) experimento em blocos ao acaso (CRBD) com repetições
Nesse item vamos considerar três situações. A primeira com os blocos apresentando o
mesmo valor médio em cada tratamento; na segunda situação, temos uma diferença constante
entre os valores médios de cada bloco; e na terceira valores desiguais entre os valores médios
dos blocos em cada tratamento. Entende-se melhor o que queremos explicar por meio dos
exemplos.
Primeira situação. Valores médios iguais dos blocos.
Exemplo 1. Dados de um experimento em blocos ao acaso com repetições.
Blocos
Tratamentos Total das
linhas
Média dos
blocos
A B C D
I
22 31 30 39
408 3426 38 31 42
30 36 38 45
Médias dos
blocos
26 e 26 35 e 35 33 e 33 42 e 42
II
25 34 32 41
408 3426 35 33 42
27 36 34 43
Total 156 210 198 252 Total geral:
816
Média
geral: 34
Resolução.
Segue-se o mesmo procedimento dos casos anteriores, ou seja, cálculo do fator de
correção; cálculo da soma de quadrados total; cálculo da soma de quadrados devido ao fator
coluna (tratamentos); cálculo da soma de quadrados do fator linha (blocos) e, enfim, onde está
a novidade. A resposta, para essa justificada pergunta, é a relação:
13
SQ Total = SQ COLUNA + SQ LINHA + SQ RESÍDUO.
Cálculo da Soma de Quadrados dos Tratamentos
SQ trat = {1562
+2102
+1982
+2522
)/6} – (816)2
/24 = 780,00
Cálculo da Soma de Quadrados dos Blocos
SQ blocos = {4082
+4082
)/12} – (816)2
/24 = 27744-27744 = 0
Cálculo da Soma de Quadrados dos Resíduos
SQ resíduo= ∑(x - x )2
onde x é o valor de cada célula (casela) e x é a média de cada casela
SQ resíduo = {42
+02
+42
}+{42
+32
+12
}+{32
+22
+52
}+{32
+02
+32
} referente ao bloco I
+{12
+02
+12
}+{12
+02
+12
}+{12
+02
+12
}+{12
+02
+12
} referente ao bloco I I=
= {32+26+38+18}+{2+2+2+2} = 114 + 8 = 122
Nesse nosso exemplo os números calculados indicam:
902,00 = 780,00 + 0 + 122
902,00 = 902,00 relação de igualdade.
Conclusão: valeu nesse caso a relação:
SQ Total = SQ COLUNA + SQ LINHA + SQ RESÍDUO.
Será que essa relação, na presença de repetições, sempre é válida?
Segunda situação. Valores médios dos blocos diferem de uma constante.
Exemplo 2. Dados de um experimento em blocos ao acaso com repetições.
Blocos
Tratamentos Total das
linhas
Média dos
blocos
A B C D
22 31 30 39
14
I 408 3426 38 31 42
30 36 38 45
Médias dos
blocos
26 e 30 35 e 39 33 e 37 42 e 46
II
29 38 36 45
456 3830 39 37 46
31 40 38 47
Total 168 222 210 264 Total geral:
864
Média
geral: 36
Tratamentos N Média DP
1 6 28,00 3,41
2 6 37,00 3,22
3 6 35,00 3,58
4 6 44,00 2,97
Nesse caso, também, vale a relação:
SQ Total = SQ COLUNA + SQ LINHA + SQ RESÍDUO.
998,00 = 780,00 + 96 + 122
Terceira situação. Vai aparecer o fator interação!
Valores desiguais entre os valores médios dos blocos em cada tratamento
Exemplo 3. Dados de um experimento em blocos ao acaso com repetições.
Blocos
Tratamentos Total das
linhas
Média dos
blocos
A B C D
I
22 31 30 39
408 3426 38 31 42
30 36 38 45
Médias dos
blocos
26 e 32
difere de 6
35 e 51
difere de 16
33 e 45
difere de 12
42 e 48
difere de 6
15
II
27 47 42 44
528 4434 50 45 47
35 56 48 53
Total das
colunas
174 258 234 270
Total geral:
936
Média
geral: 39
Tratamentos N Média DP
A 6 29,00 4,98
B 6 43,00 9,51
C 6 39,00 7,38
D 6 45,00 4,77
Nesse caso, também, vale ainda a relação:
SQ Total = SQ COLUNA + SQ LINHA + SQ RESÍDUO.
1874,00 = 912,00 + 600,00 + 254,00 ?? não (esse caso difere dos outros dois)
1874,00 = 1766,00 ?? Para que seja válida essa relação de igualdade temos de acrescentar o
valor diferença = 1874,00 – 1766,00 = 108
Esse valor acrescentado será denominado de SQ interação : soma de quadrados do fator interação
que aparece devido à presença de repetições e da diferença entre os valores médios dos blocos nos
tratamentos.
O gráfico de médias ajuda-nos a observar (e a verificar) a existência do efeito interação.
16
Grupos
médias
DCBA
50
45
40
35
30
25
Blocos
1
2
6
16
12
6
Figura 1. Gráfico de médias referente às seis condições experimentais.
Ilustração do efeito interação entre as duas variáveis em estudo.
Para avaliar se essa diferença, entre os quatro valores diferenças, difere estatisticamente temos de
aplicar verificar se a razão F do efeito interação é estatisticamente significante. Em um experimento
em blocos o efeito interação, em geral, não é um efeito interessante, ou seja, avaliado. Há uma
suposição inicial da inexistência desse efeito interação.
Tabela W. ANOVA dois fatores para os dados do exemplo 3, terceira situação.
Efeito gl SQ QM F P
Blocos 1 600,00 600,00 37,80 0,001
Tratam 3 912,00 304,00 19,15 0,001
Interação 3 108,00 36,00 2,27 0,120
Erro 16 254,00 15,88
Total 23 1874,00
Por meio do resultado do teste ANOVA 2 fatores, Tabela W, pôde-se verificar que o efeito
interação é estatisticamente não significante (p = 0,120 >0,05). Então, podemos desconsiderar o valor
17
Soma da Soma de Quadrados correspondente ao efeito interação (no caso foi de 108) e, assim,
obtemos uma outra tabela ANOVA, a usual em experimento em blocos ao acaso, que desconsidera o
efeito interação, Tabela Z mostrada a seguir.
Tabela Z. ANOVA dois fatores para os dados do exemplo 3, terceira situação.
Efeito gl SQ QM F P
BLOCOS 1 600,00 600,000
TRATAM 3 912,00 304,000 15,96 0,0001
Erro 19 362,00 19,053
Total 23 1874,00
18
4º) experimento inteiramente casualizado (CRD) com repetições.
Nesse item vamos considerar os experimentos que seguem um delineamento fatorial. Não vamos
considerar fatores como blocos. Blocagem, agora, não nos interessa por um motivo de didática,
apenas.
Vamos considerar dois fatores, duas variáveis experimentais, cujos efeitos sobre a unidade
experimental são avaliados pela variável resposta. Esses efeitos, dessas duas variáveis, nos interessam.
Queremos avaliá-los isoladamente, efeitos principais e, também, se houver repetições (caso mais
freqüente, comum) vamos ter de nos enfrentar com o efeito interação. Que significa saber se há ou não
“diferença entre as diferenças”. O termo interação não apresenta, no jargão da estatística, o mesmo
significado quando empregado na ciência biológica. A Farmacologia, por exemplo, que considera a
interação entre as drogas, o efeito da mistura, da ação conjunta entre vários medicamentos sobre a
pessoa em comparação com a ação individual desses medicamentos sobre a pessoa.
Considera-se, agora, como exemplo de um delineamento fatorial o mesmo exemplo anterior, mas
com uma alteração apenas. Dessa vez, não houve blocagem. Não há o fator blocos. A casualização dos
tratamentos não foi restrita aos blocos. Não houve restrição alguma quanto ao sorteio dos tratamentos
às unidades experimentais. Porém, a forma de análise dos dados é análoga, ou seja, o mesmo
procedimento. O novo fator será denominado de Termociclagem Mecânica, por exemplo, indicado por
TCM que apresentará dois níveis. O nível I como ausência e o nível II como presença de TCM.
O outro fator, tratamentos, pode ser considerado como Tratamentos Superficiais apresentando
quatro diferentes níveis: Controle, Alumina, Rocatec e New.
A variável resposta é o resultado do teste de tração (em megapascal, MPa) obtido numa máquina
de ensaio universal.
A unidade experimental é o corpo de prova em forma de cilindro.
19
Exemplo 1. Dados de resistência a tração (MPa) de um experimento fatorial (tipo 4 x 2)
com três repetições.
TCM
Tratamentos Superficiais Total das
linhas
Média dos
níveis do
fator TCMA: controle B: alumina C: rocatec D: new
I: ausência
22 31 30 39
408 3426 38 31 42
30 36 38 45
médias dos
níveis
26 e 32
difere de 6
35 e 51
difere de 16
33 e 45
difere de 12
42 e 48
difere de 6
II: presença
27 47 42 44
528 4434 50 45 47
35 56 48 53
Total das
colunas
174 258 234 270
Total geral:
936
Média
geral: 39
Tratamentos N Média DP
A 6 29.00 4.98
B 6 43.00 9.51
C 6 39.00 7.38
D 6 45.00 4.77
Nesse caso, com repetições, é válida a seguinte relação entre as somas de quadrados:
SQ Total = SQ COLUNA + SQ LINHA + SQ Interação + SQ RESÍDUO.
1874,00 = 912,00 + 600,00 + 254,00 + SQ Interação
Assim SQ interação = 108.
Com o mesmo procedimento dos casos anteriores obtém-se a Tabela Y referente ao teste
ANOVA (2 fatores) dos dados.
Cálculo dos Graus de Liberdade (gl)
Fator Linha = TCM = L-1 e no nosso exemplo é 2 – 1 = 1
Fator Coluna = Tratamentos = G-1 e no nosso exemplo é 4 – 1 = 3
20
Total é N-1 e no nosso exemplo é 24 – 1 = 23 = (LCR) – 1
onde R é o número de repetições
Fator Interação é determinado pelo produto dos graus de liberdade do fator na linha
pelo fator coluna = (L-1)(G-1) = (2-1)(4-1) = 3.
O gl resíduo é dado pela diferença entre o gl do total em relação aos outros fatores, ou
seja, (24-1)-{(2-1)+(4-1)+(2-1)(4-1)) = 23- (1+3+3) = 23-7 = 16.
Ou o gl resíduo é dado pela fórmula gl resíduo = (LC)(R – 1) onde R é o número de
repetições; assim gl resíduo = (2 x 4)(3-1) = 8 (2) = 16.
Tabela Y. ANOVA (2 fatores) dos dados de resistência a tração (MPa) de um experimento
fatorial (tipo 4 x 2) com três repetições.
Efeito gl SQ QM F P
Tratamento 3 912,00 304,000 19,15 0,0001*
TCM 1 600,00 600,000 37,80 0,0001*
Interação 3 108,00 36,000 2,27 0,1198
Erro 16 254,00 15,875
Total 23 1874,00
* p<0,05
A interpretação inicial dos resultados de uma tabela ANOVA (2 fatores) começa pelo efeito do
fator interação.
Repito. Primeiro avalie o efeito interação. Depois, se for o caso, avalie os efeitos principais.
Diante dos efeitos principais numa possível avaliação há dois casos no gráfico de médias das
condições experimentais: interação tipo ordinal e interação do tipo não ordinal.
Vamos explicitar o que dissemos acima. Se o efeito interação foi avaliado como significante,
então, pode – sempre é possível – não avaliar os efeitos principais. O foco de atenção do resultado é,
então, o efeito interação e ponto final. Porém, o efeito principal que foi, também, avaliado como
significante pode ser interpretado (teste de Tukey, por exemplo) se, no gráfico de médias das
condições experimentais, ele se mostrar como efeito ordinal (ordinal interaction effect). Ainda, há o
caso de o efeito principal que foi, também, avaliado como significante não pode ser interpretado (teste
de Tukey, por exemplo) se, no gráfico de médias das condições experimentais, ele se mostrar como
efeito não ordinal (disordinal interaction effect). Quando há o efeito tipo ordinal as linhas que unem os
valores médios se apresentam como paralelas. Caso contrário, diante do efeito não ordinal há um
cruzamento dessas linhas que unem os valores médios do gráfico de médias.
Se o efeito interação for não significante, então, vamos interpretar os efeitos principais que
apresentaram significância (p valor inferior ao nível de significância).
21
O efeito interação é estatisticamente não significante. Assim, o relacionamento entre os níveis
do fator Termociclagem expressa mediante a perda de resistência (diferença entre presença menos
ausência) obtido no grupo controle é praticamente a mesma perda de resistência obtida nos demais
tipos de tratamentos superficiais, Figura Z.
Tratamentos Superficiais
MPa
DCBA
50
45
40
35
30
25
TCM
ausência
presença
Figura Z. Gráfico de médias referente às seis condições experimentais. Perda de resistência
(indicada pela seta) devido à ação da Termociclagem mecânica, TCM, em cada tipo
de tratamento.
Pode-se concluir mediante o resultado do teste ANOVA, Tabela Y, que há diferença
estatisticamente significante entre os quatro Tratamentos.
Para o fator Tratamentos, a hipótese H0(μ1 = μ2 = μ3 = μ4 ) é rejeitada.
Os valores médios diferem!
Teste de comparação múltipla de Tukey (5%) para o efeito Tratamento Superficial
Por meio do Teste de Tukey (5%) obtém-se o valor HSD
22
MSW = QM resíduo = 15,875 ; n = 6; q crítico = 4,047; HSD = 6,5824
valores das diferenças a serem comparadas com o valor HSD ou dms.(=6,5824)
Tratamentos Média A B C
A 29,000 ----
B 43,000 14,000* ----
C 39,000 10,000* 4,000 ----
D 45,000 16,000* 2,000 6,000
Alfa (nível de significância) 0,05
Valor Crítico Q 4,047
Valor Crítico para Comparação = 6,5824
Graus de liberdade do termo Erro (resíduo) = 16
Formação de grupos homogêneos após a aplicação do teste de Tukey(5%)
Tratamentos Média Grupos Homogêneos*
D 45,000 A
B 43,000 A
C 39,000 A
A 29,000 B
* médias seguidas de letras diferentes diferem estatisticamente
Pode-se concluir, ainda, mediante o resultado do teste ANOVA, Tabela Y, que há diferença
estatisticamente significante entre os dois níveis entre o fator Termociclagem mecânica (TCM).
Assim, como são apenas dois níveis desse fator, não há necessidade de se efetuar um teste de
comparação múltipla como o teste de Tukey. Se os dois níveis diferem pode-se estabelecer que a
condição de ausência de Termociclagem é menos resistente (34,00±6,77MPa) que a condição de
presença de Termociclagem (44,00±8,37MPa).
Quando se comparam as seis condições experimentais entre si, pelo teste de Tukey, obtém-se,
por exemplo, que a condição Tratamento A(controle) sem TCM é a menos resistente (média igual a
26MPa) enquanto as mais resistentes são as condições Tratamentos B (alumina) e D(new) com TCM.
Outras considerações podem ser ainda obtidas.
Trata TCM Média Grupos Homogêneos*
B 2 51 A
23
D 2 48 A
C 2 45 AB
D 1 42 ABC
B 1 35 BCD
C 1 33 CD
A 2 32 CD
A 1 26 D
* médias seguidas de letras diferentes diferem estatisticamente
Alfa (nível de significância) 0,05
Valor Crítico Q 4,903
Valor Crítico para Comparação = 11,278
Graus de liberdade do termo Erro (resíduo) = 16
...............................................................................................................
24
Apêndice
Cálculo direto da Soma de Quadrados do Fator Interação
Experimento inteiramente casualizado. Planejamento fatorial (com repetições).
Experimento inteiramente casualizado. Planejamento fatorial.
Médicos psiquiatras de um centro de Trauma desenvolveram um programa para ajudar as
vítimas de danos cerebrais a conseguirem alcançar certo nível aceitável de independência.
No experimento participaram 27 pessoas com o mesmo grau de dano cerebral.
O objetivo foi comparar diferentes combinações de tratamentos psiquiátricos e de
fisioterapias.
Para cada pessoa foi designada uma das 9 diferentes combinações de três tratamentos
psiquiátricos e de três programas de fisioterapias. Houve três sujeitos para cada combinação.
A variável resposta é o número de meses de duração entre o indivíduo da terapia e o tempo
no qual o paciente foi capaz de voltar a agir com independência. Os resultados foram apresentados na
forma de tabela mostrada a seguir.
Valores obtidos por 27 pessoas submetidas ao teste psiquiátrico e ao programa de fisioterapia.
Programa de
fisioterapia
Tratamento psiquiátrico
A B C
1 9 10 11 10 11 12 13 11 13
2 10 11 12 11 12 15 15 12 15
3 10 12 15 12 14 16 13 15 17
soma 100 113 124
média 11,11 12,55 13,78
Soma geral = 337 ; Média geral = 12,48
vamos dispor os dados de uma forma conveniente para o cálculo da SQ interação
Programa
Fisioterapia
= Fator B
Tratamento Psiquiátrico = fator A
Total
1 2 3
1
9
10
11
10
11
12
13
11
13
100
total a1b1: 30 total a2b1: 33 total a3b1: 37
2
10 11 15
11311 12 12
12 15 15
total a1b2: 33 total a2b2: 38 total a3b2: 42
3
10 12 13
12412 14 15
15 16 17
total a1b3: 37 total a2b3: 42 total a3 b3: 45
100 113 124 337
25
Já sabemos - procedimento visto anteriormente -, como efetuar o cálculo da SQ das linhas e
das colunas. Ou seja, somo o total da coluna (ou da linha) e elevo ao quadrado e esse valor deve ser
dividido pelo número de elementos (tamanho da amostra, número de repetições) e, dessa soma geral
subtraímos o fator de correção, FC = (∑X)2
/ N).
Agora, o procedimento é bem parecido para se obter a SQ do fator interação.
O procedimento é o seguinte:
1º) Cálculo da SQ AB ou SQ Tratamentos AB
as 9 condições experimentais (os 9 tratamentos: 3 x 3)
a1b1 a2b1 a3b1 a1b2 a2b2 a3b2 a1b3 a2b3 a3b3
N 3 3 3 3 3 3 3 3 3
Total: T 30 33 37 33 38 42 37 42 45
T2
900 1089 1369 1089 144 1764 1369 1764 2025
∑T2
= 12813,00
(12813,00) / 3 = 4271,00
FC = (∑X)2
/ N) = (337)2
/27 = 4206,2593
SQ tratam AB = 4271,00 - (337)2
/27 = 4271,00 – 4206,2593 = 64,7407
2º) Cálculo da SQ A. Cálculo da SQ B.
Temos de obter essas somas porque a SQ interação é obtida pela diferença entre o valor
calculado antes (SQ tratam AB) e a soma (SQA+SQB).
SQ A = {(1002
+1132
+1242
) / 9 – FC} = (38145,00/9) – 4206,2593 = 4238,3333 - 4206,2593 = 32,0740
SQ B = {(1002
+1132
+1242
) / 9 – FC} = (38145,00/9) – 4206,2593 = 4238,3333 - 4206,2593 = 32,0740
3º) Cálculo da SQ interação
SQ trata AB = SQ A + SQ B + SQ interação → SQ interação = SQ trata AB – { SQ A + SQ B}
SQ interação = 64,7407 - {32,074 + 32,074} = 64,7407 - 64,148 = 0,593aprox.
SQ interação = 0,593
Variância do fator interação = { SQ interação = 0,593} / gl interação
O número de graus de liberdade (gl) do fator interação é dado pelo produto (a-1)(b-1)
no nosso exemplo, gl inter = (3-1)(3-1) = 4
Portanto Variância do fator interação = 0,593/4 = QM inter = 0,1481
Fórmula do número de graus de liberdade (gl) na ANOVA 2 fatores de um experimento fatorial
26
Efeito gl no nosso exemplo
A: a-1 3 -1 = 2
B: b-1 3 -1 = 2
Interação (A x B): (a-1)(b-1) (3-1)(3-1) = 2 x 2 = 4
Erro ab(r -1) (3)(3)[3-1] = 9 x 2 = 18
Total: N-1= abr-1 27-1 = 3(3)(3) – 1 = 26
r ... corresponde ao número de repetições (no nosso exemplo é 3)
27

Mais conteúdo relacionado

Mais procurados

Relatório lei de hooke turma t5
Relatório lei de hooke   turma t5Relatório lei de hooke   turma t5
Relatório lei de hooke turma t5
Roberto Leao
 
03.regua graduada, metro e trena
03.regua graduada, metro e trena03.regua graduada, metro e trena
03.regua graduada, metro e trena
Edvaldo Viana
 

Mais procurados (20)

Regressão Linear I
Regressão Linear IRegressão Linear I
Regressão Linear I
 
Aula18(3)
Aula18(3)Aula18(3)
Aula18(3)
 
Relatório lei de hooke turma t5
Relatório lei de hooke   turma t5Relatório lei de hooke   turma t5
Relatório lei de hooke turma t5
 
Rm exerc resolvidos
Rm exerc resolvidosRm exerc resolvidos
Rm exerc resolvidos
 
03.regua graduada, metro e trena
03.regua graduada, metro e trena03.regua graduada, metro e trena
03.regua graduada, metro e trena
 
Metodo dos Esforços
Metodo dos EsforçosMetodo dos Esforços
Metodo dos Esforços
 
Tabela derivadas e integrais
Tabela derivadas e integraisTabela derivadas e integrais
Tabela derivadas e integrais
 
Fisica relatorio 1
Fisica   relatorio 1Fisica   relatorio 1
Fisica relatorio 1
 
Prática de Regressão no SPSS
Prática de Regressão no SPSSPrática de Regressão no SPSS
Prática de Regressão no SPSS
 
Probabilidade - Estatística I
Probabilidade - Estatística IProbabilidade - Estatística I
Probabilidade - Estatística I
 
6 teste de hipótese
6   teste de hipótese6   teste de hipótese
6 teste de hipótese
 
Resistência dos Materiais - Torção
Resistência dos Materiais - TorçãoResistência dos Materiais - Torção
Resistência dos Materiais - Torção
 
Critérios
CritériosCritérios
Critérios
 
34 nucleo e imagem de uma transformacao linear
34 nucleo e imagem de uma transformacao linear34 nucleo e imagem de uma transformacao linear
34 nucleo e imagem de uma transformacao linear
 
Tópico 4 regressão linear simples 02
Tópico 4   regressão linear simples 02Tópico 4   regressão linear simples 02
Tópico 4 regressão linear simples 02
 
96893253 tabela-centroides-de-areas
96893253 tabela-centroides-de-areas96893253 tabela-centroides-de-areas
96893253 tabela-centroides-de-areas
 
Tabela completa de derivadas e integrais
Tabela completa de derivadas e integraisTabela completa de derivadas e integrais
Tabela completa de derivadas e integrais
 
Leitura de Polegada no Paquímetro
Leitura de Polegada no Paquímetro Leitura de Polegada no Paquímetro
Leitura de Polegada no Paquímetro
 
Apostila resistência materiais
Apostila resistência materiaisApostila resistência materiais
Apostila resistência materiais
 
Estatística Básica - Ensino médio, concursos, 6 Sigma, Qualidade
Estatística Básica - Ensino médio, concursos, 6 Sigma, QualidadeEstatística Básica - Ensino médio, concursos, 6 Sigma, Qualidade
Estatística Básica - Ensino médio, concursos, 6 Sigma, Qualidade
 

Semelhante a Anova 2__fatores_prof._ivan (2)

Delineamentos estatísticos
Delineamentos estatísticosDelineamentos estatísticos
Delineamentos estatísticos
UERGS
 
aula_2_principios_basicos_de_experimentao.pdf
aula_2_principios_basicos_de_experimentao.pdfaula_2_principios_basicos_de_experimentao.pdf
aula_2_principios_basicos_de_experimentao.pdf
EdyCipriano
 
Princípios da estatística experimental
Princípios da estatística experimental   Princípios da estatística experimental
Princípios da estatística experimental
UERGS
 
Amostragem e estimacao
Amostragem e estimacaoAmostragem e estimacao
Amostragem e estimacao
Luciano Alves
 

Semelhante a Anova 2__fatores_prof._ivan (2) (20)

Delineamentos estatísticos
Delineamentos estatísticosDelineamentos estatísticos
Delineamentos estatísticos
 
Aula 01 - Introdução à teoria de conjuntos.pdf
Aula 01 - Introdução à teoria de conjuntos.pdfAula 01 - Introdução à teoria de conjuntos.pdf
Aula 01 - Introdução à teoria de conjuntos.pdf
 
experimentac3a7c3a3o-agrc3adcola.pptx
experimentac3a7c3a3o-agrc3adcola.pptxexperimentac3a7c3a3o-agrc3adcola.pptx
experimentac3a7c3a3o-agrc3adcola.pptx
 
Introdução experimentação
Introdução experimentaçãoIntrodução experimentação
Introdução experimentação
 
aula_2_principios_basicos_de_experimentao.pdf
aula_2_principios_basicos_de_experimentao.pdfaula_2_principios_basicos_de_experimentao.pdf
aula_2_principios_basicos_de_experimentao.pdf
 
08 testes hipoteses_anova
08 testes hipoteses_anova08 testes hipoteses_anova
08 testes hipoteses_anova
 
Exp design
Exp designExp design
Exp design
 
Apostila estatistica2
Apostila estatistica2Apostila estatistica2
Apostila estatistica2
 
Princípios da estatística experimental
Princípios da estatística experimental   Princípios da estatística experimental
Princípios da estatística experimental
 
Sistemas complexos
Sistemas complexosSistemas complexos
Sistemas complexos
 
Tópico 3 Testes de Hipóteses - 2 amostras
Tópico 3   Testes de Hipóteses - 2 amostrasTópico 3   Testes de Hipóteses - 2 amostras
Tópico 3 Testes de Hipóteses - 2 amostras
 
Hduudjudmmhdkkdjdyjyhyuyduusyjyusujjsuus
HduudjudmmhdkkdjdyjyhyuyduusyjyusujjsuusHduudjudmmhdkkdjdyjyhyuyduusyjyusujjsuus
Hduudjudmmhdkkdjdyjyhyuyduusyjyusujjsuus
 
13991
1399113991
13991
 
Curso básico cep fusco
Curso básico cep fuscoCurso básico cep fusco
Curso básico cep fusco
 
referente a estatística
referente a estatísticareferente a estatística
referente a estatística
 
Aula 6 curso básico cep fusco2
Aula 6 curso básico cep fusco2Aula 6 curso básico cep fusco2
Aula 6 curso básico cep fusco2
 
Análise de dados com SciLab
Análise de dados com SciLabAnálise de dados com SciLab
Análise de dados com SciLab
 
Aula6
Aula6Aula6
Aula6
 
Amostragem e estimacao
Amostragem e estimacaoAmostragem e estimacao
Amostragem e estimacao
 
Aula de estatística
Aula de estatísticaAula de estatística
Aula de estatística
 

Mais de sirlaineengenhariaproducao (8)

Procedimento-geral-de-certificacao.docx
Procedimento-geral-de-certificacao.docxProcedimento-geral-de-certificacao.docx
Procedimento-geral-de-certificacao.docx
 
ilide.info-nr-12-check-list-equipamentos-diversos-plataforma-esmeril-bate-est...
ilide.info-nr-12-check-list-equipamentos-diversos-plataforma-esmeril-bate-est...ilide.info-nr-12-check-list-equipamentos-diversos-plataforma-esmeril-bate-est...
ilide.info-nr-12-check-list-equipamentos-diversos-plataforma-esmeril-bate-est...
 
Check-List - Alojamento.doc
Check-List -  Alojamento.docCheck-List -  Alojamento.doc
Check-List - Alojamento.doc
 
Check-list- BASICO - Esmerilhadeira-doc.doc
Check-list- BASICO - Esmerilhadeira-doc.docCheck-list- BASICO - Esmerilhadeira-doc.doc
Check-list- BASICO - Esmerilhadeira-doc.doc
 
Check-list- BASICO - Furadeira de Bancada-doc.doc
Check-list- BASICO - Furadeira de Bancada-doc.docCheck-list- BASICO - Furadeira de Bancada-doc.doc
Check-list- BASICO - Furadeira de Bancada-doc.doc
 
CHECK LIST ESMERIL E FURADEIRA DE BANCADA RN.docx
CHECK LIST ESMERIL E FURADEIRA DE BANCADA RN.docxCHECK LIST ESMERIL E FURADEIRA DE BANCADA RN.docx
CHECK LIST ESMERIL E FURADEIRA DE BANCADA RN.docx
 
CARTAZ OFICINA.pptx
CARTAZ OFICINA.pptxCARTAZ OFICINA.pptx
CARTAZ OFICINA.pptx
 
Trabalho lan house
Trabalho lan houseTrabalho lan house
Trabalho lan house
 

Anova 2__fatores_prof._ivan (2)

  • 1. ANOVA 2 fatores (two-way) Introdução♥ Em muitos trabalhos, que envolvem a realização de experimentos, é comum os pesquisadores se depararem com a questão: como avaliar se os resultados obtidos são confiáveis? Sabemos que qualquer medida realizada é sempre afetada por erros. Erros muito pequenos não trarão grandes implicações. Contudo, se forem significativos, poderão prejudicar seriamente os resultados levando a falsas conclusões. Portanto conhecer a natureza dos erros e preparar planejamentos que possam minimizá-los é uma estratégia que deve estar presente no dia-a-dia de todo pesquisador. Existem dois tipos de erros, o erro sistemático e o erro aleatório. O primeiro tem como característica afetar os resultados dos experimentos sempre na mesma direção, seja para mais ou para menos. Um exemplo simples deste tipo de situação é o caso de uma balança descalibrada que pode indicar sempre massas maiores que as reais. Mas vale notar que os erros sistemáticos podem ser identificados e, portanto, evitados. Por outro lado, há um tipo de erro que afeta as medidas sem nenhuma tendência clara. As medidas podem oscilar, ora para mais, ora para menos. Este tipo e erro é chamado de erro aleatório e, infelizmente, sempre estará presente em maior ou menor grau. Ao fazer um estudo é sempre interessante fazer replicatas, repetições, pois permite que o erro presente nas medidas seja investigado. Além disso, com a realização de várias replicatas aumentam as chances de se aproximar mais do valor exato. Isto é evidenciado por um importante princípio da estatística: o teorema do limite central, que comprova que o erro no valor médio é menor que o erro de uma observação individual (referência: Barros Neto, B, Scarminio, I.S., Bruns, R.E. Como fazer experimentos: pesquisa e desenvolvimento na ciência e na indústria. Ed. da Unicamp; Campinas, 2001). Muitas vezes as características do procedimento experimental dificultam muito a execução de replicatas autênticas. Não é correto simplesmente realizar duas medidas do mesmo experimento de forma seqüencial, pois um erro que afetar a primeira medida certamente irá, de forma sistemática, afetar a seguinte.  nessa introdução as idéias expostas foram copiadas do artigo: Conseqüências da análise incorreta de experimentos blocados, sob autoria de João Alexandre Bortoloti e Roy Edward Bruns. Artigo publicado na revista Química Nova, vol. 30, nº 2, págs. 436-440, 2007.
  • 2. Não são raros os casos em que o ajuste das condições experimentais é extremamente trabalhoso ou lento. Portanto, parece haver um dilema, realizar medidas com duplicatas e arcar com o custo do trabalho envolvido, mas garantir a qualidade das medidas, ou evitar um grande esforço no laboratório, mas correr o risco de ter todo o seu trabalho prejudicado. É neste contexto que surge uma interessante possibilidade, a blocagem dos experimentos. continuação da aula sobre Anova 1 fator Ao analisar os dados classificados em dupla-entrada, temos de aplicar o método da classificação 1 fator duas vezes: - uma vez para cada sistema de classificação. Em resumo, a anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na linha). Veremos a aplicação desse método (anova 2 fatores) em dois tipos de delineamentos: CRD e CRBD sob presença ou ausência de repetições, replicatas. Por repetição (replicata) se entende um teste completo de todos os tratamentos no experimento (a replication is a complete run for all treatments to be tested in the experiment). 1º) experimento inteiramente ao acaso (completely randomized design, CRD) sem repetições; 2º) experimento em blocos ao acaso (randomized complete block design (CRBD) sem repetições; 3º) experimento em blocos ao acaso (CRBD) com repetições; 4º) experimento inteiramente casualizado (CRD) com repetições. 2
  • 3. 1º) CRD. Experimento inteiramente ao acaso♣ , sem repetições. Exemplo 1. Por exemplo, 12 jovens foram classificados em três grupos de acordo com a idade deles. Ao mesmo tempo eles foram classificados de acordo com o sexo em dois grupos: masculino e feminino. Assim, cada jovem esteve sujeito a dois sistemas de classificação simultaneamente, Tabela 1. Tabela 1. Dados obtidos no experimento tipo CRD. colunas linhas 1 2 3 4 total linha média linha efeito linha 1 6 2 9 3 20 5 -2 2 8 9 11 12 40 10 +3♥ 3 4 4 10 6 24 6 -1 total coluna 18 15 30 21 84 média coluna 6 5 10 7 7 efeito coluna -1♠ -2 +3 0 0 ♠ (-1) = efeito coluna = média coluna 1(=6) – média geral (=7) ♥ (+3) = efeito linha = média linha 2(=10) – média geral (=7) Análise dos dados segundo a classificação do fator “linha”. anova 1 fator. SQ linha = 4{(-2)2 + (3)2 + (-1)2 } = 56 Análise dos dados segundo a classificação do fator “coluna”. anova 1 fator. SQ coluna = 3{(-1)2 + (-2)2 + (3)2 +(0)2 } = 42 Cálculo da Soma de Quadrados Total SQ Total*= ∑x2 – (∑X)2 / n = * dedução dessa fórmula = SQ = ∑(x-μ)2 = ∑(x2 -2xμ +μ2 ) = ∑(x2 )-2μ∑x +∑(μ2 )= ∑x2 -2μ2 n +n μ2 =∑x2 - nμ2 = ∑x2 - n(∑x)2 / n2 = ∑x2 –(∑x)2 / n que é a forma usual do cálculo da soma de quadrados total. {(52 +22 +92 +32 +82 +92 +112 +122 +42 +42 +102 +62 )-(5+2+9+3+8+9+11+12+4+4+10+6)2 / 12 }= SQTotal = 120 Cálculo da Soma de Quadrados Resíduo (há dois métodos) a) por meio da diferença (método mais fácil)  Denomina-se experimento inteiramente ao acaso quando os tratamentos (fatores) são designados às unidades experimentais sem qualquer restrição. Esse tipo de delineamento só pode ser conduzido quando as unidades experimentais (corpos-de-prova, pessoas, etc...) são similares. Por similares deve-se entender: não no sentido de igualdade, mas no sentido de que essas unidades respondem ao tratamento da mesma forma. 3
  • 4. SQ Total = SQ LINHA + SQ COLUNA + SQ RESÍDUO assim, SQ RESÍDUO = SQ Total – (SQ LINHA + SQ COLUNA) SQ RESÍDUO = 120 – (56+42) = 120 – 98 = 22 b) por meio do cálculo direto (método mais trabalhoso) 22 +(-1) 2 +12 +(-2)2 +(-1)2 +12 +(-2)2 +22 +(-1)2 +02 +12 +02 = 4+1+1+4+1+1+4+4+1+0+1+0 = 22 Cálculo dos Graus de Liberdade (gl) Fator Linha = Blocos = b-1 e no nosso exemplo é 3 – 1 = 2 Fator Coluna = G-1 e no nosso exemplo é 4 – 1 = 3 Total é N-1 e no nosso exemplo é 12 – 1 = 11 Resíduo é ( N-1 ) - [ (B-1) +(G-1) ] = ( BK-1 ) - [ (B-1) +(G-1) ] = (B-1)(G-1) e no nosso exemplo o gl resíduo é igual a 11-(2+3) = 6 = (3-1)(4-1) = (2)(3) Tabela 2. ANOVA 2 fatores para os dados da Tabela 1. Efeito (ou fonte de variação) gl SQ QM razão F p-valor Linhas 3-1= 2 56 56/2= 28 28/3,67= 7,64 0,0224150* Colunas 4-1=3 42 42/3= 14 14/3,67= 3,82 0,0764059 Resíduo 6 22 22/6= 3,67 Total 12-1= 11 120 *p<0,05 Conclusão. Apenas o efeito fator (Linhas) é estatisticamente significante. Os valores médios dos três níveis diferem. Há pelo menos uma diferença entre as três médias. Não temos condições, por meio do teste anova, de dizer se a diferença se encontra entre a linha 1 e a linha 2 ou entre a 1 e a 3 ou entre a 2 e a 3. O teste de comparação múltipla de Tukey, por exemplo, poderá nos indicar qual desses três pares de médias apresenta diferença estatística. .................................................................................................................. 4
  • 5. 2º) CBRD. Experimento em blocos ao acaso• , sem repetições. Vamos considerar, agora, os experimentos casualizados. Nesse delineamento os tratamentos são designados às unidades experimentais com certa restrição: são sorteados dentro de cada bloco. Neste item ao considerar os CBRD vamos estudar os casos sem repetição, ou seja, com apenas uma aplicação dos tratamentos às unidades experimentais. Para a análise dos dados em planejamentos desse tipo, convém recordar o que foi dito anteriormente: “ao analisar os dados classificados em dupla-entrada, temos de aplicar o método da classificação 1 fator duas vezes: - uma vez para cada sistema de classificação. Em resumo, a anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na linha)”. Quando as unidades experimentais não são similares, devia ser intuitivamente claro que as variações nas unidades por si mesmas poderiam ofuscar (obscurecer) os verdadeiros efeitos do tratamento. O método de blocagem considera forma de avaliar as unidades heterogêneas em todos os tipos de experimentação.  O CBRD é um delineamento no qual as unidades - às quais os tratamentos são aplicados - são subdivididas em grupos homogêneos (chamados de blocos), de modo que o número de unidades em um bloco seja igual ao número (ou algum múltiplo do número) de tratamentos que esteja sendo estudado. Os tratamentos são então designados ao acaso às unidades experimentais dentro de cada bloco. Deve-se enfatizar que cada tratamento aparece em cada um dos blocos, e cada bloco recebe cada um dos tratamentos em estudo. Assim, cada um dos blocos inclui todos os tratamentos. Dentro de cada bloco os tratamentos são atribuídos às parcelas inteiramente ao acaso. Para que o experimento seja eficiente (aumente em precisão, diminuição da variância erro ou resíduo), deverá cada bloco ser tão uniforme quanto possível, mas os blocos poderão diferir bastante uns dos outros. O pesquisador só deve optar por experimento tipo CRD quando dispõe de número suficientemente grande de unidades experimentais similares. Como isso nem sempre acontece na prática, é preciso um delineamento que permita comparar adequadamente os tratamentos, mesmo que as unidades apresentem certa heterogeneidade. Unidades similares são agrupadas (dá-se o nome de blocos a esse conjunto de unidades similares). Os experimentos em blocos ao acaso surgiram na área agrícola. O campo era dividido em blocos e os blocos eram divididos em parcelas que recebiam os tratamentos (adubo, por exemplo) em investigação. Então o termo bloco designava originalmente, uma faixa de terra de mesma fertilidade. Esse tipo de delineamento surgiu em 1925 na Inglaterra por R. A. Fisher que foi, também, o idealizador do método ANOVA. O bloco pode ser uma faixa de terra, uma ala de estufa, um período de tempo, uma ninhada, uma partida de produtos industriais, uma faixa de idade – tudo depende do que está em experimentação. O CBRD pode ser empregado de forma muito eficiente quando um experimento deve ser efetuado em mais de um laboratório (blocos) ou quando vários dias (blocos) são necessários para a sua realização. O essencial é que os blocos reúnem unidades similares e que haja variabilidade entre blocos. Não teria sentido organizar esses blocos se não houvesse variabilidade entre eles. Quem vai decidir se a variabilidade entre as unidades justifica ou não a formação de blocos é o pesquisador, não o estatístico. Embora o bloco deva reunir unidades similares, isso não significa que essa reunião deva ser física. Por exemplo, se um médico pretende comparar duas drogas hipotensoras, A e B, e considerar que a pressão arterial do paciente, no início do tratamento, é importante na resposta do paciente à droga, deve organizar blocos. Cada bloco será formado por um par de pacientes com pressões arteriais similares, mas, para formar os blocos, o médico não precisa colocar seus pacientes em fila, nem juntá-los aos pares. Basta reunir os dados numéricos. Dois pacientes do mesmo bloco não precisam nem mesmo se conhecer. O objetivo do CBRD é isolar e remover do termo resíduo (erro) a variação atribuível aos blocos, aumentando assim a precisão do experimento sem aumentar o número de unidades experimentais. 5
  • 6. Historicamente, os blocos casualizados é o primeiro delineamento válido para estimar o erro experimental e testar a significância dos efeitos de tratamento apesar da heterogeneidade das unidades experimentais sobre as quais as observações são realizadas. Esse delineamento revolucionou os experimentos na agricultura no mundo todo. Não seria um exagero afirmar que ele é ainda a espinha dorsal do delineamento da ciência experimental. Porém, nenhum delineamento torna-se popular e aceito para uso geral, não importa quão bem fundamentado do ponto de vista estatístico que ele seja, se for complicado e difícil de empreendê-lo. A beleza desse planejamento em blocos é a feliz combinação de validade, simplicidade e flexibilidade. O planejamento em blocos consiste de duas etapas. A primeira é a de coletar, reunir, as unidades afins, similares para juntas formarem um grupo homogêneo; esse grupo formado é chamado de bloco. Essa operação é conhecida como blocagem. A segunda etapa é a de designar os vários tratamentos ao acaso às unidades dentro de cada bloco. Essa é a principal diferença entre o delineamento em blocos e o delineamento inteiramente casualizado. Em termos de casualização pode-se considerar que, em blocos, há uma restrição. Veremos, a seguir, a aplicação desse método para um experimento onde a unidade experimental é “a pessoa que vira bloco”. Ela recebe, sob aplicação aleatória, dois tratamentos A e B. Convém recordar que, experimentos desse tipo, onde a unidade experimental é a pessoa que recebe todos os tratamentos em comparação, é um caso especial de experimento em blocos casualizados♠ . “Toda vez que a pessoa que participa do experimento recebe todos os tratamentos em comparação, essa pessoa é um bloco – não uma unidade”. Esse tipo de experimento é muito criticado. Por exemplo, a diferença que se mede na pessoa, antes e depois de uma série de exercícios físicos, só seria explicada pelos próprios exercícios físicos? De qualquer forma, são feitos experimentos em que cada pessoa é um bloco. O pesquisador precisa apenas estar alerta para o fato – que é possível – de a pessoa se modificar por qualquer outro motivo, que não o tratamento. Embora os experimentos em que se toma cada indivíduo como bloco sejam bastante comuns é preciso muito senso crítico para planejá-los. Muitas vezes esses experimentos não têm qualquer validade. O pesquisador planeja um experimento em blocos ao acaso quando pretende eliminar uma causa de variação. Por exemplo, para testar o efeito de um hormônio sobre o crescimento  Muitas idéias aqui apresentadas foram selecionadas do livro: Estatística Experimental. Autores: S. Vieira & R. Hoffmann. Ed. Atlas. Ano 1989. 6
  • 7. de ratos – se os ratos disponíveis são de diferentes idades – o pesquisador deve organizar blocos que correspondam às idades. Os blocos também ampliam a validade da conclusão. Por exemplo, se um entomologista quer comparar a eficiência de diversos inseticidas, tanto pode usar insetos de uma única espécie como fazer a comparação usando insetos de várias espécies. O experimento seria em blocos ap acaso se cada espécie fosse um bloco. Os blocos teriam a vantagem de ampliar a validade da conclusão. Isto porque o entomologista poderia, com base em um só experimento, estabelecer conclusões para várias espécies. Em termos de eficiência, ou seja, de uma comparação de tratamentos qual seria o melhor delineamento: CRD ou CBRD? Qual seria a conseqüência de uma má escolha? Para responder temos de considerar o número de graus de liberdade do resíduo. Vamos, então, realizar uma comparação entre o número de graus de liberdade do resíduo de um experimento CRD frente a um experimento tipo CRBD. Na tabela ANOVA obtém-se um valor igual a (k-1)(r-1) para um experimento em blocos; enquanto, para um experimento CRD, o gl do resíduo será igual a k(r- 1), onde r é o número de réplicas (ou repetições). Se k for igual a 3 e r = 20, então, o gl de resíduo do CBRD seria igual a (3-1)(20-1) = 2 x 19 = 38 e o gl do CRD seria igual a 3(20-1) = 3 x 19 = 57. Essa diferença de 57 – 38 = 19 representa r-1 graus de liberdade, em geral. Em termos de notação, temos inicialmente no CRD k(r-1) e depois no CBRD (k-1)(r-1), isto é, k(r-1) – (k-1)(r-1) = r-1 graus de liberdade a menos sob a escolha de um possível mau delineamento. Como o valor de F na tabela (F, de valores críticos) aumenta quando diminui o número de graus de liberdade de resíduo, é fácil entender que o uso indevido de blocos torna o teste menos sensível. Fcalculado = QM Trat / QM resíduo ; assim, quanto menor ↓Fcalc e maior o ↑F tabela mais difícil para que se estabeleça a condição de rejeitar Ho, ou seja, de que Fcalc > F tabelado . QM resíduo = SQ res / gl res ; assim, quanto menor ↓gl res implica ⇒ aumento de↑ QM resíduo que traz como conseqüência uma diminuição de ↓ Fcalc. 7
  • 8. Exemplo 1. Experimento em blocos (CBRD), sem repetições. Numa pesquisa sobre o efeito do óleo de milho no teor de colesterol do sangue, o médico Dr. Bem Hur obteve os seguintes dados, de 7 pacientes, Tabela 3. Tabela 3. Teor de colesterol no sangue, em mg por 100g, de sete pacientes. Pacientes Tratamentos (dois tipos de dietas) Totais dos blocos Médias dos blocosA B 1 270 175 445 222,5 2 410 308 718 359,0 3 350 248 598 299,0 4 360 231 591 295,5 5 350 196 546 273,0 6 430 190 620 310,0 7 268 252 520 260,0 Totais de Tratamentos 2438 1600 Médias de Tratamentos 348,286 228,571 A análise é feita tomando-se os pacientes como blocos. Para casos desse tipo, pode-se dizer em termos gerais, que é a mesma análise dos delineamentos tipo ANOVA de medidas repetidas e, nesse especial caso, é a mesma análise que se obtém com o teste t-Student de amostras pareadas (estatística t = 4,66; vale a relação estatística F da anova é igual ao valor da estatística t-Student ao quadrado, ou seja, F = t2 = 4,662 = 21,71). Pelo mesmo procedimento do caso anterior obtém-se o seguinte resultado do teste ANOVA 2 fatores, Tabela 4. Tabela 4. ANOVA 2 fatores pata os dados da Tabela 3. Efeito (ou fonte de variação) gl SQ QM razão F p-valor Blocos 7-1= 6 22000,40 22000,40/6= 3666,70 Tratamentos 2-1=1 50160,30 50160,30/1= 50160,30 50160,30/2310, 50= 21,71 0,003* Resíduo 6 13862,70 13862,70/6= 2310,50 Total 14-1= 13 86023,40 *p<0,05 Conclusão. O efeito fator Tratamento (colunas) é estatisticamente significante. Os valores médios dos dois níveis diferem (A: 348,3±62,2mg; B: 228,6±45,9mg). O teste de comparação múltipla de Tukey, não precisa ser efetuado porque são apenas dois níveis do fator Tratamento. O cálculo de F 8
  • 9. para blocos é desnecessário. Os experimentos tipo CRBD são feitos, essencialmente, para comparar tratamentos – a comparação de blocos é secundária. Exemplo 2. Experimento em blocos (CBRD), sem repetições. Um experimento foi delineado para estudar o desempenho de quatro diferentes detergentes de tecidos de roupas. Os seguintes índices de limpeza, Tabela 5, foram obtidos (maior o índice maior a limpeza) por meio de um instrumento especial para três diferentes tipos comuns de manchas. A hipótese da pesquisa é saber se há diferença entre os detergentes? Tabela 5. Índice de limpeza de 12 tecidos manchados segundo tipo de detergente e tipo de mancha. Manchas Detergentes Total (média: x ) 1 2 3 4 1 45 47 48 42 182 (45,50) 2 43 46 50 37 176 (44,00) 3 51 52 55 49 207 (51,75) Total (média: x ) 139 145 153 128 565 46,333 48,333 51,000 42,667 média geral: 565/12 = 47,083 Resolução Vamos aplicar a mesma fórmula, porém, com outra forma♣ , mais direta, para se obter as somas de quadrados entre grupos (referente às colunas e/ou às linhas). SQE = (∑T2 /n) - (FC); onde T... é o total da coluna (ou linha); n ... é o tamanho da amostra e FC é o chamado fator de correção dado pela soma dos valores ao quadrado dividido pelo tamanho amostral total, ou seja, FC = (∑x)2 / N. Análise dos dados segundo a classificação do fator Detergente “coluna”. anova 1 fator. SQ coluna = [ (1392 /3) + (1452 /3) +(1532 /3)+(1282 /3) ]– (182+176+207)2 /12 = SQ coluna = 26713,000 – 26602,083 = 110,917 Análise dos dados segundo a classificação do fator Mancha “linha” (blocos). anova 1 fator. SQ linha = 1822 /4 + 1762 /4 +2072 /4– (182+176+207)2 /12 = 135,167 Cálculo da Soma de Quadrados Total SQ Total = ∑x2 – FC = ∑x2 – (∑x)2 / n  SQ = ∑(x-μ)2 = ∑(x2 -2xμ +μ2 ) = ∑(x2 )-2μ∑x +∑(μ2 )= ∑x2 -2μ2 n +n μ2 =∑x2 - nμ2 = ∑x2 - n(∑x)2 / n2 = ∑x2 – (∑x)2 / n que é a forma usual do cálculo da soma de quadrados total. Dessa forma usual vem SQfator coluna = n∑( x -μ)2 = n∑ x 2 –(∑x)2 / n = n(∑x)2 /n2 –(∑x)2 / n = (Total)2 /n –(∑x)2 / n = ∑ (T2 /n) – FC. 9
  • 10. SQ Total = (452 +432 +512 +472 +462 +522 +482 +502 +552 +422 +372 +492 ) – (565)2 /12 = 264,917 SQ Total = 26867,000 – 26602,083 = 264,917 SQ Total = SQ LINHA + SQ COLUNA + SQ RESÍDUO assim, SQ RESÍDUO = SQ Total – (SQ LINHA + SQ COLUNA) SQ RESÍDUO = 264,917 – (135,167+110,917) = 264,917 – 246,084 = 18,833 Tabela 6. ANOVA 2 fatores para os dados da Tabela 5. Efeito gl SQ QM F P Detergente 3 110,917 36,972 11,78 0,006* Manchas 2 135,167 67,583 Erro 6 18,833 3,139 Total 11 264,917 *p<0,05 Conclusão: Há diferença estatisticamente significante entre os quatro detergentes. A hipótese H0(μ1 = μ2 = μ3 = μ4 ) é rejeitada. Os valores médios diferem! Teste de comparação múltipla de Tukey (5%) para o efeito Detergente Por meio do Teste de Tukey (5%) obtém-se o valor HSD MSW = QM resíduo = 3,139 ; n = 3; q crítico = 4,897; HSD = 5,0095 valores das diferenças a serem comparadas com o valor HSD ou dms.(=5,0095) Detergente Média 1( x =46,33) 2( x =48,333) 3( x =51) 1 46,333 2 48,333 2,000 3 51,000 4,667 2,667 4 42,667 3,667 5,667* 8,333* Alfa (nível de significância) 0,05 Valor Crítico Q 4,897 Valor Crítico para Comparação = 5,0095 Graus de liberdade do termo Erro (resíduo) = 6 Formação de grupos homogêneos após a aplicação do teste de Tukey(5%) Detergente Média Grupos Homogêneos* 3 51,000 A 2 48,333 A 1 46,333 AB 4 42,667 B 10
  • 11. * médias seguidas de letras diferentes diferem estatisticamente Alfa (nível de significância) 0,05 Valor Crítico Q 4,897 Valor Crítico para Comparação = dms = HSD = 5,0095 Graus de liberdade do termo Erro (resíduo) = 6 Conclusão: Grupos 1 e 4 (letra A e AB) não diferem entre si (letra B comum). Grupo 4 (letra B) difere dos grupos 2 e 3 (letra A). Grupo 1 (letra AB) não difere do grupo 4 e, também, não difere dos grupos 2 e 3, ou seja, o detergente 1 ocupa um comportamento intermediário em relação aos outros três detergentes. Quanto à limpeza o pior detergente é o tipo 4. Os detergentes tipo 1, 2 e 3 não apresentaram diferença do ponto de vista estatístico. ........................................................................................................................................................ Exemplo 3. Experimento em blocos (CBRD), sem repetições. Supõe-se que a impureza de um produto químico é afetada pela pressão. Optou-se por utilizar a temperatura como fator de blocagem. Os dados são apresentados na Tabela 7 mostrada a seguir. Tabela 7. Quinze valores de impureza, sob condições de temperatura (ºC) e pressão (mmHg), obtidos num experimento em blocos ao acaso. Temperatura Pressão Total Média x 25 30 35 40 45 100 5 4 6 3 5 23 4,60 125 3 1 4 2 3 13 2,60 150 1 1 3 1 2 8 1,60 Total 9 6 13 6 10 44 geral: 2,93 Média x 3,00 2,00 4,33 2,00 3,33 Resolução FC = fator de correção da soma de quadrados = (44)2 /15 = 129,067 SQ Total = SQ Total = ∑x2 – (∑X)2 / n = 166 – (44)2 /15= 166 – 129,067 = 36,933 SQ linha = SQ temperatura = SQ blocos = (232 +132 +82 ) / 5 – FC = 152,400-129,067 = 23,333 SQ coluna = SQ pressão = (92 +62 +132 +62 +102 ) / 3 – FC = 140,667-129,067 = 11,600 SQ Total = SQ LINHA + SQ COLUNA + SQ RESÍDUO assim, SQ RESÍDUO = SQ Total – (SQ LINHA + SQ COLUNA) SQ RESÍDUO = 36,933– (23,333+11,600) = 36,933– 34,933 = 2,000 Cálculo dos Graus de Liberdade (gl) Fator Linha = Blocos = b-1 e no nosso exemplo é 3 – 1 = 2 11
  • 12. Fator Coluna = Pressão = G-1 e no nosso exemplo é 5 – 1 = 4 Total é N-1 e no nosso exemplo é 15 – 1 = 14 Resíduo é ( N-1 ) - [ (B-1) +(G-1) ] = ( BG-1 ) - [ (B-1) +(G-1) ] = (B-1)(G-1) e no nosso exemplo é gl resíduo = 14-(2+4) = 8 = (3-1)(5-1) = (2)(4) Cálculo da estatística F Variância Efeito Coluna (pressão) = QM colunas / gl colunas = (11,600/4) = 2,900 Variância Resíduo = QM resíduo / gl resíduo = (2,00/8) = 0,250 F calculado = Var Coluna / Var resíduo = Var Pressão/ Var resíduo = 2,900/0,25 = 11,60 Comando no Minitab para se obter o p-valor associado ao F calculado é após Edit >> Command Line Editor (ou Ctrl+L) digitamos cdf 11.60 k1; F 4 8. let k2 = 1-k1 print k2 K2 0.00206337 clicar no (X) Submit Commands Tabela 8. ANOVA 2 fatores para os dados da Tabela 7. Efeito gl SQ QM F P Pressão 4 11,600 2,900 11,60 0,002* Temperatura 2 23,333 11,667 Erro 8 2,000 0,250 Total 14 36,933 *p<0,05 ....................................................................................................................................................... 12
  • 13. 3º) experimento em blocos ao acaso (CRBD) com repetições Nesse item vamos considerar três situações. A primeira com os blocos apresentando o mesmo valor médio em cada tratamento; na segunda situação, temos uma diferença constante entre os valores médios de cada bloco; e na terceira valores desiguais entre os valores médios dos blocos em cada tratamento. Entende-se melhor o que queremos explicar por meio dos exemplos. Primeira situação. Valores médios iguais dos blocos. Exemplo 1. Dados de um experimento em blocos ao acaso com repetições. Blocos Tratamentos Total das linhas Média dos blocos A B C D I 22 31 30 39 408 3426 38 31 42 30 36 38 45 Médias dos blocos 26 e 26 35 e 35 33 e 33 42 e 42 II 25 34 32 41 408 3426 35 33 42 27 36 34 43 Total 156 210 198 252 Total geral: 816 Média geral: 34 Resolução. Segue-se o mesmo procedimento dos casos anteriores, ou seja, cálculo do fator de correção; cálculo da soma de quadrados total; cálculo da soma de quadrados devido ao fator coluna (tratamentos); cálculo da soma de quadrados do fator linha (blocos) e, enfim, onde está a novidade. A resposta, para essa justificada pergunta, é a relação: 13
  • 14. SQ Total = SQ COLUNA + SQ LINHA + SQ RESÍDUO. Cálculo da Soma de Quadrados dos Tratamentos SQ trat = {1562 +2102 +1982 +2522 )/6} – (816)2 /24 = 780,00 Cálculo da Soma de Quadrados dos Blocos SQ blocos = {4082 +4082 )/12} – (816)2 /24 = 27744-27744 = 0 Cálculo da Soma de Quadrados dos Resíduos SQ resíduo= ∑(x - x )2 onde x é o valor de cada célula (casela) e x é a média de cada casela SQ resíduo = {42 +02 +42 }+{42 +32 +12 }+{32 +22 +52 }+{32 +02 +32 } referente ao bloco I +{12 +02 +12 }+{12 +02 +12 }+{12 +02 +12 }+{12 +02 +12 } referente ao bloco I I= = {32+26+38+18}+{2+2+2+2} = 114 + 8 = 122 Nesse nosso exemplo os números calculados indicam: 902,00 = 780,00 + 0 + 122 902,00 = 902,00 relação de igualdade. Conclusão: valeu nesse caso a relação: SQ Total = SQ COLUNA + SQ LINHA + SQ RESÍDUO. Será que essa relação, na presença de repetições, sempre é válida? Segunda situação. Valores médios dos blocos diferem de uma constante. Exemplo 2. Dados de um experimento em blocos ao acaso com repetições. Blocos Tratamentos Total das linhas Média dos blocos A B C D 22 31 30 39 14
  • 15. I 408 3426 38 31 42 30 36 38 45 Médias dos blocos 26 e 30 35 e 39 33 e 37 42 e 46 II 29 38 36 45 456 3830 39 37 46 31 40 38 47 Total 168 222 210 264 Total geral: 864 Média geral: 36 Tratamentos N Média DP 1 6 28,00 3,41 2 6 37,00 3,22 3 6 35,00 3,58 4 6 44,00 2,97 Nesse caso, também, vale a relação: SQ Total = SQ COLUNA + SQ LINHA + SQ RESÍDUO. 998,00 = 780,00 + 96 + 122 Terceira situação. Vai aparecer o fator interação! Valores desiguais entre os valores médios dos blocos em cada tratamento Exemplo 3. Dados de um experimento em blocos ao acaso com repetições. Blocos Tratamentos Total das linhas Média dos blocos A B C D I 22 31 30 39 408 3426 38 31 42 30 36 38 45 Médias dos blocos 26 e 32 difere de 6 35 e 51 difere de 16 33 e 45 difere de 12 42 e 48 difere de 6 15
  • 16. II 27 47 42 44 528 4434 50 45 47 35 56 48 53 Total das colunas 174 258 234 270 Total geral: 936 Média geral: 39 Tratamentos N Média DP A 6 29,00 4,98 B 6 43,00 9,51 C 6 39,00 7,38 D 6 45,00 4,77 Nesse caso, também, vale ainda a relação: SQ Total = SQ COLUNA + SQ LINHA + SQ RESÍDUO. 1874,00 = 912,00 + 600,00 + 254,00 ?? não (esse caso difere dos outros dois) 1874,00 = 1766,00 ?? Para que seja válida essa relação de igualdade temos de acrescentar o valor diferença = 1874,00 – 1766,00 = 108 Esse valor acrescentado será denominado de SQ interação : soma de quadrados do fator interação que aparece devido à presença de repetições e da diferença entre os valores médios dos blocos nos tratamentos. O gráfico de médias ajuda-nos a observar (e a verificar) a existência do efeito interação. 16
  • 17. Grupos médias DCBA 50 45 40 35 30 25 Blocos 1 2 6 16 12 6 Figura 1. Gráfico de médias referente às seis condições experimentais. Ilustração do efeito interação entre as duas variáveis em estudo. Para avaliar se essa diferença, entre os quatro valores diferenças, difere estatisticamente temos de aplicar verificar se a razão F do efeito interação é estatisticamente significante. Em um experimento em blocos o efeito interação, em geral, não é um efeito interessante, ou seja, avaliado. Há uma suposição inicial da inexistência desse efeito interação. Tabela W. ANOVA dois fatores para os dados do exemplo 3, terceira situação. Efeito gl SQ QM F P Blocos 1 600,00 600,00 37,80 0,001 Tratam 3 912,00 304,00 19,15 0,001 Interação 3 108,00 36,00 2,27 0,120 Erro 16 254,00 15,88 Total 23 1874,00 Por meio do resultado do teste ANOVA 2 fatores, Tabela W, pôde-se verificar que o efeito interação é estatisticamente não significante (p = 0,120 >0,05). Então, podemos desconsiderar o valor 17
  • 18. Soma da Soma de Quadrados correspondente ao efeito interação (no caso foi de 108) e, assim, obtemos uma outra tabela ANOVA, a usual em experimento em blocos ao acaso, que desconsidera o efeito interação, Tabela Z mostrada a seguir. Tabela Z. ANOVA dois fatores para os dados do exemplo 3, terceira situação. Efeito gl SQ QM F P BLOCOS 1 600,00 600,000 TRATAM 3 912,00 304,000 15,96 0,0001 Erro 19 362,00 19,053 Total 23 1874,00 18
  • 19. 4º) experimento inteiramente casualizado (CRD) com repetições. Nesse item vamos considerar os experimentos que seguem um delineamento fatorial. Não vamos considerar fatores como blocos. Blocagem, agora, não nos interessa por um motivo de didática, apenas. Vamos considerar dois fatores, duas variáveis experimentais, cujos efeitos sobre a unidade experimental são avaliados pela variável resposta. Esses efeitos, dessas duas variáveis, nos interessam. Queremos avaliá-los isoladamente, efeitos principais e, também, se houver repetições (caso mais freqüente, comum) vamos ter de nos enfrentar com o efeito interação. Que significa saber se há ou não “diferença entre as diferenças”. O termo interação não apresenta, no jargão da estatística, o mesmo significado quando empregado na ciência biológica. A Farmacologia, por exemplo, que considera a interação entre as drogas, o efeito da mistura, da ação conjunta entre vários medicamentos sobre a pessoa em comparação com a ação individual desses medicamentos sobre a pessoa. Considera-se, agora, como exemplo de um delineamento fatorial o mesmo exemplo anterior, mas com uma alteração apenas. Dessa vez, não houve blocagem. Não há o fator blocos. A casualização dos tratamentos não foi restrita aos blocos. Não houve restrição alguma quanto ao sorteio dos tratamentos às unidades experimentais. Porém, a forma de análise dos dados é análoga, ou seja, o mesmo procedimento. O novo fator será denominado de Termociclagem Mecânica, por exemplo, indicado por TCM que apresentará dois níveis. O nível I como ausência e o nível II como presença de TCM. O outro fator, tratamentos, pode ser considerado como Tratamentos Superficiais apresentando quatro diferentes níveis: Controle, Alumina, Rocatec e New. A variável resposta é o resultado do teste de tração (em megapascal, MPa) obtido numa máquina de ensaio universal. A unidade experimental é o corpo de prova em forma de cilindro. 19
  • 20. Exemplo 1. Dados de resistência a tração (MPa) de um experimento fatorial (tipo 4 x 2) com três repetições. TCM Tratamentos Superficiais Total das linhas Média dos níveis do fator TCMA: controle B: alumina C: rocatec D: new I: ausência 22 31 30 39 408 3426 38 31 42 30 36 38 45 médias dos níveis 26 e 32 difere de 6 35 e 51 difere de 16 33 e 45 difere de 12 42 e 48 difere de 6 II: presença 27 47 42 44 528 4434 50 45 47 35 56 48 53 Total das colunas 174 258 234 270 Total geral: 936 Média geral: 39 Tratamentos N Média DP A 6 29.00 4.98 B 6 43.00 9.51 C 6 39.00 7.38 D 6 45.00 4.77 Nesse caso, com repetições, é válida a seguinte relação entre as somas de quadrados: SQ Total = SQ COLUNA + SQ LINHA + SQ Interação + SQ RESÍDUO. 1874,00 = 912,00 + 600,00 + 254,00 + SQ Interação Assim SQ interação = 108. Com o mesmo procedimento dos casos anteriores obtém-se a Tabela Y referente ao teste ANOVA (2 fatores) dos dados. Cálculo dos Graus de Liberdade (gl) Fator Linha = TCM = L-1 e no nosso exemplo é 2 – 1 = 1 Fator Coluna = Tratamentos = G-1 e no nosso exemplo é 4 – 1 = 3 20
  • 21. Total é N-1 e no nosso exemplo é 24 – 1 = 23 = (LCR) – 1 onde R é o número de repetições Fator Interação é determinado pelo produto dos graus de liberdade do fator na linha pelo fator coluna = (L-1)(G-1) = (2-1)(4-1) = 3. O gl resíduo é dado pela diferença entre o gl do total em relação aos outros fatores, ou seja, (24-1)-{(2-1)+(4-1)+(2-1)(4-1)) = 23- (1+3+3) = 23-7 = 16. Ou o gl resíduo é dado pela fórmula gl resíduo = (LC)(R – 1) onde R é o número de repetições; assim gl resíduo = (2 x 4)(3-1) = 8 (2) = 16. Tabela Y. ANOVA (2 fatores) dos dados de resistência a tração (MPa) de um experimento fatorial (tipo 4 x 2) com três repetições. Efeito gl SQ QM F P Tratamento 3 912,00 304,000 19,15 0,0001* TCM 1 600,00 600,000 37,80 0,0001* Interação 3 108,00 36,000 2,27 0,1198 Erro 16 254,00 15,875 Total 23 1874,00 * p<0,05 A interpretação inicial dos resultados de uma tabela ANOVA (2 fatores) começa pelo efeito do fator interação. Repito. Primeiro avalie o efeito interação. Depois, se for o caso, avalie os efeitos principais. Diante dos efeitos principais numa possível avaliação há dois casos no gráfico de médias das condições experimentais: interação tipo ordinal e interação do tipo não ordinal. Vamos explicitar o que dissemos acima. Se o efeito interação foi avaliado como significante, então, pode – sempre é possível – não avaliar os efeitos principais. O foco de atenção do resultado é, então, o efeito interação e ponto final. Porém, o efeito principal que foi, também, avaliado como significante pode ser interpretado (teste de Tukey, por exemplo) se, no gráfico de médias das condições experimentais, ele se mostrar como efeito ordinal (ordinal interaction effect). Ainda, há o caso de o efeito principal que foi, também, avaliado como significante não pode ser interpretado (teste de Tukey, por exemplo) se, no gráfico de médias das condições experimentais, ele se mostrar como efeito não ordinal (disordinal interaction effect). Quando há o efeito tipo ordinal as linhas que unem os valores médios se apresentam como paralelas. Caso contrário, diante do efeito não ordinal há um cruzamento dessas linhas que unem os valores médios do gráfico de médias. Se o efeito interação for não significante, então, vamos interpretar os efeitos principais que apresentaram significância (p valor inferior ao nível de significância). 21
  • 22. O efeito interação é estatisticamente não significante. Assim, o relacionamento entre os níveis do fator Termociclagem expressa mediante a perda de resistência (diferença entre presença menos ausência) obtido no grupo controle é praticamente a mesma perda de resistência obtida nos demais tipos de tratamentos superficiais, Figura Z. Tratamentos Superficiais MPa DCBA 50 45 40 35 30 25 TCM ausência presença Figura Z. Gráfico de médias referente às seis condições experimentais. Perda de resistência (indicada pela seta) devido à ação da Termociclagem mecânica, TCM, em cada tipo de tratamento. Pode-se concluir mediante o resultado do teste ANOVA, Tabela Y, que há diferença estatisticamente significante entre os quatro Tratamentos. Para o fator Tratamentos, a hipótese H0(μ1 = μ2 = μ3 = μ4 ) é rejeitada. Os valores médios diferem! Teste de comparação múltipla de Tukey (5%) para o efeito Tratamento Superficial Por meio do Teste de Tukey (5%) obtém-se o valor HSD 22
  • 23. MSW = QM resíduo = 15,875 ; n = 6; q crítico = 4,047; HSD = 6,5824 valores das diferenças a serem comparadas com o valor HSD ou dms.(=6,5824) Tratamentos Média A B C A 29,000 ---- B 43,000 14,000* ---- C 39,000 10,000* 4,000 ---- D 45,000 16,000* 2,000 6,000 Alfa (nível de significância) 0,05 Valor Crítico Q 4,047 Valor Crítico para Comparação = 6,5824 Graus de liberdade do termo Erro (resíduo) = 16 Formação de grupos homogêneos após a aplicação do teste de Tukey(5%) Tratamentos Média Grupos Homogêneos* D 45,000 A B 43,000 A C 39,000 A A 29,000 B * médias seguidas de letras diferentes diferem estatisticamente Pode-se concluir, ainda, mediante o resultado do teste ANOVA, Tabela Y, que há diferença estatisticamente significante entre os dois níveis entre o fator Termociclagem mecânica (TCM). Assim, como são apenas dois níveis desse fator, não há necessidade de se efetuar um teste de comparação múltipla como o teste de Tukey. Se os dois níveis diferem pode-se estabelecer que a condição de ausência de Termociclagem é menos resistente (34,00±6,77MPa) que a condição de presença de Termociclagem (44,00±8,37MPa). Quando se comparam as seis condições experimentais entre si, pelo teste de Tukey, obtém-se, por exemplo, que a condição Tratamento A(controle) sem TCM é a menos resistente (média igual a 26MPa) enquanto as mais resistentes são as condições Tratamentos B (alumina) e D(new) com TCM. Outras considerações podem ser ainda obtidas. Trata TCM Média Grupos Homogêneos* B 2 51 A 23
  • 24. D 2 48 A C 2 45 AB D 1 42 ABC B 1 35 BCD C 1 33 CD A 2 32 CD A 1 26 D * médias seguidas de letras diferentes diferem estatisticamente Alfa (nível de significância) 0,05 Valor Crítico Q 4,903 Valor Crítico para Comparação = 11,278 Graus de liberdade do termo Erro (resíduo) = 16 ............................................................................................................... 24
  • 25. Apêndice Cálculo direto da Soma de Quadrados do Fator Interação Experimento inteiramente casualizado. Planejamento fatorial (com repetições). Experimento inteiramente casualizado. Planejamento fatorial. Médicos psiquiatras de um centro de Trauma desenvolveram um programa para ajudar as vítimas de danos cerebrais a conseguirem alcançar certo nível aceitável de independência. No experimento participaram 27 pessoas com o mesmo grau de dano cerebral. O objetivo foi comparar diferentes combinações de tratamentos psiquiátricos e de fisioterapias. Para cada pessoa foi designada uma das 9 diferentes combinações de três tratamentos psiquiátricos e de três programas de fisioterapias. Houve três sujeitos para cada combinação. A variável resposta é o número de meses de duração entre o indivíduo da terapia e o tempo no qual o paciente foi capaz de voltar a agir com independência. Os resultados foram apresentados na forma de tabela mostrada a seguir. Valores obtidos por 27 pessoas submetidas ao teste psiquiátrico e ao programa de fisioterapia. Programa de fisioterapia Tratamento psiquiátrico A B C 1 9 10 11 10 11 12 13 11 13 2 10 11 12 11 12 15 15 12 15 3 10 12 15 12 14 16 13 15 17 soma 100 113 124 média 11,11 12,55 13,78 Soma geral = 337 ; Média geral = 12,48 vamos dispor os dados de uma forma conveniente para o cálculo da SQ interação Programa Fisioterapia = Fator B Tratamento Psiquiátrico = fator A Total 1 2 3 1 9 10 11 10 11 12 13 11 13 100 total a1b1: 30 total a2b1: 33 total a3b1: 37 2 10 11 15 11311 12 12 12 15 15 total a1b2: 33 total a2b2: 38 total a3b2: 42 3 10 12 13 12412 14 15 15 16 17 total a1b3: 37 total a2b3: 42 total a3 b3: 45 100 113 124 337 25
  • 26. Já sabemos - procedimento visto anteriormente -, como efetuar o cálculo da SQ das linhas e das colunas. Ou seja, somo o total da coluna (ou da linha) e elevo ao quadrado e esse valor deve ser dividido pelo número de elementos (tamanho da amostra, número de repetições) e, dessa soma geral subtraímos o fator de correção, FC = (∑X)2 / N). Agora, o procedimento é bem parecido para se obter a SQ do fator interação. O procedimento é o seguinte: 1º) Cálculo da SQ AB ou SQ Tratamentos AB as 9 condições experimentais (os 9 tratamentos: 3 x 3) a1b1 a2b1 a3b1 a1b2 a2b2 a3b2 a1b3 a2b3 a3b3 N 3 3 3 3 3 3 3 3 3 Total: T 30 33 37 33 38 42 37 42 45 T2 900 1089 1369 1089 144 1764 1369 1764 2025 ∑T2 = 12813,00 (12813,00) / 3 = 4271,00 FC = (∑X)2 / N) = (337)2 /27 = 4206,2593 SQ tratam AB = 4271,00 - (337)2 /27 = 4271,00 – 4206,2593 = 64,7407 2º) Cálculo da SQ A. Cálculo da SQ B. Temos de obter essas somas porque a SQ interação é obtida pela diferença entre o valor calculado antes (SQ tratam AB) e a soma (SQA+SQB). SQ A = {(1002 +1132 +1242 ) / 9 – FC} = (38145,00/9) – 4206,2593 = 4238,3333 - 4206,2593 = 32,0740 SQ B = {(1002 +1132 +1242 ) / 9 – FC} = (38145,00/9) – 4206,2593 = 4238,3333 - 4206,2593 = 32,0740 3º) Cálculo da SQ interação SQ trata AB = SQ A + SQ B + SQ interação → SQ interação = SQ trata AB – { SQ A + SQ B} SQ interação = 64,7407 - {32,074 + 32,074} = 64,7407 - 64,148 = 0,593aprox. SQ interação = 0,593 Variância do fator interação = { SQ interação = 0,593} / gl interação O número de graus de liberdade (gl) do fator interação é dado pelo produto (a-1)(b-1) no nosso exemplo, gl inter = (3-1)(3-1) = 4 Portanto Variância do fator interação = 0,593/4 = QM inter = 0,1481 Fórmula do número de graus de liberdade (gl) na ANOVA 2 fatores de um experimento fatorial 26
  • 27. Efeito gl no nosso exemplo A: a-1 3 -1 = 2 B: b-1 3 -1 = 2 Interação (A x B): (a-1)(b-1) (3-1)(3-1) = 2 x 2 = 4 Erro ab(r -1) (3)(3)[3-1] = 9 x 2 = 18 Total: N-1= abr-1 27-1 = 3(3)(3) – 1 = 26 r ... corresponde ao número de repetições (no nosso exemplo é 3) 27