1. ANOVA 2 fatores (two-way)
Introdução♥
Em muitos trabalhos, que envolvem a realização de experimentos, é comum os
pesquisadores se depararem com a questão: como avaliar se os resultados obtidos são
confiáveis? Sabemos que qualquer medida realizada é sempre afetada por erros. Erros muito
pequenos não trarão grandes implicações. Contudo, se forem significativos, poderão prejudicar
seriamente os resultados levando a falsas conclusões. Portanto conhecer a natureza dos erros e
preparar planejamentos que possam minimizá-los é uma estratégia que deve estar presente no
dia-a-dia de todo pesquisador.
Existem dois tipos de erros, o erro sistemático e o erro aleatório. O primeiro tem como
característica afetar os resultados dos experimentos sempre na mesma direção, seja para mais
ou para menos. Um exemplo simples deste tipo de situação é o caso de uma balança
descalibrada que pode indicar sempre massas maiores que as reais. Mas vale notar que os erros
sistemáticos podem ser identificados e, portanto, evitados. Por outro lado, há um tipo de erro
que afeta as medidas sem nenhuma tendência clara. As medidas podem oscilar, ora para mais,
ora para menos. Este tipo e erro é chamado de erro aleatório e, infelizmente, sempre estará
presente em maior ou menor grau.
Ao fazer um estudo é sempre interessante fazer replicatas, repetições, pois permite que o
erro presente nas medidas seja investigado. Além disso, com a realização de várias replicatas
aumentam as chances de se aproximar mais do valor exato. Isto é evidenciado por um
importante princípio da estatística: o teorema do limite central, que comprova que o erro no
valor médio é menor que o erro de uma observação individual (referência: Barros Neto, B,
Scarminio, I.S., Bruns, R.E. Como fazer experimentos: pesquisa e desenvolvimento na ciência e na indústria.
Ed. da Unicamp; Campinas, 2001).
Muitas vezes as características do procedimento experimental dificultam muito a
execução de replicatas autênticas. Não é correto simplesmente realizar duas medidas do
mesmo experimento de forma seqüencial, pois um erro que afetar a primeira medida
certamente irá, de forma sistemática, afetar a seguinte.
nessa introdução as idéias expostas foram copiadas do artigo: Conseqüências da análise incorreta de experimentos
blocados, sob autoria de João Alexandre Bortoloti e Roy Edward Bruns. Artigo publicado na revista Química Nova, vol.
30, nº 2, págs. 436-440, 2007.
2. Não são raros os casos em que o ajuste das condições experimentais é extremamente
trabalhoso ou lento. Portanto, parece haver um dilema, realizar medidas com duplicatas e arcar
com o custo do trabalho envolvido, mas garantir a qualidade das medidas, ou evitar um grande
esforço no laboratório, mas correr o risco de ter todo o seu trabalho prejudicado. É neste
contexto que surge uma interessante possibilidade, a blocagem dos experimentos.
continuação da aula sobre Anova 1 fator
Ao analisar os dados classificados em dupla-entrada, temos de aplicar o método da
classificação 1 fator duas vezes: - uma vez para cada sistema de classificação. Em resumo, a
anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na linha).
Veremos a aplicação desse método (anova 2 fatores) em dois tipos de delineamentos:
CRD e CRBD sob presença ou ausência de repetições, replicatas. Por repetição (replicata) se
entende um teste completo de todos os tratamentos no experimento (a replication is a
complete run for all treatments to be tested in the experiment).
1º) experimento inteiramente ao acaso (completely randomized design, CRD) sem
repetições;
2º) experimento em blocos ao acaso (randomized complete block design (CRBD) sem
repetições;
3º) experimento em blocos ao acaso (CRBD) com repetições;
4º) experimento inteiramente casualizado (CRD) com repetições.
2
3. 1º) CRD. Experimento inteiramente ao acaso♣
, sem repetições.
Exemplo 1.
Por exemplo, 12 jovens foram classificados em três grupos de acordo com a idade deles.
Ao mesmo tempo eles foram classificados de acordo com o sexo em dois grupos: masculino e
feminino. Assim, cada jovem esteve sujeito a dois sistemas de classificação simultaneamente,
Tabela 1.
Tabela 1. Dados obtidos no experimento tipo CRD.
colunas
linhas
1 2 3 4 total
linha
média
linha
efeito
linha
1 6 2 9 3 20 5 -2
2 8 9 11 12 40 10 +3♥
3 4 4 10 6 24 6 -1
total coluna 18 15 30 21 84
média coluna 6 5 10 7 7
efeito coluna -1♠
-2 +3 0 0
♠
(-1) = efeito coluna = média coluna 1(=6) – média geral (=7)
♥
(+3) = efeito linha = média linha 2(=10) – média geral (=7)
Análise dos dados segundo a classificação do fator “linha”.
anova 1 fator.
SQ linha = 4{(-2)2
+ (3)2
+ (-1)2
} = 56
Análise dos dados segundo a classificação do fator “coluna”.
anova 1 fator.
SQ coluna = 3{(-1)2
+ (-2)2
+ (3)2
+(0)2
} = 42
Cálculo da Soma de Quadrados Total
SQ Total*= ∑x2
– (∑X)2
/ n =
* dedução dessa fórmula = SQ = ∑(x-μ)2
= ∑(x2
-2xμ +μ2
) = ∑(x2
)-2μ∑x +∑(μ2
)= ∑x2
-2μ2
n +n μ2
=∑x2
- nμ2
=
∑x2
- n(∑x)2
/ n2
= ∑x2
–(∑x)2
/ n que é a forma usual do cálculo da soma de quadrados total.
{(52
+22
+92
+32
+82
+92
+112
+122
+42
+42
+102
+62
)-(5+2+9+3+8+9+11+12+4+4+10+6)2
/ 12 }=
SQTotal = 120
Cálculo da Soma de Quadrados Resíduo (há dois métodos)
a) por meio da diferença (método mais fácil)
Denomina-se experimento inteiramente ao acaso quando os tratamentos (fatores) são designados às unidades
experimentais sem qualquer restrição. Esse tipo de delineamento só pode ser conduzido quando as unidades experimentais
(corpos-de-prova, pessoas, etc...) são similares. Por similares deve-se entender: não no sentido de igualdade, mas no
sentido de que essas unidades respondem ao tratamento da mesma forma.
3
4. SQ Total = SQ LINHA + SQ COLUNA + SQ RESÍDUO
assim, SQ RESÍDUO = SQ Total – (SQ LINHA + SQ COLUNA)
SQ RESÍDUO = 120 – (56+42) = 120 – 98 = 22
b) por meio do cálculo direto (método mais trabalhoso)
22
+(-1) 2
+12
+(-2)2
+(-1)2
+12
+(-2)2
+22
+(-1)2
+02
+12
+02
= 4+1+1+4+1+1+4+4+1+0+1+0 = 22
Cálculo dos Graus de Liberdade (gl)
Fator Linha = Blocos = b-1 e no nosso exemplo é 3 – 1 = 2
Fator Coluna = G-1 e no nosso exemplo é 4 – 1 = 3
Total é N-1 e no nosso exemplo é 12 – 1 = 11
Resíduo é ( N-1 ) - [ (B-1) +(G-1) ] = ( BK-1 ) - [ (B-1) +(G-1) ] = (B-1)(G-1)
e no nosso exemplo o gl resíduo é igual a 11-(2+3) = 6 = (3-1)(4-1) = (2)(3)
Tabela 2. ANOVA 2 fatores para os dados da Tabela 1.
Efeito
(ou fonte de
variação)
gl SQ QM razão F p-valor
Linhas 3-1= 2 56 56/2= 28 28/3,67= 7,64 0,0224150*
Colunas 4-1=3 42 42/3= 14 14/3,67= 3,82 0,0764059
Resíduo 6 22 22/6= 3,67
Total 12-1= 11 120
*p<0,05
Conclusão. Apenas o efeito fator (Linhas) é estatisticamente significante. Os valores médios dos
três níveis diferem. Há pelo menos uma diferença entre as três médias. Não temos condições, por meio
do teste anova, de dizer se a diferença se encontra entre a linha 1 e a linha 2 ou entre a 1 e a 3 ou entre
a 2 e a 3. O teste de comparação múltipla de Tukey, por exemplo, poderá nos indicar qual desses três
pares de médias apresenta diferença estatística.
..................................................................................................................
4
5. 2º) CBRD. Experimento em blocos ao acaso•
, sem repetições.
Vamos considerar, agora, os experimentos casualizados. Nesse delineamento os
tratamentos são designados às unidades experimentais com certa restrição: são sorteados
dentro de cada bloco.
Neste item ao considerar os CBRD vamos estudar os casos sem repetição, ou seja, com
apenas uma aplicação dos tratamentos às unidades experimentais.
Para a análise dos dados em planejamentos desse tipo, convém recordar o que foi dito
anteriormente: “ao analisar os dados classificados em dupla-entrada, temos de aplicar o
método da classificação 1 fator duas vezes: - uma vez para cada sistema de classificação. Em
resumo, a anova 1 fator duas vezes (uma vez para o fator na coluna e uma vez para o fator na
linha)”.
Quando as unidades experimentais não são similares, devia ser intuitivamente claro que
as variações nas unidades por si mesmas poderiam ofuscar (obscurecer) os verdadeiros efeitos
do tratamento. O método de blocagem considera forma de avaliar as unidades heterogêneas
em todos os tipos de experimentação.
O CBRD é um delineamento no qual as unidades - às quais os tratamentos são aplicados - são subdivididas em grupos
homogêneos (chamados de blocos), de modo que o número de unidades em um bloco seja igual ao número (ou algum
múltiplo do número) de tratamentos que esteja sendo estudado. Os tratamentos são então designados ao acaso às unidades
experimentais dentro de cada bloco. Deve-se enfatizar que cada tratamento aparece em cada um dos blocos, e cada bloco
recebe cada um dos tratamentos em estudo. Assim, cada um dos blocos inclui todos os tratamentos. Dentro de cada bloco
os tratamentos são atribuídos às parcelas inteiramente ao acaso. Para que o experimento seja eficiente (aumente em
precisão, diminuição da variância erro ou resíduo), deverá cada bloco ser tão uniforme quanto possível, mas os blocos
poderão diferir bastante uns dos outros.
O pesquisador só deve optar por experimento tipo CRD quando dispõe de número suficientemente grande de unidades
experimentais similares. Como isso nem sempre acontece na prática, é preciso um delineamento que permita comparar
adequadamente os tratamentos, mesmo que as unidades apresentem certa heterogeneidade. Unidades similares são
agrupadas (dá-se o nome de blocos a esse conjunto de unidades similares). Os experimentos em blocos ao acaso surgiram
na área agrícola. O campo era dividido em blocos e os blocos eram divididos em parcelas que recebiam os tratamentos
(adubo, por exemplo) em investigação. Então o termo bloco designava originalmente, uma faixa de terra de mesma
fertilidade. Esse tipo de delineamento surgiu em 1925 na Inglaterra por R. A. Fisher que foi, também, o idealizador do
método ANOVA.
O bloco pode ser uma faixa de terra, uma ala de estufa, um período de tempo, uma ninhada, uma partida de produtos
industriais, uma faixa de idade – tudo depende do que está em experimentação. O CBRD pode ser empregado de forma
muito eficiente quando um experimento deve ser efetuado em mais de um laboratório (blocos) ou quando vários dias
(blocos) são necessários para a sua realização.
O essencial é que os blocos reúnem unidades similares e que haja variabilidade entre blocos. Não teria sentido organizar
esses blocos se não houvesse variabilidade entre eles. Quem vai decidir se a variabilidade entre as unidades justifica ou não
a formação de blocos é o pesquisador, não o estatístico. Embora o bloco deva reunir unidades similares, isso não significa
que essa reunião deva ser física. Por exemplo, se um médico pretende comparar duas drogas hipotensoras, A e B, e
considerar que a pressão arterial do paciente, no início do tratamento, é importante na resposta do paciente à droga, deve
organizar blocos. Cada bloco será formado por um par de pacientes com pressões arteriais similares, mas, para formar os
blocos, o médico não precisa colocar seus pacientes em fila, nem juntá-los aos pares. Basta reunir os dados numéricos.
Dois pacientes do mesmo bloco não precisam nem mesmo se conhecer.
O objetivo do CBRD é isolar e remover do termo resíduo (erro) a variação atribuível aos blocos, aumentando assim a
precisão do experimento sem aumentar o número de unidades experimentais.
5
6. Historicamente, os blocos casualizados é o primeiro delineamento válido para estimar o
erro experimental e testar a significância dos efeitos de tratamento apesar da heterogeneidade
das unidades experimentais sobre as quais as observações são realizadas. Esse delineamento
revolucionou os experimentos na agricultura no mundo todo. Não seria um exagero afirmar
que ele é ainda a espinha dorsal do delineamento da ciência experimental. Porém, nenhum
delineamento torna-se popular e aceito para uso geral, não importa quão bem fundamentado do
ponto de vista estatístico que ele seja, se for complicado e difícil de empreendê-lo. A beleza
desse planejamento em blocos é a feliz combinação de validade, simplicidade e flexibilidade.
O planejamento em blocos consiste de duas etapas. A primeira é a de coletar, reunir, as
unidades afins, similares para juntas formarem um grupo homogêneo; esse grupo formado é
chamado de bloco. Essa operação é conhecida como blocagem. A segunda etapa é a de
designar os vários tratamentos ao acaso às unidades dentro de cada bloco. Essa é a principal
diferença entre o delineamento em blocos e o delineamento inteiramente casualizado. Em
termos de casualização pode-se considerar que, em blocos, há uma restrição.
Veremos, a seguir, a aplicação desse método para um experimento onde a unidade
experimental é “a pessoa que vira bloco”. Ela recebe, sob aplicação aleatória, dois tratamentos
A e B. Convém recordar que, experimentos desse tipo, onde a unidade experimental é a pessoa
que recebe todos os tratamentos em comparação, é um caso especial de experimento em blocos
casualizados♠
. “Toda vez que a pessoa que participa do experimento recebe todos os
tratamentos em comparação, essa pessoa é um bloco – não uma unidade”. Esse tipo de
experimento é muito criticado. Por exemplo, a diferença que se mede na pessoa, antes e depois
de uma série de exercícios físicos, só seria explicada pelos próprios exercícios físicos? De
qualquer forma, são feitos experimentos em que cada pessoa é um bloco. O pesquisador
precisa apenas estar alerta para o fato – que é possível – de a pessoa se modificar por qualquer
outro motivo, que não o tratamento. Embora os experimentos em que se toma cada indivíduo
como bloco sejam bastante comuns é preciso muito senso crítico para planejá-los. Muitas
vezes esses experimentos não têm qualquer validade.
O pesquisador planeja um experimento em blocos ao acaso quando pretende eliminar
uma causa de variação. Por exemplo, para testar o efeito de um hormônio sobre o crescimento
Muitas idéias aqui apresentadas foram selecionadas do livro: Estatística Experimental. Autores: S. Vieira & R.
Hoffmann. Ed. Atlas. Ano 1989.
6
7. de ratos – se os ratos disponíveis são de diferentes idades – o pesquisador deve organizar
blocos que correspondam às idades.
Os blocos também ampliam a validade da conclusão. Por exemplo, se um entomologista
quer comparar a eficiência de diversos inseticidas, tanto pode usar insetos de uma única
espécie como fazer a comparação usando insetos de várias espécies. O experimento seria em
blocos ap acaso se cada espécie fosse um bloco. Os blocos teriam a vantagem de ampliar a
validade da conclusão. Isto porque o entomologista poderia, com base em um só experimento,
estabelecer conclusões para várias espécies.
Em termos de eficiência, ou seja, de uma comparação de tratamentos qual seria o melhor
delineamento: CRD ou CBRD? Qual seria a conseqüência de uma má escolha? Para responder
temos de considerar o número de graus de liberdade do resíduo. Vamos, então, realizar uma
comparação entre o número de graus de liberdade do resíduo de um experimento CRD frente a
um experimento tipo CRBD. Na tabela ANOVA obtém-se um valor igual a (k-1)(r-1) para um
experimento em blocos; enquanto, para um experimento CRD, o gl do resíduo será igual a k(r-
1), onde r é o número de réplicas (ou repetições). Se k for igual a 3 e r = 20, então, o gl de
resíduo do CBRD seria igual a (3-1)(20-1) = 2 x 19 = 38 e o gl do CRD seria igual a 3(20-1) =
3 x 19 = 57. Essa diferença de 57 – 38 = 19 representa r-1 graus de liberdade, em geral.
Em termos de notação, temos inicialmente no CRD k(r-1) e depois no CBRD (k-1)(r-1),
isto é,
k(r-1) – (k-1)(r-1) = r-1 graus de liberdade a menos sob a escolha de um possível mau
delineamento. Como o valor de F na tabela (F, de valores críticos) aumenta quando diminui o
número de graus de liberdade de resíduo, é fácil entender que o uso indevido de blocos torna o
teste menos sensível.
Fcalculado = QM Trat / QM resíduo ; assim, quanto menor ↓Fcalc e maior o ↑F tabela mais difícil
para que se estabeleça a condição de rejeitar Ho, ou seja, de que Fcalc > F tabelado .
QM resíduo = SQ res / gl res ; assim, quanto menor ↓gl res implica ⇒ aumento de↑ QM resíduo
que traz como conseqüência uma diminuição de ↓ Fcalc.
7
8. Exemplo 1. Experimento em blocos (CBRD), sem repetições.
Numa pesquisa sobre o efeito do óleo de milho no teor de colesterol do sangue, o médico
Dr. Bem Hur obteve os seguintes dados, de 7 pacientes, Tabela 3.
Tabela 3. Teor de colesterol no sangue, em mg por 100g, de sete pacientes.
Pacientes
Tratamentos (dois tipos de dietas) Totais dos blocos Médias dos
blocosA B
1 270 175 445 222,5
2 410 308 718 359,0
3 350 248 598 299,0
4 360 231 591 295,5
5 350 196 546 273,0
6 430 190 620 310,0
7 268 252 520 260,0
Totais de Tratamentos 2438 1600
Médias de Tratamentos 348,286 228,571
A análise é feita tomando-se os pacientes como blocos. Para casos desse tipo, pode-se
dizer em termos gerais, que é a mesma análise dos delineamentos tipo ANOVA de medidas
repetidas e, nesse especial caso, é a mesma análise que se obtém com o teste t-Student de
amostras pareadas (estatística t = 4,66; vale a relação estatística F da anova é igual ao valor da
estatística t-Student ao quadrado, ou seja, F = t2
= 4,662
= 21,71).
Pelo mesmo procedimento do caso anterior obtém-se o seguinte resultado do teste
ANOVA 2 fatores, Tabela 4.
Tabela 4. ANOVA 2 fatores pata os dados da Tabela 3.
Efeito
(ou fonte de
variação)
gl SQ QM razão F p-valor
Blocos 7-1= 6 22000,40 22000,40/6= 3666,70
Tratamentos 2-1=1 50160,30 50160,30/1= 50160,30 50160,30/2310,
50= 21,71
0,003*
Resíduo 6 13862,70 13862,70/6= 2310,50
Total 14-1= 13 86023,40
*p<0,05
Conclusão. O efeito fator Tratamento (colunas) é estatisticamente significante. Os valores
médios dos dois níveis diferem (A: 348,3±62,2mg; B: 228,6±45,9mg). O teste de comparação múltipla
de Tukey, não precisa ser efetuado porque são apenas dois níveis do fator Tratamento. O cálculo de F
8
9. para blocos é desnecessário. Os experimentos tipo CRBD são feitos, essencialmente, para comparar
tratamentos – a comparação de blocos é secundária.
Exemplo 2. Experimento em blocos (CBRD), sem repetições.
Um experimento foi delineado para estudar o desempenho de quatro diferentes
detergentes de tecidos de roupas. Os seguintes índices de limpeza, Tabela 5, foram obtidos
(maior o índice maior a limpeza) por meio de um instrumento especial para três diferentes
tipos comuns de manchas. A hipótese da pesquisa é saber se há diferença entre os detergentes?
Tabela 5. Índice de limpeza de 12 tecidos manchados segundo tipo de detergente e tipo
de mancha.
Manchas
Detergentes Total (média: x )
1 2 3 4
1 45 47 48 42 182 (45,50)
2 43 46 50 37 176 (44,00)
3 51 52 55 49 207 (51,75)
Total
(média: x )
139 145 153 128 565
46,333 48,333 51,000 42,667
média geral:
565/12 = 47,083
Resolução
Vamos aplicar a mesma fórmula, porém, com outra forma♣
, mais direta, para se obter
as somas de quadrados entre grupos (referente às colunas e/ou às linhas).
SQE = (∑T2
/n) - (FC); onde T... é o total da coluna (ou linha); n ... é o tamanho da
amostra e FC é o chamado fator de correção dado pela soma dos valores ao quadrado
dividido pelo tamanho amostral total, ou seja, FC = (∑x)2
/ N.
Análise dos dados segundo a classificação do fator Detergente “coluna”.
anova 1 fator.
SQ coluna = [ (1392
/3) + (1452
/3) +(1532
/3)+(1282
/3) ]– (182+176+207)2
/12 =
SQ coluna = 26713,000 – 26602,083 = 110,917
Análise dos dados segundo a classificação do fator Mancha “linha” (blocos).
anova 1 fator.
SQ linha = 1822
/4 + 1762
/4 +2072
/4– (182+176+207)2
/12 = 135,167
Cálculo da Soma de Quadrados Total
SQ Total = ∑x2
– FC = ∑x2
– (∑x)2
/ n
SQ = ∑(x-μ)2
= ∑(x2
-2xμ +μ2
) = ∑(x2
)-2μ∑x +∑(μ2
)= ∑x2
-2μ2
n +n μ2
=∑x2
- nμ2
= ∑x2
- n(∑x)2
/ n2
= ∑x2
–
(∑x)2
/ n que é a forma usual do cálculo da soma de quadrados total. Dessa forma usual vem
SQfator coluna = n∑( x -μ)2
= n∑ x 2
–(∑x)2
/ n = n(∑x)2
/n2
–(∑x)2
/ n = (Total)2
/n –(∑x)2
/ n = ∑ (T2
/n) – FC.
9
10. SQ Total = (452
+432
+512
+472
+462
+522
+482
+502
+552
+422
+372
+492
) – (565)2
/12 = 264,917
SQ Total = 26867,000 – 26602,083 = 264,917
SQ Total = SQ LINHA + SQ COLUNA + SQ RESÍDUO
assim, SQ RESÍDUO = SQ Total – (SQ LINHA + SQ COLUNA)
SQ RESÍDUO = 264,917 – (135,167+110,917) = 264,917 – 246,084 = 18,833
Tabela 6. ANOVA 2 fatores para os dados da Tabela 5.
Efeito gl SQ QM F P
Detergente 3 110,917 36,972 11,78 0,006*
Manchas 2 135,167 67,583
Erro 6 18,833 3,139
Total 11 264,917
*p<0,05
Conclusão: Há diferença estatisticamente significante entre os quatro detergentes.
A hipótese H0(μ1 = μ2 = μ3 = μ4 ) é rejeitada.
Os valores médios diferem!
Teste de comparação múltipla de Tukey (5%) para o efeito Detergente
Por meio do Teste de Tukey (5%) obtém-se o valor HSD
MSW = QM resíduo = 3,139 ; n = 3; q crítico = 4,897; HSD = 5,0095
valores das diferenças a serem comparadas com o valor HSD ou dms.(=5,0095)
Detergente Média 1( x =46,33) 2( x =48,333) 3( x =51)
1 46,333
2 48,333 2,000
3 51,000 4,667 2,667
4 42,667 3,667 5,667* 8,333*
Alfa (nível de significância) 0,05 Valor Crítico Q 4,897
Valor Crítico para Comparação = 5,0095
Graus de liberdade do termo Erro (resíduo) = 6
Formação de grupos homogêneos após a aplicação do teste de Tukey(5%)
Detergente Média Grupos Homogêneos*
3 51,000 A
2 48,333 A
1 46,333 AB
4 42,667 B
10
11. * médias seguidas de letras diferentes diferem estatisticamente
Alfa (nível de significância) 0,05 Valor Crítico Q 4,897
Valor Crítico para Comparação = dms = HSD = 5,0095
Graus de liberdade do termo Erro (resíduo) = 6
Conclusão:
Grupos 1 e 4 (letra A e AB) não diferem entre si (letra B comum).
Grupo 4 (letra B) difere dos grupos 2 e 3 (letra A).
Grupo 1 (letra AB) não difere do grupo 4 e, também, não difere dos grupos 2 e 3, ou seja,
o detergente 1 ocupa um comportamento intermediário em relação aos outros três detergentes.
Quanto à limpeza o pior detergente é o tipo 4.
Os detergentes tipo 1, 2 e 3 não apresentaram diferença do ponto de vista estatístico.
........................................................................................................................................................
Exemplo 3. Experimento em blocos (CBRD), sem repetições.
Supõe-se que a impureza de um produto químico é afetada pela pressão. Optou-se por utilizar a
temperatura como fator de blocagem. Os dados são apresentados na Tabela 7 mostrada a seguir.
Tabela 7. Quinze valores de impureza, sob condições de temperatura (ºC) e pressão (mmHg),
obtidos num experimento em blocos ao acaso.
Temperatura
Pressão Total Média x
25 30 35 40 45
100 5 4 6 3 5 23 4,60
125 3 1 4 2 3 13 2,60
150 1 1 3 1 2 8 1,60
Total 9 6 13 6 10 44 geral: 2,93
Média x 3,00 2,00 4,33 2,00 3,33
Resolução
FC = fator de correção da soma de quadrados = (44)2
/15 = 129,067
SQ Total = SQ Total = ∑x2
– (∑X)2
/ n = 166 – (44)2
/15= 166 – 129,067 = 36,933
SQ linha = SQ temperatura = SQ blocos = (232
+132
+82
) / 5 – FC = 152,400-129,067 = 23,333
SQ coluna = SQ pressão = (92
+62
+132
+62
+102
) / 3 – FC = 140,667-129,067 = 11,600
SQ Total = SQ LINHA + SQ COLUNA + SQ RESÍDUO
assim, SQ RESÍDUO = SQ Total – (SQ LINHA + SQ COLUNA)
SQ RESÍDUO = 36,933– (23,333+11,600) = 36,933– 34,933 = 2,000
Cálculo dos Graus de Liberdade (gl)
Fator Linha = Blocos = b-1 e no nosso exemplo é 3 – 1 = 2
11
12. Fator Coluna = Pressão = G-1 e no nosso exemplo é 5 – 1 = 4
Total é N-1 e no nosso exemplo é 15 – 1 = 14
Resíduo é ( N-1 ) - [ (B-1) +(G-1) ] = ( BG-1 ) - [ (B-1) +(G-1) ] = (B-1)(G-1)
e no nosso exemplo é gl resíduo = 14-(2+4) = 8 = (3-1)(5-1) = (2)(4)
Cálculo da estatística F
Variância Efeito Coluna (pressão) = QM colunas / gl colunas = (11,600/4) = 2,900
Variância Resíduo = QM resíduo / gl resíduo = (2,00/8) = 0,250
F calculado = Var Coluna / Var resíduo = Var Pressão/ Var resíduo = 2,900/0,25 = 11,60
Comando no Minitab para se obter o p-valor associado ao F calculado é
após Edit >> Command Line Editor (ou Ctrl+L) digitamos
cdf 11.60 k1;
F 4 8.
let k2 = 1-k1
print k2
K2 0.00206337
clicar no (X) Submit Commands
Tabela 8. ANOVA 2 fatores para os dados da Tabela 7.
Efeito gl SQ QM F P
Pressão 4 11,600 2,900 11,60 0,002*
Temperatura 2 23,333 11,667
Erro 8 2,000 0,250
Total 14 36,933
*p<0,05
.......................................................................................................................................................
12
13. 3º) experimento em blocos ao acaso (CRBD) com repetições
Nesse item vamos considerar três situações. A primeira com os blocos apresentando o
mesmo valor médio em cada tratamento; na segunda situação, temos uma diferença constante
entre os valores médios de cada bloco; e na terceira valores desiguais entre os valores médios
dos blocos em cada tratamento. Entende-se melhor o que queremos explicar por meio dos
exemplos.
Primeira situação. Valores médios iguais dos blocos.
Exemplo 1. Dados de um experimento em blocos ao acaso com repetições.
Blocos
Tratamentos Total das
linhas
Média dos
blocos
A B C D
I
22 31 30 39
408 3426 38 31 42
30 36 38 45
Médias dos
blocos
26 e 26 35 e 35 33 e 33 42 e 42
II
25 34 32 41
408 3426 35 33 42
27 36 34 43
Total 156 210 198 252 Total geral:
816
Média
geral: 34
Resolução.
Segue-se o mesmo procedimento dos casos anteriores, ou seja, cálculo do fator de
correção; cálculo da soma de quadrados total; cálculo da soma de quadrados devido ao fator
coluna (tratamentos); cálculo da soma de quadrados do fator linha (blocos) e, enfim, onde está
a novidade. A resposta, para essa justificada pergunta, é a relação:
13
14. SQ Total = SQ COLUNA + SQ LINHA + SQ RESÍDUO.
Cálculo da Soma de Quadrados dos Tratamentos
SQ trat = {1562
+2102
+1982
+2522
)/6} – (816)2
/24 = 780,00
Cálculo da Soma de Quadrados dos Blocos
SQ blocos = {4082
+4082
)/12} – (816)2
/24 = 27744-27744 = 0
Cálculo da Soma de Quadrados dos Resíduos
SQ resíduo= ∑(x - x )2
onde x é o valor de cada célula (casela) e x é a média de cada casela
SQ resíduo = {42
+02
+42
}+{42
+32
+12
}+{32
+22
+52
}+{32
+02
+32
} referente ao bloco I
+{12
+02
+12
}+{12
+02
+12
}+{12
+02
+12
}+{12
+02
+12
} referente ao bloco I I=
= {32+26+38+18}+{2+2+2+2} = 114 + 8 = 122
Nesse nosso exemplo os números calculados indicam:
902,00 = 780,00 + 0 + 122
902,00 = 902,00 relação de igualdade.
Conclusão: valeu nesse caso a relação:
SQ Total = SQ COLUNA + SQ LINHA + SQ RESÍDUO.
Será que essa relação, na presença de repetições, sempre é válida?
Segunda situação. Valores médios dos blocos diferem de uma constante.
Exemplo 2. Dados de um experimento em blocos ao acaso com repetições.
Blocos
Tratamentos Total das
linhas
Média dos
blocos
A B C D
22 31 30 39
14
15. I 408 3426 38 31 42
30 36 38 45
Médias dos
blocos
26 e 30 35 e 39 33 e 37 42 e 46
II
29 38 36 45
456 3830 39 37 46
31 40 38 47
Total 168 222 210 264 Total geral:
864
Média
geral: 36
Tratamentos N Média DP
1 6 28,00 3,41
2 6 37,00 3,22
3 6 35,00 3,58
4 6 44,00 2,97
Nesse caso, também, vale a relação:
SQ Total = SQ COLUNA + SQ LINHA + SQ RESÍDUO.
998,00 = 780,00 + 96 + 122
Terceira situação. Vai aparecer o fator interação!
Valores desiguais entre os valores médios dos blocos em cada tratamento
Exemplo 3. Dados de um experimento em blocos ao acaso com repetições.
Blocos
Tratamentos Total das
linhas
Média dos
blocos
A B C D
I
22 31 30 39
408 3426 38 31 42
30 36 38 45
Médias dos
blocos
26 e 32
difere de 6
35 e 51
difere de 16
33 e 45
difere de 12
42 e 48
difere de 6
15
16. II
27 47 42 44
528 4434 50 45 47
35 56 48 53
Total das
colunas
174 258 234 270
Total geral:
936
Média
geral: 39
Tratamentos N Média DP
A 6 29,00 4,98
B 6 43,00 9,51
C 6 39,00 7,38
D 6 45,00 4,77
Nesse caso, também, vale ainda a relação:
SQ Total = SQ COLUNA + SQ LINHA + SQ RESÍDUO.
1874,00 = 912,00 + 600,00 + 254,00 ?? não (esse caso difere dos outros dois)
1874,00 = 1766,00 ?? Para que seja válida essa relação de igualdade temos de acrescentar o
valor diferença = 1874,00 – 1766,00 = 108
Esse valor acrescentado será denominado de SQ interação : soma de quadrados do fator interação
que aparece devido à presença de repetições e da diferença entre os valores médios dos blocos nos
tratamentos.
O gráfico de médias ajuda-nos a observar (e a verificar) a existência do efeito interação.
16
17. Grupos
médias
DCBA
50
45
40
35
30
25
Blocos
1
2
6
16
12
6
Figura 1. Gráfico de médias referente às seis condições experimentais.
Ilustração do efeito interação entre as duas variáveis em estudo.
Para avaliar se essa diferença, entre os quatro valores diferenças, difere estatisticamente temos de
aplicar verificar se a razão F do efeito interação é estatisticamente significante. Em um experimento
em blocos o efeito interação, em geral, não é um efeito interessante, ou seja, avaliado. Há uma
suposição inicial da inexistência desse efeito interação.
Tabela W. ANOVA dois fatores para os dados do exemplo 3, terceira situação.
Efeito gl SQ QM F P
Blocos 1 600,00 600,00 37,80 0,001
Tratam 3 912,00 304,00 19,15 0,001
Interação 3 108,00 36,00 2,27 0,120
Erro 16 254,00 15,88
Total 23 1874,00
Por meio do resultado do teste ANOVA 2 fatores, Tabela W, pôde-se verificar que o efeito
interação é estatisticamente não significante (p = 0,120 >0,05). Então, podemos desconsiderar o valor
17
18. Soma da Soma de Quadrados correspondente ao efeito interação (no caso foi de 108) e, assim,
obtemos uma outra tabela ANOVA, a usual em experimento em blocos ao acaso, que desconsidera o
efeito interação, Tabela Z mostrada a seguir.
Tabela Z. ANOVA dois fatores para os dados do exemplo 3, terceira situação.
Efeito gl SQ QM F P
BLOCOS 1 600,00 600,000
TRATAM 3 912,00 304,000 15,96 0,0001
Erro 19 362,00 19,053
Total 23 1874,00
18
19. 4º) experimento inteiramente casualizado (CRD) com repetições.
Nesse item vamos considerar os experimentos que seguem um delineamento fatorial. Não vamos
considerar fatores como blocos. Blocagem, agora, não nos interessa por um motivo de didática,
apenas.
Vamos considerar dois fatores, duas variáveis experimentais, cujos efeitos sobre a unidade
experimental são avaliados pela variável resposta. Esses efeitos, dessas duas variáveis, nos interessam.
Queremos avaliá-los isoladamente, efeitos principais e, também, se houver repetições (caso mais
freqüente, comum) vamos ter de nos enfrentar com o efeito interação. Que significa saber se há ou não
“diferença entre as diferenças”. O termo interação não apresenta, no jargão da estatística, o mesmo
significado quando empregado na ciência biológica. A Farmacologia, por exemplo, que considera a
interação entre as drogas, o efeito da mistura, da ação conjunta entre vários medicamentos sobre a
pessoa em comparação com a ação individual desses medicamentos sobre a pessoa.
Considera-se, agora, como exemplo de um delineamento fatorial o mesmo exemplo anterior, mas
com uma alteração apenas. Dessa vez, não houve blocagem. Não há o fator blocos. A casualização dos
tratamentos não foi restrita aos blocos. Não houve restrição alguma quanto ao sorteio dos tratamentos
às unidades experimentais. Porém, a forma de análise dos dados é análoga, ou seja, o mesmo
procedimento. O novo fator será denominado de Termociclagem Mecânica, por exemplo, indicado por
TCM que apresentará dois níveis. O nível I como ausência e o nível II como presença de TCM.
O outro fator, tratamentos, pode ser considerado como Tratamentos Superficiais apresentando
quatro diferentes níveis: Controle, Alumina, Rocatec e New.
A variável resposta é o resultado do teste de tração (em megapascal, MPa) obtido numa máquina
de ensaio universal.
A unidade experimental é o corpo de prova em forma de cilindro.
19
20. Exemplo 1. Dados de resistência a tração (MPa) de um experimento fatorial (tipo 4 x 2)
com três repetições.
TCM
Tratamentos Superficiais Total das
linhas
Média dos
níveis do
fator TCMA: controle B: alumina C: rocatec D: new
I: ausência
22 31 30 39
408 3426 38 31 42
30 36 38 45
médias dos
níveis
26 e 32
difere de 6
35 e 51
difere de 16
33 e 45
difere de 12
42 e 48
difere de 6
II: presença
27 47 42 44
528 4434 50 45 47
35 56 48 53
Total das
colunas
174 258 234 270
Total geral:
936
Média
geral: 39
Tratamentos N Média DP
A 6 29.00 4.98
B 6 43.00 9.51
C 6 39.00 7.38
D 6 45.00 4.77
Nesse caso, com repetições, é válida a seguinte relação entre as somas de quadrados:
SQ Total = SQ COLUNA + SQ LINHA + SQ Interação + SQ RESÍDUO.
1874,00 = 912,00 + 600,00 + 254,00 + SQ Interação
Assim SQ interação = 108.
Com o mesmo procedimento dos casos anteriores obtém-se a Tabela Y referente ao teste
ANOVA (2 fatores) dos dados.
Cálculo dos Graus de Liberdade (gl)
Fator Linha = TCM = L-1 e no nosso exemplo é 2 – 1 = 1
Fator Coluna = Tratamentos = G-1 e no nosso exemplo é 4 – 1 = 3
20
21. Total é N-1 e no nosso exemplo é 24 – 1 = 23 = (LCR) – 1
onde R é o número de repetições
Fator Interação é determinado pelo produto dos graus de liberdade do fator na linha
pelo fator coluna = (L-1)(G-1) = (2-1)(4-1) = 3.
O gl resíduo é dado pela diferença entre o gl do total em relação aos outros fatores, ou
seja, (24-1)-{(2-1)+(4-1)+(2-1)(4-1)) = 23- (1+3+3) = 23-7 = 16.
Ou o gl resíduo é dado pela fórmula gl resíduo = (LC)(R – 1) onde R é o número de
repetições; assim gl resíduo = (2 x 4)(3-1) = 8 (2) = 16.
Tabela Y. ANOVA (2 fatores) dos dados de resistência a tração (MPa) de um experimento
fatorial (tipo 4 x 2) com três repetições.
Efeito gl SQ QM F P
Tratamento 3 912,00 304,000 19,15 0,0001*
TCM 1 600,00 600,000 37,80 0,0001*
Interação 3 108,00 36,000 2,27 0,1198
Erro 16 254,00 15,875
Total 23 1874,00
* p<0,05
A interpretação inicial dos resultados de uma tabela ANOVA (2 fatores) começa pelo efeito do
fator interação.
Repito. Primeiro avalie o efeito interação. Depois, se for o caso, avalie os efeitos principais.
Diante dos efeitos principais numa possível avaliação há dois casos no gráfico de médias das
condições experimentais: interação tipo ordinal e interação do tipo não ordinal.
Vamos explicitar o que dissemos acima. Se o efeito interação foi avaliado como significante,
então, pode – sempre é possível – não avaliar os efeitos principais. O foco de atenção do resultado é,
então, o efeito interação e ponto final. Porém, o efeito principal que foi, também, avaliado como
significante pode ser interpretado (teste de Tukey, por exemplo) se, no gráfico de médias das
condições experimentais, ele se mostrar como efeito ordinal (ordinal interaction effect). Ainda, há o
caso de o efeito principal que foi, também, avaliado como significante não pode ser interpretado (teste
de Tukey, por exemplo) se, no gráfico de médias das condições experimentais, ele se mostrar como
efeito não ordinal (disordinal interaction effect). Quando há o efeito tipo ordinal as linhas que unem os
valores médios se apresentam como paralelas. Caso contrário, diante do efeito não ordinal há um
cruzamento dessas linhas que unem os valores médios do gráfico de médias.
Se o efeito interação for não significante, então, vamos interpretar os efeitos principais que
apresentaram significância (p valor inferior ao nível de significância).
21
22. O efeito interação é estatisticamente não significante. Assim, o relacionamento entre os níveis
do fator Termociclagem expressa mediante a perda de resistência (diferença entre presença menos
ausência) obtido no grupo controle é praticamente a mesma perda de resistência obtida nos demais
tipos de tratamentos superficiais, Figura Z.
Tratamentos Superficiais
MPa
DCBA
50
45
40
35
30
25
TCM
ausência
presença
Figura Z. Gráfico de médias referente às seis condições experimentais. Perda de resistência
(indicada pela seta) devido à ação da Termociclagem mecânica, TCM, em cada tipo
de tratamento.
Pode-se concluir mediante o resultado do teste ANOVA, Tabela Y, que há diferença
estatisticamente significante entre os quatro Tratamentos.
Para o fator Tratamentos, a hipótese H0(μ1 = μ2 = μ3 = μ4 ) é rejeitada.
Os valores médios diferem!
Teste de comparação múltipla de Tukey (5%) para o efeito Tratamento Superficial
Por meio do Teste de Tukey (5%) obtém-se o valor HSD
22
23. MSW = QM resíduo = 15,875 ; n = 6; q crítico = 4,047; HSD = 6,5824
valores das diferenças a serem comparadas com o valor HSD ou dms.(=6,5824)
Tratamentos Média A B C
A 29,000 ----
B 43,000 14,000* ----
C 39,000 10,000* 4,000 ----
D 45,000 16,000* 2,000 6,000
Alfa (nível de significância) 0,05
Valor Crítico Q 4,047
Valor Crítico para Comparação = 6,5824
Graus de liberdade do termo Erro (resíduo) = 16
Formação de grupos homogêneos após a aplicação do teste de Tukey(5%)
Tratamentos Média Grupos Homogêneos*
D 45,000 A
B 43,000 A
C 39,000 A
A 29,000 B
* médias seguidas de letras diferentes diferem estatisticamente
Pode-se concluir, ainda, mediante o resultado do teste ANOVA, Tabela Y, que há diferença
estatisticamente significante entre os dois níveis entre o fator Termociclagem mecânica (TCM).
Assim, como são apenas dois níveis desse fator, não há necessidade de se efetuar um teste de
comparação múltipla como o teste de Tukey. Se os dois níveis diferem pode-se estabelecer que a
condição de ausência de Termociclagem é menos resistente (34,00±6,77MPa) que a condição de
presença de Termociclagem (44,00±8,37MPa).
Quando se comparam as seis condições experimentais entre si, pelo teste de Tukey, obtém-se,
por exemplo, que a condição Tratamento A(controle) sem TCM é a menos resistente (média igual a
26MPa) enquanto as mais resistentes são as condições Tratamentos B (alumina) e D(new) com TCM.
Outras considerações podem ser ainda obtidas.
Trata TCM Média Grupos Homogêneos*
B 2 51 A
23
24. D 2 48 A
C 2 45 AB
D 1 42 ABC
B 1 35 BCD
C 1 33 CD
A 2 32 CD
A 1 26 D
* médias seguidas de letras diferentes diferem estatisticamente
Alfa (nível de significância) 0,05
Valor Crítico Q 4,903
Valor Crítico para Comparação = 11,278
Graus de liberdade do termo Erro (resíduo) = 16
...............................................................................................................
24
25. Apêndice
Cálculo direto da Soma de Quadrados do Fator Interação
Experimento inteiramente casualizado. Planejamento fatorial (com repetições).
Experimento inteiramente casualizado. Planejamento fatorial.
Médicos psiquiatras de um centro de Trauma desenvolveram um programa para ajudar as
vítimas de danos cerebrais a conseguirem alcançar certo nível aceitável de independência.
No experimento participaram 27 pessoas com o mesmo grau de dano cerebral.
O objetivo foi comparar diferentes combinações de tratamentos psiquiátricos e de
fisioterapias.
Para cada pessoa foi designada uma das 9 diferentes combinações de três tratamentos
psiquiátricos e de três programas de fisioterapias. Houve três sujeitos para cada combinação.
A variável resposta é o número de meses de duração entre o indivíduo da terapia e o tempo
no qual o paciente foi capaz de voltar a agir com independência. Os resultados foram apresentados na
forma de tabela mostrada a seguir.
Valores obtidos por 27 pessoas submetidas ao teste psiquiátrico e ao programa de fisioterapia.
Programa de
fisioterapia
Tratamento psiquiátrico
A B C
1 9 10 11 10 11 12 13 11 13
2 10 11 12 11 12 15 15 12 15
3 10 12 15 12 14 16 13 15 17
soma 100 113 124
média 11,11 12,55 13,78
Soma geral = 337 ; Média geral = 12,48
vamos dispor os dados de uma forma conveniente para o cálculo da SQ interação
Programa
Fisioterapia
= Fator B
Tratamento Psiquiátrico = fator A
Total
1 2 3
1
9
10
11
10
11
12
13
11
13
100
total a1b1: 30 total a2b1: 33 total a3b1: 37
2
10 11 15
11311 12 12
12 15 15
total a1b2: 33 total a2b2: 38 total a3b2: 42
3
10 12 13
12412 14 15
15 16 17
total a1b3: 37 total a2b3: 42 total a3 b3: 45
100 113 124 337
25
26. Já sabemos - procedimento visto anteriormente -, como efetuar o cálculo da SQ das linhas e
das colunas. Ou seja, somo o total da coluna (ou da linha) e elevo ao quadrado e esse valor deve ser
dividido pelo número de elementos (tamanho da amostra, número de repetições) e, dessa soma geral
subtraímos o fator de correção, FC = (∑X)2
/ N).
Agora, o procedimento é bem parecido para se obter a SQ do fator interação.
O procedimento é o seguinte:
1º) Cálculo da SQ AB ou SQ Tratamentos AB
as 9 condições experimentais (os 9 tratamentos: 3 x 3)
a1b1 a2b1 a3b1 a1b2 a2b2 a3b2 a1b3 a2b3 a3b3
N 3 3 3 3 3 3 3 3 3
Total: T 30 33 37 33 38 42 37 42 45
T2
900 1089 1369 1089 144 1764 1369 1764 2025
∑T2
= 12813,00
(12813,00) / 3 = 4271,00
FC = (∑X)2
/ N) = (337)2
/27 = 4206,2593
SQ tratam AB = 4271,00 - (337)2
/27 = 4271,00 – 4206,2593 = 64,7407
2º) Cálculo da SQ A. Cálculo da SQ B.
Temos de obter essas somas porque a SQ interação é obtida pela diferença entre o valor
calculado antes (SQ tratam AB) e a soma (SQA+SQB).
SQ A = {(1002
+1132
+1242
) / 9 – FC} = (38145,00/9) – 4206,2593 = 4238,3333 - 4206,2593 = 32,0740
SQ B = {(1002
+1132
+1242
) / 9 – FC} = (38145,00/9) – 4206,2593 = 4238,3333 - 4206,2593 = 32,0740
3º) Cálculo da SQ interação
SQ trata AB = SQ A + SQ B + SQ interação → SQ interação = SQ trata AB – { SQ A + SQ B}
SQ interação = 64,7407 - {32,074 + 32,074} = 64,7407 - 64,148 = 0,593aprox.
SQ interação = 0,593
Variância do fator interação = { SQ interação = 0,593} / gl interação
O número de graus de liberdade (gl) do fator interação é dado pelo produto (a-1)(b-1)
no nosso exemplo, gl inter = (3-1)(3-1) = 4
Portanto Variância do fator interação = 0,593/4 = QM inter = 0,1481
Fórmula do número de graus de liberdade (gl) na ANOVA 2 fatores de um experimento fatorial
26
27. Efeito gl no nosso exemplo
A: a-1 3 -1 = 2
B: b-1 3 -1 = 2
Interação (A x B): (a-1)(b-1) (3-1)(3-1) = 2 x 2 = 4
Erro ab(r -1) (3)(3)[3-1] = 9 x 2 = 18
Total: N-1= abr-1 27-1 = 3(3)(3) – 1 = 26
r ... corresponde ao número de repetições (no nosso exemplo é 3)
27