SlideShare uma empresa Scribd logo
1 de 64
Capitulo 1- Introdução
        Praticamente em todas as áreas do conhecimentos o uso da estatística em
especial das técnicas de planejamento de experimentos são imprecendiveis para as
tomadas de decisão visando a avaliação de novos procedimentos ou a otimização de
processos e produtos.
        Segundo Montegomery(2001), um experimento planejado é um teste, ou série de
testes, no qual são feitas mudanças propositais nas variáveis de entrada de um processo,
de modo a podermos observar e identificar mudanças correspondentes na resposta de
saída.




                       Figura 1.1: Modelo geral de um processo

       O processo, como mostra a Figura 1, pode ser visualizado como uma
combinação de máquinas, métodos e pessoas, que transforma um material de entrada
em um produto de saída. Este produto de saída pode ter uma ou mais características da
qualidade observáveis ou respostas. Algumas das variáveis do processo x1 , x 2 ,  , x p
são controláveis, enquanto outras, z1 , z 2 ,  , z q são não-controláveis(embora possam
ser controláveis para efeito de teste). Algumas vezes, esses fatores não-controláveis são
chamados fatores de ruído. Os objetivos do experimento podem incluir

   1. Determinação de quais variáveis são mais influentes na resposta y .
   2. Determinação do valor a ser atribuído aos x ’s influentes de modo que y esteja
      perto da exigência nominal.
   3. Determinação do valor a ser atribuído aos x ’s influentes de modo que a
      variabilidade em y seja pequena.
   4. Determinação do valor a ser atribuído aos x ’s influentes de modo que os
      efeitos das variáveis não-controláveis sejam minimizados.

        Assim, métodos de planejamento experimental podem ser usados tanto no
desenvolvimento do processo quanto na solução de problemas do processo, para
melhorar o seu desempenho ou obter um processo que seja robusto ou não-sensível a
fontes externas de variabilidade.




                                                                                       1
Aplicação dos Planejamentos Experimentais na Industria são fundamentais para
desenvolvimento de novos produtos e para o controle de processos. Nesta área é comum
aparecer problemas em que se precisa estudar várias propriedades ao mesmo tempo e
estas, por sua vez, são afetadas por um grande número de fatores experimentais. È papel
de técnicas de planejamento de experimentos, auxiliar na fabricação de produtos com
melhores características, na diminuição do seu tempo de desenvolvimento, aumentar a
produtividade de processos e minimizar a sensibilidade a fatores externos (NETO et al.,
2001).

        A análise de dados para os modelos de planejamento de experimentos fica
praticamente inviabilizada sem o uso de softwares específicos. Neste material é
apresentado as possíbilidades de análise de dados para modelos de planejamento pelo
software R.
        O software R, que é uma linguagem e ambiente para computação estatística e
gráfica de domínio público (VENABLES e SMITH, 2001), atualmente muito difundido
nos grandes centros, contudo pouco conhecido em Goiás. Este software pode ser uma
ótima alternativa para o trabalho com Análise de Experimentos, pois, tem apresentado
igual ou superior eficiência para análise de dados, além de haver material disponível na
internet e listas de discussão que servem como guia de suporte e aprendizagem.

       Nesta apostila serão apresentados um resumo dos principais modelos de
planejamento de experimentos, dentre os quais destacamos: Planejamento
completamente aleatorizado com único fator, Planejamento completamente aleatorizado
com blocos, Planejamento Fatoriais e Planejamentos Hierarquicos e para cada modelo
apresentou-se a sequencia de comandos em R para a análise estatística dos modelos, que
geram os resultados finais como o Quadro da ANOVA, as Comparações Multiplas e a
Análise de Resíduos.




                                                                                      2
Capítulo 2- Elementos Básicos da Experimenta-
ção
       Segundo Werkema & Aguiar (1996), para se realizar de forma eficiente um
experimento, deve-se ser utilizada uma abordagem científica para o planejamento.
Esta abordagem é identificada por meio do termo planejamento estatístico de
experimentos, que se refere ao procedimento de planejar um experimento de forma que
os dados apropriados sejam coletados em tempo e custo mínimos. A análise destes
dados por meio de técnicas estatísticas resultará em conclusões confiáveis.
       Portanto existem dois aspectos fundamentais em qualquer estudo experimental:
o planejamento do experimento e a análise estatística dos dados. Estes dois aspectos
devem ser bem avaliados, já que a técnica de análise depende diretamente do
planejamento utilizado.
       Um dos grande problemas dos estudos experimentais é a coleta de dados. Se os
dados forem coletados de forma inadequada, não há técnica estatística de análise de
dados que concerte o problema e todo o experimento fica comprometido.

2.1 Princípios Básicos

       Para que seja possível planejar de modo adequado a coleta de dados, princípios
básicos do planejamento de experimentos como a réplica, a aleatorização e a formação
de blocos devem ser entendidos.

2.1.1- Réplicas

       As réplicas são repetições do experimento feitas sob as mesmas condições
experimentais. O termo “sob as mesmas condições experimentais” se refere ao fato de
que os demais fatores que possam influenciar a variável resposta de interesse sejam
controlados de modo a não sofrerem variações de uma experimentação para outra.
       Em um experimento, a realização de réplicas é importante pelos seguintes
motivos:

   •   As réplicas permitem a obtenção de uma estimativa da variabilidade devida ao
       erro experimental. A partir desta estimativa é possível avaliar se a variabilidade
       presente nos dados é devida somente ao erro experimental ou se existe influência
       das diferentes condições avaliadas pelo pesquisador. Se estas condições forem
       influentes, o responsável pela pesquisa poderá determinar qual é a condição mais
       favoravel para conduzir o experimento.
   •   Por meio da escolha adequada do número de réplicas é possível detectar, com
       precisão desejada, quaisquer efeitos produzidos pelas diferentes condições
       experimentais que sejam considerados significantes do ponto de vista prático.


2.1.2- Aleatorização

        A expressão aleatorização se refere ao fato de que tanto a alocação do material
experimental às diversas condições de experimentação, quanto a ordem segundo a qual
os ensaios individuais do experimento serão realizados, são determinados ao acaso. A
aleatorização torna possível a plicação dos métodos estatísticos para a análise dos


                                                                                       3
dados. A maioria dos modelos subjacentes e estes métodos estatísticos exigem que os
componentes do erro experimental sejam variáveis aleatórias independentes e a
aleatorização geralmente torna válida esta exigência.
        A aleatorização permite ainda que os efeitos de fatores não-controlados, que
afetam a variável resposta e que podem estar presentes durante a realização do
experimento, sejam balanceados entre todas as possíveis medidas. Este balanceamento
evita possíveis confundimentos na avaliação dos resultados devido à atuação destes
fatores.

2.1.3- Formação de Blocos

        Em muitas situações experimentais é necessário planejar o experimento de
forma que a variabilidade resultante de fatores externos conhecidos, sobre os quais não
existe interesse, possa ser sistematicamente controlada e avaliada.
        Se estes fatores externos não forem controlados, mesmo usando a aleatorização,
o erro experimental irá refletir tanto o erro aleatório inerente ao experimento, quanto a
variabilidade existente em função desses fatores.
        Nesta situação, deve-se formar blocos para os varios fatores externos de
influência, e realizar repetições completas do experimento em cada bloco, dessa forma
em cada bloco poderão ser observadas as diferenças existentes devido ao fator de
interesse, minimizando assim o efeito dos fatores pertubadores no resultado final do
experimento. Aqui cada bloco corresponde a um corpo de prova. Note que o objetivo
principal do experimento não é medir o efeito destes fatores pertubadores, mas sim
avaliar com maior eficiência os efeitos dos fatores de interesse.
        Assim de forma genérica podemos definir que blocos são conjuntos
homogêneos de unidades experimentais.


2.1.4- Terminologia Básica


Na terminologia básica para um planejamento de experimentos, destaca-se:

   •   Unidade experimental: É a unidade básica para a qual será feita a medida da
       resposta.
   •   Fatores: São as variáveis cuja influência sobre a variável resposta está sendo
       estudada no experimento.
   •   Niveis de um Fator: Os diferentes modos de presença de um fator no estudo
       considerado são denominados níveis do fator.
   •   Tratamento: As combinações específicas dos níveis de diferentes fatores são
       denominadas tratamentos. Quando há apenas um fator, os níveis deste fator
       correspondem aos tratamentos.
   •   Ensaio: Cada realização do experimento em uma determinada condição de
       interesse(tratamento) é denominada ensaio, isto é, um ensaio corresponde a
       aplicação de um tratamento a uma unidade experimental.
   •   Variável Resposta: O resultado de interesse registrado após a realização de um
       ensaio é denominado variável resposta.




                                                                                       4
Vamos considerar um exemplo apresentado em Werkema & Aguiar (1996) para ilustrar
melhor os princípios básicos do planejamento de experimentos:

Exemplo 2.1- Suponha que um engenheiro esteja interessado em estudar o efeito
produzido por três diferentes banhos(meios) de têmpera: têmpera em água, em óleo e
em solução aqüosa de cloreto de sódio (água salgada) na dureza de um determinado tipo
de aço. Aqui o propósito era determinar qual banho de têmpera produziria a dureza
máxima do aço. Com este objetivo ele decidiu submeter um determinado número de
amostras da liga, que denominaremos corpos de prova, a cada meio de têmpera e a
seguir mediu a dureza da liga.

Vamos ilustrar a aplicação dos princípios do planejamento neste problema.

Réplica: Neste caso uma réplica do experimento completo consiste em medir a dureza
de um corpo de prova submetido à têmpera em água, de um segundo corpo de prova
submetido à têmpera em óleo e de um terceiro temperado em solução de cloreto de
sódio.Isto é, realizar uma réplica do experimento completo significa coletar uma
observação da variável resposta em cada condição experimental considerada no estudo.
Portanto, se seis corpos de prova são temperados em cada banho (água, óleo e água
salgada), sendo feita a seguir a medida da dureza de cada um destes corpos de prova,
dizemos que foram realizadas seis réplicas do experimento(sendo realizados dessa
forma 6x3=18 ensaios).

Aleatorização: Neste experimento a aleatorização deve-se fazer presente pela
distribuição ao acaso dos corpos de prova entre os banhos de têmpera. Este
procedimento atenua por exemplo situações onde a espessura dos corpos de prova são
ligeiramente diferentes, assim de todas as amostras com espessura maior foram
submetidas a um mesmo banho de têmpera este provavelmente estará em situação
vantajosa e os resultados do experimento estarão tendenciosos.


Blocos: Supor que os corpos de prova são provenientes de corridas diferentes ( ou
matérias primas diferentes), se planejarmos um experimento onde estes corpos de prova
sejam distribuídos ao acaso entre os diferentes banhos de têmpera, as diferenças entre os
corpos de prova irão acrescentar uma variabilidade adicional às medidas de dureza, o
que poderá mascarar os efeitos devidos ao fator de interesse (banho de têmpera). Para
eliminar do erro experimental a variabilidade devida ao fato de os corpos de prova
terem sido produzidos em corridas diferentes, deve-se realizar o experimento da
seguinte maneira: cada corpo de prova será dividido em três partes iguais, sendo cada
parte submetida a um diferente banho de têmpera. Deste modo, dentro de cada terno
formado pelas três partes de um mesmo corpo de prova, a influência devida às
características particulares de cada corpo de prova deverá ocorrer de forma
aproximadamente igual para cada um dos banhos de têmpera.


Dentro da terminologia básica temos que:

Unidade Experimental: Corpo de prova do aço utilizado no estudo.
Fatores: Banhos de têmpera.


                                                                                       5
Níveis do Fator: água, água salgada e óleo
Ensaio: Cada ensaio consiste em tratar um corpo de prova em um determinado banho
de têmpera.
Variável Resposta: É a dureza do corpo de prova medida após a realização da têmpera.

2.1.5- Roteiro para a Realização de um Bom Experimento.

        Para usar a abordagem estatística no planejamento e na análise de um
experimento é necessário que as pessoas envolvidas na experimentação tenham,
antecipadamente, uma idéia clara do que será estudado e da forma como os dados serão
coletados. Também é recomendado que se tenha uma idéia qualitativa de como os dados
serão analisados. Um roteiro para a realização de um bom experimento é apresentado a
seguir:

    1. Reconhecimento e relato do problema. Na prática, geralmente é difícil
       perceber que existe um problema que exige experimentos planejados formais,
       de maneira que não pode ser fácil obter-se um relato claro de problema que é
       aceito por todos. No entanto é de primordial importância desenvolver todas as
       idéias do problema e definir de forma clara os objetivos específicos do
       experimento.
    2. Escolha dos fatores e dos níveis. Devem ser escolhidos os fatores que devem
       variar, os intervalos sobre os quais esses fatores variarão e os níveis específicos
       nos quais cada rodada será feita. Exige-se conhecimento do processo para fazer
       isso, esse conhecimento em geral é uma combinação de experiência prática e
       conhecimento teórico. É importante a investigação de todos os fatores que
       possam ser importantes e evitar ser excessivamente influenciado pela
       experiência passada.
    3. Escolha da variável resposta: Na escolha da variável resposta, o
       experimentador deve ter certeza de que aquela variável realmente fornece
       informação útil sobre o processo em estudo e a capacidade de medida dessa
       variável. Se a capacidade do medidor é baixa, então apenas grandes efeitos dos
       fatores serão detectados pelo experimento, ou será necessário muitas réplicas.
    4. Escolha do planejamento experimental. A escolha do planejamento envolve
       consideração sobre o tamanho da amostra(número de replicações), seleção de
       uma ordem adequada de rodadas para as tentativas experimentais, ou se a
       formação de blocos ou outras restrições de aleatorização estão envolvidas.
    5. Realização do experimento. Quanto da realização do experimento, é de vital
       importância monitorar o processo, para garantir que tudo esteja sendo feito de
       acordo com o planejamento. Erros no procedimento experimental nessa etapa,
       em geral comprometem a validade do experimento.
    6. Análise dos dados. Métodos estatísticos devem ser usados para analisar os
       dados, de modo que os resultados e conclusões sejam objetivos e não de
       opinião. Se o experimento foi planejado corretamente o método estatístico para
       análise não será um problema. A análise de resíduos e a verificação da validade
       do modelo são importantes e devem ser feitas.
    7. Conclusões e recomendações. Uma vez analisados os dados, o experimento
       deve acarretar conclusões práticas sobre os resultados e recomendar um curso
       de ação. Deve-se auxiliar de métodos gráficos, particularmente na apresentação
       dos resultados para outras pessoas. Seqüências de acompanhamento e testes de



                                                                                        6
confirmação devem ser também realizados para validar as conclusões do
        experimento.


2.2 – Exercícios do Capítulo

   1. Planeje um experimento para comparar quatro drogas no alívio de cefaléias,
      supondo que você dispõe de um conjunto de pacientes similares.
   2. Planeje um experimento para comparar três fórmulas de adubação no
      crescimento de Pinus, supondo que você dispõe de um terreno heterogêneo que
      deve ser dividido em cinco blocos e que em cada bloco podem ser alocadas nove
      parcelas.
   3. Planeje um experimento para comparar dois testes de inteligência tomando cada
      criança como um bloco.
   4. Planeje um experimento para comparar o desempenho(tempo de realização da
      tarefa) de três máquinas empacotadeiras, dispondo de 5 operadores.




                                                                                 7
Capítulo 3 - Planejamento Completamente Alea-
torizado com Único Fator.

        Para a comparação de dois tratamentos( duas populações) vindos de populações
normais, utiliza-se em o teste t-student, desde que as suposições sejam válidas. Para
comparação de mais de dois tratamentos não é muito recomendado sua utilização, visto
que serão necessárias várias comparações, o que acaretará um aumento no erro tipo I.
Essa situação é ilutrada em Montegomery (2001).
        O problema para a comparação de k tratamentos por meio de ensaios
realizados em ordem aleatória é descrito abaixo.
        Consideremos que existem k diferentes níveis (tratamentos de um único fator)
que queremos comparar. A resposta para cada um dos k tratamentos é uma variável
aleatória. A ilustração da disposição dos dados é ilustrado na Tabela abaixo:

Tabela 3.1: Esquema da disposição de dados para Experimento Aleatorizado com Fator
                                      Único.

                Tratamento          Observações           Totais Médias
                     1           y11    y12       y1n     y1.    y1.
                     2           y 21   y 22      y2n     y 2.   y 2.
                                                            
                      k         y k1 y k 2        y kn    yk.    yk.
                                                           y ..   y..


       Aqui y ij representa a j ª - ésima observação feita sob o i ª-ésimo tratamento.
Neste caso estamos considerando a situação em que há um número igual de
observações, n , em cada tratamento.

3.1 – Modelo Estatístico

         Cada observação y ij na Tabela 3.1, pode ser descrita pelo seguinte modelo
estatístico linear,
                                y ij = µ + τ i + ε ij , (3.1)


com i =1,2,..., k e j =1,2,..., n .


Aqui,

y ij : é uma v.a. denotando a (ij)ª obeservação;
µ : é a média geral, comum a todos os tratamentos;

                                                                                    8
τ i : é o efeito do i-ésimo tratamento;
εij : é a componente do erro aleatório.

Supondo que ε ij ~ N (0; σ ) , ou seja, os erros são independentes e normalmente
                          2


distribuidos com média zero e variância σ 2 . Dessa forma, cada tratamento pode ser
pensado como uma população normal com média µ i = µ + τ i e variância σ 2 , ou seja,
 y ij ~ N ( µi ; σ 2 ) .
Assim, vamos apresentar o procedimento para testar a igualdade das k médias
populacionais. Esse modelo de análise de variância é chamado de efeitos fixos. Os
efeitos dos tratamentos τi são definidos, em geral, como desvios da média geral µ , de
modo que
                                        ∑i =1τ i = 0
                                           k


Representando, y i . , o total das observações sob o i-ésimo tratamento e por y i . a
média das observações sob o i-ésimo tratamento, analogamente, y.. o total geral e y.. a
média geral,

       n
                                       y i.
y i. = ∑ y ij                 y i. =        ,        i =1,2,..., k .
      i =1                             n

       k     n
                                       y..
y.. = ∑∑ y ij                 y.. =        , N = kn “ Número total de observações”
      i =1 j =1                        N


Estamos interessados em testar a igualdade das médias µ , µ2 ,..., µk dos k
                                                                  1

tratamentos. Pela equação 3.1, este procedimento é equivalente a testar as hipóteses:

                       H o : τ1 = τ 2 = ... = τ k = 0
                                                                  (3.2)
                       H 1 : τ i ≠ 0 para pelo menos um i.



Dessa forma se H o é verdadeira, cada observação consiste de uma média geral µ
mais uma realização da componente do erro aleatório εij . Assim se H o é verdadeira a
mudança dos níveis do fator (tratamentos) não tem qualquer efeito sobre a resposta
média.

       A análise de variância particiona a variabilidade total na amostra de dados em
duas partes então o teste proposto em (3.2) é baseado na comparação de duas
estimativas independentes da variância populacional.
A variabilidade total dos dados é dada a partir da soma de quadrados totais

                              SQT = ∑∑ ( y ij − y.. )
                                         k      n
                                                        2
                                                              (3.3)
                                         i =1 j =1



Mas pode-se particionar SQT de forma que:




                                                                                      9
∑∑ ( y              − y.. ) = n∑ ( y i. − y.. ) 2 + ∑∑ ( y ij − y i. )
                   k   n                       k                    k    n
                                        2                                              2
                             ij
                 i =1 j =1                    i =1                 i =1 j =1               (3.4)

Demonstração: Ver Montogomery 2001.

A relação em (3.4), mostra que a variabilidade total nos dados, medida pela soma de
quadrados total, pode ser particionada em uma soma de quadrados das diferenças entre
as médias dos tratamentos e a média geral, e na soma de quadrados das diferenças entre
as observações dentro de cada tratamento e a média do respectivo tratamento.
Diferenças entre médias de tratamentos observadas e a média geral quantificam
diferenças entre tratamentos, enquanto diferenças das observações dentro de um
tratamento e a média do tratamento podem ser devidas apenas a um erro aleatório.

Dessa forma, reescrevemos (3.4) como

                                             SQT = SQTrat + SQE , onde:


SQT = ∑∑ ( y ij − y.. ) :
        k    n
                                   2
                                         Soma dos quadrados total.
       i =1 j =1


             k
SQTrat = n∑ ( y i. − y.. ) : Soma dos quadrados devido aos tratamentos.
                                   2

            i =1




SQE = ∑∑ ( y ij − y i. ) : Soma dos quadrados dos erros.
        k    n
                                   2

       i =1 j =1




Calculando os valores esperados de SQTrat e SQ E tem-se :

                                                                         k
                                       E ( SQTrat ) = (k − 1)σ 2 + n∑τ i2          (3.5)
                                                                        i =1


Demonstração: Ver Montgomery (2001)


                                                          1          
Sob H o verdadeira, temos que E 
                                                              SQTrat  = σ 2
                                                                      
                                                      ( k −1)        

Se H 1 é verdadeira, então

                                                                 n∑i =1τ i2
                                                                               k
                                          1              
                                          (k − 1) SQTrat  = σ + k − 1
                                        E                     2
                                                          
                                                         
                 SQTrat
A razão QM Trat =       é chamada média quadrática dos tratamentos. Logo, se H o é
                  k −1
verdadeira, QM Trat é um estimador não-viciado de σ 2 , enquanto que, se H 1 é



                                                                                                   10
verdadeira, QM Trat estima σ 2 mais um termo positivo que incorpora a variação
devida à diferença entre as médias dos tratamentos.

Da mesma forma, tem-se que
                               E ( SQ E ) = k (n − 1)σ 2 (3.6)

                                                   SQ E
Então a média quadrática dos erros QM E =                  é um estimador não-viciado de
                                                 k ( n −1)
σ 2 , independente de H o ser ou não verdadeira.

Analisaremos também a partição dos graus de liberdade.

SQT : tem N − 1 = kn − 1 graus de liberdade

SQTrat : tem k −1 graus de liberdade

SQ E : tem k ( n −1) graus de liberdade

Supondo que cada uma das k populações possa ser modelada com uma distribuição
normal. Com essa suposição pode-se mostrar que, sob H o , então:

                           SQTrat
                                    QM Trat
                      Fo = k − 1 =          ~ F( k −1, k ( n −1) )   (3.7)
                            SQ E    QM E
                          k (n − 1)

Se H o é verdadeira QM Trat e QM E são estimadores não viciados de σ 2 , mas se
 H o é falsa então E ( QM Trat ) será maior que E (QM E ) , assim sob a hipótese
alternativa, Fo será grande. Dessa forma um teste de hipótese é construído. Devemos
rejeitar H o se o valor da estatística é grande, isso implica em uma região crítica
unilateral superior. Então rejeita-se H o se Fo > Fα,( k −1), k ( n −1) . No geral utiliza-se o
seguinte quadro para ANOVA.
                             Tabela 3.2 - Quadro da Anova

Fonte de Variação                     SQ         G.L          QM             Fo
Entre Tratamentos                     SQTrat     k −1         QM Trat               QM Trat
                                                                             Fo =
                                                                                    QM E
Dentro dos Tratamentos (Erro)         SQ E       k ( n −1)    QM E

Total                                 SQT        kn −1

Estimativas dos efeitos dos tratamentos:

                                τ i = y i . − y.. , i =1,2,..., k
                                ˆ




                                                                                              11
3.2 Análise de Resíduos.


        O modelo matemático de um planejamento completamente aleatorizado,
considera que as observações sejam distribuidas de forma normal, com mesma
variância. Essas suposições podem ser verificadas através da análise de resíduos.
        Um resíduo é a diferença entre uma observação y ij e seu valor estimado (ou
                                                                                        ˆ
ajustado) a partir do modelo estatístico que esta sendo utilizado, denotado por y ij . Para
o modelo específico temos que y ij = y i . , com cada resíduo sendo ε ij = y ij − y i . , ou seja,
                                 ˆ
a diferença entre uma observação e a média correspondente observada do tratamento.

           Para identificar se as suposições estão sendo violadas utilizamos básicamente
três tipos de gráficos: Resíduos X Ordem de Coleta, Resíduos X Tratamentos (médias
 y i . ) e Gráfico de probabilidade normal dos Resíduos.

       O gráfico de Resíduos X Ordem de Coleta busca identificar algum tipo de
associação dos resíduos com a ordem de coleta das observações. A identificação de
algum tipo de associação viola a suposição de indepêndencia entre os dados, portanto
espera-se em uma análise de resíduos que não haja associoação entre resíduos e ordem
de coleta. O gráfico deve apresentar uma configuração aleatória entre resíduos e ordem
de coleta.




                           Figura 3.1: Gráfico Resíduo X Ordem

       Na Figura 3.1, tem-se uma típica configuração aleatória entre ordem X resíduos,
validando a suposição de independência entre as observações.

        O gráfico de Resíduos X Tratamento, busca identificar algum tipo de alteração
na dispersão dos resíduos para cada tratamento. Se houver dispersões muito diferentes
entre tratamentos pode significar que a variação não é constante, e uma importante
suposição do modelo estará violada. O gráfico deve apresentar uma configuração de
dispersão semelhante para todos os tratamentos.



                                                                                               12
Figura 3.2: Resíduo X Média dos Tratamentos

Na Figura 3.2, verifica-se um caso típico de não violação da suposição de igualdade da
variância.
        O gráfico de probabilidade normal dos resíduos identifica se os dados
apresentam uma distribuição normal. Os resíduos plotados contra os quantils de uma
distribuição normal devem ficar de forma aproximada ao longo de uma reta. Neste caso
pode-se usar um teste estatístico baseado no coeficiente de correlação para identificar
uma possível lineariedade.




           Figura 3.3: Gráfico de Probabilidade Normal para os Resíduos.

        Em situações como na Figura 3.3, percebemos que pontos centrais estavam
localizados, de forma aproximada, ao longo de uma reta, o que indica que os
componentes do erro do modelo seguiam uma distribuição normal. No entanto para
confirmar essa hipótese sugere-se utilizar um teste para normalidade.

3.3 Comparações Multiplas



                                                                                    13
A análise de variância nós indica que há uma diferença entre as médias, mas ela
não diz qual média que difere.Existem procedimentos específicos chamados de
procedimentos de comparação múltipla, para testar as diferenças entre as médias
específicas seguindo uma análise de variância. Dentre os testes mais conhecidos
destacamos o teste Tukey (Montgomery,2001).

3.3.1 Teste de Tukey

       O teste de Tukey, está baseado na amplitude total estudentizada e pode ser usado
para comparar todos os pares de contrastes que envolvem diferenças de médias.
O teste é exato de nível α quando o número de repetições é o mesmo para todos
tratamentos e aproximado quando o número de repetições é diferente para os
tratamentos. Este teste pode ainda ser usado para a construção de intervalos de
confiança para a difernça entre as médias dos tratamentos.
O procedimento está baseado na distribuição de amplitude total estudentizada
(studentized range statistic) dada por:
                                     y − y min
                                q = max
                                        QM E         (3.8)
                                     n
onde ymax e      ymin são as maiores e menores médias amostrais respectivamente,
calculadas para um grupo de p amostras. A distribuição de qα ( p, f ) , com α sendo
o percentil superior de pontos de q com f graus de liberdade, associado ao
estimador QM E é calculada computacionalmente.
Para um número igual de repetições, o teste Tukey detecta diferenças significativas
entre pares de duas médias se o valor absoluto da diferenças das médias amostrais
execeder
                                                       QM E
                                  Tα = qα (k , f )
                                                        n

De forma equivalente, constrói-se intervalos de 100(1 − α )% de confiança para todos os
pares de médias dada por:

                       yi. − y j . − Tα ≤ µi − µ j ≤ yi. − y j . + Tα , i ≠ j .

Para tamanhos amostrais diferentes (diferente n° de repetições), temos:

                                     qα ( k , f )        1  1 
                              Tα =                  QM E  +    
                                                         n     
                                           2              i nj 
e

              yi. − y j . − Tα ≤ µi − µ j ≤ yi. − y j . + Tα , i ≠ j respectivamente.



3.4- Análise Estatística de um Planejamento Completamente Aleatorizado com o
uso do Software R.


                                                                                        14
Neste tópico vamos ilustrar a utilização do software R na análise de dados para o
modelo de planejamento de experimento completamente aleatorizado.

3.4.1- Descrição do Programa

        O software R, que é uma linguagem e ambiente para computação estatística e
gráfica de domínio público (VENABLES e SMITH, 2001), atualmente muito difundido
nos grandes centros.
A linguagem R é derivada da linguagem do Software S-plus. Sua sintaxe é semelhante
com a linguagem C, e sua estrutura é de linguagem funcional. A tela inicial do
programa está ilustrada na figura abaixo:




                       Figura 3.4 : Tela Inicial do Software R.

O simbolo > indica a linha de comando (“prompt”) na qual serão digitados os comandos
para a execusão das análises.

O R tem um sistema de ajuda on-line que permite que a documentação seja exibida em
um browser (explorer,mozilla,ou similar). Para iniciar este sistema on-line clique em
“help” depois “html help”.
Para uma consulta rápida, quando já se sabe o nome da função, basta digitar
help(nome_da_função).
Para conhecer ou lembrar os parâmetros ou argumentos da função utilize o comando
args(nome_da_função).


                                                                                    15
Quando se quer listar todas as funções que possuem um determinado termo utiliza-se o
comando apropos(termo). Por Exemplo:

> apropos(vector)
[1] ".__C__vector"       "as.data.frame.vector" "as.vector"
[4] "as.vector.factor"   "is.vector"      "vector"

Por ser gratuito, o R não possui suporte oficial. Existe uma lista de discussão através do
endereço http://www.r-project.org/mail.html, que se tem mostrado um suporte interativo
bastante eficiente.

3.4.2 – Aplicação do Software R na analise de dados para o planejamento de
experimentos completamente aleatorizado com único fator.

        Para ilustrarmos a aplicação desse modelo, utilizamos o problema proposto em
Werkema & Aguiar (1996) descrito abaixo:
Os técnicos de uma indústria metalúrgica, desejam avaliar a dureza de peças de aço
após diferentes banhos de têmpera. O experimento consistiu em submeter nove peças de
aço a cada tipo de banho de têmpera (água, óleo A e óleo B), a seguir medir a dureza no
centro das peças temperadas e comparar as durezas médias obtidas, com o objetivo de
identificar o meio de têmpera mais adequado. Este é um exemplo de um experimento
com um único fator (banho de têmpera) com k = 3 níveis (água, óleo A e óleo B) e n
= 9 réplicas. Neste experimento, os 27 ensaios ou testes foram realizados em ordem
aleatória. Na Tabela 9, apresenta-se os resultados do experimento.

             Tabela 3.3 : Dados do experimento com a ordem dos ensaios.

               Ordem      Água      Ordem      Óleo A    Ordem      Óleo B
                 24        36,7       11         36        4         35,3
                 12        38,9       26        36,4       14         35
                 25        38,7        9        35,3       15        34,3
                 22        38,8       23        36,8       17        35,7
                 21        37,6        2        36,9       20        35,2
                  8        37,2       18        37,5       3         34,2
                 13        38,8        1        35,3       5         36,5
                 16         38        10         36        6         35,8
                  7        37,2       19        35,7       27        35,5




Neste caso a matriz de planejamento de experimento pode ser montada com a seguinte
seqüência de comandos para entrar com os dados do experimento:

Montando as colunas resposta e ordem:

>y<- scan() : Depois do comando o próximo passo é digitar os valores da resposta
seguidos de enter e para encerrar digite enter duas vezes.

>or<- scan() : Depois do comando o próximo passo é entrar com os dados da ordem do
ensaio da mesma forma anterior.



                                                                                       16
Montando a variável tratamento:

>x<-rep(1:3,each=9) : no caso temos 3 tratamentos com 9 repetições, ou,

>x1<-factor(rep(1:3,each=9),labels=c("agua","oleoA","oleoB"))

Montando o data.frame ( matriz de dados e fatores)

bt<-data.frame(resp=y, ordem=or, trat=x1)

Assim, a matriz de planejamento terá a seguinte forma:

   resp ordem trat
1 36.7 24     agua
2 38.9 12     agua
        *
        *
        *
26 35.8 6 oleoB
27 35.5 27 oleoB

Para a análise descritiva o primeiro passo é indicar o caminho das variáveis no
data.frame, isso é feito com o comando attach(bt) . O comando tapply, possibilita a
manipulação de dados no data.frame. Para um resumo descritivo usamos a seqüência:


tapply(resp,trat,summary)

$água
  Min. 1st Qu.   Median Mean 3rd Qu. Max.
 36.70 37.20     38.00 37.99 38.80 38.90
$óleoA
  Min. 1st Qu.   Median Mean 3rd Qu. Max.
 35.30 35.70     36.00 36.21 36.80 37.50
$óleoB
  Min. 1st Qu.   Median Mean 3rd Qu. Max.
 34.20 35.00     35.30 35.28 35.70 36.50

O comando resultou em um resumo descritivo das respostas por tratamento.
Uma inspeção gráfica pode ser obtida pelo Gráfico de Box-Cox.


>plot(resp~trat,xlab="Banho de Têmpera",ylab="Dureza", col ="red")




                                                                                17
Figura 3.5: Box-Plot para os Valores de Dureza Obtidos em cada Banho de Têmpera.


        Pela Figura 3.5 e medidas descritivas acima, pode-se observar que parece haver
uma diferença entre os banhos de óleo e o de água, sendo que a maior dureza média foi
observada no banho de água.
        O problema agora é verificar se essas diferenças de fato são significativas ou
podem ser de origem aleatória. Para constatarmos se de fato as diferenças são
significativas utilizaremos à análise de variância.

       Para a Análise de Variância temos a seguinte seqüência de comandos:

aov(formula, data = NULL, projections = FALSE, qr = TRUE,
     contrasts = NULL, ...)

Este comando efetua e guarda todos os resultados da ANOVA do modelo (formula)

av<-aov(resp~trat) :

O comando names(av) lista todos os vetores de resultados gerados pela ANOVA como
por exemplo o vetor de resíduos.

> names(av)
 [1] "coefficients" "residuals"  "effects"     "rank"       "fitted.values" "assign"
"qr"
 [8] "df.residual" "contrasts" "xlevels"   "call"     "terms"      "model"

Para utilizar esses vetores deve-se referenciar como por exemplo av$res ou av$fitt ,
aqui será listado o vetor de resíduos e o vetor de valores ajustados pelo modelo
proposto.
Agora utiliza-se o comando summary(av) ou anova(av) , que geram a Tabela da
ANOVA abaixo:

Analysis of Variance Table

Response: resp

             Df SumSq        Mean Sq    F value    Pr(>F)
trat          2 34.145       17.073     28.389     4.732e-07 ***
Residuals    24 14.433       0.601


                                                                                   18
---
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

        Assim, como Fo = 28.389 é um valor bem maior que 1, temos evidências
significativas para concluir que pelo menos um tratamento difere dos demais. Essa
evidência é mais facilmente verificado pelo p-value que neste caso é dado por
Pr(>F)=4.732e-07 , ou seja, a diferença é significativa a um nível de abaixo de 0.001.
        Dessa forma verifica-se que as médias diferem, isto é, que o tipo de banho
utilizado afeta a dureza das peças temperadas.

       Detectado a diferença entre tratamentos o próximo passo e identificar de fato
qual dos tratamentos esta diferindo do outro. Nesta etapa vamos utilizar o teste de
Tukey. O comando para o teste de Tukey é:


>TukeyHSD(av)

Tukey multiple comparisons of means

   95% family-wise confidence level
Fit: aov(formula = resp ~ trat)
$trat
                  diff          lwr upr
oleoA-agua -1.7777778 -2.690713 -0.8648426
oleoB-agua -2.7111111 -3.624046 -1.7981760
oleoB-oleoA -0.9333333 -1.846268 -0.0203982


       Percebe-se, através do teste paras diferenças entre tratamentos e o intervalo de
confiança para as diferenças, que todos os tratamentos são diferentes entre si e a ordem
é dada por:




                                     Água > Óleo A > Óleo B




                                                                                     19
Figura 3.6: Comparações Múltiplas.

O resultado pode ser melhor ilustrado pela Figura 3.6, que é gerado através do comado:

> plot(TukeyHSD(av))

        O modelo de análise de variância assume que as observações são independentes,
com distribuição normal de mesma variância em cada tratamento. Dessa forma devemos
analisar o comportamento dos resíduos através dos seguintes gráficos:

•      Gráfico de resíduos contra ordem de coleta das observações (tempo)
•      Gráfico de resíduos contra Valores Ajustados
•      Gráfico de probabilidade normal.

        Para o Gráfico de resíduos contra ordem de coleta das observações (tempo),
utiliza-se o comando:

>plot (ordem,av$res,xlab="Ordem",ylab="Resíduos",col="red")

Aqui “ordem” é o vetor associado a ordem de realização do experimento, “av$res” é o
vetor relacionado com os resíduos gerados pelo modelo, xlab é o nome da coordenada x,
ylab é o nome da coordenada y e col é a cor desejada. Da mesma forma para Resíduos
X Valores Ajustados temos:




     Figura 3.7 – Gráficos: Resíduos X Ordem e Resíduos X Valores Ajustados

>plot(av$fit,av$res, xlab="Valores Ajustados",ylab="Resíduos",col="blue")

Para o Gráfico Normal tem-se a seqüência de comando:

>qqnorm(av$res,xlab="Quantil da Normal",ylab="Resíduos")




                                                                                    20
Este comando plot os quantis da distribuição normal contra os valores dos resíduos
ordenados

>qqline(av.$res)

Este comando ajusta a reta entre os pontos. Neste caso espera-se que os dados se
alinhem em torno da reta ajustada.




             Figura 3.8 – Gráfico Normal de Probabilidade dos Resíduos


       Considerando o gráfico dos Resíduos X ordem, não se identifica nenhum relação
existente, validando dessa forma a suposição de independência entre os resíduos. Para o
gráfico de resíduos X valores ajustados (médias) a suposição testada era a de variação
igual para ambos os tratamentos, neste caso também parece não haver ocorrido violação
da suposição. No gráfico normal de probabilidade (QQ-Plot) os dados também parecem
não terem violado de forma comprometedora a suposição de normalidade.

Abaixo apresenta-se os testes de Bartlett para homogeneidade de variâncias nos
tratamentos e Shapiro-Wilk para normalidade dos resíduos.
O Teste de Bartlett é usado através do comando:

>bartlett.test(av$res,trat)

       Bartlett test of homogeneity of variances
data: resp and trat
Bartlett's K-squared = 0.199, df = 2, p-value = 0.9053


                                                                                    21
Como visto não se rejeita a hipótese de igualdade de variâncias, portanto essa suposição
não foi violada.
O teste de normalidade de Shapiro-Wilk é usado através do comando:

>shapiro.test(av$res)

     Shapiro-Wilk normality test
data: av$res
W = 0.9613, p-value = 0.3954

Da mesma forma, não se rejeita a hipótese de normalidade dos resíduos, portanto a
suposição de normalidade não foi violada.

Conclusão Final:

   •   Todos os tratamentos (água, óleo A e óleo B) diferem entre si.
   •   A ordem da durabilidade para o tipo de tratamento é: Água > Óleo A > Óleo B.
   •   O modelo utilizado para a análise foi adequado, não violando nenhuma
       suposição inicial.


3.5 - Exercícios do Capítulo

   1. Considere um experimento para determinar o efeito da vazão de C 2F6 sobre a
      uniformidade do ataque químico em uma pastilha de silicone usada na
      fabricação de um circuito integrado. Três vazões são usadas no experimento e a
      uniformidade (%) resultante, para seis replicatas, é mostrado a seguir.




           •   Faça um estudo descritivo, visando comparar os níveis do fator (tabela
               decritiva e Box-Plot).
           •   Faça um análise de variância completa usando α = 0.1 e verifique quais
               as vazões de gás que produzem diferentes uniformidades médias de
               ataque químico.

   2. Um experimento foi feito para determinar se quatro temperaturas específicas de
      queima afetam a densidade de um certo tipo de tijolo. O experimento conduziu
      aos seguintes dados.




                                                                                     22
•   Faça um estudo descritivo, visando comparar os níveis do fator (tabela
          decritiva e Box-Plot).
      •   Faça um análise de variância completa usando α = 0.05 e verifique quais
          níveis de temperatura que produzem diferentes densidades nos tijolos.

   3. A resistência à compressão do concreto está sendo estudada e quatro técnicas
      diferentes de mistura estão sendo investigadas. Os seguintes dados foram
      coletados.




      •   Faça um estudo descritivo, visando comparar os níveis do fator (tabela
          decritiva e Box-Plot).
      •   Faça um análise de variância completa usando α = 0.05 e verifique se as
          misturas afetam a resistência do concreto.

   4. Um engenheiro eletrônico está interessado no efeito, na condutividade do tubo,
      de cinco tipos diferentes de recobrimento de tubos de raios catódicos em uma
      tela de um sistema de telecomunicações. Os seguintes dados de condutividade
      são obtidos. Se α = 0.05 , você pode isolar qualquer diferença na condutividade
      média devido ao tipo de recobrimento?




Capítulo 4- Planejamento de Experimentos em
Blocos Completamente Aleatorizados.

4.1 Introdução




                                                                                  23
Em muitas situações experimentais, a presença de fontes externas perturbadoras
conhecidas pode provocar variabilidade extra e alterar os efeitos dos fatores de
interesse, confundindo dessa forma a análise final do planejamento experimental.
        Os planejamentos de experimentos com blocos completamente aleatorizados são
planejamentos experimentais nos quais parte dessa variabilidade devida a fatores
externos conhecidos é controlada.
Um exemplo desse estudo pode ser ilustrado em uma situação onde se deseja testar a
eficiência de diferentes processos de produção para a mesma finalidade sabendo que a
matéria-prima, que é vinda de diferentes fornecedores pode influenciar no resultado.
Aqui não se tem interesse em testar a matéria prima e sim os processos, no entanto a
matéria-prima que não vem de forma padronizada pode confundir o desempenho dos
processos.
        Nesta situação, os diferentes lotes de matéria-prima devem ser tratados como
blocos. Dentro do bloco devem ser realizados todos os ensaios correspondentes aos
possíveis tratamentos (ou níveis do fator de interesse). Ainda dentro do bloco, a
associação dos tratamentos ás unidades experimentais e a ordem de realização dos
ensaios devem ser determinadas ao acaso.

4.2 Formulação Teórica

       Para este modelo, vamos considerar em geral, que existem k tratamentos que
serão avaliados em b blocos. A disposição dos dados é ilustrada na Tabela abaixo:


                                            Blocos
        Trat            1             2              ...           b             Totais
         1             y11           y12             ...          y1b             y1.
         2             y21           y22             ...          y2 b            y 2.
                                                                              
         k             yk 1          yk 2            ...          ykb             yk .
       Totais          y.1           y.2             ...          y.b             y..




       Nesta situação será coletada apenas uma observação para cada tratamento (nível
do fator), em cada bloco. A maneira como os tratamentos serão alocados às unidades
experimentais e a ordem de realização dos ensaios, dentro de cada bloco, serão
determinadas de modo aleatório. Em função da primeira aleatorização dos tratamentos
com os blocos, dizemos que os blocos representam uma restrição a aleatorização.


       O modelo estatístico para esse experimento é


                yij = µ + τ i + β j + ε ij , i =1,2,, k e j =1,2,, b . (4.1)
onde

yij : observações coletadas sob o i-ésimo tratamento no j-ésimo bloco.
µ : média geral.


                                                                                          24
τi : efeito do i-ésimo tratamento.
βj : efeito do j-ésimo bloco.
εij : erro aleatório associado à observação y ij .

        Aqui será feita a suposição de que os erros aleatórios são independentes e
distribuídos de forma normal com média zero e variância σ 2 , ou seja, ε ij ~ N (0, σ ) .
                                                                                     2


Os tratamentos e blocos serão considerados, inicialmente, como fatores fixos.
        Temos ainda que os efeitos dos tratamentos e dos blocos são definidos como
desvios da média global, de modo que ∑i =1τ i = 0 e ∑j =1 β j = 0 . Considerando
                                           k                 b



também que os tratamentos e os blocos não interagem.

        Assim, estamos interessados em testar a igualdade dos efeitos do tratamento. Isto
é:

                          H 0 : τ1 = τ 2 =  = τ k = 0
                                                                          (4.2)
                          H 1 : τ i ≠ 0 , para no mínimo um i

        Dessa forma a análise de variância pode ser estendida ao planejamento em
blocos completamente aleatorizados. O procedimento usa a soma de quadrados total,
SQT , que representa uma partição da variabilidade total das observações em relação à
variabilidade explicada pelo tratamento, pelos blocos e pelo acaso.

SQT = ∑∑ ( y ij − y.. ) = b∑ ( y i . − y.. ) 2 + k ∑ ( y. j − y.. ) 2 + ∑∑ ( y ij − y. j − y i . + y.. ) 2
          k     b                 k                    b                   k    b
                           2

         i =1 j =1               i =1                 j =1                i =1 j =1

                                                  (4.3)

Aqui:

y i . : soma da observações no i-ésimo tratamento
y . j : soma da observações no j-ésimo bloco
y .. : soma total
y i . : média das observações no i-ésimo tratamento
y . j : média das observações no j-ésimo bloco
y .. : média geral de todas as observações.
N = kb : Total de observações.

       A demonstração da partição de SQT pode ser vista em Montegomery, 2001. A
identidade da soma quadrática pode ser representada simbolicamente por

                               SQT = SQTrat + SQBloco + SQE (4.4)
onde,

          k     b
SQT = ∑∑ ( y ij − y.. ) 2 : Soma de quadrados total.
         i =1 j =1
               k
SQTrat = b∑ ( y i. − y.. ) 2 : Soma de quadrados devido aos tratamentos.
              i =1




                                                                                                        25
b
SQ Blo cos = k ∑( y. j − y.. ) 2 : Soma de quadrados devido aos blocos.
                    j =1
         k    b
SQ E = ∑∑ ( y ij − y. j − y i. + y.. ) 2 : Soma do quadrado dos resíduos.
        i =1 j =1



        O desmembramento do grau de liberdade correspondente a essas somas
quadráticas é dado da seguinte forma. Para N observações, SQT terá N −1 graus de
liberdade, para k tratamentos e b blocos, SQTrat e SQBlo cos terão k −1 e b −1
graus de liberdade respectivamente. Para SQ E temos ( k −1)(b −1) graus de
liberdade por subtração. A idéia do teste é a mesma do planejamento completamente
aleatorizado, procurando trabalhar com os quadrados médios. Para este modelo os
quadrados médios são:
                           SQTrat
                 QM Trat =        : Quadrado Médio dos Tratamentos
                            k −1

                                           SQBlo cos
                            QM Blo cos =             : Quadrado Médio dos Blocos.
                                            b −1

                                        SQ E
                           QM E =                : Quadrado Médio dos Resíduos.
                                    (k −1)(b −1)

       Pode ser demonstrado (ver Montgomery, 2002) que os valores esperados dessas
médias quadráticas são:
                                                                k
                                                             b∑ τ i2
                                                                                (4.5)
                                     E ( QM Trat ) = σ 2 +     i =1

                                                               k −1
                                                                    b
                                                               k ∑ β j2
                                                                                 (4.6)
                                    E ( QM Blo cos ) = σ 2 +
                                                                    j =1

                                                                b −1

                                             E ( QM E ) = σ 2           (4.7)

Dessa forma, se a hipótese nula H 0 for verdadeira de modo que todos os efeitos do
tratamento τ i = 0 , então QM Trat será um estimador não tendencioso de σ 2 , enquanto
se H o for falsa, estimará σ 2 mais um termo quadrático positivo. O quadrado médio
dos resíduos será sempre um estimador não tendencioso de σ 2 . Dessa forma para testar
a hipótese nula de que os efeitos dos tratamentos sejam iguais a zero, utilizamos a
estatística

                                                        QM Trat
                                                 F0 =
                                                        QM E

que, sob H o , terá uma distribuição F, com ( k −1), (k −1)(b −1) graus de liberdade.
Assim, rejeita-se a hipótese nula H o , com um nível de significância α , se




                                                                                         26
Fo = Fα , [ ( k −1),( k −1)(b −1) ]

O quadro da ANOVA será dado por:


                            Tabela 4.1 – Quadro da Anova
  Fonte de               SQ              GL              QM                              Fo
  Variação
 Tratamentos            SQTrat                  k −1                     QM Trat      QM Trat
                                                                                       QM E
    Blocos             SQBlo cos                b −1                     QM Blo cos   QM Blo cos
                                                                                       QM E
     Erros              SQ E              ( k −1)(b −1)                   QM E
     Total              SQT                N − 1 = kb − 1


                            QM Blo cos
       A estatística   F=              , aparece como teste para o efeito dos blocos. A
                             QM E
validade dessa razão como uma estatística de teste para a hipótese nula de nenhum
efeito do bloco é duvidosa, uma vez que os blocos representam uma restrição à
aleatoriedade, ou seja, usamos a aleatoridade apenas dentro dos blocos. Podemos
considerar, se os blocos forem realizados em uma ordem aleatória, que um valor grande
para F dá indicativos para efeitos significativos dos blocos, mas não podemos afirmar
esses resultados como para o teste do efeito dos tratamentos.



4.3-Análise de Resíduos (Verificação da Adequação do Modelo)

Da mesma forma, no caso dos planejamentos em blocos completamente aleatorizados
deve ser verificada a validade das suposições de normalidade dos erros, igualdade de
variância das observações nos tratamentos, nos blocos e ausência da interação
tratamento-bloco. A análise de resíduo é a principal ferramenta utilizada para esta
verificação. Para os planejamentos em blocos completamente aleatorizados os resíduos
são definidos por
                         ε ij = y ij − y ij = y ij − y i. − y. j + y.. (4.8)
                                       ˆ


As verificações serão feitas por meio do estudo dos gráficos de resíduos como: Gráficos
de resíduos X Valores Ajustados; Gráficos de Resíduos x Tratamentos; Resíduos x
Blocos e Gráfico de probabilidade Normal. Aqui pode-se também usar o teste de
Barllets para testar a igualdade de variâncias e o teste de ShapiroWilk para Normalidade
dos resíduos.

4.4- Comparações Múltiplas.

Da mesma forma pode-se utilizar o teste de Tukey, considerando agora uma pequena
alteração no grau de liberdade do QM E , que agora possui ( k −1)(b −1) graus de
liberdade e substituir o número n de réplicas pelo número de blocos b.


                                                                                                   27
4.5 – Aplicação do Software R na analise de dados para o planejamento de
experimento aleatorizado em blocos completos.

Para ilustrarmos a aplicação desse modelo, utilizamos outro problema proposto em
Werkema & Aguiar, (1996) descrito abaixo:

Com o objetivo de reduzir o tempo de reação de um processo químico, uma indústria
resolve realizar um experimento com quatro tipos de catalisadores (A,B,C e D). No
entanto os técnicos perceberam que a matéria-prima utilizada na reação não era
totalmente homogênea e representava uma fonte de variabilidade que afetava o
desempenho do processo. Uma maneira de contornar este problema consistia em
selecionar vários lotes de matéria-prima e comparar os quatro catalisadores nas
condições relativamente homogêneas dentro de cada lote. Dessa forma, a equipe decidiu
usar cinco lotes disponíveis no estoque da industria e para cada lote extrair quatro
porções de matéria-prima, de modo que cada porção fosse suficiente para fabricar uma
batelada de produto, e alocar aleatoriamente a cada uma destas porções um dos
catalisadores considerados no estudo. Estabeleceu-se a aleatorização da ordem de
realização dos ensaios. Neste caso, cada ensaio corresponde à produção de uma batelada
da substância química utilizando uma das combinações porção de matéria-
prima/catalisador. Portanto estamos diante de um experimento aleatorizado em blocos
completos.
Cada bloco corresponde a um lote de matéria prima e os tratamentos ou níveis do fator
correspondem aos tipos de catalisador. Dentro de um bloco, a associação dos
tratamentos às unidades experimentais e a ordem de realização dos ensaios são
determinadas ao acaso.

Os dados desse experimento estão ilustrados abaixo:

                 Tabela 4.2: Dados do experimento com Catalisadores

                                              Lotes
            Catalisador    1          2         3         4         5
            A              41         34       40         39        33
            B              43         37       45         42        40
            C              45         38       48         43        38
            D              43         41       45         46        40

4.5.1 - Entrada de dados e análise descritiva usando o Software R.

Aqui a matriz de planejamento será montada da seguinte forma:

Repostas:

y<- scan() : Depois do comando o próximo passo é entrar com os dados da resposta.

Montando a variável Bloco e Tratamento:

b<-rep(1:5,each=4) : no caso temos 5 blocos com 4 repetições.
tr<-rep(1:5,4) : no caso temos 4 tratamentos com 5 repetições.



                                                                                    28
Uma opção mais completa pode ser definida por:

b<-factor(rep(1:5,each=4),labels=c("Lote1","Lote2","Lote3","Lote4","Lote5"))
tr<- factor(rep(1:4,5),labels=c("A","B","C","D"))

Montando o Data.frame

decab<-data.frame(resp=y,trat=tr,bloco=b)

> decab
   resp trat bloco
1 41 A Lote1
2 43 B Lote1
      *
      *
      *
19 38 C Lote5
20 40 D Lote5

Da mesma forma utilizando o comando attach() e tapply(), a um resumo descritivo
considerando os fatores.

attach(decab)

> tapply(resp,trat,summary)
$A
  Min. 1st Qu. Median Mean        3rd Qu. Max.
  33.0 34.0 39.0       37.4       40.0    41.0
$B
  Min. 1st Qu. Median Mean        3rd Qu. Max.
  37.0 40.0 42.0        41.4        43.0 45.0
$C
  Min. 1st Qu. Median Mean        3rd Qu. Max.
  38.0 38.0     43.0   42.4         45.0 48.0
$D
  Min. 1st Qu. Median Mean        3rd Qu.     Max.
   40 41         43     43           45       46
> tapply(resp,bloco,summary)

$Lote1
  Min. 1st Qu.   Median   Mean 3rd Qu.        Max.
  41.0 42.5       43.0    43.0  43.5          45.0
$Lote2
  Min. 1st Qu.   Median Mean       3rd Qu. Max.
 34.00 36.25     37.50  37.50       38.75 41.00
$Lote3
  Min. 1st Qu.   Median   Mean     3rd Qu. Max.
 40.00 43.75     45.00    44.50     45.75 48.00
$Lote4
  Min. 1st Qu.   Median    Mean     3rd Qu.    Max.


                                                                            29
39.00 41.25 42.50     42.50   43.75 46.00
$Lote5
  Min. 1st Qu. Median Mean 3rd Qu. Max.
 33.00 36.75 39.00 37.75     40.00 40.00

Uma inspeção gráfica, pode ser obtida pelos comandos:

par(mfrow=c(2,1))
plot(trat,resp,xlab="Tratamento",ylab="Respostas")
plot(bloco,resp,xlab="Bloco",ylab="Respostas")




   Figura 4.1: Box-Plot para os tempos de reação segundo tratamento (catalisador) e
                            bloco (lotes de matéria-prima).
 Pela Figura 4.1 e medidas descritivas acima, pode-se observar que parece haver uma
diferença entre os tempos, sendo que o menor tempo de reação parece estar associado
ao catalisador A.

>     coplot(resp~trat|bloco,panel=panel.smooth,rows=1,xlab=c("Medidas         por
Catalisador", paste("Bloco")),ylab="Tempo de Reação")




                                                                                30
O problema agora é verificar se essas diferenças de fato são significativas ou podem ser
de origem aleatória. Para constatarmos se de fato as diferenças são significativas
utilizaremos à análise de variância.

> eb.av<-aov(resp~trat+bloco)
> anova(eb.av)

Analysis of Variance Table

Response: resp
           Df Sum Sq Mean Sq F value Pr(>F)
trat       3    95.350 31.783           13.430       0.0003839 ***
bloco       4 165.200 41.300            17.451       6.098e-05 ***
Residuals 12 28.400         2.367
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1




                                                                                     31
Pelo quadro da anova acima, verifica-se que existe diferença entre tratamentos, com
relação aos blocos tem-se uma indicação de que apresentaram efeito significativo, sendo
dessa forma seu uso indispensável neste experimento.

Detectado a diferença entre tratamentos o próximo passo e identificar de fato qual dos
tratamentos esta diferindo do outro. Nesta etapa vamos utilizar o teste de Tukey.

Comando:

>TukeyHSD(eb.av)

 Tukey multiple comparisons of means
  95% family-wise confidence level

Fit: aov(formula = resp ~ trat + bloco)

$trat
        diff       lwr          upr
B-A     4.0     1.111354      6.888646
C-A     5.0     2.111354     7.888646
D-A     5.6    2.711354      8.488646
C-B     1.0    -1.888646     3.888646
D-B      1.6   -1.288646     4.488646
D-C      0.6   -2.288646     3.488646




$bloco
                     diff        lwr        upr
Lote2-Lote1       -5.50      -8.967325    -2.032675
Lote3-Lote1        1.50      -1.967325      4.967325
Lote4-Lote1       -0.50      -3.967325      2.967325
Lote5-Lote1       -5.25      -8.717325     -1.782675
Lote3-Lote2        7.00       3.532675    10.467325
Lote4-Lote2        5.00       1.532675      8.467325
Lote5-Lote2        0.25      -3.217325       3.717325
Lote4-Lote3       -2.00      -5.467325       1.467325
Lote5-Lote3       -6.75     -10.217325     -3.282675
Lote5-Lote4       -4.75       -8.217325     -1.282675

Percebe-se, através do teste paras diferenças entre tratamentos e o intervalo de
confiança para as diferenças, que o catalisador A proporciona menor tempo de reação
comparado com todos os tratamentos.

Para este modelo devem-se construir os gráficos de resíduos contra valores ajustados;
gráfico de resíduos contra tratamentos; gráfico de resíduos contra blocos e gráfico de



                                                                                    32
probabilidade normal. Da mesma forma, podem-se utilizar alguns testes para verificar
as hipóteses de variância constante e normalidade dos dados.
Na Figura abaixo contém os gráficos descritos acima, para a análise de resíduos.




     Figura 4.2: Gráficos para Análise de Resíduo do modelo de planejamento de
                         experimentos em blocos completos.
A seqüência dos comandos para a análise de resíduos da Figura 4.2, é descrita abaixo:

> par(mfrow=c(2,2))
> plot(eb.av$fit,eb.av$res,xlab="Valores Ajustados",ylab="Resíduos",col="blue")
> plot(trat,eb.av$res,xlab="Tratamentos",ylab="Resíduos",col="blue")
> plot(bloco,eb.av$res,xlab="Blocos",ylab="Resíduos",col="blue")
> qqnorm(eb.av$res,xlab="Quantil da Normal",ylab="Resíduos",col="blue")
> qqline(eb.av$res)

Pela Figura 4.2, parece não existir nenhuma violação grave na suposição do modelo.
Aplicando os testes de normalidade e homogeneidade de variâncias tem-se os seguintes
resultados:

Para o teste da Normalidade dos Resíduos temos:

> shapiro.test(eb.av$res)

    Shapiro-Wilk normality test



                                                                                        33
data: eb.av$res
W = 0.9217, p-value = 0.1066
Para testar a homogeneidade das variâncias temos:

> bartlett.test(eb.av$res,trat)

       Bartlett test of homogeneity of variances

data: eb.av$res and trat
Bartlett's K-squared = 0.8093, df = 3, p-value = 0.8472

>bartlett.test(eb.av$res,bloco)

       Bartlett test of homogeneity of variances

data: eb.av$res and bloco
Bartlett's K-squared = 0.5292, df = 4, p-value = 0.9706

Como a suposições de normalidade e nem de variância constante foram rejeitadas,
pode-se considerar o modelo como válido e a análise encerrada.

4.6- Conclusões Finais

   •     Existe diferença entre o tempo médio de reação entre os tratamentos, sendo que
         o Catalisador A apresenta menor tempo de reação.
   •     O modelo utilizado na análise se mostrou apropriado, sem apresentar violações.
   •     Dessa forma recomenda-se a utilização do Catalisador A na produção, pois irá
         aumentar a produtividade do processo.



4.7- Exercícios do Capítulo

   1- Um experimento foi conduzido a fim de investigar o escapamento de corrente
      elétrica em um aparelho SOS MOSFETS. A finalidade do experimento foi
      investigar como o escapamento de corrente varia com o comprimento do canal.
      Quatro comprimentos diferentes foram selecionados. Para cada comprimento do
      canal, cinco larguras diferentes foram também usadas. A largura deve ser
      considerada como fator pertubador. Eis os dados.

                                                              Largura
         Comprimento do Canal           1             2          3          4            5
                  1                    0,7           0,8        0,8        0,9           1
                  2                    0,8           0,8        0,9        0,9           1
                  3                    0,9            1         1,7         2            4
                  4                     1            1,5         2          3            20


   2- No artigo intitulado “O efeito do projeto do bocal na estabilidade e desempenho
      de jatos turbulentos de água”, na revista Fire Safety Journal,Vol.4,agosto de
      1981,C.Theobald descreve um Velocidade do Jato deuma medida da forma foi
                                      experimento em que Saída (m/s)
         Tipo de Bocal         11,73         14,37         16,59   20,43         23,46        28,74
               1               0,78           0,8          0,81    0,75          0,77         0,78
               2               0,85          0,85          0,92    0,86          0,81         0,83
                                                                                                      34
               3               0,93          0,92          0,95    0,89          0,89         0,83
               4               1,14          0,97          0,98    0,88          0,86         0,83
               5               0,97          0,86          0,78    0,76          0,76         0,75
determinada para vários tipos diferentes de bocais, com níveis diferentes de
            velocidade do jato de saída. O interesse nesse experimento está principalmente
            no tipo de bocal, sendo a velocidade um fator que provoca distúrbio. Os dados
            são apresentados a seguir.




                  •   O tipo de bocal afeta a medida da forma? Compare os bocais, usando os
                      diagramas de caixa e a análise de variância.
                  •   Compare as diferenças entre os bocais utilizando o gráfico box-plot.
                  •   Faça a análise de resíduos para o modelo.

        3- Um experimento foi realizado para determinar o efeito de quatro tipos diferentes
           de ponteiras em um teste de dureza de uma liga metálica. Quatro corpos de
           prova da liga foram obtidos e cada ponteira foi testada uma vez em cada corpo
           de prova, produzindo os seguintes dados:

                                                  Corpo de Prova
                      Tipo de Ponteira     1        2        3          4
                              1           9,3      9,4      9,6        10
                              2           9,4      9,3      9,8        9,9
                              3           9,2      9,4      9,5        9,7
                              4           9,7      9,6       10       10,2


                  •   Faça uma análise de variância completa para checar se existe diferença
                      nas medidas de dureza entre as ponteiras.
     Capítulo 5 – Planejamentos Fatorias
     Em muitas situações práticas podemos ter interesse em estudar o efeito de dois ou mais
     fatores, nestas situações um experimento fatorial deve ser utilizado. Nos experimentos
     fatorias, os fatores variam de forma simultânea, especificamente, queremos dizer que
     em cada tentativa completa ou replicação do experimento, são investigadas todas as
     combinações dos níveis dos fatores. Por exemplo, se há dois fatores A e B, com a
     níveis para o fator A e b níveis para o fator B, então cada replicação contém todas as
      ab combinações possíveis.

     O efeito de um fator é definido como a mudança na resposta produzida por uma
     mudança no nível do fator. Isso é chamado efeito principal, porque se refere aos fatores
     principais no estudo.
35
   Se a diferença na resposta entre os níveis de um 25
                                                    fator não é a mesma em todos os níveis
30
   dos outros fatores, então esse efeito é chamado de interação. Abaixo apresentamos
                                                    20
25
   exemplos gráficos de planejamentos com dois fatores com e sem interação.
                                                    15
20                                        B(+)                                              B(+)
15                                        B(-)        10                                    B(-)
10
                                                      5
 5
 0                                                    0                                   35
              -                 +                               -                +
                      Fator A                                         Fator A
Figura 5.1: Sem Interação                                      Figura 5.2: Presença de Interação

5.1- Planejamento Fatorial com dois fatores.

Vamos considerar neste caso o planejamento com dois fatores. Aqui consideramos A e
B, com a e b níveis respectivamente. Se o experimento é replicado n vezes, a
disposição dos dados pode ser ilustrada na tabela abaixo:

Tabela 5.1: Disposição dos dados para um experimento fatorial com dois fatores
                                                  Fator B
   Fator A                1                2              …                  b
      1             y111 , y112 ,    y121 , y122 ,                      y1b1 , y1b 2 ,
                   ..., y11n        ..., y12 n            …            ..., y1bn
        2            y211 , y212 ,              y221, y222 ,                              y2 b1 , y2 b 2 ,
                     ..., y21n                 ..., y22 n                     …           ..., y2 bn
                                                                                           
                     ya11 , ya12 ,             ya 21 , ya 22 ,                            yab1 , yab 2 ,
        a            ..., ya1n                ..., ya 2 n                     …           ..., yabn
Em geral, a observação na ij-ésima cela na k-ésima repetição é yijk . Aqui, na coleta de
dados, as abn observações devem ser feitas em ordem aleatória. O planejamento
fatorial com dois fatores é um planejamento completamente aleatorizado. Vamos supor,
inicialmente, que ambos os fatores tenham efeitos fixos.
O modelo matemático para observações de um experimento fatorial com dois fatores é
dado por



                                                                i = 1,2,..., a
                                                               
                   yijk = µ + τ i + β j + (τβ ) ij + ε ijk   ;  j = 1,2,..., b   (5.1)
                                                                k = 1,2,..., n
                                                               
onde:

µ : é o efeito médio geral
τi : é o efeito do i-ésimo nível do fator A.
βj : é o efeito do j-ésimo nível do fator B.


                                                                                                             36
(τβ)ij : é o efeito da interação entre A e B.
εijk : é o erro aleatório. Da mesma forma, vamos considerar que εijk ~ N (0;σ 2 ).

Ambos os fatores são considerados fixos, e o efeito dos tratamentos são definidos como
desvios da média geral, dessa forma ∑i =1τ i = 0 e ∑j =1 β j = 0 .
                                      a                b




Similarmente os efeitos da interação são considerados fixos e são definidos de forma
que ∑i =1 (τi β j ) = ∑j =1 (τi β j ) = 0 . Como existirão n réplicas no experimento, tem-
       a               b



se um total de abn observações.

No experimento fatorial com dois fatores, tem-se interesse em testar o efeito dos dois
fatores. Especificamente, estamos interessados em testes de hipóteses sobre a igualdade
do efeito do tratamento das linhas (Fator A)

                        H 0 : τ1 = τ 2 = ... = τ a = 0
                                                                           (5.2)
                        H1 : τi ≠ 0, para pelo menos um i

E a igualdade de efeito do tratamento das colunas (Fator B).


                        H 0 : β1 = β2 = ... = βb = 0
                                                                            (5.3)
                        H1 : β j ≠ 0; para pelo menos um j.



Também, tem-se interesse em se testar o efeito da interação entre linhas e colunas, ou
seja,

                  H 0 : (τβ)ij = 0, para todo i, j.
                                                                                    (5.4)
                  H1 : (τβ)ij ≠ 0, para pelo menos um para (i, j ).



5.1.1- Análise Estatística para o modelo de efeitos fixos.


Sejam yi .. o total das observações no i-ésimo nível do fator A, y . j . o total das
observações no j-ésimo nível do fator B, y ij . o total das observações na ij-ésima cela
da Tabela 1, e y i .. , y. j . , y ij . e y... como as correspondentes médias de linha, coluna,
cela e total. Isto é,

                                                            y i..
                  y i .. = ∑j =1 ∑ =1 y ijk
                             b      n
                                  k
                                                  y i.. =         ;      i =1,2,..., a
                                                            bn

                                                              y. j .
                  y. j . = ∑i =1 ∑k =1 y ijk
                             a      n
                                                   y. j . =            ; j =1,2,..., b
                                                              an




                                                                                            37
y ij .     i = 1,2,..., a
                       y ij . = ∑k =1 y ijk                                                     ;
                                  n
                                                                            y ij . =
                                                                                                  j = 1,2,..., b
                                                                                        n


                                                                                                                y...
                   y... = ∑=1 ∑j =1 ∑ =1 y ijk
                                  a      b           n
                           i         k
                                                                                                      y... =
                                                                                                               abn


A análise de variância decompõe a soma de quadrados total


                                              a     b       n
                                 SQT = ∑∑∑( y ijk − y... ) 2                                      (5.5)
                                              i =1 j =1 k =1




Da seguinte forma:


             a     b     n                                      a                                     b

            ∑∑∑( yijk − y... ) 2 = bn∑( yi.. − y... ) 2 + an∑( y. j. − y... ) 2
             i =1 j =1 k =1                                 i =1                                     j =1
                                                            a           b
                                                  + n∑∑ ( y ij . − y i .. − y. j . + y... ) 2
                                                          i =1 j =1
                                                        a           b       n
                                                  + ∑∑∑( y ijk − y ij . ) 2 .
                                                        i =1 j =1 k =1




Ou, simbolicamente,

                               SQT = SQ A + SQB + SQ AB + SQE                                       (5.6)


A decomposição dos graus de liberdade é ilustrada na tabela abaixo:


                       Tabela 5.2 – Decomposição dos graus de liberdade.

                  Efeito                                                                        Graus de Liberdade
                    A                                                                                  a −1
                    B                                                                                  b −1
              Interação AB                                                                          ( a −1)(b −1)
                   Erro                                                                                ab( n −1)
                  Total                                                                                   abn −1




                                                                                                                       38
Cada soma de quadrados dividido pelos respectivos graus de liberdade formam os
quadrados médios. Assim

                            SQ A
                  QM A =         : Quadrado médio do tratamento A.
                            a −1

                            SQ B
                  QM B =         : Quadrado médio do tratamento B.
                            b −1


                               SQ AB
               QM AB =                  : Quadrado médio da Interação.
                          ( a −1)(b −1)


                               SQ E
                    QM E =             : Quadrado médio dos Erros.
                             ab(n − 1)
Os valores esperados dos quadrados médios são:


                                               bn∑i =1τ i2
                                                       a
                                  SQ A 
                   E (QM A ) = E        =σ +
                                            2
                                                                       (5.7)
                                  a −1         a −1

                                              an ∑ j =1 β j
                                                       b       2
                                 SQB                                  (5.8)
                  E (QM B ) = E        =σ +
                                           2

                                 b −1          b −1


                                                 n∑i =1 ∑ j =1 (τβ ) ij
                                                           a       b 2
                              SQ AB      
                          (a − 1)(b − 1)  = σ + (a − 1)(b − 1)
          E (QM AB ) = E                                                       (5.9)
                                               2
                                          
                                         


                                       SQE 
                                       ab(n − 1)  = σ
                        E (QM E ) = E                  2
                                                              (5.10)
                                                 


Note que se as hipóteses nulas sobre o efeito das linhas A, efeitos das colunas B e da
interação AB são verdadeiras então QM A , QM B , QM AB e QM E são todos
estimativas de σ 2 .

Dessa forma, se existe diferenças entre os efeitos dos tratamentos em A, então QM A
será maior que QM E . Similarmente, se existe diferenças nos efeitos dos tratamentos
em B, ou na interação AB, então a correspondente média quadrática será maior que
QM E . Portanto o teste de significância de ambos os efeitos e interações, é
simplesmente usar a razão entre as médias quadráticas e o quadrado médio dos resíduos
QM E .




                                                                                        39
Se for assumido que o modelo da equação 5.1 é adequado e que os ε ij k são
independentes e identicamente distribuídos de forma normal com variância constante
                                               QM A QM B           QM AB
σ 2 , então cada razão de quadrados médios            ,         e          é distribuído
                                               QM E QM E           QM E
como uma F com (a −1) , (b −1) e ( a −1)(b −1) graus de liberdade do
numerador respectivamente e ab( n −1) graus de liberdade do denominador. A região
critica para um teste com nível de significância α , será valores da razão de quadrados
que exceder o quantil da F com um nível α e respectivos graus de liberdade.


O procedimento é resumido na tabela de Análise de Variância abaixo:


                            Tabela 5.3 – Quadro da ANOVA

  Fonte de         Soma de              Graus de                     Quadrado Médio
  Variação        Quadrados             Liberdade                                       F0
                                                                           SQ A        QM A
      A              SQ A                   a −1                      QM A =
                                                                           a −1        QM E
                                                                           SQB         QM B
      B              SQ B                   b −1                 QM B =
                                                                           b −1        QM E
                                                                            SQ AB      QM AB
                                     ( a −1)(b −1)             QM AB =
  Interação         SQ AB                                              ( a −1)(b −1)   QM E
                                                                           SQ E
                                        ab( n −1)               QM E =
    Erro             SQ E                                                ab(n − 1)

    Total            SQT                  abn −1




5.1.2- Análise de Resíduo para o Modelo Fatorial com 2 fatores fixos.


Do mesmo modo que nos experimentos com um fator, discutidos anteriormente, os
resíduos de um experimento fatorial desempenham papel importante na garantia de
adequação do modelo. Os resíduos de um experimento fatorial de dois fatores são

                            ε ijk = y ijk − y ijk = y ijk − y ij .
                                            ˆ                          (5.11)

 Isto é, os resíduos são, simplesmente, a diferença entre as observações e as médias das
celas correspondentes (ver Montgomery, 2001). Da mesma forma a utilização de
gráficos e testes para checar a adequação das suposições serão de grande importância.
Para o modelo fatorial de dois fatores A e B, destacamos os seguintes gráficos e testes.

   1. Gráfico da probabilidade normal. Usado com os resíduos, checa se os mesmos
      seguem uma distribuição normal. Aqui também utiliza-se o teste de
      normalidade como por exemplo Shapiro-Wilky.


                                                                                               40
2. Gráfico de resíduos X níveis do fator A. Checa a homogeneidade da variância
      nos níveis de A.
   3. Gráfico de resíduos X níveis do fator B. Checa a homogeneidade da variância
      nos níveis de B.
                                               ˆ
   4. Gráfico de resíduos X valores preditos y ijk . Checa a homogeneidade da
      variância de forma geral. Para testar a homogeneidade da variância pode-se usar
      o teste de Bartey.
   5. Gráfico de resíduos X Ordem de coleta. Checa a suposição de independência
      entre as observações.

Se forem observadas evidências de fortes violações na suposição do modelo, esse deve
ser invalidado ou deve-se proceder a transformações dos dados originais (ver
Montgomery, 2001).

5.1.3- Comparações Múltiplas


Identificado o efeito significativo nos níveis dos fatores, deve-se utilizar um teste de
comparações múltiplas, para a identificação das diferenças específicas. Novamente será
utilizado nesta fase o teste de comparações múltiplas de Tukey.
Vale ressaltar que quando a interação é significativa, a comparação entre médias de um
mesmo fator pode ser mascarada pelo efeito da interação. Uma alternativa para essa
situação é por exemplo fixar o fator B em um nível específico e aplicar o teste Tukey
para as médias do fator A neste nível fixado.

5.2- O Modelo de Planejamento Fatorial Geral


Os resultados do experimento fatorial com dois fatores podem ser facilmente estendidos
para o caso geral onde existem a níveis do fator A, b níveis do fator B, c níveis do
fator C, e assim por diante. No geral, existirão abc...n observações totais para n
réplicas completas do experimento. Aqui, deve-se ter no mínimo duas réplicas ( n ≥ 2 )
para determinar as somas de quadrados envolvidas no modelo.

Se todos os fatores no experimento são fixos, pode-se facilmente formular e testar
hipóteses sobre os efeitos principais e interações. Neste caso, testes estatísticos para
cada efeito principal e interação podem ser construídos pela divisão da correspondente
média de quadrados dos efeitos ou interação pela média quadrática dos erros. Todos são
testes F , unilaterais a direita. O número de graus de liberdade para os efeitos
principais é o número de níveis do fator menos um e o número de graus de liberdade
para interação é o produto do número de graus de liberdade associado com os
componentes individuais da interação. Por exemplo, considerando o modelo com três
fatores temos:




                                                                                     41
 i = 1,2,..., a
                                                                                                     j = 1,2,..., b
                                                                                                    
       y ijkl = µ + τ i + β j + γ k + (τβ ) ij + (τγ ) ik + ( βγ ) jk + (τβγ ) ijk + ε ijkl   , com 
                                                                                                     k = 1,2,..., c
                                                                                                     l = 1,2,..., n
                                                                                                    
(5.12)

Assumindo que A,B e C são fixados, a tabela resumo da análise de variância, incluindo
a esperança dos quadrados médios é dada abaixo.

              Tabela 5.4 – Quadro da Anova (Modelo Fatorial com Três Fatores)

Fonte de Soma de                          Graus de                 Quadrado             Esperança da Média              Fo
Variação Quadrados                        Liberdade                 Médio                   Quadrática
   A       SQ A                              a −1                   QM A                       bcn∑τ i2                QM A
                                                                                          σ2 +
                                                                                                       a −1            QM E
   B                SQ B                     b −1                      QM B                          acn∑ β 2          QM B
                                                                                              σ2 +
                                                                                                       b −1            QM E
   C                SQC                      c −1                      QM C                          abn∑ γ k2         QM C
                                                                                              σ2 +
                                                                                                    c −1               QM E
  AB               SQ AB              ( a −1)(b −1)                    QM AB                     cn∑∑(τβ ) ij
                                                                                                           2
                                                                                                                       QM AB
                                                                                        σ2 +
                                                                                                  ( a − 1)(b − 1)      QM E
  AC               SQ AC                (a − 1)(c − 1)                 QM AC                     bn∑∑(τγ ) ik
                                                                                                           2
                                                                                                                       QM AC
                                                                                        σ2 +
                                                                                                  (a − 1)(c − 1)       QM E
  BC               SQBC               (b −1)(c −1)                     QM BC                    an∑∑( βγ ) 2jk         QM BC
                                                                                        σ2 +
                                                                                                  (b − 1)(c − 1)       QM E
 ABC              SQ ABC           ( a −1)(b −1)(c −1)                                         n∑∑∑(τβγ ) ijk
                                                                                                          2
                                                                                                                  QM ABC
                                                                    QM ABC           σ + 2

                                                                                               (a −1)(b −1)(c −1) QM E
 Erro               SQ E                  abc( n − 1)                  QM E                        σ2
 Total              SQT                      abcn −1



A soma de quadrados total é encontrada da mesma forma anterior, sendo dada por

                                                                                      2
                                                                                    y....
                         SQT = ∑i =1 ∑j =1 ∑k =1 ∑l =1 y
                                         a       b        c        n      2
                                                                          ijkl   −               (5.13)
                                                                                   abcn


As somas de quadrados dos efeitos principais são encontradas a partir dos totais dos
fatores A ( y i ... ) , B ( y. j .. ) e C ( y..k . ) como segue




                                                                                                                       42
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento
Apostila planejamento

Mais conteúdo relacionado

Mais procurados

A escolha do método estatístico profa. dra. lívia maria andaló tenuta (unic...
A escolha do método estatístico   profa. dra. lívia maria andaló tenuta (unic...A escolha do método estatístico   profa. dra. lívia maria andaló tenuta (unic...
A escolha do método estatístico profa. dra. lívia maria andaló tenuta (unic...
Jose Carlos Carlos Melo
 
Tipos de variações
Tipos de variaçõesTipos de variações
Tipos de variações
UERGS
 
Apresentação cep
Apresentação cepApresentação cep
Apresentação cep
emc5714
 
Controle+estatístico+da+qualidade[1]
Controle+estatístico+da+qualidade[1]Controle+estatístico+da+qualidade[1]
Controle+estatístico+da+qualidade[1]
silvioxavierjunior
 
Seminário sobre Validação 2003
Seminário sobre Validação 2003Seminário sobre Validação 2003
Seminário sobre Validação 2003
Adriana Quevedo
 
0 Aula De ValidaçãO
0   Aula De ValidaçãO0   Aula De ValidaçãO
0 Aula De ValidaçãO
Alvaro Neto
 
Controle de Processo
Controle de ProcessoControle de Processo
Controle de Processo
Euler Silva
 
MSA - Análise dos sistemas de medição
MSA - Análise dos sistemas de mediçãoMSA - Análise dos sistemas de medição
MSA - Análise dos sistemas de medição
Carlos Ernesto Natali
 

Mais procurados (20)

apostila de estatistica 2012
apostila de estatistica 2012apostila de estatistica 2012
apostila de estatistica 2012
 
Aula 1 validação em métodos cromatográficos e afins
Aula 1  validação em métodos cromatográficos e afinsAula 1  validação em métodos cromatográficos e afins
Aula 1 validação em métodos cromatográficos e afins
 
Introdução experimentação
Introdução experimentaçãoIntrodução experimentação
Introdução experimentação
 
Controle de processos
Controle de processosControle de processos
Controle de processos
 
Introdução ao CEP
Introdução ao CEPIntrodução ao CEP
Introdução ao CEP
 
Validação de métodos analíticos
Validação de métodos analíticosValidação de métodos analíticos
Validação de métodos analíticos
 
A escolha do método estatístico profa. dra. lívia maria andaló tenuta (unic...
A escolha do método estatístico   profa. dra. lívia maria andaló tenuta (unic...A escolha do método estatístico   profa. dra. lívia maria andaló tenuta (unic...
A escolha do método estatístico profa. dra. lívia maria andaló tenuta (unic...
 
Experimentacao agricola manual
Experimentacao agricola manualExperimentacao agricola manual
Experimentacao agricola manual
 
Tipos de variações
Tipos de variaçõesTipos de variações
Tipos de variações
 
Apresentação cep
Apresentação cepApresentação cep
Apresentação cep
 
Controle+estatístico+da+qualidade[1]
Controle+estatístico+da+qualidade[1]Controle+estatístico+da+qualidade[1]
Controle+estatístico+da+qualidade[1]
 
Controle estatístico de processo - CEP
Controle estatístico de processo - CEPControle estatístico de processo - CEP
Controle estatístico de processo - CEP
 
Atps estatistica 2
Atps estatistica 2Atps estatistica 2
Atps estatistica 2
 
Ipaee capitulo1
Ipaee capitulo1Ipaee capitulo1
Ipaee capitulo1
 
Seminário sobre Validação 2003
Seminário sobre Validação 2003Seminário sobre Validação 2003
Seminário sobre Validação 2003
 
0 Aula De ValidaçãO
0   Aula De ValidaçãO0   Aula De ValidaçãO
0 Aula De ValidaçãO
 
Cep
CepCep
Cep
 
Controle de Processo
Controle de ProcessoControle de Processo
Controle de Processo
 
MSA - Análise dos sistemas de medição
MSA - Análise dos sistemas de mediçãoMSA - Análise dos sistemas de medição
MSA - Análise dos sistemas de medição
 
Curso CEP Operadores
Curso CEP  OperadoresCurso CEP  Operadores
Curso CEP Operadores
 

Destaque (12)

Jonathan anthony infographic resume2
Jonathan anthony infographic resume2Jonathan anthony infographic resume2
Jonathan anthony infographic resume2
 
σέσκλο
σέσκλοσέσκλο
σέσκλο
 
Clasificación de tipo de discapacidad
Clasificación de tipo de discapacidadClasificación de tipo de discapacidad
Clasificación de tipo de discapacidad
 
Tema 7 lengua adaptado anaya 3º
Tema 7 lengua adaptado anaya 3º Tema 7 lengua adaptado anaya 3º
Tema 7 lengua adaptado anaya 3º
 
Torres de Vera Cruz
Torres de Vera CruzTorres de Vera Cruz
Torres de Vera Cruz
 
Chilled Almond Coffee
Chilled Almond CoffeeChilled Almond Coffee
Chilled Almond Coffee
 
عرض عن الادارة_الذاتية_خاص2
عرض عن الادارة_الذاتية_خاص2عرض عن الادارة_الذاتية_خاص2
عرض عن الادارة_الذاتية_خاص2
 
Marrueco snuria raúl
Marrueco snuria raúlMarrueco snuria raúl
Marrueco snuria raúl
 
Tema 8 lengua3º anaya adaptado
Tema 8 lengua3º anaya  adaptadoTema 8 lengua3º anaya  adaptado
Tema 8 lengua3º anaya adaptado
 
Conoces bien el fútbol
Conoces bien el fútbolConoces bien el fútbol
Conoces bien el fútbol
 
Semana da leitura 2013 a.a.
Semana da leitura 2013 a.a.Semana da leitura 2013 a.a.
Semana da leitura 2013 a.a.
 
Plan de area
Plan de areaPlan de area
Plan de area
 

Semelhante a Apostila planejamento

Investigação Experimental em Psicologia
Investigação Experimental em PsicologiaInvestigação Experimental em Psicologia
Investigação Experimental em Psicologia
Jorge Barbosa
 
aula_2_principios_basicos_de_experimentao.pdf
aula_2_principios_basicos_de_experimentao.pdfaula_2_principios_basicos_de_experimentao.pdf
aula_2_principios_basicos_de_experimentao.pdf
EdyCipriano
 
19 elaboração da metodologia
19 elaboração da metodologia19 elaboração da metodologia
19 elaboração da metodologia
Joao Balbi
 
19 elaboração da metodologia
19 elaboração da metodologia19 elaboração da metodologia
19 elaboração da metodologia
Joao Balbi
 
Pobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc iPobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc i
Anderson Araujo
 
Método Científico
Método CientíficoMétodo Científico
Método Científico
margaridabt
 
Caracterização Física e Classificação dos Solos (ALMEIDA, 2005)
Caracterização Física e Classificação dos Solos (ALMEIDA, 2005)Caracterização Física e Classificação dos Solos (ALMEIDA, 2005)
Caracterização Física e Classificação dos Solos (ALMEIDA, 2005)
Arquiteturando
 

Semelhante a Apostila planejamento (20)

Exp design
Exp designExp design
Exp design
 
1-Sequencia analítica.pdf
1-Sequencia analítica.pdf1-Sequencia analítica.pdf
1-Sequencia analítica.pdf
 
Apostila fisica ok
Apostila fisica okApostila fisica ok
Apostila fisica ok
 
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
 
Ensaio Acelerado em Relés
Ensaio Acelerado em RelésEnsaio Acelerado em Relés
Ensaio Acelerado em Relés
 
Mecanica particula
Mecanica particulaMecanica particula
Mecanica particula
 
Https _doc-14-bc-
Https  _doc-14-bc-Https  _doc-14-bc-
Https _doc-14-bc-
 
Investigação Experimental em Psicologia
Investigação Experimental em PsicologiaInvestigação Experimental em Psicologia
Investigação Experimental em Psicologia
 
Método estatístico
Método estatísticoMétodo estatístico
Método estatístico
 
aula_2_principios_basicos_de_experimentao.pdf
aula_2_principios_basicos_de_experimentao.pdfaula_2_principios_basicos_de_experimentao.pdf
aula_2_principios_basicos_de_experimentao.pdf
 
Estatística Aplicada à Administração - Aula 08: Tipos de Ensaios
Estatística Aplicada à Administração - Aula 08: Tipos de EnsaiosEstatística Aplicada à Administração - Aula 08: Tipos de Ensaios
Estatística Aplicada à Administração - Aula 08: Tipos de Ensaios
 
19 elaboração da metodologia
19 elaboração da metodologia19 elaboração da metodologia
19 elaboração da metodologia
 
19 elaboração da metodologia
19 elaboração da metodologia19 elaboração da metodologia
19 elaboração da metodologia
 
Aula-3-Introdução-parte-2.ppt
Aula-3-Introdução-parte-2.pptAula-3-Introdução-parte-2.ppt
Aula-3-Introdução-parte-2.ppt
 
Pobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc iPobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc i
 
Artigo - Robson Eng Qual Turma 8
Artigo - Robson Eng Qual Turma 8Artigo - Robson Eng Qual Turma 8
Artigo - Robson Eng Qual Turma 8
 
Método Científico
Método CientíficoMétodo Científico
Método Científico
 
Método científico
Método científicoMétodo científico
Método científico
 
Caracterização Física e Classificação dos Solos (ALMEIDA, 2005)
Caracterização Física e Classificação dos Solos (ALMEIDA, 2005)Caracterização Física e Classificação dos Solos (ALMEIDA, 2005)
Caracterização Física e Classificação dos Solos (ALMEIDA, 2005)
 
O método Científico
O método Científico O método Científico
O método Científico
 

Mais de Márcio Alexsandro P Santos (11)

Certificate (1)
Certificate (1)Certificate (1)
Certificate (1)
 
Certificate (2)
Certificate (2)Certificate (2)
Certificate (2)
 
Certificate
CertificateCertificate
Certificate
 
Apostila excel-avancado-senac
Apostila excel-avancado-senacApostila excel-avancado-senac
Apostila excel-avancado-senac
 
Os cinco passos pensamento enxuto
Os cinco passos pensamento enxutoOs cinco passos pensamento enxuto
Os cinco passos pensamento enxuto
 
Green belt training
Green belt trainingGreen belt training
Green belt training
 
Roadmap lean office english
Roadmap lean office englishRoadmap lean office english
Roadmap lean office english
 
Lean office português
Lean office portuguêsLean office português
Lean office português
 
Lean office b bs english
Lean office b bs englishLean office b bs english
Lean office b bs english
 
Lean six-sigma-project-charter-template
Lean six-sigma-project-charter-templateLean six-sigma-project-charter-template
Lean six-sigma-project-charter-template
 
Engenharia De MéTodos Conceitos
Engenharia De MéTodos ConceitosEngenharia De MéTodos Conceitos
Engenharia De MéTodos Conceitos
 

Apostila planejamento

  • 1. Capitulo 1- Introdução Praticamente em todas as áreas do conhecimentos o uso da estatística em especial das técnicas de planejamento de experimentos são imprecendiveis para as tomadas de decisão visando a avaliação de novos procedimentos ou a otimização de processos e produtos. Segundo Montegomery(2001), um experimento planejado é um teste, ou série de testes, no qual são feitas mudanças propositais nas variáveis de entrada de um processo, de modo a podermos observar e identificar mudanças correspondentes na resposta de saída. Figura 1.1: Modelo geral de um processo O processo, como mostra a Figura 1, pode ser visualizado como uma combinação de máquinas, métodos e pessoas, que transforma um material de entrada em um produto de saída. Este produto de saída pode ter uma ou mais características da qualidade observáveis ou respostas. Algumas das variáveis do processo x1 , x 2 ,  , x p são controláveis, enquanto outras, z1 , z 2 ,  , z q são não-controláveis(embora possam ser controláveis para efeito de teste). Algumas vezes, esses fatores não-controláveis são chamados fatores de ruído. Os objetivos do experimento podem incluir 1. Determinação de quais variáveis são mais influentes na resposta y . 2. Determinação do valor a ser atribuído aos x ’s influentes de modo que y esteja perto da exigência nominal. 3. Determinação do valor a ser atribuído aos x ’s influentes de modo que a variabilidade em y seja pequena. 4. Determinação do valor a ser atribuído aos x ’s influentes de modo que os efeitos das variáveis não-controláveis sejam minimizados. Assim, métodos de planejamento experimental podem ser usados tanto no desenvolvimento do processo quanto na solução de problemas do processo, para melhorar o seu desempenho ou obter um processo que seja robusto ou não-sensível a fontes externas de variabilidade. 1
  • 2. Aplicação dos Planejamentos Experimentais na Industria são fundamentais para desenvolvimento de novos produtos e para o controle de processos. Nesta área é comum aparecer problemas em que se precisa estudar várias propriedades ao mesmo tempo e estas, por sua vez, são afetadas por um grande número de fatores experimentais. È papel de técnicas de planejamento de experimentos, auxiliar na fabricação de produtos com melhores características, na diminuição do seu tempo de desenvolvimento, aumentar a produtividade de processos e minimizar a sensibilidade a fatores externos (NETO et al., 2001). A análise de dados para os modelos de planejamento de experimentos fica praticamente inviabilizada sem o uso de softwares específicos. Neste material é apresentado as possíbilidades de análise de dados para modelos de planejamento pelo software R. O software R, que é uma linguagem e ambiente para computação estatística e gráfica de domínio público (VENABLES e SMITH, 2001), atualmente muito difundido nos grandes centros, contudo pouco conhecido em Goiás. Este software pode ser uma ótima alternativa para o trabalho com Análise de Experimentos, pois, tem apresentado igual ou superior eficiência para análise de dados, além de haver material disponível na internet e listas de discussão que servem como guia de suporte e aprendizagem. Nesta apostila serão apresentados um resumo dos principais modelos de planejamento de experimentos, dentre os quais destacamos: Planejamento completamente aleatorizado com único fator, Planejamento completamente aleatorizado com blocos, Planejamento Fatoriais e Planejamentos Hierarquicos e para cada modelo apresentou-se a sequencia de comandos em R para a análise estatística dos modelos, que geram os resultados finais como o Quadro da ANOVA, as Comparações Multiplas e a Análise de Resíduos. 2
  • 3. Capítulo 2- Elementos Básicos da Experimenta- ção Segundo Werkema & Aguiar (1996), para se realizar de forma eficiente um experimento, deve-se ser utilizada uma abordagem científica para o planejamento. Esta abordagem é identificada por meio do termo planejamento estatístico de experimentos, que se refere ao procedimento de planejar um experimento de forma que os dados apropriados sejam coletados em tempo e custo mínimos. A análise destes dados por meio de técnicas estatísticas resultará em conclusões confiáveis. Portanto existem dois aspectos fundamentais em qualquer estudo experimental: o planejamento do experimento e a análise estatística dos dados. Estes dois aspectos devem ser bem avaliados, já que a técnica de análise depende diretamente do planejamento utilizado. Um dos grande problemas dos estudos experimentais é a coleta de dados. Se os dados forem coletados de forma inadequada, não há técnica estatística de análise de dados que concerte o problema e todo o experimento fica comprometido. 2.1 Princípios Básicos Para que seja possível planejar de modo adequado a coleta de dados, princípios básicos do planejamento de experimentos como a réplica, a aleatorização e a formação de blocos devem ser entendidos. 2.1.1- Réplicas As réplicas são repetições do experimento feitas sob as mesmas condições experimentais. O termo “sob as mesmas condições experimentais” se refere ao fato de que os demais fatores que possam influenciar a variável resposta de interesse sejam controlados de modo a não sofrerem variações de uma experimentação para outra. Em um experimento, a realização de réplicas é importante pelos seguintes motivos: • As réplicas permitem a obtenção de uma estimativa da variabilidade devida ao erro experimental. A partir desta estimativa é possível avaliar se a variabilidade presente nos dados é devida somente ao erro experimental ou se existe influência das diferentes condições avaliadas pelo pesquisador. Se estas condições forem influentes, o responsável pela pesquisa poderá determinar qual é a condição mais favoravel para conduzir o experimento. • Por meio da escolha adequada do número de réplicas é possível detectar, com precisão desejada, quaisquer efeitos produzidos pelas diferentes condições experimentais que sejam considerados significantes do ponto de vista prático. 2.1.2- Aleatorização A expressão aleatorização se refere ao fato de que tanto a alocação do material experimental às diversas condições de experimentação, quanto a ordem segundo a qual os ensaios individuais do experimento serão realizados, são determinados ao acaso. A aleatorização torna possível a plicação dos métodos estatísticos para a análise dos 3
  • 4. dados. A maioria dos modelos subjacentes e estes métodos estatísticos exigem que os componentes do erro experimental sejam variáveis aleatórias independentes e a aleatorização geralmente torna válida esta exigência. A aleatorização permite ainda que os efeitos de fatores não-controlados, que afetam a variável resposta e que podem estar presentes durante a realização do experimento, sejam balanceados entre todas as possíveis medidas. Este balanceamento evita possíveis confundimentos na avaliação dos resultados devido à atuação destes fatores. 2.1.3- Formação de Blocos Em muitas situações experimentais é necessário planejar o experimento de forma que a variabilidade resultante de fatores externos conhecidos, sobre os quais não existe interesse, possa ser sistematicamente controlada e avaliada. Se estes fatores externos não forem controlados, mesmo usando a aleatorização, o erro experimental irá refletir tanto o erro aleatório inerente ao experimento, quanto a variabilidade existente em função desses fatores. Nesta situação, deve-se formar blocos para os varios fatores externos de influência, e realizar repetições completas do experimento em cada bloco, dessa forma em cada bloco poderão ser observadas as diferenças existentes devido ao fator de interesse, minimizando assim o efeito dos fatores pertubadores no resultado final do experimento. Aqui cada bloco corresponde a um corpo de prova. Note que o objetivo principal do experimento não é medir o efeito destes fatores pertubadores, mas sim avaliar com maior eficiência os efeitos dos fatores de interesse. Assim de forma genérica podemos definir que blocos são conjuntos homogêneos de unidades experimentais. 2.1.4- Terminologia Básica Na terminologia básica para um planejamento de experimentos, destaca-se: • Unidade experimental: É a unidade básica para a qual será feita a medida da resposta. • Fatores: São as variáveis cuja influência sobre a variável resposta está sendo estudada no experimento. • Niveis de um Fator: Os diferentes modos de presença de um fator no estudo considerado são denominados níveis do fator. • Tratamento: As combinações específicas dos níveis de diferentes fatores são denominadas tratamentos. Quando há apenas um fator, os níveis deste fator correspondem aos tratamentos. • Ensaio: Cada realização do experimento em uma determinada condição de interesse(tratamento) é denominada ensaio, isto é, um ensaio corresponde a aplicação de um tratamento a uma unidade experimental. • Variável Resposta: O resultado de interesse registrado após a realização de um ensaio é denominado variável resposta. 4
  • 5. Vamos considerar um exemplo apresentado em Werkema & Aguiar (1996) para ilustrar melhor os princípios básicos do planejamento de experimentos: Exemplo 2.1- Suponha que um engenheiro esteja interessado em estudar o efeito produzido por três diferentes banhos(meios) de têmpera: têmpera em água, em óleo e em solução aqüosa de cloreto de sódio (água salgada) na dureza de um determinado tipo de aço. Aqui o propósito era determinar qual banho de têmpera produziria a dureza máxima do aço. Com este objetivo ele decidiu submeter um determinado número de amostras da liga, que denominaremos corpos de prova, a cada meio de têmpera e a seguir mediu a dureza da liga. Vamos ilustrar a aplicação dos princípios do planejamento neste problema. Réplica: Neste caso uma réplica do experimento completo consiste em medir a dureza de um corpo de prova submetido à têmpera em água, de um segundo corpo de prova submetido à têmpera em óleo e de um terceiro temperado em solução de cloreto de sódio.Isto é, realizar uma réplica do experimento completo significa coletar uma observação da variável resposta em cada condição experimental considerada no estudo. Portanto, se seis corpos de prova são temperados em cada banho (água, óleo e água salgada), sendo feita a seguir a medida da dureza de cada um destes corpos de prova, dizemos que foram realizadas seis réplicas do experimento(sendo realizados dessa forma 6x3=18 ensaios). Aleatorização: Neste experimento a aleatorização deve-se fazer presente pela distribuição ao acaso dos corpos de prova entre os banhos de têmpera. Este procedimento atenua por exemplo situações onde a espessura dos corpos de prova são ligeiramente diferentes, assim de todas as amostras com espessura maior foram submetidas a um mesmo banho de têmpera este provavelmente estará em situação vantajosa e os resultados do experimento estarão tendenciosos. Blocos: Supor que os corpos de prova são provenientes de corridas diferentes ( ou matérias primas diferentes), se planejarmos um experimento onde estes corpos de prova sejam distribuídos ao acaso entre os diferentes banhos de têmpera, as diferenças entre os corpos de prova irão acrescentar uma variabilidade adicional às medidas de dureza, o que poderá mascarar os efeitos devidos ao fator de interesse (banho de têmpera). Para eliminar do erro experimental a variabilidade devida ao fato de os corpos de prova terem sido produzidos em corridas diferentes, deve-se realizar o experimento da seguinte maneira: cada corpo de prova será dividido em três partes iguais, sendo cada parte submetida a um diferente banho de têmpera. Deste modo, dentro de cada terno formado pelas três partes de um mesmo corpo de prova, a influência devida às características particulares de cada corpo de prova deverá ocorrer de forma aproximadamente igual para cada um dos banhos de têmpera. Dentro da terminologia básica temos que: Unidade Experimental: Corpo de prova do aço utilizado no estudo. Fatores: Banhos de têmpera. 5
  • 6. Níveis do Fator: água, água salgada e óleo Ensaio: Cada ensaio consiste em tratar um corpo de prova em um determinado banho de têmpera. Variável Resposta: É a dureza do corpo de prova medida após a realização da têmpera. 2.1.5- Roteiro para a Realização de um Bom Experimento. Para usar a abordagem estatística no planejamento e na análise de um experimento é necessário que as pessoas envolvidas na experimentação tenham, antecipadamente, uma idéia clara do que será estudado e da forma como os dados serão coletados. Também é recomendado que se tenha uma idéia qualitativa de como os dados serão analisados. Um roteiro para a realização de um bom experimento é apresentado a seguir: 1. Reconhecimento e relato do problema. Na prática, geralmente é difícil perceber que existe um problema que exige experimentos planejados formais, de maneira que não pode ser fácil obter-se um relato claro de problema que é aceito por todos. No entanto é de primordial importância desenvolver todas as idéias do problema e definir de forma clara os objetivos específicos do experimento. 2. Escolha dos fatores e dos níveis. Devem ser escolhidos os fatores que devem variar, os intervalos sobre os quais esses fatores variarão e os níveis específicos nos quais cada rodada será feita. Exige-se conhecimento do processo para fazer isso, esse conhecimento em geral é uma combinação de experiência prática e conhecimento teórico. É importante a investigação de todos os fatores que possam ser importantes e evitar ser excessivamente influenciado pela experiência passada. 3. Escolha da variável resposta: Na escolha da variável resposta, o experimentador deve ter certeza de que aquela variável realmente fornece informação útil sobre o processo em estudo e a capacidade de medida dessa variável. Se a capacidade do medidor é baixa, então apenas grandes efeitos dos fatores serão detectados pelo experimento, ou será necessário muitas réplicas. 4. Escolha do planejamento experimental. A escolha do planejamento envolve consideração sobre o tamanho da amostra(número de replicações), seleção de uma ordem adequada de rodadas para as tentativas experimentais, ou se a formação de blocos ou outras restrições de aleatorização estão envolvidas. 5. Realização do experimento. Quanto da realização do experimento, é de vital importância monitorar o processo, para garantir que tudo esteja sendo feito de acordo com o planejamento. Erros no procedimento experimental nessa etapa, em geral comprometem a validade do experimento. 6. Análise dos dados. Métodos estatísticos devem ser usados para analisar os dados, de modo que os resultados e conclusões sejam objetivos e não de opinião. Se o experimento foi planejado corretamente o método estatístico para análise não será um problema. A análise de resíduos e a verificação da validade do modelo são importantes e devem ser feitas. 7. Conclusões e recomendações. Uma vez analisados os dados, o experimento deve acarretar conclusões práticas sobre os resultados e recomendar um curso de ação. Deve-se auxiliar de métodos gráficos, particularmente na apresentação dos resultados para outras pessoas. Seqüências de acompanhamento e testes de 6
  • 7. confirmação devem ser também realizados para validar as conclusões do experimento. 2.2 – Exercícios do Capítulo 1. Planeje um experimento para comparar quatro drogas no alívio de cefaléias, supondo que você dispõe de um conjunto de pacientes similares. 2. Planeje um experimento para comparar três fórmulas de adubação no crescimento de Pinus, supondo que você dispõe de um terreno heterogêneo que deve ser dividido em cinco blocos e que em cada bloco podem ser alocadas nove parcelas. 3. Planeje um experimento para comparar dois testes de inteligência tomando cada criança como um bloco. 4. Planeje um experimento para comparar o desempenho(tempo de realização da tarefa) de três máquinas empacotadeiras, dispondo de 5 operadores. 7
  • 8. Capítulo 3 - Planejamento Completamente Alea- torizado com Único Fator. Para a comparação de dois tratamentos( duas populações) vindos de populações normais, utiliza-se em o teste t-student, desde que as suposições sejam válidas. Para comparação de mais de dois tratamentos não é muito recomendado sua utilização, visto que serão necessárias várias comparações, o que acaretará um aumento no erro tipo I. Essa situação é ilutrada em Montegomery (2001). O problema para a comparação de k tratamentos por meio de ensaios realizados em ordem aleatória é descrito abaixo. Consideremos que existem k diferentes níveis (tratamentos de um único fator) que queremos comparar. A resposta para cada um dos k tratamentos é uma variável aleatória. A ilustração da disposição dos dados é ilustrado na Tabela abaixo: Tabela 3.1: Esquema da disposição de dados para Experimento Aleatorizado com Fator Único. Tratamento Observações Totais Médias 1 y11 y12  y1n y1. y1. 2 y 21 y 22  y2n y 2. y 2.        k y k1 y k 2  y kn yk. yk. y .. y.. Aqui y ij representa a j ª - ésima observação feita sob o i ª-ésimo tratamento. Neste caso estamos considerando a situação em que há um número igual de observações, n , em cada tratamento. 3.1 – Modelo Estatístico Cada observação y ij na Tabela 3.1, pode ser descrita pelo seguinte modelo estatístico linear, y ij = µ + τ i + ε ij , (3.1) com i =1,2,..., k e j =1,2,..., n . Aqui, y ij : é uma v.a. denotando a (ij)ª obeservação; µ : é a média geral, comum a todos os tratamentos; 8
  • 9. τ i : é o efeito do i-ésimo tratamento; εij : é a componente do erro aleatório. Supondo que ε ij ~ N (0; σ ) , ou seja, os erros são independentes e normalmente 2 distribuidos com média zero e variância σ 2 . Dessa forma, cada tratamento pode ser pensado como uma população normal com média µ i = µ + τ i e variância σ 2 , ou seja, y ij ~ N ( µi ; σ 2 ) . Assim, vamos apresentar o procedimento para testar a igualdade das k médias populacionais. Esse modelo de análise de variância é chamado de efeitos fixos. Os efeitos dos tratamentos τi são definidos, em geral, como desvios da média geral µ , de modo que ∑i =1τ i = 0 k Representando, y i . , o total das observações sob o i-ésimo tratamento e por y i . a média das observações sob o i-ésimo tratamento, analogamente, y.. o total geral e y.. a média geral, n y i. y i. = ∑ y ij y i. = , i =1,2,..., k . i =1 n k n y.. y.. = ∑∑ y ij y.. = , N = kn “ Número total de observações” i =1 j =1 N Estamos interessados em testar a igualdade das médias µ , µ2 ,..., µk dos k 1 tratamentos. Pela equação 3.1, este procedimento é equivalente a testar as hipóteses: H o : τ1 = τ 2 = ... = τ k = 0 (3.2) H 1 : τ i ≠ 0 para pelo menos um i. Dessa forma se H o é verdadeira, cada observação consiste de uma média geral µ mais uma realização da componente do erro aleatório εij . Assim se H o é verdadeira a mudança dos níveis do fator (tratamentos) não tem qualquer efeito sobre a resposta média. A análise de variância particiona a variabilidade total na amostra de dados em duas partes então o teste proposto em (3.2) é baseado na comparação de duas estimativas independentes da variância populacional. A variabilidade total dos dados é dada a partir da soma de quadrados totais SQT = ∑∑ ( y ij − y.. ) k n 2 (3.3) i =1 j =1 Mas pode-se particionar SQT de forma que: 9
  • 10. ∑∑ ( y − y.. ) = n∑ ( y i. − y.. ) 2 + ∑∑ ( y ij − y i. ) k n k k n 2 2 ij i =1 j =1 i =1 i =1 j =1 (3.4) Demonstração: Ver Montogomery 2001. A relação em (3.4), mostra que a variabilidade total nos dados, medida pela soma de quadrados total, pode ser particionada em uma soma de quadrados das diferenças entre as médias dos tratamentos e a média geral, e na soma de quadrados das diferenças entre as observações dentro de cada tratamento e a média do respectivo tratamento. Diferenças entre médias de tratamentos observadas e a média geral quantificam diferenças entre tratamentos, enquanto diferenças das observações dentro de um tratamento e a média do tratamento podem ser devidas apenas a um erro aleatório. Dessa forma, reescrevemos (3.4) como SQT = SQTrat + SQE , onde: SQT = ∑∑ ( y ij − y.. ) : k n 2 Soma dos quadrados total. i =1 j =1 k SQTrat = n∑ ( y i. − y.. ) : Soma dos quadrados devido aos tratamentos. 2 i =1 SQE = ∑∑ ( y ij − y i. ) : Soma dos quadrados dos erros. k n 2 i =1 j =1 Calculando os valores esperados de SQTrat e SQ E tem-se : k E ( SQTrat ) = (k − 1)σ 2 + n∑τ i2 (3.5) i =1 Demonstração: Ver Montgomery (2001)  1  Sob H o verdadeira, temos que E   SQTrat  = σ 2   ( k −1)  Se H 1 é verdadeira, então n∑i =1τ i2 k  1   (k − 1) SQTrat  = σ + k − 1 E 2    SQTrat A razão QM Trat = é chamada média quadrática dos tratamentos. Logo, se H o é k −1 verdadeira, QM Trat é um estimador não-viciado de σ 2 , enquanto que, se H 1 é 10
  • 11. verdadeira, QM Trat estima σ 2 mais um termo positivo que incorpora a variação devida à diferença entre as médias dos tratamentos. Da mesma forma, tem-se que E ( SQ E ) = k (n − 1)σ 2 (3.6) SQ E Então a média quadrática dos erros QM E = é um estimador não-viciado de k ( n −1) σ 2 , independente de H o ser ou não verdadeira. Analisaremos também a partição dos graus de liberdade. SQT : tem N − 1 = kn − 1 graus de liberdade SQTrat : tem k −1 graus de liberdade SQ E : tem k ( n −1) graus de liberdade Supondo que cada uma das k populações possa ser modelada com uma distribuição normal. Com essa suposição pode-se mostrar que, sob H o , então: SQTrat QM Trat Fo = k − 1 = ~ F( k −1, k ( n −1) ) (3.7) SQ E QM E k (n − 1) Se H o é verdadeira QM Trat e QM E são estimadores não viciados de σ 2 , mas se H o é falsa então E ( QM Trat ) será maior que E (QM E ) , assim sob a hipótese alternativa, Fo será grande. Dessa forma um teste de hipótese é construído. Devemos rejeitar H o se o valor da estatística é grande, isso implica em uma região crítica unilateral superior. Então rejeita-se H o se Fo > Fα,( k −1), k ( n −1) . No geral utiliza-se o seguinte quadro para ANOVA. Tabela 3.2 - Quadro da Anova Fonte de Variação SQ G.L QM Fo Entre Tratamentos SQTrat k −1 QM Trat QM Trat Fo = QM E Dentro dos Tratamentos (Erro) SQ E k ( n −1) QM E Total SQT kn −1 Estimativas dos efeitos dos tratamentos: τ i = y i . − y.. , i =1,2,..., k ˆ 11
  • 12. 3.2 Análise de Resíduos. O modelo matemático de um planejamento completamente aleatorizado, considera que as observações sejam distribuidas de forma normal, com mesma variância. Essas suposições podem ser verificadas através da análise de resíduos. Um resíduo é a diferença entre uma observação y ij e seu valor estimado (ou ˆ ajustado) a partir do modelo estatístico que esta sendo utilizado, denotado por y ij . Para o modelo específico temos que y ij = y i . , com cada resíduo sendo ε ij = y ij − y i . , ou seja, ˆ a diferença entre uma observação e a média correspondente observada do tratamento. Para identificar se as suposições estão sendo violadas utilizamos básicamente três tipos de gráficos: Resíduos X Ordem de Coleta, Resíduos X Tratamentos (médias y i . ) e Gráfico de probabilidade normal dos Resíduos. O gráfico de Resíduos X Ordem de Coleta busca identificar algum tipo de associação dos resíduos com a ordem de coleta das observações. A identificação de algum tipo de associação viola a suposição de indepêndencia entre os dados, portanto espera-se em uma análise de resíduos que não haja associoação entre resíduos e ordem de coleta. O gráfico deve apresentar uma configuração aleatória entre resíduos e ordem de coleta. Figura 3.1: Gráfico Resíduo X Ordem Na Figura 3.1, tem-se uma típica configuração aleatória entre ordem X resíduos, validando a suposição de independência entre as observações. O gráfico de Resíduos X Tratamento, busca identificar algum tipo de alteração na dispersão dos resíduos para cada tratamento. Se houver dispersões muito diferentes entre tratamentos pode significar que a variação não é constante, e uma importante suposição do modelo estará violada. O gráfico deve apresentar uma configuração de dispersão semelhante para todos os tratamentos. 12
  • 13. Figura 3.2: Resíduo X Média dos Tratamentos Na Figura 3.2, verifica-se um caso típico de não violação da suposição de igualdade da variância. O gráfico de probabilidade normal dos resíduos identifica se os dados apresentam uma distribuição normal. Os resíduos plotados contra os quantils de uma distribuição normal devem ficar de forma aproximada ao longo de uma reta. Neste caso pode-se usar um teste estatístico baseado no coeficiente de correlação para identificar uma possível lineariedade. Figura 3.3: Gráfico de Probabilidade Normal para os Resíduos. Em situações como na Figura 3.3, percebemos que pontos centrais estavam localizados, de forma aproximada, ao longo de uma reta, o que indica que os componentes do erro do modelo seguiam uma distribuição normal. No entanto para confirmar essa hipótese sugere-se utilizar um teste para normalidade. 3.3 Comparações Multiplas 13
  • 14. A análise de variância nós indica que há uma diferença entre as médias, mas ela não diz qual média que difere.Existem procedimentos específicos chamados de procedimentos de comparação múltipla, para testar as diferenças entre as médias específicas seguindo uma análise de variância. Dentre os testes mais conhecidos destacamos o teste Tukey (Montgomery,2001). 3.3.1 Teste de Tukey O teste de Tukey, está baseado na amplitude total estudentizada e pode ser usado para comparar todos os pares de contrastes que envolvem diferenças de médias. O teste é exato de nível α quando o número de repetições é o mesmo para todos tratamentos e aproximado quando o número de repetições é diferente para os tratamentos. Este teste pode ainda ser usado para a construção de intervalos de confiança para a difernça entre as médias dos tratamentos. O procedimento está baseado na distribuição de amplitude total estudentizada (studentized range statistic) dada por: y − y min q = max QM E (3.8) n onde ymax e ymin são as maiores e menores médias amostrais respectivamente, calculadas para um grupo de p amostras. A distribuição de qα ( p, f ) , com α sendo o percentil superior de pontos de q com f graus de liberdade, associado ao estimador QM E é calculada computacionalmente. Para um número igual de repetições, o teste Tukey detecta diferenças significativas entre pares de duas médias se o valor absoluto da diferenças das médias amostrais execeder QM E Tα = qα (k , f ) n De forma equivalente, constrói-se intervalos de 100(1 − α )% de confiança para todos os pares de médias dada por: yi. − y j . − Tα ≤ µi − µ j ≤ yi. − y j . + Tα , i ≠ j . Para tamanhos amostrais diferentes (diferente n° de repetições), temos: qα ( k , f ) 1 1  Tα = QM E  +  n  2  i nj  e yi. − y j . − Tα ≤ µi − µ j ≤ yi. − y j . + Tα , i ≠ j respectivamente. 3.4- Análise Estatística de um Planejamento Completamente Aleatorizado com o uso do Software R. 14
  • 15. Neste tópico vamos ilustrar a utilização do software R na análise de dados para o modelo de planejamento de experimento completamente aleatorizado. 3.4.1- Descrição do Programa O software R, que é uma linguagem e ambiente para computação estatística e gráfica de domínio público (VENABLES e SMITH, 2001), atualmente muito difundido nos grandes centros. A linguagem R é derivada da linguagem do Software S-plus. Sua sintaxe é semelhante com a linguagem C, e sua estrutura é de linguagem funcional. A tela inicial do programa está ilustrada na figura abaixo: Figura 3.4 : Tela Inicial do Software R. O simbolo > indica a linha de comando (“prompt”) na qual serão digitados os comandos para a execusão das análises. O R tem um sistema de ajuda on-line que permite que a documentação seja exibida em um browser (explorer,mozilla,ou similar). Para iniciar este sistema on-line clique em “help” depois “html help”. Para uma consulta rápida, quando já se sabe o nome da função, basta digitar help(nome_da_função). Para conhecer ou lembrar os parâmetros ou argumentos da função utilize o comando args(nome_da_função). 15
  • 16. Quando se quer listar todas as funções que possuem um determinado termo utiliza-se o comando apropos(termo). Por Exemplo: > apropos(vector) [1] ".__C__vector" "as.data.frame.vector" "as.vector" [4] "as.vector.factor" "is.vector" "vector" Por ser gratuito, o R não possui suporte oficial. Existe uma lista de discussão através do endereço http://www.r-project.org/mail.html, que se tem mostrado um suporte interativo bastante eficiente. 3.4.2 – Aplicação do Software R na analise de dados para o planejamento de experimentos completamente aleatorizado com único fator. Para ilustrarmos a aplicação desse modelo, utilizamos o problema proposto em Werkema & Aguiar (1996) descrito abaixo: Os técnicos de uma indústria metalúrgica, desejam avaliar a dureza de peças de aço após diferentes banhos de têmpera. O experimento consistiu em submeter nove peças de aço a cada tipo de banho de têmpera (água, óleo A e óleo B), a seguir medir a dureza no centro das peças temperadas e comparar as durezas médias obtidas, com o objetivo de identificar o meio de têmpera mais adequado. Este é um exemplo de um experimento com um único fator (banho de têmpera) com k = 3 níveis (água, óleo A e óleo B) e n = 9 réplicas. Neste experimento, os 27 ensaios ou testes foram realizados em ordem aleatória. Na Tabela 9, apresenta-se os resultados do experimento. Tabela 3.3 : Dados do experimento com a ordem dos ensaios. Ordem Água Ordem Óleo A Ordem Óleo B 24 36,7 11 36 4 35,3 12 38,9 26 36,4 14 35 25 38,7 9 35,3 15 34,3 22 38,8 23 36,8 17 35,7 21 37,6 2 36,9 20 35,2 8 37,2 18 37,5 3 34,2 13 38,8 1 35,3 5 36,5 16 38 10 36 6 35,8 7 37,2 19 35,7 27 35,5 Neste caso a matriz de planejamento de experimento pode ser montada com a seguinte seqüência de comandos para entrar com os dados do experimento: Montando as colunas resposta e ordem: >y<- scan() : Depois do comando o próximo passo é digitar os valores da resposta seguidos de enter e para encerrar digite enter duas vezes. >or<- scan() : Depois do comando o próximo passo é entrar com os dados da ordem do ensaio da mesma forma anterior. 16
  • 17. Montando a variável tratamento: >x<-rep(1:3,each=9) : no caso temos 3 tratamentos com 9 repetições, ou, >x1<-factor(rep(1:3,each=9),labels=c("agua","oleoA","oleoB")) Montando o data.frame ( matriz de dados e fatores) bt<-data.frame(resp=y, ordem=or, trat=x1) Assim, a matriz de planejamento terá a seguinte forma: resp ordem trat 1 36.7 24 agua 2 38.9 12 agua * * * 26 35.8 6 oleoB 27 35.5 27 oleoB Para a análise descritiva o primeiro passo é indicar o caminho das variáveis no data.frame, isso é feito com o comando attach(bt) . O comando tapply, possibilita a manipulação de dados no data.frame. Para um resumo descritivo usamos a seqüência: tapply(resp,trat,summary) $água Min. 1st Qu. Median Mean 3rd Qu. Max. 36.70 37.20 38.00 37.99 38.80 38.90 $óleoA Min. 1st Qu. Median Mean 3rd Qu. Max. 35.30 35.70 36.00 36.21 36.80 37.50 $óleoB Min. 1st Qu. Median Mean 3rd Qu. Max. 34.20 35.00 35.30 35.28 35.70 36.50 O comando resultou em um resumo descritivo das respostas por tratamento. Uma inspeção gráfica pode ser obtida pelo Gráfico de Box-Cox. >plot(resp~trat,xlab="Banho de Têmpera",ylab="Dureza", col ="red") 17
  • 18. Figura 3.5: Box-Plot para os Valores de Dureza Obtidos em cada Banho de Têmpera. Pela Figura 3.5 e medidas descritivas acima, pode-se observar que parece haver uma diferença entre os banhos de óleo e o de água, sendo que a maior dureza média foi observada no banho de água. O problema agora é verificar se essas diferenças de fato são significativas ou podem ser de origem aleatória. Para constatarmos se de fato as diferenças são significativas utilizaremos à análise de variância. Para a Análise de Variância temos a seguinte seqüência de comandos: aov(formula, data = NULL, projections = FALSE, qr = TRUE, contrasts = NULL, ...) Este comando efetua e guarda todos os resultados da ANOVA do modelo (formula) av<-aov(resp~trat) : O comando names(av) lista todos os vetores de resultados gerados pela ANOVA como por exemplo o vetor de resíduos. > names(av) [1] "coefficients" "residuals" "effects" "rank" "fitted.values" "assign" "qr" [8] "df.residual" "contrasts" "xlevels" "call" "terms" "model" Para utilizar esses vetores deve-se referenciar como por exemplo av$res ou av$fitt , aqui será listado o vetor de resíduos e o vetor de valores ajustados pelo modelo proposto. Agora utiliza-se o comando summary(av) ou anova(av) , que geram a Tabela da ANOVA abaixo: Analysis of Variance Table Response: resp Df SumSq Mean Sq F value Pr(>F) trat 2 34.145 17.073 28.389 4.732e-07 *** Residuals 24 14.433 0.601 18
  • 19. --- Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Assim, como Fo = 28.389 é um valor bem maior que 1, temos evidências significativas para concluir que pelo menos um tratamento difere dos demais. Essa evidência é mais facilmente verificado pelo p-value que neste caso é dado por Pr(>F)=4.732e-07 , ou seja, a diferença é significativa a um nível de abaixo de 0.001. Dessa forma verifica-se que as médias diferem, isto é, que o tipo de banho utilizado afeta a dureza das peças temperadas. Detectado a diferença entre tratamentos o próximo passo e identificar de fato qual dos tratamentos esta diferindo do outro. Nesta etapa vamos utilizar o teste de Tukey. O comando para o teste de Tukey é: >TukeyHSD(av) Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = resp ~ trat) $trat diff lwr upr oleoA-agua -1.7777778 -2.690713 -0.8648426 oleoB-agua -2.7111111 -3.624046 -1.7981760 oleoB-oleoA -0.9333333 -1.846268 -0.0203982 Percebe-se, através do teste paras diferenças entre tratamentos e o intervalo de confiança para as diferenças, que todos os tratamentos são diferentes entre si e a ordem é dada por: Água > Óleo A > Óleo B 19
  • 20. Figura 3.6: Comparações Múltiplas. O resultado pode ser melhor ilustrado pela Figura 3.6, que é gerado através do comado: > plot(TukeyHSD(av)) O modelo de análise de variância assume que as observações são independentes, com distribuição normal de mesma variância em cada tratamento. Dessa forma devemos analisar o comportamento dos resíduos através dos seguintes gráficos: • Gráfico de resíduos contra ordem de coleta das observações (tempo) • Gráfico de resíduos contra Valores Ajustados • Gráfico de probabilidade normal. Para o Gráfico de resíduos contra ordem de coleta das observações (tempo), utiliza-se o comando: >plot (ordem,av$res,xlab="Ordem",ylab="Resíduos",col="red") Aqui “ordem” é o vetor associado a ordem de realização do experimento, “av$res” é o vetor relacionado com os resíduos gerados pelo modelo, xlab é o nome da coordenada x, ylab é o nome da coordenada y e col é a cor desejada. Da mesma forma para Resíduos X Valores Ajustados temos: Figura 3.7 – Gráficos: Resíduos X Ordem e Resíduos X Valores Ajustados >plot(av$fit,av$res, xlab="Valores Ajustados",ylab="Resíduos",col="blue") Para o Gráfico Normal tem-se a seqüência de comando: >qqnorm(av$res,xlab="Quantil da Normal",ylab="Resíduos") 20
  • 21. Este comando plot os quantis da distribuição normal contra os valores dos resíduos ordenados >qqline(av.$res) Este comando ajusta a reta entre os pontos. Neste caso espera-se que os dados se alinhem em torno da reta ajustada. Figura 3.8 – Gráfico Normal de Probabilidade dos Resíduos Considerando o gráfico dos Resíduos X ordem, não se identifica nenhum relação existente, validando dessa forma a suposição de independência entre os resíduos. Para o gráfico de resíduos X valores ajustados (médias) a suposição testada era a de variação igual para ambos os tratamentos, neste caso também parece não haver ocorrido violação da suposição. No gráfico normal de probabilidade (QQ-Plot) os dados também parecem não terem violado de forma comprometedora a suposição de normalidade. Abaixo apresenta-se os testes de Bartlett para homogeneidade de variâncias nos tratamentos e Shapiro-Wilk para normalidade dos resíduos. O Teste de Bartlett é usado através do comando: >bartlett.test(av$res,trat) Bartlett test of homogeneity of variances data: resp and trat Bartlett's K-squared = 0.199, df = 2, p-value = 0.9053 21
  • 22. Como visto não se rejeita a hipótese de igualdade de variâncias, portanto essa suposição não foi violada. O teste de normalidade de Shapiro-Wilk é usado através do comando: >shapiro.test(av$res) Shapiro-Wilk normality test data: av$res W = 0.9613, p-value = 0.3954 Da mesma forma, não se rejeita a hipótese de normalidade dos resíduos, portanto a suposição de normalidade não foi violada. Conclusão Final: • Todos os tratamentos (água, óleo A e óleo B) diferem entre si. • A ordem da durabilidade para o tipo de tratamento é: Água > Óleo A > Óleo B. • O modelo utilizado para a análise foi adequado, não violando nenhuma suposição inicial. 3.5 - Exercícios do Capítulo 1. Considere um experimento para determinar o efeito da vazão de C 2F6 sobre a uniformidade do ataque químico em uma pastilha de silicone usada na fabricação de um circuito integrado. Três vazões são usadas no experimento e a uniformidade (%) resultante, para seis replicatas, é mostrado a seguir. • Faça um estudo descritivo, visando comparar os níveis do fator (tabela decritiva e Box-Plot). • Faça um análise de variância completa usando α = 0.1 e verifique quais as vazões de gás que produzem diferentes uniformidades médias de ataque químico. 2. Um experimento foi feito para determinar se quatro temperaturas específicas de queima afetam a densidade de um certo tipo de tijolo. O experimento conduziu aos seguintes dados. 22
  • 23. Faça um estudo descritivo, visando comparar os níveis do fator (tabela decritiva e Box-Plot). • Faça um análise de variância completa usando α = 0.05 e verifique quais níveis de temperatura que produzem diferentes densidades nos tijolos. 3. A resistência à compressão do concreto está sendo estudada e quatro técnicas diferentes de mistura estão sendo investigadas. Os seguintes dados foram coletados. • Faça um estudo descritivo, visando comparar os níveis do fator (tabela decritiva e Box-Plot). • Faça um análise de variância completa usando α = 0.05 e verifique se as misturas afetam a resistência do concreto. 4. Um engenheiro eletrônico está interessado no efeito, na condutividade do tubo, de cinco tipos diferentes de recobrimento de tubos de raios catódicos em uma tela de um sistema de telecomunicações. Os seguintes dados de condutividade são obtidos. Se α = 0.05 , você pode isolar qualquer diferença na condutividade média devido ao tipo de recobrimento? Capítulo 4- Planejamento de Experimentos em Blocos Completamente Aleatorizados. 4.1 Introdução 23
  • 24. Em muitas situações experimentais, a presença de fontes externas perturbadoras conhecidas pode provocar variabilidade extra e alterar os efeitos dos fatores de interesse, confundindo dessa forma a análise final do planejamento experimental. Os planejamentos de experimentos com blocos completamente aleatorizados são planejamentos experimentais nos quais parte dessa variabilidade devida a fatores externos conhecidos é controlada. Um exemplo desse estudo pode ser ilustrado em uma situação onde se deseja testar a eficiência de diferentes processos de produção para a mesma finalidade sabendo que a matéria-prima, que é vinda de diferentes fornecedores pode influenciar no resultado. Aqui não se tem interesse em testar a matéria prima e sim os processos, no entanto a matéria-prima que não vem de forma padronizada pode confundir o desempenho dos processos. Nesta situação, os diferentes lotes de matéria-prima devem ser tratados como blocos. Dentro do bloco devem ser realizados todos os ensaios correspondentes aos possíveis tratamentos (ou níveis do fator de interesse). Ainda dentro do bloco, a associação dos tratamentos ás unidades experimentais e a ordem de realização dos ensaios devem ser determinadas ao acaso. 4.2 Formulação Teórica Para este modelo, vamos considerar em geral, que existem k tratamentos que serão avaliados em b blocos. A disposição dos dados é ilustrada na Tabela abaixo: Blocos Trat 1 2 ... b Totais 1 y11 y12 ... y1b y1. 2 y21 y22 ... y2 b y 2.       k yk 1 yk 2 ... ykb yk . Totais y.1 y.2 ... y.b y.. Nesta situação será coletada apenas uma observação para cada tratamento (nível do fator), em cada bloco. A maneira como os tratamentos serão alocados às unidades experimentais e a ordem de realização dos ensaios, dentro de cada bloco, serão determinadas de modo aleatório. Em função da primeira aleatorização dos tratamentos com os blocos, dizemos que os blocos representam uma restrição a aleatorização. O modelo estatístico para esse experimento é yij = µ + τ i + β j + ε ij , i =1,2,, k e j =1,2,, b . (4.1) onde yij : observações coletadas sob o i-ésimo tratamento no j-ésimo bloco. µ : média geral. 24
  • 25. τi : efeito do i-ésimo tratamento. βj : efeito do j-ésimo bloco. εij : erro aleatório associado à observação y ij . Aqui será feita a suposição de que os erros aleatórios são independentes e distribuídos de forma normal com média zero e variância σ 2 , ou seja, ε ij ~ N (0, σ ) . 2 Os tratamentos e blocos serão considerados, inicialmente, como fatores fixos. Temos ainda que os efeitos dos tratamentos e dos blocos são definidos como desvios da média global, de modo que ∑i =1τ i = 0 e ∑j =1 β j = 0 . Considerando k b também que os tratamentos e os blocos não interagem. Assim, estamos interessados em testar a igualdade dos efeitos do tratamento. Isto é: H 0 : τ1 = τ 2 =  = τ k = 0 (4.2) H 1 : τ i ≠ 0 , para no mínimo um i Dessa forma a análise de variância pode ser estendida ao planejamento em blocos completamente aleatorizados. O procedimento usa a soma de quadrados total, SQT , que representa uma partição da variabilidade total das observações em relação à variabilidade explicada pelo tratamento, pelos blocos e pelo acaso. SQT = ∑∑ ( y ij − y.. ) = b∑ ( y i . − y.. ) 2 + k ∑ ( y. j − y.. ) 2 + ∑∑ ( y ij − y. j − y i . + y.. ) 2 k b k b k b 2 i =1 j =1 i =1 j =1 i =1 j =1 (4.3) Aqui: y i . : soma da observações no i-ésimo tratamento y . j : soma da observações no j-ésimo bloco y .. : soma total y i . : média das observações no i-ésimo tratamento y . j : média das observações no j-ésimo bloco y .. : média geral de todas as observações. N = kb : Total de observações. A demonstração da partição de SQT pode ser vista em Montegomery, 2001. A identidade da soma quadrática pode ser representada simbolicamente por SQT = SQTrat + SQBloco + SQE (4.4) onde, k b SQT = ∑∑ ( y ij − y.. ) 2 : Soma de quadrados total. i =1 j =1 k SQTrat = b∑ ( y i. − y.. ) 2 : Soma de quadrados devido aos tratamentos. i =1 25
  • 26. b SQ Blo cos = k ∑( y. j − y.. ) 2 : Soma de quadrados devido aos blocos. j =1 k b SQ E = ∑∑ ( y ij − y. j − y i. + y.. ) 2 : Soma do quadrado dos resíduos. i =1 j =1 O desmembramento do grau de liberdade correspondente a essas somas quadráticas é dado da seguinte forma. Para N observações, SQT terá N −1 graus de liberdade, para k tratamentos e b blocos, SQTrat e SQBlo cos terão k −1 e b −1 graus de liberdade respectivamente. Para SQ E temos ( k −1)(b −1) graus de liberdade por subtração. A idéia do teste é a mesma do planejamento completamente aleatorizado, procurando trabalhar com os quadrados médios. Para este modelo os quadrados médios são: SQTrat QM Trat = : Quadrado Médio dos Tratamentos k −1 SQBlo cos QM Blo cos = : Quadrado Médio dos Blocos. b −1 SQ E QM E = : Quadrado Médio dos Resíduos. (k −1)(b −1) Pode ser demonstrado (ver Montgomery, 2002) que os valores esperados dessas médias quadráticas são: k b∑ τ i2 (4.5) E ( QM Trat ) = σ 2 + i =1 k −1 b k ∑ β j2 (4.6) E ( QM Blo cos ) = σ 2 + j =1 b −1 E ( QM E ) = σ 2 (4.7) Dessa forma, se a hipótese nula H 0 for verdadeira de modo que todos os efeitos do tratamento τ i = 0 , então QM Trat será um estimador não tendencioso de σ 2 , enquanto se H o for falsa, estimará σ 2 mais um termo quadrático positivo. O quadrado médio dos resíduos será sempre um estimador não tendencioso de σ 2 . Dessa forma para testar a hipótese nula de que os efeitos dos tratamentos sejam iguais a zero, utilizamos a estatística QM Trat F0 = QM E que, sob H o , terá uma distribuição F, com ( k −1), (k −1)(b −1) graus de liberdade. Assim, rejeita-se a hipótese nula H o , com um nível de significância α , se 26
  • 27. Fo = Fα , [ ( k −1),( k −1)(b −1) ] O quadro da ANOVA será dado por: Tabela 4.1 – Quadro da Anova Fonte de SQ GL QM Fo Variação Tratamentos SQTrat k −1 QM Trat QM Trat QM E Blocos SQBlo cos b −1 QM Blo cos QM Blo cos QM E Erros SQ E ( k −1)(b −1) QM E Total SQT N − 1 = kb − 1 QM Blo cos A estatística F= , aparece como teste para o efeito dos blocos. A QM E validade dessa razão como uma estatística de teste para a hipótese nula de nenhum efeito do bloco é duvidosa, uma vez que os blocos representam uma restrição à aleatoriedade, ou seja, usamos a aleatoridade apenas dentro dos blocos. Podemos considerar, se os blocos forem realizados em uma ordem aleatória, que um valor grande para F dá indicativos para efeitos significativos dos blocos, mas não podemos afirmar esses resultados como para o teste do efeito dos tratamentos. 4.3-Análise de Resíduos (Verificação da Adequação do Modelo) Da mesma forma, no caso dos planejamentos em blocos completamente aleatorizados deve ser verificada a validade das suposições de normalidade dos erros, igualdade de variância das observações nos tratamentos, nos blocos e ausência da interação tratamento-bloco. A análise de resíduo é a principal ferramenta utilizada para esta verificação. Para os planejamentos em blocos completamente aleatorizados os resíduos são definidos por ε ij = y ij − y ij = y ij − y i. − y. j + y.. (4.8) ˆ As verificações serão feitas por meio do estudo dos gráficos de resíduos como: Gráficos de resíduos X Valores Ajustados; Gráficos de Resíduos x Tratamentos; Resíduos x Blocos e Gráfico de probabilidade Normal. Aqui pode-se também usar o teste de Barllets para testar a igualdade de variâncias e o teste de ShapiroWilk para Normalidade dos resíduos. 4.4- Comparações Múltiplas. Da mesma forma pode-se utilizar o teste de Tukey, considerando agora uma pequena alteração no grau de liberdade do QM E , que agora possui ( k −1)(b −1) graus de liberdade e substituir o número n de réplicas pelo número de blocos b. 27
  • 28. 4.5 – Aplicação do Software R na analise de dados para o planejamento de experimento aleatorizado em blocos completos. Para ilustrarmos a aplicação desse modelo, utilizamos outro problema proposto em Werkema & Aguiar, (1996) descrito abaixo: Com o objetivo de reduzir o tempo de reação de um processo químico, uma indústria resolve realizar um experimento com quatro tipos de catalisadores (A,B,C e D). No entanto os técnicos perceberam que a matéria-prima utilizada na reação não era totalmente homogênea e representava uma fonte de variabilidade que afetava o desempenho do processo. Uma maneira de contornar este problema consistia em selecionar vários lotes de matéria-prima e comparar os quatro catalisadores nas condições relativamente homogêneas dentro de cada lote. Dessa forma, a equipe decidiu usar cinco lotes disponíveis no estoque da industria e para cada lote extrair quatro porções de matéria-prima, de modo que cada porção fosse suficiente para fabricar uma batelada de produto, e alocar aleatoriamente a cada uma destas porções um dos catalisadores considerados no estudo. Estabeleceu-se a aleatorização da ordem de realização dos ensaios. Neste caso, cada ensaio corresponde à produção de uma batelada da substância química utilizando uma das combinações porção de matéria- prima/catalisador. Portanto estamos diante de um experimento aleatorizado em blocos completos. Cada bloco corresponde a um lote de matéria prima e os tratamentos ou níveis do fator correspondem aos tipos de catalisador. Dentro de um bloco, a associação dos tratamentos às unidades experimentais e a ordem de realização dos ensaios são determinadas ao acaso. Os dados desse experimento estão ilustrados abaixo: Tabela 4.2: Dados do experimento com Catalisadores Lotes Catalisador 1 2 3 4 5 A 41 34 40 39 33 B 43 37 45 42 40 C 45 38 48 43 38 D 43 41 45 46 40 4.5.1 - Entrada de dados e análise descritiva usando o Software R. Aqui a matriz de planejamento será montada da seguinte forma: Repostas: y<- scan() : Depois do comando o próximo passo é entrar com os dados da resposta. Montando a variável Bloco e Tratamento: b<-rep(1:5,each=4) : no caso temos 5 blocos com 4 repetições. tr<-rep(1:5,4) : no caso temos 4 tratamentos com 5 repetições. 28
  • 29. Uma opção mais completa pode ser definida por: b<-factor(rep(1:5,each=4),labels=c("Lote1","Lote2","Lote3","Lote4","Lote5")) tr<- factor(rep(1:4,5),labels=c("A","B","C","D")) Montando o Data.frame decab<-data.frame(resp=y,trat=tr,bloco=b) > decab resp trat bloco 1 41 A Lote1 2 43 B Lote1 * * * 19 38 C Lote5 20 40 D Lote5 Da mesma forma utilizando o comando attach() e tapply(), a um resumo descritivo considerando os fatores. attach(decab) > tapply(resp,trat,summary) $A Min. 1st Qu. Median Mean 3rd Qu. Max. 33.0 34.0 39.0 37.4 40.0 41.0 $B Min. 1st Qu. Median Mean 3rd Qu. Max. 37.0 40.0 42.0 41.4 43.0 45.0 $C Min. 1st Qu. Median Mean 3rd Qu. Max. 38.0 38.0 43.0 42.4 45.0 48.0 $D Min. 1st Qu. Median Mean 3rd Qu. Max. 40 41 43 43 45 46 > tapply(resp,bloco,summary) $Lote1 Min. 1st Qu. Median Mean 3rd Qu. Max. 41.0 42.5 43.0 43.0 43.5 45.0 $Lote2 Min. 1st Qu. Median Mean 3rd Qu. Max. 34.00 36.25 37.50 37.50 38.75 41.00 $Lote3 Min. 1st Qu. Median Mean 3rd Qu. Max. 40.00 43.75 45.00 44.50 45.75 48.00 $Lote4 Min. 1st Qu. Median Mean 3rd Qu. Max. 29
  • 30. 39.00 41.25 42.50 42.50 43.75 46.00 $Lote5 Min. 1st Qu. Median Mean 3rd Qu. Max. 33.00 36.75 39.00 37.75 40.00 40.00 Uma inspeção gráfica, pode ser obtida pelos comandos: par(mfrow=c(2,1)) plot(trat,resp,xlab="Tratamento",ylab="Respostas") plot(bloco,resp,xlab="Bloco",ylab="Respostas") Figura 4.1: Box-Plot para os tempos de reação segundo tratamento (catalisador) e bloco (lotes de matéria-prima). Pela Figura 4.1 e medidas descritivas acima, pode-se observar que parece haver uma diferença entre os tempos, sendo que o menor tempo de reação parece estar associado ao catalisador A. > coplot(resp~trat|bloco,panel=panel.smooth,rows=1,xlab=c("Medidas por Catalisador", paste("Bloco")),ylab="Tempo de Reação") 30
  • 31. O problema agora é verificar se essas diferenças de fato são significativas ou podem ser de origem aleatória. Para constatarmos se de fato as diferenças são significativas utilizaremos à análise de variância. > eb.av<-aov(resp~trat+bloco) > anova(eb.av) Analysis of Variance Table Response: resp Df Sum Sq Mean Sq F value Pr(>F) trat 3 95.350 31.783 13.430 0.0003839 *** bloco 4 165.200 41.300 17.451 6.098e-05 *** Residuals 12 28.400 2.367 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 31
  • 32. Pelo quadro da anova acima, verifica-se que existe diferença entre tratamentos, com relação aos blocos tem-se uma indicação de que apresentaram efeito significativo, sendo dessa forma seu uso indispensável neste experimento. Detectado a diferença entre tratamentos o próximo passo e identificar de fato qual dos tratamentos esta diferindo do outro. Nesta etapa vamos utilizar o teste de Tukey. Comando: >TukeyHSD(eb.av) Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = resp ~ trat + bloco) $trat diff lwr upr B-A 4.0 1.111354 6.888646 C-A 5.0 2.111354 7.888646 D-A 5.6 2.711354 8.488646 C-B 1.0 -1.888646 3.888646 D-B 1.6 -1.288646 4.488646 D-C 0.6 -2.288646 3.488646 $bloco diff lwr upr Lote2-Lote1 -5.50 -8.967325 -2.032675 Lote3-Lote1 1.50 -1.967325 4.967325 Lote4-Lote1 -0.50 -3.967325 2.967325 Lote5-Lote1 -5.25 -8.717325 -1.782675 Lote3-Lote2 7.00 3.532675 10.467325 Lote4-Lote2 5.00 1.532675 8.467325 Lote5-Lote2 0.25 -3.217325 3.717325 Lote4-Lote3 -2.00 -5.467325 1.467325 Lote5-Lote3 -6.75 -10.217325 -3.282675 Lote5-Lote4 -4.75 -8.217325 -1.282675 Percebe-se, através do teste paras diferenças entre tratamentos e o intervalo de confiança para as diferenças, que o catalisador A proporciona menor tempo de reação comparado com todos os tratamentos. Para este modelo devem-se construir os gráficos de resíduos contra valores ajustados; gráfico de resíduos contra tratamentos; gráfico de resíduos contra blocos e gráfico de 32
  • 33. probabilidade normal. Da mesma forma, podem-se utilizar alguns testes para verificar as hipóteses de variância constante e normalidade dos dados. Na Figura abaixo contém os gráficos descritos acima, para a análise de resíduos. Figura 4.2: Gráficos para Análise de Resíduo do modelo de planejamento de experimentos em blocos completos. A seqüência dos comandos para a análise de resíduos da Figura 4.2, é descrita abaixo: > par(mfrow=c(2,2)) > plot(eb.av$fit,eb.av$res,xlab="Valores Ajustados",ylab="Resíduos",col="blue") > plot(trat,eb.av$res,xlab="Tratamentos",ylab="Resíduos",col="blue") > plot(bloco,eb.av$res,xlab="Blocos",ylab="Resíduos",col="blue") > qqnorm(eb.av$res,xlab="Quantil da Normal",ylab="Resíduos",col="blue") > qqline(eb.av$res) Pela Figura 4.2, parece não existir nenhuma violação grave na suposição do modelo. Aplicando os testes de normalidade e homogeneidade de variâncias tem-se os seguintes resultados: Para o teste da Normalidade dos Resíduos temos: > shapiro.test(eb.av$res) Shapiro-Wilk normality test 33
  • 34. data: eb.av$res W = 0.9217, p-value = 0.1066 Para testar a homogeneidade das variâncias temos: > bartlett.test(eb.av$res,trat) Bartlett test of homogeneity of variances data: eb.av$res and trat Bartlett's K-squared = 0.8093, df = 3, p-value = 0.8472 >bartlett.test(eb.av$res,bloco) Bartlett test of homogeneity of variances data: eb.av$res and bloco Bartlett's K-squared = 0.5292, df = 4, p-value = 0.9706 Como a suposições de normalidade e nem de variância constante foram rejeitadas, pode-se considerar o modelo como válido e a análise encerrada. 4.6- Conclusões Finais • Existe diferença entre o tempo médio de reação entre os tratamentos, sendo que o Catalisador A apresenta menor tempo de reação. • O modelo utilizado na análise se mostrou apropriado, sem apresentar violações. • Dessa forma recomenda-se a utilização do Catalisador A na produção, pois irá aumentar a produtividade do processo. 4.7- Exercícios do Capítulo 1- Um experimento foi conduzido a fim de investigar o escapamento de corrente elétrica em um aparelho SOS MOSFETS. A finalidade do experimento foi investigar como o escapamento de corrente varia com o comprimento do canal. Quatro comprimentos diferentes foram selecionados. Para cada comprimento do canal, cinco larguras diferentes foram também usadas. A largura deve ser considerada como fator pertubador. Eis os dados. Largura Comprimento do Canal 1 2 3 4 5 1 0,7 0,8 0,8 0,9 1 2 0,8 0,8 0,9 0,9 1 3 0,9 1 1,7 2 4 4 1 1,5 2 3 20 2- No artigo intitulado “O efeito do projeto do bocal na estabilidade e desempenho de jatos turbulentos de água”, na revista Fire Safety Journal,Vol.4,agosto de 1981,C.Theobald descreve um Velocidade do Jato deuma medida da forma foi experimento em que Saída (m/s) Tipo de Bocal 11,73 14,37 16,59 20,43 23,46 28,74 1 0,78 0,8 0,81 0,75 0,77 0,78 2 0,85 0,85 0,92 0,86 0,81 0,83 34 3 0,93 0,92 0,95 0,89 0,89 0,83 4 1,14 0,97 0,98 0,88 0,86 0,83 5 0,97 0,86 0,78 0,76 0,76 0,75
  • 35. determinada para vários tipos diferentes de bocais, com níveis diferentes de velocidade do jato de saída. O interesse nesse experimento está principalmente no tipo de bocal, sendo a velocidade um fator que provoca distúrbio. Os dados são apresentados a seguir. • O tipo de bocal afeta a medida da forma? Compare os bocais, usando os diagramas de caixa e a análise de variância. • Compare as diferenças entre os bocais utilizando o gráfico box-plot. • Faça a análise de resíduos para o modelo. 3- Um experimento foi realizado para determinar o efeito de quatro tipos diferentes de ponteiras em um teste de dureza de uma liga metálica. Quatro corpos de prova da liga foram obtidos e cada ponteira foi testada uma vez em cada corpo de prova, produzindo os seguintes dados: Corpo de Prova Tipo de Ponteira 1 2 3 4 1 9,3 9,4 9,6 10 2 9,4 9,3 9,8 9,9 3 9,2 9,4 9,5 9,7 4 9,7 9,6 10 10,2 • Faça uma análise de variância completa para checar se existe diferença nas medidas de dureza entre as ponteiras. Capítulo 5 – Planejamentos Fatorias Em muitas situações práticas podemos ter interesse em estudar o efeito de dois ou mais fatores, nestas situações um experimento fatorial deve ser utilizado. Nos experimentos fatorias, os fatores variam de forma simultânea, especificamente, queremos dizer que em cada tentativa completa ou replicação do experimento, são investigadas todas as combinações dos níveis dos fatores. Por exemplo, se há dois fatores A e B, com a níveis para o fator A e b níveis para o fator B, então cada replicação contém todas as ab combinações possíveis. O efeito de um fator é definido como a mudança na resposta produzida por uma mudança no nível do fator. Isso é chamado efeito principal, porque se refere aos fatores principais no estudo. 35 Se a diferença na resposta entre os níveis de um 25 fator não é a mesma em todos os níveis 30 dos outros fatores, então esse efeito é chamado de interação. Abaixo apresentamos 20 25 exemplos gráficos de planejamentos com dois fatores com e sem interação. 15 20 B(+) B(+) 15 B(-) 10 B(-) 10 5 5 0 0 35 - + - + Fator A Fator A
  • 36. Figura 5.1: Sem Interação Figura 5.2: Presença de Interação 5.1- Planejamento Fatorial com dois fatores. Vamos considerar neste caso o planejamento com dois fatores. Aqui consideramos A e B, com a e b níveis respectivamente. Se o experimento é replicado n vezes, a disposição dos dados pode ser ilustrada na tabela abaixo: Tabela 5.1: Disposição dos dados para um experimento fatorial com dois fatores Fator B Fator A 1 2 … b 1 y111 , y112 , y121 , y122 , y1b1 , y1b 2 , ..., y11n ..., y12 n … ..., y1bn 2 y211 , y212 , y221, y222 , y2 b1 , y2 b 2 , ..., y21n ..., y22 n … ..., y2 bn      ya11 , ya12 , ya 21 , ya 22 , yab1 , yab 2 , a ..., ya1n ..., ya 2 n … ..., yabn Em geral, a observação na ij-ésima cela na k-ésima repetição é yijk . Aqui, na coleta de dados, as abn observações devem ser feitas em ordem aleatória. O planejamento fatorial com dois fatores é um planejamento completamente aleatorizado. Vamos supor, inicialmente, que ambos os fatores tenham efeitos fixos. O modelo matemático para observações de um experimento fatorial com dois fatores é dado por  i = 1,2,..., a  yijk = µ + τ i + β j + (τβ ) ij + ε ijk ;  j = 1,2,..., b (5.1)  k = 1,2,..., n  onde: µ : é o efeito médio geral τi : é o efeito do i-ésimo nível do fator A. βj : é o efeito do j-ésimo nível do fator B. 36
  • 37. (τβ)ij : é o efeito da interação entre A e B. εijk : é o erro aleatório. Da mesma forma, vamos considerar que εijk ~ N (0;σ 2 ). Ambos os fatores são considerados fixos, e o efeito dos tratamentos são definidos como desvios da média geral, dessa forma ∑i =1τ i = 0 e ∑j =1 β j = 0 . a b Similarmente os efeitos da interação são considerados fixos e são definidos de forma que ∑i =1 (τi β j ) = ∑j =1 (τi β j ) = 0 . Como existirão n réplicas no experimento, tem- a b se um total de abn observações. No experimento fatorial com dois fatores, tem-se interesse em testar o efeito dos dois fatores. Especificamente, estamos interessados em testes de hipóteses sobre a igualdade do efeito do tratamento das linhas (Fator A) H 0 : τ1 = τ 2 = ... = τ a = 0 (5.2) H1 : τi ≠ 0, para pelo menos um i E a igualdade de efeito do tratamento das colunas (Fator B). H 0 : β1 = β2 = ... = βb = 0 (5.3) H1 : β j ≠ 0; para pelo menos um j. Também, tem-se interesse em se testar o efeito da interação entre linhas e colunas, ou seja, H 0 : (τβ)ij = 0, para todo i, j. (5.4) H1 : (τβ)ij ≠ 0, para pelo menos um para (i, j ). 5.1.1- Análise Estatística para o modelo de efeitos fixos. Sejam yi .. o total das observações no i-ésimo nível do fator A, y . j . o total das observações no j-ésimo nível do fator B, y ij . o total das observações na ij-ésima cela da Tabela 1, e y i .. , y. j . , y ij . e y... como as correspondentes médias de linha, coluna, cela e total. Isto é, y i.. y i .. = ∑j =1 ∑ =1 y ijk b n k y i.. = ; i =1,2,..., a bn y. j . y. j . = ∑i =1 ∑k =1 y ijk a n y. j . = ; j =1,2,..., b an 37
  • 38. y ij .  i = 1,2,..., a y ij . = ∑k =1 y ijk ; n y ij . =  j = 1,2,..., b n y... y... = ∑=1 ∑j =1 ∑ =1 y ijk a b n i k y... = abn A análise de variância decompõe a soma de quadrados total a b n SQT = ∑∑∑( y ijk − y... ) 2 (5.5) i =1 j =1 k =1 Da seguinte forma: a b n a b ∑∑∑( yijk − y... ) 2 = bn∑( yi.. − y... ) 2 + an∑( y. j. − y... ) 2 i =1 j =1 k =1 i =1 j =1 a b + n∑∑ ( y ij . − y i .. − y. j . + y... ) 2 i =1 j =1 a b n + ∑∑∑( y ijk − y ij . ) 2 . i =1 j =1 k =1 Ou, simbolicamente, SQT = SQ A + SQB + SQ AB + SQE (5.6) A decomposição dos graus de liberdade é ilustrada na tabela abaixo: Tabela 5.2 – Decomposição dos graus de liberdade. Efeito Graus de Liberdade A a −1 B b −1 Interação AB ( a −1)(b −1) Erro ab( n −1) Total abn −1 38
  • 39. Cada soma de quadrados dividido pelos respectivos graus de liberdade formam os quadrados médios. Assim SQ A QM A = : Quadrado médio do tratamento A. a −1 SQ B QM B = : Quadrado médio do tratamento B. b −1 SQ AB QM AB = : Quadrado médio da Interação. ( a −1)(b −1) SQ E QM E = : Quadrado médio dos Erros. ab(n − 1) Os valores esperados dos quadrados médios são: bn∑i =1τ i2 a  SQ A  E (QM A ) = E   =σ + 2 (5.7)  a −1 a −1 an ∑ j =1 β j b 2  SQB  (5.8) E (QM B ) = E   =σ + 2  b −1  b −1 n∑i =1 ∑ j =1 (τβ ) ij a b 2  SQ AB   (a − 1)(b − 1)  = σ + (a − 1)(b − 1) E (QM AB ) = E  (5.9) 2     SQE   ab(n − 1)  = σ E (QM E ) = E  2  (5.10)   Note que se as hipóteses nulas sobre o efeito das linhas A, efeitos das colunas B e da interação AB são verdadeiras então QM A , QM B , QM AB e QM E são todos estimativas de σ 2 . Dessa forma, se existe diferenças entre os efeitos dos tratamentos em A, então QM A será maior que QM E . Similarmente, se existe diferenças nos efeitos dos tratamentos em B, ou na interação AB, então a correspondente média quadrática será maior que QM E . Portanto o teste de significância de ambos os efeitos e interações, é simplesmente usar a razão entre as médias quadráticas e o quadrado médio dos resíduos QM E . 39
  • 40. Se for assumido que o modelo da equação 5.1 é adequado e que os ε ij k são independentes e identicamente distribuídos de forma normal com variância constante QM A QM B QM AB σ 2 , então cada razão de quadrados médios , e é distribuído QM E QM E QM E como uma F com (a −1) , (b −1) e ( a −1)(b −1) graus de liberdade do numerador respectivamente e ab( n −1) graus de liberdade do denominador. A região critica para um teste com nível de significância α , será valores da razão de quadrados que exceder o quantil da F com um nível α e respectivos graus de liberdade. O procedimento é resumido na tabela de Análise de Variância abaixo: Tabela 5.3 – Quadro da ANOVA Fonte de Soma de Graus de Quadrado Médio Variação Quadrados Liberdade F0 SQ A QM A A SQ A a −1 QM A = a −1 QM E SQB QM B B SQ B b −1 QM B = b −1 QM E SQ AB QM AB ( a −1)(b −1) QM AB = Interação SQ AB ( a −1)(b −1) QM E SQ E ab( n −1) QM E = Erro SQ E ab(n − 1) Total SQT abn −1 5.1.2- Análise de Resíduo para o Modelo Fatorial com 2 fatores fixos. Do mesmo modo que nos experimentos com um fator, discutidos anteriormente, os resíduos de um experimento fatorial desempenham papel importante na garantia de adequação do modelo. Os resíduos de um experimento fatorial de dois fatores são ε ijk = y ijk − y ijk = y ijk − y ij . ˆ (5.11) Isto é, os resíduos são, simplesmente, a diferença entre as observações e as médias das celas correspondentes (ver Montgomery, 2001). Da mesma forma a utilização de gráficos e testes para checar a adequação das suposições serão de grande importância. Para o modelo fatorial de dois fatores A e B, destacamos os seguintes gráficos e testes. 1. Gráfico da probabilidade normal. Usado com os resíduos, checa se os mesmos seguem uma distribuição normal. Aqui também utiliza-se o teste de normalidade como por exemplo Shapiro-Wilky. 40
  • 41. 2. Gráfico de resíduos X níveis do fator A. Checa a homogeneidade da variância nos níveis de A. 3. Gráfico de resíduos X níveis do fator B. Checa a homogeneidade da variância nos níveis de B. ˆ 4. Gráfico de resíduos X valores preditos y ijk . Checa a homogeneidade da variância de forma geral. Para testar a homogeneidade da variância pode-se usar o teste de Bartey. 5. Gráfico de resíduos X Ordem de coleta. Checa a suposição de independência entre as observações. Se forem observadas evidências de fortes violações na suposição do modelo, esse deve ser invalidado ou deve-se proceder a transformações dos dados originais (ver Montgomery, 2001). 5.1.3- Comparações Múltiplas Identificado o efeito significativo nos níveis dos fatores, deve-se utilizar um teste de comparações múltiplas, para a identificação das diferenças específicas. Novamente será utilizado nesta fase o teste de comparações múltiplas de Tukey. Vale ressaltar que quando a interação é significativa, a comparação entre médias de um mesmo fator pode ser mascarada pelo efeito da interação. Uma alternativa para essa situação é por exemplo fixar o fator B em um nível específico e aplicar o teste Tukey para as médias do fator A neste nível fixado. 5.2- O Modelo de Planejamento Fatorial Geral Os resultados do experimento fatorial com dois fatores podem ser facilmente estendidos para o caso geral onde existem a níveis do fator A, b níveis do fator B, c níveis do fator C, e assim por diante. No geral, existirão abc...n observações totais para n réplicas completas do experimento. Aqui, deve-se ter no mínimo duas réplicas ( n ≥ 2 ) para determinar as somas de quadrados envolvidas no modelo. Se todos os fatores no experimento são fixos, pode-se facilmente formular e testar hipóteses sobre os efeitos principais e interações. Neste caso, testes estatísticos para cada efeito principal e interação podem ser construídos pela divisão da correspondente média de quadrados dos efeitos ou interação pela média quadrática dos erros. Todos são testes F , unilaterais a direita. O número de graus de liberdade para os efeitos principais é o número de níveis do fator menos um e o número de graus de liberdade para interação é o produto do número de graus de liberdade associado com os componentes individuais da interação. Por exemplo, considerando o modelo com três fatores temos: 41
  • 42.  i = 1,2,..., a  j = 1,2,..., b  y ijkl = µ + τ i + β j + γ k + (τβ ) ij + (τγ ) ik + ( βγ ) jk + (τβγ ) ijk + ε ijkl , com   k = 1,2,..., c  l = 1,2,..., n  (5.12) Assumindo que A,B e C são fixados, a tabela resumo da análise de variância, incluindo a esperança dos quadrados médios é dada abaixo. Tabela 5.4 – Quadro da Anova (Modelo Fatorial com Três Fatores) Fonte de Soma de Graus de Quadrado Esperança da Média Fo Variação Quadrados Liberdade Médio Quadrática A SQ A a −1 QM A bcn∑τ i2 QM A σ2 + a −1 QM E B SQ B b −1 QM B acn∑ β 2 QM B σ2 + b −1 QM E C SQC c −1 QM C abn∑ γ k2 QM C σ2 + c −1 QM E AB SQ AB ( a −1)(b −1) QM AB cn∑∑(τβ ) ij 2 QM AB σ2 + ( a − 1)(b − 1) QM E AC SQ AC (a − 1)(c − 1) QM AC bn∑∑(τγ ) ik 2 QM AC σ2 + (a − 1)(c − 1) QM E BC SQBC (b −1)(c −1) QM BC an∑∑( βγ ) 2jk QM BC σ2 + (b − 1)(c − 1) QM E ABC SQ ABC ( a −1)(b −1)(c −1) n∑∑∑(τβγ ) ijk 2 QM ABC QM ABC σ + 2 (a −1)(b −1)(c −1) QM E Erro SQ E abc( n − 1) QM E σ2 Total SQT abcn −1 A soma de quadrados total é encontrada da mesma forma anterior, sendo dada por 2 y.... SQT = ∑i =1 ∑j =1 ∑k =1 ∑l =1 y a b c n 2 ijkl − (5.13) abcn As somas de quadrados dos efeitos principais são encontradas a partir dos totais dos fatores A ( y i ... ) , B ( y. j .. ) e C ( y..k . ) como segue 42