SlideShare uma empresa Scribd logo
1 de 38
Caroline Godoy
Turma : Sistemas de Informação
Teste de Hipótese




Última aula
• Teste para a variância com uma constante;

                         2      (n 1) / S 2          2
                         c            2
                                                ~    n 1
                                      0

• Teste para a variância de duas populações




        (n1 1) S12       2
                                                      U
   U                 ~       (n1 1)
             2
                                          S12       (n1 1)
                                            2
                                                           ~ F (n1 1, n2 1)
                 2
        (n2 1) S 2       2                S2          V
   V         2
                     ~       (n2 1)
                                                    (n2 1)
Teste de Hipótese




Última aula
• Comparação de duas populações:


   • Planejamento Aleatorizado (amostras independentes)
          Pop. 1: Perda de peso dos indivíduos submetidos à dieta A;
                (amostra de n1 valores)
          Pop. 2: Perda de peso dos indivíduos submetidos à dieta B.
                (amostra de n2 valores)

   • Planejamento Pareado (amostras dependentes)
          Pop. 1: Peso dos indivíduos antes da dieta A
          Pop. 2: Peso dos indivíduos depois da dieta A.
               (amostra única de tamanho n)
Teste de Hipótese




Última aula
• Questões iniciais:


    1.   As duas populações são normais?
         Verificar por gráficos como Box Plot ou Histograma já vistos.
    2.   As variâncias são iguais ou diferentes?
         Realizar o Teste F já visto.
    3.   As variâncias da população são conhecidas ou desconhecidas?
Teste de Hipótese




 Última aula – Amostras independentes
• Considerando as duas populações Normais ; variâncias iguais e
     desconhecidas temos a estatística de teste pelo teste da Razão de
     Verossimilhança:
                                     H 0:   A    B

                                     H 0:   B    A



                                                               2          2
       (YB YA ) ( B              )                   (n A 1) S A (nB 1) S B
tc                           A          onde    Sp
                                                          n A nB 2
               1   1
          Sp
               nA nB
Teste de Hipótese




Comparação de Duas Populações ou
Tratamentos – Amostras independentes
• Considerando as duas populações Normais ; variâncias diferentes e
     desconhecidas temos a estatística de teste pelo teste da Razão de
     Verossimilhança:

                                  H 0:   1   2

                                  H 1:   1   2

                                                              ni
        (Y2 Y1 ) (                                      1
                       2     1)      onde        Si2                ( yi    y j )2
tc                                                     nj 1 i
                  2    2                                        1
               S 1    S2
               n1     n2
Teste de Hipótese




Comparação de Duas Populações ou
Tratamentos – Amostras independentes
• Considerando as duas populações Normais ; variâncias diferentes e
  desconhecidas temos a estatística de teste pelo teste da Razão de
  Verossimilhança:
                              tc        tv;      /2       tc               H1 :       B   A
• Rejeita-se H0 se:
                         tc        tv;                         H1 :    B          A

                         tc             tv;                     H1 :       B          A

                                             2
                          2         2
                     S   1         S2
• onde               n1            n2
         v                2                           2
                2                        2
              S1                    S    2
                    n1                       n2
              n1 1                  n2 1
Teste de Hipótese




Exemplo 1
• Considerando dois diferentes métodos submetidos aleatoriamente a um
  grupo de unidades experimentais, deseja-se saber: B é mais eficiente que
  A?


                                                  Tratamentos
                    Estatísticas
                                              A                 B
            Amostra                ni         8                 8
            Média                  y         5,0            7,0
            Variância              S2        4,0            1,71


                        y1 j   nota do m étodoA
                        y2 j   nota do m étodoB
Teste de Hipótese




Comparação de Duas Populações ou
Tratamentos – Amostras dependentes
• Considerando um exemplo de uma nova droga para emagrecimento
  proposta com N indivíduos observados com relação ao seu peso inicial.
  Após o tratamento com a nova droga o peso é novamente observado.
• A droga pode ser considerada eficiente?


• Hipótese Científica:
H0: A droga não é eficiente
H1: A droga é eficiente

               y1 j   peso antes da droga            j 1,...n
               y2 j   peso depoisda droga
•   Para os testes é considerada a diferença entre antes depois do
    tratamento e quanto mais distante de zero, maior a presença do efeito
    do tratamento em estudo.
Teste de Hipótese




Comparação de Duas Populações ou
Tratamentos – Amostras dependentes
• Então, podemos definir:

                        dj   y2 j     y1 j               j 1,...n
• Suposição:
                                             2
                          d j ~ N(     d;    d   )

•   Hipóteses a serem testadas

                                    H 0:     d       0
                                    H 1:     d       0
                                    H 1:     d       0
                                    H 1:     d       0
Teste de Hipótese




Comparação de Duas Populações ou
Tratamentos – Amostras dependentes
• A estatística de teste para as hipóteses é

                                             d
                                   td                ~ tn   1
                                        Sd
                                                 n


• onde
                        n                                       n
                    1                                 1
               d              di         Sd                         (d i   d )2
                    n   i 1                          n 1i       1
Teste de Hipótese




 Comparação de Duas Populações ou
 Tratamentos – Amostras dependentes
• Rejeita-se H0 se


i)
                         ii)
                                                             iii)




• Se quiséssemos calcular um IC:

                                                        Sd
                        IC(    d   ;1   ): d   t   /2
                                                         n
Teste de Hipótese




Exemplo 2:
• Já foi dito que ouvir Mozart melhora o desempenho dos alunos em
  testes. Na história “Floral Scents and Learning”, os pesquisadores
  questionam cheiros agradáveis tem efeito semelhante. Vinte e um
  sujeitos resolveram um labirinto de papel e lápis enquanto usavam uma
  máscara que não tinha nenhum perfume ou tinha um aroma floral. A
  variável resposta é o tempo médio deles em 3 ensaios.
• O experimento analisou o tempo médio sem perfume e o tempo médio
  com perfume para cada sujeito. Na tabela consta as diferenças dos
  tempos médios com perfume menos o tempo médio sem perfume.
Teste de Hipótese




Exemplo 2:
                -7,37        -10,48        14,30        -10,77
                -3,14        -0,87        -24,57        24,97
                 4,1          8,7          16,17        -4,47
                -4,4          2,94         -7,84         11,9
                19,47        -17,24         8,6         -6,26
                                                         6,67

• O primeiro sujeito por exemplo foi 7,37 segundos mais rápido usando a
  máscara perfumada, logo a diferença é negativa. Como tempos mais
  curtos representam um desempenho melhor, difereças negativas
  mostram que o sujeito teve um melhor desempenho quando usou a
  máscara perfumada.
Teste de Hipótese




Comparação de Duas Populações ou
Tratamentos – Proporção
• Vimos o teste para a proporção, comparado com uma constante, um
  valor fixo. Agora veremos como comparar duas populações quando nos
  referimos à proporção.

           População     Proporção     Tamanho    Proporção
              ou        populacional      da       amostral
          Tratamento                    amostra
               1                p1        n1         ˆ
                                                     p1
               2                p2        n2         ˆ
                                                     p2
• Hipóteses a serem testadas:
                        H 0: p1 p 2
                        H 1: p1 p 2     p1 p 2 0
                        H 1: p1 p 2     p1 p 2 0
                        H 1: p1 p 2     p1 p 2 0
Teste de Hipótese




Comparação de Duas Populações ou
Tratamentos – Proporção
• Estatística de teste:                   ˆ ˆ
                                         p1 p2
                          Zc
                                 ˆ       ˆ   ˆ     ˆ
                                 p1 (1 p1 ) p2 (1 p2 )
                                      n1        n2
• Rejeita-se H0 se:
                                        i) | Z c | z   2    (teste bilateral)
                                        ii) Z c    z       (teste unilateralà direita)
                                        iii) Z c       z     (teste unilateralà esquerda)


i)
                           ii)
                                                           iii)
Anova




ANOVA com um fator
 Vimos até agora comparações de médias com uma
 constante e comparações de médias de duas
 populações verificando se eles diferem ou não
 significativamente;

 Porém, frequentemente existe a necessidade de
 comparar mais que duas médias, isto é comparação de
 várias populações, vários grupos.
Anova




Situação 1
 Um estudo foi conduzido, no período de um ano, para
    acompanhar três grupos de alunos de Sistemas de
    Informação com excesso de peso.
   No primeiro grupo, aplicou-se dieta, com redução no
    consumo de calorias.
   No segundo, a prática de exercícios regularmente.
   No terceiro, mantiveram-se os hábitos alimentares e o
    nível de atividade física.
   A massa corpórea foi mensurada no início e no final do
    período. Como avaliar se há alguma evidência de que
    exista diferença na variação média da massa corpórea
    nessas três populações?

                           Comparação de Vários Grupos!!
Anova




Comparando 3 populações
     Grupo                 Grupo                  Grupo
     A                     B                      C
        1   ,   1            2   ,   2                 3   ,   3




    X 1 , s12              X 2 , s22               X 3 , s32

Populações independentes e normalmente distribuídas.
Anova




Como Comparar as Médias?


   Teste z ou t duas a duas:
                                     3    3!
          Para 3 amostras teremos: 2          3 testes
                                         2!1!

                                     6    6!
          Para 6 amostras teremos:            15 testes
                                     2   2!4!
Anova



Problemas ...
 1) A quantidade de testes “explode”, quando a quantidade de
    amostras aumenta.
 2) A condução de múltiplos testes t para duas amostras, duas a
    duas, pode levar a uma conclusão incorreta!
 Suponha que    1    2   3   e   = 0,05 em cada teste t. Então:
 p(conclusão correta em todos os testes) = (0,95)3 = 0,857 e
 p(rejeitar H0 em pelo menos um teste) = 1 - 0,857 = 0,143.
 Portanto, ao realizar múltiplos testes t, aumentamos a chance de
 cometer um Erro Tipo I !!
 3) Uma vez que os testes são conduzidos com o mesmo
    conjunto de dados, eles não são mais todos independentes.
Anova




Deseja-se um teste para comparar as
diversas médias, no qual a probabilidade
de cometermos um Erro Tipo I seja igual a
algum valor predeterminado .



           ANOVA
Anova




Conceitos
 Estudos observacionais – observação de indivíduos ou
    objetos de interesse, mas não procura influenciar as
    respostas;
   Experimentos – impõe tratamentos aos indivíduos ou
    objetos de interesse para observar suas respostas;
   Fatores – variáveis explicativas, independentes, ou
    controláveis em um experimento que se deseja verificar seu
    efeito sob a variável de interesse observada;
   Níveis – os diferentes valores que o fator pode assumir no
    experimento;
   Tratamento – condição experimental específica aplicada
    aos sujeitos (combinação dos níveis com cada fator);
   Plano – descreve a escolha de tratamentos e a maneira pela
    qual os sujeitos são alocados;
Anova




Conceitos
 Aleatorização usa o acaso para alocar os ‘sujeitos’ aos
  tratamentos.

 Aleatorização + Comparação evitam o vício, ou
  favoritismo sistemático


                          Quanto mais ‘sujeitos’ pegamos mais
                            fica sensível a diferença entre os
                           tratamentos, ou seja, mais fácil de
                             identificar quais as diferenças.
Anova




Conceitos - Exemplo
 Um pesquisador está interessado em investigar o efeito
 de vários tipos de ração que diferem pela quantidade de
 potássio no aumento do peso de determinado tipo de
 animal.

   Hipótese Científica: Verificar o efeito dos diferentes tipos de ração
    para engorda de animais;
   Hipótese Estatística: Comparar as médias de ganho de peso obtido
    pelos animais submetidos aos diferentes tipos de ração;

   Variável independente / Fator – tipo de ração
   Níveis – diferentes tipos de ração (ex: tipo de ração A, tipo de ração B)
Anova




Conceitos – Exemplo 2
 Estudo do efeito de quatro fertilizantes e três variedades
  de feijão quanto à sua produção.

   Hipótese Científica: Verificar o efeito dos diferentes tipos de
    fertilizantes e diferentes tipos de feijão quanto à produção;
   Hipótese Estatística: Comparar as médias de produção obtidas;


   Variável independente / Fator – 1) tipo de fertilizante 2) tipo de feijão;
   Níveis – 1) diferentes tipos de fertilizante (A, B, C e D); 2) diferentes
    tipos de feijão (alpha, beta, gama);
   Tratamentos – (A, alpha), (A, beta), (A, gama), (B, alpha), (B, beta),
    (B, gama), (C, alpha), (C, beta), (C, gama), (D, alpha), (D, beta), (D,
    gama) (12)
Anova




Conceitos
1.   Uma indústria de parafusos adquiriu 5 máquinas de uma determinada
     marca para produzir parafusos, e está interessada em realizar um
     experimento para investigar se as 5 máquinas são homogêneas com
     relação à resistência média dos parafusos por ela produzidos.


2.   A indústria das máquinas acima está interessada em realizar um
     experimento para investigar se as máquinas produzidas por ela são
     homogêneas com relação à resistência média dos parafusos que estas
     máquinas vão produzir. Como a população das máquinas produzidas é
     muito grande, o pesquisador quer realizar o experimento com uma
     amostra de máquinas (5), mas as conclusões devem ser tomadas para
     toda a população.
Anova




Conceitos
 No item 1 máquina é um efeito fixo e no item 2 é um

 efeito aleatório;

                                Refere-se aos
                                   níveis
         Refere-se à
        população de
           níveis
Anova




Procedimento de aleatorização
 Experimentos completamente aleatorizados
   Tratamentos atribuídos aleatoriamente à todas as

    unidades experimentais (cada u.e. tem igual
    probabilidade de receber qqr um dos tratamentos)

 Experimentos com restrição na aleatorização
   As u.e. apresentam uma fonte de variabilidade que pode

    influenciar nos resultados de sua execução. (Blocos)
Anova




Tipos de Experimentos
 Experimentos com uma única fonte de variação: ONEWAY (com
  um fator)
    Exemplo: Comparar a produtividade de 4 novas variedades de feijão;
     Fonte de variação – variedades de feijão / Tratamentos: variedades A,
     B, C e D
 Experimentos com duas ou mais fontes de variação: FATORIAIS
  (dois ou mais fatores)
    Exemplo: Numa determinada indústria química deseja-se verificar
     qual a combinação de adubo e inseticida maximiza a produção de
     uma dada cultura. Fonte de variação: A-Adubos: A1,A2 e A3 ;
    B-Inseticidas: B1 e B2 / Tratamentos: A1B1, A1B2, A2B1, A2B2, A3B1,
     A3B2                                                           FATORES
                                                                   CRUZADOS
Exemplo
Um experimento foi conduzido com a finalidade de
comparar os tempos de transmissão de dados de
quatro servidores (A, B, C e D). Os dados abaixo
referem-se ao tempo de transmissão de dados em
milissegundos dos servidores.
                          Servidores
                    A     B       C     D
                   64     78      75   55
                   72     91      93   66
                   68     97      78   49
                   77     82      71   64
                   56     85      63   70
                   95     77      76   68
           Total   432   510     456   372   1770
           Média   72     85      76   62    73.75
Exemplo
Desenho esquemático do tempo de transmissão de cada servidor

                                            Existe uma forte suspeita de
                                             que há diferença entre os
                                             quatro servidores.
                                            Distribuições assimétricas.
                                            Valor discrepante.
1-2 A Análise de Variância
 Para descrever situações com apresentado neste exemplo, adota-se um modelo do tipo:


            y ij      μi       ε ij        μ τ i ε ij               i=1,2,...,4,
                                           
                                                                   j=1,2,...,6
                                               μi
   yij= é o j-ésimo tempo de transmissão do i-ésimo servidor

     ié   média do i-ésimo servidor
         é uma constante para todas as observações (média geral);

    i    é o efeito do i-ésimo servidor;

    ijé o erro aleatório(erros de medida, fatores não controláveis,
   diferenças entre as unidades experimentais, etc.).

  Objetivo: testar se existe diferenças nos tempos médias de transmissão entre
  a=4 servidores.

                Hipóteses: H0:     1=   2=...=      4   =

                             Ha:   i       ᵥ para pelo menos um par (i,v) ,
                (i≠v= 1, 2,..,4)
1-2 A Análise de Variância
Em geral

           Tabela 1-2 Dados gerais de um experimento com um único fator
           Tratamentos              Observações           Totais Médias
             (níveis)

                1       y11   y12   .     .    .    y1r   y1.     y1

                2       y21   y22   .     .    .    y2r   y2.     y2
                .        .     .    .     .    .     .      .      .
                .        .     .    .     .    .     .      .      .

                a       ya1   ya2   .     .    .    yar    ya.    ya




                                                                          35
Modelo estatístico (one-way):

             y ij      μi      ε ij      μ τ i ε ij              i=1,2,...,a,
                                         
                                                                j=1,2,...,r
                                              μi

    yij= é a j-ésima observação do i-ésimo tratamento;

     ié    média do i-ésimo tratamento
          é uma constante para todas as observações (média geral);

     i    é o efeito do i-ésimo tratamento;

     ijé o erro aleatório(erros de medida, fatores não controláveis,
    diferenças entre as unidades experimentais, etc.).

  Pressuposições: 1) os erros aleatórios são independentes;
                        2) os erros aleatórios são normalmente distribuídos;
                        3) os erros aleatórios tem média 0 (zero) e variância   2;


                                                    2
Ou, então:                yij ~ N (            i;       ) e independen
                                                                     tes
                                                                                     36
1-3 Análise de Variância

Hipóteses: H0:    1=      2=...=    a   =

           Ha:    i        ᵥ para   pelo menos um par (i,v)


 Equivalentemente


 Hipóteses: H0:       1=     2=...=     a   =0

            Ha:       i    0 para pelo menos um i




                                                              37
Próxima aula

Aula 6 - Sistemas de informação

  • 1. Caroline Godoy Turma : Sistemas de Informação
  • 2. Teste de Hipótese Última aula • Teste para a variância com uma constante; 2 (n 1) / S 2 2 c 2 ~ n 1 0 • Teste para a variância de duas populações (n1 1) S12 2 U U ~ (n1 1) 2 S12 (n1 1) 2 ~ F (n1 1, n2 1) 2 (n2 1) S 2 2 S2 V V 2 ~ (n2 1) (n2 1)
  • 3. Teste de Hipótese Última aula • Comparação de duas populações: • Planejamento Aleatorizado (amostras independentes) Pop. 1: Perda de peso dos indivíduos submetidos à dieta A; (amostra de n1 valores) Pop. 2: Perda de peso dos indivíduos submetidos à dieta B. (amostra de n2 valores) • Planejamento Pareado (amostras dependentes) Pop. 1: Peso dos indivíduos antes da dieta A Pop. 2: Peso dos indivíduos depois da dieta A. (amostra única de tamanho n)
  • 4. Teste de Hipótese Última aula • Questões iniciais: 1. As duas populações são normais? Verificar por gráficos como Box Plot ou Histograma já vistos. 2. As variâncias são iguais ou diferentes? Realizar o Teste F já visto. 3. As variâncias da população são conhecidas ou desconhecidas?
  • 5. Teste de Hipótese Última aula – Amostras independentes • Considerando as duas populações Normais ; variâncias iguais e desconhecidas temos a estatística de teste pelo teste da Razão de Verossimilhança: H 0: A B H 0: B A 2 2 (YB YA ) ( B ) (n A 1) S A (nB 1) S B tc A onde Sp n A nB 2 1 1 Sp nA nB
  • 6. Teste de Hipótese Comparação de Duas Populações ou Tratamentos – Amostras independentes • Considerando as duas populações Normais ; variâncias diferentes e desconhecidas temos a estatística de teste pelo teste da Razão de Verossimilhança: H 0: 1 2 H 1: 1 2 ni (Y2 Y1 ) ( 1 2 1) onde Si2 ( yi y j )2 tc nj 1 i 2 2 1 S 1 S2 n1 n2
  • 7. Teste de Hipótese Comparação de Duas Populações ou Tratamentos – Amostras independentes • Considerando as duas populações Normais ; variâncias diferentes e desconhecidas temos a estatística de teste pelo teste da Razão de Verossimilhança: tc tv; /2 tc H1 : B A • Rejeita-se H0 se: tc tv; H1 : B A tc tv; H1 : B A 2 2 2 S 1 S2 • onde n1 n2 v 2 2 2 2 S1 S 2 n1 n2 n1 1 n2 1
  • 8. Teste de Hipótese Exemplo 1 • Considerando dois diferentes métodos submetidos aleatoriamente a um grupo de unidades experimentais, deseja-se saber: B é mais eficiente que A? Tratamentos Estatísticas A B Amostra ni 8 8 Média y 5,0 7,0 Variância S2 4,0 1,71 y1 j nota do m étodoA y2 j nota do m étodoB
  • 9. Teste de Hipótese Comparação de Duas Populações ou Tratamentos – Amostras dependentes • Considerando um exemplo de uma nova droga para emagrecimento proposta com N indivíduos observados com relação ao seu peso inicial. Após o tratamento com a nova droga o peso é novamente observado. • A droga pode ser considerada eficiente? • Hipótese Científica: H0: A droga não é eficiente H1: A droga é eficiente y1 j peso antes da droga j 1,...n y2 j peso depoisda droga • Para os testes é considerada a diferença entre antes depois do tratamento e quanto mais distante de zero, maior a presença do efeito do tratamento em estudo.
  • 10. Teste de Hipótese Comparação de Duas Populações ou Tratamentos – Amostras dependentes • Então, podemos definir: dj y2 j y1 j j 1,...n • Suposição: 2 d j ~ N( d; d ) • Hipóteses a serem testadas H 0: d 0 H 1: d 0 H 1: d 0 H 1: d 0
  • 11. Teste de Hipótese Comparação de Duas Populações ou Tratamentos – Amostras dependentes • A estatística de teste para as hipóteses é d td ~ tn 1 Sd n • onde n n 1 1 d di Sd (d i d )2 n i 1 n 1i 1
  • 12. Teste de Hipótese Comparação de Duas Populações ou Tratamentos – Amostras dependentes • Rejeita-se H0 se i) ii) iii) • Se quiséssemos calcular um IC: Sd IC( d ;1 ): d t /2 n
  • 13. Teste de Hipótese Exemplo 2: • Já foi dito que ouvir Mozart melhora o desempenho dos alunos em testes. Na história “Floral Scents and Learning”, os pesquisadores questionam cheiros agradáveis tem efeito semelhante. Vinte e um sujeitos resolveram um labirinto de papel e lápis enquanto usavam uma máscara que não tinha nenhum perfume ou tinha um aroma floral. A variável resposta é o tempo médio deles em 3 ensaios. • O experimento analisou o tempo médio sem perfume e o tempo médio com perfume para cada sujeito. Na tabela consta as diferenças dos tempos médios com perfume menos o tempo médio sem perfume.
  • 14. Teste de Hipótese Exemplo 2: -7,37 -10,48 14,30 -10,77 -3,14 -0,87 -24,57 24,97 4,1 8,7 16,17 -4,47 -4,4 2,94 -7,84 11,9 19,47 -17,24 8,6 -6,26 6,67 • O primeiro sujeito por exemplo foi 7,37 segundos mais rápido usando a máscara perfumada, logo a diferença é negativa. Como tempos mais curtos representam um desempenho melhor, difereças negativas mostram que o sujeito teve um melhor desempenho quando usou a máscara perfumada.
  • 15. Teste de Hipótese Comparação de Duas Populações ou Tratamentos – Proporção • Vimos o teste para a proporção, comparado com uma constante, um valor fixo. Agora veremos como comparar duas populações quando nos referimos à proporção. População Proporção Tamanho Proporção ou populacional da amostral Tratamento amostra 1 p1 n1 ˆ p1 2 p2 n2 ˆ p2 • Hipóteses a serem testadas: H 0: p1 p 2 H 1: p1 p 2 p1 p 2 0 H 1: p1 p 2 p1 p 2 0 H 1: p1 p 2 p1 p 2 0
  • 16. Teste de Hipótese Comparação de Duas Populações ou Tratamentos – Proporção • Estatística de teste: ˆ ˆ p1 p2 Zc ˆ ˆ ˆ ˆ p1 (1 p1 ) p2 (1 p2 ) n1 n2 • Rejeita-se H0 se: i) | Z c | z 2 (teste bilateral) ii) Z c z (teste unilateralà direita) iii) Z c z (teste unilateralà esquerda) i) ii) iii)
  • 17.
  • 18. Anova ANOVA com um fator  Vimos até agora comparações de médias com uma constante e comparações de médias de duas populações verificando se eles diferem ou não significativamente;  Porém, frequentemente existe a necessidade de comparar mais que duas médias, isto é comparação de várias populações, vários grupos.
  • 19. Anova Situação 1  Um estudo foi conduzido, no período de um ano, para acompanhar três grupos de alunos de Sistemas de Informação com excesso de peso.  No primeiro grupo, aplicou-se dieta, com redução no consumo de calorias.  No segundo, a prática de exercícios regularmente.  No terceiro, mantiveram-se os hábitos alimentares e o nível de atividade física.  A massa corpórea foi mensurada no início e no final do período. Como avaliar se há alguma evidência de que exista diferença na variação média da massa corpórea nessas três populações? Comparação de Vários Grupos!!
  • 20. Anova Comparando 3 populações Grupo Grupo Grupo A B C 1 , 1 2 , 2 3 , 3 X 1 , s12 X 2 , s22 X 3 , s32 Populações independentes e normalmente distribuídas.
  • 21. Anova Como Comparar as Médias? Teste z ou t duas a duas: 3 3! Para 3 amostras teremos: 2 3 testes 2!1! 6 6! Para 6 amostras teremos: 15 testes 2 2!4!
  • 22. Anova Problemas ... 1) A quantidade de testes “explode”, quando a quantidade de amostras aumenta. 2) A condução de múltiplos testes t para duas amostras, duas a duas, pode levar a uma conclusão incorreta! Suponha que 1 2 3 e = 0,05 em cada teste t. Então: p(conclusão correta em todos os testes) = (0,95)3 = 0,857 e p(rejeitar H0 em pelo menos um teste) = 1 - 0,857 = 0,143. Portanto, ao realizar múltiplos testes t, aumentamos a chance de cometer um Erro Tipo I !! 3) Uma vez que os testes são conduzidos com o mesmo conjunto de dados, eles não são mais todos independentes.
  • 23. Anova Deseja-se um teste para comparar as diversas médias, no qual a probabilidade de cometermos um Erro Tipo I seja igual a algum valor predeterminado . ANOVA
  • 24. Anova Conceitos  Estudos observacionais – observação de indivíduos ou objetos de interesse, mas não procura influenciar as respostas;  Experimentos – impõe tratamentos aos indivíduos ou objetos de interesse para observar suas respostas;  Fatores – variáveis explicativas, independentes, ou controláveis em um experimento que se deseja verificar seu efeito sob a variável de interesse observada;  Níveis – os diferentes valores que o fator pode assumir no experimento;  Tratamento – condição experimental específica aplicada aos sujeitos (combinação dos níveis com cada fator);  Plano – descreve a escolha de tratamentos e a maneira pela qual os sujeitos são alocados;
  • 25. Anova Conceitos  Aleatorização usa o acaso para alocar os ‘sujeitos’ aos tratamentos.  Aleatorização + Comparação evitam o vício, ou favoritismo sistemático Quanto mais ‘sujeitos’ pegamos mais fica sensível a diferença entre os tratamentos, ou seja, mais fácil de identificar quais as diferenças.
  • 26. Anova Conceitos - Exemplo  Um pesquisador está interessado em investigar o efeito de vários tipos de ração que diferem pela quantidade de potássio no aumento do peso de determinado tipo de animal.  Hipótese Científica: Verificar o efeito dos diferentes tipos de ração para engorda de animais;  Hipótese Estatística: Comparar as médias de ganho de peso obtido pelos animais submetidos aos diferentes tipos de ração;  Variável independente / Fator – tipo de ração  Níveis – diferentes tipos de ração (ex: tipo de ração A, tipo de ração B)
  • 27. Anova Conceitos – Exemplo 2  Estudo do efeito de quatro fertilizantes e três variedades de feijão quanto à sua produção.  Hipótese Científica: Verificar o efeito dos diferentes tipos de fertilizantes e diferentes tipos de feijão quanto à produção;  Hipótese Estatística: Comparar as médias de produção obtidas;  Variável independente / Fator – 1) tipo de fertilizante 2) tipo de feijão;  Níveis – 1) diferentes tipos de fertilizante (A, B, C e D); 2) diferentes tipos de feijão (alpha, beta, gama);  Tratamentos – (A, alpha), (A, beta), (A, gama), (B, alpha), (B, beta), (B, gama), (C, alpha), (C, beta), (C, gama), (D, alpha), (D, beta), (D, gama) (12)
  • 28. Anova Conceitos 1. Uma indústria de parafusos adquiriu 5 máquinas de uma determinada marca para produzir parafusos, e está interessada em realizar um experimento para investigar se as 5 máquinas são homogêneas com relação à resistência média dos parafusos por ela produzidos. 2. A indústria das máquinas acima está interessada em realizar um experimento para investigar se as máquinas produzidas por ela são homogêneas com relação à resistência média dos parafusos que estas máquinas vão produzir. Como a população das máquinas produzidas é muito grande, o pesquisador quer realizar o experimento com uma amostra de máquinas (5), mas as conclusões devem ser tomadas para toda a população.
  • 29. Anova Conceitos  No item 1 máquina é um efeito fixo e no item 2 é um efeito aleatório; Refere-se aos níveis Refere-se à população de níveis
  • 30. Anova Procedimento de aleatorização  Experimentos completamente aleatorizados  Tratamentos atribuídos aleatoriamente à todas as unidades experimentais (cada u.e. tem igual probabilidade de receber qqr um dos tratamentos)  Experimentos com restrição na aleatorização  As u.e. apresentam uma fonte de variabilidade que pode influenciar nos resultados de sua execução. (Blocos)
  • 31. Anova Tipos de Experimentos  Experimentos com uma única fonte de variação: ONEWAY (com um fator)  Exemplo: Comparar a produtividade de 4 novas variedades de feijão; Fonte de variação – variedades de feijão / Tratamentos: variedades A, B, C e D  Experimentos com duas ou mais fontes de variação: FATORIAIS (dois ou mais fatores)  Exemplo: Numa determinada indústria química deseja-se verificar qual a combinação de adubo e inseticida maximiza a produção de uma dada cultura. Fonte de variação: A-Adubos: A1,A2 e A3 ;  B-Inseticidas: B1 e B2 / Tratamentos: A1B1, A1B2, A2B1, A2B2, A3B1, A3B2 FATORES CRUZADOS
  • 32. Exemplo Um experimento foi conduzido com a finalidade de comparar os tempos de transmissão de dados de quatro servidores (A, B, C e D). Os dados abaixo referem-se ao tempo de transmissão de dados em milissegundos dos servidores. Servidores A B C D 64 78 75 55 72 91 93 66 68 97 78 49 77 82 71 64 56 85 63 70 95 77 76 68 Total 432 510 456 372 1770 Média 72 85 76 62 73.75
  • 33. Exemplo Desenho esquemático do tempo de transmissão de cada servidor  Existe uma forte suspeita de que há diferença entre os quatro servidores.  Distribuições assimétricas.  Valor discrepante.
  • 34. 1-2 A Análise de Variância Para descrever situações com apresentado neste exemplo, adota-se um modelo do tipo: y ij μi ε ij μ τ i ε ij i=1,2,...,4,   j=1,2,...,6 μi yij= é o j-ésimo tempo de transmissão do i-ésimo servidor ié média do i-ésimo servidor é uma constante para todas as observações (média geral); i é o efeito do i-ésimo servidor; ijé o erro aleatório(erros de medida, fatores não controláveis, diferenças entre as unidades experimentais, etc.). Objetivo: testar se existe diferenças nos tempos médias de transmissão entre a=4 servidores. Hipóteses: H0: 1= 2=...= 4 = Ha: i ᵥ para pelo menos um par (i,v) , (i≠v= 1, 2,..,4)
  • 35. 1-2 A Análise de Variância Em geral Tabela 1-2 Dados gerais de um experimento com um único fator Tratamentos Observações Totais Médias (níveis) 1 y11 y12 . . . y1r y1. y1 2 y21 y22 . . . y2r y2. y2 . . . . . . . . . . . . . . . . . . a ya1 ya2 . . . yar ya. ya 35
  • 36. Modelo estatístico (one-way): y ij μi ε ij μ τ i ε ij i=1,2,...,a,   j=1,2,...,r μi yij= é a j-ésima observação do i-ésimo tratamento; ié média do i-ésimo tratamento é uma constante para todas as observações (média geral); i é o efeito do i-ésimo tratamento; ijé o erro aleatório(erros de medida, fatores não controláveis, diferenças entre as unidades experimentais, etc.). Pressuposições: 1) os erros aleatórios são independentes; 2) os erros aleatórios são normalmente distribuídos; 3) os erros aleatórios tem média 0 (zero) e variância 2; 2 Ou, então: yij ~ N ( i; ) e independen tes 36
  • 37. 1-3 Análise de Variância Hipóteses: H0: 1= 2=...= a = Ha: i ᵥ para pelo menos um par (i,v) Equivalentemente Hipóteses: H0: 1= 2=...= a =0 Ha: i 0 para pelo menos um i 37