Caroline Godoy
Turma : Sistemas de Informação
Última aula
 Aula 1:
    Estimativa Pontual para a Média ;
Última aula
 Aula 1:
    Estimativa Pontual para a Média ;
    Teorema Central do Limite;




                2
  x~N       ;
                n
Última aula
  Aula 1:
     Estimativa Pontual para a Média ;
     Teorema Central do Limite;
     Distribuição amostral da média com variância
      conhecida;
                                Transformando xbarra para z
                                padronizado
Usando o teorema central
do limite:          2
           x~N    ;
                      n




                                                     Z ~ N (0;1)
Última aula
 Aula 1:
    Estimativa Pontual para a Média ;
    Teorema Central do Limite;
    Distribuição amostral da média com variância
     conhecida;
    Intervalo de confiança com variância conhecida;
Última aula
 Aula 1:
    Estimativa Pontual para a Média ;
    Teorema Central do Limite;
    Distribuição amostral da média com variância
     conhecida;
    Intervalo de confiança com variância conhecida;
    Determinação do tamanho da amostra


                                  Onde e é o erro determinado pelo
                                  pesquisador
Última aula
      Aula 1:
         Estimativa Pontual para a Média ;
         Teorema Central do Limite;
         Distribuição amostral da média com variância
          conhecida;
         Intervalo de confiança com variância conhecida;
         Determinação do tamanho da amostra
         Distribuição amostral da média e intervalo de confiança
          com variância desconhecida;
1º                              ~tn-1


                                                   E   t   /2
                                                                n
Estimação por ponto da proporção
 O estimador pontual para p (proporção) é definido
 como:
                         X
                     ˆ
                     p
                         n
 onde X é a característica considerada, n é o tamanho
  da amostra e X ~ bin(n; p) ;
 Utilizando o TCL, para n grande:

                          p(1 p)
                 ˆ
                 p ~ N p;
                             n
Estimação intervalar da proporção
 Então utilizando o intervalo já visto para a média,
  porém utilizando proporção tem-se:

                                   ˆ    ˆ
                                   p(1 p)
                     ˆ
          IC( p; ) : p z      /2
                                      n
Estimação intervalar da proporção
Determinação do tamanho da amostra
 Do intervalo,
                                            ˆ    ˆ
                                            p(1 p)
                         ˆ
              IC( p; ) : p z   /2
                                                            e
                                               n


 ou seja,                                     Não conheço => amostra
                                               piloto
              ˆ    ˆ
              p(1 p)               2        ˆ    ˆ
                                            p(1 p)
e    z   /2              n     z
                 n                     /2
                                              e2
Estimação intervalar da proporção
Determinação do tamanho da amostra
                              Valor
                              máximo


                                       2
                              z
                        n         /2
                                           0,25
                                  e
                            Pto, fornece um
                            valor de n maior
                            que o necessário
Estimação intervalar para amostras
não normais e grandes
 Utilizar a mesma teoria para dados normais devido ao
 Teorema central do limite:


                                  Sx
                    X    z   /2
                                   n
Metodologia e Condições
  Se o interesse é construir intervalos para a média
    populacional             de uma determinada característica de
    interesse:
Método                Condições
Use Distribuição      • Variância conhecida e distribuição da característica em estudo
Normal P. (Z)         de distribuição Normal
                      • Variância conhecida e n ≥ 30
Use a Distribuição t- • Variância desconhecida e distribuição da característica da
Student               população, Normal
                      • Variância desconhecida e n ≤ 30
Use Distribuição      • Distribuição não normal e com n grande
Normal P. (Z)

Use métodos não-      • População não normal e amostras pequenas
paramétricos
Como testar a normalidade?
 Faça um gráfico para analisar a assimetria de valores e
  valores atípicos;

 Para a maioria dos casos a distribuição t-Sudent pode
  ser utilizada para amostras maiores que 30 a menos
  que haja um valor atípico ou assimetria muito
  forte
Box plot
 Utilizado para verificar o comportamento da
  distribuição dos dados;
 Necessário: Mediana e Quantil 1 e Quantil 3

   Q(0,25): 1º Quartil;
   Q(0,50): Mediana;
   Q(0,75): 3º Quartil.                  50% das
                                        observações




                           x(1)    q1       q2        q3   x(n)
Box plot
       3
         dq
       2
              q3



dq   q3 q1    q2=mediana



              q3

       3
         dq
       2

                           *
Exercícios
Exercícios
Apresentação dos dados
• Portal Action – Software Livre de conexão R + Excel
Exercícios

        2
        0
        -2
        -4
        -6
        -8
Exercícios
 Para estimar o rendimento semanal de operários de
 construção de uma grande cidade, um sociólogo
 seleciona uma amostra aleatória de 75 operários. A
 média amostral é dada por 427 reais e o desvio padrão
 da amostra é 15 reais. Determine um intervalo de
 confiança para considerando coeficientes de
 confiança de 0,9 e 0,95;
Exercícios
 Para estimar o rendimento semanal de operários de
 construção de uma grande cidade, um sociólogo
 seleciona uma amostra aleatória de 75 operários. A
 média amostral é dada por 427 reais e o desvio padrão
 da amostra é 15 reais. Determine um intervalo de
 confiança para considerando coeficientes de
 confiança de 0,9 e 0,95;
Intervalo para a Variância
 Muitos processo exigem a estimação da variabilidade.
    Ex: controle de qualidade
 Partindo que
                  (n 1) S 2      2
                       2
                              ~ Xn 1
Intervalo para a Variância
                      Assimétrica
 Temos
Intervalo para a Variância
                                                2
 Como a distribuição é assimétrica o IC para       não é da
         2
 forma S      e e deve ser representado por:


                      (n 1) S 2
             P X 12        2
                                    2
                                   X2

               (n 1) S 2       2   (n 1) S 2
             P     2
                 X2                  X 12
Exercícios
 Um fabricante de esferas para rolamento desenvolveu
 um novo método de produção mais barato. Ele
 necessita de produtos mais baratos porém com
 qualidade consistente. (menor variab.). Para analisar a
 variabilidade do produto ele selecionou 15 esferas
 obtendo os seguintes diâmetros em mm.

29,8 29,8 29,6 29,8 29,9 30,0 29,9 29,9 30,0 29,7
  30,1 29,9 29,9 29,9 30,8
Conceitos
 Vimos que podemos tirar informações dos parâmetros
 de uma de uma população através de uma amostra,
 porém na maioria das vezes precisamos comparar esses
 valores com outros já pré estabelecidos;

 Para isso existem os testes de hipóteses que fornecem
 uma metodologia para verificar se os dados amostrais
 trazem evidências que apoiam ou não uma hipótese
 formulada.
Conceitos - Exemplo



Hipótese Científica:
H0: O novo medicamento não é melhor que o medicamento tradicional.
H1: O novo medicamento é melhor que o medicamento tradicional.
Conceitos – Exemplo cont.
                                                                     n



                                             Variável de interesse


Hipótese Estatística:
H0: p≤0,4 (O medicamento novo não é melhor que o tradicional)
H1: p>0,4 (O medicamento novo é melhor que o tradicional)
Conceitos – Exemplo cont.
• Regra de decisão:

Rejeita H0 se Y ≥ 9
Não rejeita H0 se Y < 9

• Testar uma hipótese estatística significa estabelecer uma
  regra que nos permita, com base na informação da amostra,
  decidir pela rejeição ou não de H0.

• Região de Rejeição ou Região Crítica
        RC = {9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20} : região crítica

        RCc = {0, 1, 2, 3, 4, 5, 6, 7, 8}: região de aceitação de H0
Conceitos – Exemplo cont.
• Na decisão pela rejeição ou não da hipótese nula pode-se
  cometer 2 tipos de erros:

 Decisão baseada              Situação na população
   na amostra           H0 Verdadeira          H0 Falsa

  Não Rejeitar H0      Decisão correta       Erro Tipo II

    Rejeitar H0           Erro Tipo I      Decisão correta

• Erro Tipo I: Dizer que o medicamento novo é melhor que o
  tradicional, quando na verdade não é;
• Erro Tipo II: Dizer que o medicamento novo não é melhor
  que o tradicional, quando na verdade é melhor.
Conceitos – Exemplo cont.
• Na decisão pela rejeição ou não da hipótese nula pode-se
  cometer 2 tipos de erros:

 Decisão baseada              Situação na população
   na amostra           H0 Verdadeira          H0 Falsa

  Não Rejeitar H0      Decisão correta       Erro Tipo II

    Rejeitar H0           Erro Tipo I      Decisão correta

• Erro Tipo I: Dizer que o medicamento novo é melhor que o
  tradicional, quando na verdade não é;
• Erro Tipo II: Dizer que o medicamento novo não é melhor
  que o tradicional, quando na verdade é melhor.
Probabilidades de erros
• O maior valor do erro tipo I é chamado de nível de
  significância de um teste (prob. máxima que aceitamos de
  ocorrer o risco do erro), denotado por:

     P(erro tipo I )     P(rejeitar H 0 | H0 é verdadeira)
• A probabilidade de ocorrer o erro tipo II é denotada por:

     P(erro tipo II )     P(não rejeitar H 0 | H0 é falsa)
• Em geral, o erro tipo I é mais sério que o erro tipo II,
  portanto escolhe-se controlar      e escolhe-se um teste tal
  que seja o menor possível.
Próxima aula
• Teste de hipóteses

Aula 2 - Sistemas de informação

  • 1.
    Caroline Godoy Turma :Sistemas de Informação
  • 2.
    Última aula  Aula1:  Estimativa Pontual para a Média ;
  • 3.
    Última aula  Aula1:  Estimativa Pontual para a Média ;  Teorema Central do Limite; 2 x~N ; n
  • 4.
    Última aula Aula 1:  Estimativa Pontual para a Média ;  Teorema Central do Limite;  Distribuição amostral da média com variância conhecida; Transformando xbarra para z padronizado Usando o teorema central do limite: 2 x~N ; n Z ~ N (0;1)
  • 5.
    Última aula  Aula1:  Estimativa Pontual para a Média ;  Teorema Central do Limite;  Distribuição amostral da média com variância conhecida;  Intervalo de confiança com variância conhecida;
  • 6.
    Última aula  Aula1:  Estimativa Pontual para a Média ;  Teorema Central do Limite;  Distribuição amostral da média com variância conhecida;  Intervalo de confiança com variância conhecida;  Determinação do tamanho da amostra Onde e é o erro determinado pelo pesquisador
  • 7.
    Última aula  Aula 1:  Estimativa Pontual para a Média ;  Teorema Central do Limite;  Distribuição amostral da média com variância conhecida;  Intervalo de confiança com variância conhecida;  Determinação do tamanho da amostra  Distribuição amostral da média e intervalo de confiança com variância desconhecida; 1º ~tn-1 E t /2 n
  • 8.
    Estimação por pontoda proporção  O estimador pontual para p (proporção) é definido como: X ˆ p n  onde X é a característica considerada, n é o tamanho da amostra e X ~ bin(n; p) ;  Utilizando o TCL, para n grande: p(1 p) ˆ p ~ N p; n
  • 9.
    Estimação intervalar daproporção  Então utilizando o intervalo já visto para a média, porém utilizando proporção tem-se: ˆ ˆ p(1 p) ˆ IC( p; ) : p z /2 n
  • 10.
    Estimação intervalar daproporção Determinação do tamanho da amostra  Do intervalo, ˆ ˆ p(1 p) ˆ IC( p; ) : p z /2 e n  ou seja, Não conheço => amostra piloto ˆ ˆ p(1 p) 2 ˆ ˆ p(1 p) e z /2 n z n /2 e2
  • 11.
    Estimação intervalar daproporção Determinação do tamanho da amostra Valor máximo 2 z n /2 0,25 e Pto, fornece um valor de n maior que o necessário
  • 12.
    Estimação intervalar paraamostras não normais e grandes  Utilizar a mesma teoria para dados normais devido ao Teorema central do limite: Sx X z /2 n
  • 13.
    Metodologia e Condições  Se o interesse é construir intervalos para a média populacional de uma determinada característica de interesse: Método Condições Use Distribuição • Variância conhecida e distribuição da característica em estudo Normal P. (Z) de distribuição Normal • Variância conhecida e n ≥ 30 Use a Distribuição t- • Variância desconhecida e distribuição da característica da Student população, Normal • Variância desconhecida e n ≤ 30 Use Distribuição • Distribuição não normal e com n grande Normal P. (Z) Use métodos não- • População não normal e amostras pequenas paramétricos
  • 14.
    Como testar anormalidade?  Faça um gráfico para analisar a assimetria de valores e valores atípicos;  Para a maioria dos casos a distribuição t-Sudent pode ser utilizada para amostras maiores que 30 a menos que haja um valor atípico ou assimetria muito forte
  • 15.
    Box plot  Utilizadopara verificar o comportamento da distribuição dos dados;  Necessário: Mediana e Quantil 1 e Quantil 3  Q(0,25): 1º Quartil;  Q(0,50): Mediana;  Q(0,75): 3º Quartil. 50% das observações x(1) q1 q2 q3 x(n)
  • 16.
    Box plot 3 dq 2 q3 dq q3 q1 q2=mediana q3 3 dq 2 *
  • 17.
  • 18.
  • 19.
    Apresentação dos dados •Portal Action – Software Livre de conexão R + Excel
  • 20.
    Exercícios 2 0 -2 -4 -6 -8
  • 21.
    Exercícios  Para estimaro rendimento semanal de operários de construção de uma grande cidade, um sociólogo seleciona uma amostra aleatória de 75 operários. A média amostral é dada por 427 reais e o desvio padrão da amostra é 15 reais. Determine um intervalo de confiança para considerando coeficientes de confiança de 0,9 e 0,95;
  • 22.
    Exercícios  Para estimaro rendimento semanal de operários de construção de uma grande cidade, um sociólogo seleciona uma amostra aleatória de 75 operários. A média amostral é dada por 427 reais e o desvio padrão da amostra é 15 reais. Determine um intervalo de confiança para considerando coeficientes de confiança de 0,9 e 0,95;
  • 23.
    Intervalo para aVariância  Muitos processo exigem a estimação da variabilidade.  Ex: controle de qualidade  Partindo que (n 1) S 2 2 2 ~ Xn 1
  • 24.
    Intervalo para aVariância Assimétrica  Temos
  • 25.
    Intervalo para aVariância 2  Como a distribuição é assimétrica o IC para não é da 2 forma S e e deve ser representado por: (n 1) S 2 P X 12 2 2 X2 (n 1) S 2 2 (n 1) S 2 P 2 X2 X 12
  • 26.
    Exercícios  Um fabricantede esferas para rolamento desenvolveu um novo método de produção mais barato. Ele necessita de produtos mais baratos porém com qualidade consistente. (menor variab.). Para analisar a variabilidade do produto ele selecionou 15 esferas obtendo os seguintes diâmetros em mm. 29,8 29,8 29,6 29,8 29,9 30,0 29,9 29,9 30,0 29,7 30,1 29,9 29,9 29,9 30,8
  • 28.
    Conceitos  Vimos quepodemos tirar informações dos parâmetros de uma de uma população através de uma amostra, porém na maioria das vezes precisamos comparar esses valores com outros já pré estabelecidos;  Para isso existem os testes de hipóteses que fornecem uma metodologia para verificar se os dados amostrais trazem evidências que apoiam ou não uma hipótese formulada.
  • 29.
    Conceitos - Exemplo HipóteseCientífica: H0: O novo medicamento não é melhor que o medicamento tradicional. H1: O novo medicamento é melhor que o medicamento tradicional.
  • 30.
    Conceitos – Exemplocont. n Variável de interesse Hipótese Estatística: H0: p≤0,4 (O medicamento novo não é melhor que o tradicional) H1: p>0,4 (O medicamento novo é melhor que o tradicional)
  • 31.
    Conceitos – Exemplocont. • Regra de decisão: Rejeita H0 se Y ≥ 9 Não rejeita H0 se Y < 9 • Testar uma hipótese estatística significa estabelecer uma regra que nos permita, com base na informação da amostra, decidir pela rejeição ou não de H0. • Região de Rejeição ou Região Crítica RC = {9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20} : região crítica RCc = {0, 1, 2, 3, 4, 5, 6, 7, 8}: região de aceitação de H0
  • 32.
    Conceitos – Exemplocont. • Na decisão pela rejeição ou não da hipótese nula pode-se cometer 2 tipos de erros: Decisão baseada Situação na população na amostra H0 Verdadeira H0 Falsa Não Rejeitar H0 Decisão correta Erro Tipo II Rejeitar H0 Erro Tipo I Decisão correta • Erro Tipo I: Dizer que o medicamento novo é melhor que o tradicional, quando na verdade não é; • Erro Tipo II: Dizer que o medicamento novo não é melhor que o tradicional, quando na verdade é melhor.
  • 33.
    Conceitos – Exemplocont. • Na decisão pela rejeição ou não da hipótese nula pode-se cometer 2 tipos de erros: Decisão baseada Situação na população na amostra H0 Verdadeira H0 Falsa Não Rejeitar H0 Decisão correta Erro Tipo II Rejeitar H0 Erro Tipo I Decisão correta • Erro Tipo I: Dizer que o medicamento novo é melhor que o tradicional, quando na verdade não é; • Erro Tipo II: Dizer que o medicamento novo não é melhor que o tradicional, quando na verdade é melhor.
  • 34.
    Probabilidades de erros •O maior valor do erro tipo I é chamado de nível de significância de um teste (prob. máxima que aceitamos de ocorrer o risco do erro), denotado por: P(erro tipo I ) P(rejeitar H 0 | H0 é verdadeira) • A probabilidade de ocorrer o erro tipo II é denotada por: P(erro tipo II ) P(não rejeitar H 0 | H0 é falsa) • Em geral, o erro tipo I é mais sério que o erro tipo II, portanto escolhe-se controlar e escolhe-se um teste tal que seja o menor possível.
  • 35.