Iremos começar a nossa resolução pelo item 59 e 54




A covariância entre as variáveis X e Y é dada por: Cov( X, Y ) = E( XY) − E( X)E( Y ) , onde E(.) é a média ou
esperança.

Mas E( A ) = ∑ , assim: Cov( X, Y ) = E( XY) − E( X)E( Y ) = ∑
              A                                                XY ∑ X ∑ Y
                                                                 −
                n                                                    n        n      n


Substituindo valores dados no enunciado: Cov( X, Y ) = ∑
                                                         XY ∑ X ∑ Y 988 682 341
                                                           −       =   −        = 0,89
                                                                    n         n     n           341   341 341

0,89 > 0,85 – ALTERNATIVA CERTA




                                                                   COV( X, Y )
A correlação entre as variáveis X e Y é dada por: ρ =                             , onde SX e SY são os desvios padrão de
                                                                    S S
                                                                     X Y
X e Y, respectivamente.

Mas a variância , que é o quadrado do desvio padrão, é dada por: S2 = E( X 2 ) − (E( X))2
                                                                                        X

                COV( X, Y )            E( XY) − E( X)E( Y )
Assim: ρ =                  =
                              E( X 2 ) − (E( X))2 E( Y 2 ) − (E( Y ))2
                 S S
                  X Y

                    ∑ XY − ∑ X ∑ Y                                         ∑ X∑ Y
                                                               ∑ XY −
 ρ =                 n         n    n               =                        n
       ∑     (∑ X ) 
           X2            ∑
                           2
                                 (∑ Y ) 
                                   Y2
                                                2     (∑            X )2             (∑ Y )2
          −                 −              ∑ X2 −                       ∑ Y2 −
       n     n           n     n                     n                                  n
                  682 .341
           988 −
                     341                   306     306
ρ ==                               =             =     = 0,9
     1704 −
            (682 ) 681 − (341)
                  2             2      340 340 340
              341            341

0,9 > 0,85 – ALTERNATIVA CERTA

ATÉ AQUI NADA DE MAIS...TUDO SOB O CONTROLE!!!!!

AGORA QUE VEM A PEGADINHA!!!
R 2 = ρ2 → na Regressão Simples, o Coeficiente de determinação
                                             é o quadrado do índice de correlação



Assim R2 = 0,92 = 0,81

e, pela definição de Coeficiente de Explicação, 81% da variação de Y é explicada pela variação de X ou
pelo modelo de regressão.

        ALTERNATIVA CERTA                                    SERÁ????
Releia o enunciado. Ele informa que foi obtida uma relação linear do tipo YK = β XK + εK.

Aparentemente, e seria o raciocínio correto pela forma que foi colocado no enunciado, foi feito uma
modelagem através de uma regressão simples YK = γ + β XK + εK e pela particularidade dos dados
amostrais o valor do intercepto (γ) foi obtido como zero.

Se isso fosse o correto a alternativa do item 53 seria certa.

Mas vamos calcular o valor de γ e β através dos dados amostrais para confirmar a nossa afirmação.

              Cov( X, Y )   S
        β=                =ρ Y
                S2          S
                  X           X

Assim
        ∑ Y 2 −  (∑ Y ) 
                           2
                                             (∑ Y )2
          n
                
                    n
                         
                         
                                    ∑ Y2 −
β=ρ                            =ρ              n

        ∑ X2 −  (∑ X ) 
                          2                  (∑ X)2
                                  ∑ X2 −
          n         n                        n


                                                   340
Como já calculado anteriormente: β = ρ                   = ρ = 0,9
                                                   340

                                     __      __             __       __
e o valor do intercepto: γ = Y − β X , onde Y e X são as médias dos dados amostrais Y e X,
respectivamente.

γ = ∑ −β ∑ =
      Y    X 341       682
     n    n  341
                 − 0,9
                       341
                           = 1 − 1,8 = −0,8                ALERTA: É DIFERENTE DE ZERO
Daí conclui-se que o enunciado estava tratando do modelo da regressão passando na origem, isso é,
forçou-se um modelo sem intercepto, mesmo esse não sendo a melhor regressão para os dados amostrais.

Neste caso algumas formulas e propriedades não são atendidas.

Retornando ao item 53:

R2 = 0,92 = 0,81, essa formula não muda, o valor do coeficiente de explicação é 81%.

O problema e que para este tipo de modelagem de regressão o coeficiente de explicação não representa
mais a percentagem da variação dependente que é explicada pelo modelo.

Assim o enunciado 53 é falso não pelo valor de R2 mas sim pela afirmação final que este valor indica que
81% de Y são explicados por X.

        ALTERNATIVA ERRADA




Primeiro ponto: se a distribuição dos erros aleatórios é normal, assim a estimativa de máxima
verossimilhança é igual a estimativa através do método dos mínimos quadrados.

Assim

     Cov( X, Y )   S
β=               =ρ Y    = 0,9, conforme calculado anteriormente.
       S2          S
         X           X
0,9 > 0,6 – ALTERNATIVA ERRADA                      SERÁ???? Lembre-se da pegadinha
O modelo é da regressão passando na origem, assim o coeficiente angular não é calculado pela formula
acima. A fórmula é:

β=   ∑ XY
     ∑ X2

Assim β = ∑
            XY   988
               =     = 0,58
          ∑ X 2 1704

Como 0,55 < 0,58 < 0,6 ALTERNATIVA CERTA
Bem como o ponto médio sempre pertence a regressão linear então o enunciado acima esta correto.

NÃO!!! Lembre-se da pegadinha
Só podemos garantir que o ponto médio pertença a linha de regressão para o caso do modelo tradicional,
isso é, com intercepto, mesmo para o caso que fazendo o modelo o intercepto dê zero.

Acontece que nós forçamos dados nos quais o intercepto não daria zero, vide cálculos anteriores, para ter
uma linha de regressão com intercepto nulo. Nesta caso não podemos garantir que o ponto médio pertença
a linha de regressão.
                  __                               __
Para se confirmar Y = ∑ =                         β X = 0,58 ∑ = 0,58
                       Y 341                                   X      682
                             =1                                           = 1,16 ≠ 1
                               n     341                      n       341

        __     __
Assim Y ≠ β X – ALTERNATIVA ERRADA



Bem vamos recordar, para o caso da Regressão simples tradicional:

                                                       ∧
                                                     ε2
Para se estimar a variância do erro aleatório: σ2 = ∑ , onde ∑ ε 2 é a soma quadrática dos resíduos.
                                                            (n - 2)



Para a Regressão simples passando na origem as fórmulas são diferentes:

                                                       ∧
                                                     ε2
Para se estimar a variância do erro aleatório: σ2 = ∑ , onde ∑ ε 2 é a soma quadrática dos resíduos
                                                            (n - 1)


Como obter          ∑ ε 2 ?????

Na Regressão Simples tradicional: ∑ ε 2 = ∑ y 2 − β2 ∑ x 2 ,usando o conceito de SQRes = SQT – SQReg.

Na Regressão Simples passando na origem: ∑ ε 2 = ∑ Y 2 − β2 ∑ X2

(deduza esta formula fazendo   ∑ ε 2 = ∑ ( Y − βX)2 substituindo o valor de β)

Assim
                                                               ∧
                 (∑ XY)2             988 2                            ∑ ε 2 = 108,14 = 0,318
∑ ε2 = ∑ Y 2 −             = 681 −         = 108,14     e     σ2 =
                  ∑ X2               1704                             (n - 1)    340


0,318 > 0,1 – ALTERNATIVA ERRADA
Bem vamos recordar, para o caso da Regressão simples tradicional:

                                                      σ2         σ2
A variância do estimador β é dada por σ2 =                    =        , onde a variância é o quadrado do desvio
                                             β          __      ∑ x2
                                                 ∑ ( X - X )2      i
                                                      i
padrão (erro padrão do estimador)


Para a Regressão simples passando na origem as fórmulas são diferentes:

                                           σ2
A variância do estimador β é dada por σ2 =    , onde a variância é o quadrado do desvio padrão (erro
                                       β ∑ X2
                                                      i
padrão do estimador)


Então

        σ2    0,318
σ2 =        =         = 1,87 10-4
 β     ∑X 2 1704
          i

                                              σ2          0,318
Erro padrão = Desvio padrão = σ2 =                =
                                      β      ∑ X2         1704
                                                i
Não precisa fazer esta ultima conta, basta ver que 1,87 10-4 > 10-4

                  σ2       0,318
Assim     σ2 =        =             > 0,01
           β     ∑ X2      1704
                    i

Bem acho que não errei em conta, já verifiquei MIL VEZES.

Se minhas contas estiverem certas. Aqui até a banca se enrolou, foi colocar pegadinha demais e se
enrolou.

Pois o gabarito oficial é CERTO

Porém erro padrão > 0,01 – ALTERNATIVA ERRADA
Por fim , esta é mais tranqüila

A regressão inicial do enunciado β = ∑
                                       XY
                                     ∑ X2

A regressão invertida α = ∑
                            YX ∑ XY
                              =
                          ∑ Y2 ∑ Y2

               1
Portanto α ≠     – ALTERNATIVA ERRADA
               β




Bem espero ter contribuído para seu estudo.

Continue Estudando.

Até a próxima.

Prof. Jorge Cerqueira

profjorgecerqueira@gmail.com

Anac 2012 Resolução 53-60

  • 1.
    Iremos começar anossa resolução pelo item 59 e 54 A covariância entre as variáveis X e Y é dada por: Cov( X, Y ) = E( XY) − E( X)E( Y ) , onde E(.) é a média ou esperança. Mas E( A ) = ∑ , assim: Cov( X, Y ) = E( XY) − E( X)E( Y ) = ∑ A XY ∑ X ∑ Y − n n n n Substituindo valores dados no enunciado: Cov( X, Y ) = ∑ XY ∑ X ∑ Y 988 682 341 − = − = 0,89 n n n 341 341 341 0,89 > 0,85 – ALTERNATIVA CERTA COV( X, Y ) A correlação entre as variáveis X e Y é dada por: ρ = , onde SX e SY são os desvios padrão de S S X Y X e Y, respectivamente. Mas a variância , que é o quadrado do desvio padrão, é dada por: S2 = E( X 2 ) − (E( X))2 X COV( X, Y ) E( XY) − E( X)E( Y ) Assim: ρ = = E( X 2 ) − (E( X))2 E( Y 2 ) − (E( Y ))2 S S X Y ∑ XY − ∑ X ∑ Y ∑ X∑ Y ∑ XY − ρ = n n n = n ∑  (∑ X )  X2 ∑ 2  (∑ Y )  Y2 2 (∑ X )2 (∑ Y )2 −  −  ∑ X2 − ∑ Y2 − n  n  n  n  n n 682 .341 988 − 341 306 306 ρ == = = = 0,9 1704 − (682 ) 681 − (341) 2 2 340 340 340 341 341 0,9 > 0,85 – ALTERNATIVA CERTA ATÉ AQUI NADA DE MAIS...TUDO SOB O CONTROLE!!!!! AGORA QUE VEM A PEGADINHA!!!
  • 2.
    R 2 =ρ2 → na Regressão Simples, o Coeficiente de determinação é o quadrado do índice de correlação Assim R2 = 0,92 = 0,81 e, pela definição de Coeficiente de Explicação, 81% da variação de Y é explicada pela variação de X ou pelo modelo de regressão. ALTERNATIVA CERTA SERÁ???? Releia o enunciado. Ele informa que foi obtida uma relação linear do tipo YK = β XK + εK. Aparentemente, e seria o raciocínio correto pela forma que foi colocado no enunciado, foi feito uma modelagem através de uma regressão simples YK = γ + β XK + εK e pela particularidade dos dados amostrais o valor do intercepto (γ) foi obtido como zero. Se isso fosse o correto a alternativa do item 53 seria certa. Mas vamos calcular o valor de γ e β através dos dados amostrais para confirmar a nossa afirmação. Cov( X, Y ) S β= =ρ Y S2 S X X Assim ∑ Y 2 −  (∑ Y )  2 (∑ Y )2 n   n   ∑ Y2 − β=ρ =ρ n ∑ X2 −  (∑ X )  2 (∑ X)2   ∑ X2 − n  n  n 340 Como já calculado anteriormente: β = ρ = ρ = 0,9 340 __ __ __ __ e o valor do intercepto: γ = Y − β X , onde Y e X são as médias dos dados amostrais Y e X, respectivamente. γ = ∑ −β ∑ = Y X 341 682 n n 341 − 0,9 341 = 1 − 1,8 = −0,8 ALERTA: É DIFERENTE DE ZERO
  • 3.
    Daí conclui-se queo enunciado estava tratando do modelo da regressão passando na origem, isso é, forçou-se um modelo sem intercepto, mesmo esse não sendo a melhor regressão para os dados amostrais. Neste caso algumas formulas e propriedades não são atendidas. Retornando ao item 53: R2 = 0,92 = 0,81, essa formula não muda, o valor do coeficiente de explicação é 81%. O problema e que para este tipo de modelagem de regressão o coeficiente de explicação não representa mais a percentagem da variação dependente que é explicada pelo modelo. Assim o enunciado 53 é falso não pelo valor de R2 mas sim pela afirmação final que este valor indica que 81% de Y são explicados por X. ALTERNATIVA ERRADA Primeiro ponto: se a distribuição dos erros aleatórios é normal, assim a estimativa de máxima verossimilhança é igual a estimativa através do método dos mínimos quadrados. Assim Cov( X, Y ) S β= =ρ Y = 0,9, conforme calculado anteriormente. S2 S X X 0,9 > 0,6 – ALTERNATIVA ERRADA SERÁ???? Lembre-se da pegadinha O modelo é da regressão passando na origem, assim o coeficiente angular não é calculado pela formula acima. A fórmula é: β= ∑ XY ∑ X2 Assim β = ∑ XY 988 = = 0,58 ∑ X 2 1704 Como 0,55 < 0,58 < 0,6 ALTERNATIVA CERTA
  • 4.
    Bem como oponto médio sempre pertence a regressão linear então o enunciado acima esta correto. NÃO!!! Lembre-se da pegadinha Só podemos garantir que o ponto médio pertença a linha de regressão para o caso do modelo tradicional, isso é, com intercepto, mesmo para o caso que fazendo o modelo o intercepto dê zero. Acontece que nós forçamos dados nos quais o intercepto não daria zero, vide cálculos anteriores, para ter uma linha de regressão com intercepto nulo. Nesta caso não podemos garantir que o ponto médio pertença a linha de regressão. __ __ Para se confirmar Y = ∑ = β X = 0,58 ∑ = 0,58 Y 341 X 682 =1 = 1,16 ≠ 1 n 341 n 341 __ __ Assim Y ≠ β X – ALTERNATIVA ERRADA Bem vamos recordar, para o caso da Regressão simples tradicional: ∧ ε2 Para se estimar a variância do erro aleatório: σ2 = ∑ , onde ∑ ε 2 é a soma quadrática dos resíduos. (n - 2) Para a Regressão simples passando na origem as fórmulas são diferentes: ∧ ε2 Para se estimar a variância do erro aleatório: σ2 = ∑ , onde ∑ ε 2 é a soma quadrática dos resíduos (n - 1) Como obter ∑ ε 2 ????? Na Regressão Simples tradicional: ∑ ε 2 = ∑ y 2 − β2 ∑ x 2 ,usando o conceito de SQRes = SQT – SQReg. Na Regressão Simples passando na origem: ∑ ε 2 = ∑ Y 2 − β2 ∑ X2 (deduza esta formula fazendo ∑ ε 2 = ∑ ( Y − βX)2 substituindo o valor de β) Assim ∧ (∑ XY)2 988 2 ∑ ε 2 = 108,14 = 0,318 ∑ ε2 = ∑ Y 2 − = 681 − = 108,14 e σ2 = ∑ X2 1704 (n - 1) 340 0,318 > 0,1 – ALTERNATIVA ERRADA
  • 5.
    Bem vamos recordar,para o caso da Regressão simples tradicional: σ2 σ2 A variância do estimador β é dada por σ2 = = , onde a variância é o quadrado do desvio β __ ∑ x2 ∑ ( X - X )2 i i padrão (erro padrão do estimador) Para a Regressão simples passando na origem as fórmulas são diferentes: σ2 A variância do estimador β é dada por σ2 = , onde a variância é o quadrado do desvio padrão (erro β ∑ X2 i padrão do estimador) Então σ2 0,318 σ2 = = = 1,87 10-4 β ∑X 2 1704 i σ2 0,318 Erro padrão = Desvio padrão = σ2 = = β ∑ X2 1704 i Não precisa fazer esta ultima conta, basta ver que 1,87 10-4 > 10-4 σ2 0,318 Assim σ2 = = > 0,01 β ∑ X2 1704 i Bem acho que não errei em conta, já verifiquei MIL VEZES. Se minhas contas estiverem certas. Aqui até a banca se enrolou, foi colocar pegadinha demais e se enrolou. Pois o gabarito oficial é CERTO Porém erro padrão > 0,01 – ALTERNATIVA ERRADA
  • 6.
    Por fim ,esta é mais tranqüila A regressão inicial do enunciado β = ∑ XY ∑ X2 A regressão invertida α = ∑ YX ∑ XY = ∑ Y2 ∑ Y2 1 Portanto α ≠ – ALTERNATIVA ERRADA β Bem espero ter contribuído para seu estudo. Continue Estudando. Até a próxima. Prof. Jorge Cerqueira profjorgecerqueira@gmail.com