Econometria
Tópico 3 – Regressão Múltipla
O Problema da Inferência
Ricardo Bruno N. dos Santos
Professor Adjunto da Faculdade de Economia
e do PPGE (Economia) UFPA
Lembre-se que os vídeos necessários para o
acompanhamento dessa apresentação são todos os
vídeos que iniciam por 05, e encontram-se dentro da
pasta Vídeos no mediafire.
Link do mediafire:
http://www.mediafire.com/?q1dbpxh1b4uxo
No Slideshare:
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
O que devemos ter em mente?
- Normalidade dos resíduos, portanto, devemos
considerar:
𝑢𝑖~𝑁(0, 𝜎2)
- Deve-se levar em conta que nossos estimadores são
os Melhores Estimadores Lineares Não Tendenciosos (MELNT)
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
A estatística t para avaliar os estimadores ’s continua a
mesma, ou seja, para avaliar a significância estatística
individual dos estimadores devemos considerar que:
𝑡 =
𝛽1 − 𝛽1
𝑒𝑝 𝛽1
𝑡 =
𝛽2 − 𝛽2
𝑒𝑝 𝛽2
𝑡 =
𝛽3 − 𝛽3
𝑒𝑝 𝛽3
Nesse caso, segue distribuição t com n-3 graus de
liberdade.
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
O teste de hipótese na Regressão Múltipla
Como já observado na regressão simples, o teste de
hipótese anteriormente aplicado é semelhante a múltipla, por
esse motivo, não iremos nos deter nesse tópico novamente,
analisaremos apenas o modelo já estimado na seção anterior
sobre mortalidade infantil, e a partir deste modelo iremos
tecer alguns comentários sobre a análise da significância e da
construção do intervalo de confiança.
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
O modelo estimado para o caso da mortalidade infantil
foi:
𝑀𝐼𝑖 = 263,6416 − 0,0056𝑃𝑁𝐵𝑝𝑐𝑖 − 2,2316𝑇𝐴𝐹𝑖
𝑒𝑝 = 11,5932 0,0019 0,2099
𝑡 = 22,7411 −2,8187 −10,6293
𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0,00000 0,0065 0,000000
𝑅2
= 0,7077 𝑅2
= 0,6981
Podemos estabelecer que:
𝐻0: 𝛽2 = 0 𝑒 𝐻1: 𝛽2 ≠ 0
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
A interpretação literal da hipótese nula (H0) seria a de que,
mantida constante a Taxa de Alfabetização Feminina, X2 (PNBpc)
NÃO EXERCE influência (linear) sobre Y ( Mortalidade Infantil). Para
testar tal hipótese, usamos o teste t, onde:
𝑡 = −
0,0056
0,0020
= −2,8187
Podemos então achar o valor tabelado para comparar se o
valor do t calculado de -2,8187 é, em módulo, maior que o valor
tabelado, para encontrarmos o valor tabelado basta consultarmos
a tabela t para 𝛼 = 5% e com 61 graus de liberdade, haja vista
que o número de observações utilizadas é de 64.
Com (n-k) graus de liberdade, sendo k o número de
variáveis, teremos: (64-3=61 gl) o valor tabelado portanto é de 2
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
Assim, podemos verificar que o valor calculado é maior
que o tabelado, nos direcionando a rejeição da hipótese nula.
Logo a conclusão é de que é significativo o efeito do PNBpc na
Mortalidade Infantil. A seguir podemos visualizar o gráfico
para essa situação:
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
Outro importante elemento a ser considerado é o intervalo
de confiança do modelo, com os resultados fornecidos já é
possível construí-lo com base na seguinte fórmula:
𝛽2 − 𝑡 𝛼
2
𝑒𝑝 𝛽2 ≤ 𝛽2 ≤ 𝛽2 + 𝑡 𝛼
2
𝑒𝑝( 𝛽2)
Com os valores informados verifica-se que:
−0,0056 − 2 0,002 ≤ 𝛽2 ≤ −0,0056 + 2 0,002
−0,0096 ≤ 𝛽2 ≤ −0,0016
Com isso, o intervalo acima incluirá o verdadeiro valor do
coeficiente 𝛽2 com um nível de confiança de 95%. Dessa forma, se
100 amostras de tamanho 64 forem selecionadas e 100 intervalos
de confiança como o de cima forem formulados, esperamos que
em 95 deles incluam o verdadeiro parâmetro populacional 𝛽2.
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
No tópico anterior foi calculado o teste de
Normalidade, e verificou-se que os resíduos atenderam a
hipótese de normalidade.
O teste de significância geral
Já foi retratado que devemos testar se os estimadores
𝛽2 e 𝛽3 são em conjunto iguais a zero, ou seja, devemos
verificar se 𝛽2 = 𝛽3 = 0, para realizar tal procedimento,
deveremos recorrer a estatística F.
Quando abordamos a regressão linear simples, fizemos
uma análise sobre a estatística F, sua forma de interpretação e
o cálculo de sua estatística a partir da tabela da ANOVA.
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
Porém ficou claro que em modelos simples a medida da
F não possui muito sentido, haja vista que temos apenas uma
variável independente, no caso da regressão múltipla,
teremos duas ou mais variáveis independentes no modelo, o
que deixa o teste F com maior sentido.
Para tanto, vamos recorres a Tabela da ANOVA,
lembrando que essa tabela é composta pela Soma de
Quadrados, que para o modelo múltiplo foi verificado nas
aulas anteriores.
Assim:
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
𝑦𝑖
2
= 𝛽2 𝑦𝑖 𝑥2𝑖 + 𝛽3 𝑦𝑖 𝑥3𝑖 + 𝑢𝑖
2
𝑆𝑄𝑇 = 𝑆𝑄𝐸 + 𝑆𝑄𝑅
Considerando a hipótese de normalidade temos:
𝐹 =
𝛽2 𝑦𝑖 𝑥2𝑖 + 𝛽3 𝑦𝑖 𝑥3𝑖
2
𝑢𝑖
2
𝑛 − 3
=
𝑆𝑄𝐸/𝑔𝑙
𝑆𝑄𝑅/𝑔𝑙
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
Assim a nossa tabela da ANOVA é composta por:
No nosso exemplo temos:
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
Como a partir dos dados da regressão podemos
encontrar toda a estrutura da ANOVA?
Na verdade a regressão solta dois valores pelos quais
podemos encontrar todos os dados da ANOVA, são a SQR e o
R2.
Vejamos no resultado do modelo de Mortalidade
Infantil
Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaDevemos lembrar que:
𝑅2 = 1 −
𝑆𝑄𝑅
𝑆𝑄𝑇
E que:
𝑆𝑄𝑇 = 𝑆𝑄𝐸 + 𝑆𝑄𝑅
Se temos 𝑅2 e SQR podemos concluir então que:
𝑆𝑄𝑇 =
𝑆𝑄𝑅
1−𝑅2 logo: 𝑆𝑄𝑇 =
106.315,6
1−0,707665
= 363.677,3
𝑆𝑄𝐸 = 363.677,3 − 106.315,6 = 257.361,7
Considerando: (n-k)=61 e k-1=2 temos
Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência
𝐹 =
257.361,7
2
106.315,6
61
=
128.680,8
1.742,879
= 73,8324
Portanto, apenas com duas informações é possível
encontrar todos os valores da tabela da ANOVA.
Considerando então um modelo com k variáveis:
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + ⋯ + 𝛽 𝑘 𝑋 𝑘𝑖
Formula-se a hipótese:
𝐻0: 𝛽2 = 𝛽3 = ⋯ = 𝛽 𝑘 = 0
Considerando os resultados da F do modelo da
mortalidade infantil, rejeita-se a hipótese nula, conclui-se que
pelo menos um dos estimadores é diferente de zero.
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaA importante relação entre o 𝑹 𝟐 e a estatística F
Verificamos que:
𝐹 =
𝑛 − 𝑘
𝑘 − 1
×
𝑆𝑄𝐸
𝑆𝑄𝑅
=
𝑛 − 𝑘
𝑘 − 1
×
𝑆𝑄𝐸
𝑆𝑄𝑇 − 𝑆𝑄𝐸
=
𝑛 − 𝑘
𝑘 − 1
×
𝑆𝑄𝐸/𝑆𝑄𝑇
1 −
𝑆𝑄𝐸
𝑆𝑄𝑇
=
𝑛 − 𝑘
𝑘 − 1
×
𝑅2
1 − 𝑅2
=
𝑅2
𝑘 − 1
1 − 𝑅2
𝑛 − 𝑘
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaOu seja, para realizar a estatística F, basta que
tenhamos o valor do R2.
Dessa forma, podemos encontrar a tabela ANOVA pela
seguinte maneira:
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaA contribuição “incremental” ou “marginal” de uma
variável independente (explanatória)
No tópico anterior, fazendo uso das variáveis
padronizadas, podemos observar que a variável Taxa de
Mortalidade Infantil tinha um peso (impacto) maior na
redução da Taxa de Mortalidade Infantil.
Com o R2 é possível fazer uma outra análise,
verificamos que o R2 para o modelo foi de 0,7077, mas não
podemos informar qual parte desse valor deve-se à variável
PNBpc e qual deve-se a TAF, graças a possível correlação que
possa ocorrer entre as duas variáveis na amostra. Podemos
aplica a técnica da ANOVA para identificar isso.
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaProcederemos da seguinte forma: será feita uma
inclusão sequencial estimando um modelo linear tendo como
variáveis dependentes PNBpc e em seguida um modelo com
apenas a TAF. Aqui na verdade queremos verificar a
contribuição individual de cada variável, ou seja, queremos
saber se a inclusão da variável no modelo aumenta a SQE (e,
por conseguinte, o R2).
A regressão obtida considerando apenas MI e PNBpc
será:
Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência
A tabela ANOVA da Regressão será:
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaNesse caso o valor da estatística F já se encontra no modelo
(12,3598), mas a sua fórmula de cálculo será:
𝐹 =
60.449,5
4890,7822
= 12,3598
Pelo resultado do modelo, verifica-se que a estatística F é
significativa, observe que se pegarmos a razão t e elevarmos ao
quadrado (-3,5156)^2= 12,3594, que é um valor muito próximo a
estatística F obtida.
Então vamos para a próxima etapa com os seguintes
questionamentos:
1) Qual a contribuição marginal da TAF, sabendo que o PNBpc já
está no modelo e tem relação significativa com MI?
2) A contribuição incremental da TAF é estatisticamente
significativa?
3) Qual o critério para acrescentar variáveis no modelo?
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaPara responder a tais perguntas, devemos fazer uso da
ANOVA. Para isso vamos visualizar, em uma tabela, a
contribuição incremental de TAF no modelo, para fazer essa
avaliação devemos fazer o seguinte passo:
𝐹 =
𝑄2/1
𝑄4/61
=
𝑆𝑄𝐸 𝑛𝑜𝑣𝑜 − 𝑆𝑄𝐸 𝑣𝑒𝑙ℎ𝑜
𝑛º 𝑑𝑒 𝑛𝑜𝑣𝑜𝑠 𝑟𝑒𝑔𝑟𝑒𝑠𝑠𝑜𝑟𝑒𝑠
𝑆𝑄𝑅 𝑛𝑜𝑣𝑜
𝑔𝑙(= 𝑛 − 𝑛º 𝑑𝑒 𝑛𝑜𝑣𝑜𝑠 𝑝𝑎𝑟â𝑚𝑒𝑡𝑟𝑜𝑠 𝑛𝑜 𝑛𝑜𝑣𝑜 𝑚𝑜𝑑𝑒𝑙𝑜)
Logo usando 𝐹 =
𝑄2/1
𝑄4/61
Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência
Em que o 𝑆𝑄𝐸 𝑛𝑜𝑣𝑜 = 𝑆𝑄𝐸 sob o novo modelo (ou seja, após
adicionar os novos regressores = 𝑄3), 𝑆𝑄𝐸 𝑣𝑒𝑙ℎ𝑜 = 𝑆𝑄𝐸 no
modelo velho (= 𝑄1) e 𝑆𝑄𝑅 𝑛𝑜𝑣𝑜 = 𝑆𝑄𝑅 no novo modelo (ou
seja, levando em conta todos os regressores = 𝑄4). Assim:
Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência
𝐹 =
196.912,9
1742,8786
= 112,9814
No entanto, a forma mais fácil de se fazer isso é
utilizando o R2, cuja expressão:
𝐹 =
(𝑅 𝑛𝑜𝑣𝑜
2 − 𝑅 𝑣𝑒𝑙ℎ𝑜
2
)/𝑔𝑙
(1 − 𝑅 𝑛𝑜𝑣𝑜
2
)/𝑔𝑙
𝐹 =
(0,7077 − 0,1662)/1
(1 − 0,7077)/61
= 113,05
A hipótese aqui testada no caso é:
𝐻0: 𝑇𝐴𝐹 𝑛ã𝑜 𝑐𝑜𝑛𝑡𝑟𝑖𝑏𝑢𝑖 𝑝𝑎𝑟𝑎 𝑜 𝑎𝑢𝑚𝑒𝑛𝑡𝑜 𝑑𝑜 𝑆𝑄𝐸
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaAssim a tabela da ANOVA fica:
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaQuando acrescentar uma nova variável?
O procedimento que verificamos anteriormente na
estatística F induz à um método formal para decidir se
devemos adicionar uma variável ao modelo de regressão.
Frequentemente, os pesquisadores são confrontados com a
tarefa de escolher entre vários modelos que envolvem a
mesma variável dependente, mas diferentes variáveis
independentes. A se fazer uma escolha ad hoc (pois muitas
vezes o fundamento teórico é fraco), caímos na tentação de
escolher o modelo que reflete o maior R2 ajustado.
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaTeste de igualdade para dois coeficientes de regressão
Uma das formas de verificarmos a inserção ou não de
novas variáveis no modelo e observar a restrição (ou
igualdade) dos estimadores de tais variáveis.
Suponha que estejamos trabalhando com a seguinte
regressão múltipla:
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝛽4 𝑋4𝑖 + 𝑢𝑖
E que desejamos testar as seguintes hipóteses:
𝐻0: 𝛽3 = 𝛽4 ou 𝛽3 − 𝛽4 = 0
𝐻0: 𝛽3 ≠ 𝛽4 ou 𝛽3 − 𝛽4 ≠ 0
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaOu seja, com esse procedimento, passamos a verificar
se (ou testar) se os dois coeficientes angulares 𝛽3 e 𝛽4, são
iguais.
A hipótese nula tem importância prática. Imagine que o
modelo anterior remeta a uma função demanda de um bem,
onde Y= quantidade demandada do bem, X2 = o preço do
bem; X3 = renda do consumidor; X4 = riqueza do consumidor.
Neste caso, a hipótese nula significa que os coeficientes da
renda e da riqueza são os mesmos. Ou, se 𝑌𝑖 e os X forem
expressos em foram logarítmica, a hipótese nula implica que
as elasticidades renda e riqueza do consumo são iguais.
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaA hipótese nula com essas características pode ser testada a
partir da seguinte expressão:
𝑡 =
𝛽3 − 𝛽4 − 𝛽3 − 𝛽4
𝑒𝑝 𝛽3 − 𝛽4
Que segue uma distribuição t com (n-4) graus de liberdade.
O erro padrão pode ser obtido pela seguinte equação.
𝑒𝑝 𝛽3 − 𝛽4 = 𝑣𝑎𝑟 𝛽3 + 𝑣𝑎𝑟 𝛽4 − 2𝑐𝑜𝑣( 𝛽3, 𝛽4)
Logo:
𝑡 =
𝛽3 − 𝛽4 − 𝛽3 − 𝛽4
𝑣𝑎𝑟 𝛽3 + 𝑣𝑎𝑟 𝛽4 − 2𝑐𝑜𝑣( 𝛽3, 𝛽4)
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaNota
Podemos estabelecer a covariância como:
𝑐𝑜𝑣 𝛽3, 𝛽4 =
−𝜎2 𝑟34
2
𝑥3 𝑥4 − 𝑛 𝑋3 𝑋4 1 − 𝑟34
2
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaCom isso, o processo envolve os seguintes passos:
1) Estimados 𝛽3 e 𝛽4. Isso evidentemente pode ser feito pelo
programa de sua escolha, nesse caso estamos vendo o Gretl.
2) A maioria dos programas calcula de forma rotineira os erros
padrões de cada estimador.
3) Obtemos a razão t. Porém, devemos ter cuidado com a
hipótese nula que passa a ser 𝛽3 − 𝛽4 = 0.
4) Se a variável t calculada for maior que o valor crítico de t no
nível de significância proposto para dados graus de liberdade,
poderemos rejeitar a hipótese nula; caso contrário, não a
rejeitamos. Como alternativa, se o valor p da estatística t for
baixo, poderemos rejeitar a hipótese nula.
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaPelo resultado da função cúbica de custo total temos:
𝑌𝑖 = 141,7667 + 63,4777𝑋𝑖 − 12,9615𝑋𝑖
2
+ 0,9396𝑋𝑖
3
𝑒𝑝 = 6,3753 4,7786 0,9857 0,0591
𝑅2 = 0,9983 𝑐𝑜𝑣 𝛽3, 𝛽4 = −0,0576
𝑡 =
−12,9615 − 0,9396
0,9867 2 + 0,0591 2 − 2 −0,0576
= −
13,9011
1,0442
= −13,3130
Usando 6 graus de liberdade (10-4), o valor t observado é superior
ao valor tabelado, com isso, podemos concluir pela rejeição da
hipótese nula, ou seja, os valores dos coeficientes são diferentes.
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaMínimos Quadrados Restritos: testes de restrições de
igualdade linear.
Existem ocasiões em que a teoria econômica sugere
que os coeficientes de um modelo de regressão estão sujeitos
a algum tipo de restrição de igualdade linear. Por exemplo,
considere a função de produção Cobb-Douglas:
𝑌𝑖 = 𝛽1 𝑋2𝑖
𝛽2
𝑋3𝑖
𝛽3
𝑒 𝑢 𝑖
Na forma logarítmica já verificamos que:
ln 𝑌𝑖 = 𝛽0 + 𝛽2 ln 𝑋2𝑖 + 𝛽3 ln 𝑋3𝑖 + 𝑢𝑖
Vamos supor que queiramos fazer um teste para
verificar a existência de retorno constantes de escala, a teoria
econômica estabelece que: 𝛽2 + 𝛽3 = 1
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaTrata-se, portanto, de um exemplo de restrição de
igualdade linear. Para descobrir se realmente existem
retornos constantes de escala podemos fazer uso de duas
abordagens.
Abordagem do teste t: A forma mais simples é verificar
pela expressão do teste t considerando agora as restrições,
nesse caso antes estávamos testando:
𝛽2 = 𝛽3 o que resultava em 𝛽2 − 𝛽3 = 0
Agora a situação seria:
𝛽2 + 𝛽3 = 1 o que resulta em 𝛽2 + 𝛽3 − 1 = 0
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaCom isso a fórmula estatística do teste t para a
explicitar a restrição, que antes por hipótese era zero,
tornando-se:
𝑡 =
𝛽2 + 𝛽3 − 1
𝑣𝑎𝑟 𝛽2 + 𝑣𝑎𝑟 𝛽3 + 2𝑐𝑜𝑣 𝛽2, 𝛽3
Logo a hipótese nula a ser testada é:
𝐻0: 𝛽2 + 𝛽3 − 1 = 0 , ou seja, a restrição existe, o
que implica que 𝛽2 + 𝛽3 = 1, concluindo-se pelos retornos
constantes a escala.
Rejeitar H0 é concluir pela existência ou de retornos
decrescentes ou retornos crescentes.
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaO que torna complicado o uso da t? O fato de calcular a
covariância torna a operação ou uso dessa estatística, apesar
de simples, mais demorado, pois teríamos que encontrar a
matriz var-cov dos estimadores.
Porém há outro método, que pelo uso de duas
regressões poderemos encontrar de forma mais rápida,
apesar de dar mais trabalho, o nosso teste.
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaAbordagem do teste F: Mínimos Quadrados Restritos
Trata-se de uma abordagem mais direta seria a o teste
F, no entanto, para realizar tal procedimento teríamos que
mudar a nossa restrição, uma delas seria:
𝛽2 = 1 − 𝛽3 ou 𝛽3 = 1 − 𝛽2
Isso nos permite eliminar um dos coeficientes betas na
equação das elasticidades de produção e reescrever a função
Cobb-Douglas da seguinte forma:
ln 𝑌𝑖 = 𝛽0 + 1 − 𝛽3 ln 𝑋2𝑖 + 𝛽3 ln 𝑋3𝑖 + 𝑢𝑖
= 𝛽0 + ln 𝑋2𝑖 + 𝛽3 ln 𝑋3𝑖 − ln 𝑋2𝑖 + 𝑢𝑖
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaTal expressão resulta em:
ln 𝑌𝑖 − ln 𝑋2𝑖 = 𝛽0 + 𝛽3 ln 𝑋3𝑖 − ln 𝑋2𝑖 + 𝑢𝑖
Que pela propriedade do log fica
ln
𝑌𝑖
𝑋2𝑖
= 𝛽0 + 𝛽3 ln
𝑋3𝑖
𝑋2𝑖
+ 𝑢𝑖
Que nos dará a razão produção trabalho Y/X2 e a razão
capital trabalho X3/X2.
Com isso teríamos dois modelos, um com uma
restrição, que foi a modelo que acabamos de construir e
outro modelo sem restrição, que é o modelo sem a
transformação.
Quando formos analisar, o modelo com restrição será,
geralmente, aquele que possuir menor número de variáveis.
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaAssim, podemos a partir dessa abordagem construir
uma estatística F considerando a SQR de cada um dos
modelos, onde:
𝑢 𝑆𝑅
2
= SQR da regressão sem restrições
𝑢 𝑅
2
= SQR da regressão com restrições
m = número de restrições lineares (no caso desse
exemplo 1)
k = número de parâmetros da regressão sem restrições;
n = número de observações.
Assim,
Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência
𝐹 =
𝑆𝑄𝑅 𝑅 − 𝑆𝑄𝑅 𝑆𝑅
𝑚
𝑆𝑄𝑅 𝑆𝑅
𝑛 − 𝑘
=
𝑢 𝑅
2
− 𝑢 𝑆𝑅
2
𝑚
𝑢 𝑆𝑅
2
𝑛 − 𝑘
=
𝑅 𝑆𝑅
2
− 𝑅 𝑅
2
𝑚
1 − 𝑅 𝑆𝑅
2
𝑛 − 𝑘
Onde,
𝑅 𝑆𝑅
2
≥ 𝑅 𝑅
2
e
𝑢 𝑆𝑅
2
≤ 𝑢 𝑅
2
Vamos verificar no exemplo para a função Cobb-
Douglas no Gretl.
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaComo exercício reproduza no Gretl o exemplo 8.4 da
página 219, sobre demanda de frango nos EUA.
Teste da Estabilidade estrutural ou dos parâmetros
nos modelos de regressão: O teste de Chow.
Esse teste é aplicado principalmente em series de
tempo, e sua finalidade é a de verificar se, ao longo dos anos,
uma determinada economia teve uma mudança e sua
trajetória, ou seja, ele define se ocorreu alguma mudança no
coeficiente de inclinação de nossa variável de interesse.
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaAgora o que seriam essas mudanças estruturais?
Seriam mudança decorrentes de alguns aspectos como:
Decorrente de forças externas – Guerras, Embargos
econômicos, Copa do Mundo no Brasil, etc;
Decorrentes de mudanças na política Econômica:
Câmbio Fixo para Flutuante, Plano Real, etc
Decorrentes de tomadas de decisões: Mudanças
tributárias, Investimentos no Nordeste, Construção de usinas
hidreelétricas, etc.
Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaComo verificar se a mudança ocorreu ou não? É usado
no Gujarati o exemplo da tabela 8.9, que apresenta dados
sobre a renda pessoal disponível e a poupança pessoal, em bi
US$, nos EUA entre 1970-1995.
Sabe-se que em 1982, ocorreu uma forte recessão na
economia americana, fato que poderia influenciar na relação
poupança X renda.
A ideia e construir uma estrutura de modelo onde
possamos verificar se a partir do ano em que se verifica uma
mudança na economia, se a inclinação de nossa variável de
interesse mudou. Assim, pode-se construir 3 regressões
específicas:
Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência1970-1981 = 𝑌𝑡 = 1 + 2 𝑋𝑡 + 𝑢1𝑡 𝑛1 = 12 (a)
1982-1995= 𝑌𝑡 = 𝛾1 + 𝛾2 𝑋𝑡 + 𝑢2𝑡 𝑛2 = 14 (b)
1970-1995= 𝑌𝑡 = 𝛼1 + 𝛼2 𝑋𝑡 + 𝑢 𝑡 𝑛 = 26 (c)
Como proceder com o teste de Chow?
1) Estima-se a regressão (c) que será adequada se não houver
instabilidade dos parâmetros estimados, obtém-se a SQR com
(n-k) gl. Nesse caso ele será a 𝑆𝑄𝑅 𝑅, nesse caso ela é restrita
pela imposição de 1 = 𝛾1 e 2 = 𝛾2, ou seja, as regressões
dos subperíodos são iguais.
2) Estima-se a equação (a) e obtemos a SQR1, com (𝑛1 − 𝑘) gl.
3) Estima-se a equação (b) e obtemos a SQR2, com (𝑛2 − 𝑘) gl.
Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência4) Como estamos considerando que os dois conjuntos de
amostras são independentes, podemos somar SQR1+SQR2 e
dizer que essa soma seja a Soma de Quadrado dos Resíduos
sem restrições (𝑆𝑄𝑅 𝑆𝑅)
5) Aplicamos tudo na Fórmula da F, onde:
𝐹 =
𝑆𝑄𝑅 𝑅 − 𝑆𝑄𝑅 𝑆𝑅
𝑘
𝑆𝑄𝑅 𝑆𝑅
𝑛 − 2𝑘
Vamos fazer no Gretl
FIM DO TÓPICO
2

04 tópico 3 - regressão multipla

  • 1.
    Econometria Tópico 3 –Regressão Múltipla O Problema da Inferência Ricardo Bruno N. dos Santos Professor Adjunto da Faculdade de Economia e do PPGE (Economia) UFPA
  • 2.
    Lembre-se que osvídeos necessários para o acompanhamento dessa apresentação são todos os vídeos que iniciam por 05, e encontram-se dentro da pasta Vídeos no mediafire. Link do mediafire: http://www.mediafire.com/?q1dbpxh1b4uxo No Slideshare:
  • 3.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência O que devemos ter em mente? - Normalidade dos resíduos, portanto, devemos considerar: 𝑢𝑖~𝑁(0, 𝜎2) - Deve-se levar em conta que nossos estimadores são os Melhores Estimadores Lineares Não Tendenciosos (MELNT)
  • 4.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência A estatística t para avaliar os estimadores ’s continua a mesma, ou seja, para avaliar a significância estatística individual dos estimadores devemos considerar que: 𝑡 = 𝛽1 − 𝛽1 𝑒𝑝 𝛽1 𝑡 = 𝛽2 − 𝛽2 𝑒𝑝 𝛽2 𝑡 = 𝛽3 − 𝛽3 𝑒𝑝 𝛽3 Nesse caso, segue distribuição t com n-3 graus de liberdade.
  • 5.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência O teste de hipótese na Regressão Múltipla Como já observado na regressão simples, o teste de hipótese anteriormente aplicado é semelhante a múltipla, por esse motivo, não iremos nos deter nesse tópico novamente, analisaremos apenas o modelo já estimado na seção anterior sobre mortalidade infantil, e a partir deste modelo iremos tecer alguns comentários sobre a análise da significância e da construção do intervalo de confiança.
  • 6.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência O modelo estimado para o caso da mortalidade infantil foi: 𝑀𝐼𝑖 = 263,6416 − 0,0056𝑃𝑁𝐵𝑝𝑐𝑖 − 2,2316𝑇𝐴𝐹𝑖 𝑒𝑝 = 11,5932 0,0019 0,2099 𝑡 = 22,7411 −2,8187 −10,6293 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0,00000 0,0065 0,000000 𝑅2 = 0,7077 𝑅2 = 0,6981 Podemos estabelecer que: 𝐻0: 𝛽2 = 0 𝑒 𝐻1: 𝛽2 ≠ 0
  • 7.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência A interpretação literal da hipótese nula (H0) seria a de que, mantida constante a Taxa de Alfabetização Feminina, X2 (PNBpc) NÃO EXERCE influência (linear) sobre Y ( Mortalidade Infantil). Para testar tal hipótese, usamos o teste t, onde: 𝑡 = − 0,0056 0,0020 = −2,8187 Podemos então achar o valor tabelado para comparar se o valor do t calculado de -2,8187 é, em módulo, maior que o valor tabelado, para encontrarmos o valor tabelado basta consultarmos a tabela t para 𝛼 = 5% e com 61 graus de liberdade, haja vista que o número de observações utilizadas é de 64. Com (n-k) graus de liberdade, sendo k o número de variáveis, teremos: (64-3=61 gl) o valor tabelado portanto é de 2
  • 8.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência Assim, podemos verificar que o valor calculado é maior que o tabelado, nos direcionando a rejeição da hipótese nula. Logo a conclusão é de que é significativo o efeito do PNBpc na Mortalidade Infantil. A seguir podemos visualizar o gráfico para essa situação:
  • 9.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência
  • 10.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência Outro importante elemento a ser considerado é o intervalo de confiança do modelo, com os resultados fornecidos já é possível construí-lo com base na seguinte fórmula: 𝛽2 − 𝑡 𝛼 2 𝑒𝑝 𝛽2 ≤ 𝛽2 ≤ 𝛽2 + 𝑡 𝛼 2 𝑒𝑝( 𝛽2) Com os valores informados verifica-se que: −0,0056 − 2 0,002 ≤ 𝛽2 ≤ −0,0056 + 2 0,002 −0,0096 ≤ 𝛽2 ≤ −0,0016 Com isso, o intervalo acima incluirá o verdadeiro valor do coeficiente 𝛽2 com um nível de confiança de 95%. Dessa forma, se 100 amostras de tamanho 64 forem selecionadas e 100 intervalos de confiança como o de cima forem formulados, esperamos que em 95 deles incluam o verdadeiro parâmetro populacional 𝛽2.
  • 11.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência No tópico anterior foi calculado o teste de Normalidade, e verificou-se que os resíduos atenderam a hipótese de normalidade. O teste de significância geral Já foi retratado que devemos testar se os estimadores 𝛽2 e 𝛽3 são em conjunto iguais a zero, ou seja, devemos verificar se 𝛽2 = 𝛽3 = 0, para realizar tal procedimento, deveremos recorrer a estatística F. Quando abordamos a regressão linear simples, fizemos uma análise sobre a estatística F, sua forma de interpretação e o cálculo de sua estatística a partir da tabela da ANOVA.
  • 12.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência Porém ficou claro que em modelos simples a medida da F não possui muito sentido, haja vista que temos apenas uma variável independente, no caso da regressão múltipla, teremos duas ou mais variáveis independentes no modelo, o que deixa o teste F com maior sentido. Para tanto, vamos recorres a Tabela da ANOVA, lembrando que essa tabela é composta pela Soma de Quadrados, que para o modelo múltiplo foi verificado nas aulas anteriores. Assim:
  • 13.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência 𝑦𝑖 2 = 𝛽2 𝑦𝑖 𝑥2𝑖 + 𝛽3 𝑦𝑖 𝑥3𝑖 + 𝑢𝑖 2 𝑆𝑄𝑇 = 𝑆𝑄𝐸 + 𝑆𝑄𝑅 Considerando a hipótese de normalidade temos: 𝐹 = 𝛽2 𝑦𝑖 𝑥2𝑖 + 𝛽3 𝑦𝑖 𝑥3𝑖 2 𝑢𝑖 2 𝑛 − 3 = 𝑆𝑄𝐸/𝑔𝑙 𝑆𝑄𝑅/𝑔𝑙
  • 14.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência Assim a nossa tabela da ANOVA é composta por: No nosso exemplo temos:
  • 15.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência Como a partir dos dados da regressão podemos encontrar toda a estrutura da ANOVA? Na verdade a regressão solta dois valores pelos quais podemos encontrar todos os dados da ANOVA, são a SQR e o R2. Vejamos no resultado do modelo de Mortalidade Infantil
  • 16.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência
  • 17.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaDevemos lembrar que: 𝑅2 = 1 − 𝑆𝑄𝑅 𝑆𝑄𝑇 E que: 𝑆𝑄𝑇 = 𝑆𝑄𝐸 + 𝑆𝑄𝑅 Se temos 𝑅2 e SQR podemos concluir então que: 𝑆𝑄𝑇 = 𝑆𝑄𝑅 1−𝑅2 logo: 𝑆𝑄𝑇 = 106.315,6 1−0,707665 = 363.677,3 𝑆𝑄𝐸 = 363.677,3 − 106.315,6 = 257.361,7 Considerando: (n-k)=61 e k-1=2 temos
  • 18.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência 𝐹 = 257.361,7 2 106.315,6 61 = 128.680,8 1.742,879 = 73,8324 Portanto, apenas com duas informações é possível encontrar todos os valores da tabela da ANOVA. Considerando então um modelo com k variáveis: 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + ⋯ + 𝛽 𝑘 𝑋 𝑘𝑖 Formula-se a hipótese: 𝐻0: 𝛽2 = 𝛽3 = ⋯ = 𝛽 𝑘 = 0 Considerando os resultados da F do modelo da mortalidade infantil, rejeita-se a hipótese nula, conclui-se que pelo menos um dos estimadores é diferente de zero.
  • 19.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaA importante relação entre o 𝑹 𝟐 e a estatística F Verificamos que: 𝐹 = 𝑛 − 𝑘 𝑘 − 1 × 𝑆𝑄𝐸 𝑆𝑄𝑅 = 𝑛 − 𝑘 𝑘 − 1 × 𝑆𝑄𝐸 𝑆𝑄𝑇 − 𝑆𝑄𝐸 = 𝑛 − 𝑘 𝑘 − 1 × 𝑆𝑄𝐸/𝑆𝑄𝑇 1 − 𝑆𝑄𝐸 𝑆𝑄𝑇 = 𝑛 − 𝑘 𝑘 − 1 × 𝑅2 1 − 𝑅2 = 𝑅2 𝑘 − 1 1 − 𝑅2 𝑛 − 𝑘
  • 20.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaOu seja, para realizar a estatística F, basta que tenhamos o valor do R2. Dessa forma, podemos encontrar a tabela ANOVA pela seguinte maneira:
  • 21.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaA contribuição “incremental” ou “marginal” de uma variável independente (explanatória) No tópico anterior, fazendo uso das variáveis padronizadas, podemos observar que a variável Taxa de Mortalidade Infantil tinha um peso (impacto) maior na redução da Taxa de Mortalidade Infantil. Com o R2 é possível fazer uma outra análise, verificamos que o R2 para o modelo foi de 0,7077, mas não podemos informar qual parte desse valor deve-se à variável PNBpc e qual deve-se a TAF, graças a possível correlação que possa ocorrer entre as duas variáveis na amostra. Podemos aplica a técnica da ANOVA para identificar isso.
  • 22.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaProcederemos da seguinte forma: será feita uma inclusão sequencial estimando um modelo linear tendo como variáveis dependentes PNBpc e em seguida um modelo com apenas a TAF. Aqui na verdade queremos verificar a contribuição individual de cada variável, ou seja, queremos saber se a inclusão da variável no modelo aumenta a SQE (e, por conseguinte, o R2). A regressão obtida considerando apenas MI e PNBpc será:
  • 23.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência A tabela ANOVA da Regressão será:
  • 24.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaNesse caso o valor da estatística F já se encontra no modelo (12,3598), mas a sua fórmula de cálculo será: 𝐹 = 60.449,5 4890,7822 = 12,3598 Pelo resultado do modelo, verifica-se que a estatística F é significativa, observe que se pegarmos a razão t e elevarmos ao quadrado (-3,5156)^2= 12,3594, que é um valor muito próximo a estatística F obtida. Então vamos para a próxima etapa com os seguintes questionamentos: 1) Qual a contribuição marginal da TAF, sabendo que o PNBpc já está no modelo e tem relação significativa com MI? 2) A contribuição incremental da TAF é estatisticamente significativa? 3) Qual o critério para acrescentar variáveis no modelo?
  • 25.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaPara responder a tais perguntas, devemos fazer uso da ANOVA. Para isso vamos visualizar, em uma tabela, a contribuição incremental de TAF no modelo, para fazer essa avaliação devemos fazer o seguinte passo: 𝐹 = 𝑄2/1 𝑄4/61 = 𝑆𝑄𝐸 𝑛𝑜𝑣𝑜 − 𝑆𝑄𝐸 𝑣𝑒𝑙ℎ𝑜 𝑛º 𝑑𝑒 𝑛𝑜𝑣𝑜𝑠 𝑟𝑒𝑔𝑟𝑒𝑠𝑠𝑜𝑟𝑒𝑠 𝑆𝑄𝑅 𝑛𝑜𝑣𝑜 𝑔𝑙(= 𝑛 − 𝑛º 𝑑𝑒 𝑛𝑜𝑣𝑜𝑠 𝑝𝑎𝑟â𝑚𝑒𝑡𝑟𝑜𝑠 𝑛𝑜 𝑛𝑜𝑣𝑜 𝑚𝑜𝑑𝑒𝑙𝑜) Logo usando 𝐹 = 𝑄2/1 𝑄4/61
  • 26.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência Em que o 𝑆𝑄𝐸 𝑛𝑜𝑣𝑜 = 𝑆𝑄𝐸 sob o novo modelo (ou seja, após adicionar os novos regressores = 𝑄3), 𝑆𝑄𝐸 𝑣𝑒𝑙ℎ𝑜 = 𝑆𝑄𝐸 no modelo velho (= 𝑄1) e 𝑆𝑄𝑅 𝑛𝑜𝑣𝑜 = 𝑆𝑄𝑅 no novo modelo (ou seja, levando em conta todos os regressores = 𝑄4). Assim:
  • 28.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência 𝐹 = 196.912,9 1742,8786 = 112,9814 No entanto, a forma mais fácil de se fazer isso é utilizando o R2, cuja expressão: 𝐹 = (𝑅 𝑛𝑜𝑣𝑜 2 − 𝑅 𝑣𝑒𝑙ℎ𝑜 2 )/𝑔𝑙 (1 − 𝑅 𝑛𝑜𝑣𝑜 2 )/𝑔𝑙 𝐹 = (0,7077 − 0,1662)/1 (1 − 0,7077)/61 = 113,05 A hipótese aqui testada no caso é: 𝐻0: 𝑇𝐴𝐹 𝑛ã𝑜 𝑐𝑜𝑛𝑡𝑟𝑖𝑏𝑢𝑖 𝑝𝑎𝑟𝑎 𝑜 𝑎𝑢𝑚𝑒𝑛𝑡𝑜 𝑑𝑜 𝑆𝑄𝐸
  • 29.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaAssim a tabela da ANOVA fica:
  • 30.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaQuando acrescentar uma nova variável? O procedimento que verificamos anteriormente na estatística F induz à um método formal para decidir se devemos adicionar uma variável ao modelo de regressão. Frequentemente, os pesquisadores são confrontados com a tarefa de escolher entre vários modelos que envolvem a mesma variável dependente, mas diferentes variáveis independentes. A se fazer uma escolha ad hoc (pois muitas vezes o fundamento teórico é fraco), caímos na tentação de escolher o modelo que reflete o maior R2 ajustado.
  • 31.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaTeste de igualdade para dois coeficientes de regressão Uma das formas de verificarmos a inserção ou não de novas variáveis no modelo e observar a restrição (ou igualdade) dos estimadores de tais variáveis. Suponha que estejamos trabalhando com a seguinte regressão múltipla: 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝛽4 𝑋4𝑖 + 𝑢𝑖 E que desejamos testar as seguintes hipóteses: 𝐻0: 𝛽3 = 𝛽4 ou 𝛽3 − 𝛽4 = 0 𝐻0: 𝛽3 ≠ 𝛽4 ou 𝛽3 − 𝛽4 ≠ 0
  • 32.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaOu seja, com esse procedimento, passamos a verificar se (ou testar) se os dois coeficientes angulares 𝛽3 e 𝛽4, são iguais. A hipótese nula tem importância prática. Imagine que o modelo anterior remeta a uma função demanda de um bem, onde Y= quantidade demandada do bem, X2 = o preço do bem; X3 = renda do consumidor; X4 = riqueza do consumidor. Neste caso, a hipótese nula significa que os coeficientes da renda e da riqueza são os mesmos. Ou, se 𝑌𝑖 e os X forem expressos em foram logarítmica, a hipótese nula implica que as elasticidades renda e riqueza do consumo são iguais.
  • 33.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaA hipótese nula com essas características pode ser testada a partir da seguinte expressão: 𝑡 = 𝛽3 − 𝛽4 − 𝛽3 − 𝛽4 𝑒𝑝 𝛽3 − 𝛽4 Que segue uma distribuição t com (n-4) graus de liberdade. O erro padrão pode ser obtido pela seguinte equação. 𝑒𝑝 𝛽3 − 𝛽4 = 𝑣𝑎𝑟 𝛽3 + 𝑣𝑎𝑟 𝛽4 − 2𝑐𝑜𝑣( 𝛽3, 𝛽4) Logo: 𝑡 = 𝛽3 − 𝛽4 − 𝛽3 − 𝛽4 𝑣𝑎𝑟 𝛽3 + 𝑣𝑎𝑟 𝛽4 − 2𝑐𝑜𝑣( 𝛽3, 𝛽4)
  • 34.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaNota Podemos estabelecer a covariância como: 𝑐𝑜𝑣 𝛽3, 𝛽4 = −𝜎2 𝑟34 2 𝑥3 𝑥4 − 𝑛 𝑋3 𝑋4 1 − 𝑟34 2
  • 35.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaCom isso, o processo envolve os seguintes passos: 1) Estimados 𝛽3 e 𝛽4. Isso evidentemente pode ser feito pelo programa de sua escolha, nesse caso estamos vendo o Gretl. 2) A maioria dos programas calcula de forma rotineira os erros padrões de cada estimador. 3) Obtemos a razão t. Porém, devemos ter cuidado com a hipótese nula que passa a ser 𝛽3 − 𝛽4 = 0. 4) Se a variável t calculada for maior que o valor crítico de t no nível de significância proposto para dados graus de liberdade, poderemos rejeitar a hipótese nula; caso contrário, não a rejeitamos. Como alternativa, se o valor p da estatística t for baixo, poderemos rejeitar a hipótese nula.
  • 36.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaPelo resultado da função cúbica de custo total temos: 𝑌𝑖 = 141,7667 + 63,4777𝑋𝑖 − 12,9615𝑋𝑖 2 + 0,9396𝑋𝑖 3 𝑒𝑝 = 6,3753 4,7786 0,9857 0,0591 𝑅2 = 0,9983 𝑐𝑜𝑣 𝛽3, 𝛽4 = −0,0576 𝑡 = −12,9615 − 0,9396 0,9867 2 + 0,0591 2 − 2 −0,0576 = − 13,9011 1,0442 = −13,3130 Usando 6 graus de liberdade (10-4), o valor t observado é superior ao valor tabelado, com isso, podemos concluir pela rejeição da hipótese nula, ou seja, os valores dos coeficientes são diferentes.
  • 37.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaMínimos Quadrados Restritos: testes de restrições de igualdade linear. Existem ocasiões em que a teoria econômica sugere que os coeficientes de um modelo de regressão estão sujeitos a algum tipo de restrição de igualdade linear. Por exemplo, considere a função de produção Cobb-Douglas: 𝑌𝑖 = 𝛽1 𝑋2𝑖 𝛽2 𝑋3𝑖 𝛽3 𝑒 𝑢 𝑖 Na forma logarítmica já verificamos que: ln 𝑌𝑖 = 𝛽0 + 𝛽2 ln 𝑋2𝑖 + 𝛽3 ln 𝑋3𝑖 + 𝑢𝑖 Vamos supor que queiramos fazer um teste para verificar a existência de retorno constantes de escala, a teoria econômica estabelece que: 𝛽2 + 𝛽3 = 1
  • 38.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaTrata-se, portanto, de um exemplo de restrição de igualdade linear. Para descobrir se realmente existem retornos constantes de escala podemos fazer uso de duas abordagens. Abordagem do teste t: A forma mais simples é verificar pela expressão do teste t considerando agora as restrições, nesse caso antes estávamos testando: 𝛽2 = 𝛽3 o que resultava em 𝛽2 − 𝛽3 = 0 Agora a situação seria: 𝛽2 + 𝛽3 = 1 o que resulta em 𝛽2 + 𝛽3 − 1 = 0
  • 39.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaCom isso a fórmula estatística do teste t para a explicitar a restrição, que antes por hipótese era zero, tornando-se: 𝑡 = 𝛽2 + 𝛽3 − 1 𝑣𝑎𝑟 𝛽2 + 𝑣𝑎𝑟 𝛽3 + 2𝑐𝑜𝑣 𝛽2, 𝛽3 Logo a hipótese nula a ser testada é: 𝐻0: 𝛽2 + 𝛽3 − 1 = 0 , ou seja, a restrição existe, o que implica que 𝛽2 + 𝛽3 = 1, concluindo-se pelos retornos constantes a escala. Rejeitar H0 é concluir pela existência ou de retornos decrescentes ou retornos crescentes.
  • 40.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaO que torna complicado o uso da t? O fato de calcular a covariância torna a operação ou uso dessa estatística, apesar de simples, mais demorado, pois teríamos que encontrar a matriz var-cov dos estimadores. Porém há outro método, que pelo uso de duas regressões poderemos encontrar de forma mais rápida, apesar de dar mais trabalho, o nosso teste.
  • 41.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaAbordagem do teste F: Mínimos Quadrados Restritos Trata-se de uma abordagem mais direta seria a o teste F, no entanto, para realizar tal procedimento teríamos que mudar a nossa restrição, uma delas seria: 𝛽2 = 1 − 𝛽3 ou 𝛽3 = 1 − 𝛽2 Isso nos permite eliminar um dos coeficientes betas na equação das elasticidades de produção e reescrever a função Cobb-Douglas da seguinte forma: ln 𝑌𝑖 = 𝛽0 + 1 − 𝛽3 ln 𝑋2𝑖 + 𝛽3 ln 𝑋3𝑖 + 𝑢𝑖 = 𝛽0 + ln 𝑋2𝑖 + 𝛽3 ln 𝑋3𝑖 − ln 𝑋2𝑖 + 𝑢𝑖
  • 42.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaTal expressão resulta em: ln 𝑌𝑖 − ln 𝑋2𝑖 = 𝛽0 + 𝛽3 ln 𝑋3𝑖 − ln 𝑋2𝑖 + 𝑢𝑖 Que pela propriedade do log fica ln 𝑌𝑖 𝑋2𝑖 = 𝛽0 + 𝛽3 ln 𝑋3𝑖 𝑋2𝑖 + 𝑢𝑖 Que nos dará a razão produção trabalho Y/X2 e a razão capital trabalho X3/X2. Com isso teríamos dois modelos, um com uma restrição, que foi a modelo que acabamos de construir e outro modelo sem restrição, que é o modelo sem a transformação. Quando formos analisar, o modelo com restrição será, geralmente, aquele que possuir menor número de variáveis.
  • 43.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaAssim, podemos a partir dessa abordagem construir uma estatística F considerando a SQR de cada um dos modelos, onde: 𝑢 𝑆𝑅 2 = SQR da regressão sem restrições 𝑢 𝑅 2 = SQR da regressão com restrições m = número de restrições lineares (no caso desse exemplo 1) k = número de parâmetros da regressão sem restrições; n = número de observações. Assim,
  • 44.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência 𝐹 = 𝑆𝑄𝑅 𝑅 − 𝑆𝑄𝑅 𝑆𝑅 𝑚 𝑆𝑄𝑅 𝑆𝑅 𝑛 − 𝑘 = 𝑢 𝑅 2 − 𝑢 𝑆𝑅 2 𝑚 𝑢 𝑆𝑅 2 𝑛 − 𝑘 = 𝑅 𝑆𝑅 2 − 𝑅 𝑅 2 𝑚 1 − 𝑅 𝑆𝑅 2 𝑛 − 𝑘 Onde, 𝑅 𝑆𝑅 2 ≥ 𝑅 𝑅 2 e 𝑢 𝑆𝑅 2 ≤ 𝑢 𝑅 2 Vamos verificar no exemplo para a função Cobb- Douglas no Gretl.
  • 45.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaComo exercício reproduza no Gretl o exemplo 8.4 da página 219, sobre demanda de frango nos EUA. Teste da Estabilidade estrutural ou dos parâmetros nos modelos de regressão: O teste de Chow. Esse teste é aplicado principalmente em series de tempo, e sua finalidade é a de verificar se, ao longo dos anos, uma determinada economia teve uma mudança e sua trajetória, ou seja, ele define se ocorreu alguma mudança no coeficiente de inclinação de nossa variável de interesse.
  • 46.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaAgora o que seriam essas mudanças estruturais? Seriam mudança decorrentes de alguns aspectos como: Decorrente de forças externas – Guerras, Embargos econômicos, Copa do Mundo no Brasil, etc; Decorrentes de mudanças na política Econômica: Câmbio Fixo para Flutuante, Plano Real, etc Decorrentes de tomadas de decisões: Mudanças tributárias, Investimentos no Nordeste, Construção de usinas hidreelétricas, etc.
  • 47.
    Análise da RegressãoMúltipla (Tópico 2): O problema da InferênciaComo verificar se a mudança ocorreu ou não? É usado no Gujarati o exemplo da tabela 8.9, que apresenta dados sobre a renda pessoal disponível e a poupança pessoal, em bi US$, nos EUA entre 1970-1995. Sabe-se que em 1982, ocorreu uma forte recessão na economia americana, fato que poderia influenciar na relação poupança X renda. A ideia e construir uma estrutura de modelo onde possamos verificar se a partir do ano em que se verifica uma mudança na economia, se a inclinação de nossa variável de interesse mudou. Assim, pode-se construir 3 regressões específicas:
  • 48.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência1970-1981 = 𝑌𝑡 = 1 + 2 𝑋𝑡 + 𝑢1𝑡 𝑛1 = 12 (a) 1982-1995= 𝑌𝑡 = 𝛾1 + 𝛾2 𝑋𝑡 + 𝑢2𝑡 𝑛2 = 14 (b) 1970-1995= 𝑌𝑡 = 𝛼1 + 𝛼2 𝑋𝑡 + 𝑢 𝑡 𝑛 = 26 (c) Como proceder com o teste de Chow? 1) Estima-se a regressão (c) que será adequada se não houver instabilidade dos parâmetros estimados, obtém-se a SQR com (n-k) gl. Nesse caso ele será a 𝑆𝑄𝑅 𝑅, nesse caso ela é restrita pela imposição de 1 = 𝛾1 e 2 = 𝛾2, ou seja, as regressões dos subperíodos são iguais. 2) Estima-se a equação (a) e obtemos a SQR1, com (𝑛1 − 𝑘) gl. 3) Estima-se a equação (b) e obtemos a SQR2, com (𝑛2 − 𝑘) gl.
  • 49.
    Análise da RegressãoMúltipla (Tópico 2): O problema da Inferência4) Como estamos considerando que os dois conjuntos de amostras são independentes, podemos somar SQR1+SQR2 e dizer que essa soma seja a Soma de Quadrado dos Resíduos sem restrições (𝑆𝑄𝑅 𝑆𝑅) 5) Aplicamos tudo na Fórmula da F, onde: 𝐹 = 𝑆𝑄𝑅 𝑅 − 𝑆𝑄𝑅 𝑆𝑅 𝑘 𝑆𝑄𝑅 𝑆𝑅 𝑛 − 2𝑘 Vamos fazer no Gretl
  • 50.