O slideshow foi denunciado.
Seu SlideShare está sendo baixado. ×

Cadeira_Econometria_2.pdf

Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Carregando em…3
×

Confira estes a seguir

1 de 150 Anúncio

Mais Conteúdo rRelacionado

Mais recentes (20)

Anúncio

Cadeira_Econometria_2.pdf

  1. 1. Econometria 2 Renan Oliveira Regis UNEMAT Renan Oliveira Regis Econometria 2 1 / 150
  2. 2. Sumário Sumário 1 Ementa da disciplina 2 Métodos de MQO e aplicação em R 3 agrupamento de cortes transversais ao longo do tempo: métodos simples de dados em painel 4 Métodos avançados de dados em painel Renan Oliveira Regis Econometria 2 2 / 150
  3. 3. Ementa da disciplina 1 Ementa da disciplina 2 Métodos de MQO e aplicação em R 3 agrupamento de cortes transversais ao longo do tempo: métodos simples de dados em painel 4 Métodos avançados de dados em painel Renan Oliveira Regis Econometria 2 3 / 150
  4. 4. Ementa da disciplina Temas abordados Introdução à econometria: uma abordagem moderna – Tradução da 6ª edição norte-americana Jeffrey M. Wooldridge ▶ Cap 13: agrupamento de cortes transversais ao longo do tempo: métodos simples de dados em painel. ▶ Cap 14: métodos avançados de dados em painel. ▶ Cap 15: estimação de variáveis instrumentais e mínimos quadrados em dois estágios. ▶ Cap 16: modelos de equações simultâneas. ▶ Cap 17: modelos com variáveis dependentes limitadas e correções da seleção amostral Avaliação econômica de projetos sociais / Betânia Menezes Filho]. – São Paulo : Fundação Itaú Social, 2016. ▶ Avaliação de Impacto de Programas Sociais.Por que, para que e quando fazer? ▶ Modelo de Resultados Potenciais. ▶ Método de Aleatorização. ▶ Diferenças em Diferenças. ▶ Variáveis Instrumentais. ▶ Regressão Descontínua. Renan Oliveira Regis Econometria 2 4 / 150
  5. 5. Métodos de MQO e aplicação em R 1 Ementa da disciplina 2 Métodos de MQO e aplicação em R 3 agrupamento de cortes transversais ao longo do tempo: métodos simples de dados em painel 4 Métodos avançados de dados em painel Renan Oliveira Regis Econometria 2 5 / 150
  6. 6. Métodos de MQO e aplicação em R Modelo de regressão Múltipla Y = β0 + β1X1 + β2X2 + ... + βk Xk + e Ou, forma Por que, para que e quando fazer?Por que, para que e quando fazer? Modelo de Resultados Potenciais. Método de Aleatorização. Diferenças em Diferenças. Pareamento. Variáveis Instrumentais. Regressão Descontínua. O Cálculo do Retorno Econômico.matricial y = Xβ + e y =      y1 y2 . . . yn      ; X =      1 x11 x12 x13 . . . x1k 1 x21 x22 x23 . . . x2k . . . . . . . . . . . . . . . . . . . . . . 1 xn1 xn2 xn3 . . . xnk      ; β =      β0 β1 . . . βk      ;e =      e1 e2 . . . en      . Renan Oliveira Regis Econometria 2 6 / 150
  7. 7. Métodos de MQO e aplicação em R Modelo de regressão Múltipla (Forma Matricial) y = Xβ + e      y1 y2 . . . yn      =      1 x11 x12 x13 . . . x1k 1 x21 x22 x23 . . . x2k . . . . . . . . . . . . . . . . . . . . . . 1 xn1 xn2 xn3 . . . xnk           β0 β1 . . . βk      +      e1 e2 . . . en      Renan Oliveira Regis Econometria 2 7 / 150
  8. 8. Métodos de MQO e aplicação em R Derivação das estimativas de mínimos quadrados ordinários Renan Oliveira Regis Econometria 2 8 / 150
  9. 9. Métodos de MQO e aplicação em R Derivação das estimativas de mínimos quadrados ordinários Renan Oliveira Regis Econometria 2 9 / 150
  10. 10. Métodos de MQO e aplicação em R Derivação das estimativas de mínimos quadrados ordinários Renan Oliveira Regis Econometria 2 10 / 150
  11. 11. Métodos de MQO e aplicação em R Derivação das estimativas de mínimos quadrados ordinários Agora, suponha que escolhamos β̂0 e β̂1 com a finalidade de fazer a soma dos quadrados dos resíduos, n X i=1 û2 i = n X i (yi − β̂0 − β̂1xi )2 tão pequena quanto possível. Ou Seja: MIM ˆ β0, ˆ β1 n X i (yi − β̂0 − β̂1xi )2 Já para k variáveis teremos: n X i=1 û2 i = n X i (yi − β̂0 − β̂1xi1 − .. − β̂k xik )2 Renan Oliveira Regis Econometria 2 11 / 150
  12. 12. Métodos de MQO e aplicação em R Solução β̂j = Pn i=1(xi − x̄)(yi − ȳ) Pn i=1(xi − x̄)2 OU β̂j = cov(x, y) var(x) Ou em forma matricial β̂ = (X ′ X)−1 X ′ y Renan Oliveira Regis Econometria 2 12 / 150
  13. 13. Métodos de MQO e aplicação em R Hipoteses Renan Oliveira Regis Econometria 2 13 / 150
  14. 14. Métodos de MQO e aplicação em R Hipoteses Renan Oliveira Regis Econometria 2 14 / 150
  15. 15. Métodos de MQO e aplicação em R Hipoteses Renan Oliveira Regis Econometria 2 15 / 150
  16. 16. Métodos de MQO e aplicação em R Hipoteses Renan Oliveira Regis Econometria 2 16 / 150
  17. 17. Métodos de MQO e aplicação em R Hipoteses Renan Oliveira Regis Econometria 2 17 / 150
  18. 18. Métodos de MQO e aplicação em R Hipoteses Renan Oliveira Regis Econometria 2 18 / 150
  19. 19. Métodos de MQO e aplicação em R Hipoteses Renan Oliveira Regis Econometria 2 19 / 150
  20. 20. Métodos de MQO e aplicação em R Hipoteses Renan Oliveira Regis Econometria 2 20 / 150
  21. 21. Métodos de MQO e aplicação em R Hipoteses Renan Oliveira Regis Econometria 2 21 / 150
  22. 22. Métodos de MQO e aplicação em R Aplicação wage = β0 +β1educ +β2exper +β3tenure +β4nonwhite +β5female +β6married+ β7numdep + e Variável Descrição wage salário médio por hora educ anos de educação exper anos de experiência tenure anos de experiência com o empregador atual nonwhite = 1 se não branco female = 1 se for feminino married = 1 se casado numdep número de dependentes Renan Oliveira Regis Econometria 2 22 / 150
  23. 23. Métodos de MQO e aplicação em R Aplicação Precisamos informa ao R onde os dados se encontram: Utilize a função setwd() e especifique o diretório dentro da função. OBS: Lembrar da barra dupla. Inserindo os dados no R dados = read.table("data.txt", header = T) Talvez seus dados precise do "sep" Anexado o banco de dados para que eu possa chamar as colunas pelos seus nomes. attach(dados) Renan Oliveira Regis Econometria 2 23 / 150
  24. 24. Métodos de MQO e aplicação em R Estatística descritiva max() min() mean() sd() Variável Máximo Mínimo Média Desvio Padrão wage 24,98 0,53 8,89 3,69 educ 18 0 12,56 2,76 expec 51 1 17,01 13,57 tenure 44 0 5,10 7,22 numped 6 0 1,04 1,26 Renan Oliveira Regis Econometria 2 24 / 150
  25. 25. Métodos de MQO e aplicação em R Estatística descritiva table() Frequência Variável 0 1 nonwhite 472 54 female 274 252 married 206 320 Renan Oliveira Regis Econometria 2 25 / 150
  26. 26. Métodos de MQO e aplicação em R Estatística descritiva Verificar se existe multicolinearidade entre as variáveis. (relação linear quase exata) x=cbind(educ,exper,tenure,numdep) cor(x) OBS: análisar a alta correlação entre exper e tenure. educ exper tenure numdep educ 1 -0,29 -0,05 -0,21 exper -0,29 1 0,49 -0,05 tenure -0,05 0,49 1 -0,02 numdep -0,21 -0,05 -0,02 1 Renan Oliveira Regis Econometria 2 26 / 150
  27. 27. Métodos de MQO e aplicação em R Modelo Completo Renan Oliveira Regis Econometria 2 27 / 150
  28. 28. Métodos de MQO e aplicação em R Teste de Normalidade: Jarque-Bera O teste de normalidade Jarque-Bera serve para identificar se os resíduos são normalmente distribuídos, esse teste é assintótico e quanto maior o tamanho da amostra mais confiável se torna. O objetivo desse teste é verificar se existe normalidade por meio do cálculo da assimetria e curtose dos resíduos que foram obtidos através do método de mínimos quadrados ordinários (MQO) (GUJARATI, 2011). A fórmula usada no teste: JB = T S2 6 + (c − 3)2 24 onde T é o tamanho da amostra, S e C são os coeficientes de assimetria e curtose, respectivamente. Esse teste leva em consideração a hipótese conjunta de que os resíduos são pertencentes a uma distribuição normal cujo os coeficientes S e C são iguais a 0 e 3 respectivamente. Renan Oliveira Regis Econometria 2 28 / 150
  29. 29. Métodos de MQO e aplicação em R Teste de Normalidade: Jarque-Bera Portanto para obter o resultado que os resíduos tem distribuição normal, a estatística de Jarque-Bera terá que ter valor igual a zero. A hipótese nula deste teste é que os resíduos seguem a distribuição normal (GUJARATI, 2011). Renan Oliveira Regis Econometria 2 29 / 150
  30. 30. Métodos de MQO e aplicação em R Variâncias Homocedásticos e Heterocedásticos: Teste de Konker A princípio é investigado a ocorrência de heterocedasticidades para os modelos de regressão linear. Na Figura, encontram-se os resultados do teste de homocedasticidade de Breusch e Pagan (1979) para os modelos estimados pela metodologia de MQO. O teste de homocedasticidade está sendo exposto com o intuito de verificar se as variâncias são constantes. O teste de Breusch Pagan não necessita da hipótese de normalidade e é mais poderoso do que o teste de Koenker e Bassett (1978) sobre normalidade. Hipótese nula é de homocedasticidade Renan Oliveira Regis Econometria 2 30 / 150
  31. 31. Métodos de MQO e aplicação em R Correção da heterocedasticidade Os dados são heterocedastico. teste de hipótese e intervalo de confiança não são mais válidos. Precisamos de um estimador para teste de hpótese e intervalo de confiança. temos os HC0 (White), HC1 (Hinkely), HC2 (Horn, Horn e Duncan), HC3 (Davidson e Mackninnon) e HC4 (Cribari-Neto (2004)). HC2, HC3 e HC4 executam o teste quasi-t e isso significa que são válidos sobre não normalidade. ▶ Cribari-Neto, F., Soares, A. C. N. (2003). Inferência em modelos heterocedásticos. Revista Brasileira de Economia, 57, 319-335. Renan Oliveira Regis Econometria 2 31 / 150
  32. 32. Métodos de MQO e aplicação em R Resultado com HC4 Renan Oliveira Regis Econometria 2 32 / 150
  33. 33. Métodos de MQO e aplicação em R Modelo completo: Salário em log Renan Oliveira Regis Econometria 2 33 / 150
  34. 34. Métodos de MQO e aplicação em R Normalidade e homocedasticidade Renan Oliveira Regis Econometria 2 34 / 150
  35. 35. Métodos de MQO e aplicação em R Ressultado com HC4 Renan Oliveira Regis Econometria 2 35 / 150
  36. 36. Métodos de MQO e aplicação em R Selecionando o modelo Renan Oliveira Regis Econometria 2 36 / 150
  37. 37. Métodos de MQO e aplicação em R modelo com tenure e sem exper Renan Oliveira Regis Econometria 2 37 / 150
  38. 38. Métodos de MQO e aplicação em R modelo sem tenure e com exper (modelo escolhido) Renan Oliveira Regis Econometria 2 38 / 150
  39. 39. Métodos de MQO e aplicação em R Conclusões do modelo final R2 = 0, 36. Sinal de Educação positivo. Sinal de experiência positivo. Sinal para casados positivo. Sinal para mulheres negativo. Renan Oliveira Regis Econometria 2 39 / 150
  40. 40. dados em painel 1 Ementa da disciplina 2 Métodos de MQO e aplicação em R 3 agrupamento de cortes transversais ao longo do tempo: métodos simples de dados em painel 4 Métodos avançados de dados em painel Renan Oliveira Regis Econometria 2 40 / 150
  41. 41. dados em painel Introdução conjuntos de dados que possuem as duas dimensões, corte transversal e séries temporais, estão sendo usados cada vez mais na pesquisa empírica. Um agrupamento independente de cortes transversais é obtido fazendo-se uma amostragem aleatória de dados de uma população grande, em diferentes períodos de tempo (em geral, mas não necessariamente em anos diferentes). ▶ Por exemplo, de cada ano, podemos extrair uma amostra aleatória de salários por hora, educação, experiência etc., da população de trabalhadores nos Estados Unidos. Do ponto de vista estatístico, esses conjuntos de dados possuem uma importante caracte-rística: consistem de observações amostrais coletadas independentemente. Renan Oliveira Regis Econometria 2 41 / 150
  42. 42. dados em painel Introdução Um agrupamento independente de cortes transversais difere de uma amostra aleatória única pelo fato de que fazer amostragem de uma população em períodos de tempo diferentes provavelmente levará a observações que não são distribuídas de maneira idêntica. ▶ Por exemplo, distribuições de salários e educação vêm mudando ao longo do tempo, na maioria dos países. Renan Oliveira Regis Econometria 2 42 / 150
  43. 43. dados em painel Introdução Um conjunto de dados em painel, embora tenha dimensões tanto de corte transversal como de série temporal, difere em alguns aspectos importantes de um agrupamento independente de cortes transversais. Para coletar dados em painel – algumas vezes chamados de dados longitudinais –, nós acompanhamos (ou tentamos acompanhar) os mesmos indivíduos, famílias, empresas, cidades, estados, ou o que seja, ao longo do tempo. ▶ Por exemplo, um conjunto de dados em painel sobre salários individuais, horas, educação e outros fatores é coletado fazendo-se uma seleção aleatória de pessoas de uma população em determinado momento. ▶ Depois, essas mesmas pessoas são entrevistadas em vários períodos de tempo subsequentes. Isso nos fornecerá dados sobre salários, horas, educação etc. do mesmo grupo de pessoas em anos diferentes. Renan Oliveira Regis Econometria 2 43 / 150
  44. 44. dados em painel Introdução Na análise econométrica de dados em painel, não podemos supor que as observações sejam independentemente distribuídas ao longo do tempo. ▶ Por exemplo, fatores não observados (como a aptidão) que afetaram o salário-hora de um indivíduo em 1990 também afetarão seu salário em 1991; ▶ fatores não observados que afetaram a taxa de criminalidade de uma cidade em 1985 também afetarão sua taxa de criminalidade em 1990. Por essa razão, modelos e métodos especiais foram desenvolvidos para analisar dados em painel. Renan Oliveira Regis Econometria 2 44 / 150
  45. 45. dados em painel Agrupamento independente de cortes transversais ao longo do tempo Se uma amostra aleatória for extraída a cada período de tempo, o agrupamento das amostras aleatórias resultantes produz um agrupamento independente de cortes transversais. Uma razão para usar agrupamentos independentes de cortes transversais é aumentar o tamanho da amostra. Ao agrupar amostras aleatórias extraídas da mesma população, mas em períodos de tempo diferentes, podemos obter estimadores mais precisos e estatísticas de testes mais poderosas. O agrupamento é útil nesse caso somente se a relação entre a variável dependente e pelo menos uma das variáveis independentes permanecer constante ao longo do tempo. Renan Oliveira Regis Econometria 2 45 / 150
  46. 46. dados em painel Agrupamento independente de cortes transversais ao longo do tempo Em geral, para refletir o fato de que a população pode ter distribuições diferentes em períodos de tempo diferentes, permitimos que o intercepto difira ao longo dos períodos, normalmente anos. Isso é facilmente conseguido com a inclusão de variáveis dummy para todos os anos menos um, em que o primeiro ano da amostra é habitualmente escolhido como o ano-base. Também é possível que a variância do erro mude ao longo do tempo, assunto que discutiremos mais tarde. Renan Oliveira Regis Econometria 2 46 / 150
  47. 47. dados em painel Agrupamento independente de cortes transversais ao longo do tempo Algumas vezes, o padrão dos coeficientes das variáveis dummy anuais é de interesse particular. ▶ Por exemplo, um demógrafo pode estar interessado na seguinte questão: depois de ter controlado a variável educação, o padrão de fertilidade entre mulheres com mais de 35 anos mudou entre 1972 e 1984? O seguinte exemplo ilustra como essa questão pode ser respondida de maneira simples, com o uso da análise de regressão múltipla com variáveis dummy anuais. Renan Oliveira Regis Econometria 2 47 / 150
  48. 48. dados em painel Fertilidade feminina ao longo do tempo Os dados provém do General Social Survey (Pesquisa Social Geral) do National Opinion Research Center (Centro de Pesquisa de Opinião Nacional) para os anos de 1972 a 1984, inclusive. Usamos esses dados para estimar um modelo que explique o número total de nascimentos por mulheres (kids). o que aconteceu com as taxas de fertilidade ao longo do tempo? Os fatores que controlamos são anos de educação, idade, raça, região do país onde as mulheres residiam quando tinham 16 anos e ambiente em que viviam quando tinham essa mesma idade. O ano-base é 1972. Renan Oliveira Regis Econometria 2 48 / 150
  49. 49. dados em painel Fertilidade feminina ao longo do tempo Renan Oliveira Regis Econometria 2 49 / 150
  50. 50. dados em painel Aplicação no R Rstudio Data1 Renan Oliveira Regis Econometria 2 50 / 150
  51. 51. dados em painel Fertilidade feminina ao longo do tempo: Conclusões Os coeficientes das variáveis dummy anuais mostram uma nítida queda da fertilidade no início dos anos 1980. ▶ Por exemplo, o coeficiente de y82 indica que mantendo fixos educação (educ), idade (age) e outros fatores, uma mulher teve, em média, 0,52 menos filhos em 1982 do que em 1972. ▶ Isso é uma queda bastante grande: mantendo fixos educ, age e os outros fatores, prevê-se que 100 mulheres em 1982 teriam 52 crianças a menos se comparadas com 100 mulheres em 1972. Os coeficientes de y82 e y84 representam queda na fertilidade por razões que não estão captadas nas variáveis explicativas. R2 = 0, 12 com as dummys e R2 = 0, 10 se retirar as dummys. Educ com sinal negativo. O modelo estimado presume que o efeito de cada variável explicativa, particularmente a da educação, permaneceu constante. Isso pode ou não ser verdade; Renan Oliveira Regis Econometria 2 51 / 150
  52. 52. dados em painel Agrupamento independente de cortes transversais ao longo do tempo Podemos também interagir uma variável dummy anual com variáveis explicativas básicas para verificar se o efeito dessa variável mudou ao longo de certo período de tempo. O próximo exemplo examina como o retorno da educação e a diferença salarial por gênero mudaram de 1978 a 1985. Renan Oliveira Regis Econometria 2 52 / 150
  53. 53. dados em painel Mudanças no retorno da educação e a diferença salarial por gênero Renan Oliveira Regis Econometria 2 53 / 150
  54. 54. dados em painel Mudanças no retorno da educação e a diferença salarial por gênero O intercepto de 1978 é β0, e o intercepto de 1985 é β0 + δ0. O retorno da educação em 1978 é β1, e o retorno da educação em 1985 é β1 + δ1. ▶ Portanto, δ1 mede como o retorno de mais um ano de estudo mudou ao longo do período de sete anos. Finalmente, em 1978 o diferencial log(wage) entre homens e mulheres é β5; o diferencial em 1985 é β5 + δ5. Assim, podemos testar a hipótese nula de que nada aconteceu com o diferencial por gênero ao longo desse período de sete anos, fazendo o teste H0 : δ5 = 0. A hipótese alternativa de que o diferencial por gênero tenha sido reduzido é H1 : δ5 0. Para simplificar, presumimos que a experiência e a filiação sindical têm o mesmo efeito sobre os salários em ambos os períodos de tempo. Renan Oliveira Regis Econometria 2 54 / 150
  55. 55. dados em painel Mudanças no retorno da educação e a diferença salarial por gênero Renan Oliveira Regis Econometria 2 55 / 150
  56. 56. dados em painel Mudanças no retorno da educação e a diferença salarial por gênero Renan Oliveira Regis Econometria 2 56 / 150
  57. 57. dados em painel Agrupamento independente de cortes transversais ao longo do tempo O que acontece se fizermos a interação de todas as variáveis independentes com y85 na equação (13.2)? Seria o mesmo que estimarmos duas equações separadas, uma para 1978 e outra para 1985. Algumas vezes, isso é preferível. Renan Oliveira Regis Econometria 2 57 / 150
  58. 58. dados em painel análise de decisão de políticas com agrupamentos de cortes transversais Cortes transversais agrupados podem ser muito úteis para a avaliação do impacto de determinado evento ou decisão política. O exemplo seguinte de um estudo de evento mostra como dois conjuntos de dados de cortes transversais, coletados antes e depois da ocorrência de um evento, podem ser usados para determinar seu efeito sobre resultados econômicos. Renan Oliveira Regis Econometria 2 58 / 150
  59. 59. dados em painel Efeito da localização de um incinerador de lixo sobre os preços de imóveis Kiel e McClain (1995) estudaram o efeito que um novo incinerador de lixo teve sobre os valores dos imóveis em North Andover, Massachusetts. Utilizaremos dados de dois anos e alguns modelos simplificados, mas nossa análise é semelhante à deles. Utilizaremos dados de preços dos imóveis vendidos em 1978 e outra amostra dos vendidos em 1981. A hipótese é que os preços dos imóveis localizados próximos do incinerador cairiam em relação aos preços dos imóveis mais distantes. Renan Oliveira Regis Econometria 2 59 / 150
  60. 60. dados em painel Efeito da localização de um incinerador de lixo sobre os preços de imóveis Renan Oliveira Regis Econometria 2 60 / 150
  61. 61. dados em painel Efeito da localização de um incinerador de lixo sobre os preços de imóveis Como essa é uma regressão simples sobre uma única variável dummy, o intercepto é a média dos preços de venda dos imóveis afastados do incinerador, enquanto o coeficiente de nearinc é a diferença no preço médio de venda entre os imóveis situados próximos ao incinerador e os distantes dele. A estimativa mostra que o preço médio de venda dos imóveis para o primeiro grupo era de 30.688,27 dólares a menos que o do segundo grupo. Renan Oliveira Regis Econometria 2 61 / 150
  62. 62. dados em painel Efeito da localização de um incinerador de lixo sobre os preços de imóveis Renan Oliveira Regis Econometria 2 62 / 150
  63. 63. dados em painel Efeito da localização de um incinerador de lixo sobre os preços de imóveis Como, então, podemos dizer se a construção de um novo incinerador reduz os valores dos imóveis? ▶ O segredo está em verificar como o coeficiente de nearinc mudou entre 1978 e 1981. Renan Oliveira Regis Econometria 2 63 / 150
  64. 64. dados em painel Efeito da localização de um incinerador de lixo sobre os preços de imóveis Renan Oliveira Regis Econometria 2 64 / 150
  65. 65. dados em painel Efeito da localização de um incinerador de lixo sobre os preços de imóveis O parâmetro de interesse está no termo de interação y81×nearinc: δ1 mede o declínio nos valores dos imóveis em razão do novo incinerador. Renan Oliveira Regis Econometria 2 65 / 150
  66. 66. dados em painel Efeito da localização de um incinerador de lixo sobre os preços de imóveis Renan Oliveira Regis Econometria 2 66 / 150
  67. 67. dados em painel Efeito da localização de um incinerador de lixo sobre os preços de imóveis Além das variáveis de idade na coluna (2), a coluna (3) controla a distância até a rodovia interestadual (intst), a área do terreno (land), a área construída (area), o nú-mero de quartos (rooms) e o número de banheiros (baths). Isso produz uma estimativa de y81×nearinc mais próxima daquela sem nenhum controle, mas produz um erro padrão muito menor. torna δ1 mais significativa. Renan Oliveira Regis Econometria 2 67 / 150
  68. 68. dados em painel Efeito da localização de um incinerador de lixo sobre os preços de imóveis (log do preço) OBS: O Livro errou no resultado e o correto é 0,063, ou seja, uma redução de 6, 3% Renan Oliveira Regis Econometria 2 68 / 150
  69. 69. dados em painel Aplicação no R Ver no Rstudio (data2) Renan Oliveira Regis Econometria 2 69 / 150
  70. 70. dados em painel Diferrenças em diferrenças (Diff-Diif) A metodologia utilizada no exemplo anterior tem inúmeras aplicações, especialmente quando os dados são provenientes de um experimento natural (ou quase experimento). ▶ Um experimento natural ocorre quando algum evento exógeno — frequentemente uma mudança na política governamental — altera o ambiente no qual indivíduos, famílias, empresas ou cidades operam. ▶ Um experimento natural sempre tem um grupo de controle, que não é afetado pela mudança na política, e um grupo de tratamento, que é afetado pela mudança na política. Renan Oliveira Regis Econometria 2 70 / 150
  71. 71. dados em painel Diferrenças em diferrenças (Diff-Diif) Para controlar diferenças sistemáticas entre os grupos de controle e de tratamento, necessitamos de dois anos de dados, um anterior à mudança na política e outro após a mudança. Assim, nossa amostra será convenientemente dividida em quatro grupos: 1 o grupo de controle antes da mudança, 2 o grupo de controle após a mudança, 3 o grupo de tratamento antes da mudança 4 e o grupo de tratamento após a mudança. Renan Oliveira Regis Econometria 2 71 / 150
  72. 72. dados em painel Diferrenças em diferrenças (Diff-Diif) Renan Oliveira Regis Econometria 2 72 / 150
  73. 73. dados em painel Diferrenças em diferrenças (Diff-Diif):efeito médio de tratamento (1) calculando as di-ferenças nas médias entre os grupos de tratamento e de controle em cada período de tempo e depois tirando a primeira diferença dos resultados ao longo do tempo; Ou Rearranjando: (2) calculando a alteração nas médias ao longo do tempo de cada um dos grupos de tratamento e controle, e então tirando a primeira diferença dessas alterações, o que significa que simplesmente escrevemos Renan Oliveira Regis Econometria 2 73 / 150
  74. 74. dados em painel Diferrenças em diferrenças (Diff-Diif) Renan Oliveira Regis Econometria 2 74 / 150
  75. 75. dados em painel Efeitos das leis de indenizações trabalhistas sobre os prazos de afastamento dos trabalhadores Em 15 de julho de 1980, o estado norte-americano de Kentucky aumentou o limite dos ganhos semanais que eram cobertos por essa remuneração (indenização por acidente). Um aumento no limite não tem efeito sobre os benefícios para os trabalhadores de baixa renda, mas torna menos oneroso para um trabalhador de alta renda permanecer afastado recebendo indenização trabalhista. ▶ Portanto, o grupo de controle é o dos trabalhadores de baixa renda, ▶ e o grupo de tratamento é o dos trabalhadores de alta renda; trabalhadores de alta renda são definidos como os que estavam posicionados no teto antes da mudança na política do governo. ▶ Usando amostras aleatórias, tanto do período anterior como do período posterior à mudança. Renan Oliveira Regis Econometria 2 75 / 150
  76. 76. dados em painel Efeitos das leis de indenizações trabalhistas sobre os prazos de afastamento dos trabalhadores Objetivo ▶ Testar se uma remuneração mais generosa faria com que os trabalhadores ficassem mais tempo sem trabalhar (tudo mais mantido inalterado). usando log(durat) como a variável dependente. Façamos afchnge representar uma variável dummy das observações após a mudança da política e highearn, a variável dos trabalhadores de altos rendimentos. Renan Oliveira Regis Econometria 2 76 / 150
  77. 77. dados em painel Efeitos das leis de indenizações trabalhistas sobre os prazos de afastamento dos trabalhadores Renan Oliveira Regis Econometria 2 77 / 150
  78. 78. dados em painel Análise de dados em painel de dois períodos Retornamos agora à análise do tipo mais simples de dados em painel: para um corte transversal de indivíduos, escolas, empresas, cidades, ou o que seja, temos dados de dois anos; vamos chamá-los de t = 1 e t = 2. ▶ Por exemplo, taxas de criminalidade e de desemprego de 46 cidades em 1982 e 1987. Portanto, t = 1 corresponde a 1982 e t = 2, a 1987. Renan Oliveira Regis Econometria 2 78 / 150
  79. 79. dados em painel Análise de dados em painel de dois períodos O que acontece se usarmos o corte transversal de 1987 e executarmos uma regressão simples de crmrte sobre unem? Obteremos Se interpretarmos de forma causal, a equação estimada implica aumento na taxa de desemprego que reduz a taxa de criminalidade. Com certeza, isso não é o que esperávamos. O coeficiente de unem não é estatisticamente significante aos níveis padrão de significância. na melhor das hipóteses, não encontramos ligação entre as taxas de criminalidade e desemprego. Renan Oliveira Regis Econometria 2 79 / 150
  80. 80. dados em painel Análise de dados em painel de dois períodos Como temos enfatizado ao longo deste texto, essa equação de regressão simples possivelmente sofre do problema de variáveis omitidas. Um modo alternativo de usar dados em painel é separar os fatores não observados que afetam a variável dependente em dois tipos: os que são constantes e os que variam ao longo do tempo. ▶ Fazendo i representar a unidade de corte transversal e t o período de tempo, podemos escrever um modelo com uma única variável explicativa observada como: Na notação yit, i é a pessoa, empresa, cidade etc., e t é o período de tempo. A variável d2t é uma variável dummy igual a zero quando t = 1 e igual a um quando t = 2; A variável ai capta todos os fatores não observados, constantes no tempo, que afetam yit( (O fato de ai não ter um subscrito t nos diz que ele não muda ao longo do tempo.). Renan Oliveira Regis Econometria 2 80 / 150
  81. 81. dados em painel Análise de dados em painel de dois períodos (ai) De forma genérica, ai é chamado de efeito não observado. ▶ Também é comum no trabalho aplicado encontrar ai referido como efeito fixo, o que nos ajuda a lembrar que ai é fixo ao longo do tempo. ▶ O modelo é chamado de modelo de efeitos não observados ou modelo de efeitos fixos. ▶ Em aplicações, pode-se encontrar também ai referido como heterogeneidade não observada (ou heterogeneidade do indivíduo, heterogeneidade da empresa, heterogeneidade da cidade etc.). O erro uit muitas vezes é chamado de erro idiossincrático ou erro de variação temporal, porque ele representa fatores não observados que mudam ao longo do tempo e afetam yit. ▶ Eles são muito parecidos com os erros em uma equação de regressão de série temporal. Renan Oliveira Regis Econometria 2 81 / 150
  82. 82. dados em painel Análise de dados em painel de dois períodos Renan Oliveira Regis Econometria 2 82 / 150
  83. 83. dados em painel Análise de dados em painel de dois períodos Como devemos estimar o parâmetro de interesse, β1, a partir de dois anos de dados em painel? Teremos de presumir o efeito não observado, ai , como não correlacionado com xit. O problema é que ai pode está correlacionado com xit e teremos estimativas viesadas. Embora o sinal do coeficiente de unem está correto, apresenta ser não significativa. Renan Oliveira Regis Econometria 2 83 / 150
  84. 84. dados em painel Análise de dados em painel de dois períodos Na maioria das aplicações, a principal razão para coletar dados em painel é considerar que o efeito não observado, ai , é correlacionado com as variáveis explicativas. Isso acaba sendo fácil de fazer: como ai é constante ao longo do tempo, podemos diferenciar os dados no decorrer dos dois anos. Renan Oliveira Regis Econometria 2 84 / 150
  85. 85. dados em painel Análise de dados em painel de dois períodos A equação, que chamamos de equação de primeiras diferenças, é muito simples. O MQO em equações de diferença é chamado de estimador de primeira diferença (PD) Renan Oliveira Regis Econometria 2 85 / 150
  86. 86. dados em painel Análise de dados em painel de dois períodos Sinal positivo e significativo. Renan Oliveira Regis Econometria 2 86 / 150
  87. 87. dados em painel Análise de dados em painel de dois períodos (alguns problemas) Embora a diferenciação de dados em painel de dois anos seja um meio poderoso de controlar efeitos não observados, isso tem um custo. ▶ Primeiro, os conjuntos de dados em painel são mais difíceis de coletar do que um corte transversal, especialmente de indivíduos. Precisamos usar uma pesquisa e acompanhar o indivíduo para uma pesquisa complementar. Em unidades como empresas, algumas delas podem falir ou passar por uma fusão com outras empresas. Dados em painel são mais fáceis de ser obtidos de escolas, cidades, municípios, estados e países. ▶ ∆xi pode não ter muita variação. Elevando o erro padrão. ▶ xi não pode ser dummy que não pode mudar ao longo do tempo. EX: dummy de sexo. (Uma mulher vai sempre ser mulher ∆xi ) Renan Oliveira Regis Econometria 2 87 / 150
  88. 88. dados em painel Análise de dados em painel de dois períodos (Exemplo problemático) Como exemplo, considere o problema de estimar o retorno da educação, desta vez usando dados em painel de indivíduos, de dois anos. O modelo por pessoa i é em que ai contém aptidão não observada — que provavelmente é correlacionada com educit(aptidão inata não muda ao longo do tempo). Novamente, consideramos interceptos diferentes ao longo do tempo, para levar em conta ganhos de produtividade agregados. Renan Oliveira Regis Econometria 2 88 / 150
  89. 89. dados em painel Análise de dados em painel de dois períodos (Exemplo problemático) O problema é que estamos interessados nos adultos que trabalham, e para a maioria dos indivíduos empregados, a educação não muda ao longo do tempo. Renan Oliveira Regis Econometria 2 89 / 150
  90. 90. dados em painel Análise de dados em painel de dois períodos (Exemplo problemático) A adição de muitas variáveis explicativas não causa dificuldades. Iniciamos com o modelo de efeitos não observados Devemos adicionar maior número de variáveis explicativas para reduzir as chances de ter variáveis não observaveis correlacionadas com x. Renan Oliveira Regis Econometria 2 90 / 150
  91. 91. dados em painel Dormir versus trabalhar Estimar a relação de substituição entre o tempo gasto dormindo e trabalhando. slpnap é o tempo gasto dormindo. totwrk é o tempo gasto trabalhando. A variável educ representa anos de escolaridade. marr é uma variável dummy que indica o estado civil. yngkid é uma variável dummy que indica a presença de criança pequena e gdhlth é uma variável dummy que indica se a pessoa goza de boa saúde. Renan Oliveira Regis Econometria 2 91 / 150
  92. 92. dados em painel Dormir versus trabalhar As demais variáveis são não significativas. Renan Oliveira Regis Econometria 2 92 / 150
  93. 93. dados em painel Aplicação no R Data3 Renan Oliveira Regis Econometria 2 93 / 150
  94. 94. dados em painel Defasagens distribuídas da taxa de criminalidade sobre a taxa de esclarecimento de crimes Eide (1994) utiliza dados em painel de distritos policiais da Noruega para estimar um modelo de defasagens distribuídas de taxas de criminalidade. A única variável explicativa é o “percentual de esclarecimento” de crimes (clrprc) — a porcentagem de crimes que levaram a uma condenação. Os dados sobre a taxa de criminalidade são dos anos de 1972 e 1978. Renan Oliveira Regis Econometria 2 94 / 150
  95. 95. dados em painel Defasagens distribuídas da taxa de criminalidade sobre a taxa de esclarecimento de crimes Renan Oliveira Regis Econometria 2 95 / 150
  96. 96. dados em painel Organização dos dados em painel (Primeira forma) Crimes é a quantidade de crimes cometidos. unem é a taxa de desemprego. d87 é dummy que indica 1 se em 1987 e 0 se em 1982. A melhor maneira de armazenar os dados é ter dois registros para cada cidade, um para cada ano: o primeiro registro de cada cidade corresponde ao ano mais antigo, e o segundo ao ano mais recente. crimes unem d87 17136 8.2 0 17306 3.7 1 75654 8.1 0 83960 5.4 1 ... ... ... Renan Oliveira Regis Econometria 2 96 / 150
  97. 97. dados em painel Organização dos dados em painel (Segunda forma) Uma segunda maneira de organizar dois períodos de dados em painel é ter apenas um registro por unidade de corte transversal. Isso exige duas entradas para cada variável, uma para cada período de tempo. crimes1982 crimes 1987 unem1982 unem 1987 17136 8.2 17306 3.7 75654 8.1 83960 5.4 ... ... ... ... Renan Oliveira Regis Econometria 2 97 / 150
  98. 98. dados em painel Análise de decisões de políticas com dados em painel de dois períodos Conjuntos de dados em painel são muito úteis para a análise de decisões de políticas, particularmente na avaliação de programas. Na estrutura mais simples de avaliação de programas, uma amostra de indivíduos, firmas, cidades etc. é obtida no primeiro período de tempo. ▶ Algumas dessas unidades, as pertencentes ao grupo de tratamento, farão parte de um programa específico em um período de tempo posterior; ▶ as que não farão parte estão no grupo de controle. Isso é semelhante à literatura sobre experimentos naturais discutida anteriormente, com uma importante diferença: as mesmas unidades do corte transversal aparecem em cada período de tempo. Renan Oliveira Regis Econometria 2 98 / 150
  99. 99. dados em painel Análise de decisões de políticas com dados em painel de dois períodos suponha que queiramos avaliar o efeito de um programa de treinamento de pessoal de Michigan sobre a produtividade dos trabalhadores de firmas manufatureiras. scrapit representar a taxa de refugo dos produtos da firma i durante o ano t (o número de itens, em cada 100, que devem ser rejeitados por causa dos defeitos). Seja grantit um indicador binário igual a um se a firma i no ano t recebeu subsídio de treinamento de pessoal. Para os anos de 1987 e 1988, o modelo é em que y88t é uma variável dummy para 1988 e ai é o efeito não observado da firma ou o efeito fixo da firma. Renan Oliveira Regis Econometria 2 99 / 150
  100. 100. dados em painel Análise de decisões de políticas com dados em painel de dois períodos Renan Oliveira Regis Econometria 2 100 / 150
  101. 101. dados em painel Análise de decisões de políticas com dados em painel de dois períodos Renan Oliveira Regis Econometria 2 101 / 150
  102. 102. dados em painel Análise de decisões de políticas com dados em painel de dois períodos log(scrapcontrole) − log(scraptratado) = −0, 317 Fazendo a exponenciação e a subtração, temos scrapcontrole − scraptratado scraptratado = exp(−0, 317) − 1 = −0, 272 Renan Oliveira Regis Econometria 2 102 / 150
  103. 103. dados em painel Análise de decisões de políticas com dados em painel de dois períodos Renan Oliveira Regis Econometria 2 103 / 150
  104. 104. dados em painel Análise de decisões de políticas com dados em painel de dois períodos Se a participação no programa ocorrer nos dois períodos, ˆ β1 não pode ser escrito como em diff-diff, mas o interpretamos da mesma maneira: ele é a mudança no valor médio de y em razão da participação no programa. Renan Oliveira Regis Econometria 2 104 / 150
  105. 105. dados em painel Efeitos da legislação a respeito da condução de veículos sob embriaguez sobre as fatalidades no trânsito Dois tipos de leis que estudaremos aqui são as leis de recipientes abertos. 1 que consideram ilegal os passageiros de um veículo ter em seu poder recipientes abertos de bebidas alcoólicas. 2 e as leis administrativas propriamente ditas — que autorizam a Justiça a suspender a carteira de habilitação do motorista preso por dirigir embriagado, mesmo antes de sua con-denação. Uma análise convincente utiliza dados em painel de um período de tempo em que alguns estados tenham adotado novas leis (e alguns estados que tenham revogado as leis até então existentes). Renan Oliveira Regis Econometria 2 105 / 150
  106. 106. dados em painel Efeitos da legislação a respeito da condução de veículos sob embriaguez sobre as fatalidades no trânsito A variável dependente é o número de mortes no trânsito por 100 milhões de milhas (dthrte). Em 1985, 19 estados tinham leis de recipientes abertos, enquanto 22 estados tinham essas leis em 1990. Em 1985, 21 estados tinham leis administrativas propriamente ditas; esse número subiu para 29 em 1990. Renan Oliveira Regis Econometria 2 106 / 150
  107. 107. dados em painel Efeitos da legislação a respeito da condução de veículos sob embriaguez sobre as fatalidades no trânsito As estimativas sugerem que a adoção de uma lei de recipientes abertos reduziu a taxa de fatalidades no trânsito em 0,42, efeito nada desprezível considerando que a taxa média de mor-talidade em 1985 era de 2,7. A lei administrativa propriamente dita tem efeito menor, e sua estatística t é de somente 21,29; mas as estimativas dão os sinais que esperávamos. O intercepto nessa equação mostra que as fatalidades no trânsito caíram substancialmente em todos os estados ao longo do período de cinco anos, tenha ou não havido mudanças de leis. Renan Oliveira Regis Econometria 2 107 / 150
  108. 108. dados em painel Aplicação no R Data4 Renan Oliveira Regis Econometria 2 108 / 150
  109. 109. dados em painel A diferenciação com mais de dois períodos de tempo Renan Oliveira Regis Econometria 2 109 / 150
  110. 110. dados em painel A diferenciação com mais de dois períodos de tempo Renan Oliveira Regis Econometria 2 110 / 150
  111. 111. dados em painel A diferenciação com mais de dois períodos de tempo Prova no quadro. Com T ≥ 3, as mudanças nas dummies de tempo podem assumir os valores −1, 0, 1. Se não estivermos interessados nos valores de δt, é mais fácil incluir dummies de tempo no modelo diferenciado. perdemos uma dummy de tempo, já que perdemos as observações do primeiro período. Generalizando Renan Oliveira Regis Econometria 2 111 / 150
  112. 112. dados em painel Observação Como existe varios periodos de tempo, então poderemos ter erros correlacionados ao longo do tempo. O que é correlação serial? ▶ Autocorrelação (correlação serial) de primeira ordem: correlação existente entre uma observação i qualquer e a observação imediatamente anterior (i-1). Autocorrelação (correlação serial) de ordem q: correlação existente entre uma observação i qualquer e a observação anterior (i-q). Teste de correlação: library(car) durbinWatsonTest(modelo1) Caso possuisse teria que usar o estimador de correção: library(sandwich) coeftest(modelo1, vcov. = vcovHAC(modelo1)) note que é diferente do HC4. Serve para teste de hipotese. Renan Oliveira Regis Econometria 2 112 / 150
  113. 113. dados em painel Efeitos das zonas industriais sobre os pedidos de seguro-desemprego Papke (1994) estudou o efeito do programa de instalação de zonas industriais (ZI) no estado norte-americano de Indiana sobre os pedidos de seguro-desemprego. Ela analisou 22 cidades de Indiana ao longo do período de 1980 a 1988. Seis zonas industriais foram criadas em 1984 e mais quatro em 1985. Doze das cidades da amostra não criaram zonas industriais nesse período; elas serviram como grupo de controle. Renan Oliveira Regis Econometria 2 113 / 150
  114. 114. dados em painel Efeitos das zonas industriais sobre os pedidos de seguro-desemprego θt representa o conjunto de todas as dummies de tempo. A variável binária ziit era igual a um se a cidade i no tempo t possuía uma zona industrial; estamos interessados em β1. O efeito não observado ai representa fato-res fixos que afetam o meio ambiente econômico na cidade i. ▶ Como o estabelecimento de zonas industriais não foi feito de maneira aleatória — zonas industriais normalmente são estabelecidas em áreas economicamente debilitadas — é provável que ziit e ai sejam positivamente correlacionados Renan Oliveira Regis Econometria 2 114 / 150
  115. 115. dados em painel Efeitos das zonas industriais sobre os pedidos de seguro-desemprego Renan Oliveira Regis Econometria 2 115 / 150
  116. 116. dados em painel Aplicação no R data5 A estimativa de β1 é β1 = −0, 182 (erro padrão = 0, 078). Portanto, parece que a presença de uma ZI provoca uma queda aproximada de 16,6% [exp(−0, 182) − 1 −0, 166 nos pedidos de seguro-desemprego. Esse é um efeito economicamente grande e estatisticamente significante. Renan Oliveira Regis Econometria 2 116 / 150
  117. 117. dados em painel Taxas de criminalidade municipais na Carolina do Norte Cornwell e Trumbull (1994) usaram dados de 90 municípios da Carolina do Norte, dos anos de 1981 a 1987, para estimar um modelo de efeitos não observados da crimi-nalidade; A taxa de criminalidade é o número de crimes por pessoa, prbarr é a probabilidade estimada de prisão, prbconv é a probabilidade de condenação (tendo havido uma prisão), prbpris é a probabilidade de cumprir pena prisional (tendo havido uma condenação), avgsen é a duração média da sentença cumprida e polpc é o número de policiais per capita. Renan Oliveira Regis Econometria 2 117 / 150
  118. 118. dados em painel Taxas de criminalidade municipais na Carolina do Norte Renan Oliveira Regis Econometria 2 118 / 150
  119. 119. dados em painel Resultado e aplicação no R Data6 a estimativa para polpac aumento de 1% no número de policiais per capita aumenta a taxa de criminalidade em cerca de 0,4%. ▶ O que estará acontecendo aqui? Existem pelo me-nos duas possibilidades. 1 Primeiro, a variável da taxa de criminalidade é calculada com base nos crimes denunciados. Pode ser que, quando há mais policiais, mais crimes são registrados. 2 Segundo, a variável do número de policiais pode ser endógena na equação por outras razões: os municípios podem aumentar a força policial quando preveem aumento da criminalidade. Renan Oliveira Regis Econometria 2 119 / 150
  120. 120. Métodos avançados de dados em painel 1 Ementa da disciplina 2 Métodos de MQO e aplicação em R 3 agrupamento de cortes transversais ao longo do tempo: métodos simples de dados em painel 4 Métodos avançados de dados em painel Renan Oliveira Regis Econometria 2 120 / 150
  121. 121. Métodos avançados de dados em painel Métodos avançados de dados em painel Discutiremos o estimador de efeitos fixos que, assim como a primeira diferença, usa transformação para remover o efeito não observado ai antes da estimação. Quaisquer variáveis explicativas constantes no tempo são removidas com ai . O estimador de efeitos aleatórios é importante quando pensamos que o efeito não observado é não correlacionado com todas as variáveis explicativas. Posteriormente, introduziremos a nova abordagem de efeitos aleatórios correlacionados, que fornece uma síntese de efeitos fixos e métodos de efeitos aleatórios, e que tem se mostrado muito útil na prática. Renan Oliveira Regis Econometria 2 121 / 150
  122. 122. Métodos avançados de dados em painel Estimação de efeitos fixos A primeira diferença é apenas uma das muitas maneiras de eliminar o efeito fixo, ai . Um método alternativo que funciona melhor sob certas hipóteses é chamado de transformação de efeitos fixos. Para verificar o que esse método envolve, considere um modelo com uma única variável explicativa: para cada i, Renan Oliveira Regis Econometria 2 122 / 150
  123. 123. Métodos avançados de dados em painel Estimação de efeitos fixos Renan Oliveira Regis Econometria 2 123 / 150
  124. 124. Métodos avançados de dados em painel Estimação de efeitos fixos O importante sobre a equação (14.3) é que o efeito não observado, ai , desapareceu. Um estimador MQO agrupado baseado em variáveis temporais reduzidas é chamado de estimador de efeitos fixos ou estimador intragrupo. Esse último nome vem do fato de que o MQO em (14.3) usa a variação temporal em y e x dentro de cada observação do corte transversal. Renan Oliveira Regis Econometria 2 124 / 150
  125. 125. Métodos avançados de dados em painel Estimação de efeitos fixos Renan Oliveira Regis Econometria 2 125 / 150
  126. 126. Métodos avançados de dados em painel Estimação de efeitos fixos: hipoteses Renan Oliveira Regis Econometria 2 126 / 150
  127. 127. Métodos avançados de dados em painel Estimação de efeitos fixos: hipoteses Renan Oliveira Regis Econometria 2 127 / 150
  128. 128. Métodos avançados de dados em painel Estimação de efeitos fixos: hipoteses Renan Oliveira Regis Econometria 2 128 / 150
  129. 129. Métodos avançados de dados em painel Estimação de efeitos fixos: hipoteses Renan Oliveira Regis Econometria 2 129 / 150
  130. 130. Métodos avançados de dados em painel Estimação de efeitos fixos: hipoteses Renan Oliveira Regis Econometria 2 130 / 150
  131. 131. Métodos avançados de dados em painel Estimação de efeitos fixos: hipoteses Renan Oliveira Regis Econometria 2 131 / 150
  132. 132. Métodos avançados de dados em painel Estimação de efeitos fixos: hipoteses Renan Oliveira Regis Econometria 2 132 / 150
  133. 133. Métodos avançados de dados em painel estimação de efeitos fixos O estimador de efeitos fixos leva em conta uma correlação arbitrária entre ai e as variáveis explicativas em qualquer período de tempo, como na primeira diferença. Por esse motivo, qualquer variável explicativa que seja constante ao longo do tempo para todo i é removida pela transformação de efeitos fixos: ẍit = 0 para todo i e t, se xit for constante ao longo de t. ▶ Portanto, não podemos incluir variáveis tais como sexo ou distância de uma cidade até um rio. Renan Oliveira Regis Econometria 2 133 / 150
  134. 134. Métodos avançados de dados em painel Efeito do treinamento de pessoal sobre as taxas de refugos de produtos das empresas Utilizamos os dados de três anos, 1987, 1988 e 1989, de 54 empresas que informaram suas taxas de refugos em cada ano. Nenhuma das empresas havia recebido subsídio de treinamento antes de 1988; em 1988, 19 empresas receberam subsídios; em 1989, outras 10 empresas receberam subsídios. Portanto, também devemos considerar a possibilidade de que o treinamento adicional de pessoal em 1988 tenha tornado os trabalhadores mais produtivos em 1989. Isso é feito com facilidade com a inclusão de um valor defasado do indicador de subsídios. Também incluímos dummies anuais para 1988 e 1989. Renan Oliveira Regis Econometria 2 134 / 150
  135. 135. Métodos avançados de dados em painel Efeito do treinamento de pessoal sobre as taxas de refugos de produtos das empresas Renan Oliveira Regis Econometria 2 135 / 150
  136. 136. Métodos avançados de dados em painel Efeito do treinamento de pessoal sobre as taxas de refugos de produtos das empresas Como a variável dependente está na forma logarítmica, prevê-se que a obtenção de um subsídio em 1988 reduz a taxa de refugo da empresa em 1989 em cerca de 34,4% (exp(−0, 422) − 1) = −0, 344; O coeficiente de d89 indica que a taxa de refugo foi substancialmente menor em 1989 do que no ano-base, 1987, mesmo na ausência de subsídios de treinamento de pessoal. Renan Oliveira Regis Econometria 2 136 / 150
  137. 137. Métodos avançados de dados em painel Interpretação do R2 O R-quadrado dado é baseado na transformação intragrupo: ele é o R-quadrado obtido da estimativa de (14.5). Assim, ele é interpretado como o montante da variação temporal em yit, que é explicada pela variação temporal nas variáveis explicativas. Renan Oliveira Regis Econometria 2 137 / 150
  138. 138. Métodos avançados de dados em painel Estimação de efeitos fixos Embora variáveis constantes no tempo não possam ser incluídas por si mesmas em um modelo de efeitos fixos, elas podem interagir com variáveis que mudam ao longo do tempo e, particularmente, com variáveis dummy anuais. ▶ Por exemplo, em uma equação de salários na qual a educação é constante ao longo do tempo para cada indivíduo em nossa amostra, podemos interagir a educação com cada dummy anual para verificar como o retorno da educação mudou ao longo do tempo. Renan Oliveira Regis Econometria 2 138 / 150
  139. 139. Métodos avançados de dados em painel O retorno da educação mudou no transcorrer do tempo? Cada um dos 545 homens na amostra trabalhou em todos os anos de 1980 a 1987. Algumas variáveis no conjunto de dados mudam ao longo do tempo: experiência, estado civil e filiação sindical são as três mais importantes. Outras variáveis não mudam: raça e educação são os principais exemplos. Se usarmos efeitos fixos (ou primeira diferença), não poderemos incluir raça, educação na equação. Todavia, podemos incluir interações de educ com dummies anuais para 1981 a 1987, para testar se o retorno da educação foi constante ao longo desse período de tempo. Usamos log(salário) como variável dependente, variáveis dummy para estado civil e filiação sindical, um conjunto completo de dummies anuais e os termos de interação d81.educ, d82.educ, ..., d87.educ. Renan Oliveira Regis Econometria 2 139 / 150
  140. 140. Métodos avançados de dados em painel O retorno da educação mudou no transcorrer do tempo? (Aplicação no R) Data 7 Renan Oliveira Regis Econometria 2 140 / 150
  141. 141. Métodos avançados de dados em painel O retorno da educação mudou no transcorrer do tempo? (Resultado) As estimativas desses termos de interação são todas positivas e geralmente ficam maiores para os anos mais recentes. O maior coeficiente (0,030) é o de d87.educ, com t = 2, 48. Em outras palavras, estima-se que o retorno da educação seja cerca de três pontos percentuais maior em 1987 do que no ano-base, 1980. O outro termo de interação significante é d86.educ (coeficiente = 0,027, t = 2, 23). As estimativas dos primeiros anos são menores e não significantes no nível de 5% contra uma alternativa bilateral. Renan Oliveira Regis Econometria 2 141 / 150
  142. 142. Métodos avançados de dados em painel Estimação de efeito fixo com dummies Existe outra forma forma de estimar o modelo de efeito fixos. Usando os dados originais , yit xit, faça a regressão de yit em N variáveis dummy diferentes, para cada indivíduo. yit = a1ind1it + a2ind2it + ... + aNindNit + β1xit1 + ... + βk xitk + uit Problema: ▶ Uma base de dados com muitos indivíduos fica muito trabalhoso. Renan Oliveira Regis Econometria 2 142 / 150
  143. 143. Métodos avançados de dados em painel Estimação de efeito fixo com dummies Ocasionalmente, os interceptos estimados, digamos âi , são de interesse. Esse é o caso, se quisermos estudar a distribuição de âi ao longo de i, ou se quisermos selecionar uma empresa ou cidade em particular para verificar se âi está acima ou abaixo do valor médio na amostra. Essas estimativas são disponibilizadas diretamente pela regressão das variáveis dummy, mas raramente são descritas pelos programas que possuem rotinas de efeitos fixos (pela razão prática de existirem muitos âi ). Após a estimação dos efeitos fixos com N de qualquer tamanho, os âi serão calculados com facilidade: Renan Oliveira Regis Econometria 2 143 / 150
  144. 144. Métodos avançados de dados em painel Estimação de efeito fixo com dummies: Exemplo Por exemplo, se estimarmos um modelo da criminalidade controlando vários fatores de variação temporal, poderemos obter âi para uma cidade, para verificar se os efeitos fixos não observados que contribuem para a criminalidade estão acima ou abaixo da média. Renan Oliveira Regis Econometria 2 144 / 150
  145. 145. Métodos avançados de dados em painel Efeitos fixos ou primeira diferença? Até agora, sem considerar o MQO agrupado, vimos dois métodos para estimar mode-los de efeitos não observados. Um deles envolve a diferenciação dos dados e o outro a centralização na média. Como saber qual deles usar? Renan Oliveira Regis Econometria 2 145 / 150
  146. 146. Métodos avançados de dados em painel Efeitos fixos ou primeira diferença? Com T = 2 A regressão de primeira diferença é igual a de efeito fixo com uma dummy de tempo. Quando T ≥ 3, os estimadores EF e PD não são os mesmos. ▶ Como ambos são não viesados sob as Hipóteses EF.1 a EF.4, não podemos usar a inexistência de viés como um critério. ▶ Além disso, ambos são consistentes sob EF.1 a EF.4 (com T fixo e N tendendo ao infinito). ▶ Para N grande e T pequeno, a escolha entre EF e PD dependerá da eficiência relativa dos estimadores, e isso é determinado pela correlação serial nos erros idiossincráticos, uit . Renan Oliveira Regis Econometria 2 146 / 150
  147. 147. Métodos avançados de dados em painel Efeitos fixos ou primeira diferença? T ≥ 3 ▶ Quando os uit são serialmente não correlacionados, os efeitos fixos são mais eficientes que a primeira diferença. ▶ Se uit são serialmente correlacionados o de primeira diferença é mais eficiênte, desde que ∆uit seja não correlacionado. ▶ Em caso dos dois modelos serem correlacionado EF provavelmente será melhor. Renan Oliveira Regis Econometria 2 147 / 150
  148. 148. Métodos avançados de dados em painel Efeitos fixos com painéis não equilibrados Em alguns conjuntos de dados em painel, especialmente de pessoas ou empresas, estão ausentes certos anos em pelo menos algumas unidades do corte transversal na amostra. Nesse caso, chamamos o conjunto de dados em painel não equilibrado. A mecânica de estimação dos efeitos fixos com um painel não equilibrado não é muito mais difícil que com um painel equilibrado. ▶ Se Ti for o número de períodos de tempo da unidade i do corte transversal, simplesmente usamos essas Ti observações para fazer a centralização na média. ▶ O número total de observações será, então, T1 + T2 + ... + TN . Renan Oliveira Regis Econometria 2 148 / 150
  149. 149. Métodos avançados de dados em painel Efeitos fixos com painéis não equilibrados O problema mais difícil com um painel não equilibrado é determinar a razão de ele não ser equilibrado. Com cidades e estados, por exemplo, algumas vezes os dados de variáveis importantes faltam para certos anos. Desde que a razão da falta de dados de algum i não seja correlacionada com os erros idiossincráticos, uit, o painel não equilibrado não causará problemas. Renan Oliveira Regis Econometria 2 149 / 150
  150. 150. Métodos avançados de dados em painel Efeito do treinamento de pessoal sobre as taxas de refugo das empresas Adicionamos duas variáveis à análise da Tabela 14.1: log(salesit) e log(employit), em que sales representa as vendas anuais da empresa e employ é o número de empregados. Três das 54 firmas são inteiramente eliminadas da análise por não possuírem dados sobre vendas ou emprego. Cinco observações adicionais são perdidas em razão da falta de dados em uma ou em ambas dessas variáveis para alguns anos, deixando-nos com n = 148. O uso de efeitos fixos no painel não equilibrado não altera a situação básica, embora o efeito estimado dos subsídios fique maior: β̂grant = −0, 297, tgrant = −1, 89; β̂grant−1 = −0.526, tgrant = −2, 389. Renan Oliveira Regis Econometria 2 150 / 150

×