SlideShare uma empresa Scribd logo
1 de 14
Baixar para ler offline
 

40

Econometria – Semestre 2010.01

CAPÍTULO 9 – MODELOS DE REGRESSÃO COM VARIÁVEIS BINÁRIAS 

 
1‐OBJETIVOS 
 
Considerar  modelos  em  que  uma  ou  mais  variáveis  explicativas  são  variáveis  nominais  (também 
chamadas de indicadores, variáveis qualitativas, variáveis binárias ou variáveis “dummy”). O caso 
mais  simples  é  quando  fazemos  a  variável  igual  a  1  para  uma  categoria  e  0  para  a  categoria 
mutuamente  exclusiva  à  primeira.  Por  exemplo,  podemos  definir  SEXO  =  1  se  feminino,  e  0  se 
masculino.  
Os modelos de regressão que contêm apenas variáveis binárias ou qualitativas são chamados de 
modelos de Análise de Variância (modelos ANOVA). 
 

2‐ CUIDADOS NO USO DE MODELOS COM VARIÁVEIS QUALITATIVAS 
 
Suponha  que  desejamos  inserir  no  modelo  uma  variável  qualitativa  com  m  categorias.  É 
importante notar que o modelo deverá ser especificado da seguinte forma: 
1)  Modelo com termo constante e (m‐1) variáveis dummy 
2)  Modelo SEM termo constante e m variáveis dummy 
Por que? Poderia parecer natural, à primeira vista, escrever o modelo como: 
Yi = α + β1 .D1i + β 2 .D2i + ... + β m .Dmi + ε i       

 

 

 

 

 

 

(1) 

onde Dj = 1 ou 0 se a observação pertence à j‐ésima categoria da variável X, para j = 1, 2,..., n. 
Mas, qual a matriz de design X para o modelo da equação (1) acima? VERIFIQUE que a primeira 
coluna de X é composta apenas de 1’s. A segunda coluna contém 1’s e 0’s, assim como todas as 
demais colunas. Mas, a soma das colunas 2 até m+1 é igual à 1ª. coluna, pois somando todas as 
variáveis dummy em todos os seus níveis encontramos uma coluna de 1’s. 
Logo,  o  modelo  representado  por  (1)  NÃO  PODE  ser  ajustado,  pois  sua  matriz  de  design  exibe 
colinearidade perfeita. As alternativas são as indicadas em 1) e 2) acima. 
Como funciona o modelo 1)? 

 
Professora Mônica Barros

ENCE 
 

41

Econometria – Semestre 2010.01

Escolhe‐se uma categoria como categoria “base”. Apenas a título de exemplo, suponha que ela é a 
m‐ésima categoria da nossa variável qualitativa. Então o modelo a ser ajustado terá constante e 
(m‐1) variáveis dummy, cada uma correspondendo às categorias 1, 2, ..., m‐1 respectivamente. 
Ou seja, a equação do modelo é: 

Yi = α + β1.D1i + β 2 .D2i + ... + β m−1 .D( m−1)i + ε i  

 

 

 

 

 

 

(2) 

Suponha que, para uma dada observação estamos na 1ª. categoria da variável qualitativa e assim 
D1i = 0 e todas as outras variáveis dummy são zero. Então o valor ajustado nesta observação será:  
ˆ ˆ ˆ
ˆ ˆ
Yi = α + β1 .(1) = α + β1  

 

 

 

 

 

 

 

 

 

(3) 

Suponha agora que uma observação corresponde à m‐ésima categoria (que é a categoria base). 
Então, os valores de TODAS as variáveis dummy nesta observação são zero, e o valor ajustado é: 
ˆ
ˆ
Yi = α   

 

 

 

 

 

 

 

 

 

 

 

(4) 

A partir de (3) e (4) fica fácil interpretar o significado dos coeficientes na regressão (2).  α indica o 
valor médio na categoria omitida (neste caso a m‐ésima). Cada  βi indica a diferença entre o valor 
da i‐ésima categoria e a média da categoria omitida. 
Modelo 2) 
A especificação do modelo 2) é: 

Yi = β1 .D1i + β 2 .D2i + ... + β m .D( m ) i + ε i  

 

 

 

 

 

 

 

(5) 

Note que: 

• Na equação (5) não existe termo constante; 
• Agora existem variáveis dummy para TODAS as m categorias. 
Qual a interpretação dos coeficientes na equação (5)? Cada  βi indica o valor médio da respectiva 
categoria. 
 
Exemplo 9.1. 
Neste  exemplo  a  variável  dependente  é  o  percentual  de  votos  nulos  e  brancos  (soma  dos  dois 
percentuais) no 1º. Turno das eleições municipais para prefeito no município do Rio de Janeiro em 
2008. A variável explicativa é a região da cidade em que está situada a seção eleitoral, dividida em 
5 categorias: Centro, Sul, Norte, Oeste, Subúrbio. 
 

 
Professora Mônica Barros

ENCE 
 

42

Econometria – Semestre 2010.01

Existem  10702  observações  na  amostra,  cada  uma  corresponde  a  uma  seção  eleitoral,  ou  seja, 
uma urna de votação. 
Inicialmente ajustamos o modelo: 

Yi = α + β1 .CENTROi + β 2 .NORTEi + β 3 .SULi + β 4 .OESTEi + ε i  
Ou seja, a categoria base é “SUBURBIO”. Os resultados desta regressão estão abaixo: 
Coefficients(a)
Unstandardized
Coefficients

Model

t

Sig.

B
13,405

Std. Error
,037

B
360,889

Std. Error
,000

,696

,125

5,565

,000

indicador zona norte

-2,423

,096

-25,262

,000

indicador zona sul

-3,529

,073

-48,395

,000

-,190
,055
-3,479
a Dependent Variable: soma dos percentuais de nulos e brancos

,001

(Constant)
indicador centro da
cidade

indicador zona oeste

Model Summary

Model
1

R
,472(a)

R Square
,223

Adjusted R
Square
,222

Std. Error of
the Estimate
2,43974

a Predictors: (Constant), indicador zona oeste, indicador centro da cidade, indicador zona norte, indicador zona sul
ANOVA(b)

df

Regression

Sum of
Squares
18244,922

4

Mean Square
4561,230

Residual

Model
1

63671,940

10697

5,952

F
766,295

Sig.
,000(a)

Total

81916,862
10701
a Predictors: (Constant), indicador zona oeste, indicador centro da cidade, indicador zona norte, indicador zona sul
b Dependent Variable: soma dos percentuais de nulos e brancos
Descriptive Statistics

perc_nulos_brancos

Mean
12,6959

Std. Deviation
2,76678

N
10702

Que estória você pode contar a partir destes dados? 

• O modelo é, em geral, altamente significante (veja a estatística F), ou seja, os percentuais 
de nulos + brancos variam de acordo com a região da cidade. Apesar disso, o R2 do modelo 
é baixo. Que tal investigar a relação entre a estatística F e o R2 e descobrir por que? 

 
Professora Mônica Barros

ENCE 
 

43

Econometria – Semestre 2010.01

• No  SUBURBIO  (categoria  base,  variável  dummy  omitida),  o  percentual  médio  de  votos 
brancos + nulos é 13,405%, que é superior à média geral do município (12,696%). 
• No CENTRO, o percentual médio de brancos + nulos é 13,405  + 0,696 = 14, 101%.  
• Na  zona  NORTE,  o  percentual  médio  de  brancos  +  nulos  é  13,405  ‐  2,423=  10,982%,  o 
SEGUNDO MENOR de todas as regiões da cidade. 
• Na zona SUL, o percentual médio de brancos + nulos é 13,405  ‐ 3,529= 9,876%, o MENOR 
de todas as regiões da cidade. 
• Na  zona  OESTE,  o  percentual  médio  de  brancos  +  nulos  é  13,405    ‐  0,190=  13,215%, 
superior à média geral do município. 
 
 Para  comparação  ajustamos  o  modelo  que  emprega  todas  as  categorias  da  variável  “região  da 
cidade” e não contém termo constante.  

Yi = β1 .CENTROi + β 2 .NORTEi + β 3 .SULi + β 4 .OESTEi + β 5 .SUBURBIOi + ε i  
Os resultados seguem abaixo. 
ANOVA(c,d)
Sum of
Squares
df
Mean Square
F
Sig.
Regression
1743244,3
5
348648,867 58573,634
,000(a)
36
Residual
63671,940
10697
5,952
Total
1806916,2
10702
76(b)
a Predictors: indicador suburbio, indicador zona oeste, indicador zona sul, indicador zona norte, indicador centro da
cidade
b This total sum of squares is not corrected for the constant because the constant is zero for regression through the
origin.
c Dependent Variable: soma dos percentuais de nulos e brancos
d Linear Regression through the Origin
Model
1

Coefficients(a,b)
Unstandardized
Coefficients

t

Sig.

B

Model

B

Std. Error

Std. Error

indicador centro da
cidade

14,102

,119

118,030

,000

indicador zona norte

10,982

,088

124,174

,000

indicador zona sul

9,877

,063

157,413

,000

indicador zona oeste

13,215

,040

329,390

,000

13,405
,037
360,889
a Dependent Variable: soma dos percentuais de nulos e brancos
b Linear Regression through the Origin

,000

indicador suburbio

 
Professora Mônica Barros

ENCE 
 

44

Econometria – Semestre 2010.01

Note  que  os  coeficientes  da  regressão  estimada  por  este  modelo  são  exatamente  os  mesmos 
obtidos no modelo anterior.  
 
Que modelo usar? 
No fundo é uma questão de gosto... 
A maioria dos pesquisadores tende a usar o modelo representado pela equação (2), que inclui o 
termo constante. Isso acontece pois nesta forma é possível verificar facilmente se a categorização 
faz diferença (em relação à categoria base). 
Nota 
É  possível  combinar  no  mesmo  nodelo  mais  de  uma  variável  qualitativa.  O  único  ponto  a 
considerar  é  que  cada  variável  qualitativa  deve  ser  expressa  com  o  seu  número  de  categorias 
menos UM. Também, neste caso, o termo constante indicará a média quando a observação estiver 
nos níveis das categorias base para as duas variáveis qualitativas. 
  
Exemplo 9.2.  
Uso de variáveis “dummy” para representar a sazonalidade de uma série temporal. 
Considere a série de consumo mensal de energia elétrica na região Sudeste a partir de janeiro de 
2003 mostrada no gráfico a seguir. 
Consumo de Energia Elétrica na Região Sudeste em GWh
19000

18000

17000

16000

15000

14000

13000

20
03
.0
1
20
03
.0
20 3
03
.0
20 5
03
.0
20 7
03
.0
20 9
03
.1
20 1
04
.0
20 1
04
.0
20 3
04
.0
20 5
04
.0
20 7
04
.0
20 9
04
.1
20 1
05
.0
20 1
05
.0
20 3
05
.0
5
20
05
.0
20 7
05
.0
20 9
05
.1
20 1
06
.0
20 1
06
.0
20 3
06
.0
20 5
06
.0
20 7
06
.0
20 9
06
.1
1
20
07
.0
20 1
07
.0
20 3
07
.0
20 5
07
.0
7
20
07
.0
20 9
07
.1
20 1
08
.0
20 1
08
.0
20 3
08
.0
20 5
08
.0
20 7
08
.0
20 9
08
.1
20 1
09
.0
1
20
09
.0
20 3
09
.0
20 5
09
.0
20 7
09
.0
20 9
09
.1
20 1
10
0

12000

 

Vamos  calcular  os  fatores  sazonais  mensais  para  esta  série  usando  o  primeiro  método  descrito 
neste  capítulo.  As  variáveis  INDIC_01  a  INDIC_12  são,  respectivamente,  as  “dummies”  para  os 
meses de Janeiro a Dezembro. 
Método 1 – modelo com constante – categoria omitida = janeiro 
O modelo ajustado é: 
 
Professora Mônica Barros

ENCE 
 

45

Econometria – Semestre 2010.01
Coefficients(a)
Unstandardized
Coefficients

Model

(Constant)
indic_02

t

Sig.

B
15688,000

Std. Error
604,355

B
25,958

Std. Error
,000

-398,571

884,684

-,451

,654

indic_03

57,571

884,684

,065

,948

indic_04

133,286

884,684

,151

,881

indic_05

-49,000

884,684

-,055

,956

indic_06

-159,286

884,684

-,180

,858

indic_07

-347,429

884,684

-,393

,696

indic_08

18,714

884,684

,021

,983

indic_09

262,571

884,684

,297

,767

indic_10

463,714

884,684

,524

,602

indic_11

739,143

884,684

,835

,406

indic_12

468,143

884,684

,529

,598

a Dependent Variable: consumo_ee_sudeste

Note que as estatísticas t são pequenas, indicando que os fatores sazonais não são significantes 
neste caso. O que o modelo nos diz é que esta série, no período indicado, não é sazonal, ou pelo 
menos, que não conseguimos identificar as componentes sazonais mensais. 
 
As  estatísticas  do  modelo  também  indicam  que  apenas  os  fatores  sazonais  não  conseguem 
“explicar” o consumo de energia – note que a estatística F na próxima tabela é muito pequena, e o 
modelo como um todo não é significativo. 
 
ANOVA(b)
Sum of
Squares
df
Mean Square
F
Sig.
Regression
8832858,9
11
802987,178
,275
,989(a)
61
Residual
213302712
73
2921954,963
,286
Total
222135571
84
,247
a Predictors: (Constant), indic_12, indic_11, indic_10, indic_09, indic_08, indic_07, indic_06, indic_05, indic_04,
indic_03, indic_02
b Dependent Variable: consumo_ee_sudeste
Model
1

 
Na verdade, é provável que o “culpado” por isso seja o nível da série, que está aumentando, e não 
está sendo considerado na modelagem. Vamos adicionar uma tendência linear ao modelo, através 
de uma variável que assume os valores 1, 2, 3, ... 85. Esta variável será chamada de “tempo” no 
modelo a seguir.  

 
Professora Mônica Barros

ENCE 
 

46

Econometria – Semestre 2010.01

O novo modelo (que inclui a tendência linear) tem os seguintes diagnósticos: 
 
Coefficients(a)
Unstandardized
Coefficients

Model

t

Sig.

B
13054,619

Std. Error
233,489

B
55,911

Std. Error
,000

indic_02

-92,364

300,804

-,307

,760

indic_03

302,537

300,704

1,006

,318

indic_04

317,010

300,626

1,054

,295

indic_05

73,483

300,570

,244

,808

indic_06

-98,044

300,537

-,326

,745

indic_07

-347,429

300,526

-1,156

,251

indic_08

-42,527

300,537

-,142

,888

indic_09

140,089

300,570

,466

,643

indic_10

279,990

300,626

,931

,355

indic_11

494,177

300,704

1,643

,105

indic_12

161,936

300,804

,538

,592

61,241

2,587

23,677

,000

(Constant)

tempo

a Dependent Variable: consumo_ee_sudeste

 
ANOVA(b)
Sum of
Squares
df
Mean Square
F
Sig.
Regression
197858692
12 16488224,389
48,901
,000(a)
,664
Residual
24276878,
72
337178,869
583
Total
222135571
84
,247
a Predictors: (Constant), tempo, indic_07, indic_08, indic_06, indic_05, indic_09, indic_10, indic_04, indic_11, indic_03,
indic_12, indic_02
b Dependent Variable: consumo_ee_sudeste
Model

 
Model Summary(b)
Adjusted R
Std. Error of
Square
the Estimate
R Square
,891
,872
580,671
a Predictors: (Constant), tempo, indic_07, indic_08, indic_06, indic_05, indic_09, indic_10, indic_04, indic_11, indic_03,
indic_12, indic_02
b Dependent Variable: consumo_ee_sudeste
Model

O que podemos concluir? 
Os  fatores  sazonais  são  ainda  não  significantes,  mas  a  qualidade  do  ajuste  melhorou 
sensivelmente.  O  modelo  agora  é,  como  um  todo,  significativo  (veja  a  estatística  F).  As 

 
Professora Mônica Barros

ENCE 
 

47

Econometria – Semestre 2010.01

estatísticas t dos fatores sazonais são não significantes, mas são maiores (em módulo) que 
na situação anterior. Talvez o procedimento mais adequado (se o objetivo é encontrar um 
modelo  parcimonioso)  seja  empregar  apenas  alguns  dos  fatores  sazonais,  e  não  todos, 
escolhendo‐os, por exemplo, através de um procedimento “stepwise”. 
 
A estrutura do modelo ajustado é: 

(Consumo _ estimadot ) = 13054,62 + 61,24 * t − 92,36 * Indic _ 02t + 302,54 * Indic _ 03t + 317,01* Indic _ 04t +
+ 73,48 * Indic _ 05t − 98,04 * Indic _ 06 t − 347,43 * Indic _ 07 t − 42,53 * Indic _ 08t +
+ 140,09 * Indic _ 09 t + 279,99 * Indic _ 10 t + 494,18 * Indic _ 11t + 161,94 * Indic _ 12 t
 
Exemplo 9.3. 
Considere  a  série  de  Vendas  nominais  no  varejo  (hipermercados  e  supermercados)  –  número 
índice  (média  2003  =  100),  fornecida  pela  Pesquisa  Mensal  do  Comércio  (PMC)  do  IBGE  e 
mostrada no próximo gráfico.
Vendas nominais - varejo - hipermercados e superm. - índice (média 2003 = 100) - IBGE/PMC
250
230
210
190
170
150
130
110
90
70

ja

m

n/
00
ai
/0
0
se
t/0
0
ja
n/
01
m
ai
/0
1
se
t/0
1
ja
n/
02
m
ai
/0
2
se
t/ 0
2
ja
n/
03
m
ai
/0
3
se
t/0
3
ja
n/
04
m
ai
/0
4
se
t/0
4
ja
n/
05
m
ai
/0
5
se
t/0
5
ja
n/
06
m
ai
/0
6
se
t/0
6
ja
n/
07
m
ai
/0
7
se
t/0
7
ja
n/
08
m
ai
/0
8
se
t/0
8
ja
n/
09
m
ai
/0
9
se
t/0
9
ja
n/
10

50

A sazonalidade na série fica particularmente óbvia por conta do mês de Dezembro, onde ocorre 
um “pico” nas vendas do ano.  No entanto, deve‐se notar também que a série tem uma tendência 
muito  expressiva,  e  modela‐la  sem  levar  em  conta  esta  tendência  pode  nos  levar  a  encontrar 
fatores  sazonais  que  não  fazem  sentido,  pois  estão  capturando  também  a  componente  da 
tendência, além da sazonalidade. 

 
Professora Mônica Barros

ENCE 
 

48

Econometria – Semestre 2010.01

Vamos experimentar diversos modelos  e comentar os resultados. 
Modelo 1 – SEM TENDÊNCIA, apenas componentes sazonais 
Estrutura:    Yi = α + β1.D1i + β 2 .D2i + ... + β m−1 .D( m−1)i + ε i       onde  ajustamos  m‐1  =  11  variáveis 
dummy. Escolhemos neste caso o mês de janeiro como variável omitida, e assim serão ajustadas 
as dummies para fevereiro a dezembro. Os resultados do ajuste são: 
Coefficients(a)
Unstandardized
Coefficients

Model

t

Sig.

(Constant)

B
116,116

Std. Error
11,144

B
10,419

Std. Error
,000

indic_02

-11,697

16,150

-,724

,470

indic_03

-,141

16,150

-,009

,993

indic_04

-1,389

16,150

-,086

,932

indic_05

-1,876

16,150

-,116

,908

indic_06

-5,106

16,150

-,316

,752

indic_07

-,095

16,150

-,006

,995

indic_08

2,284

16,150

,141

,888

indic_09

-,199

16,150

-,012

,990

indic_10

5,858

16,150

,363

,718

indic_11

4,647

16,150

,288

,774

indic_12

39,735
16,150
2,460
,015
a Dependent Variable: Vendas nominais - varejo - hipermercados e superm. - índice (média 2003 = 100) - IBGE/PMC PMC12_VNSUPT12
ANOVA(b)
Sum of
Squares
df
Mean Square
F
Sig.
Regression
17236,646
11
1566,968
1,147
,333(a)
Residual
148909,93
109
1366,146
7
Total
166146,58
120
2
a Predictors: (Constant), indic_12, indic_11, indic_10, indic_09, indic_08, indic_07, indic_05, indic_04, indic_03,
indic_02, indic_06
b Dependent Variable: Vendas nominais - varejo - hipermercados e superm. - índice (média 2003 = 100) - IBGE/PMC PMC12_VNSUPT12
Model

Note  como  o  ajuste  do  modelo  é  ruim.  A  estatística  F  é  muito  pequena,  indicando  que  os 
regressores são, em conjunto, não significantes.  Dentre os fatores sazonais, apenas o relativo ao 
mês  de  dezembro  é  significativo  (veja  as  estatísticas  t).  O  R2  desde  modelo  é  terrível,  apenas 
10,4%, e o R2 ajustado é 1,3%. 
 

 
Professora Mônica Barros

ENCE 
 

49

Econometria – Semestre 2010.01

Vamos  tentar  melhorar  este  resultado  incorporando  uma  tendência  linear  ao  modelo.  Criamos 
uma  variável  “tempo”  definida  como  1,  2,  ...,  121,  que  é  apenas  um  indicador  do  instante  de 
tempo.  Esta  variável  poderia  ter  sido  criada  de  outra  forma,  qualquer  transformação  linear  da 
variável “tempo” definida acima serviria. A estrutura do modelo agora é: 
Modelo 2 – TENDÊNCIA LINEAR e componentes sazonais 
Estrutura:    Yi = α + λ.t + β1 .D1i + β 2 .D2i + ... + β m−1 .D( m−1)i + ε i       onde ajustamos m‐1 = 11 variáveis 
dummy. Escolhemos neste caso o mês de janeiro como variável omitida, e assim serão ajustadas 
as dummies para fevereiro a dezembro. Os resultados do ajuste são: 
Coefficients(a)
Unstandardized
Coefficients

Model

t

Sig.

(Constant)

B
56,560

Std. Error
3,155

B
17,927

Std. Error
,000

indic_02

-6,816

4,044

-1,685

,095

indic_03

3,764

4,043

,931

,354

indic_04

1,540

4,043

,381

,704

indic_05

,076

4,042

,019

,985

indic_06

-4,130

4,042

-1,022

,309

indic_07

-,095

4,042

-,024

,981

indic_08

1,307

4,042

,323

,747

indic_09

-2,152

4,042

-,532

,596

indic_10

2,929

4,043

,724

,470

indic_11

,741

4,043

,183

,855

indic_12

1

34,853

4,044

8,619

,000

,976

,024

40,397

,000

tempo

a Dependent Variable: Vendas nominais - varejo - hipermercados e superm. - índice (média 2003 = 100) - IBGE/PMC PMC12_VNSUPT12
ANOVA(b)
Sum of
Squares
df
Mean Square
F
Sig.
Regression
156903,55
12
13075,296
152,778
,000(a)
0
Residual
9243,032
108
85,584
Total
166146,58
120
2
a Predictors: (Constant), tempo, indic_07, indic_08, indic_06, indic_09, indic_05, indic_10, indic_04, indic_11, indic_03,
indic_12, indic_02
b Dependent Variable: Vendas nominais - varejo - hipermercados e superm. - índice (média 2003 = 100) - IBGE/PMC PMC12_VNSUPT12
Model
1

O  resultado  do  modelo  é  bem  superior  ao  anterior.  Agora  o  modelo  é  significante  (veja  a 
estatística F) e ambos o R2 e o R2 ajustado são altos (94,4 e 93,8% respectivamente). No entanto, 
apenas os fatores sazonais para fevereiro e dezembro são significantes ao nível 10%. 

 
Professora Mônica Barros

ENCE 
 

50

Econometria – Semestre 2010.01

O  que  fazer?  Podemos  tentar  mudar  a  “cara”  da  tendência  e  tentar  ajustar,  por  exemplo,  uma 
tendência quadrática. Isso nos leva ao próximo modelo. 
 
Modelo 3 – TENDÊNCIA QUADRÁTICA e componentes sazonais 
Estrutura:    Yi = α + λ1 .t + λ2 .t 2 + β1 .D1i + β 2 .D2i + ... + β m−1.D( m−1) i + ε i       Ajustamos  m‐1  =  11 
variáveis dummy. Escolhemos neste caso o mês de janeiro como variável omitida, e assim serão 
ajustadas as dummies para fevereiro a dezembro. Os resultados do ajuste são: 
Coefficients(a)
Unstandardized
Coefficients

Model

t

Sig.

(Constant)

B
71,441

Std. Error
2,115

B
33,775

Std. Error
,000

indic_02

-5,335

2,369

-2,252

,026

indic_03

5,304

2,369

2,239

,027

indic_04

3,125

2,369

1,319

,190

indic_05

1,694

2,369

,715

,476

indic_06

-2,493

2,369

-1,052

,295

indic_07

1,549

2,369

,654

,515

indic_08

2,945

2,369

1,243

,217

indic_09

-,534

2,369

-,225

,822

indic_10

4,514

2,369

1,905

,059

indic_11

2,281

2,369

,963

,338

indic_12

36,334

2,369

15,335

,000

,180

,057

3,169

,002

tempo
tempo_quadrado

,007
,000
14,429
,000
a Dependent Variable: Vendas nominais - varejo - hipermercados e superm. - índice (média 2003 = 100) - IBGE/PMC PMC12_VNSUPT12

Os fatores sazonais para fevereiro, março, outubro e dezembro são significantes agora. Também 
existem  outros  fatores  “quase”  significantes  (com  79%  ou  80%  de  significância,  que  são  os 
relativos a Abril e Agosto). 
 
Note também que os parâmetros que caracterizam a tendência são altamente significantes. 
 
Para  tentar  ainda  mais  amortecer  esta  tendência,  poderíamos  ajustar  o  modelo  à  série 
logaritmada de vendas. 
 
 

 
Professora Mônica Barros

ENCE 
 

51

Econometria – Semestre 2010.01

Modelo  4  –  TENDÊNCIA  QUADRÁTICA  e  componentes  sazonais  aplicada  à  série  do  logaritmo  de 
Vendas 
Coefficients(a)
Unstandardized
Coefficients

Model

t

Sig.

B
4,239

Std. Error
,014

B
296,004

Std. Error
,000

indic_02

-,048

,016

-3,001

,003

indic_03

,049

,016

3,039

,003

indic_04

,028

,016

1,741

,085

indic_05

,013

,016

,790

,431

indic_06

-,022

,016

-1,369

,174

indic_07

,013

,016

,822

,413

indic_08

,024

,016

1,503

,136

indic_09

-,003

,016

-,213

,832

indic_10

,036

,016

2,262

,026

indic_11

,021

,016

1,287

,201

indic_12

,270

,016

16,815

,000

tempo

1

,006

,000

16,171

,000

5,322

,000

(Constant)

tempo_quadrado

1,63E-005
,000
a Dependent Variable: log_vendas_varejo_hipermercados

Em  vermelho  estão  indicados  os  coeficientes  das  dummies  significantes.  Note  que  as  dummies 
para Junho e Agosto são significantes a nível 17%, e Novembro é significante a 20%. O modelo é 
altamente  significante,  como  indicado  na  tabela  ANOVA  a  seguir.  O  R2  e  o  R2  ajustado  são, 
respectivamente, 99,4 e 98,5%. 
ANOVA(b)

Model
1

Regression
Residual
Total

Sum of
Squares
10,957

df
13

Mean Square
,843

,144

107

,001

11,100

F
627,171

Sig.
,000(a)

120

a Predictors: (Constant), tempo_quadrado, indic_07, indic_08, indic_06, indic_09, indic_05, indic_10, indic_04, indic_11,
indic_03, indic_12, indic_02, tempo
b Dependent Variable: log_vendas_varejo_hipermercados

 
E o que estes fatores sazonais representam neste caso? A série (na escala log) menos a tendência 
deve ser estacionária, ou quase isso, ou seja, não deve “subir” nem “descer”. Então, o que deve 
ficar aparente nesta série em que a tendência foi eliminada são os fatores sazonais. 
Vamos calcular: 

 
Professora Mônica Barros

ENCE 
 

52

Econometria – Semestre 2010.01

ˆ
Z t = Yt − 4,2385 - 0,0062336 * t - (1,62883e - 005) * t 2  
ˆ
Onde  Yt  é o logaritmo da série de vendas de varejo em hipermercados. Zt é a série sem tendência. 

O gráfico de Zt está a seguir. Note que os fatores sazonais tornam‐se bastante claros e a série é 
estacionária na média, ou seja, não tem tendência. 
Série sem Tendência

0,4000
0,3500
0,3000
0,2500
0,2000
0,1500
0,1000
0,0500

0
/1
ja
n

9

t/0
9

ju
l/0

ou

9

9

/0

r/0

ja
n

ab

8

t/0
8

ju
l/0

ou

8

8

/0

r/0

ja
n

ab

7

t/0
7

ju
l/0

ou

7

7

/0

r/0

ja
n

ab

6

t/0
6

ju
l/0

ou

6

6

/0

r/0

ja
n

ab

5

t/0
5

ju
l/0

ou

5

5

/0

r/0

ja
n

ab

4

t/0
4

ju
l/0

ou

4

4

/0

r/0

ja
n

ab

3

t/0
3

ju
l/0

ou

3

3

/0

r/0

ja
n

ab

2

t/0
2

ju
l/0

ou

2

2

/0

r/0

ja
n

ab

1

t/0
1

ju
l/0

ou

1

1

/0

r/0

ja
n

ab

0

t/0
0

ju
l/0

ou

0
r/0

ja
n

ab

/0

0

0,0000
-0,0500
-0,1000
-0,1500

  
Qual a interpretação dos fatores sazonais? 
Se  olharmos  para  o  modelo  da  variável  logaritmada,  notamos  que  o  nível  em  Janeiro  (categoria 
omitida) é dado por: 
ˆ
Yt = 4,2385 + 0,0062336 * t + (1,62883e - 005) * t 2  

Isto ocorre pois em Janeiro os valores de todas as variáveis dummy são zero. A equação acima nos 
permite encontrar o valor ajustado para t = 1 (Jan/2000), t = 13 (Jan/2001), t = 25 (Jan/2002) e etc, 
bastando substituir o valor de t apropriado. 
E as previsões dos valores de Dezembro? São dadas por: 
ˆ
Yt = 4,2385 + 0,0062336 * t + (1,62883e - 005) * t 2 + 0,2697 * INDIC_DEZEMBRO t  

Onde INDIC_DEZEMBROt = 1 se t é um mês de Dezembro e 0 se t não é um mês de Dezembro. 
Por exemplo, a previsão para Dezembro de 2000 (t = 12) será: 
ˆ
Yt = 4,2385 + 0,0062336 * (12) + (1,62883e - 005) * (12) 2 + 0,2697  

 
Professora Mônica Barros

ENCE 
 

53

Econometria – Semestre 2010.01

Em Dezembro de 2008 (t= 108), a previsão é: 
ˆ
Yt = 4,2385 + 0,0062336 * (108) + (1,62883e - 005) * (108) 2 + 0,2697  

Note que o último termo desta equação (0,2697) só afeta os meses de Dezembro, ou seja, só se 
aplica à equação nos instantes t que correspondem a um mês de Dezembro. 
Para casa: 
Use o Excel (ou algo parecido) para calcular os valores ajustados pelo modelo para cada mês. 
Para casa II: 
Considere as planilhas: 
Dados_mensais_exemplos_capitulo_9.xls 
Exemplo_taxa_desemprego_RMSP.xls 
PIB_trimestral.xls 
Exercite  o  que  você  aprendeu  neste  capítulo  sobre  fatores  sazonais,  tendências  lineares, 
quadráticas,  etc...  e  ajuste  modelos  para  as  séries  nestas  planilhas  que  não  foram  usadas  nos 
exemplos deste texto.  
O que muda quando precisamos estimar fatores sazonais trimestrais? 

 
Professora Mônica Barros

ENCE 

Mais conteúdo relacionado

Mais procurados

Distribuição normal
Distribuição normalDistribuição normal
Distribuição normaljoseagrosa
 
A distribuição normal
A distribuição normalA distribuição normal
A distribuição normalLiliane Ennes
 
Cap9 - Parte 4 - Regressão Linear
Cap9 - Parte 4 - Regressão LinearCap9 - Parte 4 - Regressão Linear
Cap9 - Parte 4 - Regressão LinearRegis Andrade
 
Cap4 - Parte 7 - Distribuição Normal
Cap4 - Parte 7 - Distribuição NormalCap4 - Parte 7 - Distribuição Normal
Cap4 - Parte 7 - Distribuição NormalRegis Andrade
 
Estatística aula_02a
Estatística aula_02aEstatística aula_02a
Estatística aula_02amaria_br3
 
Regressão Linear Simples
Regressão Linear SimplesRegressão Linear Simples
Regressão Linear Simplesmonica_lima
 
Doc estatistica _687118434
Doc estatistica _687118434Doc estatistica _687118434
Doc estatistica _687118434Eliabe Denes
 
Distribuicaonormal
DistribuicaonormalDistribuicaonormal
Distribuicaonormalthiagoufal
 
Função de densidade normal bom
Função de densidade normal   bomFunção de densidade normal   bom
Função de densidade normal bomjon024
 
Estatística Aplicada à Administração - Aula 19: Regressão Linear Simples
Estatística Aplicada à Administração - Aula 19: Regressão Linear SimplesEstatística Aplicada à Administração - Aula 19: Regressão Linear Simples
Estatística Aplicada à Administração - Aula 19: Regressão Linear SimplesMarcus Araújo
 
Distribuicao continua
Distribuicao continuaDistribuicao continua
Distribuicao continuacarneiro62
 

Mais procurados (20)

Tópico 4 regressão linear simples 01
Tópico 4   regressão linear simples 01Tópico 4   regressão linear simples 01
Tópico 4 regressão linear simples 01
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
A distribuição normal
A distribuição normalA distribuição normal
A distribuição normal
 
Análise de regressão linear
Análise de regressão linearAnálise de regressão linear
Análise de regressão linear
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
Cap9 - Parte 4 - Regressão Linear
Cap9 - Parte 4 - Regressão LinearCap9 - Parte 4 - Regressão Linear
Cap9 - Parte 4 - Regressão Linear
 
Variáveis aleatórias contínuas - Estatística II
Variáveis aleatórias contínuas - Estatística IIVariáveis aleatórias contínuas - Estatística II
Variáveis aleatórias contínuas - Estatística II
 
Estatística distribuição normal (aula 2)
Estatística   distribuição normal (aula 2)Estatística   distribuição normal (aula 2)
Estatística distribuição normal (aula 2)
 
Exercicio de Regressao Linear Simples
Exercicio de Regressao Linear SimplesExercicio de Regressao Linear Simples
Exercicio de Regressao Linear Simples
 
Cap4 - Parte 7 - Distribuição Normal
Cap4 - Parte 7 - Distribuição NormalCap4 - Parte 7 - Distribuição Normal
Cap4 - Parte 7 - Distribuição Normal
 
Estatística aula_02a
Estatística aula_02aEstatística aula_02a
Estatística aula_02a
 
Regressão Linear Simples
Regressão Linear SimplesRegressão Linear Simples
Regressão Linear Simples
 
Doc estatistica _687118434
Doc estatistica _687118434Doc estatistica _687118434
Doc estatistica _687118434
 
Distribuição Normal
Distribuição NormalDistribuição Normal
Distribuição Normal
 
Aula 08 de estatística
Aula 08 de estatísticaAula 08 de estatística
Aula 08 de estatística
 
Distribuicaonormal
DistribuicaonormalDistribuicaonormal
Distribuicaonormal
 
Função de densidade normal bom
Função de densidade normal   bomFunção de densidade normal   bom
Função de densidade normal bom
 
Estatística Aplicada à Administração - Aula 19: Regressão Linear Simples
Estatística Aplicada à Administração - Aula 19: Regressão Linear SimplesEstatística Aplicada à Administração - Aula 19: Regressão Linear Simples
Estatística Aplicada à Administração - Aula 19: Regressão Linear Simples
 
Distribuicao continua
Distribuicao continuaDistribuicao continua
Distribuicao continua
 
Regressão Linear I
Regressão Linear IRegressão Linear I
Regressão Linear I
 

Semelhante a Modelos de regressão com variáveis binárias

Medições e erros
Medições e errosMedições e erros
Medições e errosraphael1968
 
AMD - Aula n.º 9 - regressão linear múltipla.pptx
AMD - Aula n.º 9 - regressão linear múltipla.pptxAMD - Aula n.º 9 - regressão linear múltipla.pptx
AMD - Aula n.º 9 - regressão linear múltipla.pptxNunoSilva599593
 
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Kleverton Saath
 
MAT 1ª Série 3º BimestreEstudante.pdf
MAT 1ª Série 3º BimestreEstudante.pdfMAT 1ª Série 3º BimestreEstudante.pdf
MAT 1ª Série 3º BimestreEstudante.pdfGernciadeProduodeMat
 
Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Adriano Figueiredo
 
U1S4 - PPCP e Técnicas de Previsão de Demanda.pdf
U1S4 - PPCP e Técnicas de Previsão de Demanda.pdfU1S4 - PPCP e Técnicas de Previsão de Demanda.pdf
U1S4 - PPCP e Técnicas de Previsão de Demanda.pdfCelsoCiamponi1
 
Cesgranrio banco do brasil 2018
Cesgranrio banco do brasil 2018Cesgranrio banco do brasil 2018
Cesgranrio banco do brasil 2018Arthur Lima
 
LISTA 02 E 03 - EXERCÍCIOS DE MATEMÁTICA 1º ANO - PROFª NEID
LISTA 02 E 03 - EXERCÍCIOS DE MATEMÁTICA 1º ANO - PROFª NEIDLISTA 02 E 03 - EXERCÍCIOS DE MATEMÁTICA 1º ANO - PROFª NEID
LISTA 02 E 03 - EXERCÍCIOS DE MATEMÁTICA 1º ANO - PROFª NEIDCriativa Niterói
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptssuser2b53fe
 
Regressão Múltipla
Regressão MúltiplaRegressão Múltipla
Regressão MúltiplaFelipe Pontes
 
Teoria dos erros
Teoria dos errosTeoria dos erros
Teoria dos errosLaura Jane
 

Semelhante a Modelos de regressão com variáveis binárias (20)

Aula6final
Aula6finalAula6final
Aula6final
 
Medições e erros
Medições e errosMedições e erros
Medições e erros
 
AMD - Aula n.º 9 - regressão linear múltipla.pptx
AMD - Aula n.º 9 - regressão linear múltipla.pptxAMD - Aula n.º 9 - regressão linear múltipla.pptx
AMD - Aula n.º 9 - regressão linear múltipla.pptx
 
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
 
Trabalho de calibracao 2016
Trabalho de calibracao 2016Trabalho de calibracao 2016
Trabalho de calibracao 2016
 
MAT 1ª Série 3º BimestreEstudante.pdf
MAT 1ª Série 3º BimestreEstudante.pdfMAT 1ª Série 3º BimestreEstudante.pdf
MAT 1ª Série 3º BimestreEstudante.pdf
 
EstatisticaGIMO_aquiUEM
EstatisticaGIMO_aquiUEMEstatisticaGIMO_aquiUEM
EstatisticaGIMO_aquiUEM
 
Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1 Topicos de econometria de séries temporais 2020_1
Topicos de econometria de séries temporais 2020_1
 
U1S4 - PPCP e Técnicas de Previsão de Demanda.pdf
U1S4 - PPCP e Técnicas de Previsão de Demanda.pdfU1S4 - PPCP e Técnicas de Previsão de Demanda.pdf
U1S4 - PPCP e Técnicas de Previsão de Demanda.pdf
 
Cesgranrio banco do brasil 2018
Cesgranrio banco do brasil 2018Cesgranrio banco do brasil 2018
Cesgranrio banco do brasil 2018
 
LISTA 02 E 03 - EXERCÍCIOS DE MATEMÁTICA 1º ANO - PROFª NEID
LISTA 02 E 03 - EXERCÍCIOS DE MATEMÁTICA 1º ANO - PROFª NEIDLISTA 02 E 03 - EXERCÍCIOS DE MATEMÁTICA 1º ANO - PROFª NEID
LISTA 02 E 03 - EXERCÍCIOS DE MATEMÁTICA 1º ANO - PROFª NEID
 
var_copulas
var_copulasvar_copulas
var_copulas
 
12247 5validação
12247 5validação12247 5validação
12247 5validação
 
Bioestatística
 Bioestatística Bioestatística
Bioestatística
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
 
Gaal_Aula_01
Gaal_Aula_01Gaal_Aula_01
Gaal_Aula_01
 
Gaal_Aula_01
Gaal_Aula_01Gaal_Aula_01
Gaal_Aula_01
 
Regressão Múltipla
Regressão MúltiplaRegressão Múltipla
Regressão Múltipla
 
Full Waveform Inversion: Introdução e Aplicações [3/5]
Full Waveform Inversion: Introdução e Aplicações [3/5]Full Waveform Inversion: Introdução e Aplicações [3/5]
Full Waveform Inversion: Introdução e Aplicações [3/5]
 
Teoria dos erros
Teoria dos errosTeoria dos erros
Teoria dos erros
 

Mais de Monica Barros

Introdução à programação em R
Introdução à programação em RIntrodução à programação em R
Introdução à programação em RMonica Barros
 
Time series and forecasting from wikipedia
Time series and forecasting from wikipediaTime series and forecasting from wikipedia
Time series and forecasting from wikipediaMonica Barros
 
Barros monica isf2012
Barros monica isf2012Barros monica isf2012
Barros monica isf2012Monica Barros
 
Barros Monica Isf2012
Barros Monica Isf2012Barros Monica Isf2012
Barros Monica Isf2012Monica Barros
 
V29n2a04 Artigo Revista Sobrapo
V29n2a04 Artigo Revista SobrapoV29n2a04 Artigo Revista Sobrapo
V29n2a04 Artigo Revista SobrapoMonica Barros
 
Residential%20 Electrical%20 Energy%20 Consumption%20 Profile%20in%20 Brazil
Residential%20 Electrical%20 Energy%20 Consumption%20 Profile%20in%20 BrazilResidential%20 Electrical%20 Energy%20 Consumption%20 Profile%20in%20 Brazil
Residential%20 Electrical%20 Energy%20 Consumption%20 Profile%20in%20 BrazilMonica Barros
 

Mais de Monica Barros (12)

Introdução à programação em R
Introdução à programação em RIntrodução à programação em R
Introdução à programação em R
 
Time series and forecasting from wikipedia
Time series and forecasting from wikipediaTime series and forecasting from wikipedia
Time series and forecasting from wikipedia
 
Barros monica isf2012
Barros monica isf2012Barros monica isf2012
Barros monica isf2012
 
Southeast load
Southeast loadSoutheast load
Southeast load
 
Barros Monica Isf2012
Barros Monica Isf2012Barros Monica Isf2012
Barros Monica Isf2012
 
V30n3a02
V30n3a02V30n3a02
V30n3a02
 
V29n2a04 Artigo Revista Sobrapo
V29n2a04 Artigo Revista SobrapoV29n2a04 Artigo Revista Sobrapo
V29n2a04 Artigo Revista Sobrapo
 
Icord 2007
Icord 2007Icord 2007
Icord 2007
 
Modelagem Revistas
Modelagem RevistasModelagem Revistas
Modelagem Revistas
 
Pulp And Paper Isf
Pulp And Paper IsfPulp And Paper Isf
Pulp And Paper Isf
 
Ecomod 2007
Ecomod 2007Ecomod 2007
Ecomod 2007
 
Residential%20 Electrical%20 Energy%20 Consumption%20 Profile%20in%20 Brazil
Residential%20 Electrical%20 Energy%20 Consumption%20 Profile%20in%20 BrazilResidential%20 Electrical%20 Energy%20 Consumption%20 Profile%20in%20 Brazil
Residential%20 Electrical%20 Energy%20 Consumption%20 Profile%20in%20 Brazil
 

Último

Noções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdfNoções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdflucassilva721057
 
CIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestre
CIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestreCIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestre
CIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestreElianeElika
 
Aula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdfAula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdfFernandaMota99
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxLuizHenriquedeAlmeid6
 
VARIEDADES LINGUÍSTICAS - 1. pptx
VARIEDADES        LINGUÍSTICAS - 1. pptxVARIEDADES        LINGUÍSTICAS - 1. pptx
VARIEDADES LINGUÍSTICAS - 1. pptxMarlene Cunhada
 
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de..."É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...Rosalina Simão Nunes
 
A QUATRO MÃOS - MARILDA CASTANHA . pdf
A QUATRO MÃOS  -  MARILDA CASTANHA . pdfA QUATRO MÃOS  -  MARILDA CASTANHA . pdf
A QUATRO MÃOS - MARILDA CASTANHA . pdfAna Lemos
 
Manual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManuais Formação
 
Literatura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.pptLiteratura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.pptMaiteFerreira4
 
Mapa mental - Classificação dos seres vivos .docx
Mapa mental - Classificação dos seres vivos .docxMapa mental - Classificação dos seres vivos .docx
Mapa mental - Classificação dos seres vivos .docxBeatrizLittig1
 
Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....
Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....
Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....LuizHenriquedeAlmeid6
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividadeMary Alvarenga
 
Urso Castanho, Urso Castanho, o que vês aqui?
Urso Castanho, Urso Castanho, o que vês aqui?Urso Castanho, Urso Castanho, o que vês aqui?
Urso Castanho, Urso Castanho, o que vês aqui?AnabelaGuerreiro7
 
Dicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelDicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelGilber Rubim Rangel
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...azulassessoria9
 
o ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfo ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfCamillaBrito19
 
Rotas Transaarianas como o desrto prouz riqueza
Rotas Transaarianas como o desrto prouz riquezaRotas Transaarianas como o desrto prouz riqueza
Rotas Transaarianas como o desrto prouz riquezaronaldojacademico
 
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamentalAntônia marta Silvestre da Silva
 

Último (20)

Noções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdfNoções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdf
 
CIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestre
CIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestreCIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestre
CIÊNCIAS HUMANAS - ENSINO MÉDIO. 2024 2 bimestre
 
Aula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdfAula de História Ensino Médio Mesopotâmia.pdf
Aula de História Ensino Médio Mesopotâmia.pdf
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
 
VARIEDADES LINGUÍSTICAS - 1. pptx
VARIEDADES        LINGUÍSTICAS - 1. pptxVARIEDADES        LINGUÍSTICAS - 1. pptx
VARIEDADES LINGUÍSTICAS - 1. pptx
 
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de..."É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
"É melhor praticar para a nota" - Como avaliar comportamentos em contextos de...
 
A QUATRO MÃOS - MARILDA CASTANHA . pdf
A QUATRO MÃOS  -  MARILDA CASTANHA . pdfA QUATRO MÃOS  -  MARILDA CASTANHA . pdf
A QUATRO MÃOS - MARILDA CASTANHA . pdf
 
Manual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envio
 
Literatura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.pptLiteratura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.ppt
 
Mapa mental - Classificação dos seres vivos .docx
Mapa mental - Classificação dos seres vivos .docxMapa mental - Classificação dos seres vivos .docx
Mapa mental - Classificação dos seres vivos .docx
 
Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....
Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....
Slides Lição 5, Betel, Ordenança para uma vida de vigilância e oração, 2Tr24....
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividade
 
Urso Castanho, Urso Castanho, o que vês aqui?
Urso Castanho, Urso Castanho, o que vês aqui?Urso Castanho, Urso Castanho, o que vês aqui?
Urso Castanho, Urso Castanho, o que vês aqui?
 
Dicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim RangelDicionário de Genealogia, autor Gilber Rubim Rangel
Dicionário de Genealogia, autor Gilber Rubim Rangel
 
Bullying, sai pra lá
Bullying,  sai pra láBullying,  sai pra lá
Bullying, sai pra lá
 
CINEMATICA DE LOS MATERIALES Y PARTICULA
CINEMATICA DE LOS MATERIALES Y PARTICULACINEMATICA DE LOS MATERIALES Y PARTICULA
CINEMATICA DE LOS MATERIALES Y PARTICULA
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: COMUNICAÇÃO ASSERTIVA E INTERPESS...
 
o ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfo ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdf
 
Rotas Transaarianas como o desrto prouz riqueza
Rotas Transaarianas como o desrto prouz riquezaRotas Transaarianas como o desrto prouz riqueza
Rotas Transaarianas como o desrto prouz riqueza
 
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental
 

Modelos de regressão com variáveis binárias

  • 1.   40 Econometria – Semestre 2010.01 CAPÍTULO 9 – MODELOS DE REGRESSÃO COM VARIÁVEIS BINÁRIAS    1‐OBJETIVOS    Considerar  modelos  em  que  uma  ou  mais  variáveis  explicativas  são  variáveis  nominais  (também  chamadas de indicadores, variáveis qualitativas, variáveis binárias ou variáveis “dummy”). O caso  mais  simples  é  quando  fazemos  a  variável  igual  a  1  para  uma  categoria  e  0  para  a  categoria  mutuamente  exclusiva  à  primeira.  Por  exemplo,  podemos  definir  SEXO  =  1  se  feminino,  e  0  se  masculino.   Os modelos de regressão que contêm apenas variáveis binárias ou qualitativas são chamados de  modelos de Análise de Variância (modelos ANOVA).    2‐ CUIDADOS NO USO DE MODELOS COM VARIÁVEIS QUALITATIVAS    Suponha  que  desejamos  inserir  no  modelo  uma  variável  qualitativa  com  m  categorias.  É  importante notar que o modelo deverá ser especificado da seguinte forma:  1)  Modelo com termo constante e (m‐1) variáveis dummy  2)  Modelo SEM termo constante e m variáveis dummy  Por que? Poderia parecer natural, à primeira vista, escrever o modelo como:  Yi = α + β1 .D1i + β 2 .D2i + ... + β m .Dmi + ε i                    (1)  onde Dj = 1 ou 0 se a observação pertence à j‐ésima categoria da variável X, para j = 1, 2,..., n.  Mas, qual a matriz de design X para o modelo da equação (1) acima? VERIFIQUE que a primeira  coluna de X é composta apenas de 1’s. A segunda coluna contém 1’s e 0’s, assim como todas as  demais colunas. Mas, a soma das colunas 2 até m+1 é igual à 1ª. coluna, pois somando todas as  variáveis dummy em todos os seus níveis encontramos uma coluna de 1’s.  Logo,  o  modelo  representado  por  (1)  NÃO  PODE  ser  ajustado,  pois  sua  matriz  de  design  exibe  colinearidade perfeita. As alternativas são as indicadas em 1) e 2) acima.  Como funciona o modelo 1)?    Professora Mônica Barros ENCE 
  • 2.   41 Econometria – Semestre 2010.01 Escolhe‐se uma categoria como categoria “base”. Apenas a título de exemplo, suponha que ela é a  m‐ésima categoria da nossa variável qualitativa. Então o modelo a ser ajustado terá constante e  (m‐1) variáveis dummy, cada uma correspondendo às categorias 1, 2, ..., m‐1 respectivamente.  Ou seja, a equação do modelo é:  Yi = α + β1.D1i + β 2 .D2i + ... + β m−1 .D( m−1)i + ε i               (2)  Suponha que, para uma dada observação estamos na 1ª. categoria da variável qualitativa e assim  D1i = 0 e todas as outras variáveis dummy são zero. Então o valor ajustado nesta observação será:   ˆ ˆ ˆ ˆ ˆ Yi = α + β1 .(1) = α + β1                     (3)  Suponha agora que uma observação corresponde à m‐ésima categoria (que é a categoria base).  Então, os valores de TODAS as variáveis dummy nesta observação são zero, e o valor ajustado é:  ˆ ˆ Yi = α                          (4)  A partir de (3) e (4) fica fácil interpretar o significado dos coeficientes na regressão (2).  α indica o  valor médio na categoria omitida (neste caso a m‐ésima). Cada  βi indica a diferença entre o valor  da i‐ésima categoria e a média da categoria omitida.  Modelo 2)  A especificação do modelo 2) é:  Yi = β1 .D1i + β 2 .D2i + ... + β m .D( m ) i + ε i                 (5)  Note que:  • Na equação (5) não existe termo constante;  • Agora existem variáveis dummy para TODAS as m categorias.  Qual a interpretação dos coeficientes na equação (5)? Cada  βi indica o valor médio da respectiva  categoria.    Exemplo 9.1.  Neste  exemplo  a  variável  dependente  é  o  percentual  de  votos  nulos  e  brancos  (soma  dos  dois  percentuais) no 1º. Turno das eleições municipais para prefeito no município do Rio de Janeiro em  2008. A variável explicativa é a região da cidade em que está situada a seção eleitoral, dividida em  5 categorias: Centro, Sul, Norte, Oeste, Subúrbio.      Professora Mônica Barros ENCE 
  • 3.   42 Econometria – Semestre 2010.01 Existem  10702  observações  na  amostra,  cada  uma  corresponde  a  uma  seção  eleitoral,  ou  seja,  uma urna de votação.  Inicialmente ajustamos o modelo:  Yi = α + β1 .CENTROi + β 2 .NORTEi + β 3 .SULi + β 4 .OESTEi + ε i   Ou seja, a categoria base é “SUBURBIO”. Os resultados desta regressão estão abaixo:  Coefficients(a) Unstandardized Coefficients Model t Sig. B 13,405 Std. Error ,037 B 360,889 Std. Error ,000 ,696 ,125 5,565 ,000 indicador zona norte -2,423 ,096 -25,262 ,000 indicador zona sul -3,529 ,073 -48,395 ,000 -,190 ,055 -3,479 a Dependent Variable: soma dos percentuais de nulos e brancos ,001 (Constant) indicador centro da cidade indicador zona oeste Model Summary Model 1 R ,472(a) R Square ,223 Adjusted R Square ,222 Std. Error of the Estimate 2,43974 a Predictors: (Constant), indicador zona oeste, indicador centro da cidade, indicador zona norte, indicador zona sul ANOVA(b) df Regression Sum of Squares 18244,922 4 Mean Square 4561,230 Residual Model 1 63671,940 10697 5,952 F 766,295 Sig. ,000(a) Total 81916,862 10701 a Predictors: (Constant), indicador zona oeste, indicador centro da cidade, indicador zona norte, indicador zona sul b Dependent Variable: soma dos percentuais de nulos e brancos Descriptive Statistics perc_nulos_brancos Mean 12,6959 Std. Deviation 2,76678 N 10702 Que estória você pode contar a partir destes dados?  • O modelo é, em geral, altamente significante (veja a estatística F), ou seja, os percentuais  de nulos + brancos variam de acordo com a região da cidade. Apesar disso, o R2 do modelo  é baixo. Que tal investigar a relação entre a estatística F e o R2 e descobrir por que?    Professora Mônica Barros ENCE 
  • 4.   43 Econometria – Semestre 2010.01 • No  SUBURBIO  (categoria  base,  variável  dummy  omitida),  o  percentual  médio  de  votos  brancos + nulos é 13,405%, que é superior à média geral do município (12,696%).  • No CENTRO, o percentual médio de brancos + nulos é 13,405  + 0,696 = 14, 101%.   • Na  zona  NORTE,  o  percentual  médio  de  brancos  +  nulos  é  13,405  ‐  2,423=  10,982%,  o  SEGUNDO MENOR de todas as regiões da cidade.  • Na zona SUL, o percentual médio de brancos + nulos é 13,405  ‐ 3,529= 9,876%, o MENOR  de todas as regiões da cidade.  • Na  zona  OESTE,  o  percentual  médio  de  brancos  +  nulos  é  13,405    ‐  0,190=  13,215%,  superior à média geral do município.     Para  comparação  ajustamos  o  modelo  que  emprega  todas  as  categorias  da  variável  “região  da  cidade” e não contém termo constante.   Yi = β1 .CENTROi + β 2 .NORTEi + β 3 .SULi + β 4 .OESTEi + β 5 .SUBURBIOi + ε i   Os resultados seguem abaixo.  ANOVA(c,d) Sum of Squares df Mean Square F Sig. Regression 1743244,3 5 348648,867 58573,634 ,000(a) 36 Residual 63671,940 10697 5,952 Total 1806916,2 10702 76(b) a Predictors: indicador suburbio, indicador zona oeste, indicador zona sul, indicador zona norte, indicador centro da cidade b This total sum of squares is not corrected for the constant because the constant is zero for regression through the origin. c Dependent Variable: soma dos percentuais de nulos e brancos d Linear Regression through the Origin Model 1 Coefficients(a,b) Unstandardized Coefficients t Sig. B Model B Std. Error Std. Error indicador centro da cidade 14,102 ,119 118,030 ,000 indicador zona norte 10,982 ,088 124,174 ,000 indicador zona sul 9,877 ,063 157,413 ,000 indicador zona oeste 13,215 ,040 329,390 ,000 13,405 ,037 360,889 a Dependent Variable: soma dos percentuais de nulos e brancos b Linear Regression through the Origin ,000 indicador suburbio   Professora Mônica Barros ENCE 
  • 5.   44 Econometria – Semestre 2010.01 Note  que  os  coeficientes  da  regressão  estimada  por  este  modelo  são  exatamente  os  mesmos  obtidos no modelo anterior.     Que modelo usar?  No fundo é uma questão de gosto...  A maioria dos pesquisadores tende a usar o modelo representado pela equação (2), que inclui o  termo constante. Isso acontece pois nesta forma é possível verificar facilmente se a categorização  faz diferença (em relação à categoria base).  Nota  É  possível  combinar  no  mesmo  nodelo  mais  de  uma  variável  qualitativa.  O  único  ponto  a  considerar  é  que  cada  variável  qualitativa  deve  ser  expressa  com  o  seu  número  de  categorias  menos UM. Também, neste caso, o termo constante indicará a média quando a observação estiver  nos níveis das categorias base para as duas variáveis qualitativas.     Exemplo 9.2.   Uso de variáveis “dummy” para representar a sazonalidade de uma série temporal.  Considere a série de consumo mensal de energia elétrica na região Sudeste a partir de janeiro de  2003 mostrada no gráfico a seguir.  Consumo de Energia Elétrica na Região Sudeste em GWh 19000 18000 17000 16000 15000 14000 13000 20 03 .0 1 20 03 .0 20 3 03 .0 20 5 03 .0 20 7 03 .0 20 9 03 .1 20 1 04 .0 20 1 04 .0 20 3 04 .0 20 5 04 .0 20 7 04 .0 20 9 04 .1 20 1 05 .0 20 1 05 .0 20 3 05 .0 5 20 05 .0 20 7 05 .0 20 9 05 .1 20 1 06 .0 20 1 06 .0 20 3 06 .0 20 5 06 .0 20 7 06 .0 20 9 06 .1 1 20 07 .0 20 1 07 .0 20 3 07 .0 20 5 07 .0 7 20 07 .0 20 9 07 .1 20 1 08 .0 20 1 08 .0 20 3 08 .0 20 5 08 .0 20 7 08 .0 20 9 08 .1 20 1 09 .0 1 20 09 .0 20 3 09 .0 20 5 09 .0 20 7 09 .0 20 9 09 .1 20 1 10 0 12000   Vamos  calcular  os  fatores  sazonais  mensais  para  esta  série  usando  o  primeiro  método  descrito  neste  capítulo.  As  variáveis  INDIC_01  a  INDIC_12  são,  respectivamente,  as  “dummies”  para  os  meses de Janeiro a Dezembro.  Método 1 – modelo com constante – categoria omitida = janeiro  O modelo ajustado é:    Professora Mônica Barros ENCE 
  • 6.   45 Econometria – Semestre 2010.01 Coefficients(a) Unstandardized Coefficients Model (Constant) indic_02 t Sig. B 15688,000 Std. Error 604,355 B 25,958 Std. Error ,000 -398,571 884,684 -,451 ,654 indic_03 57,571 884,684 ,065 ,948 indic_04 133,286 884,684 ,151 ,881 indic_05 -49,000 884,684 -,055 ,956 indic_06 -159,286 884,684 -,180 ,858 indic_07 -347,429 884,684 -,393 ,696 indic_08 18,714 884,684 ,021 ,983 indic_09 262,571 884,684 ,297 ,767 indic_10 463,714 884,684 ,524 ,602 indic_11 739,143 884,684 ,835 ,406 indic_12 468,143 884,684 ,529 ,598 a Dependent Variable: consumo_ee_sudeste Note que as estatísticas t são pequenas, indicando que os fatores sazonais não são significantes  neste caso. O que o modelo nos diz é que esta série, no período indicado, não é sazonal, ou pelo  menos, que não conseguimos identificar as componentes sazonais mensais.    As  estatísticas  do  modelo  também  indicam  que  apenas  os  fatores  sazonais  não  conseguem  “explicar” o consumo de energia – note que a estatística F na próxima tabela é muito pequena, e o  modelo como um todo não é significativo.    ANOVA(b) Sum of Squares df Mean Square F Sig. Regression 8832858,9 11 802987,178 ,275 ,989(a) 61 Residual 213302712 73 2921954,963 ,286 Total 222135571 84 ,247 a Predictors: (Constant), indic_12, indic_11, indic_10, indic_09, indic_08, indic_07, indic_06, indic_05, indic_04, indic_03, indic_02 b Dependent Variable: consumo_ee_sudeste Model 1   Na verdade, é provável que o “culpado” por isso seja o nível da série, que está aumentando, e não  está sendo considerado na modelagem. Vamos adicionar uma tendência linear ao modelo, através  de uma variável que assume os valores 1, 2, 3, ... 85. Esta variável será chamada de “tempo” no  modelo a seguir.     Professora Mônica Barros ENCE 
  • 7.   46 Econometria – Semestre 2010.01 O novo modelo (que inclui a tendência linear) tem os seguintes diagnósticos:    Coefficients(a) Unstandardized Coefficients Model t Sig. B 13054,619 Std. Error 233,489 B 55,911 Std. Error ,000 indic_02 -92,364 300,804 -,307 ,760 indic_03 302,537 300,704 1,006 ,318 indic_04 317,010 300,626 1,054 ,295 indic_05 73,483 300,570 ,244 ,808 indic_06 -98,044 300,537 -,326 ,745 indic_07 -347,429 300,526 -1,156 ,251 indic_08 -42,527 300,537 -,142 ,888 indic_09 140,089 300,570 ,466 ,643 indic_10 279,990 300,626 ,931 ,355 indic_11 494,177 300,704 1,643 ,105 indic_12 161,936 300,804 ,538 ,592 61,241 2,587 23,677 ,000 (Constant) tempo a Dependent Variable: consumo_ee_sudeste   ANOVA(b) Sum of Squares df Mean Square F Sig. Regression 197858692 12 16488224,389 48,901 ,000(a) ,664 Residual 24276878, 72 337178,869 583 Total 222135571 84 ,247 a Predictors: (Constant), tempo, indic_07, indic_08, indic_06, indic_05, indic_09, indic_10, indic_04, indic_11, indic_03, indic_12, indic_02 b Dependent Variable: consumo_ee_sudeste Model   Model Summary(b) Adjusted R Std. Error of Square the Estimate R Square ,891 ,872 580,671 a Predictors: (Constant), tempo, indic_07, indic_08, indic_06, indic_05, indic_09, indic_10, indic_04, indic_11, indic_03, indic_12, indic_02 b Dependent Variable: consumo_ee_sudeste Model O que podemos concluir?  Os  fatores  sazonais  são  ainda  não  significantes,  mas  a  qualidade  do  ajuste  melhorou  sensivelmente.  O  modelo  agora  é,  como  um  todo,  significativo  (veja  a  estatística  F).  As    Professora Mônica Barros ENCE 
  • 8.   47 Econometria – Semestre 2010.01 estatísticas t dos fatores sazonais são não significantes, mas são maiores (em módulo) que  na situação anterior. Talvez o procedimento mais adequado (se o objetivo é encontrar um  modelo  parcimonioso)  seja  empregar  apenas  alguns  dos  fatores  sazonais,  e  não  todos,  escolhendo‐os, por exemplo, através de um procedimento “stepwise”.    A estrutura do modelo ajustado é:  (Consumo _ estimadot ) = 13054,62 + 61,24 * t − 92,36 * Indic _ 02t + 302,54 * Indic _ 03t + 317,01* Indic _ 04t + + 73,48 * Indic _ 05t − 98,04 * Indic _ 06 t − 347,43 * Indic _ 07 t − 42,53 * Indic _ 08t + + 140,09 * Indic _ 09 t + 279,99 * Indic _ 10 t + 494,18 * Indic _ 11t + 161,94 * Indic _ 12 t   Exemplo 9.3.  Considere  a  série  de  Vendas  nominais  no  varejo  (hipermercados  e  supermercados)  –  número  índice  (média  2003  =  100),  fornecida  pela  Pesquisa  Mensal  do  Comércio  (PMC)  do  IBGE  e  mostrada no próximo gráfico. Vendas nominais - varejo - hipermercados e superm. - índice (média 2003 = 100) - IBGE/PMC 250 230 210 190 170 150 130 110 90 70 ja m n/ 00 ai /0 0 se t/0 0 ja n/ 01 m ai /0 1 se t/0 1 ja n/ 02 m ai /0 2 se t/ 0 2 ja n/ 03 m ai /0 3 se t/0 3 ja n/ 04 m ai /0 4 se t/0 4 ja n/ 05 m ai /0 5 se t/0 5 ja n/ 06 m ai /0 6 se t/0 6 ja n/ 07 m ai /0 7 se t/0 7 ja n/ 08 m ai /0 8 se t/0 8 ja n/ 09 m ai /0 9 se t/0 9 ja n/ 10 50 A sazonalidade na série fica particularmente óbvia por conta do mês de Dezembro, onde ocorre  um “pico” nas vendas do ano.  No entanto, deve‐se notar também que a série tem uma tendência  muito  expressiva,  e  modela‐la  sem  levar  em  conta  esta  tendência  pode  nos  levar  a  encontrar  fatores  sazonais  que  não  fazem  sentido,  pois  estão  capturando  também  a  componente  da  tendência, além da sazonalidade.    Professora Mônica Barros ENCE 
  • 9.   48 Econometria – Semestre 2010.01 Vamos experimentar diversos modelos  e comentar os resultados.  Modelo 1 – SEM TENDÊNCIA, apenas componentes sazonais  Estrutura:    Yi = α + β1.D1i + β 2 .D2i + ... + β m−1 .D( m−1)i + ε i       onde  ajustamos  m‐1  =  11  variáveis  dummy. Escolhemos neste caso o mês de janeiro como variável omitida, e assim serão ajustadas  as dummies para fevereiro a dezembro. Os resultados do ajuste são:  Coefficients(a) Unstandardized Coefficients Model t Sig. (Constant) B 116,116 Std. Error 11,144 B 10,419 Std. Error ,000 indic_02 -11,697 16,150 -,724 ,470 indic_03 -,141 16,150 -,009 ,993 indic_04 -1,389 16,150 -,086 ,932 indic_05 -1,876 16,150 -,116 ,908 indic_06 -5,106 16,150 -,316 ,752 indic_07 -,095 16,150 -,006 ,995 indic_08 2,284 16,150 ,141 ,888 indic_09 -,199 16,150 -,012 ,990 indic_10 5,858 16,150 ,363 ,718 indic_11 4,647 16,150 ,288 ,774 indic_12 39,735 16,150 2,460 ,015 a Dependent Variable: Vendas nominais - varejo - hipermercados e superm. - índice (média 2003 = 100) - IBGE/PMC PMC12_VNSUPT12 ANOVA(b) Sum of Squares df Mean Square F Sig. Regression 17236,646 11 1566,968 1,147 ,333(a) Residual 148909,93 109 1366,146 7 Total 166146,58 120 2 a Predictors: (Constant), indic_12, indic_11, indic_10, indic_09, indic_08, indic_07, indic_05, indic_04, indic_03, indic_02, indic_06 b Dependent Variable: Vendas nominais - varejo - hipermercados e superm. - índice (média 2003 = 100) - IBGE/PMC PMC12_VNSUPT12 Model Note  como  o  ajuste  do  modelo  é  ruim.  A  estatística  F  é  muito  pequena,  indicando  que  os  regressores são, em conjunto, não significantes.  Dentre os fatores sazonais, apenas o relativo ao  mês  de  dezembro  é  significativo  (veja  as  estatísticas  t).  O  R2  desde  modelo  é  terrível,  apenas  10,4%, e o R2 ajustado é 1,3%.      Professora Mônica Barros ENCE 
  • 10.   49 Econometria – Semestre 2010.01 Vamos  tentar  melhorar  este  resultado  incorporando  uma  tendência  linear  ao  modelo.  Criamos  uma  variável  “tempo”  definida  como  1,  2,  ...,  121,  que  é  apenas  um  indicador  do  instante  de  tempo.  Esta  variável  poderia  ter  sido  criada  de  outra  forma,  qualquer  transformação  linear  da  variável “tempo” definida acima serviria. A estrutura do modelo agora é:  Modelo 2 – TENDÊNCIA LINEAR e componentes sazonais  Estrutura:    Yi = α + λ.t + β1 .D1i + β 2 .D2i + ... + β m−1 .D( m−1)i + ε i       onde ajustamos m‐1 = 11 variáveis  dummy. Escolhemos neste caso o mês de janeiro como variável omitida, e assim serão ajustadas  as dummies para fevereiro a dezembro. Os resultados do ajuste são:  Coefficients(a) Unstandardized Coefficients Model t Sig. (Constant) B 56,560 Std. Error 3,155 B 17,927 Std. Error ,000 indic_02 -6,816 4,044 -1,685 ,095 indic_03 3,764 4,043 ,931 ,354 indic_04 1,540 4,043 ,381 ,704 indic_05 ,076 4,042 ,019 ,985 indic_06 -4,130 4,042 -1,022 ,309 indic_07 -,095 4,042 -,024 ,981 indic_08 1,307 4,042 ,323 ,747 indic_09 -2,152 4,042 -,532 ,596 indic_10 2,929 4,043 ,724 ,470 indic_11 ,741 4,043 ,183 ,855 indic_12 1 34,853 4,044 8,619 ,000 ,976 ,024 40,397 ,000 tempo a Dependent Variable: Vendas nominais - varejo - hipermercados e superm. - índice (média 2003 = 100) - IBGE/PMC PMC12_VNSUPT12 ANOVA(b) Sum of Squares df Mean Square F Sig. Regression 156903,55 12 13075,296 152,778 ,000(a) 0 Residual 9243,032 108 85,584 Total 166146,58 120 2 a Predictors: (Constant), tempo, indic_07, indic_08, indic_06, indic_09, indic_05, indic_10, indic_04, indic_11, indic_03, indic_12, indic_02 b Dependent Variable: Vendas nominais - varejo - hipermercados e superm. - índice (média 2003 = 100) - IBGE/PMC PMC12_VNSUPT12 Model 1 O  resultado  do  modelo  é  bem  superior  ao  anterior.  Agora  o  modelo  é  significante  (veja  a  estatística F) e ambos o R2 e o R2 ajustado são altos (94,4 e 93,8% respectivamente). No entanto,  apenas os fatores sazonais para fevereiro e dezembro são significantes ao nível 10%.    Professora Mônica Barros ENCE 
  • 11.   50 Econometria – Semestre 2010.01 O  que  fazer?  Podemos  tentar  mudar  a  “cara”  da  tendência  e  tentar  ajustar,  por  exemplo,  uma  tendência quadrática. Isso nos leva ao próximo modelo.    Modelo 3 – TENDÊNCIA QUADRÁTICA e componentes sazonais  Estrutura:    Yi = α + λ1 .t + λ2 .t 2 + β1 .D1i + β 2 .D2i + ... + β m−1.D( m−1) i + ε i       Ajustamos  m‐1  =  11  variáveis dummy. Escolhemos neste caso o mês de janeiro como variável omitida, e assim serão  ajustadas as dummies para fevereiro a dezembro. Os resultados do ajuste são:  Coefficients(a) Unstandardized Coefficients Model t Sig. (Constant) B 71,441 Std. Error 2,115 B 33,775 Std. Error ,000 indic_02 -5,335 2,369 -2,252 ,026 indic_03 5,304 2,369 2,239 ,027 indic_04 3,125 2,369 1,319 ,190 indic_05 1,694 2,369 ,715 ,476 indic_06 -2,493 2,369 -1,052 ,295 indic_07 1,549 2,369 ,654 ,515 indic_08 2,945 2,369 1,243 ,217 indic_09 -,534 2,369 -,225 ,822 indic_10 4,514 2,369 1,905 ,059 indic_11 2,281 2,369 ,963 ,338 indic_12 36,334 2,369 15,335 ,000 ,180 ,057 3,169 ,002 tempo tempo_quadrado ,007 ,000 14,429 ,000 a Dependent Variable: Vendas nominais - varejo - hipermercados e superm. - índice (média 2003 = 100) - IBGE/PMC PMC12_VNSUPT12 Os fatores sazonais para fevereiro, março, outubro e dezembro são significantes agora. Também  existem  outros  fatores  “quase”  significantes  (com  79%  ou  80%  de  significância,  que  são  os  relativos a Abril e Agosto).    Note também que os parâmetros que caracterizam a tendência são altamente significantes.    Para  tentar  ainda  mais  amortecer  esta  tendência,  poderíamos  ajustar  o  modelo  à  série  logaritmada de vendas.        Professora Mônica Barros ENCE 
  • 12.   51 Econometria – Semestre 2010.01 Modelo  4  –  TENDÊNCIA  QUADRÁTICA  e  componentes  sazonais  aplicada  à  série  do  logaritmo  de  Vendas  Coefficients(a) Unstandardized Coefficients Model t Sig. B 4,239 Std. Error ,014 B 296,004 Std. Error ,000 indic_02 -,048 ,016 -3,001 ,003 indic_03 ,049 ,016 3,039 ,003 indic_04 ,028 ,016 1,741 ,085 indic_05 ,013 ,016 ,790 ,431 indic_06 -,022 ,016 -1,369 ,174 indic_07 ,013 ,016 ,822 ,413 indic_08 ,024 ,016 1,503 ,136 indic_09 -,003 ,016 -,213 ,832 indic_10 ,036 ,016 2,262 ,026 indic_11 ,021 ,016 1,287 ,201 indic_12 ,270 ,016 16,815 ,000 tempo 1 ,006 ,000 16,171 ,000 5,322 ,000 (Constant) tempo_quadrado 1,63E-005 ,000 a Dependent Variable: log_vendas_varejo_hipermercados Em  vermelho  estão  indicados  os  coeficientes  das  dummies  significantes.  Note  que  as  dummies  para Junho e Agosto são significantes a nível 17%, e Novembro é significante a 20%. O modelo é  altamente  significante,  como  indicado  na  tabela  ANOVA  a  seguir.  O  R2  e  o  R2  ajustado  são,  respectivamente, 99,4 e 98,5%.  ANOVA(b) Model 1 Regression Residual Total Sum of Squares 10,957 df 13 Mean Square ,843 ,144 107 ,001 11,100 F 627,171 Sig. ,000(a) 120 a Predictors: (Constant), tempo_quadrado, indic_07, indic_08, indic_06, indic_09, indic_05, indic_10, indic_04, indic_11, indic_03, indic_12, indic_02, tempo b Dependent Variable: log_vendas_varejo_hipermercados   E o que estes fatores sazonais representam neste caso? A série (na escala log) menos a tendência  deve ser estacionária, ou quase isso, ou seja, não deve “subir” nem “descer”. Então, o que deve  ficar aparente nesta série em que a tendência foi eliminada são os fatores sazonais.  Vamos calcular:    Professora Mônica Barros ENCE 
  • 13.   52 Econometria – Semestre 2010.01 ˆ Z t = Yt − 4,2385 - 0,0062336 * t - (1,62883e - 005) * t 2   ˆ Onde  Yt  é o logaritmo da série de vendas de varejo em hipermercados. Zt é a série sem tendência.  O gráfico de Zt está a seguir. Note que os fatores sazonais tornam‐se bastante claros e a série é  estacionária na média, ou seja, não tem tendência.  Série sem Tendência 0,4000 0,3500 0,3000 0,2500 0,2000 0,1500 0,1000 0,0500 0 /1 ja n 9 t/0 9 ju l/0 ou 9 9 /0 r/0 ja n ab 8 t/0 8 ju l/0 ou 8 8 /0 r/0 ja n ab 7 t/0 7 ju l/0 ou 7 7 /0 r/0 ja n ab 6 t/0 6 ju l/0 ou 6 6 /0 r/0 ja n ab 5 t/0 5 ju l/0 ou 5 5 /0 r/0 ja n ab 4 t/0 4 ju l/0 ou 4 4 /0 r/0 ja n ab 3 t/0 3 ju l/0 ou 3 3 /0 r/0 ja n ab 2 t/0 2 ju l/0 ou 2 2 /0 r/0 ja n ab 1 t/0 1 ju l/0 ou 1 1 /0 r/0 ja n ab 0 t/0 0 ju l/0 ou 0 r/0 ja n ab /0 0 0,0000 -0,0500 -0,1000 -0,1500    Qual a interpretação dos fatores sazonais?  Se  olharmos  para  o  modelo  da  variável  logaritmada,  notamos  que  o  nível  em  Janeiro  (categoria  omitida) é dado por:  ˆ Yt = 4,2385 + 0,0062336 * t + (1,62883e - 005) * t 2   Isto ocorre pois em Janeiro os valores de todas as variáveis dummy são zero. A equação acima nos  permite encontrar o valor ajustado para t = 1 (Jan/2000), t = 13 (Jan/2001), t = 25 (Jan/2002) e etc,  bastando substituir o valor de t apropriado.  E as previsões dos valores de Dezembro? São dadas por:  ˆ Yt = 4,2385 + 0,0062336 * t + (1,62883e - 005) * t 2 + 0,2697 * INDIC_DEZEMBRO t   Onde INDIC_DEZEMBROt = 1 se t é um mês de Dezembro e 0 se t não é um mês de Dezembro.  Por exemplo, a previsão para Dezembro de 2000 (t = 12) será:  ˆ Yt = 4,2385 + 0,0062336 * (12) + (1,62883e - 005) * (12) 2 + 0,2697     Professora Mônica Barros ENCE 
  • 14.   53 Econometria – Semestre 2010.01 Em Dezembro de 2008 (t= 108), a previsão é:  ˆ Yt = 4,2385 + 0,0062336 * (108) + (1,62883e - 005) * (108) 2 + 0,2697   Note que o último termo desta equação (0,2697) só afeta os meses de Dezembro, ou seja, só se  aplica à equação nos instantes t que correspondem a um mês de Dezembro.  Para casa:  Use o Excel (ou algo parecido) para calcular os valores ajustados pelo modelo para cada mês.  Para casa II:  Considere as planilhas:  Dados_mensais_exemplos_capitulo_9.xls  Exemplo_taxa_desemprego_RMSP.xls  PIB_trimestral.xls  Exercite  o  que  você  aprendeu  neste  capítulo  sobre  fatores  sazonais,  tendências  lineares,  quadráticas,  etc...  e  ajuste  modelos  para  as  séries  nestas  planilhas  que  não  foram  usadas  nos  exemplos deste texto.   O que muda quando precisamos estimar fatores sazonais trimestrais?    Professora Mônica Barros ENCE