SlideShare uma empresa Scribd logo
1 de 34
Baixar para ler offline
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                11
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


2. Lineare Modelle für Paneldaten
Paneldaten: Information über die gleichen Untersuchungs-
           einheiten zu meheren Beobachtungszeitpunkten
• Mikro-Panels: große Anzahl (N) von U-Einheiten (Individuen,
  Firmen) zu einigen wenigen Zeipunkten (T)
  z.B.: Sozio-Ökonomisches Panel, Unternehmensfragungen
• Makro-Panels: relativ kleine Anzahl von U-Einheiten (Länder,
   Regionen) über einen relativ langen Zeitraum
   z.B.: OECD-Länderpanel, Regionenpanel, Branchenpanel
• Pseudo-Panels: U-Einheiten sind über die Wellen nicht
  identisch bzw. andere Dimension als Zeit
  − Zeitreihen über Alterskohorten
  − Querschnittsdaten über Zwillinge
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                12
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


Vorteile von Paneldaten:
• Kontrolle unbeobachteter zeitinvarianter individueller
   Unterschiede (Heterogenität), z.B. „ability bias“
•     Präzisere Parameterschätzung durch Ausnutzung von
      Querschnitts- und Zeitreihenvariation; mehr Information
•     Modellierung dynamischer Anpassungprozesse;
      Ereignisanalysen; Vorher-Nachher Vergleiche etc.

Nachteile von Paneldaten:
• Mikro-Panels meist nur für kurze Zeiträume verfügbar
   relativ teuer zu erheben
• hohe Panelsterblichkeit („sample attrition“) mit häufig nicht
   rein zufälligen Ausfällen   Stichprobenselektion
• Messfehler bei retrospektiv erhobenen Fragen
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                13
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


2.1 Statische Modelle
Grundmodell: y it = α i + β ′ xit + ε it
       α i := Individualeffekt, variiert über i, aber nicht über t
       E ( ε it xit ) , ∀ i , t := Annahme „strikter Exogenität“
Bei Gültigkeit der Annahme strikter Exogenität und:
•    αi = α, ∀i:                   OLS, erwartungstreu und effizient
•    αi ≠ α:
     E (α i xit ) = 0 : OLS, erwartungstreu aber ineffizient
         GLS konsistent und effizient
      „Random Effects“-Modell (αi ist Zufallsvariable)
     E (α i xit ) ≠ 0 :              OLS, verzerrt
           „Fixed Effects“-Modell (αi ist „fixer Effekt“)
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                14
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


2.1.1 „Fixed Effects“-Modell
Traditionell werden αi als fixe Parameter (individual-
spezifische Konstante) modelliert:
(2.1) y i = i α i + X i β + ε i T Beobachtungen für Person i
                   T ×1         T ×K
n × T Beobachtungen für alle n Personen („balanced panel“)
      ⎡ y1 ⎤              ⎡i    0 ⋅ ⋅ 0 ⎤ ⎡ α1 ⎤ ⎡ X 1 ⎤ ⎡ ε1 ⎤
      ⎢y ⎥                ⎢0    i ⋅ ⋅ 0 ⎥ ⎢α 2 ⎥ ⎢ X 2 ⎥ ⎢ε ⎥
      ⎢ 2⎥                ⎢             ⎥⎢ ⎥ ⎢ ⎥         ⎢ 2⎥
(2.2) ⎢ ⋅ ⎥ =             ⎢       ⋅ ⋅   ⎥ ⎢ ⎥ + ⎢ ⎥β + ⎢ ⎥
      ⎢ ⋅ ⎥               ⎢       ⋅ ⋅   ⎥⎢ ⎥ ⎢ ⎥         ⎢ ⎥
      ⎢ ⎥                 ⎢             ⎥⎢ ⎥ ⎢ ⎥         ⎢ ⎥
      ⎢yn ⎥
      ⎣ ⎦                 ⎢0
                          ⎣     0 ⋅ ⋅ i ⎥ ⎢α n ⎥ ⎢ X n ⎥
                                        ⎦⎣ ⎦ ⎣ ⎦         ⎢ε n ⎥
                                                         ⎣ ⎦
               ⎡                                                                 ⎤ ⎡ nα1 ⎤
(2.3)    y = ⎢ d1 d 2                           ⋅ ⋅          dn            X ⎥     ⎢ × ⎥+ε
      ( nT )×1 ⎣ ( nT )×1                                               ( nT )× K ⎢ β ⎥
                                                           ( nT )×1              ⎦ ⎣ K ×1 ⎦
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                15
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


(2.4) y = Dα + Xβ + ε , D = [d1                                     d2        ⋅ ⋅ dn ]
                                            ( nT )× n
    OLS mit n × T Beobachtungen und K + n zu schätzenden
    Parametern: LSDV („least squares dummy variable model“)
    Unter Standardannahmen haben OLS-Schätzer für α und β
    die üblichen Eigenschaften.
Falls n sehr gross (wie bei Mikro-Panels) direkte Schätzung des
LSDV (Inverse der Matrix [D X]‘[D X] !) nicht möglich:
   Transformation der Variablen, so dass fixe Individualeffekte
   eliminiert werden, mit Transformationsmatrix ( Übung)
                          = I − D ( D′D ) D′ := Diagonalmatrix
                                                  −1
(2.5)       Md
          ( nT )×( nT )
mit Diagonalelement M 0 = I T − ii ′ / T
Für beliebigen T × 1 Vektor zi gilt: M zi = zi − zi
                                                                0


 := Abweichung der Beobachtung vom individuellen Mittelwert
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                   16
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


OLS mit transformierten Daten:
(2.6)       y it − y i . = β ′ ( x it − x i . ) + ε it − ε i .
      ˆ = [ X ′M X ]−1 [ X ′M y ]
(2.7) β         d            d

Schätzung der individuellen Effekte:
            α i = yi . − β ′x i .
             ˆ           ˆ
(2.8)
           ˆ = [ D ′D ] D ′ y − Xβ
           α
                       −1
                                 ˆ     (               )
                                                                     ∑∑(                                )
                                                                       n    T
Schätzung der Varianzen:                                                                                    2
                                                                                   yit − α i − β′x it
                                                                                          ˆ ˆ
               ∧
            Var ( β ) = s [ X ′M d X ] , s =
                                  2   −1  2                           i =1 t =1
(2.9)
                                                                                  nT − n − K
               ∧    s2 ⎡         ∧
                                                ⎤
(2.10) Var (α i ) =
             ˆ        + ⎢ x i′. Var ( β ) x i . ⎥
                    T ⎣                         ⎦
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                17
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


F-Test auf fixe Effekte:
                H0: αi = α, ∀i; H1: αi ≠ α

(2.11) F               =
                            ( Ru2 − Rr2 ) / ( n − 1)
      n −1, nT − n − K
                         (1 − Ru2 ) / ( nT − n − K )
                  2
            mit: Rr             := Bestimmtheitsmass unter H0
                     Ru2        := Bestimmtheitsmass unter H1
Erweiterungen:
• Anstatt n Individual-Dummies auch Spezifikation mit (n – 1)
  Individual-Dummies und einer allgemeinen Konstanten
•    Modifikation falls T über i variiert („unbalanced panel“)
      Problem: nicht zufällige Ausfälle
•    Fixe Zeiteffekte: zweifache Transformation (Greene, S. 198)
     oder – üblicher – Zeitdummies
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                18
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


•    Spezialfall: Schätzung erster Differenzen
                             y it = α i + β ′x it + ε it
                  y it − y i ,t −1 = β ′ ( x it − x i ,t −1 ) + ε it − ε i ,t −1
     Erste-Differenzen Transformation eliminiert FE
     OLS-Schätzung des transformierten Modells:
                            Δ y it = β ′Δ x it + Δ ε it , t = 2, 3,.., T
     T = 2: FE− und Δ−Schätzer sind identisch
     T > 2:
     − FE ist effizienter als Δ−Schätzer, falls εit nicht autokorreliert
     − Δ ist effizienter falls εit einem random walk folgt, da dann
         Δ ε it = ε it − ε i ,t −1 unkorreliert ist
         vgl. dazu Übung und dynamische Modelle und Übung
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                19
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


2.1.2 „Pooled“-, „Within“- und „Between“-Schätzer
Aus dem Regressionsmodell (mit αi = α, ∀i):
(2.12) y it = α + β ′x it + ε it
ergibt sich als Abweichung von den Gruppenmittelwerten:

(2.13) y it − y i . = β ′ ( x it − x i . ) + ε it − ε i .
und bezogen auf die Gruppenmittelwerte:
(2.14) y i . = α + β ′x i . + ε i .
Der Koeffizientenvektor β kann aus jeder der drei Gleichungen
unter bestimmten Annahmen erwartungstreu geschätzt werden.
Die Schätzer unterscheiden sich hinsichtlich der jeweils
genutzten Information und damit der Effizienz der Schätzung.
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                20
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


Abweichungen von den Gesamtmittelwerten x , y
             n T
(2.15) S g =   xx( x − x )( x − x )′
                      ∑∑                 it             it
                       i =1 t =1
                          n   T
(2.16) S xgy = ∑ ∑ ( x it − x )( yit − y )
                       i =1 t =1

Abweichungen von den Gruppenmittelwerten xi . , y i .
           n  T
(2.17) S =
        w
                ( x − x )( x − x )′
               xx     ∑∑                 it   i.             it   i.
                       i =1 t =1
                          n   T
(2.18) S xy = ∑ ∑ ( x it − xi . )( yit − yi . )
         w

                        i =1 t =1

Abweichungen der Gruppenmittelwerte von Gesamtmittelwerten
            n
(2.19) S b = T ( x − x )( x − x )′
              xx      ∑             i.             i.
                       i =1
                         n
(2.20) S xy = ∑ T ( x i . − x )( yi . − y )
         b

                       i =1
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                21
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


(2.21) S xx = S xx + S xx ,
         g      w      b
                                               S xgy = S xwy + S xy
                                                                 b


Drei alternative Schätzer für β:
• OLS (pooled)
                                 −1                                   −1
(2.22) β = ⎡ S ⎦ S
           ⎣ ⎤                                 = ⎡ S + S ⎤ ⎡ S xwy + S xy ⎤
              g             g             g           w         b      b
                            xx            xy     ⎣    xx ⎦ ⎣    xx        ⎦
•     Within-Group (LSDV)
                                 −1
(2.23) β = ⎡ S ⎦ S xy
                  ⎤
               w       w    w
           ⎣                xx

• Between-Group
                    −1 b
(2.24) β = ⎡ S xx ⎦ S xy
           ⎣ ⎤
        b      b


Einsetzen von S xy = S xx β , S xy = S xx β in Formel für β :
                w      w w      b      b b                 g

                                                                           −1
(2.25) β = F β + F β , F = ⎡ S + S ⎦ S xx = I − F b
                                        ⎤
               g        w    w        b    b w  w          w         b
                               ⎣                           xx        xx

   OLS: gewichteter ∅ aus Within- und Between-Schätzer
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                22
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


2.1.3 „Random Effects“-Modell
(2.26) y it = α + β ′x it + ui + ε it , ui :=„random effect“
           E ( ε it | x ) = E ( ui | x ) = 0
           E ( ε it | x ) = σ ε2 , E ( ui2 | x ) = σ u2
                  2


(2.27) E ( ε it u j | x ) = 0, ∀ i , t , j ; E ( ui u j | x ) = 0, ∀ i ≠ j
           E ( ε it ε js | x ) = 0, ∀ t ≠ s ∨ i ≠ j
            E (ε it x it ) = 0, ∀ k , i , t
            E ( ui x it ) = 0, ∀ k , i , t
       wit = ui + ε it (Varianzkomponenten)
(2.28)
       w = [ w , w ,..., w ]′
               i         i1     i2          iT


(2.29) E ( wit | x ) = σ ε2 + σ u2 , E ( wit wis | x ) = σ u2 , t ≠ s
            2
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                 23
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e



                (
(2.30) E w i w i ′ = Ω       )
               ⎡σ ε2 + σ u
                         2
                                              σ u2    σ u2            ⋅     ⋅         σ u2    ⎤
               ⎢                                                                              ⎥
               ⎢    σ u2                  σ ε2 + σ u2 σ u2            ⋅     ⋅         σ u2    ⎥
(2.31) Ω = ⎢         ⋅                                                                 ⋅      ⎥
      ( T ×T ) ⎢                                                                              ⎥
               ⎢     ⋅                                                                 ⋅      ⎥
               ⎢ σu
               ⎣
                       2
                                               σ u2         σ u2      ⋅     ⋅     σ ε2 + σ u2 ⎥
                                                                                              ⎦

                    = σ ε2 I T + σ u i T i T
                                   2
                                           ′

Wegen Unabhängigkeit von i und j, ist die Kovarianzmatrix V für
alle n×T Beobachtungen eine Diagnonalmatrix mit Element Ω :
(2.32)          V         = In ⊗ Ω
            (Tn )×(Tn )
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                24
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e

GLS-Schätzung

                 β′ = ∑ ( X′V Xi )                          (                 )
                                n                      −1
                  GLS      i
                                              -1
                                                                Xi′V -1 y i
                               i =1
Praktisch: Transf. aller Variablen durch Pre-Multiplikation mit:
                          1 ⎡ θ ⎤                          σε
(2.33) Ω       − 1/ 2
                        =              ′    mit θ = 1 −
                             ⎢ I − T ii ⎥ ,
                          σε ⎣           ⎦              T σ u + σ ε2
                                                            2


                    ⎡ zi1 − θ zi . ⎤
                    ⎢z −θ z ⎥
                    ⎢ i2       i.
                                   ⎥
                                   ⎥ , mit zi := { y i , x i }
        − 1/ 2   1
(2.34) Ω zi =       ⎢      ⋅
                σε ⎢               ⎥
                           ⋅
                    ⎢              ⎥
                    ⎢ ziT − θ zi . ⎦
                    ⎣              ⎥
     Schätzung des transformierten Modells mit OLS
        analog zur FE-Schätzung (DVLS) mit θ = 1
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                25
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


Analog zum OLS-Schätzer ist der GLS-Schätzer ein (anders)
gewichteter Durchschnitt aus Within- und Between-Schätzer:

(2.35)
                    ˆ             ˆ   (
            β GLS = F w β w + I − F w β b ,       )
                                           −1                       σ ε2
           ˆ w = ⎡S w + λ S b ⎤ S w , λ =            = (1 − θ )
                                                                2
           F     ⎣ xx      xx ⎦
                                          σ ε + Tσ u
                                 xx         2      2


 λ ≠ 1: OLS ist ineffizient, da die relative Querschnitts-
             (between-group) und Längschnittvariation
             (within-group) nicht optimal berücksichtigt wird.
Spezialfälle
• λ = 1 ⇔ σu = 0 :
           2
                                                GLS = OLS

• λ = 0 ⇔ σε = 0 :
           2
                                                DVLS
                ⇔T → ∞:
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                26
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


In der Praxis sind die Varianzkomponenten i.A. nicht bekannt,
und müssen daher geschätzt werden
FGLS-Schätzung (Feasible Generalised Least Squares)
Schätzer für die Varianzkomponenten (Greene, 2008, S. 203ff.):
                      n    T

                    ∑ ∑ (e               − ei . )
                                                    2
                                    it
          σ ε2 =
           ˆ         i =1 t =1
                                                        ,
                          nT − n − K
(2.36)
           e it − e i . = y it − y i . − β w ′ ( x it − x i . )
                                 σ ε2
                                e ′ e b σ ε2
                                  ˆ      ˆ
       σu = σb −
       ˆ  2
               ˆ 2
                             =    b
                                       −
                       T        n−K T
(2.37)
       e ′ = ( e1 , e2 ,.., en ) := Residuen aus between Schätzung
         b

Alternativ: Residuen aus pooled Schätzung (Greene, p. 204f.)
               Check the computer program!
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                27
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e

LM-Test auf Random Effects (Breusch/Pagan-Test)
    H 0 : σ u = 0 ⇔ Corr ( wit , wis ) = 0; H 1 : σ u ≠ 0
            2                                       2



                                                  (              )
                                                                            2
                            ⎡ n                         ⎤            2

                   nT ⎢ ∑ i =1 ∑ t =1
                                          T
                                               eit      ⎥
(2.38) LM =                                         − 1⎥ ~ χ12
               2 (T − 1) ⎢ ∑ n ∑ T eit            2
                            ⎢
                            ⎣
                                   i =1    t =1         ⎥
                                                        ⎦ eit := OLS Resid.
Hausman-Test
       H 0 : E ( ui xit ) = 0, ∀ i , t ; H 1 : E ( ui xit ) ≠ 0
Unter H0: FE und RE sind konsistent, FE ist aber ineffizient
Unter H1: FE ist konsistent, RE ist inkonsistent
       HT = ( β w − β GLS )′ Σ −1 ( β w − β GLS ) ~ χ K
                             ˆ                          2

(2.39)   Σ = Var ( β w − β GLS ) = Var ( β w ) − Var ( β GLS )
          ˆ
         wegen: Cov ⎡ ( β w − β GLS ) , β GLS ⎤ = 0 (Hausman)
                       ⎣                      ⎦
                                 ⇒ Cov ⎡ β w , β GLS ⎦ = Var ( β GLS )
                                       ⎣             ⎤
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                28
 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


**********************************************************
Beispiel: Schätzung von Lohngleichungen mit Paneldaten
                                      Interpretation:
                                                               •   Koeffizienten von zeitkonstanten
                                                                   Variablen (educ, black, hispan)
                                                                   oder kollinearen (exper) Variablen
                                                                   sind im FE nicht schätzbar
                                                               •   Da der geschätzte Wert für θ
                                                                    näher bei 1 als bei 0 liegt, sind
                                                                    die RE-Koeff. näher bei den
                                                                   (schätzbaren) FE- als OLS-Koeff.
                                                               •   Interpretation des union-Koeff.
                                                                   FE-Schätzer kontrolliert aus
                                                                   konstanten Individualeffekten
                                                                   resultierende Selektivität
                                                               •   Unterschiede zw. FE und RE
                                      θˆ = 0, 643                  bei Koeffizienten für married
 Anm.: Regr. enthalten Zeitdummies                                 und union sind statistisch nicht
 Quelle: Wooldridge, 2003, S. 472.                                 signifikant.
**********************************************************
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                29
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


Erweiterungen
• „Unbalanced Panels“
  Verhältnis der Varianzkomponenten variiert über i:
                                   σε
           θi = 1 −
                            Tiσ u + σ ε2
                                2


      und Schätzformel für θ muss entsprechen angepasst werden;
•    Heteroskedastie
                                                           σε
            E (ε    2
                        ) = σ εi , θi = 1 −
                               2                                i


                                                      T σ u + σ ε2i
                   it                                     2


      und Schätzung von σ u , σ ε2i (Greene, 2008, S. 212f.).
                         ˆ2 ˆ
•     Autokorrelation - z.B.: ε it = ρε i ,t −1 + vit
      Schätzung von ρ und zweifache Transformation des Modells
      ( Übung)
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                30
 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e



RE-Ansatz von Mundlak (1978)
Statt Annahme E ( u i | X i ) = 0, X i := [ x i1 , x i 2 ,..., x iT ] :
E ( ui | X i ) = γ ′x i , Mittelwerte der x-Variable über alle Perioden.
(Alternativ könnte der Indivdiualeffekt auch in Abhängigkeit
kontemporärer Werte von xi und aller lags und leads modelliert
werden (Chamberlain 1982, Wooldridge 2005; siehe unten bei
Panelprobit-Modellen.)
       yit = β ′x it + γ ′x i + ε it + ( ui − E ( ui | X i ) )
(2.40)
           = β ′x it + γ ′xi + ε it + ui .
Auf der Basis von (2.40) kann mittels eines Wald-Tests
einfach zwischen FE und RE Spezifikationgetestet werden
   einfache Alternative zum Hausman-Test.
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                31
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


IV-Schätzung (Hausman / Taylor, 1981)
          yit = β ′x it + α ′x i + eit
(2.41)         = β1x 1it + β ′ x 2 it + α1x 3i + α ′ x 4 i + ui + ε it
                    ′        2
                                         ′         2
      mit x 1it := K1 zeitvariierende exogene Variable
          x 2it := K2 zeitvariierende Variable, mit u korreliert
          x 3i := L1 zeitinvariante exogene V.
          x 4i := L2 zeitinvariante V., mit u korreliert
                 β = ( β1 , β 2 ) , α = ( α 1 , α 2 )
                E ( ui | x 1it , x 3i ) = 0, E ( ui | x 2 it , x 4 i ) ≠ 0
                Var ( ui | x 1it , x 2 it , x 3i , x 4 i ) = σ u  2


                Cov ( ε it , ui | x 1it , x 2 it , x 3i , x 4 i ) = 0, ∀ i , t
             Var ( ε it + ui | x 1it , x 2 it , x 3i , x 4 i ) = σ 2 = σ ε2 + σ u 2


   Corr ( ε it + ui , ε is + ui | x 1it , x 2 it , x 3i , x 4 i ) = ρ = σ u / σ 2 , ∀ t ≠ s
                                                                          2
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                32
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


Schätzidee:
• Abweichungen von jeweiligen Gruppenmittelwerten sind
    gültige IV für x1t, x2t
• Die Gruppenmittelwerte von x1t sind potenzielle IV für x4
• Die Varianzkomponenten für eine GLS-Schätzung können
    aus der FE-Schätzung des Modells gewonnen werden:
(2.42) yit − yi = β1 ( x 1it − x1i ) + β′ ( x 2 it − x 2 i ) + ( ε it − ε i )
                   ′                    2

Mehrstufige Schätzung:
1. Berechne aus der Schätzgleichung (2.42) σ ε
                                            ˆ2
2. Berechne aus (2.42) die Gruppenmittelwerte der Residuen:
    ∗
   eit = ei , t = 1,..., T ; i = 1,..., n
   IV-Schätzung mit diesem (nT)×1 Residuenvektor als
   abhängiger Variabler, x3, und IV x1 für x4: ⇒ α IV
                                                  ˆ
   Notwendige Bedingung für Identifikation: K1 ≥ L2
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                33
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


3. Die Residualvarianz aus der 2. Stufe ist ein konsistenter
   Schätzer für: σ = σ u + σ ε / T
                  ∗2    2    2


        σ u2 = σ ∗2 − σ ε2 / T , mit σ ε2 aus 1. Stufe
         ˆ      ˆ        ˆ             ˆ
                                                            σεˆ
   Gewicht für FGLS-Schätzung: θ          ˆ =1−
                                                        σ ε2 + T σ u2
                                                          ˆ          ˆ
4. Variablentransformation mit θˆ
   w it = w it − θˆw i ,
    %                            w it := {x 1it , x 2 it , x 3i , x 4 i }
       yit = yit − θˆ yi
       %
     IV: z it = ⎡ ( x 1it − x1i ) , ( x 2 it − x 2 i ) , x 3i , x1i ⎤ ,
                ⎣                                                   ⎦
         alle nT Beobachtungen: nT × K +Z + L + K , mit K1 ≥ L2
                                                  ( 1 K2 1 1 )
(2.43)

  ( )               = ⎡ ( W ′Z ) ( Z ′Z )             (Z ⎦ ⎣
                                                        ′W ) ⎤ ⎡ ( W ′Z ) ( Z ′Z ) ( Z ′y ) ⎤
            '                                    −1               −1              −1
    ˆ ˆ
    β, α                  %                              %         %                    %
            2 SLS     ⎣                                                                     ⎦
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                34
       2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e

                                                                     Hausman / Taylor, 1981




(x3)




(x4)



                       Hausman                          χ 32 = 7.8
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                35
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


2.1.4 Random Coefficients Models
(2.44) y i = x i β i + ε i , (including a constant)
                        {
                    T × ( K +1)

           E (εi | xi ) = 0
           E ( ε′ε i | x i ) = σ ε2 I T ,
                i                                      (assume T > K)
(2.45) βi = β + ui ,
                {
                         ( K +1)×1
           E ( u i | x i ) = 0,
          E (u i u′ | x i ) =
                  i                        Γ
                                           {
                                     ( K +1)×( K +1)
(If only the constant term is random                             RE model specification)
(2.46) y i = xi βi + ( ε i + xi u i ) ,
with Ωii = E[( y i − xi βi )( y i − xi βi )′ | xi ] = σ ε2 IT + xi Γx′
                                                                     i
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                36
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


The GLS estimator is:
                                                                 n
                       = ( X′ΩX ) X′Ω y = ∑ Wi βOLS ,
                                        −1         −1
(2.47)       ˆ
             β   GLS                           ˆ
                                                 i
                                                                i =1
with        Ω := block-diagonal matrix with diag. element Ωii
                                                                     −1
                 ⎡
                              (                           )
                                                        −1 −1   ⎤ ⎡                   −1 −1
                          n
            Wi = ⎢ ∑ Γ + σ ε2 ( x′xi )                          ⎥ ⎣ Γ + σ ε ( x′ x i ) ⎤
                                                                          2

                 ⎣ i =1
                                 i
                                                                ⎦
                                                                               i
                                                                                        ⎦
According to Swamy (1971), an estimate of the matrix Γ may
be obtained based on the estimated n OLS coefficient vectors;
also see Greene (2008, p. 224).
Efficient estimates of group specific (individual) coefficient
vectors are weighted averages of the GLS estimator and the
group specific OLS estimators (Greene, 2008, p. 224).
The Random Coeff. model can be tested against the Pooled
OLS model based on a χ2- test (Greene, 2008, p. 224).
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                37
   2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


Example: State-level productivity regressions
Continental (48) U.S. states, 1970-1986, Cobb-Douglas production function:
ln gspit = α + β1 ln pcit + β 2 ln hwyit + β 3 ln waterit + β 4 ln utilit
          + β 5 ln empit + β 6unemp + ui + ε it , where:
                                                                         gsp   := gross state product
                                                                         p_cap := private capital
                                                                         hwy := highway capital
                                                                         water := water utility capital
                                                                         util   := utility capital
                                                                         emp    := employment
                                                                         unemp := unemployment rate




   Source: Greene (2008, S. 225)
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                38
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e



Example cont.: Distribution of β2 coefficient - histogram




 Source: Greene (2008, S. 225)
 In theory, both estimators should be consistent under the
 maintained model assumptions!
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                39
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


2.1.5 Models for Repeated Cross Sections
Individual data from independent cross sections are treated as
cohort data.
A cohort is defined as group of units with fixed membership,
i.e. an age cohort.
In large successive samples (like the German Microcensus or
the Income and Expenditure Survey), random samples of
members of each cohort will be generated.
Unit of regression analysis: time series of sample averages of
cohorts (pseudo panels). Here we focus on static pseudo panel
models.
At the individual level, the model is:
(2.48) yit = α i + x it β + ε it ,
with the usual strict exog. assumption E(xituis)=0, ∀ t,s; t=1,...T
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                40
 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


Each unit belonging to some cohort, c, is assumed to be
observed in one period only. The model for the cohort
population is (* for population):
(2.49)        y = α + x β + ε , with
                *
                ct
                         *
                         c
                                 *
                                 ct
                                     yct = E ( yit | i belongs to c ) etc.
                                      *     *
                                            ct

Assuming a stationary population, the cohort fixed effect, α c ,
                                                               *

                                                    x*
is constant over time, but will be correlated with ct
if the individual-level counterparts in (2.48) are correlated.
Population means are not observed, but are estimated by
cohort-time averages leading to the model:
(2.50) yct = α c + x ct β + ε ct , c = 1,..., C ; t = 1,..., T
Using these averages instead of unobserved population means
Introduces measurement error in both dependent and explanatory
variables.
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                    41
2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


Exkurs: Messfehler in erklärenden Variablen
           y i = β 0 + β 1 xi*1 + ui
               xi*1 := (unbeobachbarer) „wahrer“ Wert der Variablen
               xi1 := mit Fehler beobachteter Wert der Variablen
         ei1 = xi1 − xi*1 := Messfehler
     mit E ( e1 ) = 0, Var ( e1 ) = σ e1 , Cov ( x1 , e1 ) = 0
                                      2           *


           Cov ( x1 , e1 ) = E ( x1e1 ) = E ( x1 e1 ) + E ( e12 ) = σ e21
                                               *



           y = β 0 + β 1 x1 + ( u − β 1e1 )
    mit Cov ( x1 , u − β 1e1 ) = − β 1Cov ( x1 , e1 ) = − β 1σ e2
                                                                1


                 ˆ OLS = β + Cov ( x1 , u − β 1e1 )
          p lim β 1(          )  Var ( x1 )
                          1




                   ⎣         ( (
              = β1 ⎡1 − σ e21 / σ x* + σ e21
                   ⎢
                                  2
                                   1
                                                        ))   ⎥
                                                             ⎦    1
                                                                    ⎣ x1     x1 (
                                                             ⎤ = β ⎡σ 2* / σ 2* + σ 2 ⎤
                                                                                    e1
                                                                                       ⎦         )
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                42
 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


If measurement errors are small due to the large number of
observations per cohort (nc = N/C ∞), they can be ignored (if
there are no time effects in εit, see Verbeek 1992)
   (2.50) can be estimated by the FE-estimator (within-
transformation of cohort means).
If measurement errors cannot be neglected:

• Measurement Error Estimator (Deaton, 1985)
        ⎛ yct − yct ⎞ iid ⎛ ⎛ 0 ⎞ ⎛ σ 00 σ ' ⎞ ⎞
                   *
(2.51) ⎜           * ⎟
                        ~ N ⎜ ⎜ ⎟;⎜          ⎟⎟,
        ⎝ x ct − x ct ⎠     ⎝⎝0⎠ ⎝ σ' Σ ⎠⎠
with population means treated as unknown constants.
These variances and covariances can be estimated consistently
on the basis of the individual data for large N (or T, or both).
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                43
 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e


Estimation idea: Adjust the moments in the within estimator
using estimated error variances to eliminate measurement error:
                                                                     −1
              ⎛ 1   C    T
                                                            T −1 ˆ ⎞
        βD = ⎜
         ˆ
                   ∑∑(       x ct − x c )′ ( x ct − x c ) −      Σ⎟
(2.52)        ⎝ CT c =1 t =1                                 T     ⎠
              ⎛ 1 C T               ′ ( y − y ) − T − 1σ ⎞
            ×⎜     ∑ ∑ ( xct − xc ) ct c T ˆ ⎟
              ⎝ CT c =1 t =1                              ⎠
Note: In the Deaton article (T-1)/T :=1, irrelevant for large T.
If nc ∞, measurement errors and both Σ and σ 0;
Errors-in-variables estimator (2.52) is asymptotically equivalent
to the within-estimator applied to cohort-time averages in (2.50):
                                                                                −1
                   ⎛ 1            C     T
                                                               ⎞
              βW = ⎜
              ˆ
                        ∑∑(       x ct − x c )′ ( x ct − x c ) ⎟
(2.53)             ⎝ CT c =1 t =1                              ⎠
                  ⎛ 1 C T                    ′ (y − y )⎞
                 ×⎜    ∑ ∑ ( xct − xc ) ct c ⎟
                  ⎝ CT c =1 t =1                              ⎠
P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09)                44
 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e



• IV Estimator (Moffitt, 1993, Collado, 1997)
       yct = yct + ξ ct
               *
(2.53)
       x ct = xct + ζ ct
               *


Inserting (2.53) into (2.49):
            yct − ξ ct = α c + ( x ct − ζ ct ) β + ε ct
                           *                         *

(2.54)
                     yct = α c + x ct β + ω ct , ω ct = ε ct − ζ ct β + ξ ct
                             *                            *


First-differencing (2.54) eliminates the population cohort
fixed effect:
(2.55) Δ yct = Δ x ct β + Δ ω ct , t = 2,..., T
Due to measurement error, E ( Δ x ct Δ ω ct ) ≠ 0
Potential IV: lagged levels of exogenous variables, x c ,t −1

Mais conteúdo relacionado

Destaque

mediscript Kalendar 2013 "Lernen heisst Entdecken"
mediscript Kalendar 2013 "Lernen heisst Entdecken"mediscript Kalendar 2013 "Lernen heisst Entdecken"
mediscript Kalendar 2013 "Lernen heisst Entdecken"mediscript Team
 
Lernen Mit Web 2.0 (IHK Stuttgart Juli 2009)
Lernen Mit Web 2.0 (IHK Stuttgart Juli 2009)Lernen Mit Web 2.0 (IHK Stuttgart Juli 2009)
Lernen Mit Web 2.0 (IHK Stuttgart Juli 2009)Martina Goehring
 
E Co C Bratislava 09 Persoenlichkeit
E Co C Bratislava 09 PersoenlichkeitE Co C Bratislava 09 Persoenlichkeit
E Co C Bratislava 09 Persoenlichkeitthomasabauer
 
Unbezahlte arbeitszeit in_Österreich
Unbezahlte arbeitszeit in_ÖsterreichUnbezahlte arbeitszeit in_Österreich
Unbezahlte arbeitszeit in_ÖsterreichFESD GKr
 
Kelantan
KelantanKelantan
Kelantanwmzuri
 
Financial Institutions Must Support Their Clients on Twitter
Financial Institutions Must Support Their Clients on TwitterFinancial Institutions Must Support Their Clients on Twitter
Financial Institutions Must Support Their Clients on TwitterChristophe Langlois
 
EdChang - Parallel Algorithms For Mining Large Scale Data
EdChang - Parallel Algorithms For Mining Large Scale DataEdChang - Parallel Algorithms For Mining Large Scale Data
EdChang - Parallel Algorithms For Mining Large Scale Datagu wendong
 
Plan de mejora jefatura de sector 06 21 fts4006o
Plan de mejora jefatura de sector 06  21 fts4006oPlan de mejora jefatura de sector 06  21 fts4006o
Plan de mejora jefatura de sector 06 21 fts4006oRoberto Carlos Vega Monroy
 
Uv08 Dcii Tema 3 DiseñO Y Gestion Servicios
Uv08 Dcii Tema 3 DiseñO Y Gestion ServiciosUv08 Dcii Tema 3 DiseñO Y Gestion Servicios
Uv08 Dcii Tema 3 DiseñO Y Gestion ServiciosJordi Miro
 
Ati flash cards 09, medications affecting fluid, electrolytes, minerals, and ...
Ati flash cards 09, medications affecting fluid, electrolytes, minerals, and ...Ati flash cards 09, medications affecting fluid, electrolytes, minerals, and ...
Ati flash cards 09, medications affecting fluid, electrolytes, minerals, and ...Mary Elizabeth Francisco
 
Analisis Grafico 3 Ejercicios
Analisis Grafico 3 EjerciciosAnalisis Grafico 3 Ejercicios
Analisis Grafico 3 EjerciciosMarcos A. Fatela
 
Gestión y diseño de los instrumentos de comunicacion de marketing
Gestión y diseño de los instrumentos de comunicacion de marketingGestión y diseño de los instrumentos de comunicacion de marketing
Gestión y diseño de los instrumentos de comunicacion de marketingJordi Miro
 
Simce 2014
Simce 2014Simce 2014
Simce 201415511
 
Salesforce.com Agile Transformation - Agile 2007 Conference
Salesforce.com Agile Transformation - Agile 2007 ConferenceSalesforce.com Agile Transformation - Agile 2007 Conference
Salesforce.com Agile Transformation - Agile 2007 ConferenceSteve Greene
 
Science Interactive Notebook
Science Interactive NotebookScience Interactive Notebook
Science Interactive NotebookEboni DuBose
 
Creating Tribal Ideas for Gen C - By Dan Pankraz for Nokia World '09
Creating Tribal Ideas for Gen C  - By Dan Pankraz for Nokia World '09Creating Tribal Ideas for Gen C  - By Dan Pankraz for Nokia World '09
Creating Tribal Ideas for Gen C - By Dan Pankraz for Nokia World '09guestbcb2a7
 
Gridcomputing
GridcomputingGridcomputing
Gridcomputingpchengi
 

Destaque (20)

mediscript Kalendar 2013 "Lernen heisst Entdecken"
mediscript Kalendar 2013 "Lernen heisst Entdecken"mediscript Kalendar 2013 "Lernen heisst Entdecken"
mediscript Kalendar 2013 "Lernen heisst Entdecken"
 
Lernen Mit Web 2.0 (IHK Stuttgart Juli 2009)
Lernen Mit Web 2.0 (IHK Stuttgart Juli 2009)Lernen Mit Web 2.0 (IHK Stuttgart Juli 2009)
Lernen Mit Web 2.0 (IHK Stuttgart Juli 2009)
 
E Co C Bratislava 09 Persoenlichkeit
E Co C Bratislava 09 PersoenlichkeitE Co C Bratislava 09 Persoenlichkeit
E Co C Bratislava 09 Persoenlichkeit
 
Unbezahlte arbeitszeit in_Österreich
Unbezahlte arbeitszeit in_ÖsterreichUnbezahlte arbeitszeit in_Österreich
Unbezahlte arbeitszeit in_Österreich
 
Kelantan
KelantanKelantan
Kelantan
 
Financial Institutions Must Support Their Clients on Twitter
Financial Institutions Must Support Their Clients on TwitterFinancial Institutions Must Support Their Clients on Twitter
Financial Institutions Must Support Their Clients on Twitter
 
EdChang - Parallel Algorithms For Mining Large Scale Data
EdChang - Parallel Algorithms For Mining Large Scale DataEdChang - Parallel Algorithms For Mining Large Scale Data
EdChang - Parallel Algorithms For Mining Large Scale Data
 
Plan de mejora jefatura de sector 06 21 fts4006o
Plan de mejora jefatura de sector 06  21 fts4006oPlan de mejora jefatura de sector 06  21 fts4006o
Plan de mejora jefatura de sector 06 21 fts4006o
 
Practical Object Oriented Models In Sql
Practical Object Oriented Models In SqlPractical Object Oriented Models In Sql
Practical Object Oriented Models In Sql
 
Uv08 Dcii Tema 3 DiseñO Y Gestion Servicios
Uv08 Dcii Tema 3 DiseñO Y Gestion ServiciosUv08 Dcii Tema 3 DiseñO Y Gestion Servicios
Uv08 Dcii Tema 3 DiseñO Y Gestion Servicios
 
Ati flash cards 09, medications affecting fluid, electrolytes, minerals, and ...
Ati flash cards 09, medications affecting fluid, electrolytes, minerals, and ...Ati flash cards 09, medications affecting fluid, electrolytes, minerals, and ...
Ati flash cards 09, medications affecting fluid, electrolytes, minerals, and ...
 
Analisis Grafico 3 Ejercicios
Analisis Grafico 3 EjerciciosAnalisis Grafico 3 Ejercicios
Analisis Grafico 3 Ejercicios
 
Gestión y diseño de los instrumentos de comunicacion de marketing
Gestión y diseño de los instrumentos de comunicacion de marketingGestión y diseño de los instrumentos de comunicacion de marketing
Gestión y diseño de los instrumentos de comunicacion de marketing
 
Simce 2014
Simce 2014Simce 2014
Simce 2014
 
Salesforce.com Agile Transformation - Agile 2007 Conference
Salesforce.com Agile Transformation - Agile 2007 ConferenceSalesforce.com Agile Transformation - Agile 2007 Conference
Salesforce.com Agile Transformation - Agile 2007 Conference
 
Mini Project- Stepper Motor Control
Mini Project- Stepper Motor ControlMini Project- Stepper Motor Control
Mini Project- Stepper Motor Control
 
Science Interactive Notebook
Science Interactive NotebookScience Interactive Notebook
Science Interactive Notebook
 
Sports MKT 2011 - Daniel Sá
Sports MKT 2011 - Daniel SáSports MKT 2011 - Daniel Sá
Sports MKT 2011 - Daniel Sá
 
Creating Tribal Ideas for Gen C - By Dan Pankraz for Nokia World '09
Creating Tribal Ideas for Gen C  - By Dan Pankraz for Nokia World '09Creating Tribal Ideas for Gen C  - By Dan Pankraz for Nokia World '09
Creating Tribal Ideas for Gen C - By Dan Pankraz for Nokia World '09
 
Gridcomputing
GridcomputingGridcomputing
Gridcomputing
 

Semelhante a Kap2 1

Distribution of the number of times m m 2 n
Distribution of the number of times m m 2 nDistribution of the number of times m m 2 n
Distribution of the number of times m m 2 nprjpublications
 
Distribution of the number of times m m 2 n
Distribution of the number of times m m 2 nDistribution of the number of times m m 2 n
Distribution of the number of times m m 2 nprj_publication
 
01.5 abiturvorbereitung analysis efkt2
01.5 abiturvorbereitung analysis efkt201.5 abiturvorbereitung analysis efkt2
01.5 abiturvorbereitung analysis efkt2PaulFestl
 
03 abiturvorbereitung analysis tangente an graphen
03 abiturvorbereitung analysis tangente an graphen03 abiturvorbereitung analysis tangente an graphen
03 abiturvorbereitung analysis tangente an graphenPaulFestl
 
Beispiele_2022_LSG.pdf
Beispiele_2022_LSG.pdfBeispiele_2022_LSG.pdf
Beispiele_2022_LSG.pdfHannaL13
 
26 integral tak wajar
26 integral tak wajar26 integral tak wajar
26 integral tak wajarYudi Hartawan
 
Convolucion y transformada_de_fourier
Convolucion y transformada_de_fourierConvolucion y transformada_de_fourier
Convolucion y transformada_de_fourierLuz Garcia
 
Elliptische Kurven in der Kryptographie-slides-10.pdf
Elliptische Kurven in der Kryptographie-slides-10.pdfElliptische Kurven in der Kryptographie-slides-10.pdf
Elliptische Kurven in der Kryptographie-slides-10.pdfjmail1111
 

Semelhante a Kap2 1 (12)

Distribution of the number of times m m 2 n
Distribution of the number of times m m 2 nDistribution of the number of times m m 2 n
Distribution of the number of times m m 2 n
 
Distribution of the number of times m m 2 n
Distribution of the number of times m m 2 nDistribution of the number of times m m 2 n
Distribution of the number of times m m 2 n
 
01.5 abiturvorbereitung analysis efkt2
01.5 abiturvorbereitung analysis efkt201.5 abiturvorbereitung analysis efkt2
01.5 abiturvorbereitung analysis efkt2
 
Kap1
Kap1Kap1
Kap1
 
03 abiturvorbereitung analysis tangente an graphen
03 abiturvorbereitung analysis tangente an graphen03 abiturvorbereitung analysis tangente an graphen
03 abiturvorbereitung analysis tangente an graphen
 
Statistik - Teil 2
Statistik - Teil 2Statistik - Teil 2
Statistik - Teil 2
 
Beispiele_2022_LSG.pdf
Beispiele_2022_LSG.pdfBeispiele_2022_LSG.pdf
Beispiele_2022_LSG.pdf
 
Tranformada
TranformadaTranformada
Tranformada
 
26 integral tak wajar
26 integral tak wajar26 integral tak wajar
26 integral tak wajar
 
Ej series
Ej seriesEj series
Ej series
 
Convolucion y transformada_de_fourier
Convolucion y transformada_de_fourierConvolucion y transformada_de_fourier
Convolucion y transformada_de_fourier
 
Elliptische Kurven in der Kryptographie-slides-10.pdf
Elliptische Kurven in der Kryptographie-slides-10.pdfElliptische Kurven in der Kryptographie-slides-10.pdf
Elliptische Kurven in der Kryptographie-slides-10.pdf
 

Kap2 1

  • 1. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 11 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e 2. Lineare Modelle für Paneldaten Paneldaten: Information über die gleichen Untersuchungs- einheiten zu meheren Beobachtungszeitpunkten • Mikro-Panels: große Anzahl (N) von U-Einheiten (Individuen, Firmen) zu einigen wenigen Zeipunkten (T) z.B.: Sozio-Ökonomisches Panel, Unternehmensfragungen • Makro-Panels: relativ kleine Anzahl von U-Einheiten (Länder, Regionen) über einen relativ langen Zeitraum z.B.: OECD-Länderpanel, Regionenpanel, Branchenpanel • Pseudo-Panels: U-Einheiten sind über die Wellen nicht identisch bzw. andere Dimension als Zeit − Zeitreihen über Alterskohorten − Querschnittsdaten über Zwillinge
  • 2. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 12 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e Vorteile von Paneldaten: • Kontrolle unbeobachteter zeitinvarianter individueller Unterschiede (Heterogenität), z.B. „ability bias“ • Präzisere Parameterschätzung durch Ausnutzung von Querschnitts- und Zeitreihenvariation; mehr Information • Modellierung dynamischer Anpassungprozesse; Ereignisanalysen; Vorher-Nachher Vergleiche etc. Nachteile von Paneldaten: • Mikro-Panels meist nur für kurze Zeiträume verfügbar relativ teuer zu erheben • hohe Panelsterblichkeit („sample attrition“) mit häufig nicht rein zufälligen Ausfällen Stichprobenselektion • Messfehler bei retrospektiv erhobenen Fragen
  • 3. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 13 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e 2.1 Statische Modelle Grundmodell: y it = α i + β ′ xit + ε it α i := Individualeffekt, variiert über i, aber nicht über t E ( ε it xit ) , ∀ i , t := Annahme „strikter Exogenität“ Bei Gültigkeit der Annahme strikter Exogenität und: • αi = α, ∀i: OLS, erwartungstreu und effizient • αi ≠ α: E (α i xit ) = 0 : OLS, erwartungstreu aber ineffizient GLS konsistent und effizient „Random Effects“-Modell (αi ist Zufallsvariable) E (α i xit ) ≠ 0 : OLS, verzerrt „Fixed Effects“-Modell (αi ist „fixer Effekt“)
  • 4. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 14 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e 2.1.1 „Fixed Effects“-Modell Traditionell werden αi als fixe Parameter (individual- spezifische Konstante) modelliert: (2.1) y i = i α i + X i β + ε i T Beobachtungen für Person i T ×1 T ×K n × T Beobachtungen für alle n Personen („balanced panel“) ⎡ y1 ⎤ ⎡i 0 ⋅ ⋅ 0 ⎤ ⎡ α1 ⎤ ⎡ X 1 ⎤ ⎡ ε1 ⎤ ⎢y ⎥ ⎢0 i ⋅ ⋅ 0 ⎥ ⎢α 2 ⎥ ⎢ X 2 ⎥ ⎢ε ⎥ ⎢ 2⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥ ⎢ 2⎥ (2.2) ⎢ ⋅ ⎥ = ⎢ ⋅ ⋅ ⎥ ⎢ ⎥ + ⎢ ⎥β + ⎢ ⎥ ⎢ ⋅ ⎥ ⎢ ⋅ ⋅ ⎥⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢yn ⎥ ⎣ ⎦ ⎢0 ⎣ 0 ⋅ ⋅ i ⎥ ⎢α n ⎥ ⎢ X n ⎥ ⎦⎣ ⎦ ⎣ ⎦ ⎢ε n ⎥ ⎣ ⎦ ⎡ ⎤ ⎡ nα1 ⎤ (2.3) y = ⎢ d1 d 2 ⋅ ⋅ dn X ⎥ ⎢ × ⎥+ε ( nT )×1 ⎣ ( nT )×1 ( nT )× K ⎢ β ⎥ ( nT )×1 ⎦ ⎣ K ×1 ⎦
  • 5. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 15 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e (2.4) y = Dα + Xβ + ε , D = [d1 d2 ⋅ ⋅ dn ] ( nT )× n OLS mit n × T Beobachtungen und K + n zu schätzenden Parametern: LSDV („least squares dummy variable model“) Unter Standardannahmen haben OLS-Schätzer für α und β die üblichen Eigenschaften. Falls n sehr gross (wie bei Mikro-Panels) direkte Schätzung des LSDV (Inverse der Matrix [D X]‘[D X] !) nicht möglich: Transformation der Variablen, so dass fixe Individualeffekte eliminiert werden, mit Transformationsmatrix ( Übung) = I − D ( D′D ) D′ := Diagonalmatrix −1 (2.5) Md ( nT )×( nT ) mit Diagonalelement M 0 = I T − ii ′ / T Für beliebigen T × 1 Vektor zi gilt: M zi = zi − zi 0 := Abweichung der Beobachtung vom individuellen Mittelwert
  • 6. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 16 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e OLS mit transformierten Daten: (2.6) y it − y i . = β ′ ( x it − x i . ) + ε it − ε i . ˆ = [ X ′M X ]−1 [ X ′M y ] (2.7) β d d Schätzung der individuellen Effekte: α i = yi . − β ′x i . ˆ ˆ (2.8) ˆ = [ D ′D ] D ′ y − Xβ α −1 ˆ ( ) ∑∑( ) n T Schätzung der Varianzen: 2 yit − α i − β′x it ˆ ˆ ∧ Var ( β ) = s [ X ′M d X ] , s = 2 −1 2 i =1 t =1 (2.9) nT − n − K ∧ s2 ⎡ ∧ ⎤ (2.10) Var (α i ) = ˆ + ⎢ x i′. Var ( β ) x i . ⎥ T ⎣ ⎦
  • 7. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 17 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e F-Test auf fixe Effekte: H0: αi = α, ∀i; H1: αi ≠ α (2.11) F = ( Ru2 − Rr2 ) / ( n − 1) n −1, nT − n − K (1 − Ru2 ) / ( nT − n − K ) 2 mit: Rr := Bestimmtheitsmass unter H0 Ru2 := Bestimmtheitsmass unter H1 Erweiterungen: • Anstatt n Individual-Dummies auch Spezifikation mit (n – 1) Individual-Dummies und einer allgemeinen Konstanten • Modifikation falls T über i variiert („unbalanced panel“) Problem: nicht zufällige Ausfälle • Fixe Zeiteffekte: zweifache Transformation (Greene, S. 198) oder – üblicher – Zeitdummies
  • 8. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 18 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e • Spezialfall: Schätzung erster Differenzen y it = α i + β ′x it + ε it y it − y i ,t −1 = β ′ ( x it − x i ,t −1 ) + ε it − ε i ,t −1 Erste-Differenzen Transformation eliminiert FE OLS-Schätzung des transformierten Modells: Δ y it = β ′Δ x it + Δ ε it , t = 2, 3,.., T T = 2: FE− und Δ−Schätzer sind identisch T > 2: − FE ist effizienter als Δ−Schätzer, falls εit nicht autokorreliert − Δ ist effizienter falls εit einem random walk folgt, da dann Δ ε it = ε it − ε i ,t −1 unkorreliert ist vgl. dazu Übung und dynamische Modelle und Übung
  • 9. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 19 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e 2.1.2 „Pooled“-, „Within“- und „Between“-Schätzer Aus dem Regressionsmodell (mit αi = α, ∀i): (2.12) y it = α + β ′x it + ε it ergibt sich als Abweichung von den Gruppenmittelwerten: (2.13) y it − y i . = β ′ ( x it − x i . ) + ε it − ε i . und bezogen auf die Gruppenmittelwerte: (2.14) y i . = α + β ′x i . + ε i . Der Koeffizientenvektor β kann aus jeder der drei Gleichungen unter bestimmten Annahmen erwartungstreu geschätzt werden. Die Schätzer unterscheiden sich hinsichtlich der jeweils genutzten Information und damit der Effizienz der Schätzung.
  • 10. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 20 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e Abweichungen von den Gesamtmittelwerten x , y n T (2.15) S g = xx( x − x )( x − x )′ ∑∑ it it i =1 t =1 n T (2.16) S xgy = ∑ ∑ ( x it − x )( yit − y ) i =1 t =1 Abweichungen von den Gruppenmittelwerten xi . , y i . n T (2.17) S = w ( x − x )( x − x )′ xx ∑∑ it i. it i. i =1 t =1 n T (2.18) S xy = ∑ ∑ ( x it − xi . )( yit − yi . ) w i =1 t =1 Abweichungen der Gruppenmittelwerte von Gesamtmittelwerten n (2.19) S b = T ( x − x )( x − x )′ xx ∑ i. i. i =1 n (2.20) S xy = ∑ T ( x i . − x )( yi . − y ) b i =1
  • 11. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 21 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e (2.21) S xx = S xx + S xx , g w b S xgy = S xwy + S xy b Drei alternative Schätzer für β: • OLS (pooled) −1 −1 (2.22) β = ⎡ S ⎦ S ⎣ ⎤ = ⎡ S + S ⎤ ⎡ S xwy + S xy ⎤ g g g w b b xx xy ⎣ xx ⎦ ⎣ xx ⎦ • Within-Group (LSDV) −1 (2.23) β = ⎡ S ⎦ S xy ⎤ w w w ⎣ xx • Between-Group −1 b (2.24) β = ⎡ S xx ⎦ S xy ⎣ ⎤ b b Einsetzen von S xy = S xx β , S xy = S xx β in Formel für β : w w w b b b g −1 (2.25) β = F β + F β , F = ⎡ S + S ⎦ S xx = I − F b ⎤ g w w b b w w w b ⎣ xx xx OLS: gewichteter ∅ aus Within- und Between-Schätzer
  • 12. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 22 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e 2.1.3 „Random Effects“-Modell (2.26) y it = α + β ′x it + ui + ε it , ui :=„random effect“ E ( ε it | x ) = E ( ui | x ) = 0 E ( ε it | x ) = σ ε2 , E ( ui2 | x ) = σ u2 2 (2.27) E ( ε it u j | x ) = 0, ∀ i , t , j ; E ( ui u j | x ) = 0, ∀ i ≠ j E ( ε it ε js | x ) = 0, ∀ t ≠ s ∨ i ≠ j E (ε it x it ) = 0, ∀ k , i , t E ( ui x it ) = 0, ∀ k , i , t wit = ui + ε it (Varianzkomponenten) (2.28) w = [ w , w ,..., w ]′ i i1 i2 iT (2.29) E ( wit | x ) = σ ε2 + σ u2 , E ( wit wis | x ) = σ u2 , t ≠ s 2
  • 13. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 23 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e ( (2.30) E w i w i ′ = Ω ) ⎡σ ε2 + σ u 2 σ u2 σ u2 ⋅ ⋅ σ u2 ⎤ ⎢ ⎥ ⎢ σ u2 σ ε2 + σ u2 σ u2 ⋅ ⋅ σ u2 ⎥ (2.31) Ω = ⎢ ⋅ ⋅ ⎥ ( T ×T ) ⎢ ⎥ ⎢ ⋅ ⋅ ⎥ ⎢ σu ⎣ 2 σ u2 σ u2 ⋅ ⋅ σ ε2 + σ u2 ⎥ ⎦ = σ ε2 I T + σ u i T i T 2 ′ Wegen Unabhängigkeit von i und j, ist die Kovarianzmatrix V für alle n×T Beobachtungen eine Diagnonalmatrix mit Element Ω : (2.32) V = In ⊗ Ω (Tn )×(Tn )
  • 14. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 24 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e GLS-Schätzung β′ = ∑ ( X′V Xi ) ( ) n −1 GLS i -1 Xi′V -1 y i i =1 Praktisch: Transf. aller Variablen durch Pre-Multiplikation mit: 1 ⎡ θ ⎤ σε (2.33) Ω − 1/ 2 = ′ mit θ = 1 − ⎢ I − T ii ⎥ , σε ⎣ ⎦ T σ u + σ ε2 2 ⎡ zi1 − θ zi . ⎤ ⎢z −θ z ⎥ ⎢ i2 i. ⎥ ⎥ , mit zi := { y i , x i } − 1/ 2 1 (2.34) Ω zi = ⎢ ⋅ σε ⎢ ⎥ ⋅ ⎢ ⎥ ⎢ ziT − θ zi . ⎦ ⎣ ⎥ Schätzung des transformierten Modells mit OLS analog zur FE-Schätzung (DVLS) mit θ = 1
  • 15. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 25 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e Analog zum OLS-Schätzer ist der GLS-Schätzer ein (anders) gewichteter Durchschnitt aus Within- und Between-Schätzer: (2.35) ˆ ˆ ( β GLS = F w β w + I − F w β b , ) −1 σ ε2 ˆ w = ⎡S w + λ S b ⎤ S w , λ = = (1 − θ ) 2 F ⎣ xx xx ⎦ σ ε + Tσ u xx 2 2 λ ≠ 1: OLS ist ineffizient, da die relative Querschnitts- (between-group) und Längschnittvariation (within-group) nicht optimal berücksichtigt wird. Spezialfälle • λ = 1 ⇔ σu = 0 : 2 GLS = OLS • λ = 0 ⇔ σε = 0 : 2 DVLS ⇔T → ∞:
  • 16. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 26 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e In der Praxis sind die Varianzkomponenten i.A. nicht bekannt, und müssen daher geschätzt werden FGLS-Schätzung (Feasible Generalised Least Squares) Schätzer für die Varianzkomponenten (Greene, 2008, S. 203ff.): n T ∑ ∑ (e − ei . ) 2 it σ ε2 = ˆ i =1 t =1 , nT − n − K (2.36) e it − e i . = y it − y i . − β w ′ ( x it − x i . ) σ ε2 e ′ e b σ ε2 ˆ ˆ σu = σb − ˆ 2 ˆ 2 = b − T n−K T (2.37) e ′ = ( e1 , e2 ,.., en ) := Residuen aus between Schätzung b Alternativ: Residuen aus pooled Schätzung (Greene, p. 204f.) Check the computer program!
  • 17. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 27 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e LM-Test auf Random Effects (Breusch/Pagan-Test) H 0 : σ u = 0 ⇔ Corr ( wit , wis ) = 0; H 1 : σ u ≠ 0 2 2 ( ) 2 ⎡ n ⎤ 2 nT ⎢ ∑ i =1 ∑ t =1 T eit ⎥ (2.38) LM = − 1⎥ ~ χ12 2 (T − 1) ⎢ ∑ n ∑ T eit 2 ⎢ ⎣ i =1 t =1 ⎥ ⎦ eit := OLS Resid. Hausman-Test H 0 : E ( ui xit ) = 0, ∀ i , t ; H 1 : E ( ui xit ) ≠ 0 Unter H0: FE und RE sind konsistent, FE ist aber ineffizient Unter H1: FE ist konsistent, RE ist inkonsistent HT = ( β w − β GLS )′ Σ −1 ( β w − β GLS ) ~ χ K ˆ 2 (2.39) Σ = Var ( β w − β GLS ) = Var ( β w ) − Var ( β GLS ) ˆ wegen: Cov ⎡ ( β w − β GLS ) , β GLS ⎤ = 0 (Hausman) ⎣ ⎦ ⇒ Cov ⎡ β w , β GLS ⎦ = Var ( β GLS ) ⎣ ⎤
  • 18. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 28 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e ********************************************************** Beispiel: Schätzung von Lohngleichungen mit Paneldaten Interpretation: • Koeffizienten von zeitkonstanten Variablen (educ, black, hispan) oder kollinearen (exper) Variablen sind im FE nicht schätzbar • Da der geschätzte Wert für θ näher bei 1 als bei 0 liegt, sind die RE-Koeff. näher bei den (schätzbaren) FE- als OLS-Koeff. • Interpretation des union-Koeff. FE-Schätzer kontrolliert aus konstanten Individualeffekten resultierende Selektivität • Unterschiede zw. FE und RE θˆ = 0, 643 bei Koeffizienten für married Anm.: Regr. enthalten Zeitdummies und union sind statistisch nicht Quelle: Wooldridge, 2003, S. 472. signifikant. **********************************************************
  • 19. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 29 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e Erweiterungen • „Unbalanced Panels“ Verhältnis der Varianzkomponenten variiert über i: σε θi = 1 − Tiσ u + σ ε2 2 und Schätzformel für θ muss entsprechen angepasst werden; • Heteroskedastie σε E (ε 2 ) = σ εi , θi = 1 − 2 i T σ u + σ ε2i it 2 und Schätzung von σ u , σ ε2i (Greene, 2008, S. 212f.). ˆ2 ˆ • Autokorrelation - z.B.: ε it = ρε i ,t −1 + vit Schätzung von ρ und zweifache Transformation des Modells ( Übung)
  • 20. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 30 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e RE-Ansatz von Mundlak (1978) Statt Annahme E ( u i | X i ) = 0, X i := [ x i1 , x i 2 ,..., x iT ] : E ( ui | X i ) = γ ′x i , Mittelwerte der x-Variable über alle Perioden. (Alternativ könnte der Indivdiualeffekt auch in Abhängigkeit kontemporärer Werte von xi und aller lags und leads modelliert werden (Chamberlain 1982, Wooldridge 2005; siehe unten bei Panelprobit-Modellen.) yit = β ′x it + γ ′x i + ε it + ( ui − E ( ui | X i ) ) (2.40) = β ′x it + γ ′xi + ε it + ui . Auf der Basis von (2.40) kann mittels eines Wald-Tests einfach zwischen FE und RE Spezifikationgetestet werden einfache Alternative zum Hausman-Test.
  • 21. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 31 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e IV-Schätzung (Hausman / Taylor, 1981) yit = β ′x it + α ′x i + eit (2.41) = β1x 1it + β ′ x 2 it + α1x 3i + α ′ x 4 i + ui + ε it ′ 2 ′ 2 mit x 1it := K1 zeitvariierende exogene Variable x 2it := K2 zeitvariierende Variable, mit u korreliert x 3i := L1 zeitinvariante exogene V. x 4i := L2 zeitinvariante V., mit u korreliert β = ( β1 , β 2 ) , α = ( α 1 , α 2 ) E ( ui | x 1it , x 3i ) = 0, E ( ui | x 2 it , x 4 i ) ≠ 0 Var ( ui | x 1it , x 2 it , x 3i , x 4 i ) = σ u 2 Cov ( ε it , ui | x 1it , x 2 it , x 3i , x 4 i ) = 0, ∀ i , t Var ( ε it + ui | x 1it , x 2 it , x 3i , x 4 i ) = σ 2 = σ ε2 + σ u 2 Corr ( ε it + ui , ε is + ui | x 1it , x 2 it , x 3i , x 4 i ) = ρ = σ u / σ 2 , ∀ t ≠ s 2
  • 22. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 32 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e Schätzidee: • Abweichungen von jeweiligen Gruppenmittelwerten sind gültige IV für x1t, x2t • Die Gruppenmittelwerte von x1t sind potenzielle IV für x4 • Die Varianzkomponenten für eine GLS-Schätzung können aus der FE-Schätzung des Modells gewonnen werden: (2.42) yit − yi = β1 ( x 1it − x1i ) + β′ ( x 2 it − x 2 i ) + ( ε it − ε i ) ′ 2 Mehrstufige Schätzung: 1. Berechne aus der Schätzgleichung (2.42) σ ε ˆ2 2. Berechne aus (2.42) die Gruppenmittelwerte der Residuen: ∗ eit = ei , t = 1,..., T ; i = 1,..., n IV-Schätzung mit diesem (nT)×1 Residuenvektor als abhängiger Variabler, x3, und IV x1 für x4: ⇒ α IV ˆ Notwendige Bedingung für Identifikation: K1 ≥ L2
  • 23. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 33 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e 3. Die Residualvarianz aus der 2. Stufe ist ein konsistenter Schätzer für: σ = σ u + σ ε / T ∗2 2 2 σ u2 = σ ∗2 − σ ε2 / T , mit σ ε2 aus 1. Stufe ˆ ˆ ˆ ˆ σεˆ Gewicht für FGLS-Schätzung: θ ˆ =1− σ ε2 + T σ u2 ˆ ˆ 4. Variablentransformation mit θˆ w it = w it − θˆw i , % w it := {x 1it , x 2 it , x 3i , x 4 i } yit = yit − θˆ yi % IV: z it = ⎡ ( x 1it − x1i ) , ( x 2 it − x 2 i ) , x 3i , x1i ⎤ , ⎣ ⎦ alle nT Beobachtungen: nT × K +Z + L + K , mit K1 ≥ L2 ( 1 K2 1 1 ) (2.43) ( ) = ⎡ ( W ′Z ) ( Z ′Z ) (Z ⎦ ⎣ ′W ) ⎤ ⎡ ( W ′Z ) ( Z ′Z ) ( Z ′y ) ⎤ ' −1 −1 −1 ˆ ˆ β, α % % % % 2 SLS ⎣ ⎦
  • 24. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 34 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e Hausman / Taylor, 1981 (x3) (x4) Hausman χ 32 = 7.8
  • 25. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 35 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e 2.1.4 Random Coefficients Models (2.44) y i = x i β i + ε i , (including a constant) { T × ( K +1) E (εi | xi ) = 0 E ( ε′ε i | x i ) = σ ε2 I T , i (assume T > K) (2.45) βi = β + ui , { ( K +1)×1 E ( u i | x i ) = 0, E (u i u′ | x i ) = i Γ { ( K +1)×( K +1) (If only the constant term is random RE model specification) (2.46) y i = xi βi + ( ε i + xi u i ) , with Ωii = E[( y i − xi βi )( y i − xi βi )′ | xi ] = σ ε2 IT + xi Γx′ i
  • 26. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 36 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e The GLS estimator is: n = ( X′ΩX ) X′Ω y = ∑ Wi βOLS , −1 −1 (2.47) ˆ β GLS ˆ i i =1 with Ω := block-diagonal matrix with diag. element Ωii −1 ⎡ ( ) −1 −1 ⎤ ⎡ −1 −1 n Wi = ⎢ ∑ Γ + σ ε2 ( x′xi ) ⎥ ⎣ Γ + σ ε ( x′ x i ) ⎤ 2 ⎣ i =1 i ⎦ i ⎦ According to Swamy (1971), an estimate of the matrix Γ may be obtained based on the estimated n OLS coefficient vectors; also see Greene (2008, p. 224). Efficient estimates of group specific (individual) coefficient vectors are weighted averages of the GLS estimator and the group specific OLS estimators (Greene, 2008, p. 224). The Random Coeff. model can be tested against the Pooled OLS model based on a χ2- test (Greene, 2008, p. 224).
  • 27. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 37 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e Example: State-level productivity regressions Continental (48) U.S. states, 1970-1986, Cobb-Douglas production function: ln gspit = α + β1 ln pcit + β 2 ln hwyit + β 3 ln waterit + β 4 ln utilit + β 5 ln empit + β 6unemp + ui + ε it , where: gsp := gross state product p_cap := private capital hwy := highway capital water := water utility capital util := utility capital emp := employment unemp := unemployment rate Source: Greene (2008, S. 225)
  • 28. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 38 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e Example cont.: Distribution of β2 coefficient - histogram Source: Greene (2008, S. 225) In theory, both estimators should be consistent under the maintained model assumptions!
  • 29. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 39 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e 2.1.5 Models for Repeated Cross Sections Individual data from independent cross sections are treated as cohort data. A cohort is defined as group of units with fixed membership, i.e. an age cohort. In large successive samples (like the German Microcensus or the Income and Expenditure Survey), random samples of members of each cohort will be generated. Unit of regression analysis: time series of sample averages of cohorts (pseudo panels). Here we focus on static pseudo panel models. At the individual level, the model is: (2.48) yit = α i + x it β + ε it , with the usual strict exog. assumption E(xituis)=0, ∀ t,s; t=1,...T
  • 30. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 40 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e Each unit belonging to some cohort, c, is assumed to be observed in one period only. The model for the cohort population is (* for population): (2.49) y = α + x β + ε , with * ct * c * ct yct = E ( yit | i belongs to c ) etc. * * ct Assuming a stationary population, the cohort fixed effect, α c , * x* is constant over time, but will be correlated with ct if the individual-level counterparts in (2.48) are correlated. Population means are not observed, but are estimated by cohort-time averages leading to the model: (2.50) yct = α c + x ct β + ε ct , c = 1,..., C ; t = 1,..., T Using these averages instead of unobserved population means Introduces measurement error in both dependent and explanatory variables.
  • 31. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 41 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e Exkurs: Messfehler in erklärenden Variablen y i = β 0 + β 1 xi*1 + ui xi*1 := (unbeobachbarer) „wahrer“ Wert der Variablen xi1 := mit Fehler beobachteter Wert der Variablen ei1 = xi1 − xi*1 := Messfehler mit E ( e1 ) = 0, Var ( e1 ) = σ e1 , Cov ( x1 , e1 ) = 0 2 * Cov ( x1 , e1 ) = E ( x1e1 ) = E ( x1 e1 ) + E ( e12 ) = σ e21 * y = β 0 + β 1 x1 + ( u − β 1e1 ) mit Cov ( x1 , u − β 1e1 ) = − β 1Cov ( x1 , e1 ) = − β 1σ e2 1 ˆ OLS = β + Cov ( x1 , u − β 1e1 ) p lim β 1( ) Var ( x1 ) 1 ⎣ ( ( = β1 ⎡1 − σ e21 / σ x* + σ e21 ⎢ 2 1 )) ⎥ ⎦ 1 ⎣ x1 x1 ( ⎤ = β ⎡σ 2* / σ 2* + σ 2 ⎤ e1 ⎦ )
  • 32. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 42 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e If measurement errors are small due to the large number of observations per cohort (nc = N/C ∞), they can be ignored (if there are no time effects in εit, see Verbeek 1992) (2.50) can be estimated by the FE-estimator (within- transformation of cohort means). If measurement errors cannot be neglected: • Measurement Error Estimator (Deaton, 1985) ⎛ yct − yct ⎞ iid ⎛ ⎛ 0 ⎞ ⎛ σ 00 σ ' ⎞ ⎞ * (2.51) ⎜ * ⎟ ~ N ⎜ ⎜ ⎟;⎜ ⎟⎟, ⎝ x ct − x ct ⎠ ⎝⎝0⎠ ⎝ σ' Σ ⎠⎠ with population means treated as unknown constants. These variances and covariances can be estimated consistently on the basis of the individual data for large N (or T, or both).
  • 33. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 43 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e Estimation idea: Adjust the moments in the within estimator using estimated error variances to eliminate measurement error: −1 ⎛ 1 C T T −1 ˆ ⎞ βD = ⎜ ˆ ∑∑( x ct − x c )′ ( x ct − x c ) − Σ⎟ (2.52) ⎝ CT c =1 t =1 T ⎠ ⎛ 1 C T ′ ( y − y ) − T − 1σ ⎞ ×⎜ ∑ ∑ ( xct − xc ) ct c T ˆ ⎟ ⎝ CT c =1 t =1 ⎠ Note: In the Deaton article (T-1)/T :=1, irrelevant for large T. If nc ∞, measurement errors and both Σ and σ 0; Errors-in-variables estimator (2.52) is asymptotically equivalent to the within-estimator applied to cohort-time averages in (2.50): −1 ⎛ 1 C T ⎞ βW = ⎜ ˆ ∑∑( x ct − x c )′ ( x ct − x c ) ⎟ (2.53) ⎝ CT c =1 t =1 ⎠ ⎛ 1 C T ′ (y − y )⎞ ×⎜ ∑ ∑ ( xct − xc ) ct c ⎟ ⎝ CT c =1 t =1 ⎠
  • 34. P r o f. D r. V i k t o r S t e i n e r – M I K R O Ö K O N O M E T R I E (SS 09) 44 2. L i n e a r e M o d e l l e f ü r P a n e l d a t e n / 2.1 S t a t i s c h e M o d e l l e • IV Estimator (Moffitt, 1993, Collado, 1997) yct = yct + ξ ct * (2.53) x ct = xct + ζ ct * Inserting (2.53) into (2.49): yct − ξ ct = α c + ( x ct − ζ ct ) β + ε ct * * (2.54) yct = α c + x ct β + ω ct , ω ct = ε ct − ζ ct β + ξ ct * * First-differencing (2.54) eliminates the population cohort fixed effect: (2.55) Δ yct = Δ x ct β + Δ ω ct , t = 2,..., T Due to measurement error, E ( Δ x ct Δ ω ct ) ≠ 0 Potential IV: lagged levels of exogenous variables, x c ,t −1