Togel Online: Panduan Lengkap tentang Dkitoto, Dkitogel, dan Situs Togel
DETEKSI HETEROKEDASTISITAS
1. LECTURE NOTES #7
HETEROKEDASTISITAS
I. Pendahuluan
Pada bagian sebelumnya telah dibahas penggunaan Ordinary Least Square
untuk mengestimasi suatu garis regresi linier berganda serta prosedur
inferensinya. Seperti yang diketahui jika asumsi klasik (Gauss-Markov)
dipenuhi maka parameter yang diperoleh dengan teknik ini adalah bersifat
Best Liniear Unbiased Estimator (BLUE).
Dalam prakteknya sangat mungkin sekali satu atau lebih asumsi tersebut
tidak dapat dipenuhi. Dengan demikian maka estimator OLS tidak lagi
BLUE. Pada kasus yang ekstrim estimator dan/atau pengujian hipotesa
bahkan tidak dapat dilakukan.
Dalam bagian ini akan dibahas suatu pelanggaran asumsi klasik yang sering
terjadi yakni heterokedastisitas. Pelanggaran asumsi ini terjadi ketika
residual tidak lagi konstan melainkan bersifat variabel.
Kita akan membahas konsep/pengertian dari heterokedastisitas dan
implikasi yang ditimbulkannya. Pada beberapa kasus heterokedastisitas
dapat diobservasi secara kasual (pengamatan melalui pola residual), namun
sering kali tidak. Untuk itu perlu dikembangkan teknik pengujian formal
berdasarkan suatu kaidah statistik. teknik deteksi dan metoda koreksi.
II. Konsep Heterokedastisitas
Salah satu asumsi penting (asumsi Gauss Markov) didalam penggunaan
estimator OLS agar ia bersifat Best Liniear Unbiased Estimator (BLUE)
adalah varians yang konstan. Varians dari residual tidak berubah dengan
berubahnya satu atau lebih variabel bebas (Homokedastisitas). Secara grafis
hal ini ditunjukkan pada grafik 1.
Grafik 1. Residual dengan Sifat Homokedastis
1
2. Secara formal homokedastisitas dinyatakan sbg
Var (u x1 , x2 ,..., xk ) = σ 2 ………………………1)
Jika asumsi ini terlanggar maka dapat dinyatakan
Var (u x1 , x2 ,..., xk ) = σ i 2 ………………………2)
Dimana indeks I menunjukkan bahwa varians berubah dari observasi ke
observasi (bersifat variabel). Secara grafis hal ini ditunjukkan sbb
Grafik 2. Residual dengan Sifat Heterokedastis
Terdapat beberapa alasan mengapa residual regresi dapat bersifat seperti
ini, diantaranya:
a. Terdapat situasi error learning, misalnya kita ingin mengetahui
hubungan tingkat kesalahan mengetik terhadap berbagai variabel. Jika
kita menggunakan sample yang bersifat panel/time series akan sangat
mungkin model yang dimiliki akan bersifat heterokedastis. Hal ini
disebabkan kesalahan pengetikan akan menurun dari waktu ke waktu
dan terjadi konvergensi diantara elemen sample (kesalahan anggota
sample yang paling tidak terampir akan menurun mendekati mereka
yang awalnya sudah terampil).
b. Peningkatan diskresi. Hal ini tampak jelas pada penelitian dengan
menggunakan variabel pendapatan. Aktivitas oleh individu yang
memiliki pendapatan tinggi akan jauh lebih variatif dibandingkan
mereka yang berpendapatan rendah. Dengan demikian suatu model
regresi dengan menggunakan variabel semacam ini akan mengalami
peningkatan residual kuadrat dengan semakin besarnya pendapatan.
c. Perbaikan teknik pengambilan data. Kembali hal ini relevan jika data
bersifat panel (data diambil dari individu yang sama pada titik waktu
berbeda-beda). Peneliti akan belajar untuk menarik informasi dengan
2
3. benar dengan demikian kesalahan akibat proses ekstraksi data akan
semakin menurun.
d. Keberadaan Outlier. Outlier adalah data yang memiliki karakteristik
sangat berbeda dari kondisi yang umum. Misalnya kita memiliki suatu
set data pendapatan dengan kisaran IDR 2-5 juta per bulan, keberadaan
individu dengan pendapatan 100 juta dapat dikatakan outlier.
e. Masalah spesifikasi. Jika model pada populasi adalah non linier
(misalnya eksponensial) namun kita memaksa penggunaan model linier.
Disini kuadrat residual akan meningkat dengan cepat dengan
meningkatnya nilai variabel bebas.
III. Implikasi Heterokedastisitas
Terlanggarnya asumsi ini (disebut Heterokedastisitas) tidak menyebabkan
estimator (βi) menjadi bias karena residual bukanlah komponen didalam
perhitungan. Sebagai ilustrasi, kita gunakan model regresi sederhana dua
variabel sbb:
y = β 0 + β1 x + u ………………………3)
Parameter model regresi dapat dihitung dengan formula sbb:
n _ _
^ ∑ ( x − x)( y − y)
i i
Cov( x, y )
β1 = i =1
n _
=
∑ ( x − x) 2 Var ( x)
i
i =1
^ _ _
β 0 = y − β1 x ………………………4)
Dapat dilihat pada persamaan 4, residual kuadrat bukanlah komponen
didalam perhitungan parameter.
Namun demikian heterokedastisitas menyebabkan standar error dari model
regresi menjadi bias, dan sebagai konsekuensinya matriks varians-kovarians
yang digunakan untuk menghitung standar error parameter menjadi bias
pula. Untuk model sederhana diatas, standar error parameter dapat
dihitung sbb:
3
4. ^ σ2
V ar( β 1 ) = n _
………………………5)
∑ ( x − x)
i =1
i
2
Dengan demikian pada asumsi heterokedastisitas dapat ditunjukkan
formula yang valid bagi persamaan 5 adalah
n _
^ ∑ ( x − x) σi
2
i
2
V ar( β 1 ) = i =1
n _
………………………6)
∑ ( x − x)
i =1
i
2
Hasil kedua formula ini umumnya adalah berbeda, akan sama jika σi2 = σ2,
suatu konstanta.
Seperti yang diketahui pengujian hipotesa baik t test maupun F test
sangatlah tergantung pada standar error yang benar. Dengan demikian
masalah heterokedastisitas akan menyebabkan pengambilan kesimpulan
berdasarkan rejection rule yang ada akan menjadi tidak valid.
IV. Teknik Deteksi
Kita dapat mendeteksi keberadaan heterokedastisitas melalui suatu metoda
kasual, yakni mengamati pola residual kuadrat. Jika heterokedastisitas ada
pada model hal ini dapat terlihat dengan adanya suatu pola tertentu pada
grafik residual kuadrat.
Grafik 3. Berbagai Pola Residual Kuadrat
4
5. Grafik 3 menunjukkan pola-pola residual kuadrat yang mungkin sering
diamati pada penelitian. Disini kita melakukan plotting residual kuadrat
terhadap fitted value namun pola yang sama juga dapat diperoleh jika kita
mengganti fitted valued dengan nilai observasi salah satu variabel bebas.
Pola 3a. menunjukkan situasi homokedastisitas, disini residual kuadrat
berada pada interval yang sama pada setiap tingkat fitted value. Sedangkan
pola 3b s/d 3e menunjukkan bahwa selang residual kuadrat adalah bersifat
variabel (misalnya kuadratik pada pola 3d).
Kita tentunya membutuhkan suatu prosedur formal yang dapat digunakan
untuk mendeteksi adanya heterokedastisitas (pengamatan kasual tidaklah
mencukupi). Terdapat banyak test yang dikembangkan untuk menguji
keberadaan heterokedastisitas, namun disini kita akan membahas 2 metoda
yang paling popular, yakni: Breusch-Pagan Test dan White Test (lihat
Gujarati, 2003 untuk jenis test lainnya).
Prosedur Breusch-Pagan (1980) mengasumsikan bahwa ketika varians
residual adalah tidak konstan maka ia akan berhubungan dengan satu atau
lebih variabel dalam spesifikasi yang linier. Adapun langkah-langkah test
dapat diuraikan sbb:
a. Estimasi model, misalnya dengan k regresor sbb
y = β 0 + β1 x1 + β 2 x2 + ... + β k xk + u ………………………7)
b. Jika kita menduga bahwa model ini mengalami heterokedastisitas, maka
laksanakan regresi auxiliary sbb
^2
u = δ 0 + δ1 x1 + δ 2 x2 + ... + δ k xk + v ………………………8)
^ 2
Nilai u diperoleh dari residual persamaan 7, yakni
^ ^ ^ ^ ^
u i = y − β 0 − β 1 x1 − β 2 x2 − ... − β k xk ………………………9)
c. Set up hipotesis yang digunakan disini adalah
H 0 : δ1 = δ 2 = ... = δ k =0
……………………10)
H1 : Paling tidak satu δ i ≠ 0
Hipotesis null yang digunakan adalah tidak terdapat heterokedastisitas
(residual memiliki pola homokedastis).
d. Hitung statistik uji Fht atau LM sbb:
5
6. Raux 2 / k
Fht = ;
(1 − Raux ) /(n − k − 1)
2
……………………11)
LM = nRaux 2
Dimana Raux2 diperoleh dari regresi auxiliary (persamaan 8), n adalah
jumlah sample dan k adalah jumlah variabel bebas (diluar intersep).
e. Statistik Fht dan LM masing-masing didistribusikan mengikuti F(df : k,
n-k-1) dan Chi Square, χ2 (df=k). Dengan demikian kita dapat
menggunakan salah satu criteria rejection rule: nilai kritis atau p value
pada α yang relevan (misalnya 5% atau 1%). Jika hipotesis null tidak
dapat ditolak, maka dapat disimpulkan bahwa model regresi yang
dimiliki tidak mengalami masalah heterokedastisitas (paling tidak jika ia
berbentuk linier). Sedangkan penolakan terhadap hipotesis null
memberikan indikasi bahwa model mengalami heterokedastisitas dan
perlu dilakukan koreksi.
Contoh 1:
Dengan menggunakan data Hprice1.raw, kita akan melakukan estimasi
model regresi linier yang menghubungkan harga rumah (price) terhadap
variabel lotsize, sqrft dan bdrms. Hasil regresi yang dilakukan diberikan
pada tabel 1.
Dependent Variable: PRICE
Method: Least Squares
Date: 06/08/08 Time: 10:00
Sample: 1 88
Included observations: 88
Variable Coefficient Std. Error t-Statistic Prob.
C -21.77031 29.47504 -0.738601 0.4622
LOTSIZE 0.002068 0.000642 3.220096 0.0018
SQRFT 0.122778 0.013237 9.275093 0.0000
BDRMS 13.85252 9.010145 1.537436 0.1279
R-squared 0.672362 Mean dependent var 293.5460
Adjusted R-squared 0.660661 S.D. dependent var 102.7134
S.E. of regression 59.83348 Akaike info criterion 11.06540
Sum squared resid 300723.8 Schwarz criterion 11.17800
Log likelihood -482.8775 F-statistic 57.46023
Durbin-Watson stat 2.109796 Prob(F-statistic) 0.000000
Tabel 1. Print Output Regresi Contoh 1
6
7. Kita akan menggunakan prosedur Breusch-Pagan untuk mendeteksi
keberadaan heterokedastisitas. Untuk itu kita mentabulasikan dahulu
residual dari regresi diatas dengan nama u dan melakukan regresi auxiliary
residual kuadrat terhadap seluruh variabel bebas. Ketika ini dilaksanakan
hasil yang diperoleh adalah
Dependent Variable: U^2
Method: Least Squares
Date: 06/08/08 Time: 10:01
Sample: 1 88
Included observations: 88
Variable Coefficient Std. Error t-Statistic Prob.
C -5522.795 3259.478 -1.694380 0.0939
LOTSIZE 0.201521 0.071009 2.837961 0.0057
SQRFT 1.691037 1.463850 1.155198 0.2513
BDRMS 1041.760 996.3810 1.045544 0.2988
R-squared 0.160141 Mean dependent var 3417.316
Adjusted R-squared 0.130146 S.D. dependent var 7094.384
S.E. of regression 6616.646 Akaike info criterion 20.47695
Sum squared resid 3.68E+09 Schwarz criterion 20.58956
Log likelihood -896.9860 F-statistic 5.338919
Durbin-Watson stat 2.351111 Prob(F-statistic) 0.002048
Tabel 2. Auxiliary Regression Contoh 1
Dengan demikian nilai F atau LM dapat dihitung dengan cara
1.601/ 3
Fht = ≈ 5.34
(1 − 1.601) /(84) ……………………12)
LM = (88)(1.601) ≈ 14.09
Nilai p value terkait dengan Fht dan LM adalah masing-masing 0.02 dan
0.028, dan keduanya dibawah 5%. Dengan demikian hasil test
menunjukkan model regresi mengalami heterokedastisitas.
White (1980) melakukan evaluasi terhadap pola-pola residual kuadrat serta
mengkaitkannya dengan asumsi Gauss Markov: Homokedastisitas. Dalam
analisisnya tersebut ia berkesimpulan bahwa asumsi ini dapat diperlunak
dengan menyatakan bahwa residual kuadrat tidak berkorelasi dengan
seluruh variabel bebas (xj), kuadrat variabel bebas (x2j) dan cross product
(xjxh dimana j≠h).
7
8. Preposisi ini dapat diuji melalui model regresi auxiliary berikut
^2
u = δ 0 + δ1 x1 + ... + δ k xk + δ k +1 x12 + ... + δ k + k xk 2
+ δ k + k +1 x1 x2 + ... + δ k + k + C xk −1 xk + error ……………………13)
dimana
C = kombinasi 2 dari pilihan k
Adapun set up hipotesis yang digunakan adalah
H 0 : δ1 = δ 2 = ... = δ k + k +C =0 ……………………14)
H1 : Paling tidak satu δ m ≠ 0 (m=1,...,k+k+C)
Rejection rule dilakukan dengan menggunakan statistik F atau LM dengan
perhitungan sebagaimana diberikan pada persamaan 11.
Pengujian sebagaimana diuraikan diatas memiliki kelemahan karena
memakan banyak degree of freedom. Disini terlalu banyak parameter yang
diestimasi, sebagai contoh dengan model hanya 3 variabel kita akan
mengestimasi 9 parameter (=3+3+3). Untuk itu Wooldridge (2005)
menyarankan modifikasi dengan menggunakan fitted value, ingat bahwa
fitted value dapat diperoleh dengan cara
^ ^ ^ ^ ^
y i = β 0 + β 1 x1i + β 2 x2i + ... + β k xki ……………………15)
dimana i adalah observasi. Dengan demikian kita dapat memodifikasi
persamaan 13 menjadi
^2 ^ ^2
u = δ 0 + δ1 y + δ 2 y + error ……………………16)
Rejection rule terhadap null hipotesis δ1=δ1=0 dapat dilakukan dengan
menggunakan statistik F atau LM dengan perhitungan sebagaimana
diberikan pada persamaan 11.
Contoh 2.
Masih dengan menggunakan data pada contoh 1, disini kita mengganti
prosedur Breusch-Pagan dengan White test. Prosedur White Test dapat
8
9. diakses pada sub menu output hasil regresi (tabel 1), menu View,
Residual Test, White Heterocedasticity (cross terms). Hasil yang
diperoleh diberikan oleh tabel 3.
White Heteroskedasticity Test:
F-statistic 5.386953 Prob. F(9,78) 0.000010
Obs*R-squared 33.73166 Prob. Chi-Square(9) 0.000100
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/09/08 Time: 08:45
Sample: 1 88
Included observations: 88
Variable Coefficient Std. Error t-Statistic Prob.
C 15626.24 11369.41 1.374411 0.1733
LOTSIZE -1.859507 0.637097 -2.918719 0.0046
LOTSIZE^2 -4.98E-07 4.63E-06 -0.107498 0.9147
LOTSIZE*SQRFT 0.000457 0.000277 1.649673 0.1030
LOTSIZE*BDRMS 0.314647 0.252094 1.248135 0.2157
SQRFT -2.673918 8.662183 -0.308689 0.7584
SQRFT^2 0.000352 0.001840 0.191484 0.8486
SQRFT*BDRMS -1.020860 1.667154 -0.612337 0.5421
BDRMS -1982.841 5438.483 -0.364595 0.7164
BDRMS^2 289.7541 758.8303 0.381843 0.7036
R-squared 0.383314 Mean dependent var 3417.316
Adjusted R-squared 0.312158 S.D. dependent var 7094.384
S.E. of regression 5883.814 Akaike info criterion 20.30444
Sum squared resid 2.70E+09 Schwarz criterion 20.58596
Log likelihood -883.3955 F-statistic 5.386953
Durbin-Watson stat 2.052712 Prob(F-statistic) 0.000010
Tabel 3. White Heterocedasticity Test
Seperti yang dapat dilihat pada tabel 3, prosedur yang ada pada Eviews
menggunakan spesifikasi persamaan 13. Baik F maupun LM test
menunjukkan hipotesis null homokedastisitas dapat ditolak. Dengan
demikian sejalan dengan Breusch-Pagan Test, White Test juga
mengindikasikan model mengalami heterokedastisitas.
9
10. Suatu catatan terkait dengan pengujian heterokedastisitas perlu diberikan
disini. Dari pembahasan penyebab heterokedastisitas diketahui bahwa
fenomena ini dapat terjadi karena masalah misspesifikasi bentuk
fungsional. Disisi lain uji yang telah dipelajari mengasumsikan bahwa pola
heterokedastisitas adalah linier terhadap variabel bebas. Dengan demikian
Wooldridge (2005) menyarankan untuk melakukan uji spesifikasi terdahulu
terhadap model sebelum melakukan uji heterokedastisitas. Uji
heterokedastisitas dilakukan jika bentuk fungsional model sudah benar.
V. Prosedur Koreksi
Jika pada suatu model regresi terdeteksi heterokedastisitas maka standar
error dari regresi menjadi bias. Sebagai konsekuensinya seluruh tipe uji
hipotesis (parsial dan exclusion) menjadi menyesatkan. Untuk itu perlu
dilakukan koreksi terhadap model. Terdapat 2 tipe koreksi yakni (1) koreksi
terhadap standar error regresi dan (2) Generalized Least Square/GLS.
Tipe koreksi yang pertama dilakukan hanya terbatas pada standar error
regresi. Tidak ada modifikasi atau estimasi ulang atas parameter yang
diperoleh dari OLS. Koreksi terhadap standar error regresi dilakukan
melalui prosedur yang diuraikan oleh White (1980) dan dikenal dengan
nama Heterocedasticity Robust Standard Error.
Uraian bagaimana koreksi dilakukan terhadap varians error model regresi
bersifat sangat teknis, dan kita tidak akan membahasnya. White (1980)
menunjukkan bahwa suatu standar error yang bersifat robust terhadap
heterokedastisitas (yang bahkan bersifat unknown form) dapat dihitung
dengan formulas sbb:
n ^2 ^ 2
^ ∑r ij ui
V ar( β j ) = i =1
n _
;
∑ ( x − x)
i =1
i
2
……………………17)
^ ^
SE ( β j ) = V ar( β j )
^2
dimana r ij menunjukkan residual ke i dari regresi variabel xj terhadap
seluruh variabel independen lainnya.
Dengan diperolehnya standar error yang robust terhadap heterokedastisitas
(persamaan 17) maka perhitungan statistik uji t dapat dilakukan dengan
menggantikan standar error OLS semula dengan formula yang baru ini.
10
11. Hampir semua paket software ekonometrika/statistik telah memasukkan
Heterocedasticity Robust Standard Error kedalam routine yang
dimilikinya. Namun demikian perhitungan exclusion test dan overall
significance test bersifat jauh lebih rumit dan kita tidak akan membahasnya.
Bagi pembaca yang tertarik dapat merujuk pada Wooldrige hal 253-254.
Contoh 3.
Dengan menggunakan data pada GPA3.raw, kita akan mengestimasi regresi
cumgpa terhadap sat, hsperc, tothrs, female, black dan white. Dengan
menggunakan prosedur biasa diperoleh hasil pada tabel 4
Dependent Variable: CUMGPA
Method: Least Squares
Date: 06/09/08 Time: 08:54
Sample: 1 732 IF SPRING=1
Included observations: 366
Variable Coefficient Std. Error t-Statistic Prob.
C 1.470065 0.229803 6.397063 0.0000
SAT 0.001141 0.000179 6.388504 0.0000
HSPERC -0.008566 0.001240 -6.906003 0.0000
TOTHRS 0.002504 0.000731 3.425510 0.0007
FEMALE 0.303433 0.059020 5.141165 0.0000
BLACK -0.128284 0.147370 -0.870486 0.3846
WHITE -0.058722 0.140990 -0.416497 0.6773
R-squared 0.400560 Mean dependent var 2.334153
Adjusted R-squared 0.390542 S.D. dependent var 0.601126
S.E. of regression 0.469286 Akaike info criterion 1.343732
Sum squared resid 79.06233 Schwarz criterion 1.418372
Log likelihood -238.9029 F-statistic 39.98208
Prob(F-statistic) 0.000000
Tabel 4. Print Out Regresi Contoh 3.
Model ini mengalami masalah heterokedastisitas. Hal ini dapat dilihat melalui
pengujian White Heterocedasticity Test, dimana baik nilai p value maupun F,
menunjukkan dengan sangat kuat bahwa hipotesis null homokedastisitas adalah
ditolak.
White Heteroskedasticity Test:
F-statistic 3.629836 Prob. F(23,342) 0.000000
Obs*R-squared 71.81422 Prob. Chi-Square(23) 0.000001
11
12. Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/09/08 Time: 10:05
Sample: 1 732 IF SPRING=1
Included observations: 366
Collinear test regressors dropped from specification
Variable Coefficient Std. Error t-Statistic Prob.
C 0.748114 1.006458 0.743314 0.4578
SAT -0.000930 0.001461 -0.636818 0.5247
SAT^2 6.85E-07 6.21E-07 1.102059 0.2712
SAT*HSPERC -8.15E-07 5.94E-06 -0.137065 0.8911
SAT*TOTHRS -6.69E-06 3.76E-06 -1.779145 0.0761
SAT*FEMALE -0.000232 0.000303 -0.767388 0.4434
SAT*BLACK 0.000798 0.000810 0.985402 0.3251
SAT*WHITE 0.000342 0.000722 0.473846 0.6359
HSPERC -0.007883 0.008268 -0.953522 0.3410
HSPERC^2 7.75E-05 3.74E-05 2.069623 0.0392
HSPERC*TOTHRS -5.63E-06 2.69E-05 -0.209662 0.8341
HSPERC*FEMALE -0.000903 0.002409 -0.375028 0.7079
HSPERC*BLACK 0.001311 0.005295 0.247640 0.8046
HSPERC*WHITE 0.004146 0.004907 0.845006 0.3987
TOTHRS -0.000258 0.006853 -0.037671 0.9700
TOTHRS^2 5.05E-05 1.73E-05 2.921279 0.0037
TOTHRS*FEMALE -0.000609 0.001214 -0.502005 0.6160
TOTHRS*BLACK -0.003979 0.005439 -0.731463 0.4650
TOTHRS*WHITE -0.002024 0.005387 -0.375695 0.7074
FEMALE 0.190255 0.432399 0.439999 0.6602
FEMALE*BLACK -0.045258 0.319959 -0.141450 0.8876
FEMALE*WHITE 0.127827 0.305694 0.418152 0.6761
BLACK -0.433255 0.896341 -0.483360 0.6291
WHITE -0.305580 0.821256 -0.372089 0.7101
R-squared 0.196214 Mean dependent var 0.216017
Adjusted R-squared 0.142158 S.D. dependent var 0.348846
S.E. of regression 0.323101 Akaike info criterion 0.641619
Sum squared resid 35.70277 Schwarz criterion 0.897530
Log likelihood -93.41635 F-statistic 3.629836
Prob(F-statistic) 0.000000
Tabel 5. White Heterocedasticity Test Contoh 3.
Dengan demikian perlu dilakukan koreksi terhadap standar error dari parameter.
Hasil yang diperoleh dari prosedur ini diberikan oleh tabel 6.
12
13. Dependent Variable: CUMGPA
Method: Least Squares
Date: 06/09/08 Time: 08:55
Sample: 1 732 IF SPRING=1
Included observations: 366
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 1.470065 0.220680 6.661516 0.0000
SAT 0.001141 0.000192 5.955817 0.0000
HSPERC -0.008566 0.001418 -6.041464 0.0000
TOTHRS 0.002504 0.000741 3.380845 0.0008
FEMALE 0.303433 0.059138 5.130949 0.0000
BLACK -0.128284 0.119241 -1.075833 0.2827
WHITE -0.058722 0.111392 -0.527163 0.5984
R-squared 0.400560 Mean dependent var 2.334153
Adjusted R-squared 0.390542 S.D. dependent var 0.601126
S.E. of regression 0.469286 Akaike info criterion 1.343732
Sum squared resid 79.06233 Schwarz criterion 1.418372
Log likelihood -238.9029 F-statistic 39.98208
Prob(F-statistic) 0.000000
Tabel 6. Reestimasi Contoh 3 dengan Heterocedasticity Robust Standard Error
Generalized Least Squares (GLS) adalah prosedur koreksi heterokedastisitas
dengan cara melakukan transformasi dan reestimasi. Jika kita mengetahui
bentuk spesifik dari heterokedastisitas (misalnya linier terhadap variabel bebas)
maka kita dapat memodifikasi nilai variabel tergantung dan variabel bebas sesuai
dengan bentuk heterokedastisitas dan mengestimasinya kembali.
Salah satu bentuk yang paling sering digunakan dalam mengasumsikan
heterokedastisitas adalah multiplicative constant, yakni
Var (u x) = σ 2 h( x) ……………………18)
dimana x menyatakan seluruh variabel bebas dan h(x) adalah suatu fungsi dari
variabel bebas yang menentukan heterokedastisitas. Dengan demikian
heterokedastisitas dalam asumsi ini dapat dinyatakan sebagai
σ 2i = Var (ui xi ) = σ 2 h( xi ) = σ 2 hi ……………………19)
13
14. Selanjutnya kita dapat melakukan transformasi atas model awal yang mengalami
heterokedastisitas, yakni
yi = β 0 + β1 x1i + β 2 x2i + ... + β k xki + ui ……………………20)
menjadi suatu model dengan residual yang homokedastisitas. Hal ini dapat
dilakukan dengan membagi seluruh regressor dan regresand dengan hi (disebut
dengan penimbang/bobot). Dapat ditunjukkan disini residual model hasil
transformasi, yakni
( ) (
yi / hi = β 0 / hi + β1 x1i / hi + β 2 x2i / hi + ... )
(
+ β k xki / h ) + (u / h )
i i i ……………………21)
atau
y *i = β 0 x *0i + β1 x *1i + β 2 x *2i +... + β k x *ki +u *i
memiliki pola homokedastis, atau
Var (u *i ) = Var (ui / hi ) = E ⎡ ui / hi ( )⎤
2
⎢
⎣ ⎥
⎦
= E ( ui ) / hi = σ 2 hi / hi = σ 2
2
……………………22)
Transformasi ini adalah suatu kelas khusus dari GLS yang disebut weighted least
squares (WLS). Standar error hasil regresi yang ditransformasi (persamaan 21)
adalah tidak bias dan dengan demikian prosedur pengujian (t dan F test) menjadi
valid. Tidak ada yang berubah dalam formula perhitungan dan rejection rule, kita
tetap menggunakan standar intrepretasi regresi linier berganda. Disamping itu
meskipun kita melakukan transformasi terhadap model regresi, intrepretasi
koefisien tetap dilakukan seperti regresi awal.
Contoh 4
Dengan menggunakan data saving.raw, kita akan mengestimasi hubungan
tingkat simpanan rumah tangga (sav) terhadap pendapatan (inc), ukuran RT
(size), pendidikan (educ), usia (age) dan ras (black). Hasil estimasi awal
dirangkum pada tabel
Dependent Variable: SAV
Method: Least Squares
Date: 06/10/08 Time: 07:04
14
15. Sample: 1 100
Included observations: 100
Variable Coefficient Std. Error t-Statistic Prob.
C -1605.416 2830.707 -0.567143 0.5720
INC 0.109455 0.071432 1.532304 0.1288
SIZE 67.66119 222.9642 0.303462 0.7622
EDUC 151.8235 117.2487 1.294885 0.1985
AGE 0.285722 50.03108 0.005711 0.9955
BLACK 518.3934 1308.063 0.396306 0.6928
R-squared 0.082775 Mean dependent var 1582.510
Adjusted R-squared 0.033987 S.D. dependent var 3284.902
S.E. of regression 3228.598 Akaike info criterion 19.05561
Sum squared resid 9.80E+08 Schwarz criterion 19.21192
Log likelihood -946.7804 F-statistic 1.696615
Durbin-Watson stat 1.594808 Prob(F-statistic) 0.142998
Tabel 7. Print Out Regresi Contoh 4
Selanjutnya jika kita menduga bahwa heterokedastisitas terjadi dengan
mengambil bentuk linier terhadap inc (σ2i=σ2 inc) maka transformasi dilakukan
dengan menggunakan akar kuadrat inc sebagai bobot. Pada Eviews hal ini
dilakukan melalui sub menu output/estimate/option isikan opsi Weighted
LS/TSLS dengan (inc)^-0.5. Hasil yang diperoleh adalah pada tabel 8.
Dependent Variable: SAV
Method: Least Squares
Date: 06/10/08 Time: 07:06
Sample: 1 100
Included observations: 100
Weighting series: (INC)^-0.5
Variable Coefficient Std. Error t-Statistic Prob.
C -1854.814 2351.797 -0.788680 0.4323
INC 0.100518 0.077251 1.301184 0.1964
SIZE -6.868501 168.4327 -0.040779 0.9676
EDUC 139.4802 100.5362 1.387363 0.1686
AGE 21.74721 41.30598 0.526491 0.5998
BLACK 137.2842 844.5941 0.162545 0.8712
Weighted Statistics
R-squared 0.104200 Mean dependent var 1364.931
15
16. Adjusted R-squared 0.056551 S.D. dependent var 2675.843
S.E. of regression 2686.849 Akaike info criterion 18.68825
Sum squared resid 6.79E+08 Schwarz criterion 18.84456
Log likelihood -928.4125 F-statistic 2.186836
Durbin-Watson stat 1.598984 Prob(F-statistic) 0.062100
Unweighted Statistics
R-squared 0.077644 Mean dependent var 1582.510
Adjusted R-squared 0.028582 S.D. dependent var 3284.902
S.E. of regression 3237.617 Sum squared resid 9.85E+08
Durbin-Watson stat 1.578383
Tabel 8. Weighted Least Squares Contoh 4
Seperti yang dapat dilihat pada tabel 8, terjadi perubahan signifikan pada nilai
koefisien. Namun demikian jika model ini memang benar mengalami
heterokedastis, maka nilai koefisien pada tabel 8 adalah lebih valid.
Ada kalanya teori maupun pertimbangan ilmiah tidak memberikan dukungan
untuk mengasumsikan suatu pola heterokedastisitas tertentu. Jika ini terjadi
maka kita harus mengestimasi bentuk dari h(xi) dan mentransformasikan model
awal dengan nilai estimasi dari h(xi). Prosedur ini disebut Feasible GLS (FGLS)
atau Estimated GLS (EGLS). Kita tidak akan membicarakan landasan teoritis
penggunaan FGLS, pembaca yang tertarik dapat merujuk pada Wooldridge, 2005
(hal 266-267).
Adapun prosedur FGLS dapat diuraikan sebagai berikut: ^
1. Regresikan model awal (persamaan 20) dan peroleh residual,u i .
^ 2
2. Buat series log (u i) . ^
3. Estimasi regresi auxiliary berikut dan peroleh nilai g i
^2
log(u ) = δ 0 + δ1 x1 + ... + δ k xk + e
^ ^2 ^ ^ ^
g i = log(u ) = δ 0 + δ 1 x1i + ... + δ k xki
^
4. Hitung hi dimana
^ ^
h i = exp( g i )
^
5. Transformasi persamaan 20 dengan bobot 1/ hi .
16
17. Contoh 5.
Dengan menggunakan data smoke.raw akan diestimasi regresi cigs terhadap
log(income), log(cigpric), educ, age, age^2 dan restaurn. Hasil yang diperoleh
dirangkum pada tabel 9.
Dependent Variable: CIGS
Method: Least Squares
Date: 06/10/08 Time: 08:51
Sample: 1 807
Included observations: 807
Variable Coefficient Std. Error t-Statistic Prob.
C -3.639823 24.07866 -0.151164 0.8799
LOG(INCOME) 0.880268 0.727783 1.209519 0.2268
LOG(CIGPRIC) -0.750862 5.773342 -0.130057 0.8966
EDUC -0.501498 0.167077 -3.001596 0.0028
AGE 0.770694 0.160122 4.813155 0.0000
AGE^2 -0.009023 0.001743 -5.176494 0.0000
RESTAURN -2.825085 1.111794 -2.541016 0.0112
R-squared 0.052737 Mean dependent var 8.686493
Adjusted R-squared 0.045632 S.D. dependent var 13.72152
S.E. of regression 13.40479 Akaike info criterion 8.037737
Sum squared resid 143750.7 Schwarz criterion 8.078448
Log likelihood -3236.227 F-statistic 7.423062
Durbin-Watson stat 2.012825 Prob(F-statistic) 0.000000
Tabel 9. Print Out Regresi Contoh 5
Dengan melaksanakan prosedur FGLS sebagaimana diuraikan diatas, diperoleh
hasil sbb:
Dependent Variable: CIGS
Method: Least Squares
Date: 06/10/08 Time: 08:59
Sample: 1 807
Included observations: 807
Weighting series: (H)^-0.5
Variable Coefficient Std. Error t-Statistic Prob.
C 5.635471 17.80314 0.316544 0.7517
LOG(INCOME) 1.295239 0.437012 2.963855 0.0031
LOG(CIGPRIC) -2.940314 4.460145 -0.659242 0.5099
17
18. EDUC -0.463446 0.120159 -3.856953 0.0001
AGE 0.481948 0.096808 4.978378 0.0000
AGE^2 -0.005627 0.000939 -5.989706 0.0000
RESTAURN -3.461064 0.795505 -4.350776 0.0000
Weighted Statistics
R-squared 0.113409 Mean dependent var 7.158227
Adjusted R-squared 0.106760 S.D. dependent var 11.66855
S.E. of regression 11.69611 Akaike info criterion 7.765025
Sum squared resid 109439.1 Schwarz criterion 7.805736
Log likelihood -3126.188 F-statistic 17.05549
Durbin-Watson stat 2.049719 Prob(F-statistic) 0.000000
Unweighted Statistics
R-squared 0.045739 Mean dependent var 8.686493
Adjusted R-squared 0.038582 S.D. dependent var 13.72152
S.E. of regression 13.45421 Sum squared resid 144812.7
Durbin-Watson stat 2.011453
18