REFLEKSI MANDIRI_Prakarsa Perubahan BAGJA Modul 1.3.pdf
Aminullah assagaf model logistic 19 feb 2021
1. MODEL LOGISTIC (LOGIT)
Reference: Mudah Memahami Regresi Logit (Junaidi, 2008)
Untuk Latihan SPSS_Binary Logistic, Studi Kasus “AA”
Jakarta, 21 Maret 2019
Prof. Dr. Dr. H. Aminullah Assagaf, SE., MS., MM., M.Ak
Email: assagaf29@yahoo.com
HP. : +618113543409
2. MODEL LOGISTIK ATAU MODEL LOGIT
Regresi logistik (kadang disebut model logistik atau model logit), dalam statistika digunakan
untuk prediksi probabilitas kejadian suatu peristiwa dengan mencocokkan data pada fungsi
logit kurva logistik.
Metode ini merupakan model linier umum yang digunakan untuk regresi binomial.
Seperti analisis regresi pada umumnya, metode ini menggunakan beberapa variabel
prediktor, baik numerik maupun kategori.
Misalnya, probabilitas bahwa orang yang menderita serangan jantung pada waktu tertentu
dapat diprediksi dari informasi usia, jenis kelamin, dan indeks massa tubuh.
Regresi logistik juga digunakan secara luas pada bidang kedokteran dan ilmu sosial, maupun
pemasaran seperti prediksi kecenderungan pelanggan untuk membeli suatu produk atau
berhenti berlangganan.
Karena nilai Dependen berupa kategori 0 dan 1, tentunya penjelasan persamaan yang
menghubungkan antara variabel independen dan variabel dependen tidak bisa dilakukan
secara linear seperti yang dilakukan pada regresi umumnya. Maka penggunaan regresi
logistik diperlukan untuk menghitung peluang kecenderungan responden untuk bernilai 0
hingga 1.
3. MODEL LOGISTIK ATAU MODEL LOGIT
Tujuan Menggunakan regresi Logistik, ada 3
1. Menghitung peluang
Persamaan yang diperoleh dari proses regresi logistik, dapat digunakan untuk menghitung peluang
responden diluar responden yang termasuk dalam penelitian. Contoh yang dapat dipahami adalah proses
pengajuan kredit. Pihak bank biasanya melakukan evaluasi kelayakan seseorang layak atau tidak untuk
menerima kredit pinjaman dari bank. Beberapa pertanyaan diberikan kepada pihak bank terhadap calon
penerima kredit. Pertanyaan yang diberikan seputar karakteristik variabel calon penerima modal tersebut
merupakan variabel independen yang akan diinput oleh petugas bank kedalam model. Dari beberapa
variabel yang dipertanyakan itulah, petugas bank dapat menentukan peluang calon penerima kredit tersebut
untuk bisa mengembalikan pinjaman atau tidak, nilai antara 0 – 1.
Tentunya model yang digunakan oleh petugas bank adalah model regresi logistik berdasarkan data-data
peminjam sebelumnya. Dalam model tersebut terdapat komponen bahwa biasanya peminjam yang memiliki
pendapatan dibawah sekian dengan pinjaman yang telah dimiliki sebelumnya sekian, ditambah tanggungan
kerja sekian, memiliki peluang untuk mengembalikan pinjaman sebesar sekian ( nilai 0 -1).
4. 2. Melihat karakteristik
Tujuan kedua ini sering digunakan untuk melihat perbedaan karakteristik antara 2 kelompok. Salah satunya
adalah skripsi saya yang saya sebutkan diatas. Skripsi tersebut menggambarkan karakteristik petani anorganik
dan petani organik. Hasil kesimpulan bahwa peluang petani mampu beralih dari anorganik ke organik adalah
karena perbedaan harga produk hasil kedua proses tersebut. Petani organik bersedia beralih dari anorganik ke
organik meskipun produktivitas organik lebih kecil dibanding anorganik. Namun, perbedaan harga yang tinggi
menjadikan petani organik memiliki pendapatan yang lebih tinggi dibandingkan petani anorganik.
Tujuan melihat karakteristik ini biasanya membahas nilai odds ratio di masing masing variabel independen
(nilai odds ratio adalah (exp(koefisien)) masing-masing variabel). Nilai odds ratio menjelaskan peluang
responden beralih ke organik (contoh kasus diatas). Penjelasan nilai odds ratio berbeda dari nilai koefisien
regresi pada umumnya. Bila koefisien regresi menjelaskan : “ jika variabel X naik 1 satuan, maka nilai Y akan
naik sebesar nilai koefisien satuan” maka exp(koefisien) atau odds ratio pada regresi logistik menjelaskan : “
responden yang memiliki variabel x lebih tinggi, maka akan berpeluang untuk memilih organik (contoh kasus
diatas) sebesar “exp(nilai koefisien) atau biasa disebut odds ratio” kali dibandingkan responden yang memiliki
variabel x lebih rendah”. Iya, nilai exp(koefisien) pada regresi logistik atau disebut sebagai odds ratio
menjelaskan peluang, dan tidak menjelaskan berapa yang dimaksud “lebih tinggi” dari variabel X tersebut.
5. 3. Faktor Yang mempengaruhi
Tujuan ketiga ini merupakan pengembangan dari tujuan kedua, peneliti mampu mengetahui faktor yang
mempengaruhi mengapa terdapat perbedaan antara kedua kelompok tersebut. Nilai odds ratio yang tinggi
menandakan varaibel tersebut memiliki pengaruh yang tinggi terhadap pemilihan beda dari responden.
Tujuan untuk mengetahui faktor yang mempengaruhi ini adalah diharapkan faktor yang signifikan
mempengaruhi tersebut merupakan faktor yang bisa diatur oleh peneliti atau pengambil kebijakan
sehingga bisa menggiring responden lainnya untuk berbuat yang sama terhadap responden yang bernilai 1
sebelumnya.
Contoh pada skripsi ini adalah bahwa harga merupakan faktor yang paling berpengaruh terhadap
preferensi petani memilih pertanian organik, maka pemerintah jika ingin mengembangkan pertanian
organik harus melakukan kebijakan yang tetap menstabilkan harga agar terus berada diatas harga produk
anorganik sehingga peminat petani organik akan sebakin banyak dan bisa terus berkembang.
6. Bagaimana Model Persamaan Regresi Logistik?
Jika regresi linear memiliki persamaan :
Y = a + b1X1 + …. + bnXn, dengan a sebagai konstanta, dan b1 hingga bn adalah koefisien, maka
regresi logistik juga akan mengeluarkan output yang sama jika anda menggunakan software
minitab atau SPSS. Namun, anda akan keliru jika langsung mengambil persamaan itu untuk
menjelaskan atau membahas peluang.
Nilai koefisen masing masing variabel dari gambar diatas terletak pada kolom B, sedangkan
penjelasan nilai odds ratio dari masing masing variabel adalah pada kolom Exp(B).
7.
8. Persamaan regresi logistik adalah :
Jika anda menggunakan regresi logistik untuk membuat persamaan dan menginterpretasikan peluang
pada responden lain, maka pembahasan anda akan berkutat kepada kolom B untuk membuat persamaan,
jika anda akan membahas faktor yang mempengaruhi variabel secara parsial, maka anda akan membahas
kolom odd ratio atau exp(B)
Persamaan tersebut dapat anda gunakan untuk menghitung peluang responden yang memiliki nilai
variabel yang sudah ditetapkan dalam persamaan, hasil akhir nilai p tentunya akan berkisar antara 0 – 1.
10. Tahapan Proses Regresi Logistik
Mari kita langsung praktek dengan menggunakan spss 22. Buka spss dan copikan data yang anda
miliki. Proses regresi logistik bermula dari klik analyze – regression – binary logistic
Kemudian isikan nilai kolom dependen dengan variabel Y dan kolom covariate dengan variabel
independen. Anda bisa menggunakan bermacam – macam methode untuk mengeliminasi variabel
dan memperoleh persamaan yang paling baik untuk menginterpretasikan penelitian anda, anda
bisa membaca artikel saya tentang cara eliminasi variabel pada regresi. Pada latihan ini, kita pilih
methode enter saja. Klik oK
11.
12.
13.
14. Interpretasi Output
Nilai signifikan omnibus test harus berada dibawah 0.05 jika anda menggunakan taraf kepercayaan
95%. Omnibus Test dengan jumlah variabel independen sebanyak x menghasilkan nilai signifikansi
yang lebih rendah dari 0.05. Hal ini menunjukkan bahwa terdapat pengaruh yang signifikan dari x
variabel independen secara simultan mempengaruhi variabel dependen.Kemudian nilai nagelkerke R
Square merupakan nilai R squared pada regresi linear. Variabel independen mampu menjelaskan 86
persen variabel dependen yang terlihat dari nilai Square nagelkerke sebesar 0.86. Sedangkan 14
persen lainnya dapat dijelaskan oleh faktor lain diluar variabel independen dalam persamaan hasil
regresi logistik.
Hosmer and lemeshow Test
Berbeda dengan omnibus test, nilai hosmer and lemeshow test justru dikatakan baik jika nilai
signifikannya > 0.05.
Nilai Hosmer tersebut lebih besar dibandingkan α = 0.05, artinya terima H0 yakni model regresi
logistik mampu menjelaskan data dan tidak terdapat perbedaan antara model dan nilai
observasinya. Hal ini menunjukkan bahwa persamaan regresi logistik dapat digunakan untuk
menjelaskan hubungan variabel independen dan variabel dependen
15.
16.
17.
18. Membuat persamaan
Persamaan diperlukan apabila anda selanjutnya ingin membahas atau meramal suatu
peluang dimana kondisi – kondisi variabel telah anda peroleh. Contoh simple seperti
diatas adalah penentuan layak atau tidak seseorang mendapatkan kredit pinjaman.
Atau, bisa juga memprediksi peluang keberhasilan suatu program apabila memiliki
kondisi kkondisi yang mirip dengan variabel yang ada di persamaan tersebut.
Cara membuat persamaan sudah saya jelaskan diatas, namun sebagai gambaran saya
ilustrasikan sebuah contoh:
Hasil interpretasi nilai logistic regression adalah sebagai berikut:
B0 = -4.2
B1 = 2.3
Variabel independen yang diproses adalah : IP semester 1 mahasiswa dengan variabel
dependennya : 0 berarti lulus lebih atau sama dengan 4 tahun, nilai 1 berarti lulus
kurang dari 4 tahun.
Jika IP semester 1 seorang mahasiswa adalah 3, maka berapa peluang mahasiswa
tersebut untuk lulus kurang dari 4 tahun?
21. MODEL LOGIT
Model logit disusun berdasarkan fungsi peluang logistik kumulatif (Gaspersz, 91):
Untuk menduga persaman di atas secara langsung adalah tidak mungkin, karena Pi mengambil
nilai 0 sampai 1. Komponen {Pi/(1-Pi)} = 0 akan menjadi 0 apabila Pi = 1 dan menjadi tak
terdefinisi bila Pi = 1. Untuk menduga model peluang melalui penggunaan Pi* sebagai pendekatan
Pi dengan formulasi:
Persamaan di atas linear dalam parameter sehingga dapat diduga dengan menggunakan OLS.
Dengan asumsi bahwa setiap individu pengamatan dalam kelompok adalah bebas menurut sebaran
binomial, maka variabel tak bebas Ln (Pi*/(1-Pi*) akan mendekati sebaran normal (ukuran sampel
besar). Persamaan Model Logit dan variabel yang digunakan untuk mengetahui faktorfaktor yang
berpengaruh terhadap peluang peningkatann produksi disajikan dalam bentuk persamaan sebagai
berikut :
Keterangan :
27. Proses SPSS
LOGISTIC
- Analysis
- Regression
- Binary Logistic
- Dependent : Y
- Independent : X1, X2, X3….
- Khusus X3, karena datanya (1, 2, 3), maka:
- Categorical
- Klik X3
- Klik tanda panah samping "Categorical covarians"
- Pilih "Reference Category" dengan " "First"
- Klik "Change"
- Continue
- OK
B S.E. Wald df Sig. Exp(B
Variables in the Equation
28. Exp (B)
=ln(10) =10^(1/2.302) 1.153
10 2.302585 2.718282 =2.718282^(0.142) = 1.153
- Dalam kasus variabel X1 (umur), dengan odds ratio sebesar 1,153 dapat diartikan bahwa konsumen yang berumur
lebih tua satu tahun peluang membeli mobilnya adalah 1,153 kali dibandingkan konsumen umur yang lebih muda
(satu tahun), jika pendapatan dan jenis kelamin mereka sama.
- Dalam kasus variabel X2 (jenis kelamin dimana 1 = wanita dan 0 = pria), dengan odds ratio sebesar 0,201 dapat
diartikan bahwa peluang wanita untuk membeli mobil adalah 0,201 kali dibandingkan pria, jika umur dan
pendapatan mereka sama. Artinya wanita memiliki peluang lebih rendahi dalam membeli mobil dibandingkan pria.
29. Result “Exp(B)”
B S.E. Wald df Sig. Exp(B)
X1 .142 .084 2.838 1 .092 1.153
X2 -1.602 .795 4.065 1 .044 .201
X3 8.783 2 .012
X3(1) -.712 .992 .515 1 .473 .491
X3(2) 1.864 .833 5.011 1 .025 6.450
Constant -5.637 3.150 3.202 1 .074 .004
Variables in the Equation
Step 1a
a. Variable(s) entered on step 1: X1, X2, X3.
30. Uji F (Chi-Square) dan R2
Chi-square df Sig.
Step 18.131 4 .001
Block 18.131 4 .001
Model 18.131 4 .001
-2 Log
likelihood
Cox & Snell R
Square
Nagelkerke R
Square
1 47.660a
.315 .422
Model Summary
Step
a. Estimation terminated at iteration number 5
because parameter estimates changed by less than
Omnibus Tests of Model Coefficients
Step 1
31. TAHAPAN-TAHAPAN ESTIMASI DALAM SPSS
1. Setelah data diinput dalam lembar kerja SPSS kemudian klik Analyze > Regression > Binary Logistic
2. Masukkan Y sebagai variable dependent dengan cara klik Y di kotak kiri, kemudian klik tanda panah
disamping kotak Dependent. Masukkan X1, X2 dan X3 kedalam kotak Covariates, dengan cara klik masing-
masing variable, kemudian klik tanda panah disamping kotak covariates.
3. Selanjutnya, karena variabel X3 merupakan peubah kategori (ordinal) dengan lebih dari dua kategori
(yaitu 0=pendapatan rendah, 1=pendapatan sedang dan 2=pendapatan tinggi) maka diubah terlebih
dahulu ke dalam 2 variabel dummy, untuk mengembangkan model yang logis dan mudah diinterpretasi,
sebagai berikut: (ini sama dengan prosedur regresi dengan variabel bebas dummy sebelumnya)
X3_1 = 1, jika konsumen berpendapatan menengah
0, jika selainnya
X3_2 = 1, jika konsumen berpendapatan tinggi
0, jika selainnya
Dalam program SPSS untuk mengkonversi ini dengan cara klik Categorical dari tampilan diatas, maka akan
muncul tampilan berikut: Selanjutnya, klik X3, klik tanda panah disamping Categorical Covariates. Pilih
Reference Category dengan First, kemudian klik Change dan Continue. Selanjutnya klik OK.
4. Akan keluar output SPSS untuk regresi logit sebagai berikut (disini hanya ditampilkan bagian-bagian
terpenting saja yang akan dibahas)
32.
33.
34. Result and Discuss
Printout di tabel pertama diatas menjelaskan transformasi variabel X3 dengan kategori 0,1 dan 2
menjadi dua variabel dummy yaitu X3_1 dan X3_2. Seperti yang terlihat dari tabel tersebut,
variabel X3_1 bernilai 1 untuk kategori 1 (pendapatan menengah) dan 0 untuk kategori lainnya.
Variabel X3_2 bernilai 1 untuk kategori 2 (pendapatan tinggi) dan 0 untuk kategori lainnya.
Dengan demikian, kategori 0 (pendapatan rendah) akan bernilai 0 baik pada variabel X3_1 dan
X3_2.
Printout di tabel kedua diatas merupakan nilai Khi-kuadrat (χ2) dari model regresi. Sebagaimana
halnya model regresi linear dengan metode OLS, kita juga dapat melakukan pengujian arti penting
model secara keseluruhan. Jika metode OLS menggunakan uji F, maka pada model logit
menggunakan uji G. Statistik G ini menyebar menurut sebaran Khi-kuadrat (χ2). Karenanya dalam
pengujiannya, nilai G dapat dibandingkan dengan nilai χ2 tabel pada α tertentu dan derajat bebas
k-1. (kriteria pengujian dan cara pengujian persis sama dengan uji F pada metode regresi OLS).
Tetapi, kita juga bisa melihat nilai p-value dari nilai G ini yang biasanya ditampilkan oleh sofware-
software statistik, termasuk SPSS.
35. Result and Discuss
• Dari output SPSS, didapatkan nilai χ2 sebesar 18,131 dengan p-value 0,001. Karena nilai
ini jauh dibawah 10 % (jika menggunakan pengujian dengan α=10%), atau jauh dibawah
5% (jika menggunakan pengujian dengan α=5%), maka dapat disimpulkan bahwa model
regresi logistik secara keseluruhan dapat menjelaskan atau memprediksi keputusan
konsumen dalam membeli mobil.
• Printout di tabel ketiga memberikan estimasi koefisien model dan pengujian hipotesis
parsial dari koefisien model. Dalam pelaporannya, model regresi logistiknya dapat
dituliskan sebagai berikut:
Dari output SPSS diatas menjadi sebagai berikut:
36. Result and Discuss
• Model ini merupakan model peluang membeli mobil [(P(xi)] yang dipengaruhi
oleh faktor-faktor umur, jenis kelamin dan pendapatan. Model tersebut adalah
bersifat non-linear dalam parameter. Selanjutnya, untuk menjadikan model
tersebut linear, dilakukan transformasi dengan logaritma natural, (transformasi ini
yang menjadi hal penting dalam regresi logistik dan dikenal dengan istilah ”logit
transformation”), sehingga menjadi (pembahasan lebih rinci, silakan dibaca buku-
buku ekonometrik):
37. Result and Discuss
• 1-P(xi) adalah peluang tidak membeli mobil, sebagai kebalikan dari P(xi)
sebagai peluang membeli mobil. Oleh karenanya, ln [P(xi)/1-P(xi)] secara
sederhana merupakan log dari perbandingan antara peluang membeli
mobil dengan peluang tidak membeli mobil. Oleh karenanya juga, koefisien
dalam persamaan ini menunjukkan pengaruh dari umur, jenis kelamin dan
pendapatan terhadap peluang relative individu membeli mobil yang
dibandingkan dengan peluang tidak membeli mobil.
• Selanjutnya, untuk menguji faktor mana yang berpengaruh nyata terhadap
keputusan pilihan membeli mobil tersebut, dapat menggunakan uji
signifikansi dari parameter koefisien secara parsial dengan statistik uji
Wald, yang serupa dengan statistik uji t atau uji Z dalam regresi linear
biasa, yaitu dengan membagi koefisien terhadap standar error masing-
masing koefisien.
38. Result and Discuss
• Dari output SPSS ditampilkan nilai Wald dan p-valuenya. Berdasarkan nilai
p-value (dan menggunakan kriteria pengujian α=10%), dapat dilihat seluruh
variabel (kecuali X3_1), berpengaruh nyata (memiliki p-value dibawah 10%)
terhadap keputusan membeli mobil.
• Lalu, bagaimana interpretasi koefisien regresi logit dari persamaan di atas ?
Dalam model regresi linear, koefisien βi menunjukkan perubahan nilai
variabel dependent sebagai akibat perubahan satu satuan variabel
independent.
• Hal yang sama sebenarnya juga berlaku dalam model regresi logit, tetapi
secara matematis sulit diinterpretasikan.
•
39. Result and Discuss
• Koefisien dalam model logit menunjukkan perubahan dalam logit sebagai
akibat perubahan satu satuan variabel independent. Interpretasi yang
tepat untuk koefisien ini tentunya tergantung pada kemampuan
menempatkan arti dari perbedaan antara dua logit.
• Oleh karenanya, dalam model logit, dikembangkan pengukuran yang
dikenal dengan nama odds ratio (ψ).
• Odds ratio untuk masing-masing variabel ditampilkan oleh SPSS
sebagaimana yang terlihat tabel diatas (kolom Exp(B)).
• Odds ratio dapat dirumuskan: ψ = eβ, dimana e adalah bilangan 2,71828
dan β adalah koefisien masing-masing variabel.
• Sebagai contoh, odds ratio untuk variabel X2 = e-0.1602 = 0,201 (lihat
output SPSS). Atau 2.718282^(-1.602) = 0.201…demikian seterusnya utk
variabel lainnya
41. Result and Discuss
• Dalam kasus variabel X2 (jenis kelamin dimana 1 = wanita dan 0 = pria), dengan
odds ratio sebesar 0,201 dapat diartikan bahwa peluang wanita untuk membeli
mobil adalah 0,201 kali dibandingkan pria, jika umur dan pendapatan mereka
sama. Artinya wanita memiliki peluang lebih rendahi dalam membeli mobil
dibandingkan pria.
• Dalam kasus variabel X1 (umur), dengan odds ratio sebesar 1,153 dapat diartikan
bahwa konsumen yang berumur lebih tua satu tahun peluang membeli mobilnya
adalah 1,153 kali dibandingkan konsumen umur yang lebih muda (satu tahun),
jika pendapatan dan jenis kelamin mereka sama.
• Artinya orang yang lebih tua memiliki peluang yang lebih tinggi dalam membeli
mobil.
• Dalam konteks umur ini (yang merupakan variabel dengan skala ratio), hati-hati
menginterpretasikan nilai perbedaan peluangnya. Jika perbedaan umur lebih dari
1 tahun,
42. Result and Discuss
• misalnya 10 tahun, maka odds rationya akan menjadi 4,14, yang diperoleh dari
perhitungan sbb: ψ=e(10 x 0.142) = 2.718282^1.42=4.14 . Artinya peluang
membeli mobil konsumen yang berumur lebih tua 10 tahun adalah 4,14 kali
dibandingkan konsumen yang lebih muda (10 tahun) darinya.
• Selanjutnya, dalam konteks variabel pendapatan, terlihat bahwa X31 tidak
berpengaruh signifikan. Artinya, peluang membeli mobil antara konsumen
pendapatan sedang dan pendapatan rendah adalah sama saja.
• Sebaliknya, untuk X32, dapat diinterpretasikan bahwa peluang membeli mobil
konsumen pendapatan tinggi adalah 6,45 kali dibandingkan pendapatan rendah,
jika umur dan jenis kelaminnya sama.
• atau
43. Result and Discuss
Atau:
Di mana: exp atau ditulis “e” adalah fungsi exponen.
(Perlu diingat bahwa exponen merupakan kebalikan dari logaritma
natural. Sedangkan logaritma natural adalah bentuk logaritma namun
dengan nilai konstanta 2,71828182845904 atau biasa dibulatkan
menjadi 2,72).
44. Result and Discuss
• Dengan model persamaan di atas, tentunya akan sangat sulit untuk
menginterprestasikan koefisien regresinya.
• Oleh karena itu maka diperkenalkanlah istilah Odds Ratio atau yang biasa
disingkat Exp(B) atau OR.
• Exp(B) merupakan exponen dari koefisien regresi. Jadi misalkan nilai slope dari
regresi adalah sebesar 0,80, maka Exp(B) dapat diperkirakan sebagai berikut:
45.
46. Proses SPSS
LOGISTIC
- Analysis
- Regression
- Binary Logistic
- Dependent : Y
- Independent : X1, X2, X3….
- Khusus X3, karena datanya (1, 2, 3), maka:
- Categorical
- Klik X3
- Klik tanda panah samping "Categorical covarians"
- Pilih "Reference Category" dengan " "First"
- Klik "Change"
- Continue
- OK
B S.E. Wald df Sig. Exp(B
Variables in the Equation