SENINAR TESIS ANDHITA DESSY W.

Dhita Djilan
Dhita Djilanlecturer em STAIN Ponorogo
KLASIFIKASI POHON SEBAGAI METODE
 ALTERNATIF BAGI REGRESI LOGISTIK
 DALAM PENGKLASIFIKASIAN OBYEK
  (Studi Kasus : Program Wajib Belajar
       Pendidikan Dasar 9 Tahun)



                     ANDHITA DESSY WULANSARI
                            1307 201 705
PENDAHULUAN
LATAR BELAKANG
• Program Wajardikdas 9 tahun mewajibkan penduduk
  Indonesia mempunyai ijasah minimal SMP/sederajat
• Program ini dikatakan berhasil apabila tiap daerahnya
  mencapai kategori tuntas paripurna
• Untuk mendukung program pemerataan pendidikan di
  Kabupaten Gresik, diperlukan informasi tentang
  klasifikasi desa/kelurahan.
• Salah satu metode yang sering digunakan untuk
  pengklasifikasian obyek adalah regresi logistik.
• Klasifikasi pohon adalah metode alternatif untuk
  pengklasifikasian obyek.
• Pada penelitian ini, dibandingkan ketepatan klasifikasi
  antara kedua metode.
LATAR BELAKANG
Program WAJARDIKDAS 9 Tahun    Tidak Tuntas / Tuntas Paripurna




          Respon Biner




        Metode Klasifikasi              Klasifikasi Pohon



                                   Bidang Kesehatan :
      Regresi Logistik Biner       Camdeviren, et al. (2007)
                                   Kurt, et al. (2008)
TUJUAN PENELITIAN

•   Mendapatkan hasil perbandingan ketepatan klasifikasi
    yang dihasilkan oleh kedua metode.

•   Mendapatkan hasil analisa data dengan metode yang
    lebih tepat digunakan untuk mengklasifikasikan
    desa/kelurahan yang ada di Kabupaten Gresik pada
    kasus program Wajardikdas 9 tahun.
MANFAAT PENELITIAN

•   Dapat meningkatkan wawasan keilmuan yang
    berkaitan dengan penerapan metode regresi logistik
    dan klasifikasi pohon pada bidang pendidikan.

•   Dapat digunakan sebagai bahan masukan bagi
    pemerintah Kabupaten Gresik dalam menentukan
    kebijakan yang berkaitan dengan program gerakan
    nasional percepatan penuntasan Wajardikdas 9
    Tahun.
TINJAUAN PUSTAKA
REGRESI LOGISTIK BINER


• Digunakan jika variabel responnya berskala nominal dan
  terdiri 2 kategori (respon biner)
• Model regresi logistik dengan p variabel prediktor :



• Model logitnya :

  dimana,
REGRESI LOGISTIK BINER

PENGUJIAN PARAMETER

•   UJI OVERALL
    statistik uji :


    statistik uji G mengikuti distribusi   dengan derajat bebas p, tolak H0 jika


•   UJI INDIVIDU
    statistik uji :


    statistik uji W mengikuti distribusi normal, tolak H0 jika
KLASIFIKASI POHON


Klasifikasi pohon juga dikenal sebagai sebagai metode
pemilahan rekusif secara biner (binary recursive
partitioning), artinya sekelompok data yang terkumpul
dalam satu ruang yang disebut sebagai simpul (node)
dapat dipilah menjadi 2 simpul anak dan setiap simpul
anak dapat dipilah lagi menjadi 2 simpul anak, begitu
seterusnya dan akan berhenti jika sudah memenuhi
kriteria tertentu (Lewis, 2000).
KLASIFIKASI POHON

Adapun beberapa kelebihan metode klasifikasi pohon adalah :
•    Metode ini bersifat nonparametrik sehingga tidak memerlukan asumsi-
     asumsi yang mengikat bagi variabel prediktor.
•    Struktur datanya dapat dilihat secara visual sehingga dapat memudahkan
     pengambilan keputusan berdasarkan model pohon yang diperoleh.
•    Variabel yang paling berpengaruh terhadap variabel respon (variabel
     dominan) dapat diketahui dari sejumlah variabel prediktor yang dilibatkan.
•    Tidak hanya memberikan informasi tentang klasifikasi, tetapi juga
     probabilitas kesalahan pengklasifikasian.
•    Hasil klasifikasi akhir berbentuk sederhana dan dapat mengklasikan data
     baru secara efesien
•    Memudahkan interpretasi hasil.
KLASIFIKASI POHON

Kelemahan dari metode klasifikasi pohon adalah,

•   Proses penghitungan secara manual sangat sulit
    dilakukan sehingga memerlukan bantuan software
    khusus seperti CART (Classification and Regression
    Trees).

•   Tidak ada penetapan fungsi keheterogenan (metode
    pemilahan simpul), jumlah simpul anak minimal dan
    penduga yang digunakan.
KLASIFIKASI POHON
Model Pohon Klasifikasi :
KLASIFIKASI POHON

Pemilah-Pemilah
•    Fungsi Keheterogenan simpul


•     Proses pemilahan simpul
    –     Mencari semua kemungkinan pemilah pada variabel prediktor.
    –     Memilih pemilah terbaik dari masing-masing variabel prediktor.
          Pemilah terbaik adalah pemilah yang memaksimumkan ukuran
          kehomogenan masing-masing simpul anak relatif terhadap simpul
          induknya dan memaksimumkan ukuran pemisahan antara 2 simpul
          anak tersebut.
•     Kriteria Goodness of split
KLASIFIKASI POHON

Penentuan simpul terminal
   – Tidak terdapat penurunan keheterogenan yang
      berarti
   – Hanya terdapat satu satu pengamatan pada tiap
      simpul anak atau adanya batasan minimum n.
      Menurut Breiman, et. al., (1984), pengembangan
      pohon akan berhenti apabila pada simpul terdapat
      ni<5, ada juga yang membatasi pengembangan
      pohon dengan banyak obyek dalam simpul terminal
      ni<10.
   – Adanya batasan jumlah level atau tingkat
      kedalaman pohon, kemudian pohon berhenti.
KLASIFIKASI POHON


Penandaan label kelas
• Jika               maka label kelas
  untuk simpul terminal t adalah, jo
  yang memberikan nilai kesalahan
  pengklasifikasian pada simpul t paling
  kecil sebesar
KLASIFIKASI POHON


proses pembentukan pohon akan berhenti pada saat :

• Terdapat hanya satu pengamatan dalam tiap simpul
  anak atau adanya batasan minimum n
• Semua pengamatan dalam tiap simpul anak mempunyai
  variabel prediktor dengan distribusi yang sama atau
  identik sehingga tidak mungkin lagi terjadi pemilahan.
• Adanya batasan jumlah level atau tingkat kedalaman
  dalam pohon.
KLASIFIKASI POHON

• Untuk mendapatkan ukuran pohon yang layak ini, dapat
  dilakukan pemangkasan pohon dengan ukuran cost
  complexity minimum (Breiman, et. al., 1984).
•              dengan             dimana :
•     = Resubtitution estimate (penduga pengganti)
•     = Complexity parameter (biaya penambahan satu
        simpul pada pohon T)
•     = Complexity (banyaknya simpul terminal pada
        pohon T)
KLASIFIKASI POHON



Macam-macam penduga

• Resubtitution estimate
• Test sample estimate
• Cross validation v fold estimate
KLASIFIKASI POHON

• Resubtitution Estimate (penduga pengganti)
  adalah proporsi amatan yang mengalami kesalahan
  pengklasifikasian yaitu :


  dimana X(.) adalah fungsi indikator berbentuk,


  Jika R(T) dipilih sebagai penduga terbaik, maka akan
  cenderung dipilih pohon ukuran terbesar, sebab semakin
  besar pohon akan semakin kecil R(T)
KLASIFIKASI POHON

    Dua macam penduga yang dapat digunakan untuk mendapatkan pohon
    klasifikasi optimal (terbaik) adalah :

•   Penduga Sampel Uji (Test Sample Estimate)
    Sampel L dibagi menjadi dua yaitu L1 (Learning set) dan L2 (Testing set).
    Amatan dalam L1 digunakan untuk membentuk pohon T, sedangkan
    amatan-amatan dalam L2 digunakan untuk menduga . Jika N2 adalah
    jumlah amatan dalam L2, maka penduga sampel uji adalah :



    Pohon klasifikasi optimum dipilih T* dengan
KLASIFIKASI POHON

•   penduga validasi silang lipat V (cross validation V fold estimate)
    Amatan dalam sampel L dibagi secara acak menjadi V bagian yang
    saling lepas dengan ukuran kurang lebih sama besar untuk setiap
    kelasnya. Pohon T(v) dibentuk dari L-Lv dengan v=1,2,…V. Misalkan d(x)
    (v) adalah hasil pengklasifikasian, penduga sampel uji untuk R(Tt(v))
    adalah :


    dimana Nv adalah jumlah amatan dalam Lv
    Kemudian dilakukan prosedur yang sama menggunakan seluruh L, maka
    penduga validasi silang lipat V untuk Tt adalah,



    Pohon klasifikasi optimal dipilih T* dengan
ANGKA PARTISIPASI KASAR
             (APK)


• APK adalah perbandingan antara
  jumlah siswa pada jenjang
  pendidikan tertentu dengan jumlah
  penduduk usia yang sesuai dan
  dinyatakan dalam prosentase.
ANGKA PARTISIPASI KASAR
               (APK)

  Dalam perhitungan angka partisipasi terdapat empat
  kategori ketuntasan yaitu :

 Tuntas Paripurna :
  nilai APK sekurang-kurangnya 95%
 Tuntas Utama :
  nilai APK antara 90% sampai dengan <94%
 Tuntas Madya :
  nilai APK antara 84% sampai dengan <90%
 Tuntas Pratama :
  nilai APK antara 80% sampai dengan <84%
METODOLOGI PENELITIAN
SUMBER DATA


• Data yang digunakan dalam
  penelitian ini adalah data sekunder,
  yaitu data statistik SMP/Sederajat
  untuk desa/kelurahan tahun
  2006/2007 yang berasal dari Cabang
  Dinas P&K dan kecamatan yang ada
  di Kabupaten Gresik.
VARIABEL PENELITIAN

–   Rasio Murid / Sekolah (MS)
–   Rasio Murid / Guru (MG)
–   Rasio Murid / Kelas (MK)
–   Rasio Kelas / Ruang Belajar (KB)
–   Angka lulusan (AL)
–   Angka Murid Mengulang (AM)
–   Angka Putus Sekolah (APS)
–   Kategori APK yang dicapai oleh desa/kelurahan di
    Kabupaten Gresik
METODE PENELITIAN
Adapun langkah-langkah pada analisa data adalah sebagai berikut :
•        Mendapatkan hasil ketepatan klasifikasi dari masing-masing metode baik itu regresi logistik maupun
         klasifikasi pohon.
     –          Membagi data menjadi 2 bagian secara random yaitu data learning (data yang digunakan dalam dalam
                pembentukan model) dan data testing (data yang digunakan dalam validasi model).
     –          Menghitung ketepatan klasifikasi dengan menggunakan data learning dan data testing
     –          Melakukan evaluasi klasifikasi data learning dan data testing
•        Mendapatkan metode yang lebih tepat digunakan untuk mengklasifikasikan kelurahan yang ada di
         Kabupaten Gresik.
     –          Membandingkan ketepatan klasifikasi antara kedua metode berdasarkan data testing
     –          Menggunakan metode yang mempunyai ketepatan klasifikasi lebih tinggi untuk mengklasifikasikan
                desa/kelurahan di Kabupaten Gresik.
     Apabila metode yang mempunyai ketepatan klasifikasi lebih tinggi adalah metode regresi logistik, maka analisa
                data akan dilanjutkan dengan langkah-langkah sebagai berikut :
     –          Membuat model regresi logistik multivariabel antara variabel respon dengan variabel prediktor
                kemudian dilakukan pengujian secara overall dan individu terhadap model yang diperoleh.
     –          Menginterpretasi model regresi logistik yang diperoleh.
     –          Mendapatkan faktor yang menyebabkan adanya perbedaan jenis ketuntasan Wajardikdas 9 tahun di
                Kabupaten Gresik.
     Apabila metode yang mempunyai ketepatan klasifikasi lebih tinggi adalah metode klasifikasi pohon, maka
                langkah-langkahnya adalah :
      –       Melakukan pembentukan pohon klasifikasi maksimal dengan menggunakan data learning.
      –       Menentukan model pohon klasifikasi terbaik (optimal) dengan cara memangkas (prunning) pohon klasifikasi maksimal
              berdasarkan ukuran cost complexity minimum.
      –       Menginterpretasi model pohon klasifikasi optimal yang diperoleh.
      –       Mendapatkan faktor yang menyebabkan adanya perbedaan jenis ketuntasan Wajardikdas 9 tahun di Kabupaten Gresik.
HASIL DAN PEMBAHASAN


• Pie chart untuk kategori APK
HASIL DAN PEMBAHASAN

• Perbandingan ketepatan klasifikasi
HASIL DAN PEMBAHASAN


• Topology pohon klasifikasi maksimal
HASIL DAN PEMBAHASAN

• Misklasifikasi data learning pada
  pohon klasifikasi maksimal



• Misklasifikasi data testing pada pohon
  klasifikasi maksimal
HASIL DAN PEMBAHASAN

• Plot relative cost dengan jumlah
  simpul terminal
HASIL DAN PEMBAHASAN

• Pohon klasifikasi optimal
HASIL DAN PEMBAHASAN

• Prediksi Sukses untuk data learning
  pada pohon optimal



• Prediksi Sukses untuk data testing
  pada pohon optimal
KESIMPULAN

Berdasarkan hasil penelitian dan pembahasan pada Bab 4 maka didapatkan
   kesimpulan sebagai berikut :
• Ketepatan klasifikasi yang dihasilkan melalui analisa data dengan metode
   regresi logistik dan klasifikasi pohon untuk pengklasifikasian desa/kelurahan
   di kabupaten Gresik pada program Wajardikdas 9 tahun mempunyai nilai
   yang cukup berbeda, terutama untuk data testing. Pada kondisi pembagian
   data learning 95% dan data testing 5%, untuk metode regresi logistik
   ketepatan klasifikasi dari data learning-nya adalah 60.58% dan testing-nya
   adalah 42.86% sedangkan untuk metode klasifikasi pohon ketepatan
   klasifikasi data learning-nya adalah 62.04% dan testing-nya adalah 71.43%.
• Metode yang lebih tepat dipergunakan untuk pengklasifikasian
   desa/kelurahan di kabupaten Gresik pada program Wajardikdas 9 tahun
   adalah klasifikasi pohon dengan data learning 95% dan testing 5%, karena
   nilai ketepatan klasifikasi yang dihasilkan lebih besar khususnya untuk data
   testing. Dari metode ini didapatkan variabel yang berpengaruh terhadap
   kondisi kentuntasan Wajardikdas 9 tahun adalah variabel rasio murid/guru
   dan rasio murid/sekolah.
TERIMA KASIH
MOHON KRITIK
 DAN SARAN
1 de 37

Recomendados

Aev.pend6 por
Aev.pend6Aev.pend6
Aev.pend6Mas Ragil
687 visualizações32 slides
Infopublik20120703102611 por
Infopublik20120703102611Infopublik20120703102611
Infopublik20120703102611Raafi Raafi
1.5K visualizações34 slides
Klasifikasi Data.pptx por
Klasifikasi Data.pptxKlasifikasi Data.pptx
Klasifikasi Data.pptxErlangga Putra
15 visualizações18 slides
PPT KEL 3 DAI - 007.pptx por
PPT KEL 3 DAI - 007.pptxPPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptxStevenAdiSantoso
7 visualizações25 slides
Cara analisis data por
Cara analisis dataCara analisis data
Cara analisis datamohdkhamdani
193.3K visualizações32 slides
PPT-UEU-PSD315-Pertemuan4.ppt por
PPT-UEU-PSD315-Pertemuan4.pptPPT-UEU-PSD315-Pertemuan4.ppt
PPT-UEU-PSD315-Pertemuan4.pptmaassalamiyah1
2 visualizações28 slides

Mais conteúdo relacionado

Similar a SENINAR TESIS ANDHITA DESSY W.

Coba ahp (2) por
Coba ahp (2)Coba ahp (2)
Coba ahp (2)Ginanjar471
301 visualizações29 slides
Supervised and Unsupervised Classifications por
Supervised and Unsupervised ClassificationsSupervised and Unsupervised Classifications
Supervised and Unsupervised ClassificationsLuhur Moekti Prayogo
197 visualizações17 slides
Pengembangan-Instrumen-UNJ.ppt por
Pengembangan-Instrumen-UNJ.pptPengembangan-Instrumen-UNJ.ppt
Pengembangan-Instrumen-UNJ.pptRiskySetiawan19
4 visualizações26 slides
8. Analisis Butir Soal CTT.pptx por
8. Analisis Butir Soal CTT.pptx8. Analisis Butir Soal CTT.pptx
8. Analisis Butir Soal CTT.pptxMiyamizu1
28 visualizações35 slides
Pengembangan-Instrumen-UNJ.ppt por
Pengembangan-Instrumen-UNJ.pptPengembangan-Instrumen-UNJ.ppt
Pengembangan-Instrumen-UNJ.pptmochrizkyarrasyid
44 visualizações26 slides
Klasifikasi Data Mining.pptx por
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxAdam Superman
225 visualizações62 slides

Similar a SENINAR TESIS ANDHITA DESSY W.(20)

Coba ahp (2) por Ginanjar471
Coba ahp (2)Coba ahp (2)
Coba ahp (2)
Ginanjar471301 visualizações
Supervised and Unsupervised Classifications por Luhur Moekti Prayogo
Supervised and Unsupervised ClassificationsSupervised and Unsupervised Classifications
Supervised and Unsupervised Classifications
Luhur Moekti Prayogo197 visualizações
Pengembangan-Instrumen-UNJ.ppt por RiskySetiawan19
Pengembangan-Instrumen-UNJ.pptPengembangan-Instrumen-UNJ.ppt
Pengembangan-Instrumen-UNJ.ppt
RiskySetiawan194 visualizações
8. Analisis Butir Soal CTT.pptx por Miyamizu1
8. Analisis Butir Soal CTT.pptx8. Analisis Butir Soal CTT.pptx
8. Analisis Butir Soal CTT.pptx
Miyamizu128 visualizações
Pengembangan-Instrumen-UNJ.ppt por mochrizkyarrasyid
Pengembangan-Instrumen-UNJ.pptPengembangan-Instrumen-UNJ.ppt
Pengembangan-Instrumen-UNJ.ppt
mochrizkyarrasyid44 visualizações
Klasifikasi Data Mining.pptx por Adam Superman
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptx
Adam Superman225 visualizações
12 pengantar teori klasik por Agus Suratno
12 pengantar teori klasik12 pengantar teori klasik
12 pengantar teori klasik
Agus Suratno6.1K visualizações
Cara pemakaian weka por Nurdin Sumantri
Cara pemakaian wekaCara pemakaian weka
Cara pemakaian weka
Nurdin Sumantri9.8K visualizações
Ukuran penyebaran data por Annisa Yaumadina
Ukuran penyebaran dataUkuran penyebaran data
Ukuran penyebaran data
Annisa Yaumadina526 visualizações
Evaluasi-Pembelajaran-Di-SD-Modul-4.pptx por SDNSARENG02
Evaluasi-Pembelajaran-Di-SD-Modul-4.pptxEvaluasi-Pembelajaran-Di-SD-Modul-4.pptx
Evaluasi-Pembelajaran-Di-SD-Modul-4.pptx
SDNSARENG025 visualizações
Statistik 1 1 intro & dist frek por Selvin Hadi
Statistik 1 1 intro & dist frekStatistik 1 1 intro & dist frek
Statistik 1 1 intro & dist frek
Selvin Hadi2.3K visualizações
Analisis data dan interpretasi 2 por Aiman Safwan Bakkeri
Analisis data dan interpretasi 2Analisis data dan interpretasi 2
Analisis data dan interpretasi 2
Aiman Safwan Bakkeri746 visualizações
04-cara-pemakaian-weka.ppt por Putrifitriasari1
04-cara-pemakaian-weka.ppt04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt
Putrifitriasari12 visualizações
Tutorial WEKA.ppt por JurnalJTIM
Tutorial WEKA.pptTutorial WEKA.ppt
Tutorial WEKA.ppt
JurnalJTIM8 visualizações
Ppt proposal por Putri Sasmadiyani
Ppt proposal Ppt proposal
Ppt proposal
Putri Sasmadiyani21 visualizações
Jurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-means por ym.ygrex@comp
Jurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-meansJurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-means
Jurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-means
ym.ygrex@comp227 visualizações
clustering por dewi2093
clusteringclustering
clustering
dewi2093771 visualizações
Kriteria Ketercapaian Tujuan Pembelajaran.pdf por NurainiAini13
Kriteria Ketercapaian Tujuan Pembelajaran.pdfKriteria Ketercapaian Tujuan Pembelajaran.pdf
Kriteria Ketercapaian Tujuan Pembelajaran.pdf
NurainiAini13488 visualizações

Último

PPT PENKOM ALVIN.pptx por
PPT PENKOM ALVIN.pptxPPT PENKOM ALVIN.pptx
PPT PENKOM ALVIN.pptxAlfin61471
16 visualizações9 slides
Tugas PPT 6_Fahmi Muzakkii_E1G022105.pptx por
Tugas PPT 6_Fahmi Muzakkii_E1G022105.pptxTugas PPT 6_Fahmi Muzakkii_E1G022105.pptx
Tugas PPT 6_Fahmi Muzakkii_E1G022105.pptxFahmiMuzakkii
9 visualizações9 slides
SAS SENI TARI.docx por
SAS SENI TARI.docxSAS SENI TARI.docx
SAS SENI TARI.docxHERMAN511894
7 visualizações4 slides
Kel.10-PBA.pdf por
Kel.10-PBA.pdfKel.10-PBA.pdf
Kel.10-PBA.pdfYanDiyant
12 visualizações16 slides
Latihan 6_ Aldy 085.pptx por
Latihan 6_ Aldy 085.pptxLatihan 6_ Aldy 085.pptx
Latihan 6_ Aldy 085.pptxjustneptun
14 visualizações6 slides
Kepemimpinan Pramuka por
Kepemimpinan Pramuka Kepemimpinan Pramuka
Kepemimpinan Pramuka Kafe Buku Pak Aw
14 visualizações23 slides

Último(20)

PPT PENKOM ALVIN.pptx por Alfin61471
PPT PENKOM ALVIN.pptxPPT PENKOM ALVIN.pptx
PPT PENKOM ALVIN.pptx
Alfin6147116 visualizações
Tugas PPT 6_Fahmi Muzakkii_E1G022105.pptx por FahmiMuzakkii
Tugas PPT 6_Fahmi Muzakkii_E1G022105.pptxTugas PPT 6_Fahmi Muzakkii_E1G022105.pptx
Tugas PPT 6_Fahmi Muzakkii_E1G022105.pptx
FahmiMuzakkii9 visualizações
SAS SENI TARI.docx por HERMAN511894
SAS SENI TARI.docxSAS SENI TARI.docx
SAS SENI TARI.docx
HERMAN5118947 visualizações
Kel.10-PBA.pdf por YanDiyant
Kel.10-PBA.pdfKel.10-PBA.pdf
Kel.10-PBA.pdf
YanDiyant12 visualizações
Latihan 6_ Aldy 085.pptx por justneptun
Latihan 6_ Aldy 085.pptxLatihan 6_ Aldy 085.pptx
Latihan 6_ Aldy 085.pptx
justneptun14 visualizações
Kepemimpinan Pramuka por Kafe Buku Pak Aw
Kepemimpinan Pramuka Kepemimpinan Pramuka
Kepemimpinan Pramuka
Kafe Buku Pak Aw14 visualizações
Latihan 6 PPT_Dwi Maulidini _E1G022094.pptx por rdsnfgzhgj
Latihan 6 PPT_Dwi Maulidini _E1G022094.pptxLatihan 6 PPT_Dwi Maulidini _E1G022094.pptx
Latihan 6 PPT_Dwi Maulidini _E1G022094.pptx
rdsnfgzhgj10 visualizações
PAS Mtk Kls 7,8,9 Ganjil 2023.pdf por ssuser29a952
PAS Mtk Kls 7,8,9 Ganjil 2023.pdfPAS Mtk Kls 7,8,9 Ganjil 2023.pdf
PAS Mtk Kls 7,8,9 Ganjil 2023.pdf
ssuser29a952160 visualizações
Tugas PPT 6_Selviana Fitri_E1G022081.pptx por selvianafitri2k17
Tugas PPT 6_Selviana Fitri_E1G022081.pptxTugas PPT 6_Selviana Fitri_E1G022081.pptx
Tugas PPT 6_Selviana Fitri_E1G022081.pptx
selvianafitri2k1711 visualizações
Permendikbudristek Nomor 30 Tahun 2021.pdf por Irawan Setyabudi
Permendikbudristek Nomor 30 Tahun 2021.pdfPermendikbudristek Nomor 30 Tahun 2021.pdf
Permendikbudristek Nomor 30 Tahun 2021.pdf
Irawan Setyabudi41 visualizações
PPT PENGEMBANGAN KEWIRAUSAHAAN SEKOLAH.pptx por WartoyoWartoyo3
PPT PENGEMBANGAN KEWIRAUSAHAAN SEKOLAH.pptxPPT PENGEMBANGAN KEWIRAUSAHAAN SEKOLAH.pptx
PPT PENGEMBANGAN KEWIRAUSAHAAN SEKOLAH.pptx
WartoyoWartoyo38 visualizações
1. Sang Surya por agreenlife5
1. Sang Surya1. Sang Surya
1. Sang Surya
agreenlife58 visualizações
SOAL PAI UJIAN AKHIR SEKOLAH9.docx por rahman abdika
SOAL PAI UJIAN AKHIR SEKOLAH9.docxSOAL PAI UJIAN AKHIR SEKOLAH9.docx
SOAL PAI UJIAN AKHIR SEKOLAH9.docx
rahman abdika7 visualizações
Bimtek Pencegahan Kekerasan dalam Rumah Tangga.pdf por Irawan Setyabudi
Bimtek Pencegahan Kekerasan dalam Rumah Tangga.pdfBimtek Pencegahan Kekerasan dalam Rumah Tangga.pdf
Bimtek Pencegahan Kekerasan dalam Rumah Tangga.pdf
Irawan Setyabudi38 visualizações
LEMBAGA JASA KEUANGAN.pptx por DelviaAndrini1
LEMBAGA JASA KEUANGAN.pptxLEMBAGA JASA KEUANGAN.pptx
LEMBAGA JASA KEUANGAN.pptx
DelviaAndrini141 visualizações
SK Satgas PPKS.pdf por Irawan Setyabudi
SK Satgas PPKS.pdfSK Satgas PPKS.pdf
SK Satgas PPKS.pdf
Irawan Setyabudi53 visualizações
Link2 MATERI & RENCANA Training _"Effective LEADERSHIP"di OMAZAKI BSD City - ... por Kanaidi ken
Link2 MATERI & RENCANA Training _"Effective LEADERSHIP"di OMAZAKI BSD City - ...Link2 MATERI & RENCANA Training _"Effective LEADERSHIP"di OMAZAKI BSD City - ...
Link2 MATERI & RENCANA Training _"Effective LEADERSHIP"di OMAZAKI BSD City - ...
Kanaidi ken27 visualizações
Leadership Communication Skills _Training "Effective Leadership and Superviso... por Kanaidi ken
Leadership Communication Skills _Training "Effective Leadership and Superviso...Leadership Communication Skills _Training "Effective Leadership and Superviso...
Leadership Communication Skills _Training "Effective Leadership and Superviso...
Kanaidi ken7 visualizações
Bimtek Paralegal.pdf por Irawan Setyabudi
Bimtek Paralegal.pdfBimtek Paralegal.pdf
Bimtek Paralegal.pdf
Irawan Setyabudi36 visualizações
Panduan Praktikum Administrasi Sistem Jaringan Edisi 2 por I Putu Hariyadi
Panduan Praktikum Administrasi Sistem Jaringan Edisi 2Panduan Praktikum Administrasi Sistem Jaringan Edisi 2
Panduan Praktikum Administrasi Sistem Jaringan Edisi 2
I Putu Hariyadi27 visualizações

SENINAR TESIS ANDHITA DESSY W.

  • 1. KLASIFIKASI POHON SEBAGAI METODE ALTERNATIF BAGI REGRESI LOGISTIK DALAM PENGKLASIFIKASIAN OBYEK (Studi Kasus : Program Wajib Belajar Pendidikan Dasar 9 Tahun) ANDHITA DESSY WULANSARI 1307 201 705
  • 3. LATAR BELAKANG • Program Wajardikdas 9 tahun mewajibkan penduduk Indonesia mempunyai ijasah minimal SMP/sederajat • Program ini dikatakan berhasil apabila tiap daerahnya mencapai kategori tuntas paripurna • Untuk mendukung program pemerataan pendidikan di Kabupaten Gresik, diperlukan informasi tentang klasifikasi desa/kelurahan. • Salah satu metode yang sering digunakan untuk pengklasifikasian obyek adalah regresi logistik. • Klasifikasi pohon adalah metode alternatif untuk pengklasifikasian obyek. • Pada penelitian ini, dibandingkan ketepatan klasifikasi antara kedua metode.
  • 4. LATAR BELAKANG Program WAJARDIKDAS 9 Tahun Tidak Tuntas / Tuntas Paripurna Respon Biner Metode Klasifikasi Klasifikasi Pohon Bidang Kesehatan : Regresi Logistik Biner Camdeviren, et al. (2007) Kurt, et al. (2008)
  • 5. TUJUAN PENELITIAN • Mendapatkan hasil perbandingan ketepatan klasifikasi yang dihasilkan oleh kedua metode. • Mendapatkan hasil analisa data dengan metode yang lebih tepat digunakan untuk mengklasifikasikan desa/kelurahan yang ada di Kabupaten Gresik pada kasus program Wajardikdas 9 tahun.
  • 6. MANFAAT PENELITIAN • Dapat meningkatkan wawasan keilmuan yang berkaitan dengan penerapan metode regresi logistik dan klasifikasi pohon pada bidang pendidikan. • Dapat digunakan sebagai bahan masukan bagi pemerintah Kabupaten Gresik dalam menentukan kebijakan yang berkaitan dengan program gerakan nasional percepatan penuntasan Wajardikdas 9 Tahun.
  • 8. REGRESI LOGISTIK BINER • Digunakan jika variabel responnya berskala nominal dan terdiri 2 kategori (respon biner) • Model regresi logistik dengan p variabel prediktor : • Model logitnya : dimana,
  • 9. REGRESI LOGISTIK BINER PENGUJIAN PARAMETER • UJI OVERALL statistik uji : statistik uji G mengikuti distribusi dengan derajat bebas p, tolak H0 jika • UJI INDIVIDU statistik uji : statistik uji W mengikuti distribusi normal, tolak H0 jika
  • 10. KLASIFIKASI POHON Klasifikasi pohon juga dikenal sebagai sebagai metode pemilahan rekusif secara biner (binary recursive partitioning), artinya sekelompok data yang terkumpul dalam satu ruang yang disebut sebagai simpul (node) dapat dipilah menjadi 2 simpul anak dan setiap simpul anak dapat dipilah lagi menjadi 2 simpul anak, begitu seterusnya dan akan berhenti jika sudah memenuhi kriteria tertentu (Lewis, 2000).
  • 11. KLASIFIKASI POHON Adapun beberapa kelebihan metode klasifikasi pohon adalah : • Metode ini bersifat nonparametrik sehingga tidak memerlukan asumsi- asumsi yang mengikat bagi variabel prediktor. • Struktur datanya dapat dilihat secara visual sehingga dapat memudahkan pengambilan keputusan berdasarkan model pohon yang diperoleh. • Variabel yang paling berpengaruh terhadap variabel respon (variabel dominan) dapat diketahui dari sejumlah variabel prediktor yang dilibatkan. • Tidak hanya memberikan informasi tentang klasifikasi, tetapi juga probabilitas kesalahan pengklasifikasian. • Hasil klasifikasi akhir berbentuk sederhana dan dapat mengklasikan data baru secara efesien • Memudahkan interpretasi hasil.
  • 12. KLASIFIKASI POHON Kelemahan dari metode klasifikasi pohon adalah, • Proses penghitungan secara manual sangat sulit dilakukan sehingga memerlukan bantuan software khusus seperti CART (Classification and Regression Trees). • Tidak ada penetapan fungsi keheterogenan (metode pemilahan simpul), jumlah simpul anak minimal dan penduga yang digunakan.
  • 14. KLASIFIKASI POHON Pemilah-Pemilah • Fungsi Keheterogenan simpul • Proses pemilahan simpul – Mencari semua kemungkinan pemilah pada variabel prediktor. – Memilih pemilah terbaik dari masing-masing variabel prediktor. Pemilah terbaik adalah pemilah yang memaksimumkan ukuran kehomogenan masing-masing simpul anak relatif terhadap simpul induknya dan memaksimumkan ukuran pemisahan antara 2 simpul anak tersebut. • Kriteria Goodness of split
  • 15. KLASIFIKASI POHON Penentuan simpul terminal – Tidak terdapat penurunan keheterogenan yang berarti – Hanya terdapat satu satu pengamatan pada tiap simpul anak atau adanya batasan minimum n. Menurut Breiman, et. al., (1984), pengembangan pohon akan berhenti apabila pada simpul terdapat ni<5, ada juga yang membatasi pengembangan pohon dengan banyak obyek dalam simpul terminal ni<10. – Adanya batasan jumlah level atau tingkat kedalaman pohon, kemudian pohon berhenti.
  • 16. KLASIFIKASI POHON Penandaan label kelas • Jika maka label kelas untuk simpul terminal t adalah, jo yang memberikan nilai kesalahan pengklasifikasian pada simpul t paling kecil sebesar
  • 17. KLASIFIKASI POHON proses pembentukan pohon akan berhenti pada saat : • Terdapat hanya satu pengamatan dalam tiap simpul anak atau adanya batasan minimum n • Semua pengamatan dalam tiap simpul anak mempunyai variabel prediktor dengan distribusi yang sama atau identik sehingga tidak mungkin lagi terjadi pemilahan. • Adanya batasan jumlah level atau tingkat kedalaman dalam pohon.
  • 18. KLASIFIKASI POHON • Untuk mendapatkan ukuran pohon yang layak ini, dapat dilakukan pemangkasan pohon dengan ukuran cost complexity minimum (Breiman, et. al., 1984). • dengan dimana : • = Resubtitution estimate (penduga pengganti) • = Complexity parameter (biaya penambahan satu simpul pada pohon T) • = Complexity (banyaknya simpul terminal pada pohon T)
  • 19. KLASIFIKASI POHON Macam-macam penduga • Resubtitution estimate • Test sample estimate • Cross validation v fold estimate
  • 20. KLASIFIKASI POHON • Resubtitution Estimate (penduga pengganti) adalah proporsi amatan yang mengalami kesalahan pengklasifikasian yaitu : dimana X(.) adalah fungsi indikator berbentuk, Jika R(T) dipilih sebagai penduga terbaik, maka akan cenderung dipilih pohon ukuran terbesar, sebab semakin besar pohon akan semakin kecil R(T)
  • 21. KLASIFIKASI POHON Dua macam penduga yang dapat digunakan untuk mendapatkan pohon klasifikasi optimal (terbaik) adalah : • Penduga Sampel Uji (Test Sample Estimate) Sampel L dibagi menjadi dua yaitu L1 (Learning set) dan L2 (Testing set). Amatan dalam L1 digunakan untuk membentuk pohon T, sedangkan amatan-amatan dalam L2 digunakan untuk menduga . Jika N2 adalah jumlah amatan dalam L2, maka penduga sampel uji adalah : Pohon klasifikasi optimum dipilih T* dengan
  • 22. KLASIFIKASI POHON • penduga validasi silang lipat V (cross validation V fold estimate) Amatan dalam sampel L dibagi secara acak menjadi V bagian yang saling lepas dengan ukuran kurang lebih sama besar untuk setiap kelasnya. Pohon T(v) dibentuk dari L-Lv dengan v=1,2,…V. Misalkan d(x) (v) adalah hasil pengklasifikasian, penduga sampel uji untuk R(Tt(v)) adalah : dimana Nv adalah jumlah amatan dalam Lv Kemudian dilakukan prosedur yang sama menggunakan seluruh L, maka penduga validasi silang lipat V untuk Tt adalah, Pohon klasifikasi optimal dipilih T* dengan
  • 23. ANGKA PARTISIPASI KASAR (APK) • APK adalah perbandingan antara jumlah siswa pada jenjang pendidikan tertentu dengan jumlah penduduk usia yang sesuai dan dinyatakan dalam prosentase.
  • 24. ANGKA PARTISIPASI KASAR (APK) Dalam perhitungan angka partisipasi terdapat empat kategori ketuntasan yaitu :  Tuntas Paripurna : nilai APK sekurang-kurangnya 95%  Tuntas Utama : nilai APK antara 90% sampai dengan <94%  Tuntas Madya : nilai APK antara 84% sampai dengan <90%  Tuntas Pratama : nilai APK antara 80% sampai dengan <84%
  • 26. SUMBER DATA • Data yang digunakan dalam penelitian ini adalah data sekunder, yaitu data statistik SMP/Sederajat untuk desa/kelurahan tahun 2006/2007 yang berasal dari Cabang Dinas P&K dan kecamatan yang ada di Kabupaten Gresik.
  • 27. VARIABEL PENELITIAN – Rasio Murid / Sekolah (MS) – Rasio Murid / Guru (MG) – Rasio Murid / Kelas (MK) – Rasio Kelas / Ruang Belajar (KB) – Angka lulusan (AL) – Angka Murid Mengulang (AM) – Angka Putus Sekolah (APS) – Kategori APK yang dicapai oleh desa/kelurahan di Kabupaten Gresik
  • 28. METODE PENELITIAN Adapun langkah-langkah pada analisa data adalah sebagai berikut : • Mendapatkan hasil ketepatan klasifikasi dari masing-masing metode baik itu regresi logistik maupun klasifikasi pohon. – Membagi data menjadi 2 bagian secara random yaitu data learning (data yang digunakan dalam dalam pembentukan model) dan data testing (data yang digunakan dalam validasi model). – Menghitung ketepatan klasifikasi dengan menggunakan data learning dan data testing – Melakukan evaluasi klasifikasi data learning dan data testing • Mendapatkan metode yang lebih tepat digunakan untuk mengklasifikasikan kelurahan yang ada di Kabupaten Gresik. – Membandingkan ketepatan klasifikasi antara kedua metode berdasarkan data testing – Menggunakan metode yang mempunyai ketepatan klasifikasi lebih tinggi untuk mengklasifikasikan desa/kelurahan di Kabupaten Gresik. Apabila metode yang mempunyai ketepatan klasifikasi lebih tinggi adalah metode regresi logistik, maka analisa data akan dilanjutkan dengan langkah-langkah sebagai berikut : – Membuat model regresi logistik multivariabel antara variabel respon dengan variabel prediktor kemudian dilakukan pengujian secara overall dan individu terhadap model yang diperoleh. – Menginterpretasi model regresi logistik yang diperoleh. – Mendapatkan faktor yang menyebabkan adanya perbedaan jenis ketuntasan Wajardikdas 9 tahun di Kabupaten Gresik. Apabila metode yang mempunyai ketepatan klasifikasi lebih tinggi adalah metode klasifikasi pohon, maka langkah-langkahnya adalah : – Melakukan pembentukan pohon klasifikasi maksimal dengan menggunakan data learning. – Menentukan model pohon klasifikasi terbaik (optimal) dengan cara memangkas (prunning) pohon klasifikasi maksimal berdasarkan ukuran cost complexity minimum. – Menginterpretasi model pohon klasifikasi optimal yang diperoleh. – Mendapatkan faktor yang menyebabkan adanya perbedaan jenis ketuntasan Wajardikdas 9 tahun di Kabupaten Gresik.
  • 29. HASIL DAN PEMBAHASAN • Pie chart untuk kategori APK
  • 30. HASIL DAN PEMBAHASAN • Perbandingan ketepatan klasifikasi
  • 31. HASIL DAN PEMBAHASAN • Topology pohon klasifikasi maksimal
  • 32. HASIL DAN PEMBAHASAN • Misklasifikasi data learning pada pohon klasifikasi maksimal • Misklasifikasi data testing pada pohon klasifikasi maksimal
  • 33. HASIL DAN PEMBAHASAN • Plot relative cost dengan jumlah simpul terminal
  • 34. HASIL DAN PEMBAHASAN • Pohon klasifikasi optimal
  • 35. HASIL DAN PEMBAHASAN • Prediksi Sukses untuk data learning pada pohon optimal • Prediksi Sukses untuk data testing pada pohon optimal
  • 36. KESIMPULAN Berdasarkan hasil penelitian dan pembahasan pada Bab 4 maka didapatkan kesimpulan sebagai berikut : • Ketepatan klasifikasi yang dihasilkan melalui analisa data dengan metode regresi logistik dan klasifikasi pohon untuk pengklasifikasian desa/kelurahan di kabupaten Gresik pada program Wajardikdas 9 tahun mempunyai nilai yang cukup berbeda, terutama untuk data testing. Pada kondisi pembagian data learning 95% dan data testing 5%, untuk metode regresi logistik ketepatan klasifikasi dari data learning-nya adalah 60.58% dan testing-nya adalah 42.86% sedangkan untuk metode klasifikasi pohon ketepatan klasifikasi data learning-nya adalah 62.04% dan testing-nya adalah 71.43%. • Metode yang lebih tepat dipergunakan untuk pengklasifikasian desa/kelurahan di kabupaten Gresik pada program Wajardikdas 9 tahun adalah klasifikasi pohon dengan data learning 95% dan testing 5%, karena nilai ketepatan klasifikasi yang dihasilkan lebih besar khususnya untuk data testing. Dari metode ini didapatkan variabel yang berpengaruh terhadap kondisi kentuntasan Wajardikdas 9 tahun adalah variabel rasio murid/guru dan rasio murid/sekolah.