Konsep data mining

Basiroh M.Kom
Basiroh M.KomPh.D Hunter em Self-employed
KONSEP DATA
MINING
( Pohon Keputusan )
Basiroh, S.Kom, M.Kom
DECISIONTREE (POHON
KEPUTUSAN)
■ Peranan pohon Keputusan
yaitu sebagai alat bantu dalam mengambil keputusan (decision support tool) telah
dikembangkan oleh manusia sejak perkembangan teori pohon yang dilandaskan pada
teori graf.
Kegunaan pohon keputusan yang sangat banyak ini membuatnya telah dimanfaatkan
oleh manusia dalam berbagai macam sistem pengambilan keputusan.
Pengertian Pohon Keputusan
■ Pengertian Pohon Keputusan
■ Pohon dalam analisis pemecahan masalah pengambilan keputusan adalah pemetaan
mengenai alternatif-alternatif pemecahan masalah yang dapat diambil dari masalah
tersebut.
■ Pohon tersebut juga memperlihatkan faktor-faktor kemungkinan/probablitas yang
akan mempengaruhi alternatifalternatif keputusan tersebut, disertai dengan estimasi
hasil akhir yang akan didapat bila kita mengambil alternatif keputusan tersebut.
Manfaat Pohon Keputusan
■ Manfaat utama dari penggunaan pohon keputusan adalah
■ kemampuannya untuk mem-break down proses pengambilan keputusan yang
kompleks menjadi lebih simpel sehingga pengambil keputusan akan lebih
menginterpretasikan solusi dari permasalahan.
■ Pohon Keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan
tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target.
■ Pohon keputusan memadukan antara eksplorasi data dan pemodelan, sehingga
sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan
sebagai model akhir dari beberapa teknik lain.
Kelebihan Pohon Keputusan
■ Kelebihan dari metode pohon keputusan adalah:
■ Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat global, dapat diubah menjadi
lebih simpel dan spesifik.
■ liminasi perhitungan-perhitungan yang tidak diperlukan, karena ketika menggunakan metode pohon
keputusan maka sample diuji hanya berdasarkan kriteria atau kelas tertentu.
■ Fleksibel untuk memilih fitur dari internal node yang berbeda, fitur yang terpilih akan membedakan
suatu kriteria dibandingkan kriteria yang lain dalam node yang sama.
■ Kefleksibelan metode pohon keputusan ini meningkatkan kualitas keputusan yang dihasilkan jika
dibandingkan ketika menggunakan metode penghitungan satu tahap yang lebih konvensional.
■ Dalam analisis multivariat, dengan kriteria dan kelas yang jumlahnya sangat banyak, seorang penguji
biasanya perlu untuk mengestimasikan baik itu distribusi dimensi tinggi ataupun parameter tertentu
dari distribusi kelas tersebut.
■ Metode pohon keputusan dapat menghindari munculnya permasalahan ini dengan menggunakan
criteria yang jumlahnya lebih sedikit pada setiap node internal tanpa banyak mengurangi kualitas
keputusan yang dihasilkan
Kekurangan Pohon Keputusan
■ Terjadi overlap terutama ketika kelas-kelas dan criteria yang digunakan jumlahnya
sangat banyak. Hal tersebut juga dapat menyebabkan meningkatnya waktu
pengambilan keputusan dan jumlah memori yang diperlukan.
■ Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah pohon keputusan yang
besar.
■ Kesulitan dalam mendesain pohon keputusan yang optimal.
■ Hasil kualitas keputusan yang didapatkan dari metode pohon keputusan sangat
tergantung pada bagaimana pohon tersebut didesain
Model Pohon Keputusan
Pohon keputusan adalah model prediksi menggunakan struktur
pohon atau struktur berhirarki. Berikut adalah Contoh dari
sebuah pohon keputusan
Gambar 1. Model Pohon Keputusan (Pramudiono,2008)
Algoritma C4.5
■ Untuk memudahkan penjelasan mengenai algoritmaC4.5 berikut ini disertakan contoh kasus
yang dituangkan dalamTabel 1:
Dalam kasus yang tertera pada
Tabel 1, akan dibuat pohon
keputusan untuk menentukan
main tenis atau tidak dengan
melihat keadaan cuaca (outlook),
temperatur, kelembaban
(humidity) dan
keadaan angin (windy).
Lanjutan
■ Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai
berikut:
1. Pilih atribut sebagai akar
2. Buat cabang untuk masing-masing nilai
3. Bagi kasus dalam cabang
4. Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki
kelas yang sama.
■ Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atribut-
atribut yang ada.
Lanjutan
Sedangkan perhitungan nilai entropy dapat dilihat pada rumus
2 berikut:
Untuk menghitung gain digunakan rumus seperti tertera dalam
Rumus 1.
Gambar 3. Pohon Keputusan Hasil Perhitungan Node 1.1
Dari hasil tersebut dapat digambarkan pohon keputusan
sementara seperti Gambar 2
1 de 11

Mais conteúdo relacionado

Similar a Konsep data mining(20)

Sistem Pendukung Keputusan (SPK)Sistem Pendukung Keputusan (SPK)
Sistem Pendukung Keputusan (SPK)
Cindi Tri Fitikasari261 visualizações
PPT KEL 3 DAI - 007.pptxPPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptx
StevenAdiSantoso7 visualizações
SPK.pptSPK.ppt
SPK.ppt
anik020695113 visualizações
Sim dwi ariyanSim dwi ariyan
Sim dwi ariyan
AriyanSutanto56 visualizações
Lampiran cd manajemen operasiLampiran cd manajemen operasi
Lampiran cd manajemen operasi
Aven Richardo7.3K visualizações
Diagram pohon keputusan 2Diagram pohon keputusan 2
Diagram pohon keputusan 2
Dedi Suryono5.9K visualizações
11 Sistem Pendukung Keputusan11 Sistem Pendukung Keputusan
11 Sistem Pendukung Keputusan
Ainul Yaqin4.7K visualizações
Dss aplotDss aplot
Dss aplot
hzney dhinie536 visualizações
Keputsn3Keputsn3
Keputsn3
Andre Rian700 visualizações

Mais de Basiroh M.Kom

2 pengantar-kwu2 pengantar-kwu
2 pengantar-kwuBasiroh M.Kom
145 visualizações11 slides
Recursive pertemuan 5Recursive pertemuan 5
Recursive pertemuan 5Basiroh M.Kom
1.8K visualizações22 slides
Dynamic programming pertemuan 4Dynamic programming pertemuan 4
Dynamic programming pertemuan 4Basiroh M.Kom
770 visualizações23 slides
Test abilitas dan testerTest abilitas dan tester
Test abilitas dan testerBasiroh M.Kom
1.1K visualizações22 slides
KcbKcb
KcbBasiroh M.Kom
295 visualizações29 slides
13 ai sitm_pakar13 ai sitm_pakar
13 ai sitm_pakarBasiroh M.Kom
893 visualizações23 slides

Mais de Basiroh M.Kom(20)

2 pengantar-kwu2 pengantar-kwu
2 pengantar-kwu
Basiroh M.Kom145 visualizações
Recursive pertemuan 5Recursive pertemuan 5
Recursive pertemuan 5
Basiroh M.Kom1.8K visualizações
Dynamic programming pertemuan 4Dynamic programming pertemuan 4
Dynamic programming pertemuan 4
Basiroh M.Kom770 visualizações
Test abilitas dan testerTest abilitas dan tester
Test abilitas dan tester
Basiroh M.Kom1.1K visualizações
KcbKcb
Kcb
Basiroh M.Kom295 visualizações
13 ai sitm_pakar13 ai sitm_pakar
13 ai sitm_pakar
Basiroh M.Kom893 visualizações
01 ai01 ai
01 ai
Basiroh M.Kom155 visualizações
01 intro ai01 intro ai
01 intro ai
Basiroh M.Kom206 visualizações
4 black-box4 black-box
4 black-box
Basiroh M.Kom1.7K visualizações
5 white-box5 white-box
5 white-box
Basiroh M.Kom3.3K visualizações
Testing dan implementasi sistemTesting dan implementasi sistem
Testing dan implementasi sistem
Basiroh M.Kom310 visualizações
Presentation1Presentation1
Presentation1
Basiroh M.Kom111 visualizações
Pertemuan 6-representasi-pengetahuan-logika-newPertemuan 6-representasi-pengetahuan-logika-new
Pertemuan 6-representasi-pengetahuan-logika-new
Basiroh M.Kom2.1K visualizações
Pertemuan 05Pertemuan 05
Pertemuan 05
Basiroh M.Kom995 visualizações
Network pertemuan 03 Network pertemuan 03
Network pertemuan 03
Basiroh M.Kom1.6K visualizações
PboPbo
Pbo
Basiroh M.Kom2K visualizações
Pengertian & konsep oop (object orientedPengertian & konsep oop (object oriented
Pengertian & konsep oop (object oriented
Basiroh M.Kom1.2K visualizações
Class diagramClass diagram
Class diagram
Basiroh M.Kom296 visualizações
01 rw01 rw
01 rw
Basiroh M.Kom579 visualizações
05 rw05 rw
05 rw
Basiroh M.Kom371 visualizações

Konsep data mining

  • 1. KONSEP DATA MINING ( Pohon Keputusan ) Basiroh, S.Kom, M.Kom
  • 2. DECISIONTREE (POHON KEPUTUSAN) ■ Peranan pohon Keputusan yaitu sebagai alat bantu dalam mengambil keputusan (decision support tool) telah dikembangkan oleh manusia sejak perkembangan teori pohon yang dilandaskan pada teori graf. Kegunaan pohon keputusan yang sangat banyak ini membuatnya telah dimanfaatkan oleh manusia dalam berbagai macam sistem pengambilan keputusan.
  • 3. Pengertian Pohon Keputusan ■ Pengertian Pohon Keputusan ■ Pohon dalam analisis pemecahan masalah pengambilan keputusan adalah pemetaan mengenai alternatif-alternatif pemecahan masalah yang dapat diambil dari masalah tersebut. ■ Pohon tersebut juga memperlihatkan faktor-faktor kemungkinan/probablitas yang akan mempengaruhi alternatifalternatif keputusan tersebut, disertai dengan estimasi hasil akhir yang akan didapat bila kita mengambil alternatif keputusan tersebut.
  • 4. Manfaat Pohon Keputusan ■ Manfaat utama dari penggunaan pohon keputusan adalah ■ kemampuannya untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih simpel sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan. ■ Pohon Keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. ■ Pohon keputusan memadukan antara eksplorasi data dan pemodelan, sehingga sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari beberapa teknik lain.
  • 5. Kelebihan Pohon Keputusan ■ Kelebihan dari metode pohon keputusan adalah: ■ Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat global, dapat diubah menjadi lebih simpel dan spesifik. ■ liminasi perhitungan-perhitungan yang tidak diperlukan, karena ketika menggunakan metode pohon keputusan maka sample diuji hanya berdasarkan kriteria atau kelas tertentu. ■ Fleksibel untuk memilih fitur dari internal node yang berbeda, fitur yang terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain dalam node yang sama. ■ Kefleksibelan metode pohon keputusan ini meningkatkan kualitas keputusan yang dihasilkan jika dibandingkan ketika menggunakan metode penghitungan satu tahap yang lebih konvensional. ■ Dalam analisis multivariat, dengan kriteria dan kelas yang jumlahnya sangat banyak, seorang penguji biasanya perlu untuk mengestimasikan baik itu distribusi dimensi tinggi ataupun parameter tertentu dari distribusi kelas tersebut. ■ Metode pohon keputusan dapat menghindari munculnya permasalahan ini dengan menggunakan criteria yang jumlahnya lebih sedikit pada setiap node internal tanpa banyak mengurangi kualitas keputusan yang dihasilkan
  • 6. Kekurangan Pohon Keputusan ■ Terjadi overlap terutama ketika kelas-kelas dan criteria yang digunakan jumlahnya sangat banyak. Hal tersebut juga dapat menyebabkan meningkatnya waktu pengambilan keputusan dan jumlah memori yang diperlukan. ■ Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah pohon keputusan yang besar. ■ Kesulitan dalam mendesain pohon keputusan yang optimal. ■ Hasil kualitas keputusan yang didapatkan dari metode pohon keputusan sangat tergantung pada bagaimana pohon tersebut didesain
  • 7. Model Pohon Keputusan Pohon keputusan adalah model prediksi menggunakan struktur pohon atau struktur berhirarki. Berikut adalah Contoh dari sebuah pohon keputusan Gambar 1. Model Pohon Keputusan (Pramudiono,2008)
  • 8. Algoritma C4.5 ■ Untuk memudahkan penjelasan mengenai algoritmaC4.5 berikut ini disertakan contoh kasus yang dituangkan dalamTabel 1: Dalam kasus yang tertera pada Tabel 1, akan dibuat pohon keputusan untuk menentukan main tenis atau tidak dengan melihat keadaan cuaca (outlook), temperatur, kelembaban (humidity) dan keadaan angin (windy).
  • 9. Lanjutan ■ Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut: 1. Pilih atribut sebagai akar 2. Buat cabang untuk masing-masing nilai 3. Bagi kasus dalam cabang 4. Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki kelas yang sama. ■ Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atribut- atribut yang ada.
  • 10. Lanjutan Sedangkan perhitungan nilai entropy dapat dilihat pada rumus 2 berikut: Untuk menghitung gain digunakan rumus seperti tertera dalam Rumus 1.
  • 11. Gambar 3. Pohon Keputusan Hasil Perhitungan Node 1.1 Dari hasil tersebut dapat digambarkan pohon keputusan sementara seperti Gambar 2