Algoritma Decision Tree - ID3

Algoritma ID3 Decision Tree
Ahmad Wahyu Rosyadi
Decision tree
• Decision tree adalah salah satu metode klasifikasi yang
mudah untuk diinterpretasi atau dipahami oleh manusia.
• Decision tree menggunakan struktur pohon untuk model
classifiernya.
• Decision tree memiliki kemampuan untuk mem-break
down proses pengambilan keputusan yang kompleks
menjadi lebih simple, sehingga pengambil keputusan akan
lebih menginterpretasikan solusi dari permasalahan.
Decision tree (2)
Arsitektur Pohon Keputusan:
• Root node atau node akar merupakan node
yang terletak paling atas dari suatu pohon.
• Internal Node ini merupakan node
percabangan, dimana pada node ini hanya
terdapat satu input dan mempunyai
minimal dua output.
• Leaf Node ini merupakan node akhir, hanya
memiliki satu input, dan tidak memiliki
output. Pada pohon keputusan setiap leaf
node menandai label kelas.
setiap percabangan menyatakan kondisi yang
harus dipenuhi.
Yes
Humidity
Outlook
sunny
overcast
rain
high normal wind
strong weak
Yes
No
Yes
No
Deskripsi ID3
• Algoritma ID3 merupakan algoritma yang dipergunakan untuk membangun sebuah
decision tree atau pohon keputusan.
• Proses dari decision tree dimulai dari root node hingga leaf node yang dilakukan
secara rekursif.:
 Setiap percabangan menyatakan suatu kondisi yang harus dipenuhi.
 Setiap ujung pohon menyatakan kelas dari suatu data.
• Proses dalam decision tree yaitu mengubah bentuk:
data (tabel)
model pohon
(tree)
aturan (rule).
• Algoritma ID3 tidak pernah melakukan backtracking untuk merevisi keputusan
pemilihan attribute yang telah dilakukan sebelumnya.
Deskripsi ID3 (2)
• ID3 menggunakan information gain untuk
menentukan atribut yang terbaik.
• Yang memiliki information gain tertinggi dipilih
(informasi yang paling berguna untuk klasifikasi).
• Untuk menentukan information gain, pertama-
tama kita menghitung entropi.
• Entropi digunakan untuk mengukur jumlah
informasi dalam suatu atribut.
Algoritma ID3
• S = training set
• p(I) = probabilitas S yang termasuk dalam kelas I
Contoh:
• S adalah kumpulan dari 14 contoh dengan 9 YA dan 5 TIDAK
Algoritma ID3 (2)
• Jika entropi 0 berarti semua anggota S masuk
dalam kelas yang sama (data diklasifikasikan
dengan sempurna).
• Kisaran entropi adalah:
0 ("diklasifikasikan sempurna") hingga 1
("acak total").
Algoritma ID3 (3)
• Gain(S, A) adalah information gain of training
set S di attribute A.
• 𝑆𝑣 = subset dari S dengan attribute A dengan
nilai v
Langkah-Langkah Konstruksi Pohon
Keputusan dengan Algoritma ID3
• Langkah 1 : Pohon dimulai dengan sebuah simpul (node) yang mereperesentasikan sampel data
pelatihan yaitu dengan membuat simpul akar.
• Langkah 2 : Jika semua sampel berada dalam kelas yang sama, maka simpul ini menjadi daun (leaf)
dan dilabeli menjadi kelas. Jika tidak, information gain akan digunakan untuk memilih atribut
terbaik dalam memisahkan data sampel menjadi kelas-kelas individu.
• Langkah 3 : Cabang akan dibuat untuk setiap nilai pada atribut dan data sampel akan dipartisi lagi.
• Langkah 4 : Algoritma ini menggunakan proses rekursif untuk membentuk pohon keputusan pada
setiap data partisi. Jika sebuah atribut sudah digunakan disebuah simpul, maka atribut ini tidak
akan digunakan lagi di simpul anak-anaknya.
• Langkah 5 : Proses ini berhenti jika dicapai kondisi seperti berikut :
 – Semua sampel pada simpul berada di dalam satu kelas
 – Tidak ada atribut lainnya yang dapat digunakan untuk mempartisi sampel lebih lanjut.
Dalam hal ini akan diterapkan suara terbanyak. Ini berarti mengubah sebuah simpul menjadi
daun dan melabelinya dengan kelas pada suara terbanyak.
Simulasi level 0
+
Simulasi level 0 (2)
Simulasi level 0 (3)
Simulasi level 0 (4)
• Menghitung Gain untuk semua atribut
lain.
• Menjadikan atribut dengan Gain paling
besar sebagai root node (simpul akar).
• Karena Outlook memiliki tiga
kemungkinan nilai, simpul akar memiliki
tiga cabang (sunny, overcast, rain).
• Melanjutkan proses training pada setiap
cabang:
• Setiap cabang akan dikombinasikan
dengan atribut yang tersisa (Humidity,
Temperature, or Wind).
Outlook
sunny
overcast
rain
Simulasi level 1
Outlook
sunny
overcast
rain
Simulasi level 1 (2)
Humidity
Outlook
sunny
overcast
rain
high normal
Simulasi level 1 (3)
• Lanjutkan ke cabang
yang belum ditraining
(overcast dan rain)
• Mari lihat slide
perhitungan gain
outlook
Humidity
Outlook
sunny
overcast
rain
high normal
Simulasi level 1 (4)
Yes
• Lanjutkan ke cabang yang
belum ditraining (rain)
• Rain akan dikombinasikan
dengan atribut yang tersisa
(Temperature dan Wind).
Humidity
Outlook
sunny
overcast
rain
high normal
Simulasi level 1 (5)
Yes
Humidity
Outlook
sunny
overcast
rain
high normal
Simulasi level 1 (6)
Yes
Humidity
Outlook
sunny
overcast
rain
high normal
Simulasi level 1 (7)
• Melanjutkan proses
training pada setiap
cabang yang belum selesai
• Mari lihat slide
perhitungan gain humidity
Yes
Humidity
Outlook
sunny
overcast
rain
high normal wind
strong weak
Simulasi level 2
Yes
Humidity
Outlook
sunny
overcast
rain
high normal wind
strong weak
Yes
No
Simulasi level 2 (2)
• Stop training karena semua
cabang sudah di training dan
tidak bisa dikombinasikan
dengan atribut terkahir:
temperature.
Yes
Humidity
Outlook
sunny
overcast
rain
high normal wind
strong weak
Yes
No
Yes
No
Referensi
• https://informatikalogi.com/algoritma-id3/
• https://medium.com/iykra/mengenal-
decision-tree-dan-manfaatnya-b98cf3cf6a8d
1 de 23

Recomendados

Pertemuan 1 - Introduction - Citra Digital por
Pertemuan 1 - Introduction - Citra DigitalPertemuan 1 - Introduction - Citra Digital
Pertemuan 1 - Introduction - Citra Digitalahmad haidaroh
3.3K visualizações38 slides
Pertemuan 4-metode-pencarian-dan-pelacakan por
Pertemuan 4-metode-pencarian-dan-pelacakanPertemuan 4-metode-pencarian-dan-pelacakan
Pertemuan 4-metode-pencarian-dan-pelacakanwillyhayon
15.7K visualizações41 slides
Materi Data Mining - C4.5 por
Materi Data Mining - C4.5Materi Data Mining - C4.5
Materi Data Mining - C4.5dedidarwis
9.1K visualizações21 slides
Machine learning por
Machine learningMachine learning
Machine learningOemar Ahmad
536 visualizações19 slides
Materi Kuliah Data Mining full por
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining fullMunajat ( Munjob )
212 visualizações34 slides
Pertemuan 05 Teknik Pencarian (Search) -lanjutan por
Pertemuan 05 Teknik Pencarian (Search) -lanjutanPertemuan 05 Teknik Pencarian (Search) -lanjutan
Pertemuan 05 Teknik Pencarian (Search) -lanjutanEndang Retnoningsih
3.1K visualizações28 slides

Mais conteúdo relacionado

Mais procurados

Analisis Algoritma - Strategi Algoritma Greedy por
Analisis Algoritma - Strategi Algoritma GreedyAnalisis Algoritma - Strategi Algoritma Greedy
Analisis Algoritma - Strategi Algoritma GreedyAdam Mukharil Bachtiar
6.3K visualizações35 slides
Modul klasifikasi decission tree modul klasifikasi por
Modul klasifikasi decission tree modul klasifikasiModul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasiUniversitas Bina Darma Palembang
9.6K visualizações23 slides
Data mining 5 klasifikasi decision tree dan random forest por
Data mining 5   klasifikasi decision tree dan random forestData mining 5   klasifikasi decision tree dan random forest
Data mining 5 klasifikasi decision tree dan random forestIrwansyahSaputra1
1.5K visualizações56 slides
TUGAS KEWIRAUSAHAAN I por
TUGAS KEWIRAUSAHAAN I TUGAS KEWIRAUSAHAAN I
TUGAS KEWIRAUSAHAAN I OktaviaPanduWinata
9.2K visualizações67 slides
Data Mining Klasifikasi (Updated 30 Desember 2020) por
Data Mining Klasifikasi (Updated 30 Desember 2020)Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)Adam Mukharil Bachtiar
595 visualizações64 slides
Silabus Pelatihan _"Peran Efektif HRD dalam Peningkatan Kualitas dan Kinerja ... por
Silabus Pelatihan _"Peran Efektif HRD dalam Peningkatan Kualitas dan Kinerja ...Silabus Pelatihan _"Peran Efektif HRD dalam Peningkatan Kualitas dan Kinerja ...
Silabus Pelatihan _"Peran Efektif HRD dalam Peningkatan Kualitas dan Kinerja ...Kanaidi ken
80 visualizações22 slides

Mais procurados(20)

Analisis Algoritma - Strategi Algoritma Greedy por Adam Mukharil Bachtiar
Analisis Algoritma - Strategi Algoritma GreedyAnalisis Algoritma - Strategi Algoritma Greedy
Analisis Algoritma - Strategi Algoritma Greedy
Adam Mukharil Bachtiar6.3K visualizações
Data mining 5 klasifikasi decision tree dan random forest por IrwansyahSaputra1
Data mining 5   klasifikasi decision tree dan random forestData mining 5   klasifikasi decision tree dan random forest
Data mining 5 klasifikasi decision tree dan random forest
IrwansyahSaputra11.5K visualizações
TUGAS KEWIRAUSAHAAN I por OktaviaPanduWinata
TUGAS KEWIRAUSAHAAN I TUGAS KEWIRAUSAHAAN I
TUGAS KEWIRAUSAHAAN I
OktaviaPanduWinata9.2K visualizações
Data Mining Klasifikasi (Updated 30 Desember 2020) por Adam Mukharil Bachtiar
Data Mining Klasifikasi (Updated 30 Desember 2020)Data Mining Klasifikasi (Updated 30 Desember 2020)
Data Mining Klasifikasi (Updated 30 Desember 2020)
Adam Mukharil Bachtiar595 visualizações
Silabus Pelatihan _"Peran Efektif HRD dalam Peningkatan Kualitas dan Kinerja ... por Kanaidi ken
Silabus Pelatihan _"Peran Efektif HRD dalam Peningkatan Kualitas dan Kinerja ...Silabus Pelatihan _"Peran Efektif HRD dalam Peningkatan Kualitas dan Kinerja ...
Silabus Pelatihan _"Peran Efektif HRD dalam Peningkatan Kualitas dan Kinerja ...
Kanaidi ken80 visualizações
Power point kepemimpinan por Emelia Ginting
Power point kepemimpinanPower point kepemimpinan
Power point kepemimpinan
Emelia Ginting31.3K visualizações
Pertemuan 3-pemecahan-masalah-ai por willyhayon
Pertemuan 3-pemecahan-masalah-aiPertemuan 3-pemecahan-masalah-ai
Pertemuan 3-pemecahan-masalah-ai
willyhayon12.8K visualizações
1 data mining-dm2016 por Cici Erza Safitri
1 data mining-dm20161 data mining-dm2016
1 data mining-dm2016
Cici Erza Safitri2.5K visualizações
Data mining 4 konsep dasar klasifikasi por IrwansyahSaputra1
Data mining 4   konsep dasar klasifikasiData mining 4   konsep dasar klasifikasi
Data mining 4 konsep dasar klasifikasi
IrwansyahSaputra1547 visualizações
TEAM BUILDING por Hadiyan Suryadi
TEAM BUILDINGTEAM BUILDING
TEAM BUILDING
Hadiyan Suryadi13.2K visualizações
circular linked list por Materi Kuliah Online
circular linked listcircular linked list
circular linked list
Materi Kuliah Online11.3K visualizações
Seleksi dan penempatan por febedwi
Seleksi dan penempatanSeleksi dan penempatan
Seleksi dan penempatan
febedwi5.9K visualizações
Class diagram por Aris Saputro
Class diagramClass diagram
Class diagram
Aris Saputro10.7K visualizações
Kecerdasan Buatan - Tugas 1 por IDementor
Kecerdasan Buatan - Tugas 1Kecerdasan Buatan - Tugas 1
Kecerdasan Buatan - Tugas 1
IDementor1.5K visualizações
PPT ALGORITMA KRIPTOGRAFI por ripki al
PPT ALGORITMA KRIPTOGRAFIPPT ALGORITMA KRIPTOGRAFI
PPT ALGORITMA KRIPTOGRAFI
ripki al1.8K visualizações
Proses Data Mining por dedidarwis
Proses Data MiningProses Data Mining
Proses Data Mining
dedidarwis24.5K visualizações
Perkuliahan ke 4 Organisasi Arsitektur Komputer por Rakhmi Khalida, M.M.S.I
Perkuliahan ke 4  Organisasi Arsitektur KomputerPerkuliahan ke 4  Organisasi Arsitektur Komputer
Perkuliahan ke 4 Organisasi Arsitektur Komputer
Rakhmi Khalida, M.M.S.I918 visualizações
Linked list por Rista Fuji
Linked listLinked list
Linked list
Rista Fuji5K visualizações

Similar a Algoritma Decision Tree - ID3

DT.ppt por
DT.pptDT.ppt
DT.pptnyomans1
3 visualizações15 slides
tgsdm3_ kelompok 7 por
 tgsdm3_ kelompok 7 tgsdm3_ kelompok 7
tgsdm3_ kelompok 7Alvian yudha Prawira
4.1K visualizações31 slides
Presentasi Implementasi Algoritma ID3 por
Presentasi Implementasi Algoritma ID3Presentasi Implementasi Algoritma ID3
Presentasi Implementasi Algoritma ID3Uliel Azmie
4.3K visualizações13 slides
PPT KEL 3 DAI - 007.pptx por
PPT KEL 3 DAI - 007.pptxPPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptxStevenAdiSantoso
7 visualizações25 slides
Datamining menggunakan algoritma c4.5 por
Datamining menggunakan algoritma c4.5Datamining menggunakan algoritma c4.5
Datamining menggunakan algoritma c4.5Rosyid Ridlo
620 visualizações10 slides
Klasifikasi Data Mining.pptx por
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptxAdam Superman
231 visualizações62 slides

Similar a Algoritma Decision Tree - ID3(20)

DT.ppt por nyomans1
DT.pptDT.ppt
DT.ppt
nyomans13 visualizações
Presentasi Implementasi Algoritma ID3 por Uliel Azmie
Presentasi Implementasi Algoritma ID3Presentasi Implementasi Algoritma ID3
Presentasi Implementasi Algoritma ID3
Uliel Azmie4.3K visualizações
PPT KEL 3 DAI - 007.pptx por StevenAdiSantoso
PPT KEL 3 DAI - 007.pptxPPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptx
StevenAdiSantoso7 visualizações
Datamining menggunakan algoritma c4.5 por Rosyid Ridlo
Datamining menggunakan algoritma c4.5Datamining menggunakan algoritma c4.5
Datamining menggunakan algoritma c4.5
Rosyid Ridlo620 visualizações
Klasifikasi Data Mining.pptx por Adam Superman
Klasifikasi Data Mining.pptxKlasifikasi Data Mining.pptx
Klasifikasi Data Mining.pptx
Adam Superman231 visualizações
BERPIKIR KOMPUTESIONAL 3.ppt por AgusPurwadi20
BERPIKIR KOMPUTESIONAL 3.pptBERPIKIR KOMPUTESIONAL 3.ppt
BERPIKIR KOMPUTESIONAL 3.ppt
AgusPurwadi2045 visualizações
Klasifikasi - Algoritma Naive Bayes por Elvi Rahmi
Klasifikasi - Algoritma Naive Bayes Klasifikasi - Algoritma Naive Bayes
Klasifikasi - Algoritma Naive Bayes
Elvi Rahmi327 visualizações
representasi pengetahuan por RizkyGanteng2
representasi pengetahuanrepresentasi pengetahuan
representasi pengetahuan
RizkyGanteng215 visualizações
1. klasifikasi dan evaluasi por BambangWijiatmoko
1. klasifikasi dan evaluasi1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi
BambangWijiatmoko104 visualizações
Structured english (se) por rika85
Structured english (se)Structured english (se)
Structured english (se)
rika8563 visualizações
Kontrak Perkuliahan por formatik
Kontrak PerkuliahanKontrak Perkuliahan
Kontrak Perkuliahan
formatik393 visualizações
Kontrak Perkuliahan por formatik
Kontrak PerkuliahanKontrak Perkuliahan
Kontrak Perkuliahan
formatik412 visualizações
Pertemuan 5 por Abrianto Nugraha
Pertemuan 5Pertemuan 5
Pertemuan 5
Abrianto Nugraha269 visualizações
Pertemuan 9 Array (Larik) por Endang Retnoningsih
Pertemuan 9 Array (Larik)Pertemuan 9 Array (Larik)
Pertemuan 9 Array (Larik)
Endang Retnoningsih4.1K visualizações
data mining por dewi2093
data miningdata mining
data mining
dewi20932K visualizações
Definisi Statistika dan Penyajian Data por Putri Aulia
Definisi Statistika dan Penyajian DataDefinisi Statistika dan Penyajian Data
Definisi Statistika dan Penyajian Data
Putri Aulia26.5K visualizações
Statistik deskriptif por Grizia Zhulva
Statistik deskriptifStatistik deskriptif
Statistik deskriptif
Grizia Zhulva17.1K visualizações

Algoritma Decision Tree - ID3

  • 1. Algoritma ID3 Decision Tree Ahmad Wahyu Rosyadi
  • 2. Decision tree • Decision tree adalah salah satu metode klasifikasi yang mudah untuk diinterpretasi atau dipahami oleh manusia. • Decision tree menggunakan struktur pohon untuk model classifiernya. • Decision tree memiliki kemampuan untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih simple, sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan.
  • 3. Decision tree (2) Arsitektur Pohon Keputusan: • Root node atau node akar merupakan node yang terletak paling atas dari suatu pohon. • Internal Node ini merupakan node percabangan, dimana pada node ini hanya terdapat satu input dan mempunyai minimal dua output. • Leaf Node ini merupakan node akhir, hanya memiliki satu input, dan tidak memiliki output. Pada pohon keputusan setiap leaf node menandai label kelas. setiap percabangan menyatakan kondisi yang harus dipenuhi. Yes Humidity Outlook sunny overcast rain high normal wind strong weak Yes No Yes No
  • 4. Deskripsi ID3 • Algoritma ID3 merupakan algoritma yang dipergunakan untuk membangun sebuah decision tree atau pohon keputusan. • Proses dari decision tree dimulai dari root node hingga leaf node yang dilakukan secara rekursif.:  Setiap percabangan menyatakan suatu kondisi yang harus dipenuhi.  Setiap ujung pohon menyatakan kelas dari suatu data. • Proses dalam decision tree yaitu mengubah bentuk: data (tabel) model pohon (tree) aturan (rule). • Algoritma ID3 tidak pernah melakukan backtracking untuk merevisi keputusan pemilihan attribute yang telah dilakukan sebelumnya.
  • 5. Deskripsi ID3 (2) • ID3 menggunakan information gain untuk menentukan atribut yang terbaik. • Yang memiliki information gain tertinggi dipilih (informasi yang paling berguna untuk klasifikasi). • Untuk menentukan information gain, pertama- tama kita menghitung entropi. • Entropi digunakan untuk mengukur jumlah informasi dalam suatu atribut.
  • 6. Algoritma ID3 • S = training set • p(I) = probabilitas S yang termasuk dalam kelas I Contoh: • S adalah kumpulan dari 14 contoh dengan 9 YA dan 5 TIDAK
  • 7. Algoritma ID3 (2) • Jika entropi 0 berarti semua anggota S masuk dalam kelas yang sama (data diklasifikasikan dengan sempurna). • Kisaran entropi adalah: 0 ("diklasifikasikan sempurna") hingga 1 ("acak total").
  • 8. Algoritma ID3 (3) • Gain(S, A) adalah information gain of training set S di attribute A. • 𝑆𝑣 = subset dari S dengan attribute A dengan nilai v
  • 9. Langkah-Langkah Konstruksi Pohon Keputusan dengan Algoritma ID3 • Langkah 1 : Pohon dimulai dengan sebuah simpul (node) yang mereperesentasikan sampel data pelatihan yaitu dengan membuat simpul akar. • Langkah 2 : Jika semua sampel berada dalam kelas yang sama, maka simpul ini menjadi daun (leaf) dan dilabeli menjadi kelas. Jika tidak, information gain akan digunakan untuk memilih atribut terbaik dalam memisahkan data sampel menjadi kelas-kelas individu. • Langkah 3 : Cabang akan dibuat untuk setiap nilai pada atribut dan data sampel akan dipartisi lagi. • Langkah 4 : Algoritma ini menggunakan proses rekursif untuk membentuk pohon keputusan pada setiap data partisi. Jika sebuah atribut sudah digunakan disebuah simpul, maka atribut ini tidak akan digunakan lagi di simpul anak-anaknya. • Langkah 5 : Proses ini berhenti jika dicapai kondisi seperti berikut :  – Semua sampel pada simpul berada di dalam satu kelas  – Tidak ada atribut lainnya yang dapat digunakan untuk mempartisi sampel lebih lanjut. Dalam hal ini akan diterapkan suara terbanyak. Ini berarti mengubah sebuah simpul menjadi daun dan melabelinya dengan kelas pada suara terbanyak.
  • 13. Simulasi level 0 (4) • Menghitung Gain untuk semua atribut lain. • Menjadikan atribut dengan Gain paling besar sebagai root node (simpul akar). • Karena Outlook memiliki tiga kemungkinan nilai, simpul akar memiliki tiga cabang (sunny, overcast, rain). • Melanjutkan proses training pada setiap cabang: • Setiap cabang akan dikombinasikan dengan atribut yang tersisa (Humidity, Temperature, or Wind). Outlook sunny overcast rain
  • 15. Simulasi level 1 (2) Humidity Outlook sunny overcast rain high normal
  • 16. Simulasi level 1 (3) • Lanjutkan ke cabang yang belum ditraining (overcast dan rain) • Mari lihat slide perhitungan gain outlook Humidity Outlook sunny overcast rain high normal
  • 17. Simulasi level 1 (4) Yes • Lanjutkan ke cabang yang belum ditraining (rain) • Rain akan dikombinasikan dengan atribut yang tersisa (Temperature dan Wind). Humidity Outlook sunny overcast rain high normal
  • 18. Simulasi level 1 (5) Yes Humidity Outlook sunny overcast rain high normal
  • 19. Simulasi level 1 (6) Yes Humidity Outlook sunny overcast rain high normal
  • 20. Simulasi level 1 (7) • Melanjutkan proses training pada setiap cabang yang belum selesai • Mari lihat slide perhitungan gain humidity Yes Humidity Outlook sunny overcast rain high normal wind strong weak
  • 22. Simulasi level 2 (2) • Stop training karena semua cabang sudah di training dan tidak bisa dikombinasikan dengan atribut terkahir: temperature. Yes Humidity Outlook sunny overcast rain high normal wind strong weak Yes No Yes No