Dokumen tersebut membahas tentang klasifikasi data menggunakan metode Naive Bayes. Terdapat beberapa poin penting yaitu penjelasan tentang klasifikasi data mining, algoritma yang dapat digunakan seperti pohon keputusan dan K-nearest neighbor, serta ciri-ciri utama dari klasifikasi data.
2. Nova Afizal
01 211250000383
ANGGOTA
M. Khusnud Dhonni
02 211250000393
Erlangga Putra W.
04 211250000407
M. Roiful Anam
05 211250000423
Maulana Fauzil Adhim
03 211250000397
3. KLASIFIKASI
Klasifikasi data mining adalah sebuah proses menemukan
definisi kesamaan karakteristik dalam suatu kelompok atau
kelas (class). Klasifikasi data mining menjadi salah satu
metode yang paling umum untuk digunakan. Metode ini
dilakukan bertujuan untuk memperkirakan kelas dari suatu
objek yang labelnya belum diketahui.
4. ALGORITMA YANG BISA DIGUNAKAN DALAM
TEKNIK KLASIFIKASI
Pohon Keputusan
(Decision Tree)
01
K-Nearest Neighbors
(K-NN)
02
Algoritma ini membangun model pohon
keputusan berdasarkan atribut-atribut
yang ada dalam data pelatihan. Pohon
keputusan dapat digunakan untuk
mengambil keputusan berdasarkan
serangkaian aturan yang ditentukan.
Algoritma ini memprediksi kelas objek
baru berdasarkan mayoritas kelas dari
K tetangga terdekatnya dalam ruang
atribut. Jarak antara objek dihitung
berdasarkan atribut-atribut yang ada.
5. ALGORITMA YANG BISA DIGUNAKAN DALAM
TEKNIK KLASIFIKASI
Algoritma ini didasarkan pada Teorema
Bayes dan mengasumsikan independensi
kondisional antara atribut-atribut. Dengan
menggunakan probabilitas, Naive Bayes
dapat memprediksi kelas berdasarkan
kombinasi atribut yang diamati.
Algoritma ini terinspirasi oleh struktur dan
fungsi jaringan saraf manusia. Jaringan
saraf tiruan terdiri dari lapisan-lapisan
neuron buatan dan dapat mempelajari
pola dari data pelatihan untuk melakukan
klasifikasi.
Naives bayes
03
Jaringan Saraf Tiruan
(Artificial Neural Networks)
04
6. CIRI-CIRI UTAMA KLASIFIKASI
Ciri-ciri utama klasifikasi dalam data mining adalah adanya atribut numerik dan atribut
nominal dalam proses pengklasifikasian. Atribut numerik merupakan atribut dengan nilai
berupa bilangan, sementara atribut nominal memiliki nilai dari suatu himpunan label atau
kategori. Pada klasifikasi, fokusnya adalah pada kelas atau label yang ingin diprediksi, yang
selalu bersifat nominal. Dalam klasifikasi, atribut dapat berupa numerik atau nominal, tetapi
kelasnya selalu bersifat nominal.
7. Resume Jurnal
Judul Klasifikasi Data Mining Untuk Seleksi Penerimaan Calon Pegawai Negeri
Sipil Tahun 2017 Menggunakan Metode Naïve Bayes
Penulis Rado Yendra, Laradea Marifni, Irma Suryani
Vol Vol. 6, No. 1
Tahun 2020
Pendahuluaan Pendahuluan membahas rekrutmen dan seleksi CPNS di Indonesia yang
masih dinilai buruk dan rentan terhadap KKN. Kualitas PNS yang diterima
juga rendah. Birokrasi pemerintah membutuhkan PNS yang profesional
dan berkualitas. Penelitian menggunakan metode Naïve Bayes sebagai
alat klasifikasi data mining untuk seleksi CPNS pada Kementerian Riset,
Teknologi, dan Pendidikan Tinggi.
8. Resume Jurnal
Tujuan Penelitian ini bertujuan untuk memperoleh distribusi yang tepat untuk fitur-
fitur data yang bersifat kontinu. Dalam konteks ini, penelitian dilakukan
untuk mencari distribusi yang sesuai dengan karakteristik data yang
bersifat kontinu, sehingga dapat digunakan untuk menganalisis dan
mengklasifikasikan data dengan akurasi yang lebih baik.
Metode Dalam jurnal ini Menggunakan Metode Klasifikasi dan Metode Naive Bayes
9. Resume Jurnal
Hasil dan pembahasan Perhitungan Naïve Bayes
Perhitungan naïve bayes dilakukan dengan menghitung sebanyak 284 data yang dibagi
menjadi 227 data training dan 57 data testing
Perhitungan Data Training
Data training dihitung secara manual menggunakan persamaan-persamaan yang disajikan
sebelumnya. Untuk fitur-fitur data yang kontinu dihitung menggunakan distribusi normal
dan distribusi gamma. terdapat 2 fitur data kategori yaitu JK dan Keterangan, dan 4 fitur
data kontinu yaitu SKD, SKB1, SKB2, dan SKB3. Oleh karena itu 4 fitur kontinu tersebut
akan dihitung menggunakan distribusi normal dan distribusi gamma. Dilihat bahwa
distribusi normal memiliki akurasi sebesar 81% dimana hasil data yang tepat sebanyak 46
dan hasil data yang tidak tepat sebanyak 11. Sedangkan distribusi gamma memiliki akurasi
sebesar 70% dimana hasil data yang tepat sebanyak 40 dan hasil data yang tidak tepat
sebanyak 17.
10. Resume Jurnal
Kesimpulan Hasil penelitian menunjukkan bahwa metode Naïve Bayes dalam seleksi
CPNS menghasilkan akurasi yang baik dengan perbandingan data training
dan testing 80%:20%. Distribusi normal pada fitur kontinu memberikan
akurasi yang lebih tinggi (81%) daripada distribusi gamma (70%). Dengan
demikian, distribusi normal lebih tepat digunakan dalam metode Naïve
Bayes untuk menghitung fitur-fitur data kontinu karena lebih akurat.
15. LANGKAH KLASIFIKASI NAÏVE BAYES
4. Menguji Hasil Klasifikasi Naive Bayes
Rumus klasifikasi Naive Bayes adalah sebagai berikut:
P(y|x) = P(x|y) * P(y) / P(x)
Penjelasan :
1. P(y|x) adalah probabilitas kelas y, diberikan fitur x
2. P(x|y) adalah probabilitas fitur x, diberikan kelas y
3. P(y) adalah probabilitas prior kelas y
4. P(x) adalah probabilitas keseluruhan fitur x