Klasifikasi Data.pptx

Nova Afizal
01 211250000383
ANGGOTA
M. Khusnud Dhonni
02 211250000393
Erlangga Putra W.
04 211250000407
M. Roiful Anam
05 211250000423
Maulana Fauzil Adhim
03 211250000397

KLASIFIKASI
Klasifikasi data mining adalah sebuah proses menemukan
definisi kesamaan karakteristik dalam suatu kelompok atau
kelas (class). Klasifikasi data mining menjadi salah satu
metode yang paling umum untuk digunakan. Metode ini
dilakukan bertujuan untuk memperkirakan kelas dari suatu
objek yang labelnya belum diketahui.

ALGORITMA YANG BISA DIGUNAKAN DALAM
TEKNIK KLASIFIKASI
Pohon Keputusan
(Decision Tree)
01
K-Nearest Neighbors
(K-NN)
02
Algoritma ini membangun model pohon
keputusan berdasarkan atribut-atribut
yang ada dalam data pelatihan. Pohon
keputusan dapat digunakan untuk
mengambil keputusan berdasarkan
serangkaian aturan yang ditentukan.
Algoritma ini memprediksi kelas objek
baru berdasarkan mayoritas kelas dari
K tetangga terdekatnya dalam ruang
atribut. Jarak antara objek dihitung
berdasarkan atribut-atribut yang ada.

ALGORITMA YANG BISA DIGUNAKAN DALAM
TEKNIK KLASIFIKASI
Algoritma ini didasarkan pada Teorema
Bayes dan mengasumsikan independensi
kondisional antara atribut-atribut. Dengan
menggunakan probabilitas, Naive Bayes
dapat memprediksi kelas berdasarkan
kombinasi atribut yang diamati.
Algoritma ini terinspirasi oleh struktur dan
fungsi jaringan saraf manusia. Jaringan
saraf tiruan terdiri dari lapisan-lapisan
neuron buatan dan dapat mempelajari
pola dari data pelatihan untuk melakukan
klasifikasi.
Naives bayes
03
Jaringan Saraf Tiruan
(Artificial Neural Networks)
04

CIRI-CIRI UTAMA KLASIFIKASI
Ciri-ciri utama klasifikasi dalam data mining adalah adanya atribut numerik dan atribut
nominal dalam proses pengklasifikasian. Atribut numerik merupakan atribut dengan nilai
berupa bilangan, sementara atribut nominal memiliki nilai dari suatu himpunan label atau
kategori. Pada klasifikasi, fokusnya adalah pada kelas atau label yang ingin diprediksi, yang
selalu bersifat nominal. Dalam klasifikasi, atribut dapat berupa numerik atau nominal, tetapi
kelasnya selalu bersifat nominal.

Resume Jurnal
Judul Klasifikasi Data Mining Untuk Seleksi Penerimaan Calon Pegawai Negeri
Sipil Tahun 2017 Menggunakan Metode Naïve Bayes
Penulis Rado Yendra, Laradea Marifni, Irma Suryani
Vol Vol. 6, No. 1
Tahun 2020
Pendahuluaan Pendahuluan membahas rekrutmen dan seleksi CPNS di Indonesia yang
masih dinilai buruk dan rentan terhadap KKN. Kualitas PNS yang diterima
juga rendah. Birokrasi pemerintah membutuhkan PNS yang profesional
dan berkualitas. Penelitian menggunakan metode Naïve Bayes sebagai
alat klasifikasi data mining untuk seleksi CPNS pada Kementerian Riset,
Teknologi, dan Pendidikan Tinggi.

Resume Jurnal
Tujuan Penelitian ini bertujuan untuk memperoleh distribusi yang tepat untuk fitur-
fitur data yang bersifat kontinu. Dalam konteks ini, penelitian dilakukan
untuk mencari distribusi yang sesuai dengan karakteristik data yang
bersifat kontinu, sehingga dapat digunakan untuk menganalisis dan
mengklasifikasikan data dengan akurasi yang lebih baik.
Metode Dalam jurnal ini Menggunakan Metode Klasifikasi dan Metode Naive Bayes

Resume Jurnal
Hasil dan pembahasan  Perhitungan Naïve Bayes
Perhitungan naïve bayes dilakukan dengan menghitung sebanyak 284 data yang dibagi
menjadi 227 data training dan 57 data testing
 Perhitungan Data Training
Data training dihitung secara manual menggunakan persamaan-persamaan yang disajikan
sebelumnya. Untuk fitur-fitur data yang kontinu dihitung menggunakan distribusi normal
dan distribusi gamma. terdapat 2 fitur data kategori yaitu JK dan Keterangan, dan 4 fitur
data kontinu yaitu SKD, SKB1, SKB2, dan SKB3. Oleh karena itu 4 fitur kontinu tersebut
akan dihitung menggunakan distribusi normal dan distribusi gamma. Dilihat bahwa
distribusi normal memiliki akurasi sebesar 81% dimana hasil data yang tepat sebanyak 46
dan hasil data yang tidak tepat sebanyak 11. Sedangkan distribusi gamma memiliki akurasi
sebesar 70% dimana hasil data yang tepat sebanyak 40 dan hasil data yang tidak tepat
sebanyak 17.

Resume Jurnal
Kesimpulan Hasil penelitian menunjukkan bahwa metode Naïve Bayes dalam seleksi
CPNS menghasilkan akurasi yang baik dengan perbandingan data training
dan testing 80%:20%. Distribusi normal pada fitur kontinu memberikan
akurasi yang lebih tinggi (81%) daripada distribusi gamma (70%). Dengan
demikian, distribusi normal lebih tepat digunakan dalam metode Naïve
Bayes untuk menghitung fitur-fitur data kontinu karena lebih akurat.

CONTOH KLASIFIKASI DATA
DENGAN ALGORITMA NAÏVE
BAYES

DATASET CUACA
Label/Class
Berupa Nominal
Atribut Berupa Nominal

LANGKAH KLASIFIKASI NAÏVE BAYES
1. Menentukan Probalititas Class
2. Menentukkan Probabilitas Kategori

3. Membuat Tabel Kategori

4. Menguji Hasil Klasifikasi Naive Bayes
Rumus klasifikasi Naive Bayes adalah sebagai berikut:
P(y|x) = P(x|y) * P(y) / P(x)
Penjelasan :
1. P(y|x) adalah probabilitas kelas y, diberikan fitur x
2. P(x|y) adalah probabilitas fitur x, diberikan kelas y
3. P(y) adalah probabilitas prior kelas y
4. P(x) adalah probabilitas keseluruhan fitur x

Dan seterusnya sampai data berakhir

5. Hasil Klasifikasi Naive Bayes

MATUR SUWUN
Ono Pitakonan Gak?
#doaibuorasepele

Klasifikasi Data.pptx

Recomendados

Recomendados

Mais conteúdo relacionado

Semelhante a Klasifikasi Data.pptx

Semelhante a Klasifikasi Data.pptx (20)

Último

Último (9)

Klasifikasi Data.pptx