perbedaan jalan raya dan rel bahasa Indonesia.pptx
data mining fuzzy c-means
1. PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS
DENGAN ALGORITMA FUZZY C-MEANS
Oleh :
BAHAR
P31.2008.00539
Tesis diajukan sebagai salah satu syarat
untuk memperoleh gelar
Magister Komputer
PROGRAM PASCA SARJANA
MAGISTER TEKNIK INFORMATIKA
UNIVERSITAS DIAN NUSWANTORO
SEMARANG
2011
1
2. 1
UNIVERSITAS DIAN NUSWANTORO
PENGESAHAN STATUS TESIS
JUDUL : PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS
DENGAN ALGORITMA FUZZY C-MEANS
NAMA : BAHAR
NPM : P31.2008.00539
mengijinkan Tesis Magister Komputer ini disimpan di Perpustakaan
UniversitasDian Nuswantoro dengan syarat-syarat kegunaan sebagai berikut:
1. Tesis adalah hak milik Universitas Dian Nuswantoro
2. Perpustakaan Universitas Dian Nuswantoro dibenarkan membuat salinanuntuk
tujuan referensi saja.
3. Perpustakaan juga dibenarkan membuat salinan Tesis ini sebagai
bahanpertukaran antar institusi pendidikan tinggi.
4. Berikan tanda √ sesuai dengan kategori Tesis
□ Sangat Rahasia
□ Rahasia
□ Biasa
Disahkan oleh:
……………………………………… ……………………….……………
Bahar Dr. Abdul Syukur
Alamat Tetap:
Jl. Ir. PM. Noor- Perum. GADIK B/14
Sei Ulin Banjarbaru
Tanggal : Tanggal :
3. 2
UNIVERSITAS DIAN NUSWANTORO
PERNYATAAN PENULIS
JUDUL : PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS
DENGAN ALGORITMA FUZZY C-MEANS
NAMA : BAHAR
NPM : P31.2008.00539
“Saya menyatakan dan bertanggungjawab dengan sebenarnya bahwa Tesis ini
adalah hasil karya saya sendiri kecuali cuplikan dan ringkasan yang masing-masing
telah saya jelaskan sumbernya. Jika pada waktu selanjutnya ada pihak lain
yang mengklaim bahwa Tesis ini sebagai karyanya, yang disertai dengan bukti-bukti
yang cukup, maka saya bersedia untuk dibatalkan gelar Magister Komputer
saya beserta segala hak dan kewajiban yang melekat pada gelar tersebut”.
Semarang, 17 Maret 2011
BAHAR
Penulis
4. 3
UNIVERSITAS DIAN NUSWANTORO
PERSETUJUAN TESIS
JUDUL : PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS
DENGAN ALGORITMA FUZZY C-MEANS
NAMA : BAHAR
NPM : P31.2008.00539
Tesis ini telah diperiksa dan disetujui,
Semarang, 17 Maret 2011
Dr. Ing.Vincent Suhartono Romi Satria Wahono, M.Eng
Pembimbing Utama Pembimbing Pembantu
Dr. Abdul Syukur
Direktur MTI UDINUS
5. 4
UNIVERSITAS DIAN NUSWANTORO
PENGESAHAN TESIS
JUDUL : PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS
DENGAN ALGORITMA FUZZY C-MEANS
NAMA : BAHAR
NPM : P31.2008.00539
Tesis ini telah diujikan dan dipertahankan dihadapan Dewan Penguji pada Sidang
Tesis tanggal 16 Maret 2011. Menurut pandangan kami, Tesis ini memadai dari segi
kualitas maupun kuantitas untuk tujuan penganugrahan gelar
Magister Komputer (M.Kom.)
Semarang, 17 Maret 2011
Dewan Penguji:
Dr. Stefanus Santosa, M.Kom M. Arief Soeleman, M.Kom
Ketua Anggota 1
Dr. Ing. Vincent Suhartono H. Himawan, M.Kom
Pendamping Anggota 2
6. 5
ABSTRACT
Appropriate curriculum applicable across Indonesia, 10th grade high school student
who went up to class 11 will experience a selection of majors (majors). Majors are
available at the high school fields of interest include the Natural Sciences, Social
Sciences, and Language Sciences. Majors will be tailored to students' abilities in
areas of interest that exist, the aim for later in life, lessons will be given to students to
be more focused because it has been in accordance with capability in the field of
interest. One consideration for selecting students are majoring in determining student
achievement in semesters one and two (grade 10) in the form of a score value. Less
accurate election process majors with manual systems at high schools or cause the
need for a use of computational methods to classify students majoring in the election
process.
Fuzzy C-Means algorithm is an algorithm that is easy and often used in data
clustering technique kerana efsien make an estimate and does not require many
parameters. Several studies have concluded that the Fuzzy C-Means algorithm can be
used to classify data based on certain attributes. This research will be used Fuzzy C-Means
algorithm to cluster high school student data based on the value of core
subjects for the majors. This study also examined the accuracy of Fuzzy C-Means
algorithm in determining the majors in high school.
Application of Fuzzy C-Means algorithm in determining the majors in high school
students in 81 samples tested in this study show that the Fuzzy C-Means algorithm
has a higher degree of accuracy (average 78.39%), compared with the method
manually determining the direction has been done (only have an average accuracy
level of 56.17%).
Keywords: Clustering, Majors Students, Completeness Minimum Criteria, Fuzzy
C-Means
7. 6
ABSTRAK
Sesuai kurikulum yang berlaku di seluruh Indonesia, siswa kelas 10 SMA yang naik
ke kelas 11 akan mengalami pemilihan jurusan. Penjurusan yang tersedia di SMA
meliputi bidang minat Ilmu Alam, Ilmu Sosial, dan Ilmu Bahasa. Penjurusan akan
disesuaikan dengan kemampuan siswa pada bidang minat yang ada, tujuannya agar
kelak di kemudian hari, pelajaran yang akan diberikan kepada siswa menjadi lebih
terarah karena telah sesuai dengan kemampuan pada bidang minatnya. Salah satu
pertimbangan untuk menyeleksi siswa dalam menentukan jurusan adalah prestasi
siswa pada semester satu dan dua (kelas 10) dalam bentuk skor nilai. Kurang
akuratnya proses pemilihan jurusan dengan sistem manual pada Sekolah Menengah
Atas menyebabkan perlunya suatu penggunaan metode komputasi untuk
mengelompokkan siswa dalam proses pemilihan jurusan.
Algoritma Fuzzy C-Means merupakan satu algoritma yang mudah dan sering
digunakan di dalam teknik pengelompokan data kerana membuat suatu perkiraan
yang efsien dan tidak memerlukan banyak parameter. Beberapa penelitian telah
menghasilkan kesimpulan bahwa algoritma Fuzzy C-Means dapat dipergunakan
untuk mengelompokkan data berdasarkan atribut-atribut tertentu. Pada penelitian ini
akan digunakan algoritma Fuzzy C-Means untuk mengelompokkan data siswa
Sekolah Menengah Atas berdasarkan Nilai mata pelajaran inti untuk proses
penjurusan. Penelitian ini juga menguji tingkat akurasi algoritma Fuzzy C-Means
dalam penentuan jurusan pada Sekolah Menengah Atas.
Penerapan algoritma Fuzzy C-Means dalam penentuan jurusan di Sekolah Menengah
Atas pada 81 sampel data siswa yang diuji dalam penelitian ini menunjukkan bahwa
Algoritma Fuzzy C-Means memiliki tingkat akurasi yang lebih tinggi (rata-rata
78,39%), jika dibandingkan dengan metode penentuan jurusan secara manual yang
selama ini dilakukan (hanya memiliki tingkat akurasi rata-rata 56,17 %).
Kata Kunci : Klastering, Penjurusan Siswa, Kriteria Ketuntasan Minimum Fuzzy
C-Means
8. 7
ACKNOWLEDGMENTS
Puji dan syukur kepada Tuhan Yang Maha Esa, karena atas berkat dan
rakhmat- Nya sehingga tesis dengan judul “Penentuan Jurusan Sekolah Menengah
Atas Dengan Algoritma Fuzzy C-Means” ini dapat diselesaikan dengan baik.
Disadari bahwa tanpa bantuan dan dukungan beberapa pihak, tesis ini tidak dapat
diselesaikan dengan baik. Oleh karena itu pada kesempatan ini diucapkan terima
kasih kepada:
1. Bapak DR. Abdul Syukur selaku Direktur Magister Teknik Informatika yang
telah memfasilitasi selama perkuliahan berlangsung hingga terselesaikannya
penulisan tesis ini.
2. Bapak DR. Ing. Vincent Suhartono dan bapak Romi Satria Wahono, M.Eng
selaku pembimbing tesis, yang telah meluangkan waktu dan mengarahkan
selama penyusunan tesis.
3. Seluruh Staf Pengajar Magister Teknik Informatika Universitas Dian
Nuswantoro, yang telah membagi pengetahuannya selama proses perkuliahan.
4. Seluruh Staf Administrasi Magister Teknik Informatika Universitas Dian
Nuswantoro, yang telah membantu urusan administratif selama proses
perkuliahan dan penyusunan tesis ini.
5. Staf Akademik SMA Negeri 2 Banjarbaru, yang telah membantu kelancaran
proses peneliatain.
6. Keluarga tercinta dan kawan-kawan yang telah membantu secara moril dan
materil selama perkuliahan dan penyusunan tesis ini.
Disadarari bahwa dalam penulisan tesis ini masih terdapat banyak kekurangan,
sehingga saran dan koreksi sangat dibutuhkan dalam proses penyempurnaannya.
Semoga tesis ini memberikan manfaat dalam pengembangan ilmu pengetahuan.
Semarang, Maret 2011
PENULIS
9. 8
DAFTAR ISI
Halaman
HALAMAN JUDUL ..................................................................................................... i
PENGESAHAN STATUS TESIS ............................................................................... 1
PERNYATAAN PENULIS ........................................................................................ iii
PERSETUJUAN TESIS ............................................................................................. iv
PENGESAHAN TESIS ............................................................................................... v
ABSTRACT .................................................................................................................. vi
ABSTRAK ................................................................................................................. vii
ACKNOWLEDGMENTS ........................................................................................ viii
DAFTAR ISI ............................................................................................................... ix
DAFTAR GAMBAR ................................................................................................. 10
DAFTAR TABEL ................................................................................................... x10
BAB I. PENDAHULUAN ........................................................................................... 1
1.1. Latar Belakang ...................................................................................................... 1
1.2. Rumusan Masalah ................................................................................................. 5
1.3. Tujuan Penelitian .................................................................................................. 6
1.4. Manfaat Penelitian ................................................................................................ 6
1.5. Metode Penelitian ................................................................................................. 6
BAB II. LANDASAN TEORI ..................................................................................... 9
2.1. Tinjauan Studi ....................................................................................................... 9
2.2. Tinjauan Pustaka ................................................................................................. 10
2.2.1. Konsep Clustering dalam Data Mining ..................................................... 10
2.2.2. Algoritma Clustering ................................................................................. 13
2.2.3. Algoritma Fuzzy Clustering C-Means (FCM) ........................................... 15
2.2.4. Contoh Kasus Penerapan Fuzzy C-Means ................................................. 18
2.2.5. Sistem Penilaian dan Penjurusan di Sekolah Menengah Atas ................... 34
BAB III. METODOLOGI PENELITIAN ................................................................ 37
3.1. Metode Penelitian .............................................................................................. 37
3.1.1 Jenis Penelitian ........................................................................................ 37
10. 9
3.1.2 Metode Pengumpulan Data ..................................................................... 37
3.1.3 Metode Pengukuran ................................................................................ 43
3.2. Penerapan Fuzzy C-Means dalam Penentuan Jurusan ........................................ 43
BAB IV. HASIL DAN PEMBAHASAN ................................................................. 76
4.1. Hasil Penelitian ................................................................................................... 76
4.2. Pembahasan ......................................................................................................... 79
BAB V. KESIMPULAN DAN SARAN ................................................................... 84
5.1. Kesimpulan ......................................................................................................... 84
5.2. Saran ................................................................................................................... 84
DAFTAR PUSTAKA ................................................................................................ 86
11. 10
DAFTAR GAMBAR
Halaman
Gambar 1.1 Skema Kerangka Pemikiran ......................................................................... 7
Gambar 2.1 Kategori Algoritma Clustering................................................................... 13
Gambar 2.2 Dendogram ................................................................................................. 14
Gambar 3.1 Diagram Korelasi Antar Mata Pelajaran dengan Peminatan ...................... 44
Gambar 3.2 Posisi Klaster Untuk Data Pertama (Peminatan IPA) ................................ 68
Gambar 3.3 Posisi Klaster Untuk Data Kedua (Peminatan IPS) ................................... 69
Gambar 3.3 Posisi Klaster Untuk Data Ketiga (Peminatan Bahasa) ............................. 70
Gambar 4.1 Garafik Akurasi Hasil Peminatan Algoritma FCM pada Peminatan di
SMA Tahun Pertama (Kelas XI) ................................................................ 83
Gambar 4.2 Garafik Akurasi Hasil Peminatan Algoritma FCM pada Peminatan di
SMA Tahun Kedua (Kelas XII) ................................................................. 83
12. 11
DAFTAR TABEL
Halaman
Tabel 1.1 Data Prestasi Siswa di Sebuah Sekolah Menengah Atas Setelah Proses
Penjurusan ........................................................................................................ 2
Tabel 2.1 Data Industri Kecil ......................................................................................... 18
Tabel 2.2 Hasil Perhitungan Pusat Klaster Pertama....................................................... 21
Tabel 2.3 Lanjutan Tabel 2.2 ........................................................................................ 22
Tabel 2.4 Detail Perhitungan Fungsi Objektif ............................................................... 23
Tabel 2.5 Lanjutan Tabel 2.4 ........................................................................................ 24
Tabel 2.6 Lanjutan Tabel 2.5 ......................................................................................... 25
Tabel 2.7 Detail Perhitungan Derajat Keanggotaan Baru ............................................. 26
Tabel 2.8 Lanjutan Tabel 2.7 ......................................................................................... 27
Tabel 2.9 Derajat Keanggotaan Tiap Data Pada Setiap Cluster dengan FCM .............. 33
Tabel 3.1 Sampel Data Nilai Rata-rata Siswa pada Bidang Minat Tertentu Sebelum
Peminatan ....................................................................................................... 38
Tabel 3.2 Sampel Data Nilai Rata-rata Siswa pada Bidang Minat Siswa Angkatan
2008 SMA N 2 Banjarbaru Tahun 2010 Setelah Peminatan ......................... 40
Tabel 3.3 Hasil Perhitungan Pusat Klaster pada Iterasi Pertama Klaster ke- ........47
Tabel 3.4 Hasil Perhitungan Pusat Klaster pada Iterasi Pertama Klaster ke-2.. ....50
Tabel 3.5 Hasil Perhitungan Pusat Klaster pada Iterasi Pertama Klaster ke-3... .....52
Tabel 3.6 Hasil Perhitungan Fungsi Objektif Pada Iterasi Pertama .............................. 55
Tabel 3.7 Hasil Perhitungan Derajat Keanggotaan Baru .............................................. 59
Tabel 3.8 Derajat Keanggotaan Tiap Data Pada Setiap Klaster Dengan FCM
Pada Iterasi Terakhir ..................................................................................... 73
Tabel 4.1 Hasil Peminatan yang Dipilih dan Hasil Peminatan yang Dihasilkan
Oleh FCM ..................................................................................................... 77
Tabel 4.2 Akurasi Hasil Peminatan Algoritma FCM .................................................... 80
13. 12
BAB I
PENDAHULUAN
1.1 Latar Belakang
Dalam proses pendidikan di sekolah, perbedaan masing-masing siswa harus
diperhatikan karena dapat menentukan baik buruknya prestasi belajar siswa. Tujuan
sekolah yang mendasar adalah mengembangkan semua bakat dan kemampuan siswa
selama proses pendidikan. Perbedaan individual antara siswa di sekolah di antaranya
meliputi perbedaan kemampuan kognitif, motivasi berprestasi, minat dan kreativitas.
Dengan adanya perbedaan individu tersebut, maka fungsi pendidikan tidak hanya
dalam proses belajar mengajar, tetapi juga meliputi bimbingan/konseling, pemilihan
dan penempatan siswa sesuai dengan kapasitas individual yang dimiliki, rancangan
sistem pengajaran yang sesuai dan strategi mengajar yang disesuaikan dengan
karakteristik individu siswa. Kemungkinan yang akan terjadi jika siswa mengalami
kesalahan dalam penempatan yang tidak sesuai dengan kapasitas individual yang
dimiliki adalah rendahnya prestasi belajar siswa [1]. Oleh karena itu, manajemen
sekolah memegang peranan penting untuk dapat mengembangkan potensi diri yang
dimiliki oleh siswa.
Penempatan siswa sesuai dengan kapasitas kemampuannya atau sering disebut
dengan penjurusan siswa di sekolah menengah ditentukan oleh kemampuan
akademik yang didukung oleh faktor minat, karena karakteristik suatu ilmu menuntut
karakteristik yang sama dari yang mempelajarinya. Dengan demikian, siswa yang
mempelajari suatu ilmu yang sesuai dengan karakteristik kepribadiannya akan
merasa senang ketika mempelajari ilmu tersebut. Minat dapat mempengaruhi kualitas
pencapaian hasil belajar siswa dalam bidang studi tertentu. Seorang siswa yang
berminat pada Matematika misalnya, akan memusatkan perhatiannya lebih banyak
ke bidang Matematika daripada siswa lain. Karena pemusatan perhatian
intensif terhadap materi, siswa akan belajar lebih giat dan mencapai prestasi yang
diinginkan [1].
Sesuai kurikulum yang berlaku di seluruh Indonesia, siswa kelas X SMA yang
naik ke kelas XI akan mengalami pemilihan jurusan (penjurusan). Penjurusan yang
tersedia di SMA meliputi Ilmu Alam (IPA), Ilmu Sosial (IPS), dan Ilmu Bahasa.
Penjurusan akan disesuaikan dengan kemampuan dan minat siswa. Tujuannya adalah
14. 13
agar kelak di kemudian hari, pelajaran yang akan diberikan kepada siswa menjadi
lebih terarah karena telah sesuai dengan kemampuan dan minatnya. Salah satu
pertimbangan untuk menyeleksi siswa dalam menentukan jurusan adalah prestasi
siswa pada semester satu dan dua (kelas X) dalam bentuk nilai mata pelajaran[1].
Proses penjurusan diselenggarakan untuk menyeleksi dan mengumpulkan
kemampuan peserta didik yang sama untuk menempuh satu program pendidikan
yang sama juga. Disamping itu, penjurusan juga diselenggarakan untuk
menyesuaikan kemampuan dan minat peserta didik terhadap bidang yang dipilihnya.
Penempatan penjurusan yang sesuai akan meningkatkan minat dan memberikan
kenyamanan seseorang dalam belajar. Dengan dasar kemampuan yang sama
diharapkan dalam kegiatan pembelajaran dapat berjalan dengan lancar tanpa ada
yang mengalami kesulitan dan dapat meningkatkan minat serta prestasi belajar
peserta didik. Sebaliknya, kurangnya minat untuk belajar akibat kesalahan dalam
memilih jurusan menyebabkan kelesuan dan hilangnya gairah dalam belajar. Peserta
didik sering tidak masuk belajar, membuat kelas gaduh, meninggalkan jam pelajaran
dan sebagainya sehingga menyebabkan prestasinya menurun[2].
Tabel 1.1 berikut ini memperlihatkan data prestasi siswa di sebuah Sekolah
Menengah Atas setelah proses penjurusan dilaksanakan:
Tabel 1.1 Data Prestasi Siswa di Sebuah Sekolah Menengah Atas Setelah Proses
Penjurusan (Peminatan)
Nilai Rata-rata Mata Pelajaran Peminatan
Jurusan Yang
Siswa Setelah Peminatan/ Penjurusan
Kelas XI Kelas XII
Dipilih
1 Bahasa 7 5,50 74,20
2 IPS 77,00 75,50
3 IPA 75,50 78,00
4 Bahasa 7 2,00 74,50
5 IPA 72,80 71,50
6 IPA 71,50 74,50
7 IPS 69,00 65,50
8 IPA 70,50 72,50
9 Bahasa 7 6,25 75,50
10 Bahasa 7 4,50 72,50
15. 14
Nilai Rata-rata Mata Pelajaran Peminatan
Setelah Peminatan/ Penjurusan
Kelas XI Kelas XII
Siswa
Jurusan Yang
Dipilih
11 Bahasa 78,00 76,50
12 IPS 73,00 74,80
13 IPS 71,50 74,00
14 IPS 67,50 65,00
15 Bahasa 7 5,50 69,50
16 IPA 84,30 81,30
17 IPS 80,70 82,50
18 Bahasa 7 6,00 80,50
19 Bahasa 8 1,50 82,50
20 IPA 74,00 71,00
21 IPA 69,50 73,50
22 IPS 82,50 79,50
23 IPS 72,50 70,75
24 Bahasa 6 5,50 70,50
25 IPA 66,00 68,30
26 IPS 78,00 76,50
27 IPA 72,50 71,00
28 Bahasa 7 1,00 67,50
29 Bahasa 8 2,00 80,00
30 IPA 72,50 67,80
31 Bahasa 7 1,90 73,50
32 IPA 80,70 75,50
33 Bahasa 8 0,50 88,50
34 IPS 82,75 80,50
35 IPS 83,50 81,50
36 IPA 78,20 75,50
37 IPA 74,50 72,00
38 Bahasa 7 9,00 81,30
39 IPS 70,70 72,00
40 IPS 69,50 77,50
41 IPA 79,50 70,30
42 IPS 75,80 72,30
43 Bahasa 8 0,50 82,50
44 IPS 78,50 75,80
45 IPA 74,50 72,80
46 IPA 74,00 72,70
47 IPA 73,60 71,80
16. 15
Nilai Rata-rata Mata Pelajaran Peminatan
Setelah Peminatan/ Penjurusan
Kelas XI Kelas XII
Siswa
Jurusan Yang
Dipilih
48 Bahasa 7 3,80 7 4,50
49 Bahasa 7 8,50 8 2,00
50 IPA 80,50 7 9,40
51 IPS 77,50 8 0,00
52 Bahasa 8 5,00 8 1,70
53 Bahasa 7 3,80 6 9,80
54 IPA 75,50 8 0,60
55 IPA 83,60 8 4,50
56 Bahasa 7 8,50 8 2,60
57 IPS 79,60 7 5,50
58 IPS 74,20 7 2,50
59 Bahasa 7 5,80 7 7,00
60 IPA 70,50 7 4,30
61 Bahasa 7 5,00 7 5,20
62 IPA 78,10 7 5,80
63 IPS 77,50 8 1,20
64 Bahasa 6 6,90 6 8,20
65 Bahasa 7 4,50 7 4,00
66 IPA 77,60 7 8,00
67 IPS 79,00 8 0,60
68 IPA 77,50 7 8,00
69 IPS 80,20 8 2,80
70 Bahasa 7 6,40 7 8,10
71 IPS 74,00 7 4,50
72 IPA 70,80 6 9,50
73 IPA 84,20 8 2,50
74 IPS 75,80 7 5,00
75 IPS 87,60 8 2,80
76 Bahasa 7 4,50 7 2,10
77 Bahasa 7 5,80 7 7,10
78 IPA 72,40 7 4,00
79 IPA 78,60 8 2,10
80 Bahasa 8 0,20 7 9,60
81 IPS 67,80 7 4,00
Sumber: Akademik SMU Negeri 2 Banjarbaru, 2010
17. 16
Data pada tabel 1.1 memperlihatkan 81 sampel data dari 115 anggota
populasi siswa kelas X yang telah melaksanakan penjurusan. Pada tabel tersebut,
ada 42 siswa (41,98%) saat di kelas XI dan 46 siswa (45,68%) saat di kelas XII yang
memiliki nilai rata-rata Mata Pelajaran peminatan kurang dari Kriteria Ketuntasan
Minimal (KKM) yang ideal sebesar 75 [3].
Pembentukan klaster atau kelompok data merupakan salah satu teknik yang
digunakan dalam mengekstrak pola kecenderungan suatu data. Analisis klaster atau
klastering merupakan proses membagi data dalam suatu himpunan ke dalam
beberapa kelompok yang kesamaan datanya dalam suatu kelompok lebih besar
daripada kesamaan data tersebut dengan data dalam kelompok lain[4]. Suatu cara
yang sangat terkenal dalam pengklasteran data set adalah dengan penerapan
algoritma klastering [5]. Ada beberapa algoritma klastering data, salah satu
diantaranya adalah Fuzzy C-Means. Penelitian yang dilakukan oleh Ernawati dan
Susanto [6] mengkaji tentang penerapan Fuzzy Clustering untuk membagi peserta
kuliah berdasarkan nilai mata kuliah prasyarat/pendukung yang pernah mereka
peroleh. Penelitian ini berhasil membagi kelas para peserta kuliah sebagai hasil
penerapan algoritma Fuzzy Clustering, dan merekomendasikan peserta kelas dengan
valid.
Penelitian ini akan menganalisis penerapan algoritma Fuzzy Clustering
C-Means untuk pengelompokan siswa Sekolah Menengah Atas (SMA) dalam
penentuan jurusan berdasarkan prestasi siswa.
1.2 Rumusan Masalah
Berdasarkan uraian pada latar belakang, dirumuskan suatu permasalahan
yaitu rendahnya prestasi akademik siswa Sekolah Menengah Atas (SMA) pada
kelompok mata pelajaran peminatan akibat salah memilih bidang minat (jurusan)
yang sesuai dengan kemampuan akademik pada saat proses peminatan (penjurusan).
Penggunaan metode Fuzzy Clustering C-Means akan menjadi solusi yang diharapkan
lebih tepat dan akurat dalam pemilihan jurusan di SMA berdasarkan kemampuan
akademik siswa.
18. 17
1.3 Tujuan Penelitian
Penelitian ini bertujan untuk menerapkan algoritma Clustering Fuzzy
C-Means untuk mengelompokkan siswa Sekolah Menengah Atas (SMA)
berdasarkan nilai (prestasi) akademik mata pelajaran peminatan dalam proses
penentuan jurusan.
1.4 Manfaat Penelitian
Manfaat yang diharapkan dari hasil penelitian ini adalah sebagai berikut:
1. Manfaat teoritis: diharapkan dapat menjadi referensi untuk penggunaan model
Algoritma Clustering Fuzzy C-Means bagi praktisi atau peneliti lain untuk
diterapkan pada kasus penelitian yang lain, dengan melihat karakteristik
penggunaan algoritma ini dalam pengolahan (pengelompokan) data siswa SMA
untuk pemilihan jurusan berdasarkan nilai prestasi akademik.
2. Manfaat praktis: diharapkan dapat membantu pihak sekolah (khususnya
manajemen Sekolah Menengah Atas) untuk meningkatkan akurasi dalam proses
pengelompokan siswa dalam pemilihan jurusan berdasarkan nilai prestasi siswa.
3. Manfaat kebijakan: diharapkan metode Fuzzy C-Means akan menjadi metode
standar yang digunakan oleh jajaran manajemen Sekolah Menengah Atas (SMU)
dalam proses penjurusan siswa.
1.5 Metode Penelitian
Secara umum metode penelitian yang telah dilaksanakan mengacu pada
kerangka pemikiran seperti pada gambar 1.1:
19. 18
Masalah
Proses Pemilihan Jurusan (Penjurusan) di Sekolah Menengah Atas Berdasarkan Nilai (Prestasi)
Akademik Siswa Tidak Akurat
Pendekatan Komputasi
Pengelompokan siswa SMA dalam Proses Pemilihan Jurusan Berdasarkan Nilai Akademik
menggunakan Algoritma Fuzzy C-Means
Tools
Activity Diagram dan Software MATLAB
Pengujian dan Analisis
Uji dan Analisis komparasi hasil klastering algoritma Fuzzy C-Means dengan data
empiris Penjurusan di Sekolah Menengah Atas (SMA)
HASIL
Manajemen akademik Sekolah Menengah Atas (SMA) Akurat dalam melakukan penjurusan
siswa berdasarkan nilai prestasi akademik
Gambar 1.1 Skema Kerangka Pemikiran
1. Identifikasi Permasalahan: merupakan studi pendahuluan untuk mengkaji
permasalahan pada proses pengelompokan siswa SMA berdsarkan nilai
prestasi akademik dalam proses penjurusan.
2. Pendekatan dalam Penyelelesaian Masalah: merupakan tahapan menemukan
metode yang tepat dalam penyelesaian permasalahan berdasarkan kajian
pustaka. Algoritma Clustering Fuzzy C-Means , yang sudah teruji melalui
beberapa penelitian untuk kasus pengelompokan data akan diuji coba dalam
pengelompokan data nilai prestasi akademik untuk proses penjurusan siswa.
3. Penerapan dan Pengujian serta analisis hasil: merupakan tahapan proses
pengujian hasil klaster metode Fuzzy C-Means dalam mengelompokan
siswa SMA berdasarkan nilai prestasi akademik dalam proses penjurusan,
20. 19
dengan data traning berupa data nilai prestasi akademik siswa kelas X. Hasil
penerapan metode Fuzzy C-Means diuji dengan uji komparasi terhadap
kondisi real hasil Penjurusan di SMA.
4. Penarikan kesimpulan hasil penelitian
21. 20
BAB II
LANDASAN TEORI
2.1 Tinjauan Studi
Ernawati dan Susanto dari Program Studi Teknik Informatika Universitas
Atma Jaya Yogyakarta, meneliti tentang penerapan Fuzzy Clustering untuk
pembagian kelas peserta kuliah [ 6]. Penelitian ini menggunakan sampel 121 orang
mahasiswa Jurusan Teknik Informatika Universitas Atma Jaya Yogyakarta yang
menempuh perkuliahan Struktur Data Lanjut. Setiap mahasiswa dicirikan oleh dua
atribut, yaitu nilai yang pernah mereka peroleh untuk dua mata kuliah prasyarat
(Algoritma dan Pemrograman dan Struktur Data). Dalam pembahasan untuk menilai
anggota kelompok yang sah dan valid, menggunakan ukuran Fukuyama-Sugeno’s
Fuzzy Cluster Validity Index. Hasil dari penelitian ini adalah pembagian kelas para
peserta kuliah sebagai hasil penerapan algoritma Fuzzy Clustering terhadap data ke-
121 peserta mata kuliah Struktur Data Lanjut untuk pelbagai kemungkinan jumlah
kelas, dan rekomendasi peserta kelas yang valid.
Arwan Ahmad Khoiruddin dari Jurusan Teknik Informatika Universitas
Islam Indonesia, meneliti tentang Penentuan Nilai Akhir Kuliah dengan Fuzzy C-Means
[7]. Penelitian menyimpulkan bahwa metode Fuzzy C-Means dapat digunakan
untuk menentukan nilai akhir kuliah secara alami karena didasarkan pada
kecenderungan masing-masing data pada clusternya.
Emha Taufiq Luthfi dari STMIK Amikom Yogyakarta, meneliti tentang
algoritma Fuzzy C-Means untuk Clustering Data Performance Mengajar Dosen [8].
Dalam penelitian tersebut dilakukan percobaan untuk mengetahui kemungkinan
adanya cluster-cluster dari data performance mengajar dosen. Penelitian
menggunakan beberapa kriteria sebagai acuan dalam proses clustering yaitu:
penguasaan dan kemampuan dalam menjelaskan materi, kemampuan dalam
menjawab pertanyaan, kemampuan dalam member motivasi mahasiswa, kemampuan
dalam membuat suasana kelas menyenangkan dan kedisiplinan hadir dalam
perkuliahan. Penelitian ini berhasil memunculkan beberapa custer data yang dapat
dianalisis lebih lanjut persamaan dan perbedaannya. Dari 4 pusat cluster yang di set
22. 21
di awal iterasi, ada 2 cluster yang mempunyai nilai sama, yaitu cluster 3 dan cluster
4, dengan demikian hanya dihasilkan 3 buah cluster performance mengajar dosen.
2.2 Tinjauan Pustaka
2.2.1 Konsep Clustering dalam Data Mining
Konsep dasar data mining adalah menemukan informasi tersembunyi dalam
sebuah basis data dan merupakan bagian dari Knowledge Discovery in Databased
(KDD) untuk menemukan informasi dan pola yang berguna dalam data [9]. Data
mining mencari informasi baru, berharga dan berguna dalam sekumpulan data
dengan melibatkan komputer dan manusia serta bersifat iteratif baik melalui proses
yang otomatis ataupun manual. Secara umum sifat data mining adalah:
a. Predictive: menghasilkan model berdasarkan sekumpulan data yang dapat
digunakan untuk memperkirakan nilai data yang lain. Metode yang termasuk
dalam prediktif data mining adalah:
- Klasifikasi: pembagian data ke dalam beberapa kelompok yang telah
ditentukan sebelumnya
- Regresi: memetakan data ke suatu prediction variable
- Time Series Analisys: pengamatan perubahan nilai atribut dari waktu ke
waktu
b. Descriptive: mengidentifikasi pola atau hubungan dalam data untuk
menghasilkan informasi baru. Metode yang termasuk dalam Descriptive Data
Mining adalah:
- Clustering: identifikasi kategori untuk mendeskripsikan data
- Association Rules: Identifikasi hubungan antar data yang satu dengan
yang lainnya.
- Summarization: pemetaan data ke dalam subset dengan deskripsi
sederhana.
- Sequence Discovery: identifikasi pola sekuensial dalam data
Clustering membagi data menjadi kelompok-kelompok atau cluster
berdasarkan suatu kemiripan atribut-atribut diantara data tersebut [9]. Karakteristik
tiap cluster tidak ditentukan sebelumnya, melainkan tercermin dari kemiripan data
23. 22
yang terkelompok di dalamnya. Oleh sebab itu hasil clustering seringkali perlu
diinterprestasikan oleh pihak-pihak yang benar-benar mengerti mengenai karakter
domain data tersebut. Selain digunakan sebagai metode yang independen dalam data
mining, clustering juga digunakan dalam pra-pemrosesan data sebelum data diolah
dengan metode data mining yang lain untuk meningkatkan pemahaman terhadap
domain data.
Karakteristik terpenting dari hasil clustering yang baik adalah suatu instance
data dalam suatu cluster lebih ”mirip” dengan instance lain di dalam cluster tersebut
daripada dengan instance di luar dari cluster itu [10]. Ukuran kemiripan (similarity
measure) tersebut bisa bermacam-macam dan mempengaruhi perhitungan dalam
menentukan anggota suatu cluster. Jadi tipe data yang akan di-cluster (kuantitatif
atau kualitatif) juga menentukan ukuran apa yang tepat digunakan dalam suatu
algoritma. Selain kemiripan antar data dalam suatu cluster, clustering juga dapat
dilakukan berdasarkan jarak antar data atau cluster yang satu dengan yang lainnya.
Ukuran jarak (distance atau dissimilarity measure) yang merupakan kebalikan dari
ukuran kemiripan ini juga banyak ragamnya dan penggunaannya juga tergantung
pada tipe data yang akan di-cluster. Kedua ukuran ini bersifat simetris, dimana jika A
dikatakan mirip dengan B maka dapat disimpulkan bahwa B mirip dengan A.
Ada beberapa macam rumus perhitungan jarak antar cluster. Untuk Tipe data
numerik, sebuah data set X beranggotakan x1 ∈ X, i = 1, ..., n, tiap item
direpresentasikan sebagai vektor X1= {Xi1, Xi2, Xim} dengan m sebagai jumlah
dimensi dari item. Rumus-rumus yang biasa digunakan sebagai ukuran jarak antara
Xi dan Xj untuk data numerik ini antara lain:
a. Euclidean Distance
24. ( − )
……………………………………… (2.1)
Ukuran ini sering digunakan dalam clustering karena sederhana. Ukuran ini
memiliki masalah jika skala nilai atribut yang satu sangat besar dibandingkan
nilai atribut lainnya. Oleh sebab itu, nilai-nilai atribut sering dinormalisasi
sehingga berada dalam kisaran 0 dan 1.
25. 23
b. City Block Distance atau Manhattan Distance
26. − ……………………………………………(2.2)
Jika tiap item digambarkan sebagai sebuah titik dalam grid, ukuran jarak ini
merupakan banyak sisi yang harus dilewati suatu titik untuk mencapai titik
yang lain seperti halnya dalam sebuah peta jalan.
c. Minkwoski Metric
27. ( − )
……………………………. .……. . (2.3)
Ukuran ini merupakan bentuk umum dari Euclidean Distance dan
Manhattan Distance. Euclidean Distance adalah kasus dimana nilai p=2
sedangkan Manhattan Distance merupakan bentuk Minkwoski dengan p=1.
Dengan demikian, lebih banyak nilai numerik yang dapat ditempatkan pada
jarak terjauh di antara 2 vektor. Seperti pada Euclidean Distance dan juga
Manhattan Distance, ukuran ini memiliki masalah jika salah satu atribut
dalam vektor memiliki rentang yang lebih besar dibandingkan atribut-atribut
lainnya.
d. Cosine – Corelation (ukuran kemiripan dari model Euclidean n-dimensi)
. )
Σ (
.Σ
Σ
…………………………………………. .…(2.4)
Ukuran ini bagus digunakan pada data dengan tingkat kemiripan tinggi
walaupun sering pula digunakan bersama pendekatan lain untuk membatasi
dimensi dari permasalahan.
Dalam mendefenisikan ukuran jarak antar cluster yang digunakan beberapa
algoritma untuk menentukan cluster mana yang terdekat, perlu dijelaskan mengenai
atribut-atribut yang menjadi referensi dari suatu cluster [10]. Untuk suatu cluster Km
berisi N item {Xm1, Xm2, ..., Xmn}:
28. 24
- Centroid: suatu besaran yang dihitung dari rata-rata nilai dari setiap item
dari suatu cluster menurut rumus:
=
Σ ||
29. ……………………………………………. . (2.5)
- Medoid: item yang letaknya paling tengah
Metode-metode untuk mencari jarak antar cluster:
- Single Link: jarak terkecil antar suatu elemen dalam suatu cluster dengan
elemen lain di cluster yang berbeda.
- Complete Link: jarak terbesar antar satu elemen dalam suatu cluster
dengan elemen lain di cluster yang berbeda.
- Average: jarak rata-rata antar satu elemen dalam suatu cluster dengan
elemen lain di cluster yang berbeda
- Centoid: jarak antar centroid dari tiap cluster dengan centroid cluster
lainnya.
- Medoid: jarak antar medoid dari tiap cluster dengan medoid cluster
lainnya.
2.2.2 Algoritma Clustering
Secara umum pembagian algoritma clustering dapat digambarkan sebagai
berikut:
Clustering
Hierarchical Partitional Clustering
Gambar 2.1 Kategori Algoritma Clustering
Large Data
Agglomerative Divisive
30. 25
Hierarchical clustering menentukan sendiri jumlah cluster yang dihasilkan.
Hasil dari metode ini adalah suatu struktur data berbentuk pohon yang disebut
dendogram dimana data dikelompokkan secara bertingkat dari yang paling bawah
dimana tiap instance data merupakan satu cluster sendiri, hingga tingkat paling atas
dimana keseluruhan data membentuk satu cluster besar berisi cluster-cluster seperti
gambar 2.2
A B C D E
Gambar 2.2 Dendogram
1
2
3
4
Divisive hierarchical clustering mengelompokkan data dari kelompok yang terbesar
hingga ke kelompok yang terkecil, yaitu masing-masing instance dari kelompok data
tersebut. Sebaliknya, agglomerative hierarchical clustering mulai mengelompokkan
data dari kelompok yang terkecil hingga kelompok yang terbesar [10]. Beberapa
algoritma yang menggunakan metode ini adalah: RObust Clustering Using LinKs
(ROCK), Chameleon, Cobweb, Shared Nearest Neighbor (SNN).
Partitional clustering yang mengelompokkan data ke dalam k cluster dimana
k adalah banyaknya cluster dari input user. Kategori ini biasanya memerlukan
pengetahuan yang cukup mendalam tentang data dan proses bisnis yang
memanfaatkannya untuk mendapatkan kisaran nilai input yang sesuai. Beberapa
algoritma yang masuk dalam kategori ini antara lain: K-Means, Fuzzy C-Means,
Clustering Large Aplications (CLARA), Expectation Maximation (EM), Bond
Energy Algorithm (BEA), algoritma Genetika, Jaringan Saraf Tiruan.
31. 26
Clustering Large Data, dibutuhkan untuk melakukan clustering pada data
yang volumenya sangat besar sehingga tidak cukup ditampung dalam memori
komputer pasa suatu waktu. Biasanya untuk mengatasi masalah besarnya volume
data, dicari teknik-teknik untuk meminimalkan berapa kali algoritma harus membaca
seluruh data. Beberapa algoritma yang masuk dalam kategori ini antara lain:
Balanced Iteratif Reducing and clustering using hierarchies (BIRCH), Density
Based Spatial Clustering of Application With Noise (DCSCAN), Clustering
Categorical Data Using Summaries (CACTUS).
2.2.3 Algoritma Fuzzy Clustering C-Means (FCM)
Pada proses pengklasteran (clustering) secara klasik (misalnya pada
algoritma Clustering K-Means), pembentukan partisi dilakukan sedemikian rupa
sehingga setiap obyek berada tepat pada satu partisi. Namun, adakalanya tidak dapat
menempatkan suatu obyek tepat pada suatu partisi, karena sebenarnya obyek tersebut
terletak di antara 2 atau lebih partisi yang lain. Pada logika fuzzy, metode yang dapat
digunakan untuk melakukan pengelompokan sejumlah data dikenal dengan nama
fuzzy clustering. Fuzzy Clustering lebih alami jika dibandingkan dengan
pengklasteran secara klasik. Suatu algoritma clustering dikatakan sebagai fuzzy
clustering jika algoritma tersebut menggunakan parameter strategi adaptasi secara
soft competitive. Sebagian besar algoritma fuzzy clustering didasarkan atas optimasi
fungsi obyektif atau modifikasi dari fungsi obyektif tersebut [11].
Salah satu teknik fuzzy clustering adalah Fuzzy C-Means (FCM). FCM adalah
suatu teknik pengklasteran data yang keberadaan tiap-tiap data dalam suatu cluster
ditentukan oleh nilai/derajat keanggotaan tertentu. Teknik ini pertama kali
diperkenalkan oleh Jim Bezdek pada tahun 1981 [11]. Berbeda dengan teknik
pengklasteran secara klasik (dimana suatu obyek hanya akan menjadi anggota suatu
klaster tertentu), dalam FCM setiap data bisa menjadi anggota dari beberapa cluster.
Batas-batas cluster dalam FCM adalah lunak (soft). Konsep dasar FCM, pertama
kali adalah menentukan pusat cluster yang akan menandai lokasi rata-rata untuk tiap-tiap
cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap data
memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki
32. 27
pusat cluster dan nilai keanggotaan tiap-tiap data secara berulang, maa akan terlihat
bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini
didasarkan pada minimasi fungsi obyektif. Fungsi Obyektif yang digunakan pada
FCM adalah[11]:
Jw(U,V;X) = Σ Σ (#$)%(#$)' ………………………………….…. . ( (#
)
*$
) 2.6)
dengan + ∈ ,1,∞),
5
6 ……………………….…………( 72
)
#$ = (/$ − 0#) = 1 Σ (/$2 − 30#24
32
.7)
x adalah data yang akan diklaster:
/)) ⋯ /)7
⋮ ⋮
/*) ⋯ /*7
/ = 8
; …………………………….…………………… (2.8)
dan v adalah matriks pusat cluster :
0)) ⋯ 0)7
⋮ ⋮
07) ⋯ 077
0 = 8
; ………………………………………………… (2.9)
nilai Jw terkecil adalah yang terbaik, sehingga:
% ∗
(∗, ?∗; A) = min (, ?, A) …………………………………………(2.10)
Jika #$ 0, ∀H, I;+ 1 dan X setidaknya memiliki m elemen, maka (, ?) ∈
JK7 / L7M dapat meminimasi Jw hanya jika:
#$ =
NΣ OPQR S TUR V6 WR
X5 Y
Z5
[Z5
Σ WR
6 X5
NΣ X5 OPQR S TUR WU
VY Z5
[Z5
; 1 £ i £ m; 1 £ k £ n ………………………..…(2.11)
dan
?$2 = Σ ((QU)[ ]Q
X5 ∗ PQR )
Σ (QU)[ ]Q
X5
; 1 £ i £ m; 1 £ j £ m ……………………………………(2.12)
33. 28
Algoritma Fuzzy C-Means (FCM) diberikan sebagai berikut [12]:
1. Menentukan data yang akan di cluster X, berupa matriks berukuran n x m
(n=jumlah sampel data, m = atribut setiap data). Xij = data sampel ke-i
(i=1,2,...,n), atribut ke-j (j=1,2,...,m).
2. Menentukan:
- Jumlah cluster = c
- Pangkat = w
- Maksimum interasi = MaxIter
- Error terkecil yang diharapkan = ξ
- Fungsi objektif awal = Po = 0
- Interasi awal = t =1
3. Membangkitkan bilangan random μik, i=1,2,3 ..., n; k=1,2,3 ...c; sebagai
elemen-elemen matriks partisi awal U.
Menghitung jumlah setiap kolom:
^#
Σ QU
_
UX5
dengan j=1,2,...n.
Menghitung:
#$ = QU
`Q
…………...…………………...………..………( 2.13)
…………...……………..………………………..…( 2.14)
4. menghitung pusat cluster ke-k: Vkj, dengan k=1,2,...c; dan j=1,2,...m
?$2 = Σ ((QU)[ ]Q
X5 ∗ PQR )
Σ (QU)[ ]Q
X5
…………...……………..………( 2.15)
5. menghitung fungsi objektif pada interasi ke-t :
ab
Σ Σ cNΣ OPQR S TUR V6 WR
X5 Y(QU)[d _
UX5
] QX5
6. menghitung perubahan matriks partisi :
#$ =
Z5
[Z5
NΣ OPQR S TUR V6 WR
X5 Y
Σ NΣ OPQR S TUR V6 WR
X5 Y _
UX5
Z5
[Z5
……………......…… ( 2.16)
…………………….……( 2.17)
34. 29
dengan: i=1,2,...n; dan k=1,2,...c.
7. Memeriksa kondisi berhenti:
- Jika: (|Pt – Pt-1| ξ) atau (t MaxIter) maka berhenti
- Jika tidak: t=t+1, mengulang langkah ke-4.
2.2.4 Contoh Kasus Penerapan Fuzzy C-Means
Misalkan pada suatu Pemerintah Daerah di sutau kabupaten mendata 30
industri kecil di lingkungannya berdasarkan modal awal yang mereka miliki, rata-rata
penjualan per bulan dan rata-rata laba setiap bulan. Data lengkap disajikan pada
tabel 2.1 berikut [12]:
Tabel 2.1 Data Industri Kecil
No
Modal Awal
(Rp)
Rata-rata Penjualan
per Bulan (Rp)
Lama
Beroperasi
(Bulan)
Rata-rata Laba
per Bulan (Rp)
1 15.000.000 25.000.000 42 5.000.000
2 20.000.000 26.420.000 72 5.230.000
3 17.820.000 22.025.000 35 5.200.000
4 16.205.000 18.500.000 12 4.250.000
5 8.000.000 15.200.000 5 3.500.000
6 14.260.000 19.640.000 15 4.023.000
7 7.025.000 15.230.000 19 5.000.000
8 25.032.000 34.000.000 28 8.000.000
9 24.320.000 35.100.000 39 12.500.000
10 25.602.000 38.200.000 43 13.250.000
11 19.872.000 28.000.000 27 10.500.000
12 19.000.000 25.000.200 41 6.350.000
13 16.540.200 30.000.200 29 7.525.000
14 28.920.000 41.000.000 58 15.620.000
15 15.870.200 26.750.000 19 4.025.000
16 26.840.320 39.000.200 47 13.025.000
17 24.601.200 38.450.000 64 11.000.250
18 21.650.000 37.525.000 60 9.850.000
19 18.602.000 30.500.000 74 11.230.000
20 35.024.000 52.000.000 73 18.230.000
35. 30
No
Untuk memberikan pengarahan lebih intensif ke setiap industri kecil,
pemerintah kabupaten tersebut membagi industri-industri ini menjadi beberapa
kelompok, di mana setiap kelompok terdiri atas industri-industri dengan latar
belakang modal, rata-rata penjualan dan rata-rata laba yang senada.
Apabila diinginkan industri-industri tersebut terbagi dalam 5 kelompok, maka
dengan menggunakan algoritma Fuzzy C-Means (FCM) clustering dapat ditetapkan
nilai awal sebagai berikut:
1. Jumlah cluster (c) = 5
2. Pangkat (w) = 2
3. Maksimum interasi (MaxIter) = 100
4. Error terkecil yang diharapkan (ξ) = 10-5
5. Fungsi objektif awal (ae) = 0
6. Interasi Awal (t) = 1
Misalnya matrik partisi awal U yang terbentuk (secara random) adalah sebagai
berikut :
Modal Awal
(Rp)
Rata-rata Penjualan
per Bulan (Rp)
Lama
Beroperasi
(Bulan)
Rata-rata Laba
per Bulan (Rp)
21 39.024.300 52.050.000 26 15.725.000
22 27.500.000 36.500.000 6 10.560.000
23 32.500.500 45.600.000 10 16.583.000
24 27.963.000 40.250.000 38 13.670.000
25 37.250.020 51.000.000 68 18.530.000
26 16.523.000 26.750.000 9 8.500.000
27 25.690.000 39.565.000 48 15.250.000
28 34.500.000 51.065.000 37 21.500.000
29 9.850.000 1.350.000 13 2.000.000
30 16.950.000 24.580.000 18 4.500.000
47. 42
Selanjutnya dilakukan pengecekan kembali kondisi berhenti. Karena | a) -
a) | = | 1.180.012.821.223.876,7– 1.665.619.664.535.720 | = ξ (10Sm), dan
interasi = 2 MaxIter (=100), maka proses dilanjutkan ke interasi ke-3 (t=3).
Demikian seterusnya, hingga : | ab - abS) | ξ atau t MaxIter. Untuk kasus ini,
proses baru akan berhenti setelah interasi ke-73.
Pada interasi ke-73 ini, 5 cluster, ?$2 dengan k = 1,2,...,5; dan j = 1,2,3,4
adalah sebagai berikut :
26.097.128,366 38.367.129,554 43,168 12.708.683,466
8.234.631,216 12.525.801,532 12,189 3.783.433,770
16.681.512,964 23.440.686,716 28,951 4.873.526,540
18.413.841,096 28.798.309,673 38,362 9.035.488,840
35.965.416,453 50.846.152,565 47,930 18.284.604,166
V =
Informasi yang bisa diperoleh dari kelima pusat cluster ini adalah: pada
kabupaten tersebut, industri-industri kecil dapat dikelompokkan menjadi 5
kelompok:
1. Kelompok pertama (cluster ke-1), berisi industri-industri kecil yang memiliki
modal awal sekitar Rp. 26.097.128,366; memiliki rata-rata penjualan per bulan
sekitar Rp. 38.367.129,554; sudah beroperasi sekitar 43,168 bulan; dan memiliki
rata-rata laba per bulan sekitar Rp. 12.708.683,466.
2. Kelompok kedua (cluster ke-2), berisi industri-industri kecil yang memiliki
modal awal sekitar Rp. 8.234.631,216; memiliki rata-rata penjualan per bulan
sekitar Rp. 12.525.801,532; sudah beroperasi sekitar 12,189 bulan; dan memiliki
rata-rata laba per bulan sekitar Rp. 3.783.433,770.
3. Kelompok ketiga (cluster ke-3), berisi industri-industri kecil yang memiliki
modal awal sekitar Rp. 16.681.512,964; memiliki rata-rata penjualan per bulan
sekitar Rp. 23.440.686,716; sudah beroperasi sekitar 28,951 bulan; dan memiliki
rata-rata laba per bulan sekitar Rp. 4.873.526,540.
4. Kelompok keempat (cluster ke-4), berisi industri-industri kecil yang memiliki
modal awal sekitar Rp. 18.413.841,096; memiliki rata-rata penjualan per bulan
48. 43
sekitar Rp. 28.798.309,673; sudah beroperasi sekitar 38,362 bulan; dan memiliki
rata-rata laba per bulan sekitar Rp. 9.035.488,840.
5. Kelompok kelima (cluster ke-5), berisi industri-industri kecil yang memiliki
modal awal sekitar Rp. 35.965.416,453; memiliki rata-rata penjualan per bulan
sekitar Rp. 50.846.152,565; sudah beroperasi sekitar 47,930 bulan; dan memiliki
rata-rata laba per bulan sekitar Rp. 18.284.604,166.
Matrik partisi U:
0,012 0,022 0,855 0,106 0,004
0,041 0,029 0,488 0,431 0,010
0,008 0,017 0,922 0,051 0,002
0,030 0,168 0,667 0,125 0,010
0,007 0,923 0,046 0,021 0,003
0,025 0,166 0,686 0,114 0,009
0,010 0,901 0,057 0,028 0,004
0,513 0,029 0,114 0,302 0,043
0,791 0,013 0,043 0,127 0,026
0,992 0,001 0,002 0,004 0,002
0,029 0,010 0,069 0,886 0,005
0,024 0,023 0,651 0,296 0,006
0,032 0,015 0,119 0,827 0,006
0,777 0,013 0,032 0,060 0,118
0,027 0,033 0,694 0,239 0,007
0,987 0,001 0,003 0,005 0,004
0,931 0,005 0,015 0,036 0,014
0,649 0,022 0,075 0,213 0,041
0,055 0,014 0,070 0,853 0,009
0,007 0,001 0,002 0,002 0,988
0,044 0,006 0,011 0,016 0,923
0,876 0,009 0,028 0,061 0,026
0,254 0,015 0,031 0,051 0,649
0,913 0,006 0,015 0,030 0,037
0,005 0,001 0,001 0,002 0,991
0,024 0,020 0,238 0,713 0,005
0,912 0,006 0,016 0,035 0,030
0,038 0,005 0,009 0,013 0,936
0,050 0,665 0,0,16 0,099 0,026
0,004 0,006 0,953 0,036 0,001
U =
49. 44
Dari matriks partisi U tersebut dapat diperoleh informasi mengenai
kecenderungan suatu industri kecil untuk masuk ke kelompok (cluster) yang
mana. Suatu industri kecil memiliki derajat keanggotaan tertentu untuk menjadi
anggota suatu kelompok. Tentu saja derajat keanggotaan tersebar menunjukkan
kecenderungan tertinggi suatu industri untuk masuk menajadi anggota kelompok.
Tabel 2.9 menunjukkan derajat keanggotaan tiap industri kecil pada setiap kelompok
(cluster) beserta kecenderungan tertinggi suatu industri kecil untuk masuk
dalam suatu kelompok.
Tabel 2.9 Derajat Keanggotaan Tiap Data Pada Setiap Cluster Dengan FCM
Data
Ke-
Derajat Keanggotaan Data Pada Cluster
Derajat Keanggotaan Data
Pada Cluster
1 2 3 4 5 1 2 3 4 5
1 0,012 0,022 0,855 0,106 0,004 *
2 0,041 0,029 0,488 0,431 0,010 *
3 0,008 0,017 0,922 0,051 0,002 *
4 0,030 0,168 0,667 0,125 0,010 *
5 0,007 0,923 0,046 0,021 0,003 *
6 0,025 0,166 0,686 0,114 0,009 *
7 0,010 0,901 0,057 0,028 0,004 *
8 0,513 0,029 0,114 0,302 0,043 *
9 0,791 0,013 0,043 0,127 0,026 *
10 0,992 0,001 0,002 0,004 0,002 *
11 0,029 0,010 0,069 0,886 0,005 *
12 0,024 0,023 0,651 0,296 0,006 *
13 0,032 0,015 0,119 0,827 0,006 *
14 0,777 0,013 0,032 0,060 0,118 *
15 0,027 0,033 0,694 0,239 0,007 *
16 0,987 0,001 0,003 0,005 0,004 *
17 0,931 0,005 0,015 0,036 0,014 *
18 0,649 0,022 0,075 0,213 0,041 *
19 0,055 0,014 0,070 0,853 0,009 *
20 0,007 0,001 0,002 0,002 0,988 *
21 0,044 0,006 0,011 0,016 0,923 *
22 0,876 0,009 0,028 0,061 0,026 *
23 0,254 0,015 0,031 0,051 0,649 *
50. 45
Data
Ke-
Derajat keanggotaan Data Pada Cluster
Derajat
Keanggotaan Data
Pada Cluster
1 2 3 4 5 1 2 3 4 5
24 0,913 0,006 0,015 0,030 0,037 *
25 0,005 0,001 0,001 0,002 0,991 *
26 0,024 0,020 0,238 0,713 0,005 *
27 0,912 0,006 0,016 0,035 0,030 *
28 0,038 0,005 0,009 0,013 0,936 *
29 0,050 0,665 0,0,16 0,099 0,026 *
30 0,004 0,006 0,953 0,036 0,001 *
Dari tabel 2.9 tersebut dapat disimpulkan bahwa :
1. Kelompok pertama (cluster ke-1), akan berisi industri-industri kecil ke: 8, 9, 10,
14, 16, 17, 18, 22, 24, dan 27
2. Kelompok kedua (cluster ke-2), akan berisi industri-industri kecil ke: 5, 7
dan 29.
3. Kelompok ketiga (cluster ke-3), akan berisi industri-industri kecil ke: 1, 2, 3, 4,
6, 12, 15, dan 30.
4. Kelompok keempat (cluster ke-4), akan berisi industri-industri kecil ke: 11, 13,
19, dan 26.
5. Kelompok kelima (cluster ke-5), akan berisi industri-industri kecil ke: 20, 21, 23,
25, dan 28.
2.2.5 Sistem Penilaian dan Penjurusan Di Sekolah Menengah Atas (SMA)
Sesuai kurikulum yang berlaku di seluruh Indonesia, maka siswa kelas X
SMA yang naik ke kelas XI akan mengalami pemilihan jurusan/penjurusan.
Penjurusan yang tersedia di SMA meliputi Ilmu Alam (IPA), Ilmu Sosial (IPS), dan
Ilmu Bahasa. Penjurusan akan disesuaikan dengan minat dan kemampuan siswa.
Tujuannya agar kelak di kemudian hari, pelajaran yang akan diberikan kepada siswa
menjadi lebih terarah karena telah sesuai dengan minatnya. Dari keseluruhan mata
pelajaran di SMA, tidak seluruhnya dijadikan dasar untuk proses penjurusan,
51. 46
melainkan hanya mata pelajaran inti dari tiap jurusan tersebut. Mata pelajaran inti
untuk jurusan IPA terdiri atas: Biologi, Fisika, Matematika IPA, Kimia. Mata
pelajaran inti untuk IPS adalah: Sosiologi, Geografi, Sejarah dan Ekonomi.
Sedangkan mata kuliah inti untuk jurusan Bahasa adalah: Bahasa Inggris dan Bahasa
Indonesia [3].
Tujuan dilaksanakannya penjurusan adalah [3]:
1. Mengelompokkan siswa sesuai kecakapan, kemampuan, dan bakat, yang relatif
sama.
2. Membantu mempersiapkan siswa melanjutkan studi dan memilih dunia kerja.
3. Membantu memperkokoh keberhasilan dan kecocokan atas prestasi yang akan
dicapai di waktu mendatang (kelanjutan studi dan dunia kerja).
Waktu penentuan penjurusan bagi peserta didik untuk program IPA, IPS dan
Bahasa dilakukan mulai akhir semester 2 (dua) kelas X. Pelaksanaan penjurusan
program dimulai pada semester 1 (satu) kelas XI. Kriteria penjurusan program
dilakanakan berdasarkan nilai akademik. Peserta didik yang naik kelas XI dan akan
mengambil program tertentu yaitu: Ilmu Pengetahuan Alam (IPA) atau Ilmu
Pengetahuan Sosial (IPS) atau Bahasa: boleh memiliki nilai yang tidak tuntas paling
banyak 3 (tiga) mata pelajaran pada mata pelajaran-mata pelajaran yang bukan
menjadi ciri khas program tersebut. Peserta didik yang naik ke kelas XI, dan yang
bersangkutan mendapat nilai tidak tuntas 3 (tiga) mata pelajaran, maka nilai tersebut
harus dijadikan dasar untuk menentukan program yang dapat diikuti oleh peserta
didik, misalnya :
- Apabila mata pelajaran yang tidak tuntas adalah Fisika, Kimia dan Geografi (2
mata pelajaran ciri khas program IPA dan 1 ciri khas program IPS), maka siswa
tersebut secara akademik dapat dimasukkan ke program Bahasa.
- Apabila mata pelajaran yang tidak tuntas adalah Bahasa Indonesia, Bahasa
Inggris, dan Fisika, (2 mata pelajaran ciri khas Bahasa dan 1 ciri khas IPA),
maka siswa tersebut secara akademik dapat dimasukkan ke program IPS.
- Apabila mata pelajaran yang tidak tuntas adalah Ekonomi, Sosilologi, dan
Bahasa Inggris (2 mata pelajaran ciri khas program IPS dan 1 ciri khas program
Bahasa), maka peserta didik tersebut secara akademik dapat dimasukkan ke
program IPA.
52. 47
- Apabila mata pelajaran yang tidak tuntas adalah Fisika, Ekonomi, dan Bahasa
Indonesia (mencakup semua mata pelajaran yang menjadi ciri khas ketiga
program di SMA) maka perlu diperhatikan prestasi nilai mata pelajaran yang
lebih unggul daripada program lainya (siswa tersebut dapat dijuruskan ke
program yang nilai prestasi mata pelajaran yang lebih unggul tersebut), atau
dengan mempertimbangkan minat peserta didik. Untuk mengetahui minat
peserta didik dapat dilakukan melalui angket/kuesioner dan wawancara, atau
cara lain yang dapat digunakan untuk mendeteksinya.
Skala penilaian penilaian yang dapat dijadikan acuan bagi sekolah-sekolah di
Indonesia adalah [3]:
1. Nilai ketuntasan belajar untuk aspek pengetahuan dan praktik dinyatakan dalam
bentuk bilangan bulat, dengan rentang 0 -100.
2. Ketuntasan belajar setiap indikator yang telah ditetapkan dalam suatu
kompetensi dasar berkisar antara 0 – 100 %. Kriteria ideal ketuntasan untuk
masing-masing indikator 75 %.
3. Satuan pendidikan dapat menentukan kriteria ketuntasan minimal (KKM)
dibawah nilai ketuntasan belajar ideal. Satuan pendidikan diharapkan
meningkatkan kriteria ketuntasan belajar secara terus menerus untuk mencapai
kriteria ketuntasan ideal.
4. KKM ditetapkan oleh forum guru pada awal tahun pelajaran.
5. KKM tersebut dicantumkan dalam LHB dan harus diinformasikan kepada
seluruh warga sekolah dan orang tua siswa.
53. 48
BAB III
METODE PENELITIAN
3.1 Metode Penelitian
3.1.1 Jenis Penelitian
Penelitian yang dilaksanakan adalah jenis penelitian eksperimen, yaitu
melakukan pengujian tingkat akurasi algoritma Fuzzy C-Means dalam pemetaan
kesamaan minat siswa Sekolah Menengah Atas (SMA) berdasarkan nilai rata-rata
mata pelajaran bidang peminatan. Data eksperimen diambil dari tempat penelitian
yaitu di SMA Negeri 2 Banjarbaru.
3.1.2 Metode Pengumpulan Data
3.1.2.1 Jenis Data
Data yang digunakan dalam penelitian ini berupa data primer dan data
sekunder:
a. Data Primer: berupa data tentang mekanisme pelaksanaan peminatan yang
dilaksanakan di Sekolah Menengah Atas (SMA) negeri 2 Banjarbaru, yang
diperoleh dengan wawancara.
b. Data Sekunder: berupa data siswa dan nilai mata pelajaran peminatan
sebelum pelaksanaan peminatan dan setelah pelaksanaan peminatan, yang
diperoleh dari database akademik SMA Negeri 2 Banjarbaru tahun 2010.
3.1.2.2 Sampel Data
Sampel data yang digunakan adalah data nilai (sebelum dan setelah
peminatan/penjurusan) siswa SMA Negeri 2 Banjarbaru (angkatan tahun 2008)
sebanyak 81 siswa dari 115 siswa. Penetapan jumlah sampel ini di dasarkan pada
metode penentuan sampel yang dikembangkan oleh Isaac dan Michael untuk
menentukan ukuran sampel dari populasi mulai dari 10 sampai dengan 1.000.000
[13]. Tingkat kesalahan untuk menentapkan jumlah sampel yang dipilih dalam
metode ini ini adalah sekitar 10%. Parameter data yang akan digunakan dalam
54. 49
eksperimen berupa rata-rata nilai mata pelajaran kelompok peminatan, yaitu: jurusan
IPA (mata pelajaran Biologi, Matematika, Fisika dan Kimia), jurusan IPS (mata
pelajaran Sosiologi, Geografi, Sejarah dan Ekonomi), jurusan Bahsa (Bahasa Inggris
dan Bahasa Indonesia). Sampel data selengkapnya dapat dilihat pada tabel 3.1 dan
tabel 3.2.
Tabel 3.1 Sampel Data Nilai Rata-rata Siswa pada Bidang Minat Tertentu
Sebelum Peminatan
Nilai Rata-rata Peminatan
IPA IPS Bahasa
Siswa
1 72,2 74,8 76,5
2 74,9 76,5 67,3
3 77,5 70,6 74,6
4 68,1 77,1 77,8
5 76,6 71,3 76,1
6 78,2 76,4 64,6
7 70,4 74,5 72,9
8 75,3 75,2 68,7
9 77,1 73,7 80,5
10 71,5 77,6 77,8
11 74,0 69,8 80,3
12 72,8 78,4 69,8
13 73,7 73,9 71,4
14 73,1 73,9 72,5
15 71,9 73,2 74,9
16 74,3 73,2 70,3
17 78,3 79,2 79,0
18 71,8 74,3 77,9
19 74,1 75,3 80,3
20 74,7 72,4 72,1
21 74,0 71,3 71,9
22 70,6 78,5 76,6
23 76,8 78,6 73,5
24 75,3 71,2 77,6
25 76,1 72,4 72,4
26 70,7 78,9 69,0
27 83,4 76,1 78,8
56. 51
Nilai Rata-rata Peminatan
IPA IPS Bahasa
Siswa
66 82,5 7 2,5 70,6
67 75,8 82,1 70,8
68 80,2 74,5 72,5
69 74,5 91,5 69,5
70 60,5 68,7 77,8
71 74,5 77,8 69,8
72 79,0 72,5 73,8
73 87,5 75,2 71,8
74 65,0 76,8 67,5
75 76,0 94,8 74,0
76 65,0 77,8 81,5
77 65,5 68,0 75,8
78 80,4 75,5 74,2
79 90,1 78,7 74,3
80 75,7 74,0 87,5
81 74,9 77,3 65,0
Sumber: Database Akademik SMA Negeri 2 Banjarbaru, Tahun 2010.
Tabel 3.2 Sampel Data Nilai Rata-rata Bidang Peminatan Siswa Angkatan 2008
SMA Negeri 2 Banjarbaru Tahun 2010 Setelah Peminatan.
Nilai Rata-rata Mata Pelajaran Peminatan
Jurusan Yang
Siswa Setelah Peminatan/ Penjurusan
Kelas XI Kelas XII
Dipilih
1 Bahasa 7 5,50 74,20
2 IPS 77,00 75,50
3 IPA 75,50 78,00
4 Bahasa 7 2,00 74,50
5 IPA 72,80 71,50
6 IPA 71,50 74,50
7 IPS 69,00 65,50
8 IPA 70,50 72,50
9 Bahasa 7 6,25 75,50
10 Bahasa 7 4,50 72,50
11 Bahasa 7 8,00 76,50
57. 52
Nilai Rata-rata Mata Pelajaran Peminatan
Setelah Peminatan/ Penjurusan
Kelas XI Kelas XII
Siswa
Jurusan Yang
Dipilih
12 IPS 73,00 74,80
13 IPS 71,50 74,00
14 IPS 67,50 65,00
15 Bahasa 75,50 69,50
16 IPA 84,30 81,30
17 IPS 80,70 82,50
18 Bahasa 76,00 80,50
19 Bahasa 81,50 82,50
20 IPA 74,00 71,00
21 IPA 69,50 73,50
22 IPS 82,50 79,50
23 IPS 72,50 70,75
24 Bahasa 65,50 70,50
25 IPA 66,00 68,30
26 IPS 78,00 76,50
27 IPA 72,50 71,00
28 Bahasa 71,00 67,50
29 Bahasa 82,00 80,00
30 IPA 72,50 67,80
31 Bahasa 71,90 73,50
32 IPA 80,70 75,50
33 Bahasa 80,50 88,50
34 IPS 82,75 80,50
35 IPS 83,50 81,50
36 IPA 78,20 75,50
37 IPA 74,50 72,00
38 Bahasa 79,00 81,30
39 IPS 70,70 72,00
40 IPS 69,50 77,50
41 IPA 79,50 70,30
42 IPS 75,80 72,30
43 Bahasa 80,50 82,50
44 IPS 78,50 75,80
45 IPA 74,50 72,80
46 IPA 74,00 72,70
47 IPA 73,60 71,80
48 Bahasa 73,80 74,50
58. 53
Nilai Rata-rata Mata Pelajaran Peminatan
Setelah Peminatan/ Penjurusan
Kelas XI Kelas XII
Siswa
Jurusan Yang
Dipilih
49 Bahasa 78,50 82,00
50 IPA 80,50 79,40
51 IPS 77,50 80,00
52 Bahasa 85,00 81,70
53 Bahasa 73,80 69,80
54 IPA 75,50 80,60
55 IPA 83,60 84,50
56 Bahasa 78,50 82,60
57 IPS 79,60 75,50
58 IPS 74,20 72,50
59 Bahasa 75,80 77,00
60 IPA 70,50 74,30
61 Bahasa 75,00 75,20
62 IPA 78,10 75,80
63 IPS 77,50 81,20
64 Bahasa 66,90 68,20
65 Bahasa 74,50 74,00
66 IPA 77,60 78,00
67 IPS 79,00 80,60
68 IPA 77,50 78,00
69 IPS 80,20 82,80
70 Bahasa 76,40 78,10
71 IPS 74,00 74,50
72 IPA 70,80 69,50
73 IPA 84,20 82,50
74 IPS 75,80 75,00
75 IPS 87,60 82,80
76 Bahasa 74,50 72,10
77 Bahasa 75,80 77,10
78 IPA 72,40 74,00
79 IPA 78,60 82,10
80 Bahasa 80,20 79,60
81 IPS 67,80 74,00
Sumber: Database Akademik SMA Negeri 2 Banjarbaru, 2010.
59. 54
3.1.3 Metode Pengukuran
Akurasi penerapan algoritma Fuzzy C-Means (FCM) dalam peminatan/
penjurusan di SMA diuji dengan cara:
1. Data sampel siswa dan nilai rata-rata mata pelajaran peminatan sebelum
peminatan dikelompokan dengan algoritma Fuzzy C-Means untuk membagi
siswa ke dalam bidang minat tertentu (Kelompok IPA, IPS dan Bahasa)
sesuai dengan kesamaan perolehan nilai rata-rata bidang peminatan tersebut.
2. Hasil peminatan Fuzzy C-Means dibandingkan dengan hasil peminatan yang
telah diaksanakan di tempat penelitian (terhadap data sampel nilai rata-rata
mata pelajaran pada peminatan yang telah dijalani oleh siswa).
3. Jika minat yang dipilih oleh siswa sama dengan peminatan FCM dan nilai
rata-rata mata pelajaran peminatan yang diperoleh setelah peminatan =
Kriteria Ketuntasan Minimal (KKM) yang ideal (=75), maka FCM
dinyatakan AKURAT.
4. Jika minat yang dipilih oleh siswa sama dengan peminatan FCM dan nilai
rata-rata mata pelajaran peminatan yang diperoleh setelah peminatan
Kriteria Ketuntasan Minimal (KKM) yang ideal, maka FCM dinyatakan
TIDAK AKURAT.
5. Jika minat yang dipilih oleh siswa tidak sama dengan peminatan FCM dan
nilai rata-rata mata pelajaran peminatan yang diperoleh setelah peminatan =
Kriteria Ketuntasan Minimal (KKM) yang ideal, maka FCM dinyatakan
TIDAK AKURAT.
6. Jika minat yang dipilih oleh siswa tidak sama dengan peminatan FCM dan
nilai rata-rata mata pelajaran peminatan yang diperoleh setelah peminatan
Kriteria Ketuntasan Minimal (KKM) yang ideal, maka FCM dinyatakan
AKURAT.
7. Selanjutnya dihitung persen tingkat akurasi FCM dengan:
% Akurasi = (Jumlah Data Akurat / Total Sampel) * 100
3.2 Penerapan Fuzzy C-Means Dalam Peminatan/Penentuan Jurusan
Pada tahap awal dilakukan pemetaan korelasi antara peminatan dengan mata
pelajaran peminatan, hasilnya ditunjukan pada gambar 3.1 berikut:
60. 55
Peminatan Jurusan Mata Pelajaran
Bidang Minat Ilmu
Pengetahuan Alam (IPA)
Bidang Minat Ilmu
Penget. Sosial (IPS)
Bidang Minat Bahasa
Biologi
Matematika
Fisika
Kimia
Sosiologi
Geografi
Sejarah
Ekonomi
Bahasa Inggris
Bahasa Indonesia
Gambar 3.1 Diagram Korelasi Antara Mata Pelajaran Dengan Peminatan
Selanjutnya ditentukan nilai bidang minat tertentu, yang diperoleh dari hasil
rata-rata mata pelajaran peminatan yang berada dalam kelompok bidang minat
tersebut sebelum dilakukan peminatan. Data ini akan digunakan sebagai data
parameter ujicoba peminatan menggunakan FCM ( tabel 3.1.)
Setelah parameter nilai rata-rata bidang minat diketahui, selanjutnya dilakukan
pemetaan/klastering data mengikuti algoritma FCM:
1. Menetapkan matriks partisi awal U berupa matriks berukuran n x m (n adalah
jumlah sampel data, yaitu=42, dan m adalah parameter/atribut setiap data,
yaitu=3). Xij = data sampel ke-i (i=1,2,...,n), atribut ke-j (j=1,2,...,m). Data
untuk matriks partisi awal yang digunakan adalah data pada tabel 3.3.
61. 56
2. Menentukan Nilai Parameter Awal :
- Jumlah cluster ( c ) = 3
- Pangkat (w) = 2
- Maksimum interasi (MaxIter) = 100
- Error terkecil yang diharapkan ( ξ ) = 10-
-
5
- Fungsi objektif awal (P0) = 0
- Interasi awal (t) = 1
3. Membangkitkan bilangan random μik, i=1,2,...,n; k=1,2,...c; sebagai elemen-elemen
matriks partisi awal (U).
Berdasarkan persamaan 2.1, matrik partisi awal (u0) secara random
yang terbentuk dengan menggunakan Matlab adalah:
rand('state',0)
X=[rand(27,3);rand(27,3);rand(27,3)]
X =
0.9501 0.6038 0.1509
0.2311 0.2722 0.6979
0.6068 0.1988 0.3784
0.4860 0.0153 0.8600
0.8913 0.7468 0.8537
0.7621 0.4451 0.5936
0.4565 0.9318 0.4966
0.0185 0.4660 0.8998
0.8214 0.4186 0.8216
0.4447 0.8462 0.6449
0.6154 0.5252 0.8180
0.7919 0.2026 0.6602
0.9218 0.6721 0.3420
0.7382 0.8381 0.2897
0.1763 0.0196 0.3412
0.4057 0.6813 0.5341
0.9355 0.3795 0.7271
0.9169 0.8318 0.3093
0.4103 0.5028 0.8385
0.8936 0.7095 0.5681
0.0579 0.4289 0.3704
0.3529 0.3046 0.7027
0.8132 0.1897 0.5466
0.0099 0.1934 0.4449
0.1389 0.6822 0.6946
0.2028 0.3028 0.6213
0.1987 0.5417 0.7948
0.9568 0.5298 0.4120
0.5226 0.6405 0.7446