LN s10-machine vision-s2

Machine Vision

Machine Vision
LECTURE NOTES
Machine Vision
Session 11
Recognition (2)
Machine Vision
LEARNING OUTCOMES
a. Peserta diharapkan memahami pendekatan unsupervised learning dan clustering untuk
mengelompokkan data berdasarkan karakteristik visualnya.
OUTLINE MATERI (Sub-Topic):
1. Unsupervised learning
2. Clustering
Machine Vision
ISI MATERI
Unsupervised Learning
Unsupervised learning adalah salah satu bentuk pembelajaran mesin yang mencoba
menarik kesimpulan dari sebuah dataset yang terdiri dari sampel data yang tidak memiliki
label. Metode unsupervised learning yang paling umum adalah analisis cluster, yang
memanfaatkan analisis data eksplanatori untuk menemukan pola/struktur tersembunyi atau
pengelompokkan pada data tidak berlabel. Karena data yang digunakan pada proses
pembelajaran tidak berlabel, maka output dari proses clustering tidak dapat dievaluasi
kebenarannya. Hal tersebut yang membedakan unsupervised learning dari supervised learning.
Beberapa alasan untuk melakukan unsupervised learning, diantaranya:
a. Proses memberi label pada pola dalam jumlah yang banyak membutuhkan waktu
b. Unsupervised learning dapat dilakukan pada data tidak berlabel, selanjutnya kelompok
data dengan berkarakteristik serupa diberi label sesuai dengan pengetahuan dari expert.
Data yang sudah diberi label kemudian dapat digunakan untuk proses training pada
supervised learning.
c. Melakukan ekstraksi fitur (Principal Component Analysis, Independent Component
Analysis, Singular Value Decomposition)
d. Analisis data ekspanatori pada unsupervised learning memberikan gambaran mengenai
struktur dari data.
Unsupervised learning memiliki memiliki relasi yang kuat dengan permasalahan
estimasi densitas pada statistika. Namun, usupervised learning juga dapat dimanfaatkan
untuk penarikan kesimpulan serta memberikan penjelasan tentang karakteristik utama dari
data. Beberapa pendekatan unsupervised learning, yaitu:
e. Clustering (k-means, mixture model, hierarchical clustering)
f. Hidden Markov Models
g. Teknik ekstraksi fitur untuk reduksi dimensi:
- Principal Component Analysis (PCA)
- Independent Component Analysis (ICA)
- Singular Value Decomposition (SVD)
Machine Vision
ISI MATERI
Clustering
Cluster analysis atau clustering adalah proses untuk mengelompokkan sekumpulan
obyek sedemikian sehingga obyek-obyek dalam kelompok yang sama (disebut cluster)
memiliki kemiripan yang lebih tinggi dibanding obyek-obyek pada kelompok lain. Clustering
merupakan proses utama dalam data mining, dan merupakan teknik yang secara umum
digunakan dalam analisis data secara statistik, juga digunakan pada banyak bidang seperti
pembelajaran mesin, pengenalan pola, analisis citra, temu kembali informasi, dan
bioinformatik.
Terdapat banyak pendekatan dalam melakukan clustering, masing-masing pendekatan
menggunakan model cluster dan algoritma berbeda. Beberapa model cluster sebagai berikut:
a. Model connectivity: contoh hierarchical clustering yang membangun model berdasarkan
distance connectivity.
b. Model centroid: contoh algoritma k-means yang merepresentasikan setiap cluster dengan
sebuah vektor mean.
c. Model distribusi: memodelkan cluster dengan distribusi statistik seperti distribusi normal
multivariate yang digunakan dalam algoritma Expectation-Maximization.
d. Model densitas: contoh DBSCAN dan OPTICS yang mendefiisikan cluser sebagai
connected dense region pada ruang data.
e. Model subspace: contoh Biclustering (dikenal juga sebagai Co-clustering atau two-mode-
clustering), dimana cluster dimodelkan oleh anggota cluster dan atribut-atribut yang
relevan.
f. Model graph: sebuah clique, yaitu subset dari node pada graph sedemikian sehingga
untuk setiap dua node dalam subset yang terkoneksi oleh sebuah edge dipertimbangkan
sebagai bentuk prototipe dari cluster.
Secara umum algoritma clustering bekerja berdasarkan salah satu dari dua pendekatan
berikut:
a. Iterative squared-error partitioning
b. Agglomerative hierarchical clustering
Machine Vision
Squared-Error Partitioning
Berikut algoritma clustering berdasarkan pendekatan squared-error partitioning:
Misalkan suatu data yang terdiri dari n pola akan dikelompokkan menjadi k cluster D1, ..., Dk.
Misalkan ni menyatakan jumlah sampel pada Di, dan misalkan mi adalah nilai rata-rata dari
sampel tersebut:



i
D
x
i
i x
n
m
1
Sum-of-square errors didefinisikan oleh:

 


k
i D
x
i
e
i
m
x
J
1
2
Untuk setiap cluster Di, mean vector mi atau disebut juga centroid, adalah representasi terbaik
dari semua sampel pada Di.
K-Means Clustering
Algoritma umum untuk iterative squered-error partitioning adalah sebagai berikut:
1. Tentukan jumlah cluster, misal k
2. Inisialisasi centroid dengan cara memilih k sampel secara acak
3. Tentukan keanggotaan tiap sampel ke dalam salah satu cluster dengan cara mencari jarak
terdekat ke centroid.
4. Tentukan centroid baru dengan cara menghitung mean vector dari masing-masing cluster.
5. Lakukan langkah 3 dan 4 hingga nilai optimal dari fungsi obyektif terpenuhi (misal:
hingga ditemukan local minimum atau jumlah iterasi dipenuhi).
6. Sesuaikan jumlah cluster dengan melakukan penggabungan atau pemisahan dari cluster
yang sudah terbentuk dengan cara menghapus cluster dengan jumlah anggotanya sedikit
atau merupakan outlier.
Machine Vision
Langkah 1 hingga 5 dikenal sebagai k-means clustering. Gambar berikut memperlihatkan
ilustrasi proses clustering terhadap 30 sampel data kedalam 3 cluster: (a) inisialisasi centroid
secara acak; (b) menentukan keanggotaan setiap cluster; (c) iterasi-1: menentukan centroid
baru dan anggotanya; (d) iterasi-2: menentukan centroid baru dan anggotanya; (e) iterasi-3:
menentukan centroid baru dan anggotanya. Pada iterasi ketiga posisi centroid sama dengan
iterasi kedua, sehingga proses clustering dapat dihentikan karena sudah konvergen.
(a) (b)
(c) (d)
(e)
Machine Vision
Proses komputasi K-means clustering sangat efisien dan dapat memberikan hasil yang baik
jika cluster bersifat kompak dan dapat dipisahkan dengan baik pada ruang fitur. Namun
pemilihan jumlah cluster atau nilai k yang tidak optimal akan menghasilkan pengelompokkan
yang tidak akurat. Pemilihan nilai k dapat dilakukan secara empiris maupun berdasarkan
pengetahuan sebelumnya mengenai data.
Hierarchical Clustering
K-means clustering menghasilkan deskripsi data yang bersifat flat, dimana setiap cluster
terpisah pada level yang sama. Pada aplikasi tertentu, sekelompok pola memiliki karakteristik
yang serupa jika dilihat pada level tertentu. Hierarchical clustering berusaha menangkap
pengelompokkan multi level tersebut menggunakan representasi bertingkat/hierarchical.
Berikut karakteristik hierarchical clustering dari data dengan n sampel:
a. Level pertama terdiri dari n cluster, dengan demikian tiap cluster beranggotakan sebuah
sampel.
b. Level kedua terdiri dari n-1 cluster
c. Level ketiga terdiri dari n-2 cluster
d. Dan selanjutnya hingga pada level terakhir (n) terdiri dari satu cluster dengan seluruh
sampel sebagai anggotanya.
Setiap dua sampel pada level tertentu akan dikelompokkan menjadi satu cluster dan akan
tetap akan bergabung sama pada level berikutnya. Hierarchical clustering biasanya
direpresentasikan sebagai tree atau dendogram, yang menunjukkan bagaimana setiap sampel
berkelompok. Berikut algoritma dari Agglomerative Hierarchical Clustering:
1. Tentukan jumlah cluster.
2. Tempatkan tiap sampel pada cluster.
3. Hitung jarak antar setiap cluster.
4. Gabungkan cluster yang memiliki jarak terdekat.
5. Lakukan langkah 3 dan 4 hingga tersisa satu cluster saja.
Berikut beberapa rumus yang umum digunakan untuk mengukur jarak antara dua cluster Di
dan Dj:
Machine Vision
j
i
j
i
mean
D
x D
x
j
i
j
i
avg
D
x
D
x
j
i
D
x
D
x
j
i
m
m
D
D
d
x
x
D
D
D
D
d
x
x
D
D
d
x
x
D
D
d
i j
j
i
j
i








 
 




)
,
(
#
1
)
,
(
max
)
,
(
min
)
,
(
'
,
,
max
,
min
Gambar berikut memperlihatkan tahapan proses hierarchical clustering terhadap 10
sampel data. Berikut penjelasan dari setiap tahapan tersebut:
(a) Bagi data menjadi 10 cluster yang masing-masing berisi satu sampel data.
(b) Cari dua cluster yang memiliki jarak terdekat kemudian gabungkan cluster tersebut
sehingga jumlah cluster hanya tinggal 9.
(c) Cari dua cluster yang memiliki jarak terdekat dengan menganggap cluster yang
sebelumnya sudah bergabung sebagai sebuah cluster kemudian gabungkan cluster
tersebut sehingga jumlah cluster tinggal 8.
(d) Ulangi langkah (c) hingga tersisa hanya satu cluster saja seperti diperlihatkan pada
gambar (i)
Machine Vision
(a) (b) (c)
(d) (e) (f)
(g) (h) (i)
(j)
Machine Vision
SIMPULAN
1. Salah satu aplikasi utama dari unsupervised learning adalah pengelompokkan data
atau clustering.
2. Selain dapat digunakan untuk pengelompokkan data, unsupervised clustering juga
dapat dimanfaatkan untuk ekstraksi fitur dan reduksi dimensi.
3. Akurasi dari k-means clustering sangat dipengaruhi oleh pemilihan jumlah cluster
awal.
4. Hierarchical clustering memungkinkan pengelompokkan data secara
bertingkat/hierarchical, sehingga karakteristik pengelompokkan data dapat dilihat
pada setiap level-nya.
Machine Vision
DAFTAR PUSTAKA
1. Forsyth. (2011). Computer Vision a Modern Approach (2nd
Edition). Prentice Hall.
New Jersey. ISBN-10: 013608592X. ISBN-13: 978-0136085928.
2. Image Segmentation, http://www.kevinroper.org/image-segmentation/
3. A Tutorial on Clustering Algorithms,
http://home.deib.polimi.it/matteucc/Clustering/tutorial_html/index.html
4. Introduction to K-means Clustering, https://www.datascience.com/blog/introduction-
to-k-means-clustering-algorithm-learn-data-science-tutorials
5. Hierarchical Clustering,
http://www.cs.princeton.edu/courses/archive/spr08/cos424/slides/clustering-2.pdf

Recomendados

LN s08-machine vision-s2 por
LN s08-machine vision-s2LN s08-machine vision-s2
LN s08-machine vision-s2Binus Online Learning
333 visualizações17 slides
LN s07-machine vision-s2 por
LN s07-machine vision-s2LN s07-machine vision-s2
LN s07-machine vision-s2Binus Online Learning
373 visualizações15 slides
LN s12-machine vision-s2 por
LN s12-machine vision-s2LN s12-machine vision-s2
LN s12-machine vision-s2Binus Online Learning
330 visualizações14 slides
LN s06-machine vision-s2 por
LN s06-machine vision-s2LN s06-machine vision-s2
LN s06-machine vision-s2Binus Online Learning
324 visualizações12 slides
Review paper por
Review paperReview paper
Review paperananta200
224 visualizações8 slides
LN s04-machine vision-s2 por
LN s04-machine vision-s2LN s04-machine vision-s2
LN s04-machine vision-s2Binus Online Learning
339 visualizações12 slides

Mais conteúdo relacionado

Mais procurados

Pemanfaatan Stack Untuk Deteksi Gerakan por
Pemanfaatan Stack Untuk Deteksi GerakanPemanfaatan Stack Untuk Deteksi Gerakan
Pemanfaatan Stack Untuk Deteksi GerakanTeady Matius
186 visualizações5 slides
Segmentasi Citra Wajah Menggunakan Metode Level Set por
Segmentasi Citra Wajah  Menggunakan Metode Level SetSegmentasi Citra Wajah  Menggunakan Metode Level Set
Segmentasi Citra Wajah Menggunakan Metode Level SetHadi Santoso
1.2K visualizações7 slides
Bab 4 operasi-operasi dasar pengolahan citra dijital por
Bab 4 operasi-operasi dasar pengolahan citra dijitalBab 4 operasi-operasi dasar pengolahan citra dijital
Bab 4 operasi-operasi dasar pengolahan citra dijitalSyafrizal
12.5K visualizações20 slides
Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan... por
Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...
Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...Amran Simamora
31 visualizações8 slides
Bab 2 pembentukan citra por
Bab 2 pembentukan citraBab 2 pembentukan citra
Bab 2 pembentukan citraSyafrizal
868 visualizações14 slides
PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATI... por
PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATI...PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATI...
PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATI...Repository Ipb
345 visualizações9 slides

Mais procurados(19)

Pemanfaatan Stack Untuk Deteksi Gerakan por Teady Matius
Pemanfaatan Stack Untuk Deteksi GerakanPemanfaatan Stack Untuk Deteksi Gerakan
Pemanfaatan Stack Untuk Deteksi Gerakan
Teady Matius186 visualizações
Segmentasi Citra Wajah Menggunakan Metode Level Set por Hadi Santoso
Segmentasi Citra Wajah  Menggunakan Metode Level SetSegmentasi Citra Wajah  Menggunakan Metode Level Set
Segmentasi Citra Wajah Menggunakan Metode Level Set
Hadi Santoso1.2K visualizações
Bab 4 operasi-operasi dasar pengolahan citra dijital por Syafrizal
Bab 4 operasi-operasi dasar pengolahan citra dijitalBab 4 operasi-operasi dasar pengolahan citra dijital
Bab 4 operasi-operasi dasar pengolahan citra dijital
Syafrizal 12.5K visualizações
Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan... por Amran Simamora
Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...
Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...
Amran Simamora31 visualizações
Bab 2 pembentukan citra por Syafrizal
Bab 2 pembentukan citraBab 2 pembentukan citra
Bab 2 pembentukan citra
Syafrizal 868 visualizações
PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATI... por Repository Ipb
PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATI...PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATI...
PENGUKURAN KEMIIRIPAN SEMATIK CITRA DENGAN BAG OF WORDS LOKAL FRAGEMEN SEMATI...
Repository Ipb345 visualizações
2 tadan83-106 por Alen Pepa
2 tadan83-1062 tadan83-106
2 tadan83-106
Alen Pepa438 visualizações
Jenis-Jenis Format Citra por Lesmardin Hasugian
Jenis-Jenis Format CitraJenis-Jenis Format Citra
Jenis-Jenis Format Citra
Lesmardin Hasugian8.5K visualizações
Kelompok11 por Betris Darwis
Kelompok11Kelompok11
Kelompok11
Betris Darwis582 visualizações
Bab 11 citra biner por Syafrizal
Bab 11 citra binerBab 11 citra biner
Bab 11 citra biner
Syafrizal 2.9K visualizações
jurnal pengolahan citra por Ovie Poenya
jurnal pengolahan citrajurnal pengolahan citra
jurnal pengolahan citra
Ovie Poenya9K visualizações
SEGMENTASI CITRA DENGAN VARIASI RGB DAN ALGORITMA PERCEPTRON por Teady Matius
SEGMENTASI CITRA DENGAN VARIASI RGB DAN ALGORITMA PERCEPTRONSEGMENTASI CITRA DENGAN VARIASI RGB DAN ALGORITMA PERCEPTRON
SEGMENTASI CITRA DENGAN VARIASI RGB DAN ALGORITMA PERCEPTRON
Teady Matius1.7K visualizações
Slide minggu 6 (citra digital) por Setia Juli Irzal Ismail
Slide minggu 6 (citra digital)Slide minggu 6 (citra digital)
Slide minggu 6 (citra digital)
Setia Juli Irzal Ismail22.5K visualizações
pembentukan citra (pengolahan citra digital) por khaerul azmi
pembentukan citra (pengolahan citra digital)pembentukan citra (pengolahan citra digital)
pembentukan citra (pengolahan citra digital)
khaerul azmi9.2K visualizações
Materi Pengantar Pengolahan Citra por Nur Fadli Utomo
Materi Pengantar Pengolahan CitraMateri Pengantar Pengolahan Citra
Materi Pengantar Pengolahan Citra
Nur Fadli Utomo916 visualizações
Naskah%20 publikasi por CahyaUPN97
Naskah%20 publikasiNaskah%20 publikasi
Naskah%20 publikasi
CahyaUPN9742 visualizações
Binarisasi Citra Menggunakan Pencocokan Piksel por Teady Matius
Binarisasi Citra Menggunakan Pencocokan PikselBinarisasi Citra Menggunakan Pencocokan Piksel
Binarisasi Citra Menggunakan Pencocokan Piksel
Teady Matius230 visualizações
Pcd 2 por dedidarwis
Pcd 2Pcd 2
Pcd 2
dedidarwis919 visualizações

Similar a LN s10-machine vision-s2

Pert 04 clustering data mining por
Pert 04 clustering   data miningPert 04 clustering   data mining
Pert 04 clustering data miningaiiniR
10.8K visualizações66 slides
Machine Learning Diskusi 10.pdf por
Machine Learning Diskusi 10.pdfMachine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdfHendroGunawan8
10 visualizações5 slides
Machine Learning Diskusi 9.pdf por
Machine Learning Diskusi 9.pdfMachine Learning Diskusi 9.pdf
Machine Learning Diskusi 9.pdfHendroGunawan8
7 visualizações10 slides
Belajar mudah algoritma data mining k means por
Belajar mudah algoritma data mining k meansBelajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k meansilmuBiner
19.2K visualizações5 slides
Modul praktikum 3 cluster por
Modul praktikum 3   clusterModul praktikum 3   cluster
Modul praktikum 3 clusterDeiHart DeiHart
1.3K visualizações26 slides
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ... por
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest
2.2K visualizações6 slides

Similar a LN s10-machine vision-s2(20)

Pert 04 clustering data mining por aiiniR
Pert 04 clustering   data miningPert 04 clustering   data mining
Pert 04 clustering data mining
aiiniR10.8K visualizações
Machine Learning Diskusi 10.pdf por HendroGunawan8
Machine Learning Diskusi 10.pdfMachine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdf
HendroGunawan810 visualizações
Machine Learning Diskusi 9.pdf por HendroGunawan8
Machine Learning Diskusi 9.pdfMachine Learning Diskusi 9.pdf
Machine Learning Diskusi 9.pdf
HendroGunawan87 visualizações
Belajar mudah algoritma data mining k means por ilmuBiner
Belajar mudah algoritma data mining k meansBelajar mudah algoritma data mining k means
Belajar mudah algoritma data mining k means
ilmuBiner19.2K visualizações
Modul praktikum 3 cluster por DeiHart DeiHart
Modul praktikum 3   clusterModul praktikum 3   cluster
Modul praktikum 3 cluster
DeiHart DeiHart1.3K visualizações
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ... por butest
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
butest2.2K visualizações
Data mining algoritma covering dan penerapannya por Universitas Gadjah Mada
Data mining algoritma covering dan penerapannyaData mining algoritma covering dan penerapannya
Data mining algoritma covering dan penerapannya
Universitas Gadjah Mada630 visualizações
Analisis Cluster por Kurnia Millati
Analisis ClusterAnalisis Cluster
Analisis Cluster
Kurnia Millati1.8K visualizações
Clustering _IgedeAris.ppt por PandeKadek3
Clustering _IgedeAris.pptClustering _IgedeAris.ppt
Clustering _IgedeAris.ppt
PandeKadek37 visualizações
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem... por ym.ygrex@comp
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
ym.ygrex@comp700 visualizações
HibahProdi Genap 2012/2013 por achmad fauzan
HibahProdi Genap 2012/2013HibahProdi Genap 2012/2013
HibahProdi Genap 2012/2013
achmad fauzan429 visualizações
Data mining 7 por dedidarwis
Data mining 7Data mining 7
Data mining 7
dedidarwis4.5K visualizações
Klasterisasi - Algoritma K-Means Clustering.pdf por Elvi Rahmi
Klasterisasi - Algoritma K-Means Clustering.pdfKlasterisasi - Algoritma K-Means Clustering.pdf
Klasterisasi - Algoritma K-Means Clustering.pdf
Elvi Rahmi231 visualizações
K-MEANS CLUSTERING.pptx por GemmaDwiPrasetya
K-MEANS CLUSTERING.pptxK-MEANS CLUSTERING.pptx
K-MEANS CLUSTERING.pptx
GemmaDwiPrasetya9 visualizações
K-Means Clustering.ppt por Adam Superman
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.ppt
Adam Superman611 visualizações
BAB III 4.docx por RekaRismawati
BAB III 4.docxBAB III 4.docx
BAB III 4.docx
RekaRismawati2 visualizações
PPT_Data_Mining_Kel_3.pptx por AbdulMajid84127
PPT_Data_Mining_Kel_3.pptxPPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptx
AbdulMajid841278 visualizações
04-cara-pemakaian-weka.ppt por Putrifitriasari1
04-cara-pemakaian-weka.ppt04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt
Putrifitriasari12 visualizações
Tutorial WEKA.ppt por JurnalJTIM
Tutorial WEKA.pptTutorial WEKA.ppt
Tutorial WEKA.ppt
JurnalJTIM8 visualizações

Mais de Binus Online Learning

LN s11-machine vision-s2 por
LN s11-machine vision-s2LN s11-machine vision-s2
LN s11-machine vision-s2Binus Online Learning
330 visualizações13 slides
LN s09-machine vision-s2 por
LN s09-machine vision-s2LN s09-machine vision-s2
LN s09-machine vision-s2Binus Online Learning
319 visualizações17 slides
LN s05-machine vision-s2 por
LN s05-machine vision-s2LN s05-machine vision-s2
LN s05-machine vision-s2Binus Online Learning
338 visualizações17 slides
LN s03-machine vision-s2 por
LN s03-machine vision-s2LN s03-machine vision-s2
LN s03-machine vision-s2Binus Online Learning
347 visualizações15 slides
LN s02-machine vision-s2 por
LN s02-machine vision-s2LN s02-machine vision-s2
LN s02-machine vision-s2Binus Online Learning
345 visualizações11 slides
PPT s12-machine vision-s2 por
PPT s12-machine vision-s2PPT s12-machine vision-s2
PPT s12-machine vision-s2Binus Online Learning
325 visualizações43 slides

Mais de Binus Online Learning(20)

PPT Sesi 2 FO the guest delivering quality-1 por Binus Online Learning
PPT Sesi 2 FO the guest delivering quality-1PPT Sesi 2 FO the guest delivering quality-1
PPT Sesi 2 FO the guest delivering quality-1
Binus Online Learning90 visualizações
PPT Sesi 3 FO the guest - delivering quality 2 por Binus Online Learning
PPT Sesi 3 FO the guest - delivering quality 2 PPT Sesi 3 FO the guest - delivering quality 2
PPT Sesi 3 FO the guest - delivering quality 2
Binus Online Learning77 visualizações

LN s10-machine vision-s2

  • 1. Machine Vision LECTURE NOTES Machine Vision Session 11 Recognition (2)
  • 2. Machine Vision LEARNING OUTCOMES a. Peserta diharapkan memahami pendekatan unsupervised learning dan clustering untuk mengelompokkan data berdasarkan karakteristik visualnya. OUTLINE MATERI (Sub-Topic): 1. Unsupervised learning 2. Clustering
  • 3. Machine Vision ISI MATERI Unsupervised Learning Unsupervised learning adalah salah satu bentuk pembelajaran mesin yang mencoba menarik kesimpulan dari sebuah dataset yang terdiri dari sampel data yang tidak memiliki label. Metode unsupervised learning yang paling umum adalah analisis cluster, yang memanfaatkan analisis data eksplanatori untuk menemukan pola/struktur tersembunyi atau pengelompokkan pada data tidak berlabel. Karena data yang digunakan pada proses pembelajaran tidak berlabel, maka output dari proses clustering tidak dapat dievaluasi kebenarannya. Hal tersebut yang membedakan unsupervised learning dari supervised learning. Beberapa alasan untuk melakukan unsupervised learning, diantaranya: a. Proses memberi label pada pola dalam jumlah yang banyak membutuhkan waktu b. Unsupervised learning dapat dilakukan pada data tidak berlabel, selanjutnya kelompok data dengan berkarakteristik serupa diberi label sesuai dengan pengetahuan dari expert. Data yang sudah diberi label kemudian dapat digunakan untuk proses training pada supervised learning. c. Melakukan ekstraksi fitur (Principal Component Analysis, Independent Component Analysis, Singular Value Decomposition) d. Analisis data ekspanatori pada unsupervised learning memberikan gambaran mengenai struktur dari data. Unsupervised learning memiliki memiliki relasi yang kuat dengan permasalahan estimasi densitas pada statistika. Namun, usupervised learning juga dapat dimanfaatkan untuk penarikan kesimpulan serta memberikan penjelasan tentang karakteristik utama dari data. Beberapa pendekatan unsupervised learning, yaitu: e. Clustering (k-means, mixture model, hierarchical clustering) f. Hidden Markov Models g. Teknik ekstraksi fitur untuk reduksi dimensi: - Principal Component Analysis (PCA) - Independent Component Analysis (ICA) - Singular Value Decomposition (SVD)
  • 4. Machine Vision ISI MATERI Clustering Cluster analysis atau clustering adalah proses untuk mengelompokkan sekumpulan obyek sedemikian sehingga obyek-obyek dalam kelompok yang sama (disebut cluster) memiliki kemiripan yang lebih tinggi dibanding obyek-obyek pada kelompok lain. Clustering merupakan proses utama dalam data mining, dan merupakan teknik yang secara umum digunakan dalam analisis data secara statistik, juga digunakan pada banyak bidang seperti pembelajaran mesin, pengenalan pola, analisis citra, temu kembali informasi, dan bioinformatik. Terdapat banyak pendekatan dalam melakukan clustering, masing-masing pendekatan menggunakan model cluster dan algoritma berbeda. Beberapa model cluster sebagai berikut: a. Model connectivity: contoh hierarchical clustering yang membangun model berdasarkan distance connectivity. b. Model centroid: contoh algoritma k-means yang merepresentasikan setiap cluster dengan sebuah vektor mean. c. Model distribusi: memodelkan cluster dengan distribusi statistik seperti distribusi normal multivariate yang digunakan dalam algoritma Expectation-Maximization. d. Model densitas: contoh DBSCAN dan OPTICS yang mendefiisikan cluser sebagai connected dense region pada ruang data. e. Model subspace: contoh Biclustering (dikenal juga sebagai Co-clustering atau two-mode- clustering), dimana cluster dimodelkan oleh anggota cluster dan atribut-atribut yang relevan. f. Model graph: sebuah clique, yaitu subset dari node pada graph sedemikian sehingga untuk setiap dua node dalam subset yang terkoneksi oleh sebuah edge dipertimbangkan sebagai bentuk prototipe dari cluster. Secara umum algoritma clustering bekerja berdasarkan salah satu dari dua pendekatan berikut: a. Iterative squared-error partitioning b. Agglomerative hierarchical clustering
  • 5. Machine Vision Squared-Error Partitioning Berikut algoritma clustering berdasarkan pendekatan squared-error partitioning: Misalkan suatu data yang terdiri dari n pola akan dikelompokkan menjadi k cluster D1, ..., Dk. Misalkan ni menyatakan jumlah sampel pada Di, dan misalkan mi adalah nilai rata-rata dari sampel tersebut:    i D x i i x n m 1 Sum-of-square errors didefinisikan oleh:      k i D x i e i m x J 1 2 Untuk setiap cluster Di, mean vector mi atau disebut juga centroid, adalah representasi terbaik dari semua sampel pada Di. K-Means Clustering Algoritma umum untuk iterative squered-error partitioning adalah sebagai berikut: 1. Tentukan jumlah cluster, misal k 2. Inisialisasi centroid dengan cara memilih k sampel secara acak 3. Tentukan keanggotaan tiap sampel ke dalam salah satu cluster dengan cara mencari jarak terdekat ke centroid. 4. Tentukan centroid baru dengan cara menghitung mean vector dari masing-masing cluster. 5. Lakukan langkah 3 dan 4 hingga nilai optimal dari fungsi obyektif terpenuhi (misal: hingga ditemukan local minimum atau jumlah iterasi dipenuhi). 6. Sesuaikan jumlah cluster dengan melakukan penggabungan atau pemisahan dari cluster yang sudah terbentuk dengan cara menghapus cluster dengan jumlah anggotanya sedikit atau merupakan outlier.
  • 6. Machine Vision Langkah 1 hingga 5 dikenal sebagai k-means clustering. Gambar berikut memperlihatkan ilustrasi proses clustering terhadap 30 sampel data kedalam 3 cluster: (a) inisialisasi centroid secara acak; (b) menentukan keanggotaan setiap cluster; (c) iterasi-1: menentukan centroid baru dan anggotanya; (d) iterasi-2: menentukan centroid baru dan anggotanya; (e) iterasi-3: menentukan centroid baru dan anggotanya. Pada iterasi ketiga posisi centroid sama dengan iterasi kedua, sehingga proses clustering dapat dihentikan karena sudah konvergen. (a) (b) (c) (d) (e)
  • 7. Machine Vision Proses komputasi K-means clustering sangat efisien dan dapat memberikan hasil yang baik jika cluster bersifat kompak dan dapat dipisahkan dengan baik pada ruang fitur. Namun pemilihan jumlah cluster atau nilai k yang tidak optimal akan menghasilkan pengelompokkan yang tidak akurat. Pemilihan nilai k dapat dilakukan secara empiris maupun berdasarkan pengetahuan sebelumnya mengenai data. Hierarchical Clustering K-means clustering menghasilkan deskripsi data yang bersifat flat, dimana setiap cluster terpisah pada level yang sama. Pada aplikasi tertentu, sekelompok pola memiliki karakteristik yang serupa jika dilihat pada level tertentu. Hierarchical clustering berusaha menangkap pengelompokkan multi level tersebut menggunakan representasi bertingkat/hierarchical. Berikut karakteristik hierarchical clustering dari data dengan n sampel: a. Level pertama terdiri dari n cluster, dengan demikian tiap cluster beranggotakan sebuah sampel. b. Level kedua terdiri dari n-1 cluster c. Level ketiga terdiri dari n-2 cluster d. Dan selanjutnya hingga pada level terakhir (n) terdiri dari satu cluster dengan seluruh sampel sebagai anggotanya. Setiap dua sampel pada level tertentu akan dikelompokkan menjadi satu cluster dan akan tetap akan bergabung sama pada level berikutnya. Hierarchical clustering biasanya direpresentasikan sebagai tree atau dendogram, yang menunjukkan bagaimana setiap sampel berkelompok. Berikut algoritma dari Agglomerative Hierarchical Clustering: 1. Tentukan jumlah cluster. 2. Tempatkan tiap sampel pada cluster. 3. Hitung jarak antar setiap cluster. 4. Gabungkan cluster yang memiliki jarak terdekat. 5. Lakukan langkah 3 dan 4 hingga tersisa satu cluster saja. Berikut beberapa rumus yang umum digunakan untuk mengukur jarak antara dua cluster Di dan Dj:
  • 8. Machine Vision j i j i mean D x D x j i j i avg D x D x j i D x D x j i m m D D d x x D D D D d x x D D d x x D D d i j j i j i                 ) , ( # 1 ) , ( max ) , ( min ) , ( ' , , max , min Gambar berikut memperlihatkan tahapan proses hierarchical clustering terhadap 10 sampel data. Berikut penjelasan dari setiap tahapan tersebut: (a) Bagi data menjadi 10 cluster yang masing-masing berisi satu sampel data. (b) Cari dua cluster yang memiliki jarak terdekat kemudian gabungkan cluster tersebut sehingga jumlah cluster hanya tinggal 9. (c) Cari dua cluster yang memiliki jarak terdekat dengan menganggap cluster yang sebelumnya sudah bergabung sebagai sebuah cluster kemudian gabungkan cluster tersebut sehingga jumlah cluster tinggal 8. (d) Ulangi langkah (c) hingga tersisa hanya satu cluster saja seperti diperlihatkan pada gambar (i)
  • 9. Machine Vision (a) (b) (c) (d) (e) (f) (g) (h) (i) (j)
  • 10. Machine Vision SIMPULAN 1. Salah satu aplikasi utama dari unsupervised learning adalah pengelompokkan data atau clustering. 2. Selain dapat digunakan untuk pengelompokkan data, unsupervised clustering juga dapat dimanfaatkan untuk ekstraksi fitur dan reduksi dimensi. 3. Akurasi dari k-means clustering sangat dipengaruhi oleh pemilihan jumlah cluster awal. 4. Hierarchical clustering memungkinkan pengelompokkan data secara bertingkat/hierarchical, sehingga karakteristik pengelompokkan data dapat dilihat pada setiap level-nya.
  • 11. Machine Vision DAFTAR PUSTAKA 1. Forsyth. (2011). Computer Vision a Modern Approach (2nd Edition). Prentice Hall. New Jersey. ISBN-10: 013608592X. ISBN-13: 978-0136085928. 2. Image Segmentation, http://www.kevinroper.org/image-segmentation/ 3. A Tutorial on Clustering Algorithms, http://home.deib.polimi.it/matteucc/Clustering/tutorial_html/index.html 4. Introduction to K-means Clustering, https://www.datascience.com/blog/introduction- to-k-means-clustering-algorithm-learn-data-science-tutorials 5. Hierarchical Clustering, http://www.cs.princeton.edu/courses/archive/spr08/cos424/slides/clustering-2.pdf