Machine Learning dengan R

Muhammad Rifqi
Muhammad RifqiLecturer and IT Professional em Universitas Tidar
Machine Learning dengan R
Muhammad Rifqi Ma’arif, M.Eng
Matakuliah Ilmu Data Industrial
Program Studi Teknik Industri
Fakultas Teknik & Teknologi Informasi
Universitas Jenderal Achmad Yani Yogyakarta
2020
Pengantar Machine Learning
• Machine learning adalah cabang dari artificial intelligence.
Kecerdasan buatan memiliki pengertian yang sangat luas
tapi secara umum dapat dipahami sebagai komputer
dengan kecerdasan layaknya manusia.
• Sedangkan machine learning memiliki arti lebih spesifik
yaitu menggunakan metode statistika untuk membuat
komputer dapat mempelajari pola pada data tanpa perlu
diprogram secara eksplisit.
• Machine learning dibagi menjadi beberapa kategori.
Tepatnya ada empat kategori besar, yaitu supervised
learning, unsupervised learning, semi-supervised learning,
dan reinforcement learning.
Supervised Learning - Klasifikasi
• Klasifikasi adalah teknik untuk menentukan kelas
atau kategori berdasarkan atribut yang diberikan.
• Klasifikasi yang menghasilkan dua kategori disebut binary
classification,
• Klasifikasi yang menghasilkan 3 kategori atau lebih disebut
multiclass classification atau klasifikasi banyak kelas.
• Teknik-teknik Klasifikasi
• Decision Tree
• Random Forest
• Support Vector Machine
• Artificial Neural Network
Decision Tree
• Decision tree atau pohon keputusan adalah
salah satu algoritma supervised learning yang
dapat dipakai untuk masalah klasifikasi dan
regresi.
• Decision tree merupakan algoritma yang powerful alias
mampu dipakai dalam masalah yang kompleks.
• Decision tree juga merupakan komponen pembangun
utama algoritma Random Forest, yang merupakan
salah satu algoritma paling powerful saat ini.
• Decision tree memprediksi sebuah
kelas (klasifikasi) atau nilai (regresi)
berdasarkan aturan-aturan yang
dibentuk setelah mempelajari data.
Decision Tree dengan R
• Dataset (Iris Dataset)
• Dataset iris merupakan salah satu
dataset populer untuk belajar
bagaimana ML dipakai dalam klasifikasi.
Dataset ini berisi 150 sampel dari 3
spesies bunga iris.
• Pada dataset Iris terdapat 4 kolom
atribut yaitu panjang sepal, lebar sepal,
panjang petal, dan lebar petal.
• Untuk label terdapat 3 kelas atau
kategori atau jenis yang terdapat pada
dataset yaitu Setosa, Versicolor dan
Virginica. Kelas adalah.
Decision Tree
dengan R
Supervised Learning - Regresi
• Regresi adalah salah satu teknik machine learning yang
mirip dengan klasifikasi. Bedanya pada klasifikasi, sebuah
model machine learning memprediksi sebuah kelas,
sedangkan model regresi memprediksi bilangan kontinu.
Bilangan kontinu adalah bilangan numerik.
• Regresi linier adalah salah satu metode supervised yang
masuk dalam golongan regression, sesuai namanya.
• Contoh paling terkenal dari regresi linier adalah
memperkirakan harga rumah berdasarkan fitur
yang terdapat pada rumah seperti luas rumah,
jumlah kamar tidur, lokasi dan sebagainya.
• Regresi linier cocok dipakai ketika terdapat
hubungan linear pada data.
Regresi Linear
dengan R
Unsupervised Learning - Klastering
• Klaster (cluster) adalah sebuah grup yang memiliki kemiripan tertentu.
• Pengklasteran adalah sebuah metode machine learning unsupervised
untuk mengelompokkan objek-objek yang memiliki kemiripan, ke dalam
sebuah klaster.
• Karena termasuk kategori unsupervised, maka dataset yang digunakan
model clustering tidak memiliki label.
• Data yang memiliki kemiripan akan dikelompokkan, lalu setiap data pada
kelompok yang sama akan diberikan label yang sama.
• Contoh kasus untuk teknik clustering adalah customer segmentation.
• Dari data ribuan pengunjung sebuah website ecommerce, model akan
belajar sendiri untuk mengelompokkan pengunjung. Bisa berdasarkan
waktu kunjungan, lama kunjungan, penggunaan fitur search, jumlah klik,
dan sebagainya.
• Model unsupervised learning akan menentukan segmen market dan
mengelompokkan pengunjung ke dalam segmen market yang berbeda.
K-Means Clustering
• Pengklasteran K-Means adalah sebuah
metode yang dikembangkan oleh Stuart
Lloyd dari Bell Labs pada tahun 1957. Lloyd
menggunakan metode ini untuk mengubah
sinyal analog menjadi sinyal digital.
• Hal yang paling pertama K-Means lakukan
adalah memilih sebuah sampel secara acak
untuk dijadikan centroid. Centroid adalah
sebuah sampel pada data yang menjadi
pusat dari sebuah klaster. Selanjutnya
Centroid akan diupdate secara iterative
untuk mendapatkan klaster terbaik.
Perhatikan ilustrasi disamping
K-Means Clustering dengan R
K-Means Clustering dengan R
1 de 12

Recomendados

Machine learning por
Machine learningMachine learning
Machine learningOemar Ahmad
533 visualizações19 slides
Slide minggu 6 (citra digital) por
Slide minggu 6 (citra digital)Slide minggu 6 (citra digital)
Slide minggu 6 (citra digital)Setia Juli Irzal Ismail
22.5K visualizações75 slides
3 Jenis Model (pemodelan dan simulasi) por
3 Jenis Model (pemodelan dan simulasi)3 Jenis Model (pemodelan dan simulasi)
3 Jenis Model (pemodelan dan simulasi)Risdawati Hutabarat
7.8K visualizações5 slides
K-Means Clustering.ppt por
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.pptAdam Superman
601 visualizações25 slides
[PPT] BAB 2 KONSEP DASAR SISTEM, INFORMASI DAN SISTEM TEKNOLOGI INFORMASI por
[PPT] BAB 2 KONSEP DASAR SISTEM, INFORMASI DAN SISTEM TEKNOLOGI INFORMASI[PPT] BAB 2 KONSEP DASAR SISTEM, INFORMASI DAN SISTEM TEKNOLOGI INFORMASI
[PPT] BAB 2 KONSEP DASAR SISTEM, INFORMASI DAN SISTEM TEKNOLOGI INFORMASIDedes ssi
5.2K visualizações21 slides
Data mining 5 klasifikasi decision tree dan random forest por
Data mining 5   klasifikasi decision tree dan random forestData mining 5   klasifikasi decision tree dan random forest
Data mining 5 klasifikasi decision tree dan random forestIrwansyahSaputra1
1.5K visualizações56 slides

Mais conteúdo relacionado

Mais procurados

Penerapan Machine Learning di Industri por
Penerapan Machine Learning di IndustriPenerapan Machine Learning di Industri
Penerapan Machine Learning di IndustriBayu Aldi Yansyah
628 visualizações13 slides
Model dan Simulasi por
Model dan SimulasiModel dan Simulasi
Model dan SimulasiInstitut Teknologi Sepuluh Nopember Surabaya
24.3K visualizações77 slides
Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa... por
Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...
Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...I Gede Iwan Sudipa
3.5K visualizações28 slides
Modul 8 - Jaringan Syaraf Tiruan (JST) por
Modul 8 - Jaringan Syaraf Tiruan (JST)Modul 8 - Jaringan Syaraf Tiruan (JST)
Modul 8 - Jaringan Syaraf Tiruan (JST)ahmad haidaroh
16.9K visualizações75 slides
Pengolahan Citra Digital Dengan Menggunakan MATLAB por
Pengolahan Citra Digital Dengan Menggunakan MATLABPengolahan Citra Digital Dengan Menggunakan MATLAB
Pengolahan Citra Digital Dengan Menggunakan MATLABSimesterious TheMaster
48.8K visualizações51 slides
Proses Data Mining por
Proses Data MiningProses Data Mining
Proses Data Miningdedidarwis
24.5K visualizações178 slides

Mais procurados(20)

Penerapan Machine Learning di Industri por Bayu Aldi Yansyah
Penerapan Machine Learning di IndustriPenerapan Machine Learning di Industri
Penerapan Machine Learning di Industri
Bayu Aldi Yansyah628 visualizações
Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa... por I Gede Iwan Sudipa
Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...
Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...
I Gede Iwan Sudipa3.5K visualizações
Modul 8 - Jaringan Syaraf Tiruan (JST) por ahmad haidaroh
Modul 8 - Jaringan Syaraf Tiruan (JST)Modul 8 - Jaringan Syaraf Tiruan (JST)
Modul 8 - Jaringan Syaraf Tiruan (JST)
ahmad haidaroh16.9K visualizações
Pengolahan Citra Digital Dengan Menggunakan MATLAB por Simesterious TheMaster
Pengolahan Citra Digital Dengan Menggunakan MATLABPengolahan Citra Digital Dengan Menggunakan MATLAB
Pengolahan Citra Digital Dengan Menggunakan MATLAB
Simesterious TheMaster48.8K visualizações
Proses Data Mining por dedidarwis
Proses Data MiningProses Data Mining
Proses Data Mining
dedidarwis24.5K visualizações
Metodologi Penelitian pada Bidang Ilmu Komputer dan Teknologi Informasi por Albaar Rubhasy
Metodologi Penelitian pada Bidang Ilmu Komputer dan Teknologi InformasiMetodologi Penelitian pada Bidang Ilmu Komputer dan Teknologi Informasi
Metodologi Penelitian pada Bidang Ilmu Komputer dan Teknologi Informasi
Albaar Rubhasy43.5K visualizações
Tugas mandiri struktur data por Asep Jaenudin
Tugas mandiri struktur dataTugas mandiri struktur data
Tugas mandiri struktur data
Asep Jaenudin38.2K visualizações
Materi : Struktur Data (1 Pengantar) por eka pandu cynthia
Materi : Struktur Data (1 Pengantar)Materi : Struktur Data (1 Pengantar)
Materi : Struktur Data (1 Pengantar)
eka pandu cynthia2.1K visualizações
pembentukan citra (pengolahan citra digital) por khaerul azmi
pembentukan citra (pengolahan citra digital)pembentukan citra (pengolahan citra digital)
pembentukan citra (pengolahan citra digital)
khaerul azmi9.2K visualizações
Makalah teknik simulasi dan pemodelan por Nayla Tsauraya
Makalah teknik simulasi dan pemodelanMakalah teknik simulasi dan pemodelan
Makalah teknik simulasi dan pemodelan
Nayla Tsauraya33.6K visualizações
Mata Kuliah Basis Data por Mr. Nugraha
Mata Kuliah Basis DataMata Kuliah Basis Data
Mata Kuliah Basis Data
Mr. Nugraha12.6K visualizações
Data Mining - Naive Bayes por dedidarwis
Data Mining - Naive BayesData Mining - Naive Bayes
Data Mining - Naive Bayes
dedidarwis17.7K visualizações
08 penaksiran parameter por Eduard Sondakh
08 penaksiran parameter08 penaksiran parameter
08 penaksiran parameter
Eduard Sondakh6.2K visualizações
Interaksi Manusia dan Komputer : Conceptual Model por Eko Kurniawan Khannedy
Interaksi Manusia dan Komputer : Conceptual ModelInteraksi Manusia dan Komputer : Conceptual Model
Interaksi Manusia dan Komputer : Conceptual Model
Eko Kurniawan Khannedy20.2K visualizações
Machine learning dan data mining por Alvian yudha Prawira
Machine learning dan data miningMachine learning dan data mining
Machine learning dan data mining
Alvian yudha Prawira10.9K visualizações
Pcd 02 - bidang pengolahan citra por Febriyani Syafri
Pcd   02 - bidang pengolahan citraPcd   02 - bidang pengolahan citra
Pcd 02 - bidang pengolahan citra
Febriyani Syafri5.6K visualizações
Presentasi lab statistik por Julita Anggrek
Presentasi lab statistikPresentasi lab statistik
Presentasi lab statistik
Julita Anggrek19.7K visualizações
Algoritma dan Struktur Data (Python) - Struktur Data por AndiNurkholis1
Algoritma dan Struktur Data (Python) - Struktur DataAlgoritma dan Struktur Data (Python) - Struktur Data
Algoritma dan Struktur Data (Python) - Struktur Data
AndiNurkholis11.3K visualizações
Pengolahan Citra Digital (Resume materi kuliah) por Abdullah Azzam Al Haqqoni
Pengolahan Citra Digital (Resume materi kuliah)Pengolahan Citra Digital (Resume materi kuliah)
Pengolahan Citra Digital (Resume materi kuliah)
Abdullah Azzam Al Haqqoni34.8K visualizações

Similar a Machine Learning dengan R

Tugas 1 dm1 por
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1Alvian yudha Prawira
1.1K visualizações13 slides
PENGANTAR DATA SCIENCE.pdf por
PENGANTAR DATA SCIENCE.pdfPENGANTAR DATA SCIENCE.pdf
PENGANTAR DATA SCIENCE.pdfmelrideswina
2 visualizações15 slides
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803 por
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803Alvian yudha Prawira
503 visualizações16 slides
01_PENGANTAR DATA DATA SCIENCE.pptx por
01_PENGANTAR DATA DATA SCIENCE.pptx01_PENGANTAR DATA DATA SCIENCE.pptx
01_PENGANTAR DATA DATA SCIENCE.pptxmelrideswina
389 visualizações18 slides
Data mining 1 pengantar por
Data mining 1   pengantarData mining 1   pengantar
Data mining 1 pengantarIrwansyahSaputra1
1.7K visualizações52 slides
Klasifikasi pohon keputusan por
Klasifikasi pohon keputusanKlasifikasi pohon keputusan
Klasifikasi pohon keputusanUniversitas Bina Darma Palembang
1.2K visualizações14 slides

Similar a Machine Learning dengan R(20)

PENGANTAR DATA SCIENCE.pdf por melrideswina
PENGANTAR DATA SCIENCE.pdfPENGANTAR DATA SCIENCE.pdf
PENGANTAR DATA SCIENCE.pdf
melrideswina2 visualizações
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803 por Alvian yudha Prawira
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
Alvian yudha Prawira503 visualizações
01_PENGANTAR DATA DATA SCIENCE.pptx por melrideswina
01_PENGANTAR DATA DATA SCIENCE.pptx01_PENGANTAR DATA DATA SCIENCE.pptx
01_PENGANTAR DATA DATA SCIENCE.pptx
melrideswina389 visualizações
Data mining 1 pengantar por IrwansyahSaputra1
Data mining 1   pengantarData mining 1   pengantar
Data mining 1 pengantar
IrwansyahSaputra11.7K visualizações
Minggu 1 - Pendahuluan dan Well Define Learning System (Compressed).pdf por JoddySebastianSirega
Minggu 1 - Pendahuluan dan Well Define Learning System (Compressed).pdfMinggu 1 - Pendahuluan dan Well Define Learning System (Compressed).pdf
Minggu 1 - Pendahuluan dan Well Define Learning System (Compressed).pdf
JoddySebastianSirega7 visualizações
PPT KEL 3 DAI - 007.pptx por StevenAdiSantoso
PPT KEL 3 DAI - 007.pptxPPT KEL 3 DAI - 007.pptx
PPT KEL 3 DAI - 007.pptx
StevenAdiSantoso7 visualizações
4 pengenalan-supervised-dan-unsupervised-learning (1) por Nera Ajahh
4 pengenalan-supervised-dan-unsupervised-learning (1)4 pengenalan-supervised-dan-unsupervised-learning (1)
4 pengenalan-supervised-dan-unsupervised-learning (1)
Nera Ajahh322 visualizações
fuzzyShp por Moh Mabrul
fuzzyShpfuzzyShp
fuzzyShp
Moh Mabrul408 visualizações
Materi Kuliah Data Mining full por Munajat ( Munjob )
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining full
Munajat ( Munjob )212 visualizações
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem... por ym.ygrex@comp
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
ym.ygrex@comp700 visualizações
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES por Haris Pramudia
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYESSISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
SISTEM INFORMASI KERUSAKAN LAPTOP MENGGUNAKAN METODE NAÏVE BAYES
Haris Pramudia2.3K visualizações
9868 22329-1-pb por Ibnu Sabda S
9868 22329-1-pb9868 22329-1-pb
9868 22329-1-pb
Ibnu Sabda S289 visualizações
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t... por ym.ygrex@comp
17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...
ym.ygrex@comp535 visualizações
ANALISIS DAN DESAIN KNOWLEDGE MANAGEMENT SYSTEM por Eva Handriyantini
ANALISIS DAN DESAIN KNOWLEDGE MANAGEMENT SYSTEMANALISIS DAN DESAIN KNOWLEDGE MANAGEMENT SYSTEM
ANALISIS DAN DESAIN KNOWLEDGE MANAGEMENT SYSTEM
Eva Handriyantini5.9K visualizações

Mais de Muhammad Rifqi

Market Basket Analisis dengan R por
Market Basket Analisis dengan RMarket Basket Analisis dengan R
Market Basket Analisis dengan RMuhammad Rifqi
87 visualizações22 slides
Visualisasi Data di R dengan ggplot2 por
Visualisasi Data di R dengan ggplot2Visualisasi Data di R dengan ggplot2
Visualisasi Data di R dengan ggplot2Muhammad Rifqi
165 visualizações27 slides
Data Pribadi di Ruang Siber por
Data Pribadi di Ruang SiberData Pribadi di Ruang Siber
Data Pribadi di Ruang SiberMuhammad Rifqi
15 visualizações28 slides
Pengenalan Social Network ANalysis por
Pengenalan Social Network ANalysisPengenalan Social Network ANalysis
Pengenalan Social Network ANalysisMuhammad Rifqi
1.2K visualizações65 slides
Social Media Analytics por
Social Media AnalyticsSocial Media Analytics
Social Media AnalyticsMuhammad Rifqi
1.1K visualizações36 slides
Open source stak of big data techs open suse asia por
Open source stak of big data techs   open suse asiaOpen source stak of big data techs   open suse asia
Open source stak of big data techs open suse asiaMuhammad Rifqi
476 visualizações39 slides

Mais de Muhammad Rifqi(6)

Market Basket Analisis dengan R por Muhammad Rifqi
Market Basket Analisis dengan RMarket Basket Analisis dengan R
Market Basket Analisis dengan R
Muhammad Rifqi87 visualizações
Visualisasi Data di R dengan ggplot2 por Muhammad Rifqi
Visualisasi Data di R dengan ggplot2Visualisasi Data di R dengan ggplot2
Visualisasi Data di R dengan ggplot2
Muhammad Rifqi165 visualizações
Data Pribadi di Ruang Siber por Muhammad Rifqi
Data Pribadi di Ruang SiberData Pribadi di Ruang Siber
Data Pribadi di Ruang Siber
Muhammad Rifqi15 visualizações
Pengenalan Social Network ANalysis por Muhammad Rifqi
Pengenalan Social Network ANalysisPengenalan Social Network ANalysis
Pengenalan Social Network ANalysis
Muhammad Rifqi1.2K visualizações
Social Media Analytics por Muhammad Rifqi
Social Media AnalyticsSocial Media Analytics
Social Media Analytics
Muhammad Rifqi1.1K visualizações
Open source stak of big data techs open suse asia por Muhammad Rifqi
Open source stak of big data techs   open suse asiaOpen source stak of big data techs   open suse asia
Open source stak of big data techs open suse asia
Muhammad Rifqi476 visualizações

Último

Topik 2 Lembar Observasi Karakteristik Peserta Didik_siap upload.pdf por
Topik 2 Lembar Observasi Karakteristik Peserta Didik_siap upload.pdfTopik 2 Lembar Observasi Karakteristik Peserta Didik_siap upload.pdf
Topik 2 Lembar Observasi Karakteristik Peserta Didik_siap upload.pdfClaraaa6
28 visualizações6 slides
Kisi-kisi PSAS Informatika Kelas 8.docx por
Kisi-kisi PSAS Informatika Kelas 8.docxKisi-kisi PSAS Informatika Kelas 8.docx
Kisi-kisi PSAS Informatika Kelas 8.docxcristianmbessa
27 visualizações3 slides
LAPORAN TUGAS TAP 3.docx por
LAPORAN TUGAS TAP 3.docxLAPORAN TUGAS TAP 3.docx
LAPORAN TUGAS TAP 3.docxAhmadBadri14
27 visualizações15 slides
Tugas PPT 7_Julio Putra Welly_E1G022059.pptx por
Tugas PPT 7_Julio Putra Welly_E1G022059.pptxTugas PPT 7_Julio Putra Welly_E1G022059.pptx
Tugas PPT 7_Julio Putra Welly_E1G022059.pptxjulioputrawelly22
19 visualizações9 slides
Kisi-kisi PSAS Bahasa Jawa Kelas 7.doc por
Kisi-kisi PSAS Bahasa Jawa Kelas 7.docKisi-kisi PSAS Bahasa Jawa Kelas 7.doc
Kisi-kisi PSAS Bahasa Jawa Kelas 7.doccristianmbessa
14 visualizações3 slides
Tili Herlina Putri_E1G022033 PENKOM.pptx por
Tili Herlina Putri_E1G022033 PENKOM.pptxTili Herlina Putri_E1G022033 PENKOM.pptx
Tili Herlina Putri_E1G022033 PENKOM.pptxtiliherlina
5 visualizações9 slides

Último(6)

Topik 2 Lembar Observasi Karakteristik Peserta Didik_siap upload.pdf por Claraaa6
Topik 2 Lembar Observasi Karakteristik Peserta Didik_siap upload.pdfTopik 2 Lembar Observasi Karakteristik Peserta Didik_siap upload.pdf
Topik 2 Lembar Observasi Karakteristik Peserta Didik_siap upload.pdf
Claraaa628 visualizações
Kisi-kisi PSAS Informatika Kelas 8.docx por cristianmbessa
Kisi-kisi PSAS Informatika Kelas 8.docxKisi-kisi PSAS Informatika Kelas 8.docx
Kisi-kisi PSAS Informatika Kelas 8.docx
cristianmbessa27 visualizações
LAPORAN TUGAS TAP 3.docx por AhmadBadri14
LAPORAN TUGAS TAP 3.docxLAPORAN TUGAS TAP 3.docx
LAPORAN TUGAS TAP 3.docx
AhmadBadri1427 visualizações
Tugas PPT 7_Julio Putra Welly_E1G022059.pptx por julioputrawelly22
Tugas PPT 7_Julio Putra Welly_E1G022059.pptxTugas PPT 7_Julio Putra Welly_E1G022059.pptx
Tugas PPT 7_Julio Putra Welly_E1G022059.pptx
julioputrawelly2219 visualizações
Kisi-kisi PSAS Bahasa Jawa Kelas 7.doc por cristianmbessa
Kisi-kisi PSAS Bahasa Jawa Kelas 7.docKisi-kisi PSAS Bahasa Jawa Kelas 7.doc
Kisi-kisi PSAS Bahasa Jawa Kelas 7.doc
cristianmbessa14 visualizações
Tili Herlina Putri_E1G022033 PENKOM.pptx por tiliherlina
Tili Herlina Putri_E1G022033 PENKOM.pptxTili Herlina Putri_E1G022033 PENKOM.pptx
Tili Herlina Putri_E1G022033 PENKOM.pptx
tiliherlina5 visualizações

Machine Learning dengan R

  • 1. Machine Learning dengan R Muhammad Rifqi Ma’arif, M.Eng Matakuliah Ilmu Data Industrial Program Studi Teknik Industri Fakultas Teknik & Teknologi Informasi Universitas Jenderal Achmad Yani Yogyakarta 2020
  • 2. Pengantar Machine Learning • Machine learning adalah cabang dari artificial intelligence. Kecerdasan buatan memiliki pengertian yang sangat luas tapi secara umum dapat dipahami sebagai komputer dengan kecerdasan layaknya manusia. • Sedangkan machine learning memiliki arti lebih spesifik yaitu menggunakan metode statistika untuk membuat komputer dapat mempelajari pola pada data tanpa perlu diprogram secara eksplisit. • Machine learning dibagi menjadi beberapa kategori. Tepatnya ada empat kategori besar, yaitu supervised learning, unsupervised learning, semi-supervised learning, dan reinforcement learning.
  • 3. Supervised Learning - Klasifikasi • Klasifikasi adalah teknik untuk menentukan kelas atau kategori berdasarkan atribut yang diberikan. • Klasifikasi yang menghasilkan dua kategori disebut binary classification, • Klasifikasi yang menghasilkan 3 kategori atau lebih disebut multiclass classification atau klasifikasi banyak kelas. • Teknik-teknik Klasifikasi • Decision Tree • Random Forest • Support Vector Machine • Artificial Neural Network
  • 4. Decision Tree • Decision tree atau pohon keputusan adalah salah satu algoritma supervised learning yang dapat dipakai untuk masalah klasifikasi dan regresi. • Decision tree merupakan algoritma yang powerful alias mampu dipakai dalam masalah yang kompleks. • Decision tree juga merupakan komponen pembangun utama algoritma Random Forest, yang merupakan salah satu algoritma paling powerful saat ini. • Decision tree memprediksi sebuah kelas (klasifikasi) atau nilai (regresi) berdasarkan aturan-aturan yang dibentuk setelah mempelajari data.
  • 5. Decision Tree dengan R • Dataset (Iris Dataset) • Dataset iris merupakan salah satu dataset populer untuk belajar bagaimana ML dipakai dalam klasifikasi. Dataset ini berisi 150 sampel dari 3 spesies bunga iris. • Pada dataset Iris terdapat 4 kolom atribut yaitu panjang sepal, lebar sepal, panjang petal, dan lebar petal. • Untuk label terdapat 3 kelas atau kategori atau jenis yang terdapat pada dataset yaitu Setosa, Versicolor dan Virginica. Kelas adalah.
  • 7. Supervised Learning - Regresi • Regresi adalah salah satu teknik machine learning yang mirip dengan klasifikasi. Bedanya pada klasifikasi, sebuah model machine learning memprediksi sebuah kelas, sedangkan model regresi memprediksi bilangan kontinu. Bilangan kontinu adalah bilangan numerik. • Regresi linier adalah salah satu metode supervised yang masuk dalam golongan regression, sesuai namanya. • Contoh paling terkenal dari regresi linier adalah memperkirakan harga rumah berdasarkan fitur yang terdapat pada rumah seperti luas rumah, jumlah kamar tidur, lokasi dan sebagainya. • Regresi linier cocok dipakai ketika terdapat hubungan linear pada data.
  • 9. Unsupervised Learning - Klastering • Klaster (cluster) adalah sebuah grup yang memiliki kemiripan tertentu. • Pengklasteran adalah sebuah metode machine learning unsupervised untuk mengelompokkan objek-objek yang memiliki kemiripan, ke dalam sebuah klaster. • Karena termasuk kategori unsupervised, maka dataset yang digunakan model clustering tidak memiliki label. • Data yang memiliki kemiripan akan dikelompokkan, lalu setiap data pada kelompok yang sama akan diberikan label yang sama. • Contoh kasus untuk teknik clustering adalah customer segmentation. • Dari data ribuan pengunjung sebuah website ecommerce, model akan belajar sendiri untuk mengelompokkan pengunjung. Bisa berdasarkan waktu kunjungan, lama kunjungan, penggunaan fitur search, jumlah klik, dan sebagainya. • Model unsupervised learning akan menentukan segmen market dan mengelompokkan pengunjung ke dalam segmen market yang berbeda.
  • 10. K-Means Clustering • Pengklasteran K-Means adalah sebuah metode yang dikembangkan oleh Stuart Lloyd dari Bell Labs pada tahun 1957. Lloyd menggunakan metode ini untuk mengubah sinyal analog menjadi sinyal digital. • Hal yang paling pertama K-Means lakukan adalah memilih sebuah sampel secara acak untuk dijadikan centroid. Centroid adalah sebuah sampel pada data yang menjadi pusat dari sebuah klaster. Selanjutnya Centroid akan diupdate secara iterative untuk mendapatkan klaster terbaik. Perhatikan ilustrasi disamping