Tugas 1 dm1

Pengertian data mining 
• Data mining adalah proses mencari pola atau informasi menarik 
dalam data terpilih dengan menggunakan teknik atau metode 
tertentu. Teknik, metode, atau algoritma dalam data mining 
sangat bervariasi. Pemilihan metode dan algoritma yang tepat 
sangat bergantung pada tujuan dan proses KDD secara 
keseluruhan. 
• KDD (Knowledge Discovery in Database) adalah keseluruhan 
proses non-trivial untuk mencari dan mengidentifikasi pola 
(pattern) dalam data, dimana pola yang ditemukan bersifat sah, 
baru, dapat bermanfaat dan dapat dimengerti
Sejarah dan perkembangan Data mining 
Sejarah Data mining bukanlah bidang baru. Salah satu kesulitan 
untuk mendefinisikan data mining adalah kenyataan bahwa data 
mining mewarisi banyak aspek dan teknik dari bidang-bidang 
ilmu yang sudah mapan terlebih dulu. 
Beberapa teknik yang sering disebut-sebut dalam literatur data 
mining seperti classification, neural network, genetic algorithm 
dll, sudah lama dikenal di dunia kecerdasan buatan.. Yang 
membedakan persepsi terhadap data mining adalah 
perkembangan teknik-teknik data mining untuk aplikasi pada 
database skala besar. Sebelum populernya data mining, teknik-teknik 
tersebut pada umunya diterapkan pada data skala kecil 
saja. Selain itu beberapa teknik dari bidang database untuk 
transformasi data juga merupakan bagian integral dari proses 
data mining.
• Perkembangan data mining (DM) yang pesat tidak dapat lepas dari 
perkembangan teknologi informasi yang memungkinkan data dalam 
jumlah besar terakumulasi. Sebagai contoh, toko swalayan merekam 
setiap penjualan barang dengan memakai alat POS (point of sales). 
Database data penjualan tsb. bisa mencapai beberapa GB setiap harinya 
untuk sebuah jaringan toko swalayan berskala nasional. Perkembangan 
internet juga punya andil cukup besar dalam akumulasi data. 
• Tetapi pertumbuhan yang pesat dari akumulasi data menciptakan keadaan 
yang disebut “rich of data but poor of information” karena data yang 
terkumpul itu tidak dapat digunakan untuk aplikasi yang berguna. Tidak 
jarang kumpulan data itu dibiarkan begitu saja seakan-akan “kuburan 
data” (data tombs) 
• Fakta yang tak terelakkan data mining adalah bahwa subset/set data yang 
dianalisis mungkin tidak mewakili seluruh domain, dan karenanya tidak 
boleh berisi contoh-contoh hubungan kritis tertentu dan perilaku yang ada 
di bagian lain dari domain . Untuk mengatasi masalah semacam ini, 
analisis dapat ditambah menggunakan berbasis percobaan dan 
pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan 
manusia.
Metode Data mining 
• Clustering atau pengelompokan merupakan teknik untuk 
mengelompokkan data ke dalam suatu kelompok tertentu. 
Metode clustering dalam data mining antara lain DBScan, 
Simple K-mean, Hierarchical CLustering. Dua terakhir pada 
metode clustering dalam data mining ini juga dipelajari pada 
mata kuliah Statistika Multivariat Terapan. Sebagai contoh 
untuk clustering: Terdapat 5 negara: Indonesia, Singapura, 
India, Inggris, Jerman. Maka 5 negara tersebut dapat dijadikan 
dua klaster berdasarkan letak geografisnya: Eropa (Inggris, 
Jerman) dan Asia (Indonesia, Singapura, India). Namun juga 
dapat dijadikan dua klaster yang berbeda berdasarkan tingkat 
sector industri dan jasa: Negara maju (Singapura, Inggris, 
Jerman) dan Negara berkembang (Indonesia, India)
• Classification merupakan teknik pengklasifikasian data. Bedanya data 
dengan clustering pada clustering variabel dependen tidak ada sedangkan 
pada classification diharuskan ada variabel dependen. Contohnya 
pembagian criteria calon debitur yakni debitur baik dan buruk. Metode 
classification dalam data mining banyak sekali, misalnya ID3, C4.5, K 
Nearest Neigh bors. 
• Associaton merupakan teknik dalam data mining yang mempelajari 
hubungan data. Associatin Rule ini biasa digunakan pada supermarket 
untuk menganalisis perilaku pelanggan dalam berbelanja. Sebagai contoh 
jika pelanggan membeli barang A, B, C maka pelanggan akan membeli 
barang X. Atau dalam notasi biasa ditulis: A, B, C -> X . 
Biasanya dalam software data mining juga ada beberapa metode baik 
clustering atau klasifikasi yang berasal dari cabang soft computing, 
misalnya neural network. Metode yang berasal dari soft computing yang 
biasanya juga disinggung dalam data mining antara lain perceptron , 
backpropagation (multilayer perceptron), self organizing map (SOM).
Algoritma Estimasi 
• Algoritma estimasi mirip dengan algoritma 
klasifikasi, tapi variabel target adalah berupa 
bilangan numerik (kontinyu) dan bukan 
kategorikal (nominal atau diskrit) 
• Estimasi nilai dari variable target ditentukan 
berdasarkan nilai dari variabel prediktor (atribut) 
• Algoritma estimasi yang biasa digunakan adalah: 
Linear Regression, Neural Network, Support 
Vector Machine
Algoritma Prediksi 
• Algoritma prediksi/forecasting sama dengan 
algoritma estimasi di mana label/target/class 
bertipe numerik, bedanya adalah data yang 
digunakan merupakan data rentet waktu 
(data time series) 
• Istilah prediksi kadang digunakan juga untuk 
klasifikasi, tidak hanya untuk prediksi time series, 
karena sifatnya yang bisa menghasilkan class 
berdasarkan berbagai atribut yang kita sediakan 
• Semua algoritma estimasi dapat digunakan untuk 
prediksi/forecasting
Algoritma Klasifikasi 
• Klasifikasi adalah algoritma yang menggunakan data 
dengan target/class/label berupa nilai kategorikal 
(nominal) 
• Contoh, apabila target/class/label adalah pendapatan, 
maka bisa digunakan nilai nominal (kategorikal) sbb: 
pendapatan besar, menengah, kecil 
• Contoh lain adalah rekomendasi contact lens, apakah 
menggunakan yang jenis soft, hard atau none 
• Algoritma klasifikasi yang biasa digunakan adalah: Naive 
Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear 
Discriminant Analysis, etc
Algoritma Klastering 
• Klastering adalah pengelompokkan data, hasil observasi 
dan kasus ke dalam class yang mirip 
• Suatu klaster (cluster) adalah koleksi data yang mirip 
antara satu dengan yang lain, dan memiliki perbedaan 
bila dibandingkan dengan data dari klaster lain 
• Perbedaan utama algoritma klastering dengan klasifikasi 
adalah klastering tidak memiliki target/class/label, jadi 
termasuk unsupervised learning 
• Klastering sering digunakan sebagai tahap awal dalam 
proses data mining, dengan hasil klaster yang terbentuk 
akan menjadi input dari algoritma berikutnya yang 
digunakan
Algoritma Asosiasi 
• Algoritma association rule (aturan asosiasi) adalah 
algoritma yang menemukan atribut yang “muncul 
bersamaan” 
• Dalam dunia bisnis, sering disebut dengan affinity 
analysis atau market basket analysis 
• Algoritma asosiasi akan mencari aturan yang 
menghitung hubungan diantara dua atau lebih atribut 
• Algoritma association rules berangkat dari pola “If 
antecedent, then consequent,” bersamaan dengan 
pengukuran support (coverage) dan confidence 
(accuration) yang terasosiasi dalam aturan
Algoritma Asosiasi 
• Contoh, pada hari kamis malam, 1000 pelanggan telah 
melakukan belanja di supermaket ABC, dimana: 
– 200 orang membeli Sabun Mandi 
– dari 200 orang yang membeli sabun mandi, 50 
orangnya membeli Fanta 
• Jadi, association rule menjadi, “Jika membeli sabun 
mandi, maka membeli Fanta”, dengan nilai support = 
200/1000 = 20% dan nilai confidence = 50/200 = 25% 
• Algoritma association rule diantaranya adalah: A priori 
algorithm, FP-Growth algorithm, GRI algorithm
Pemanfaatan Data mining 
• Penentuan kelayakan aplikasi peminjaman uang di bank 
• Penentuan pasokan listrik PLN untuk wilayah Jakarta 
• Diagnosis pola kesalahan mesin 
• Perkiraan harga saham dan tingkat inflasi 
• Analisis pola belanja pelanggan 
• Memisahkan minyak mentah dan gas alam 
• Pemilihan program TV otomatis 
• Penentuan pola pelanggan yang loyal pada perusahaan 
operator telepon 
• Deteksi pencucian uang dari transaksi perbankan 
• Deteksi serangan (intrusion) pada suatu jaringan
Sumber refrensi 
• http://datamining10041.wordpress.com 
• http://daduhitam.wordpress.com 
• http://andiseprianto.blogspot.com 
• http://pojokkampusit.blogspot.com/ 
• http://mr-harajuku.blogspot.com/ 
• http://gorbyrashid.blogspot.com/ 
• Wikipedia
1 de 13

Recomendados

Modul Data Warehouse por
Modul Data Warehouse  Modul Data Warehouse
Modul Data Warehouse Nina Hendra Putri
1.2K visualizações17 slides
Contoh RAB PADATI WEB por
Contoh RAB PADATI WEBContoh RAB PADATI WEB
Contoh RAB PADATI WEBRina Wijaya
49.1K visualizações2 slides
Penerapan Strategi Pemasaran Digital por
Penerapan Strategi Pemasaran DigitalPenerapan Strategi Pemasaran Digital
Penerapan Strategi Pemasaran DigitalYuliasti Ika Handayani
1.9K visualizações39 slides
3. metodologi data science dts ta v.1 por
3. metodologi data science dts ta v.13. metodologi data science dts ta v.1
3. metodologi data science dts ta v.1ArdianDwiPraba
2.3K visualizações32 slides
Data mining 1 pengantar por
Data mining 1   pengantarData mining 1   pengantar
Data mining 1 pengantarIrwansyahSaputra1
1.7K visualizações52 slides
Business Plan / Rencana Bisnis por
Business Plan / Rencana BisnisBusiness Plan / Rencana Bisnis
Business Plan / Rencana BisnisJesika Amanda
9.7K visualizações41 slides

Mais conteúdo relacionado

Mais procurados

Kualitas informasi por
Kualitas informasiKualitas informasi
Kualitas informasiImam Nursyihab
120.5K visualizações21 slides
Manajemen ruang-lingkup-proyek por
Manajemen ruang-lingkup-proyekManajemen ruang-lingkup-proyek
Manajemen ruang-lingkup-proyekFajar Baskoro
45.2K visualizações17 slides
Kecerdasan Buatan (AI) por
Kecerdasan Buatan (AI)Kecerdasan Buatan (AI)
Kecerdasan Buatan (AI)Farichah Riha
2.6K visualizações92 slides
8 modul 8-dts-fitur dan cleaning data-univ-gunadarma por
8 modul 8-dts-fitur dan cleaning data-univ-gunadarma8 modul 8-dts-fitur dan cleaning data-univ-gunadarma
8 modul 8-dts-fitur dan cleaning data-univ-gunadarmaArdianDwiPraba
1.2K visualizações47 slides
Peramalan Forecasting por
Peramalan ForecastingPeramalan Forecasting
Peramalan ForecastingINDAHMAWARNI1
36.4K visualizações47 slides
Proposal Project Management Plan por
Proposal Project Management PlanProposal Project Management Plan
Proposal Project Management PlanSariWahyuningsih4
12.5K visualizações40 slides

Mais procurados(20)

Kualitas informasi por Imam Nursyihab
Kualitas informasiKualitas informasi
Kualitas informasi
Imam Nursyihab120.5K visualizações
Manajemen ruang-lingkup-proyek por Fajar Baskoro
Manajemen ruang-lingkup-proyekManajemen ruang-lingkup-proyek
Manajemen ruang-lingkup-proyek
Fajar Baskoro45.2K visualizações
Kecerdasan Buatan (AI) por Farichah Riha
Kecerdasan Buatan (AI)Kecerdasan Buatan (AI)
Kecerdasan Buatan (AI)
Farichah Riha2.6K visualizações
8 modul 8-dts-fitur dan cleaning data-univ-gunadarma por ArdianDwiPraba
8 modul 8-dts-fitur dan cleaning data-univ-gunadarma8 modul 8-dts-fitur dan cleaning data-univ-gunadarma
8 modul 8-dts-fitur dan cleaning data-univ-gunadarma
ArdianDwiPraba1.2K visualizações
Peramalan Forecasting por INDAHMAWARNI1
Peramalan ForecastingPeramalan Forecasting
Peramalan Forecasting
INDAHMAWARNI136.4K visualizações
Proposal Project Management Plan por SariWahyuningsih4
Proposal Project Management PlanProposal Project Management Plan
Proposal Project Management Plan
SariWahyuningsih412.5K visualizações
PENGENALAN DATA SCIENCE.pptx por YezintaDewimaharani
PENGENALAN DATA SCIENCE.pptxPENGENALAN DATA SCIENCE.pptx
PENGENALAN DATA SCIENCE.pptx
YezintaDewimaharani1.1K visualizações
Contoh Laporan Studi Kelayakan Bisnis Mahasiswa por Syafril Djaelani,SE, MM
Contoh Laporan Studi Kelayakan Bisnis MahasiswaContoh Laporan Studi Kelayakan Bisnis Mahasiswa
Contoh Laporan Studi Kelayakan Bisnis Mahasiswa
Syafril Djaelani,SE, MM65.7K visualizações
Tabel faktor suku bunga majemuk por Simon Patabang
Tabel faktor suku bunga majemukTabel faktor suku bunga majemuk
Tabel faktor suku bunga majemuk
Simon Patabang27.5K visualizações
Exploratory Data Analysis(EDA).pptx por ibnukatsir7
Exploratory Data Analysis(EDA).pptxExploratory Data Analysis(EDA).pptx
Exploratory Data Analysis(EDA).pptx
ibnukatsir7100 visualizações
Presentasi proposal tugas akhir por lukman88
Presentasi proposal tugas  akhirPresentasi proposal tugas  akhir
Presentasi proposal tugas akhir
lukman8814.7K visualizações
Simulasi dengan menggunakan ProModel Software por Mega Audina
Simulasi dengan menggunakan ProModel SoftwareSimulasi dengan menggunakan ProModel Software
Simulasi dengan menggunakan ProModel Software
Mega Audina35.8K visualizações
Proposal proyek por fikrizulazmi
Proposal proyekProposal proyek
Proposal proyek
fikrizulazmi27.2K visualizações
Sistem Informasi Pemasaran por Afdan Rojabi
Sistem Informasi PemasaranSistem Informasi Pemasaran
Sistem Informasi Pemasaran
Afdan Rojabi3.5K visualizações
Magang presentasi por mazqooo
Magang presentasiMagang presentasi
Magang presentasi
mazqooo35.8K visualizações
5 ta-2021-05-business-understanding-modul-ariw-2021-07-17 por ArdianDwiPraba
5 ta-2021-05-business-understanding-modul-ariw-2021-07-175 ta-2021-05-business-understanding-modul-ariw-2021-07-17
5 ta-2021-05-business-understanding-modul-ariw-2021-07-17
ArdianDwiPraba1.7K visualizações
Program Kerja por Husaeri Priatna
Program KerjaProgram Kerja
Program Kerja
Husaeri Priatna114.9K visualizações
Kumpulan TOR / Kerangka Acuan Kerja por Marino Alsangkily
Kumpulan TOR / Kerangka Acuan KerjaKumpulan TOR / Kerangka Acuan Kerja
Kumpulan TOR / Kerangka Acuan Kerja
Marino Alsangkily72.4K visualizações
Modul 3 pencarian heuristik por ahmad haidaroh
Modul 3   pencarian heuristikModul 3   pencarian heuristik
Modul 3 pencarian heuristik
ahmad haidaroh22.4K visualizações
Materi Pelatihan tentang Digital Marketing dan Social Media Marketing por Yodhia Antariksa
Materi Pelatihan tentang Digital Marketing dan Social Media MarketingMateri Pelatihan tentang Digital Marketing dan Social Media Marketing
Materi Pelatihan tentang Digital Marketing dan Social Media Marketing
Yodhia Antariksa166.8K visualizações

Similar a Tugas 1 dm1

093-P01.pdf por
093-P01.pdf093-P01.pdf
093-P01.pdfWawanSnea
1 visão44 slides
MODUL DATA MINING por
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MININGNanzalXIV
14 visualizações37 slides
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t... por
17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...ym.ygrex@comp
533 visualizações8 slides
99 1-414-2-10-20190724 por
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724ssuser82ed8e
37 visualizações17 slides
Materi Kuliah Data Mining full por
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining fullMunajat ( Munjob )
211 visualizações34 slides
Data mining week 1 - pengantar data mining por
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data miningLye Lazar
3.4K visualizações30 slides

Similar a Tugas 1 dm1(20)

MODUL DATA MINING por NanzalXIV
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MINING
NanzalXIV14 visualizações
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t... por ym.ygrex@comp
17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...
ym.ygrex@comp533 visualizações
99 1-414-2-10-20190724 por ssuser82ed8e
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724
ssuser82ed8e37 visualizações
Materi Kuliah Data Mining full por Munajat ( Munjob )
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining full
Munajat ( Munjob )211 visualizações
Data mining week 1 - pengantar data mining por Lye Lazar
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data mining
Lye Lazar3.4K visualizações
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ... por butest
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
butest2.2K visualizações
Data Mining Diskusi 2.pdf por HendroGunawan8
Data Mining Diskusi 2.pdfData Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdf
HendroGunawan87 visualizações
10 por dedesumarni3
1010
10
dedesumarni339 visualizações
Pertemuan 4.pdf por HasanulFahmi2
Pertemuan 4.pdfPertemuan 4.pdf
Pertemuan 4.pdf
HasanulFahmi27 visualizações
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx por Sangrian1
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxTUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
Sangrian14 visualizações
Machine learning dan data mining por Alvian yudha Prawira
Machine learning dan data miningMachine learning dan data mining
Machine learning dan data mining
Alvian yudha Prawira10.9K visualizações
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803 por Alvian yudha Prawira
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
A11.2012.07112 alvian yudha prawira tgsdm2 _a11.4803
Alvian yudha Prawira503 visualizações
PMK 1 PENGANTAR DATA ANALITIK.pdf por Andri946883
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdf
Andri94688325 visualizações
Essential sql server 2008 bi sql server indonesia group - data mining por Charlez Dbc
Essential sql server 2008 bi sql server indonesia group - data miningEssential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data mining
Charlez Dbc1.9K visualizações
Procceding_KNIT_2_97-102_AndikaDwiHadiri por Andika Dwi Hadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriProcceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Andika Dwi Hadiri108 visualizações
Kecerdasan bisnis por HehePangibulan2
Kecerdasan bisnisKecerdasan bisnis
Kecerdasan bisnis
HehePangibulan22.1K visualizações
Kecerdasan bisnis- Sistem Penunjang Keputusan por Dasufianti
Kecerdasan bisnis- Sistem Penunjang KeputusanKecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang Keputusan
Dasufianti565 visualizações
Data Mining Diskusi 1.docx por HendroGunawan8
Data Mining Diskusi 1.docxData Mining Diskusi 1.docx
Data Mining Diskusi 1.docx
HendroGunawan86 visualizações

Mais de Alvian yudha Prawira

Prostat 1 por
Prostat 1Prostat 1
Prostat 1Alvian yudha Prawira
398 visualizações13 slides
tgsdm3_ kelompok 7 por
 tgsdm3_ kelompok 7 tgsdm3_ kelompok 7
tgsdm3_ kelompok 7Alvian yudha Prawira
4.1K visualizações31 slides
Modul 11 por
Modul 11Modul 11
Modul 11Alvian yudha Prawira
204 visualizações7 slides
Modul 10 por
Modul 10Modul 10
Modul 10Alvian yudha Prawira
511 visualizações16 slides
Linked list linear por
Linked list linearLinked list linear
Linked list linearAlvian yudha Prawira
241 visualizações30 slides
Priority queue por
Priority queuePriority queue
Priority queueAlvian yudha Prawira
1.8K visualizações7 slides

Mais de Alvian yudha Prawira(8)

Último

LATIHAN7_HEPIMAYASARI_E1G017085.pptx por
LATIHAN7_HEPIMAYASARI_E1G017085.pptxLATIHAN7_HEPIMAYASARI_E1G017085.pptx
LATIHAN7_HEPIMAYASARI_E1G017085.pptxhepimayasari28
14 visualizações9 slides
JavaScript Dasar por
JavaScript DasarJavaScript Dasar
JavaScript Dasargdsc10
5 visualizações155 slides
Yohanes silaen E1G022043.pptx por
Yohanes silaen E1G022043.pptxYohanes silaen E1G022043.pptx
Yohanes silaen E1G022043.pptxyohanessilaen6
5 visualizações8 slides
Latihan 6_Novelia Tamba_E1G022063-1.pptx por
Latihan 6_Novelia Tamba_E1G022063-1.pptxLatihan 6_Novelia Tamba_E1G022063-1.pptx
Latihan 6_Novelia Tamba_E1G022063-1.pptxnoveliatamba
14 visualizações6 slides
SMART VILLAGE.pptx por
SMART VILLAGE.pptxSMART VILLAGE.pptx
SMART VILLAGE.pptxbayuwibisono3
6 visualizações16 slides
DITHYA HUTASOIT_E1G022069.pptx por
DITHYA HUTASOIT_E1G022069.pptxDITHYA HUTASOIT_E1G022069.pptx
DITHYA HUTASOIT_E1G022069.pptxDithyaHutasoit
5 visualizações6 slides

Último(6)

LATIHAN7_HEPIMAYASARI_E1G017085.pptx por hepimayasari28
LATIHAN7_HEPIMAYASARI_E1G017085.pptxLATIHAN7_HEPIMAYASARI_E1G017085.pptx
LATIHAN7_HEPIMAYASARI_E1G017085.pptx
hepimayasari2814 visualizações
JavaScript Dasar por gdsc10
JavaScript DasarJavaScript Dasar
JavaScript Dasar
gdsc105 visualizações
Yohanes silaen E1G022043.pptx por yohanessilaen6
Yohanes silaen E1G022043.pptxYohanes silaen E1G022043.pptx
Yohanes silaen E1G022043.pptx
yohanessilaen65 visualizações
Latihan 6_Novelia Tamba_E1G022063-1.pptx por noveliatamba
Latihan 6_Novelia Tamba_E1G022063-1.pptxLatihan 6_Novelia Tamba_E1G022063-1.pptx
Latihan 6_Novelia Tamba_E1G022063-1.pptx
noveliatamba14 visualizações
SMART VILLAGE.pptx por bayuwibisono3
SMART VILLAGE.pptxSMART VILLAGE.pptx
SMART VILLAGE.pptx
bayuwibisono36 visualizações
DITHYA HUTASOIT_E1G022069.pptx por DithyaHutasoit
DITHYA HUTASOIT_E1G022069.pptxDITHYA HUTASOIT_E1G022069.pptx
DITHYA HUTASOIT_E1G022069.pptx
DithyaHutasoit5 visualizações

Tugas 1 dm1

  • 1. Pengertian data mining • Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode dan algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan. • KDD (Knowledge Discovery in Database) adalah keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti
  • 2. Sejarah dan perkembangan Data mining Sejarah Data mining bukanlah bidang baru. Salah satu kesulitan untuk mendefinisikan data mining adalah kenyataan bahwa data mining mewarisi banyak aspek dan teknik dari bidang-bidang ilmu yang sudah mapan terlebih dulu. Beberapa teknik yang sering disebut-sebut dalam literatur data mining seperti classification, neural network, genetic algorithm dll, sudah lama dikenal di dunia kecerdasan buatan.. Yang membedakan persepsi terhadap data mining adalah perkembangan teknik-teknik data mining untuk aplikasi pada database skala besar. Sebelum populernya data mining, teknik-teknik tersebut pada umunya diterapkan pada data skala kecil saja. Selain itu beberapa teknik dari bidang database untuk transformasi data juga merupakan bagian integral dari proses data mining.
  • 3. • Perkembangan data mining (DM) yang pesat tidak dapat lepas dari perkembangan teknologi informasi yang memungkinkan data dalam jumlah besar terakumulasi. Sebagai contoh, toko swalayan merekam setiap penjualan barang dengan memakai alat POS (point of sales). Database data penjualan tsb. bisa mencapai beberapa GB setiap harinya untuk sebuah jaringan toko swalayan berskala nasional. Perkembangan internet juga punya andil cukup besar dalam akumulasi data. • Tetapi pertumbuhan yang pesat dari akumulasi data menciptakan keadaan yang disebut “rich of data but poor of information” karena data yang terkumpul itu tidak dapat digunakan untuk aplikasi yang berguna. Tidak jarang kumpulan data itu dibiarkan begitu saja seakan-akan “kuburan data” (data tombs) • Fakta yang tak terelakkan data mining adalah bahwa subset/set data yang dianalisis mungkin tidak mewakili seluruh domain, dan karenanya tidak boleh berisi contoh-contoh hubungan kritis tertentu dan perilaku yang ada di bagian lain dari domain . Untuk mengatasi masalah semacam ini, analisis dapat ditambah menggunakan berbasis percobaan dan pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan manusia.
  • 4. Metode Data mining • Clustering atau pengelompokan merupakan teknik untuk mengelompokkan data ke dalam suatu kelompok tertentu. Metode clustering dalam data mining antara lain DBScan, Simple K-mean, Hierarchical CLustering. Dua terakhir pada metode clustering dalam data mining ini juga dipelajari pada mata kuliah Statistika Multivariat Terapan. Sebagai contoh untuk clustering: Terdapat 5 negara: Indonesia, Singapura, India, Inggris, Jerman. Maka 5 negara tersebut dapat dijadikan dua klaster berdasarkan letak geografisnya: Eropa (Inggris, Jerman) dan Asia (Indonesia, Singapura, India). Namun juga dapat dijadikan dua klaster yang berbeda berdasarkan tingkat sector industri dan jasa: Negara maju (Singapura, Inggris, Jerman) dan Negara berkembang (Indonesia, India)
  • 5. • Classification merupakan teknik pengklasifikasian data. Bedanya data dengan clustering pada clustering variabel dependen tidak ada sedangkan pada classification diharuskan ada variabel dependen. Contohnya pembagian criteria calon debitur yakni debitur baik dan buruk. Metode classification dalam data mining banyak sekali, misalnya ID3, C4.5, K Nearest Neigh bors. • Associaton merupakan teknik dalam data mining yang mempelajari hubungan data. Associatin Rule ini biasa digunakan pada supermarket untuk menganalisis perilaku pelanggan dalam berbelanja. Sebagai contoh jika pelanggan membeli barang A, B, C maka pelanggan akan membeli barang X. Atau dalam notasi biasa ditulis: A, B, C -> X . Biasanya dalam software data mining juga ada beberapa metode baik clustering atau klasifikasi yang berasal dari cabang soft computing, misalnya neural network. Metode yang berasal dari soft computing yang biasanya juga disinggung dalam data mining antara lain perceptron , backpropagation (multilayer perceptron), self organizing map (SOM).
  • 6. Algoritma Estimasi • Algoritma estimasi mirip dengan algoritma klasifikasi, tapi variabel target adalah berupa bilangan numerik (kontinyu) dan bukan kategorikal (nominal atau diskrit) • Estimasi nilai dari variable target ditentukan berdasarkan nilai dari variabel prediktor (atribut) • Algoritma estimasi yang biasa digunakan adalah: Linear Regression, Neural Network, Support Vector Machine
  • 7. Algoritma Prediksi • Algoritma prediksi/forecasting sama dengan algoritma estimasi di mana label/target/class bertipe numerik, bedanya adalah data yang digunakan merupakan data rentet waktu (data time series) • Istilah prediksi kadang digunakan juga untuk klasifikasi, tidak hanya untuk prediksi time series, karena sifatnya yang bisa menghasilkan class berdasarkan berbagai atribut yang kita sediakan • Semua algoritma estimasi dapat digunakan untuk prediksi/forecasting
  • 8. Algoritma Klasifikasi • Klasifikasi adalah algoritma yang menggunakan data dengan target/class/label berupa nilai kategorikal (nominal) • Contoh, apabila target/class/label adalah pendapatan, maka bisa digunakan nilai nominal (kategorikal) sbb: pendapatan besar, menengah, kecil • Contoh lain adalah rekomendasi contact lens, apakah menggunakan yang jenis soft, hard atau none • Algoritma klasifikasi yang biasa digunakan adalah: Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis, etc
  • 9. Algoritma Klastering • Klastering adalah pengelompokkan data, hasil observasi dan kasus ke dalam class yang mirip • Suatu klaster (cluster) adalah koleksi data yang mirip antara satu dengan yang lain, dan memiliki perbedaan bila dibandingkan dengan data dari klaster lain • Perbedaan utama algoritma klastering dengan klasifikasi adalah klastering tidak memiliki target/class/label, jadi termasuk unsupervised learning • Klastering sering digunakan sebagai tahap awal dalam proses data mining, dengan hasil klaster yang terbentuk akan menjadi input dari algoritma berikutnya yang digunakan
  • 10. Algoritma Asosiasi • Algoritma association rule (aturan asosiasi) adalah algoritma yang menemukan atribut yang “muncul bersamaan” • Dalam dunia bisnis, sering disebut dengan affinity analysis atau market basket analysis • Algoritma asosiasi akan mencari aturan yang menghitung hubungan diantara dua atau lebih atribut • Algoritma association rules berangkat dari pola “If antecedent, then consequent,” bersamaan dengan pengukuran support (coverage) dan confidence (accuration) yang terasosiasi dalam aturan
  • 11. Algoritma Asosiasi • Contoh, pada hari kamis malam, 1000 pelanggan telah melakukan belanja di supermaket ABC, dimana: – 200 orang membeli Sabun Mandi – dari 200 orang yang membeli sabun mandi, 50 orangnya membeli Fanta • Jadi, association rule menjadi, “Jika membeli sabun mandi, maka membeli Fanta”, dengan nilai support = 200/1000 = 20% dan nilai confidence = 50/200 = 25% • Algoritma association rule diantaranya adalah: A priori algorithm, FP-Growth algorithm, GRI algorithm
  • 12. Pemanfaatan Data mining • Penentuan kelayakan aplikasi peminjaman uang di bank • Penentuan pasokan listrik PLN untuk wilayah Jakarta • Diagnosis pola kesalahan mesin • Perkiraan harga saham dan tingkat inflasi • Analisis pola belanja pelanggan • Memisahkan minyak mentah dan gas alam • Pemilihan program TV otomatis • Penentuan pola pelanggan yang loyal pada perusahaan operator telepon • Deteksi pencucian uang dari transaksi perbankan • Deteksi serangan (intrusion) pada suatu jaringan
  • 13. Sumber refrensi • http://datamining10041.wordpress.com • http://daduhitam.wordpress.com • http://andiseprianto.blogspot.com • http://pojokkampusit.blogspot.com/ • http://mr-harajuku.blogspot.com/ • http://gorbyrashid.blogspot.com/ • Wikipedia