SlideShare uma empresa Scribd logo
1 de 37
Data Mining
-Complete Course Edition-
1
Pengertian yang Salah
Learning Design
Educational Objectives
(Benjamin Bloom)
Cognitive
Affective
Psychomotor
Criterion Referenced
Instruction
(Robert Mager)
Competencies
Performance
Evaluation
Minimalism
(John Carroll)
Start Immediately
Minimize the Reading
Error Recognition
Self-Contained
3
Textbooks
4
Course
Outline
• 1.1 Apa dan Mengapa Data Mining?
• 1.2 Peran Utama dan Metode Data Mining
• 1.3 Sejarah dan Penerapan Data Mining
1.1. Pengantar
Data Mining
• 2.1 Proses dan Tools Data Mining
• 2.2 Penerapan Proses Data Mining
• 2.3 Evaluasi Model Data Mining
• 2.4 Proses Data Mining berbasis CRISP-DM
2. Proses
Data Mining
• 3.1 Data Cleaning
• 3.2 Data Reduction
• 3.3 Data Transformation and Data Discretization
• 3.4 Data Integration
3. Persiapan Data
• 4.1 Algoritma Klasifikasi
• 4.2 Algoritma Klastering
• 4.3 Algoritma Asosiasi
• 4.4 Algoritma Estimasi dan Forecasting
4. Algoritma
Data Mining
• 5.1 Text Mining Concepts
• 5.2 Text Clustering
• 5.3 Text Classification
• 5.4 Data Mining Law
5. Text Mining
6
1. Pengantar Data Mining
1.1 Apa dan Mengapa Data Mining?
1.2 Peran Utama dan Metode Data Mining
1.3 Sejarah dan Penerapan Data Mining
7
1.1 Apa dan Mengapa Data Mining?
8
Manusia Memproduksi Data
Manusia memproduksi beragam
data yang jumlah dan ukurannya
sangat besar
• Astronomi
• Bisnis
• Kedokteran
• Ekonomi
• Olahraga
• Cuaca
• Financial
• …
9
10
Pertumbuhan Data
Astronomi
• Sloan Digital Sky Survey
• New Mexico, 2000
• 140TB over 10 years
• Large Synoptic Survey Telescope
• Chile, 2016
• Will acquire 140TB every five days
Biologi dan Kedokteran
• European Bioinformatics Institute (EBI)
• 20PB of data (genomic data doubles in size each year)
• A single sequenced human genome can be around 140GB in size
11
kilobyte (kB) 103
megabyte (MB) 106
gigabyte (GB) 109
terabyte (TB) 1012
petabyte (PB) 1015
exabyte (EB) 1018
zettabyte (ZB) 1021
yottabyte (YB) 1024
Perubahan Kultur dan Perilaku
12
Datangnya Tsunami Data
• Mobile Electronics market
• 4.43B mobile phone users in 2015
• 7B mobile phone subscriptions in 2015
• Web and Social Networks generates
amount of data
• Google processes 100 PB per day, 3 million servers
• Facebook has 300 PB of user data per day
• Youtube has 1000PB video storage
• 235 TBs data collected by the US Library of Congress
• 15 out of 17 sectors in the US have more data stored
per company than the US Library of Congress
13
kilobyte (kB) 103
megabyte (MB) 106
gigabyte (GB) 109
terabyte (TB) 1012
petabyte (PB) 1015
exabyte (EB) 1018
zettabyte (ZB) 1021
yottabyte (YB) 1024
Kebanjiran Data tapi Miskin
Pengetahuan
We are drowning in data, but
starving for knowledge!
(John Naisbitt, Megatrends, 1988)
14
Mengubah Data Menjadi Pengetahuan
• Data harus kita olah menjadi pengetahuan
supaya bisa bermanfaat bagi manusia
• Dengan pengetahuan
tersebut, manusia dapat:
• Melakukan estimasi dan prediksi
apa yang terjadi di depan
• Melakukan analisis tentang
asosiasi, korelasi dan
pengelompokan antar data dan atribut
• Membantu pengambilan keputusan dan
pembuatan kebijakan 15
16
Apa itu Data Mining?
• Disiplin ilmu yang mempelajari metode untuk
mengekstrak pengetahuan atau menemukan pola dari
suatu data yang besar
• Ekstraksi dari data ke pengetahuan:
1. Data: fakta yang terekam dan tidak membawa arti
2. Pengetahuan: pola, rumus, aturan atau model yang muncul
dari data
• Nama lain data mining:
• Knowledge Discovery in Database (KDD)
• Knowledge extraction
• Pattern analysis
• Information harvesting
• Business intelligence
• Big data 17
Apa itu Data Mining?
Apa itu Data Mining?
18
Himpunan
Data
Metode Data
Mining
Pengetahuan
• Puluhan ribu data mahasiswa di kampus yang
diambil dari sistem informasi akademik
• Apakah pernah kita ubah menjadi pengetahuan
yang lebih bermanfaat? TIDAK!
• Seperti apa pengetahuan itu? Rumus, Pola, Aturan
19
Contoh Data di Kampus
Prediksi Kelulusan Mahasiswa
20
• Puluhan ribu data calon anggota legislatif di KPU
• Apakah pernah kita ubah menjadi pengetahuan
yang lebih bermanfaat? TIDAK!
21
Contoh Data di Komisi Pemilihan Umum
Prediksi Calon Legislatif DKI Jakarta
22
Stupid
Applications
• Sistem Informasi
Akademik
• Sistem Pencatatan
Pemilu
• Sistem Laporan
Kekayaan Pejabat
• Sistem Pencatatan
Kredit
Smart
Applications
• Sistem Prediksi
Kelulusan Mahasiswa
• Sistem Prediksi Hasil
Pemilu
• Sistem Prediksi
Koruptor
• Sistem Penentu
Kelayakan Kredit
23
From Stupid Apps to Smart Apps
24
Revolusi Industri 4.0
• Uber - the world’s largest taxi company,
owns no vehicles
• Google - world’s largest
media/advertising company, creates no
content
• Alibaba - the most valuable retailer, has
no inventory
• Airbnb - the world’s largest
accommodation provider, owns no real
estate
• Gojek - perusahaan angkutan umum,
tanpa memiliki kendaraan
Perusahaan Pengolah Pengetahuan
25
• Melakukan ekstraksi untuk mendapatkan informasi penting yang
sifatnya implisit dan sebelumnya tidak diketahui, dari suatu data (Witten
et al., 2011)
• Kegiatan yang meliputi pengumpulan, pemakaian data historis untuk
menemukan keteraturan, pola dan hubungan dalam set data
berukuran besar (Santosa, 2007)
• Extraction of interesting (non-trivial, implicit, previously unknown and
potentially useful) patterns or knowledge from huge amount of data
(Han et al., 2011)
26
Definisi Data Mining
Data - Informasi – Pengetahuan
Data Kehadiran Pegawai
27
NIP TGL DATANG PULANG
1103 02/12/2004 07:20 15:40
1142 02/12/2004 07:45 15:33
1156 02/12/2004 07:51 16:00
1173 02/12/2004 08:00 15:15
1180 02/12/2004 07:01 16:31
1183 02/12/2004 07:49 17:00
Data - Informasi – Pengetahuan
Informasi Akumulasi Bulanan Kehadiran Pegawai
28
NIP Masuk Alpa Cuti Sakit Telat
1103 22
1142 18 2 2
1156 10 1 11
1173 12 5 5
1180 10 12
Data - Informasi – Pengetahuan
Pola Kebiasaan Kehadiran Mingguan Pegawai
29
Senin Selasa Rabu Kamis Jumat
Terlambat 7 0 1 0 5
Pulang
Cepat
0 1 1 1 8
Izin 3 0 0 1 4
Alpa 1 0 2 0 2
Data - Informasi – Pengetahuan - Kebijakan
• Kebijakan penataan jam kerja karyawan khusus
untuk hari senin dan jumat
• Peraturan jam kerja:
• Hari Senin dimulai jam 10:00
• Hari Jumat diakhiri jam 14:00
• Sisa jam kerja dikompensasi ke hari lain
30
Mengubah Pengetahuan Menjadi Kebijakan
31
Kebijakan
Pengetahuan
Informasi
Data
Kebijakan Penataan Jam
Kerja Pegawai
Pola Kebiasaan Datang-
Pulang Pegawai
Informasi Rekap
Kehadiran Pegawai
Data Absensi Pegawai
Data Mining Tasks and Roles
32
Increasing potential
to support business
decisions
End User
Business Analyst
Data Scientist
DBA
Decision
Making
Data Presentation
Visualization Techniques
Data Mining
Information Discovery
Data Exploration
Statistical Summary, Querying, and Reporting
Data Preprocessing/Integration, Data Warehouses
Data Sources
Paper, Files, Web documents, Scientific experiments, Database Systems
Hubungan Data Mining dan Bidang Lain
Data
Mining
Pattern
Recognition
Machine
Learning
Statistics
Computing
Algorithms
Database
Technology
High
Performance
Computing
33
1. Text Mining:
• Mengolah data tidak terstruktur dalam bentuk text, web, social media, dsb
• Menggunakan metode text processing untuk mengkonversi data tidak terstruktur
menjadi terstruktur
• Kemudian diolah dengan data mining
2. Data Mining:
• Mengolah data terstruktur dalam bentuk tabel yang memiliki atribut dan kelas
• Menggunakan metode data mining, yang terbagi menjadi metode estimasi,
forecasting, klasifikasi, klastering atau asosiasi
• Yang dasar berpikirnya menggunakan konsep statistika atau heuristik ala machine learning
Data Mining vs Text Mining
34
Text Mining
Text Processing
35
3
6
Text Mining
Jejak Pornografi di
Indonesia
37
Text Mining: AHY-AHOK-ANIES
• Tremendous amount of data
• Algorithms must be highly scalable to handle such as tera-bytes of data
• High-dimensionality of data
• Micro-array may have tens of thousands of dimensions
• High complexity of data
• Data streams and sensor data
• Time-series data, temporal data, sequence data
• Structure data, graphs, social networks and multi-linked data
• Heterogeneous databases and legacy databases
• Spatial, spatiotemporal, multimedia, text and Web data
• Software programs, scientific simulations
• New and sophisticated applications
38
Masalah-Masalah di Data Mining

Mais conteúdo relacionado

Semelhante a DM-PENGERTIAN

01. Pengantar Penambangan Data.pdf
01. Pengantar Penambangan Data.pdf01. Pengantar Penambangan Data.pdf
01. Pengantar Penambangan Data.pdfherii2k01
 
Analisa dan perancangan sistem informasi 02 analisa sistem
Analisa dan perancangan sistem informasi 02   analisa sistemAnalisa dan perancangan sistem informasi 02   analisa sistem
Analisa dan perancangan sistem informasi 02 analisa sistemEdri Yunizal
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)ArianDerida
 
Sistem informasi akuntansi
Sistem informasi akuntansiSistem informasi akuntansi
Sistem informasi akuntansiIyeh Solichin
 
Pengantar-Big-Data.pdf
Pengantar-Big-Data.pdfPengantar-Big-Data.pdf
Pengantar-Big-Data.pdfDedek28
 
Kuliah 2a penelitian di bidang ilmu komputer
Kuliah 2a penelitian di bidang ilmu komputerKuliah 2a penelitian di bidang ilmu komputer
Kuliah 2a penelitian di bidang ilmu komputerNur Anita Okaya
 
Tik in organisation
Tik in organisationTik in organisation
Tik in organisationrusdicinere
 
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data miningLye Lazar
 
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptxPengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptxBatakMusikGroup
 
kuliah2apenelitiandibidangilmukomputer-150103210018-conversion-gate01.ppt
kuliah2apenelitiandibidangilmukomputer-150103210018-conversion-gate01.pptkuliah2apenelitiandibidangilmukomputer-150103210018-conversion-gate01.ppt
kuliah2apenelitiandibidangilmukomputer-150103210018-conversion-gate01.pptLuhPutuSafitriPratiw1
 
Tahapan Analisis Data Digital
Tahapan Analisis Data DigitalTahapan Analisis Data Digital
Tahapan Analisis Data DigitalHendro Subagyo
 
Pengantar Big Data dan Data Mining.pptx
Pengantar Big Data dan Data Mining.pptxPengantar Big Data dan Data Mining.pptx
Pengantar Big Data dan Data Mining.pptxRudiCelebes2
 
PERTEMUAN 1 SI ZAWA.pptx
PERTEMUAN 1 SI ZAWA.pptxPERTEMUAN 1 SI ZAWA.pptx
PERTEMUAN 1 SI ZAWA.pptxAndrikaSaputra1
 
Konsep Data Mining
Konsep Data MiningKonsep Data Mining
Konsep Data Miningdedidarwis
 
Konsep Sistem Informasi
Konsep Sistem InformasiKonsep Sistem Informasi
Konsep Sistem InformasiSimon Patabang
 
Pert 03 introduction dm 2012
Pert 03 introduction dm 2012Pert 03 introduction dm 2012
Pert 03 introduction dm 2012aiiniR
 

Semelhante a DM-PENGERTIAN (20)

Pertemuan 1.pptx
Pertemuan 1.pptxPertemuan 1.pptx
Pertemuan 1.pptx
 
01. Pengantar Penambangan Data.pdf
01. Pengantar Penambangan Data.pdf01. Pengantar Penambangan Data.pdf
01. Pengantar Penambangan Data.pdf
 
Analisa dan perancangan sistem informasi 02 analisa sistem
Analisa dan perancangan sistem informasi 02   analisa sistemAnalisa dan perancangan sistem informasi 02   analisa sistem
Analisa dan perancangan sistem informasi 02 analisa sistem
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)
 
Sistem informasi akuntansi
Sistem informasi akuntansiSistem informasi akuntansi
Sistem informasi akuntansi
 
Pengantar-Big-Data.pdf
Pengantar-Big-Data.pdfPengantar-Big-Data.pdf
Pengantar-Big-Data.pdf
 
Data mining
Data miningData mining
Data mining
 
Kuliah 2a penelitian di bidang ilmu komputer
Kuliah 2a penelitian di bidang ilmu komputerKuliah 2a penelitian di bidang ilmu komputer
Kuliah 2a penelitian di bidang ilmu komputer
 
Tik in organisation
Tik in organisationTik in organisation
Tik in organisation
 
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data mining
 
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptxPengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
 
kuliah2apenelitiandibidangilmukomputer-150103210018-conversion-gate01.ppt
kuliah2apenelitiandibidangilmukomputer-150103210018-conversion-gate01.pptkuliah2apenelitiandibidangilmukomputer-150103210018-conversion-gate01.ppt
kuliah2apenelitiandibidangilmukomputer-150103210018-conversion-gate01.ppt
 
Tahapan Analisis Data Digital
Tahapan Analisis Data DigitalTahapan Analisis Data Digital
Tahapan Analisis Data Digital
 
Pengantar Big Data dan Data Mining.pptx
Pengantar Big Data dan Data Mining.pptxPengantar Big Data dan Data Mining.pptx
Pengantar Big Data dan Data Mining.pptx
 
7.konsep sisteminformasi
7.konsep sisteminformasi7.konsep sisteminformasi
7.konsep sisteminformasi
 
Sim sess 1
Sim sess 1Sim sess 1
Sim sess 1
 
PERTEMUAN 1 SI ZAWA.pptx
PERTEMUAN 1 SI ZAWA.pptxPERTEMUAN 1 SI ZAWA.pptx
PERTEMUAN 1 SI ZAWA.pptx
 
Konsep Data Mining
Konsep Data MiningKonsep Data Mining
Konsep Data Mining
 
Konsep Sistem Informasi
Konsep Sistem InformasiKonsep Sistem Informasi
Konsep Sistem Informasi
 
Pert 03 introduction dm 2012
Pert 03 introduction dm 2012Pert 03 introduction dm 2012
Pert 03 introduction dm 2012
 

Mais de MohammadYazdiPusada

Mais de MohammadYazdiPusada (13)

Yazdi Undangan Pembukaan MUSWIL 2023.pdf
Yazdi Undangan Pembukaan MUSWIL 2023.pdfYazdi Undangan Pembukaan MUSWIL 2023.pdf
Yazdi Undangan Pembukaan MUSWIL 2023.pdf
 
Panduan-CoE-MBKM-2021-Final.pdf
Panduan-CoE-MBKM-2021-Final.pdfPanduan-CoE-MBKM-2021-Final.pdf
Panduan-CoE-MBKM-2021-Final.pdf
 
PBNU-E-Office.pptx
PBNU-E-Office.pptxPBNU-E-Office.pptx
PBNU-E-Office.pptx
 
IoT-IKIB Buol.pptx
IoT-IKIB Buol.pptxIoT-IKIB Buol.pptx
IoT-IKIB Buol.pptx
 
IoT-IKIB Buol.pptx
IoT-IKIB Buol.pptxIoT-IKIB Buol.pptx
IoT-IKIB Buol.pptx
 
Perkembangan StartUp (Panelis Ecosystem StartUp Palu).pptx
Perkembangan StartUp (Panelis Ecosystem StartUp Palu).pptxPerkembangan StartUp (Panelis Ecosystem StartUp Palu).pptx
Perkembangan StartUp (Panelis Ecosystem StartUp Palu).pptx
 
POPAK 2019_suplemen_SE 3 Juli 2021 STMIK Pontianak.pptx
POPAK 2019_suplemen_SE 3 Juli 2021 STMIK Pontianak.pptxPOPAK 2019_suplemen_SE 3 Juli 2021 STMIK Pontianak.pptx
POPAK 2019_suplemen_SE 3 Juli 2021 STMIK Pontianak.pptx
 
23-82-1-PB.pdf
23-82-1-PB.pdf23-82-1-PB.pdf
23-82-1-PB.pdf
 
Kuliah Kewirausahaan -Technopreneurshi.pptx
Kuliah Kewirausahaan -Technopreneurshi.pptxKuliah Kewirausahaan -Technopreneurshi.pptx
Kuliah Kewirausahaan -Technopreneurshi.pptx
 
Cosmeceuticals and active cosmetics .pdf
Cosmeceuticals and active cosmetics .pdfCosmeceuticals and active cosmetics .pdf
Cosmeceuticals and active cosmetics .pdf
 
Soal fisika modern
Soal fisika modernSoal fisika modern
Soal fisika modern
 
Biologi tes i hari ke i
Biologi tes i hari ke iBiologi tes i hari ke i
Biologi tes i hari ke i
 
Presentasi progress rabu 22022016
Presentasi progress rabu 22022016Presentasi progress rabu 22022016
Presentasi progress rabu 22022016
 

Último

PPT PENILAIAN PERKERASAN JALAN Metode PCI.pptx
PPT PENILAIAN PERKERASAN JALAN Metode PCI.pptxPPT PENILAIAN PERKERASAN JALAN Metode PCI.pptx
PPT PENILAIAN PERKERASAN JALAN Metode PCI.pptxYehezkielAkwila3
 
Klasifikasi jenis pompa berdasarkan cara kerjanya
Klasifikasi jenis pompa berdasarkan cara kerjanyaKlasifikasi jenis pompa berdasarkan cara kerjanya
Klasifikasi jenis pompa berdasarkan cara kerjanyafaizalabdillah10
 
PPT Manajemen Konstruksi Unsur Unsur Proyek 1.pptx
PPT Manajemen Konstruksi Unsur Unsur Proyek 1.pptxPPT Manajemen Konstruksi Unsur Unsur Proyek 1.pptx
PPT Manajemen Konstruksi Unsur Unsur Proyek 1.pptxHamidNurMukhlis
 
Normalisasi Database dan pengertian database
Normalisasi Database dan pengertian databaseNormalisasi Database dan pengertian database
Normalisasi Database dan pengertian databasethinkplusx1
 
Analisis Struktur Statis Tak Tentu dengan Force Method.pdf
Analisis Struktur Statis Tak Tentu dengan Force Method.pdfAnalisis Struktur Statis Tak Tentu dengan Force Method.pdf
Analisis Struktur Statis Tak Tentu dengan Force Method.pdfAgusTriyono78
 
struktur statis tak tentu dengan persamaan-tiga-momen-apdf.pptx
struktur statis tak tentu dengan persamaan-tiga-momen-apdf.pptxstruktur statis tak tentu dengan persamaan-tiga-momen-apdf.pptx
struktur statis tak tentu dengan persamaan-tiga-momen-apdf.pptxAgusTriyono78
 
Teori Pembakaran bahan kimia organik .ppt
Teori Pembakaran bahan kimia organik .pptTeori Pembakaran bahan kimia organik .ppt
Teori Pembakaran bahan kimia organik .pptEndarto Yudo
 
Thermodynamics analysis of energy, entropy and exergy
Thermodynamics analysis of energy, entropy and exergyThermodynamics analysis of energy, entropy and exergy
Thermodynamics analysis of energy, entropy and exergyEndarto Yudo
 
MEKANIKA TEKNIK TEKNIK PERTAMBANGAN FAK. TEKNIK
MEKANIKA TEKNIK TEKNIK PERTAMBANGAN FAK. TEKNIKMEKANIKA TEKNIK TEKNIK PERTAMBANGAN FAK. TEKNIK
MEKANIKA TEKNIK TEKNIK PERTAMBANGAN FAK. TEKNIKFerdinandus9
 
QCC MANAJEMEN TOOL MAINTENANCE (MAINTENANCE TEAM).pptx
QCC MANAJEMEN TOOL MAINTENANCE (MAINTENANCE TEAM).pptxQCC MANAJEMEN TOOL MAINTENANCE (MAINTENANCE TEAM).pptx
QCC MANAJEMEN TOOL MAINTENANCE (MAINTENANCE TEAM).pptxdjam11
 
TUGAS KULIAH PPT PRESENTASI STRUKTUR BETON 1
TUGAS KULIAH PPT PRESENTASI STRUKTUR BETON 1TUGAS KULIAH PPT PRESENTASI STRUKTUR BETON 1
TUGAS KULIAH PPT PRESENTASI STRUKTUR BETON 1RifkiIntipeNerakajah
 
Teknik Tenaga Listrik, Sejarah dan Komponen
Teknik Tenaga Listrik, Sejarah dan KomponenTeknik Tenaga Listrik, Sejarah dan Komponen
Teknik Tenaga Listrik, Sejarah dan KomponenRatihPuspitaSiwi
 
Sesi_02_Rangkaian_Hubungan_Seri_Paralel.pptx
Sesi_02_Rangkaian_Hubungan_Seri_Paralel.pptxSesi_02_Rangkaian_Hubungan_Seri_Paralel.pptx
Sesi_02_Rangkaian_Hubungan_Seri_Paralel.pptx185TsabitSujud
 
MATERI PRESENTASI KEPALA TEKNIK TAMBANG KEPMEN 555
MATERI PRESENTASI KEPALA TEKNIK TAMBANG KEPMEN 555MATERI PRESENTASI KEPALA TEKNIK TAMBANG KEPMEN 555
MATERI PRESENTASI KEPALA TEKNIK TAMBANG KEPMEN 555zannialzur
 
Minggu 5 Pepistimlogy berbasis wawasan politik_Ekonomi.pptx
Minggu 5 Pepistimlogy berbasis wawasan politik_Ekonomi.pptxMinggu 5 Pepistimlogy berbasis wawasan politik_Ekonomi.pptx
Minggu 5 Pepistimlogy berbasis wawasan politik_Ekonomi.pptxRahmiAulia20
 
PPT PPT Pelaksana lapangan Pekerasan Jalan Beton lvl 6.pptx
PPT PPT Pelaksana lapangan Pekerasan Jalan Beton lvl 6.pptxPPT PPT Pelaksana lapangan Pekerasan Jalan Beton lvl 6.pptx
PPT PPT Pelaksana lapangan Pekerasan Jalan Beton lvl 6.pptxdpcaskonasoki
 

Último (16)

PPT PENILAIAN PERKERASAN JALAN Metode PCI.pptx
PPT PENILAIAN PERKERASAN JALAN Metode PCI.pptxPPT PENILAIAN PERKERASAN JALAN Metode PCI.pptx
PPT PENILAIAN PERKERASAN JALAN Metode PCI.pptx
 
Klasifikasi jenis pompa berdasarkan cara kerjanya
Klasifikasi jenis pompa berdasarkan cara kerjanyaKlasifikasi jenis pompa berdasarkan cara kerjanya
Klasifikasi jenis pompa berdasarkan cara kerjanya
 
PPT Manajemen Konstruksi Unsur Unsur Proyek 1.pptx
PPT Manajemen Konstruksi Unsur Unsur Proyek 1.pptxPPT Manajemen Konstruksi Unsur Unsur Proyek 1.pptx
PPT Manajemen Konstruksi Unsur Unsur Proyek 1.pptx
 
Normalisasi Database dan pengertian database
Normalisasi Database dan pengertian databaseNormalisasi Database dan pengertian database
Normalisasi Database dan pengertian database
 
Analisis Struktur Statis Tak Tentu dengan Force Method.pdf
Analisis Struktur Statis Tak Tentu dengan Force Method.pdfAnalisis Struktur Statis Tak Tentu dengan Force Method.pdf
Analisis Struktur Statis Tak Tentu dengan Force Method.pdf
 
struktur statis tak tentu dengan persamaan-tiga-momen-apdf.pptx
struktur statis tak tentu dengan persamaan-tiga-momen-apdf.pptxstruktur statis tak tentu dengan persamaan-tiga-momen-apdf.pptx
struktur statis tak tentu dengan persamaan-tiga-momen-apdf.pptx
 
Teori Pembakaran bahan kimia organik .ppt
Teori Pembakaran bahan kimia organik .pptTeori Pembakaran bahan kimia organik .ppt
Teori Pembakaran bahan kimia organik .ppt
 
Thermodynamics analysis of energy, entropy and exergy
Thermodynamics analysis of energy, entropy and exergyThermodynamics analysis of energy, entropy and exergy
Thermodynamics analysis of energy, entropy and exergy
 
MEKANIKA TEKNIK TEKNIK PERTAMBANGAN FAK. TEKNIK
MEKANIKA TEKNIK TEKNIK PERTAMBANGAN FAK. TEKNIKMEKANIKA TEKNIK TEKNIK PERTAMBANGAN FAK. TEKNIK
MEKANIKA TEKNIK TEKNIK PERTAMBANGAN FAK. TEKNIK
 
QCC MANAJEMEN TOOL MAINTENANCE (MAINTENANCE TEAM).pptx
QCC MANAJEMEN TOOL MAINTENANCE (MAINTENANCE TEAM).pptxQCC MANAJEMEN TOOL MAINTENANCE (MAINTENANCE TEAM).pptx
QCC MANAJEMEN TOOL MAINTENANCE (MAINTENANCE TEAM).pptx
 
TUGAS KULIAH PPT PRESENTASI STRUKTUR BETON 1
TUGAS KULIAH PPT PRESENTASI STRUKTUR BETON 1TUGAS KULIAH PPT PRESENTASI STRUKTUR BETON 1
TUGAS KULIAH PPT PRESENTASI STRUKTUR BETON 1
 
Teknik Tenaga Listrik, Sejarah dan Komponen
Teknik Tenaga Listrik, Sejarah dan KomponenTeknik Tenaga Listrik, Sejarah dan Komponen
Teknik Tenaga Listrik, Sejarah dan Komponen
 
Sesi_02_Rangkaian_Hubungan_Seri_Paralel.pptx
Sesi_02_Rangkaian_Hubungan_Seri_Paralel.pptxSesi_02_Rangkaian_Hubungan_Seri_Paralel.pptx
Sesi_02_Rangkaian_Hubungan_Seri_Paralel.pptx
 
MATERI PRESENTASI KEPALA TEKNIK TAMBANG KEPMEN 555
MATERI PRESENTASI KEPALA TEKNIK TAMBANG KEPMEN 555MATERI PRESENTASI KEPALA TEKNIK TAMBANG KEPMEN 555
MATERI PRESENTASI KEPALA TEKNIK TAMBANG KEPMEN 555
 
Minggu 5 Pepistimlogy berbasis wawasan politik_Ekonomi.pptx
Minggu 5 Pepistimlogy berbasis wawasan politik_Ekonomi.pptxMinggu 5 Pepistimlogy berbasis wawasan politik_Ekonomi.pptx
Minggu 5 Pepistimlogy berbasis wawasan politik_Ekonomi.pptx
 
PPT PPT Pelaksana lapangan Pekerasan Jalan Beton lvl 6.pptx
PPT PPT Pelaksana lapangan Pekerasan Jalan Beton lvl 6.pptxPPT PPT Pelaksana lapangan Pekerasan Jalan Beton lvl 6.pptx
PPT PPT Pelaksana lapangan Pekerasan Jalan Beton lvl 6.pptx
 

DM-PENGERTIAN

  • 3. Learning Design Educational Objectives (Benjamin Bloom) Cognitive Affective Psychomotor Criterion Referenced Instruction (Robert Mager) Competencies Performance Evaluation Minimalism (John Carroll) Start Immediately Minimize the Reading Error Recognition Self-Contained 3
  • 5. Course Outline • 1.1 Apa dan Mengapa Data Mining? • 1.2 Peran Utama dan Metode Data Mining • 1.3 Sejarah dan Penerapan Data Mining 1.1. Pengantar Data Mining • 2.1 Proses dan Tools Data Mining • 2.2 Penerapan Proses Data Mining • 2.3 Evaluasi Model Data Mining • 2.4 Proses Data Mining berbasis CRISP-DM 2. Proses Data Mining • 3.1 Data Cleaning • 3.2 Data Reduction • 3.3 Data Transformation and Data Discretization • 3.4 Data Integration 3. Persiapan Data • 4.1 Algoritma Klasifikasi • 4.2 Algoritma Klastering • 4.3 Algoritma Asosiasi • 4.4 Algoritma Estimasi dan Forecasting 4. Algoritma Data Mining • 5.1 Text Mining Concepts • 5.2 Text Clustering • 5.3 Text Classification • 5.4 Data Mining Law 5. Text Mining 6
  • 6. 1. Pengantar Data Mining 1.1 Apa dan Mengapa Data Mining? 1.2 Peran Utama dan Metode Data Mining 1.3 Sejarah dan Penerapan Data Mining 7
  • 7. 1.1 Apa dan Mengapa Data Mining? 8
  • 8. Manusia Memproduksi Data Manusia memproduksi beragam data yang jumlah dan ukurannya sangat besar • Astronomi • Bisnis • Kedokteran • Ekonomi • Olahraga • Cuaca • Financial • … 9
  • 9. 10
  • 10. Pertumbuhan Data Astronomi • Sloan Digital Sky Survey • New Mexico, 2000 • 140TB over 10 years • Large Synoptic Survey Telescope • Chile, 2016 • Will acquire 140TB every five days Biologi dan Kedokteran • European Bioinformatics Institute (EBI) • 20PB of data (genomic data doubles in size each year) • A single sequenced human genome can be around 140GB in size 11 kilobyte (kB) 103 megabyte (MB) 106 gigabyte (GB) 109 terabyte (TB) 1012 petabyte (PB) 1015 exabyte (EB) 1018 zettabyte (ZB) 1021 yottabyte (YB) 1024
  • 11. Perubahan Kultur dan Perilaku 12
  • 12. Datangnya Tsunami Data • Mobile Electronics market • 4.43B mobile phone users in 2015 • 7B mobile phone subscriptions in 2015 • Web and Social Networks generates amount of data • Google processes 100 PB per day, 3 million servers • Facebook has 300 PB of user data per day • Youtube has 1000PB video storage • 235 TBs data collected by the US Library of Congress • 15 out of 17 sectors in the US have more data stored per company than the US Library of Congress 13 kilobyte (kB) 103 megabyte (MB) 106 gigabyte (GB) 109 terabyte (TB) 1012 petabyte (PB) 1015 exabyte (EB) 1018 zettabyte (ZB) 1021 yottabyte (YB) 1024
  • 13. Kebanjiran Data tapi Miskin Pengetahuan We are drowning in data, but starving for knowledge! (John Naisbitt, Megatrends, 1988) 14
  • 14. Mengubah Data Menjadi Pengetahuan • Data harus kita olah menjadi pengetahuan supaya bisa bermanfaat bagi manusia • Dengan pengetahuan tersebut, manusia dapat: • Melakukan estimasi dan prediksi apa yang terjadi di depan • Melakukan analisis tentang asosiasi, korelasi dan pengelompokan antar data dan atribut • Membantu pengambilan keputusan dan pembuatan kebijakan 15
  • 15. 16 Apa itu Data Mining?
  • 16. • Disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data yang besar • Ekstraksi dari data ke pengetahuan: 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, rumus, aturan atau model yang muncul dari data • Nama lain data mining: • Knowledge Discovery in Database (KDD) • Knowledge extraction • Pattern analysis • Information harvesting • Business intelligence • Big data 17 Apa itu Data Mining?
  • 17. Apa itu Data Mining? 18 Himpunan Data Metode Data Mining Pengetahuan
  • 18. • Puluhan ribu data mahasiswa di kampus yang diambil dari sistem informasi akademik • Apakah pernah kita ubah menjadi pengetahuan yang lebih bermanfaat? TIDAK! • Seperti apa pengetahuan itu? Rumus, Pola, Aturan 19 Contoh Data di Kampus
  • 20. • Puluhan ribu data calon anggota legislatif di KPU • Apakah pernah kita ubah menjadi pengetahuan yang lebih bermanfaat? TIDAK! 21 Contoh Data di Komisi Pemilihan Umum
  • 21. Prediksi Calon Legislatif DKI Jakarta 22
  • 22. Stupid Applications • Sistem Informasi Akademik • Sistem Pencatatan Pemilu • Sistem Laporan Kekayaan Pejabat • Sistem Pencatatan Kredit Smart Applications • Sistem Prediksi Kelulusan Mahasiswa • Sistem Prediksi Hasil Pemilu • Sistem Prediksi Koruptor • Sistem Penentu Kelayakan Kredit 23 From Stupid Apps to Smart Apps
  • 24. • Uber - the world’s largest taxi company, owns no vehicles • Google - world’s largest media/advertising company, creates no content • Alibaba - the most valuable retailer, has no inventory • Airbnb - the world’s largest accommodation provider, owns no real estate • Gojek - perusahaan angkutan umum, tanpa memiliki kendaraan Perusahaan Pengolah Pengetahuan 25
  • 25. • Melakukan ekstraksi untuk mendapatkan informasi penting yang sifatnya implisit dan sebelumnya tidak diketahui, dari suatu data (Witten et al., 2011) • Kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar (Santosa, 2007) • Extraction of interesting (non-trivial, implicit, previously unknown and potentially useful) patterns or knowledge from huge amount of data (Han et al., 2011) 26 Definisi Data Mining
  • 26. Data - Informasi – Pengetahuan Data Kehadiran Pegawai 27 NIP TGL DATANG PULANG 1103 02/12/2004 07:20 15:40 1142 02/12/2004 07:45 15:33 1156 02/12/2004 07:51 16:00 1173 02/12/2004 08:00 15:15 1180 02/12/2004 07:01 16:31 1183 02/12/2004 07:49 17:00
  • 27. Data - Informasi – Pengetahuan Informasi Akumulasi Bulanan Kehadiran Pegawai 28 NIP Masuk Alpa Cuti Sakit Telat 1103 22 1142 18 2 2 1156 10 1 11 1173 12 5 5 1180 10 12
  • 28. Data - Informasi – Pengetahuan Pola Kebiasaan Kehadiran Mingguan Pegawai 29 Senin Selasa Rabu Kamis Jumat Terlambat 7 0 1 0 5 Pulang Cepat 0 1 1 1 8 Izin 3 0 0 1 4 Alpa 1 0 2 0 2
  • 29. Data - Informasi – Pengetahuan - Kebijakan • Kebijakan penataan jam kerja karyawan khusus untuk hari senin dan jumat • Peraturan jam kerja: • Hari Senin dimulai jam 10:00 • Hari Jumat diakhiri jam 14:00 • Sisa jam kerja dikompensasi ke hari lain 30
  • 30. Mengubah Pengetahuan Menjadi Kebijakan 31 Kebijakan Pengetahuan Informasi Data Kebijakan Penataan Jam Kerja Pegawai Pola Kebiasaan Datang- Pulang Pegawai Informasi Rekap Kehadiran Pegawai Data Absensi Pegawai
  • 31. Data Mining Tasks and Roles 32 Increasing potential to support business decisions End User Business Analyst Data Scientist DBA Decision Making Data Presentation Visualization Techniques Data Mining Information Discovery Data Exploration Statistical Summary, Querying, and Reporting Data Preprocessing/Integration, Data Warehouses Data Sources Paper, Files, Web documents, Scientific experiments, Database Systems
  • 32. Hubungan Data Mining dan Bidang Lain Data Mining Pattern Recognition Machine Learning Statistics Computing Algorithms Database Technology High Performance Computing 33
  • 33. 1. Text Mining: • Mengolah data tidak terstruktur dalam bentuk text, web, social media, dsb • Menggunakan metode text processing untuk mengkonversi data tidak terstruktur menjadi terstruktur • Kemudian diolah dengan data mining 2. Data Mining: • Mengolah data terstruktur dalam bentuk tabel yang memiliki atribut dan kelas • Menggunakan metode data mining, yang terbagi menjadi metode estimasi, forecasting, klasifikasi, klastering atau asosiasi • Yang dasar berpikirnya menggunakan konsep statistika atau heuristik ala machine learning Data Mining vs Text Mining 34
  • 37. • Tremendous amount of data • Algorithms must be highly scalable to handle such as tera-bytes of data • High-dimensionality of data • Micro-array may have tens of thousands of dimensions • High complexity of data • Data streams and sensor data • Time-series data, temporal data, sequence data • Structure data, graphs, social networks and multi-linked data • Heterogeneous databases and legacy databases • Spatial, spatiotemporal, multimedia, text and Web data • Software programs, scientific simulations • New and sophisticated applications 38 Masalah-Masalah di Data Mining