SlideShare uma empresa Scribd logo
1 de 41
Analisis Performa Kecepatan Mapreduce
Pada Hadoop Menggunakan TCP Packet Flow Analysis
Priagung Khusumanegara
1006661084
Skripsi
Teknik Komputer
Universitas Indonesia
Senin, 30 Juni 2014
Latar Belakang
Referensi Gambar: http://technews.tmcnet.com/telecommunications/topics/telecommunications/articles/156051-what-att-purchase-t-mobile-means.htm
1. Mengimplementasikan sebuah program untuk mengolah data aliran paket
TCP pada sebuah jaringan yang dapat dijalankan secara terditribusi oleh
Hadoop,
2. Melakukan percobaan terhadap enam skenario berdasarkan topologi yang
telah dirancang,
3. Melakukan analisis pengaruh physical node, virtual node, block size dan
jumlah slot map terhadap kecepatan MapReduce pada Hadoop.
Tujuan Penelitian
Hadoop Framework
Hadoop merupakan framework software
berbasis Java dan opensource yang
berfungsi untuk mengolah data yang
memiliki ukuran besar secara terdistribusi.
Pengertian Hadoop
Hadoop terdiri dari 2 komponen inti:
1.Hadoop Distributed File System (HDFS)
2.MapReduce
Arsitektur Hadoop
Gambar: Bagian inti Hadoop (a) komponen HDFS (b) komponen MapReduce
Referensi Gambar : JeongJin Cheon, Tae-Young Choe. Distributed Processing of Snort Alert Log using Hadoop. International Journal of Engineering and Technology (IJET), Gyeongbuk Korea, 2013.
HADOOP
HDFS MapReduce
• File system pada Hadoop
• Menyimpan data secara terdisribusi
• Data disimpan dalam bentuk potongan-potongan (secara default
64 MB)
Hadoop Distributed File System (HDFS)
Referensi Gambar: http://www.cloudera.com/content/dam/cloudera/product-assets/hdfs-data-distribution.png
Gambar: Distribusi data pada HDFS
HDFS memiliki 3 komponen utama berupa:
1.NameNode
2.DataNode
3.Secondary NameNode
Komponen HDFS
Gambar: Komponen HDFS
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
1. NameNode
• Berada pada master node
• Mengkoordinasi DataNode yang terdapat pada slave node.
Komponen HDFS…Lanjutan…
Gambar: NameNode pada HDFS
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
2. DataNode
• Berada pada slave node
• Menyimpan data pada slave node.
Komponen HDFS…Lanjutan…
Gambar: DataNode pada HDFS
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
3. Secondary NameNode
• Berada pada master node
• Melakukan monitoring keadaan dari cluster HDFS.
Komponen HDFS…Lanjutan…
Gambar: Secondary NameNode pada HDFS
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
• Framework untuk aplikasi dan programming yang digunakan Hadoop
• Melakukan suatu pekerjaan dari komputasi terdistribusi yang dijalankan
pada sebuah cluster.
• Proses utama : Map dan Reduce
Mapreduce
Gambar: Bagian inti Hadoop (a) komponen HDFS (b) komponen MapReduce
HADOOP
HDFS MapReduce
Referensi Gambar : JeongJin Cheon, Tae-Young Choe. Distributed Processing of Snort Alert Log using Hadoop. International Journal of Engineering and Technology (IJET), Gyeongbuk Korea, 2013.
Shuffle ReduceMap
Proses Mapreduce
Referensi Gambar : The overall MapReduce WordCount process, http://www.rabidgremlin.com/data20/#%283%29. Dikases pada tanggal 30 Oktober 2013.
Gambar 2.4 Proses MapReduce pada Hadoop
Komponen MapReduce pada Hadoop yaitu:
1.JobTracker
2.TaskTracker
Komponen Mapreduce
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
Gambar: Komponen MapReduce
1. JobTracker
• Memecah permintaan yang diberikan ke HDFS menjadi beberapa pekerjaan
yang lebih kecil.
• Memberikan pekerjaan tersebut kepada setiap slave node.
Komponen Mapreduce…Lanjutan…
Gambar: Komponen MapReduce
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
2. Tasktracker
• Berfungsi untuk menerima pekerjaan yang diberikan oleh JobTracker.
• Menjalankan pekerjaan yang diberikan JobTracker.
Komponen Mapreduce…Lanjutan…
Gambar: Kerja TaskTracker pada setiap node
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
Perancangan, Hasil, dan Analisa
TCP Packet Flow Analysis
• Menganalisis aliran paket yang terdapat pada sebuah jaringan
menggunakan Hadoop.
• Program yang menggunakan konsep MapReduce.
Gambar: Contoh file yang akan diproses
TCP Packet Flow Analysis…Lanjutan…
Gambar: Flowchart TCP Packet Flow Analysis
TCP Packet Flow Analysis…Lanjutan…
Gambar: Hasil dari TCP Packet Flow Analysis (a) packet total (b) packet length
Skenario 1
Hardware Laptop 1 Laptop 2
CPU
AMD Dual Core,
Clock Speed 1.48 GHz
Intel Dual Core,
Clock Speed 2.0 GHz
RAM 4.00 GB 4.00 GB
Sistem Operasi CentOS 6.3 CentOS 6.3
Gambar: Topologi Skenario 1
Tabel: Spesifikasi machine yang digunakan pada skenario 1
Hasil Skenario 1
Skenario 2
Hardware Host VM 1 VM 2
CPU
AMD Dual Core,
Clock Speed 1.48 GHz
One Core One Core
RAM 4.00 GB 1.00 GB 1.00 GB
Sistem Operasi CentOS 6.3 CentOS 6.3 CentOS 6.3
Gambar: Topologi Skenario 2
Tabel: Spesifikasi machine yang digunakan pada skenario 2
Hasil Skenario 2
Skenario 3
Hardware Laptop 1
CPU AMD Dual Core, Clock Speed 1.48 GHz
RAM 4.00 GB
Sistem Operasi CentOS 6.3
Gambar: Pembagian block size pada Hadoop yang dijalankan secara single node
Tabel: Spesifikasi machine yang digunakan pada skenario 3
Hasil Skenario 3
Analisis Skenario 3
Gambar: Jumlah task pada file 1 GB dengan (a) block size 64 MB (b) block size 128 MB
Gambar: Komunikasi antara scheduler, JobTracker, dan TaskTracker
Analisis Skenario 3…Lanjutan…
Gambar: Proses MapReduce pada ukuran file 512 MB dengan block size 256 MB
Gambar: Proses MapReduce pada ukuran file 512 MB dengan block size 256 MB
Skenario 4
Hardware Laptop 1 Laptop 2
CPU
AMD Dual Core,
Clock Speed 1.48 GHz
Intel Dual Core,
Clock Speed 2.0 GHz
RAM 4.00 GB 4.00 GB
Sistem Operasi CentOS 6.3 CentOS 6.3
Gambar: Pembagian block size pada Hadoop yang dijalankan secara multi node
Tabel: Spesifikasi machine yang digunakan pada skenario 4
Hasil Skenario 4
Analisis Skenario 4
Gambar: Jumlah task pada file 512 GB dengan block size 128 MB
Gambar: Proses MapReduce pada ukuran file 512 MB dengan block size 128 MB
Skenario 5
Hardware Laptop 1
CPU AMD Dual Core, Clock Speed 1.48 GHz
RAM 4.00 GB
Sistem Operasi CentOS 6.3
Gambar: Gambaran slot map pada Hadoop
Tabel: Spesifikasi machine yang digunakan pada skenario 5
Hasil Skenario 5
Skenario 6
Hardware PC
CPU Intel i7-2600 , Clock Speed 3.4 GHz
RAM 4.00 GB
Sistem Operasi CentOS 6.3
Gambar: Topologi Skenario 6
Tabel: Spesifikasi machine yang digunakan pada skenario 6
Hasil Skenario 6
1. Penambahan jumlah physical machine dapat mempercepat kecepatan rata-rata
MapReduce.
2. Penambahan jumlah virtual machine dapat memperlambat kecepatan rata-rata
MapReduce.
3. Block size dapat mempengaruhi kecepatan MapReduce pada Hadoop, semakin
besar block size maka semakin cepat kecepatan MapReduce pada Hadoop
dengan syarat: number of task > slot map
Kesimpulan
4. Jumlah slot map dapat mempengaruhi kecepatan MapReduce pada Hadoop,
dimana performa kecepatan MapReduce lebih cepat jika jumlah slot map pada
Hadoop sesuai dengan jumlah core yang dimiliki oleh machine.
5. Hadoop memiliki keunggulan dalam mengolah data yang memiliki ukuran yang
besar dan jumlah yang banyak karena Hadoop dapat mengolah data tersebut
secara terdistribusi.
Kesimpulan…Lanjutan…
1. Leslie Lamport and Nancy Lynch. (1989, February 3). Chapter on Distributed Computing.
2. Chuck Lam. (2011). Hadoop In Action. Stamford: Mainning Publications Co.
3. Tom White. (2009). Hadoop: The Definitive Guide. California: O’Reilly.
4. Garry Turkington. (2013). Hadoop Beginner's Guide. Birmingham: Packt Publishing.
5. Shv, Hairong, SRadia, Chansler. (2010). The Hadoop Distributed File System. Jurnal IEEE.
6. Intel Corporation. (2013). Optimizing Java* and Apache Hadoop* for Intel® Architecture.
USA: Intel Corporation.
7. Apache TM
Hadoop @ homepage. http://hadoop.apache.org/. Diakses 17 Oktober 2013.
8. JeongJin Cheon, Tae-Young Choe. (2013). Distributed Processing of Snort Alert Log using
Hadoop. International Journal of Engineering and Technology (IJET).
9. Aditya B. Patel, Manashvi Birla, Ushma Nair. (2012). Addressing Big Data Problem Using
Hadoop and Map Reduce. Nirma University International Conference On Engineering.
Daftar Referensi
10. Amit Anand. (2013). Configuration Parameters dfs.Block.Size. Hadoop.
11. Dima May. (2012). Hadoop Distributed File System (HDFS) Overview. coreservlets.com.
12. Magang Industri. (2013). Definisi Cloud Computing. Meruvian.org Cloud Computing.
13. Colin White. (2012, January). MapReduce and the Data Scientist. BI Research.
14. R. David Idol. Large-Scale TCP Packet Flow Analysis for C Using Apache™ Hadoop.
University of North Carolina at Chapel Hill.
15. Tutorial dan Konfigurasi Hadoop Single Node.
16. http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-
cluster/. Diakses pada tanggal 20 Oktober 2013.
17. MapReduce Hadoop. http://www.yalescientific.org/2012/03/hadapt-yale-startup/. Diakses pada
tanggal 29 Oktober 2013.
Daftar Referensi…Lanjutan…
18. Interaction between the JobTracker, TaskTracker and the Scheduler @ homepage.
http://www.thecloudavenue.com/2011/11/interaction-between-jobtracker.html. Diakses
pada tanggal 29 Oktober 2013.
19. The overall MapReduce WordCount process,
20. http://www.rabidgremlin.com/data20/#%283%29. Diakses pada tanggal 30 Oktober 2013.
21. Thinking in MapReduce, https://engineering.cerner.com/2013/07/thinking-in-
mapreduce/. Diakses pada tanggal 30 Oktober 2013.
Daftar Referensi…Lanjutan…
Sekian…
Terima Kasih…

Mais conteúdo relacionado

Mais procurados

Kecerdasan Buatan (AI)
Kecerdasan Buatan (AI)Kecerdasan Buatan (AI)
Kecerdasan Buatan (AI)Farichah Riha
 
Persamaan dan Pertidaksamaan Eksponen
Persamaan dan Pertidaksamaan EksponenPersamaan dan Pertidaksamaan Eksponen
Persamaan dan Pertidaksamaan EksponenEman Mendrofa
 
Teori graph rinaldi munir
Teori graph   rinaldi munirTeori graph   rinaldi munir
Teori graph rinaldi muniresa_esa
 
Kelompok 1 relasi dan fungsi
Kelompok 1 relasi dan fungsiKelompok 1 relasi dan fungsi
Kelompok 1 relasi dan fungsiGhiyats Bayu
 
Hive Anatomy
Hive AnatomyHive Anatomy
Hive Anatomynzhang
 
Sifat-Sifat Fungsi
Sifat-Sifat FungsiSifat-Sifat Fungsi
Sifat-Sifat FungsiTaeter Toets
 
Hive User Meeting August 2009 Facebook
Hive User Meeting August 2009 FacebookHive User Meeting August 2009 Facebook
Hive User Meeting August 2009 Facebookragho
 
Kel 1 teori graf
Kel 1 teori grafKel 1 teori graf
Kel 1 teori grafnur azizah
 
Operasi Aljabar pada Fungsi dan Fungsi Komposisi
Operasi Aljabar pada Fungsi dan Fungsi KomposisiOperasi Aljabar pada Fungsi dan Fungsi Komposisi
Operasi Aljabar pada Fungsi dan Fungsi Komposisisiska sri asali
 
geometri analitik - ellips
geometri analitik - ellipsgeometri analitik - ellips
geometri analitik - ellipsLois Tulangow
 
Grafik Fungsi Kuadrat
Grafik Fungsi KuadratGrafik Fungsi Kuadrat
Grafik Fungsi KuadratIntan Saputri
 
Delta Lake, un vernis pour parquet
Delta Lake, un vernis pour parquetDelta Lake, un vernis pour parquet
Delta Lake, un vernis pour parquetAlban Phélip
 
A. grafik himpunan penyelesaian sistem pertidaksamaan linier
A.  grafik himpunan penyelesaian sistem pertidaksamaan linierA.  grafik himpunan penyelesaian sistem pertidaksamaan linier
A. grafik himpunan penyelesaian sistem pertidaksamaan linierSMKN 9 Bandung
 
Eksistensi dan Ketunggalan penyelesaian model
Eksistensi dan Ketunggalan penyelesaian modelEksistensi dan Ketunggalan penyelesaian model
Eksistensi dan Ketunggalan penyelesaian modelpetrus fendiyanto
 

Mais procurados (20)

Kecerdasan Buatan (AI)
Kecerdasan Buatan (AI)Kecerdasan Buatan (AI)
Kecerdasan Buatan (AI)
 
Persamaan dan Pertidaksamaan Eksponen
Persamaan dan Pertidaksamaan EksponenPersamaan dan Pertidaksamaan Eksponen
Persamaan dan Pertidaksamaan Eksponen
 
Teori graph rinaldi munir
Teori graph   rinaldi munirTeori graph   rinaldi munir
Teori graph rinaldi munir
 
Kalkulus modul iv fungsi dan grafiknya
Kalkulus modul iv fungsi dan grafiknyaKalkulus modul iv fungsi dan grafiknya
Kalkulus modul iv fungsi dan grafiknya
 
Kelompok 1 relasi dan fungsi
Kelompok 1 relasi dan fungsiKelompok 1 relasi dan fungsi
Kelompok 1 relasi dan fungsi
 
Bab 3 Asmaul Husna
Bab 3 Asmaul HusnaBab 3 Asmaul Husna
Bab 3 Asmaul Husna
 
Hive Anatomy
Hive AnatomyHive Anatomy
Hive Anatomy
 
Tugas si kelompok 5
Tugas si kelompok 5Tugas si kelompok 5
Tugas si kelompok 5
 
Operasi pada himpunan
Operasi pada himpunanOperasi pada himpunan
Operasi pada himpunan
 
teori graf (planar
teori graf (planarteori graf (planar
teori graf (planar
 
Sifat-Sifat Fungsi
Sifat-Sifat FungsiSifat-Sifat Fungsi
Sifat-Sifat Fungsi
 
Hive User Meeting August 2009 Facebook
Hive User Meeting August 2009 FacebookHive User Meeting August 2009 Facebook
Hive User Meeting August 2009 Facebook
 
Kel 1 teori graf
Kel 1 teori grafKel 1 teori graf
Kel 1 teori graf
 
Operasi Aljabar pada Fungsi dan Fungsi Komposisi
Operasi Aljabar pada Fungsi dan Fungsi KomposisiOperasi Aljabar pada Fungsi dan Fungsi Komposisi
Operasi Aljabar pada Fungsi dan Fungsi Komposisi
 
geometri analitik - ellips
geometri analitik - ellipsgeometri analitik - ellips
geometri analitik - ellips
 
Himpunan
HimpunanHimpunan
Himpunan
 
Grafik Fungsi Kuadrat
Grafik Fungsi KuadratGrafik Fungsi Kuadrat
Grafik Fungsi Kuadrat
 
Delta Lake, un vernis pour parquet
Delta Lake, un vernis pour parquetDelta Lake, un vernis pour parquet
Delta Lake, un vernis pour parquet
 
A. grafik himpunan penyelesaian sistem pertidaksamaan linier
A.  grafik himpunan penyelesaian sistem pertidaksamaan linierA.  grafik himpunan penyelesaian sistem pertidaksamaan linier
A. grafik himpunan penyelesaian sistem pertidaksamaan linier
 
Eksistensi dan Ketunggalan penyelesaian model
Eksistensi dan Ketunggalan penyelesaian modelEksistensi dan Ketunggalan penyelesaian model
Eksistensi dan Ketunggalan penyelesaian model
 

Destaque

Destaque (9)

The Cognitive Net is Coming
The Cognitive Net is ComingThe Cognitive Net is Coming
The Cognitive Net is Coming
 
Profiler for Smartphone Users Interests Using Modified Hierarchical Agglomera...
Profiler for Smartphone Users Interests Using Modified Hierarchical Agglomera...Profiler for Smartphone Users Interests Using Modified Hierarchical Agglomera...
Profiler for Smartphone Users Interests Using Modified Hierarchical Agglomera...
 
Distance function
Distance functionDistance function
Distance function
 
Feature Selection
Feature Selection Feature Selection
Feature Selection
 
Clusteryanam
ClusteryanamClusteryanam
Clusteryanam
 
Fall detection
Fall detectionFall detection
Fall detection
 
Domain specific IoT
Domain specific IoTDomain specific IoT
Domain specific IoT
 
Decision tree and random forest
Decision tree and random forestDecision tree and random forest
Decision tree and random forest
 
Understanding Random Forests: From Theory to Practice
Understanding Random Forests: From Theory to PracticeUnderstanding Random Forests: From Theory to Practice
Understanding Random Forests: From Theory to Practice
 

Semelhante a ANALISIS KINERJA

Analisa pengaruh block size pada hdfs terhadap kecepatan
Analisa pengaruh block size pada hdfs terhadap kecepatanAnalisa pengaruh block size pada hdfs terhadap kecepatan
Analisa pengaruh block size pada hdfs terhadap kecepatanLippo Group Digital
 
Modul membaca netcdf
Modul membaca netcdfModul membaca netcdf
Modul membaca netcdfDimaz Gunawan
 
Pemrosesan paralel untuk kompresi data
Pemrosesan paralel untuk kompresi dataPemrosesan paralel untuk kompresi data
Pemrosesan paralel untuk kompresi dataEmus Kelen
 
Operating System--Memory
Operating System--MemoryOperating System--Memory
Operating System--MemoryEverhythm Past
 
Big Data Essentials With Hadoop
Big Data Essentials With HadoopBig Data Essentials With Hadoop
Big Data Essentials With HadoopMochamad Khoiron
 
Layanan Jaringan Installasi & Konfigurasi
Layanan Jaringan Installasi & KonfigurasiLayanan Jaringan Installasi & Konfigurasi
Layanan Jaringan Installasi & KonfigurasiAlfajri Tsaqifurrosyid
 
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdfjbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdfIhsanAzhary1
 
SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx
SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptxSEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx
SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptxANNISA735564
 
PENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptx
PENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptxPENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptx
PENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptxYogiswaraDPutra
 
Tugas 5 0317-fahreza yozi-1612510832
Tugas 5 0317-fahreza yozi-1612510832Tugas 5 0317-fahreza yozi-1612510832
Tugas 5 0317-fahreza yozi-1612510832fahreza yozi
 
Slide Jaringan Komputer ITB pertemuan 1
Slide Jaringan Komputer ITB pertemuan 1 Slide Jaringan Komputer ITB pertemuan 1
Slide Jaringan Komputer ITB pertemuan 1 Putu Shinoda
 
Belajar Pemrograman Matlab
Belajar Pemrograman MatlabBelajar Pemrograman Matlab
Belajar Pemrograman Matlabsoftscients
 
Media penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeeze
Media penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeezeMedia penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeeze
Media penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeezeSuyadi Abu Farros
 
Suci Arrum Meilani - Manajemen Memori
Suci Arrum Meilani - Manajemen MemoriSuci Arrum Meilani - Manajemen Memori
Suci Arrum Meilani - Manajemen Memoribelajarkomputer
 

Semelhante a ANALISIS KINERJA (20)

Analisa pengaruh block size pada hdfs terhadap kecepatan
Analisa pengaruh block size pada hdfs terhadap kecepatanAnalisa pengaruh block size pada hdfs terhadap kecepatan
Analisa pengaruh block size pada hdfs terhadap kecepatan
 
Modul membaca netcdf
Modul membaca netcdfModul membaca netcdf
Modul membaca netcdf
 
Pemrosesan paralel untuk kompresi data
Pemrosesan paralel untuk kompresi dataPemrosesan paralel untuk kompresi data
Pemrosesan paralel untuk kompresi data
 
Operating System--Memory
Operating System--MemoryOperating System--Memory
Operating System--Memory
 
Big Data Essentials With Hadoop
Big Data Essentials With HadoopBig Data Essentials With Hadoop
Big Data Essentials With Hadoop
 
Cloud computing
Cloud computingCloud computing
Cloud computing
 
Layanan Jaringan Installasi & Konfigurasi
Layanan Jaringan Installasi & KonfigurasiLayanan Jaringan Installasi & Konfigurasi
Layanan Jaringan Installasi & Konfigurasi
 
Merakit Personal Komputer PC
Merakit Personal Komputer PCMerakit Personal Komputer PC
Merakit Personal Komputer PC
 
Ppt hadoop
Ppt hadoopPpt hadoop
Ppt hadoop
 
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdfjbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
 
Memory
MemoryMemory
Memory
 
SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx
SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptxSEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx
SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx
 
Front side bus
Front side busFront side bus
Front side bus
 
PENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptx
PENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptxPENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptx
PENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptx
 
Tugas 5 0317-fahreza yozi-1612510832
Tugas 5 0317-fahreza yozi-1612510832Tugas 5 0317-fahreza yozi-1612510832
Tugas 5 0317-fahreza yozi-1612510832
 
Slide Jaringan Komputer ITB pertemuan 1
Slide Jaringan Komputer ITB pertemuan 1 Slide Jaringan Komputer ITB pertemuan 1
Slide Jaringan Komputer ITB pertemuan 1
 
Belajar Pemrograman Matlab
Belajar Pemrograman MatlabBelajar Pemrograman Matlab
Belajar Pemrograman Matlab
 
Media penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeeze
Media penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeezeMedia penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeeze
Media penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeeze
 
Module desain web
Module desain webModule desain web
Module desain web
 
Suci Arrum Meilani - Manajemen Memori
Suci Arrum Meilani - Manajemen MemoriSuci Arrum Meilani - Manajemen Memori
Suci Arrum Meilani - Manajemen Memori
 

Último

Instrumen Penelitian dalam pengukuran fenomena .pptx
Instrumen Penelitian dalam pengukuran fenomena .pptxInstrumen Penelitian dalam pengukuran fenomena .pptx
Instrumen Penelitian dalam pengukuran fenomena .pptxZhardestiny
 
393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas
393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas
393479010-POWER-POINT-MODUL-6-ppt.pdf. tugaslisapalena
 
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Shary Armonitha
 
PPT ANEMIA pada remaja maupun dewasapptx
PPT ANEMIA pada remaja maupun dewasapptxPPT ANEMIA pada remaja maupun dewasapptx
PPT ANEMIA pada remaja maupun dewasapptxsitifaiza3
 
Geologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdfGeologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdfAuliaAulia63
 
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptxUKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptxzidanlbs25
 
Contoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningContoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningSamFChaerul
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksdanzztzy405
 
Menggunakan Data matematika kelas 7.pptx
Menggunakan Data matematika kelas 7.pptxMenggunakan Data matematika kelas 7.pptx
Menggunakan Data matematika kelas 7.pptxImahMagwa
 

Último (9)

Instrumen Penelitian dalam pengukuran fenomena .pptx
Instrumen Penelitian dalam pengukuran fenomena .pptxInstrumen Penelitian dalam pengukuran fenomena .pptx
Instrumen Penelitian dalam pengukuran fenomena .pptx
 
393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas
393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas
393479010-POWER-POINT-MODUL-6-ppt.pdf. tugas
 
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
 
PPT ANEMIA pada remaja maupun dewasapptx
PPT ANEMIA pada remaja maupun dewasapptxPPT ANEMIA pada remaja maupun dewasapptx
PPT ANEMIA pada remaja maupun dewasapptx
 
Geologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdfGeologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdf
 
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptxUKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
 
Contoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningContoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data mining
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
 
Menggunakan Data matematika kelas 7.pptx
Menggunakan Data matematika kelas 7.pptxMenggunakan Data matematika kelas 7.pptx
Menggunakan Data matematika kelas 7.pptx
 

ANALISIS KINERJA

  • 1. Analisis Performa Kecepatan Mapreduce Pada Hadoop Menggunakan TCP Packet Flow Analysis Priagung Khusumanegara 1006661084 Skripsi Teknik Komputer Universitas Indonesia Senin, 30 Juni 2014
  • 2. Latar Belakang Referensi Gambar: http://technews.tmcnet.com/telecommunications/topics/telecommunications/articles/156051-what-att-purchase-t-mobile-means.htm
  • 3. 1. Mengimplementasikan sebuah program untuk mengolah data aliran paket TCP pada sebuah jaringan yang dapat dijalankan secara terditribusi oleh Hadoop, 2. Melakukan percobaan terhadap enam skenario berdasarkan topologi yang telah dirancang, 3. Melakukan analisis pengaruh physical node, virtual node, block size dan jumlah slot map terhadap kecepatan MapReduce pada Hadoop. Tujuan Penelitian
  • 5. Hadoop merupakan framework software berbasis Java dan opensource yang berfungsi untuk mengolah data yang memiliki ukuran besar secara terdistribusi. Pengertian Hadoop
  • 6. Hadoop terdiri dari 2 komponen inti: 1.Hadoop Distributed File System (HDFS) 2.MapReduce Arsitektur Hadoop Gambar: Bagian inti Hadoop (a) komponen HDFS (b) komponen MapReduce Referensi Gambar : JeongJin Cheon, Tae-Young Choe. Distributed Processing of Snort Alert Log using Hadoop. International Journal of Engineering and Technology (IJET), Gyeongbuk Korea, 2013. HADOOP HDFS MapReduce
  • 7. • File system pada Hadoop • Menyimpan data secara terdisribusi • Data disimpan dalam bentuk potongan-potongan (secara default 64 MB) Hadoop Distributed File System (HDFS) Referensi Gambar: http://www.cloudera.com/content/dam/cloudera/product-assets/hdfs-data-distribution.png Gambar: Distribusi data pada HDFS
  • 8. HDFS memiliki 3 komponen utama berupa: 1.NameNode 2.DataNode 3.Secondary NameNode Komponen HDFS Gambar: Komponen HDFS Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
  • 9. 1. NameNode • Berada pada master node • Mengkoordinasi DataNode yang terdapat pada slave node. Komponen HDFS…Lanjutan… Gambar: NameNode pada HDFS Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
  • 10. 2. DataNode • Berada pada slave node • Menyimpan data pada slave node. Komponen HDFS…Lanjutan… Gambar: DataNode pada HDFS Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
  • 11. 3. Secondary NameNode • Berada pada master node • Melakukan monitoring keadaan dari cluster HDFS. Komponen HDFS…Lanjutan… Gambar: Secondary NameNode pada HDFS Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
  • 12. • Framework untuk aplikasi dan programming yang digunakan Hadoop • Melakukan suatu pekerjaan dari komputasi terdistribusi yang dijalankan pada sebuah cluster. • Proses utama : Map dan Reduce Mapreduce Gambar: Bagian inti Hadoop (a) komponen HDFS (b) komponen MapReduce HADOOP HDFS MapReduce Referensi Gambar : JeongJin Cheon, Tae-Young Choe. Distributed Processing of Snort Alert Log using Hadoop. International Journal of Engineering and Technology (IJET), Gyeongbuk Korea, 2013.
  • 13. Shuffle ReduceMap Proses Mapreduce Referensi Gambar : The overall MapReduce WordCount process, http://www.rabidgremlin.com/data20/#%283%29. Dikases pada tanggal 30 Oktober 2013. Gambar 2.4 Proses MapReduce pada Hadoop
  • 14. Komponen MapReduce pada Hadoop yaitu: 1.JobTracker 2.TaskTracker Komponen Mapreduce Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011. Gambar: Komponen MapReduce
  • 15. 1. JobTracker • Memecah permintaan yang diberikan ke HDFS menjadi beberapa pekerjaan yang lebih kecil. • Memberikan pekerjaan tersebut kepada setiap slave node. Komponen Mapreduce…Lanjutan… Gambar: Komponen MapReduce Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
  • 16. 2. Tasktracker • Berfungsi untuk menerima pekerjaan yang diberikan oleh JobTracker. • Menjalankan pekerjaan yang diberikan JobTracker. Komponen Mapreduce…Lanjutan… Gambar: Kerja TaskTracker pada setiap node Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
  • 18. TCP Packet Flow Analysis • Menganalisis aliran paket yang terdapat pada sebuah jaringan menggunakan Hadoop. • Program yang menggunakan konsep MapReduce. Gambar: Contoh file yang akan diproses
  • 19. TCP Packet Flow Analysis…Lanjutan… Gambar: Flowchart TCP Packet Flow Analysis
  • 20. TCP Packet Flow Analysis…Lanjutan… Gambar: Hasil dari TCP Packet Flow Analysis (a) packet total (b) packet length
  • 21. Skenario 1 Hardware Laptop 1 Laptop 2 CPU AMD Dual Core, Clock Speed 1.48 GHz Intel Dual Core, Clock Speed 2.0 GHz RAM 4.00 GB 4.00 GB Sistem Operasi CentOS 6.3 CentOS 6.3 Gambar: Topologi Skenario 1 Tabel: Spesifikasi machine yang digunakan pada skenario 1
  • 23. Skenario 2 Hardware Host VM 1 VM 2 CPU AMD Dual Core, Clock Speed 1.48 GHz One Core One Core RAM 4.00 GB 1.00 GB 1.00 GB Sistem Operasi CentOS 6.3 CentOS 6.3 CentOS 6.3 Gambar: Topologi Skenario 2 Tabel: Spesifikasi machine yang digunakan pada skenario 2
  • 25. Skenario 3 Hardware Laptop 1 CPU AMD Dual Core, Clock Speed 1.48 GHz RAM 4.00 GB Sistem Operasi CentOS 6.3 Gambar: Pembagian block size pada Hadoop yang dijalankan secara single node Tabel: Spesifikasi machine yang digunakan pada skenario 3
  • 27. Analisis Skenario 3 Gambar: Jumlah task pada file 1 GB dengan (a) block size 64 MB (b) block size 128 MB Gambar: Komunikasi antara scheduler, JobTracker, dan TaskTracker
  • 28. Analisis Skenario 3…Lanjutan… Gambar: Proses MapReduce pada ukuran file 512 MB dengan block size 256 MB Gambar: Proses MapReduce pada ukuran file 512 MB dengan block size 256 MB
  • 29. Skenario 4 Hardware Laptop 1 Laptop 2 CPU AMD Dual Core, Clock Speed 1.48 GHz Intel Dual Core, Clock Speed 2.0 GHz RAM 4.00 GB 4.00 GB Sistem Operasi CentOS 6.3 CentOS 6.3 Gambar: Pembagian block size pada Hadoop yang dijalankan secara multi node Tabel: Spesifikasi machine yang digunakan pada skenario 4
  • 31. Analisis Skenario 4 Gambar: Jumlah task pada file 512 GB dengan block size 128 MB Gambar: Proses MapReduce pada ukuran file 512 MB dengan block size 128 MB
  • 32. Skenario 5 Hardware Laptop 1 CPU AMD Dual Core, Clock Speed 1.48 GHz RAM 4.00 GB Sistem Operasi CentOS 6.3 Gambar: Gambaran slot map pada Hadoop Tabel: Spesifikasi machine yang digunakan pada skenario 5
  • 34. Skenario 6 Hardware PC CPU Intel i7-2600 , Clock Speed 3.4 GHz RAM 4.00 GB Sistem Operasi CentOS 6.3 Gambar: Topologi Skenario 6 Tabel: Spesifikasi machine yang digunakan pada skenario 6
  • 36. 1. Penambahan jumlah physical machine dapat mempercepat kecepatan rata-rata MapReduce. 2. Penambahan jumlah virtual machine dapat memperlambat kecepatan rata-rata MapReduce. 3. Block size dapat mempengaruhi kecepatan MapReduce pada Hadoop, semakin besar block size maka semakin cepat kecepatan MapReduce pada Hadoop dengan syarat: number of task > slot map Kesimpulan
  • 37. 4. Jumlah slot map dapat mempengaruhi kecepatan MapReduce pada Hadoop, dimana performa kecepatan MapReduce lebih cepat jika jumlah slot map pada Hadoop sesuai dengan jumlah core yang dimiliki oleh machine. 5. Hadoop memiliki keunggulan dalam mengolah data yang memiliki ukuran yang besar dan jumlah yang banyak karena Hadoop dapat mengolah data tersebut secara terdistribusi. Kesimpulan…Lanjutan…
  • 38. 1. Leslie Lamport and Nancy Lynch. (1989, February 3). Chapter on Distributed Computing. 2. Chuck Lam. (2011). Hadoop In Action. Stamford: Mainning Publications Co. 3. Tom White. (2009). Hadoop: The Definitive Guide. California: O’Reilly. 4. Garry Turkington. (2013). Hadoop Beginner's Guide. Birmingham: Packt Publishing. 5. Shv, Hairong, SRadia, Chansler. (2010). The Hadoop Distributed File System. Jurnal IEEE. 6. Intel Corporation. (2013). Optimizing Java* and Apache Hadoop* for Intel® Architecture. USA: Intel Corporation. 7. Apache TM Hadoop @ homepage. http://hadoop.apache.org/. Diakses 17 Oktober 2013. 8. JeongJin Cheon, Tae-Young Choe. (2013). Distributed Processing of Snort Alert Log using Hadoop. International Journal of Engineering and Technology (IJET). 9. Aditya B. Patel, Manashvi Birla, Ushma Nair. (2012). Addressing Big Data Problem Using Hadoop and Map Reduce. Nirma University International Conference On Engineering. Daftar Referensi
  • 39. 10. Amit Anand. (2013). Configuration Parameters dfs.Block.Size. Hadoop. 11. Dima May. (2012). Hadoop Distributed File System (HDFS) Overview. coreservlets.com. 12. Magang Industri. (2013). Definisi Cloud Computing. Meruvian.org Cloud Computing. 13. Colin White. (2012, January). MapReduce and the Data Scientist. BI Research. 14. R. David Idol. Large-Scale TCP Packet Flow Analysis for C Using Apache™ Hadoop. University of North Carolina at Chapel Hill. 15. Tutorial dan Konfigurasi Hadoop Single Node. 16. http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node- cluster/. Diakses pada tanggal 20 Oktober 2013. 17. MapReduce Hadoop. http://www.yalescientific.org/2012/03/hadapt-yale-startup/. Diakses pada tanggal 29 Oktober 2013. Daftar Referensi…Lanjutan…
  • 40. 18. Interaction between the JobTracker, TaskTracker and the Scheduler @ homepage. http://www.thecloudavenue.com/2011/11/interaction-between-jobtracker.html. Diakses pada tanggal 29 Oktober 2013. 19. The overall MapReduce WordCount process, 20. http://www.rabidgremlin.com/data20/#%283%29. Diakses pada tanggal 30 Oktober 2013. 21. Thinking in MapReduce, https://engineering.cerner.com/2013/07/thinking-in- mapreduce/. Diakses pada tanggal 30 Oktober 2013. Daftar Referensi…Lanjutan…