Dokumen tersebut membahas tentang big data dan perbedaannya dengan business intelligence. Big data memiliki tiga karakteristik yaitu volume, variety, dan velocity. Sedangkan business intelligence berfokus pada pengolahan data mentah menjadi informasi yang bermakna untuk tujuan bisnis. Dokumen juga membahas tentang teknologi yang mendukung big data seperti Hadoop dan High Performance Computing Cluster.
1. PAPER
BIG DATA
Nama :
Ilham Malik Ibrahim
NIM
0110212009
Sekolah Tinggi Terpadu Nurul Fikri
Teknik Informatika 2015
2. Abstrak
Pada awalnya tahun 1970-2000 data yang dibangun meruapakan data
dengan model terstruktur dan merupakan relational database seperti
MySQL, oracle, dan lain-lain. Lalu pada tahun 1995 berikutnya mulai
dibangun suatu business intelligence yang menggunakan structured dan
relational database dengan system seperti cognos, pentaho dan lain-lain.
Pada 2010 hingga sekarang dibangun suatu system yang memiliki tujuan
3V (volume, velocity, varity) atau 4V (ditambah value), dan dengan
bermacam teknologinya seperti map reduce, high performance computers
cluster dan lain-lain.
Artinya Big Data merupakan bagian dari intelijen bisnis, Big Data dapat
digunakan untuk membentuk suatu bisnis yang memiliki intelijen guna
mendukung pengambilan keputusan. Namun dalam hal ini ada beberapa
hal yang berbeda dari segi volume yang bukan hanya jumlah data yang
banyak, namun pertumbuhan data yang sangat pesat sehingga dalam
rentang waktu yang pendek data dapat bertumbuh dengan sangat cepat
dan besar (velocity), dan data yang ada memiliki variasi yang sangat
banyak (variety) tentunya dalam big data sendiri terutama dalam
pembentukan datawarehouse sudah banyak dilakukan ekstraksi transform
load untuk menanggulanggi varietas dari data tersebut sehingga data
dapat menjadi standar baik dibersihkan dari berbagai noise juga dilakukan
transformasi sehingga data jauh lebih sesuai dengan proses bisnis yang
ada atau yang sedang berjalan bagi organisasi tertentu.
Business Intelligence yang didalamnya terdapat pemanfaatan big data pun
membutuhkan suatu teknologi yang dapat mendukung proses bisnis yang
ada didalam intelijen bisnis itu sendiri, sehingga dapat berjalan sesuai
dengan yang diharapkan. Sehingga perlu dibangun suatu infrastruktur
yang tepat dan dapat mengatasi kebutuhan big data yaitu salah satunya
adalah proses pengolahan data yang sangat cepat walaupun diwaktu yang
sama data berukuran besar dan tumbuh dengan cepat.
Yang menjadi masalah dan tantangan adalah akusisi data, recording data,
ekstraksi, cleaning, anotasi, integrasi, agregasi, representasi, analisis,
modeling, interpretasi, dan visualisasi. Big data sendiri memiliki penerapan
dan manfaat untuk berbagai bidang seperti yang sudah disebutkan diatas
sebelumnya.
Kata Kunci
Big Data, Business Intelligence
3. BAB I
PENDAHULUAN
1.1 Latar Belakang
Akhir-akhir ini, istilah 'big data' menjadi topik yang dominan dan sangat sering dibahas dalam
industri IT. Banyak pihak yang mungkin heran kenapa topik ini baru menjadi pusat perhatian
padahal ledakan informasi telah terjadi secara berkelangsungan sejak dimulainya era
informasi. Perkembangan volume dan jenis data yang terus meningkat secara berlipat-lipat
dalam dunia maya Internet semenjak kelahirannya adalah fakta yang tak dapat dipungkiri.
Mulai data yang hanya berupa teks, gambar atau foto, lalu data berupa video hingga data
yang berasal system pengindraan.
Hingga saat ini, definisi resmi dari istilah big data belum ada. Namun demikian, latar belakang
dari munculnya istilah ini adalah fakta yang menunjukkan bahwa pertumbuhan data yang
terus berlipat ganda dari waktu ke waktu telah melampaui batas kemampuan media
penyimpanan maupun sistem database yang ada saat ini. Kemudian, McKinseyGlobal
Institute (MGI), dalam laporannya yang dirilis pada Mei 2011, mendefinisikan bahwa big data
adalah data yang sudah sangat sulit untuk dikoleksi, disimpan, dikelola maupun dianalisa
dengan menggunakan sistem database biasa karena volumenya yang terus berlipat. Tentu
saja definisi ini masih sangat relatif, tidak mendeskripsikan secara eksplisit sebesar apa big
data itu. Tetapi, untuk saat sekarang ini, data dengan volume puluhan terabyte hingga
beberapa petabyte kelihatannya dapat memenuhi definis MGI tersebut.
Di lain pihak, berdasarkan definisi dari Gartner, big data itu memiliki tiga atribute yaitu :
volume , variety , dan velocity. Ketiga atribute ini dipakai juga oleh IBM dalam mendifinisikan
big data. Volume berkaitan dengan ukuran, dalam hal ini kurang lebih sama dengan definisi
dari MGI. Sedangkan variety berarti tipe atau jenis data, yang meliputi berbagai jenis data
baik data yang telah terstruktur dalam suatu database maupun data yang tidak terorganisir
dalam suatu database seperti halnya data teks pada web pages, data suara, video, click
stream, log file dan lain sebagainya. Yang terakhir, velocity dapat diartikan sebagai kecepatan
dihasilkannya suatu data dan seberapa cepat data itu harus diproses agar dapat memenuhi
permintaan pengguna.
Berdasarkan uraian di atas, penulis merasa tertarik untuk mengangkat pembahasan yang
dirumuskan dalam judul “Apakah yang dimaksud dengan Big Data?”
1.2 Ruang Lingkup
Mengingat luasnya cakupan ruang lingkup big data, maka ruang lingkup yang dibahas
dibatasi pada :
1. Penjelasan tentang Big Data .
2. Kegunaan Big Data.
1.3 Tujuan dan Manfaat
Berdasarkan pembahasan pada latar belakang, maka dapat ditentukan tujuan penelitian ini,
4. yaitu untuk mengetahui perkembangan big data yang ada.
Hasil penelitian ini diharapkan dapat memberikan manfaat-manfaat sebagai berikut :
1. Untuk mengetahui definisi atau pengertian dari Big Data.
2. Untuk mengetahui perbedaan dari Big Data dan Business Intelligence.
1.4 Metodologi Penelitian
Metode yang digunakan terdiri dari beberapa bagian, yaitu :
1. Studi pustaka
Metode pengumpulan informasi yang digunakan melalui studi artikel media internet dan buku-
buku referensi yang dapat dijadikan sumber dan panduan dalam penyusunan penulisan ini.
2. Metode Analisis
Metode analisis yang digunakan pada penelitian ini adalah dengan menganalisis dan me-
review perkembangan Disaster Recovery Planning yang ada di Indonesia.
1.5 Sistematika Penulisan
Untuk mempermudah pembahasan dan memberikan gambaran yang sistematis dalam
memahami topik yang disajikan, kami membagi paper ini ke dalam bagian-bagian berupa bab
yaitu :
BAB I : Pendahuluan
Dalam bab ini diuraikan tentang masalah pokok yang dibahas dalam
paper ini, yang terdiri dari Latar Belakang, Ruang Lingkup, Tujuan dan
Manfaaat, Metodologi Penelitian, dan Sistematika Penulisan.
BAB II : Landasan Teori
Dalam bab ini akan menguraikan teori atau konsep yang melandasi hal-
hal yang terdapat dalam penelitian ini, secara umum dijelaskan tentang teori-
teori yang berhubungan dengan kinerja sistem informasi baik dikutip dari
berbagai referensi maupun hasil riset yang didapat.
BAB III : Pembahasan
Dalam bab ini berisi hasil penelitian yang dilakukan dalam rangka
mencapai tujuan dan manfaat yang ditetapkan pada pendahuluan. Lalu
menunjukkan bagaimana pemikiran atau temuan-temuan diperoleh,
menginterpretasikan temuan, dan mengaitkannya dengan teori yang
digunakan.
BAB IV : Penutup
Dalam bab ini penulis akan menarik bebarapa kesimpulan berdasarkan
petunjuk dari buku-buku referensi, internet, dan seminar teori-teori lanjutan
sistem informasi serta saran yang mungkin akan diterapkan untuk kemajuan
5. perusahaan.
BAB II
LANDASAN TEORI
2.1 Big Data
Big data adalah istilah untuk koleksi set data begitu besar dan kompleks sehingga menjadi
sulit untuk memproses menggunakan on-hand tools manajemen database atau aplikasi
pengolahan data tradisional. Tantangan termasuk capture, kurasi, penyimpanan, pencarian,
berbagi, transfer, analisis dan visualisasi.
Kecenderungan untuk set data yang lebih besar adalah karena informasi tambahan
diturunkan dari analisis set besar tunggal data terkait, dibandingkan dengan memisahkan set
yang lebih kecil dengan jumlah data yang sama, yang memungkinkan korelasi harus
ditemukan untuk "tren bisnis spot, menentukan kualitas penelitian, mencegah penyakit,
menghubungkan kutipan hukum , memerangi kejahatan, dan menentukan kondisi real-time
lalu lintas jalan. ". (Wikipedia)
2.2 Business Intelligence
Business intelligence (BI) adalah seperangkat teori, metodologi, arsitektur, dan teknologi yang
mengubah data mentah menjadi informasi yang bermakna dan berguna untuk tujuan bisnis.
BI dapat menangani sejumlah besar data tidak terstruktur untuk membantu mengidentifikasi,
mengembangkan dan sebaliknya menciptakan peluang baru. BI, dalam kata-kata sederhana,
membuat menafsirkan data tebal ramah. Memanfaatkan peluang baru dan menerapkan
strategi yang efektif dapat memberikan keunggulan pasar yang kompetitif dan stabilitas
jangka panjang. (Wikipedia)
6. BAB III
PEMBAHASAN
3.1 TITIK PEMBEDA BIG DATA
Sebagian dari Anda mungkin bertanya “Apa yang membedakan big data dengan sekumpulan
data dalam jumlah yang banyak? Apakah memungkinkan untuk menyamakan dua hal
tersebut dalam satu istilah?”
Nyatanya, big data adalah berbeda dengan sekumpulan data-data yang dikumpulkan secara
random dan dianalisis secara terpisah. Big data tepatnya dibentuk atas tiga dimensi, yang
pertama adalah kuantitas.
Kuantitas dari big data selalu meningkat seiring berjalannya waktu, terlebih lagi dengan
kemajuan teknologi yang memudahkan perusahaan untuk mendokumentasikan informasi
digital yang datang dari berbagai sumber seperti smartphones, media sosial, dan social
barcode.
Dimensi kedua yang menjadi fondasi dari big data adalah variasi. Big data memiliki
keanekaragaman data yang didapatkan dari lingkungan internal dan eksternal perusahaan,
layaknya studi tentang gaji dan demografi tenaga kerja. Variasi juga mengacu pada jenis data
yang terstruktur dan tidak terstruktur.
Data yang terstruktur merupakan data yang bersifat standar dan relasional, seperti HRIS,
sistem akunting, dan sistem perencaaan sumber daya perusahaan. Berbeda halnya dengan
data yang tidak terstruktur, data tersebut didapatkan dari sumber informasi yang lebih luas
seperti pernyataan lisan/tulisan dari subjek penelitian, surel, gambar, video, hingga postingan
di social media.
Kecepatan adalah dimensi terakhir yang membentuk big data. Kecepatan atau velocity
mereferensi kepada peningkatan pengumpulan data dan seberapa cepat data yang
dikumpulkan harus dievaluasi dan diaplikasikan untuk meningkatkan nilai bisnis.
Dari ketiga dimensi big data yang telah dipaparkan, maka dapat dipahami bahwa big data
merupakan manifestasi dari peningkatan jumlah dan variasi data yang datang secara cepat
dari berbagai media. Proses utilisasi big data tidak selesai pada pengumpulan data yang
beragam, melainkan terus berlanjut seiring dengan perusahaan mentransformasikan data-
data mentah menjadi informasi yang savvy, terukur, dan dapat dimengerti. Setelah itu
perusahaan senantiasa mengkomparasikan hasil interpretasi informasi dengan objektif yang
ingin dicapai, dari situ perusahaan dapat menilai apakah situasi, kebijakan, atau strategi
bisnis perusahaan telah secara positif berkontribusi terhadap pencapaian goals.
Ada dua teknologi dalam infrastruktur dalam Big data yaitu :
High Performance Computing Cluster (HPCC) atau dapat disebut sebagai Data Analytics
Supercomputer (DAS)
Hadoop Platform (Map Reduced-Based Platform)
Dari kedua pendekatan teknologi tersebut terdapat perbedaan yang cukup signifikan (dari
segi fungsi) dan juga terdapat kemiripan dalam proses yang berjalan didalamnya. Kemiripan
dari dua teknologi tersebut adalah sama-sama memanfaatkan lebih dari satu komputer dalam
7. melakukan proses penarikan informasi ataupun pemrosesan berbagai informasi atau bahkan
dapat terlihat keduanya menggunakan konsep kluster pada arsitektur teknologi yang
digunakan. Pada dasarnya keduanya pun dapat diintegrasikan dengan baik guna saling
mendukung satu sama lain.
High Performance Compputing Clusters ini sendiri pada dasarnya membangun suatu super
komputer yang terdiri dari lebih dari satu komputer dengan spesifikasi tertentu (biasanya
sama) untuk saling membantu menopang, atau membagi tugas satu sama lain sehingga
bersama-sama dapat melakukan processing terhadap suatu data, terutama dalam hal
pencarian data. Proses besar yang biasanya berjalan sendiri adalah seperti, Ekstrak,
Transform, dan Load, lalu setelah itu dilakukan analisis untuk mendapatkan informasi yang
lebih sesuai dengan kebuthan bisnis organisasi tersebut.
Sedangkan Hadoop Platform sendiri merupakan suatu project teknologi yang dikembangkan
oleh apache dalam mengelola data besar sehingga jauh lebih efektif dan efisien.
Dalam hadoop sendiri terdiri dari berbagai komponen, bahkan hingga hadoop sendiri memiliki
distributed file system sendiri yang disebut dengan (HDFS). Kelebihan dari dari HDFS ini
sendiri adalah :
Fault tolerance, dan di-deploy untuk low cost hardware
Write Onece, Read many, merupakan koherensi sederhana, dan terlebih lagi framework yang
dibangun dalam hadoop ketika kita akan menggunakan hadoop, menggunakan teknologi
java.
Memindahkan komputasi/proses lebih cepat dari memindahkan data.
Mirip Google File System, tetapi HDFS membagi file menjadi block dalam cluster node yang
terdistribusi.
Core component : master vs slave, name node vs data node, job tracker vs task tracker.
Pada masa ini terdapat perbedaan Sistem manajemen Basis Data, yang pada dasarnya
basisdata memiliki korelasi antar data yag biasanya kita sebt dengan data yang sudah
terstruktur atau terorganisasi, dan perangkat system manajemen basis datanya yang
merupakan perangkat lunak yang dapat digunakan untuk mengelola basis data seperti
MySQL, Oracle, PostgreSQL dan lain-lain. Pada saat init terdapat kebutuhan lain dari
manajemen basis data dengan adanya big data atau menjadi Sistem Manajemen Big Data.
Beriku adalah penyebab kenapa terdapat kebutuhan Manajemen Big Data tersebut:
Tidak semua persoalan pengolahan data dapat diselesaikan dengan cara terbaik
menggunakan traditional relational DBMS.
DBMS konvensional tidak cukup untuk big data karena:
• Kecepatan akses (isu volume)
• Kesederhanaan set up
• Kebutuhan representasi struktu/skema yang lebih longgar (isu variety)
• Kebutuhan pengelolaan data yang berbeda (ACID tidak sepenuhnya diperlukan),
missal connectedness.
• Kebutuhan arsitektur terdistribusi (scale out).
Sehingga dibangun berbagai perangkat lunak yang dapat mengatasi kebutuhan tersebut
namun masingmasing teknologi memiliki karakteristik dalam proses pengolahan yang
berbeda, berikut contohnya :
8. 1. Column Oriented
• Big table (google), Hbase, Cassandra (Facebook)
2. Document Oriented
• CouchDB, MongoDB
3. Graph-Oriented
• Neo4j, Virtuoso
4. Key-value Oriented
• DynamoDB (Amazon), Riak
Dari beberapa contoh DBMS diatas tersebut terlihat bahwa ada perbedaan mendasar pada
masing DBMS untuk big data tersebut adalah pada orientasi masing-masing database
management system. Biasanya system untuk manajemen basis data untuk Big Data yang
digunakan adalah NoSQL yang pada awalanya ditujukan oleh para komunitas yang tidak
menyukai penggunakan SQL sebagai “tidak menggunakan SQL” namun sekarang karena
kesadaran ternyta kita tidak bias sepenuhnya lepas terhadap SQL ini, dirubah menjadi “Not
Only SQL” (NoSQL).
NoSql ini merupakan DBMS yang disebutkan sebelumnya (4 point di atas). NoSQL memiliki
perbedaan merupakan database yang tidak berelasi, karena tidak adanya kebutuhan
connectedness yang sudah disebutkan sebelumnya, dan biasanya bersifat terdistribusi dan
scale out (secara horizontal). Tanpa ada skema khusus sehingga lebih longgar terhadap
skema, dan penggunakan Application Programming Interface yang lebih sederhana dalam
penggunaan manipulasi atau processing data. Juga menerapkan perinsip BASE, buka ACID.
Yang paling terkenal sendiri untuk teknologi NoSQL ini adalah Hadoop dengan map
reducenya yang antara versi 1.0 dan 2.0 nya memiliki perbedaan yang cukup signifikan
terutama dalam model frameworknya, yang kedua adalah Document Oriented yang memiliki
konsep hirarki dalam dokumen suatu data, dan biasanya doumen di enkapsulasi dan
encoding dalam format standar XML,JSON, YAML, dan lain-lain. Sedangkan Graph oriented
merupakan DBMS yang memrepresentasikan model data graph, yang memperlihatkan
keterhubungan antar setiap data.
Dalam proses mining (datamining) dengan adanya big data ini sendiri cukup menguntungkan
karena datamining membutuhkan data yang banyak sehingga menghasilkan model yang jauh
lebih general namun memiliki akurasi yang tinggi. Namun dengan adanya big data ini sendiri
datamining diharuskan menerima tantangan bagaimana melakukan datamining dengan skala
yang sangat besar dan terdistribusi juga dengan variety data yang sangat variatif.
Sehingga diharapkan dengan pemanfaatan infrastruktur teknologi dari Big Data yang tepat
guna dapat mendukung proses bisnis yang ada menjadi jauh lebih baik terutama dalam
proses pengambil informasi, knowledge dan wisdom guna mendukung dalam pengambil
keputusan pada suatu organisasi tertentu baik itu profit maupun non-profit, baik itu swasta
maupun pemerintah.
3.2 MANFAAT DARI BIG DATA
Big data dapat dikonsiderasikan sebagai suatu investasi, dimana implikasi yang nyata baru
9. dapat dirasakan apabila proses penelitian dan interpretasi big data telah dirampungkan dan
menghasilkan strategi bisnis yang solutif dan implementatif.
Manfaat pertama dari pemanfaatan big data adalah perusahaan memiliki kesempatan untuk
mengambil keputusan bisnis yang didasarkan atas data yang ilmiah dan terukur, bukan
berdasarkan common sense, intuisi, atau kebijaksanaan yang bersifat praktis.
Selama bertahun-tahun, HR telah menggunakan data tidak terstruktur dari jawaban karyawan
dalam survei engagement, performance review, dll. Di era big data ini, data tak terstruktur
tersebut datang dari sumber dalam dan luar organisasi, termasuk dari social media, blog,
wiki, email, dan lain-lain. Semua sumber ini akan memberikan semakin banyak insight
terhadap keterlibatan karyawan terhadap perusahaan.
Starbucks mendapatkan masukan tentang motivasi karyawannya dari survei dengan banyak
pertanyaan terbuka. Starbucks mempekerjakan mahasiswa paska sarjana untuk membantu
mereka membuat analisa konten dari informasi yang jumlahnya masif tersebut. Tools untuk
mengotomatisasikan proses ini masih dalam tahap pengembangan.
Menurut Ranjan Dutta, direktur pengukuran dan predictive analytics pada PwC Saratoga,
teknik analisa otomatis terhadap data tak terstruktur sebagian besar masih dalam tahap awal
pengembangannya. Tetapi kemampuan tools-tools seperti ini akan berkembang cepat dalam
5 tahun ke depan. Menurutnya, perusahaan seperti SAP, Oracle, dan Workday saat ini terus
mengembangkan perangkat lunak yang terus memudahkan analisa big data.
Baru sedikit organisasi HR yang telah menggunakan data dari situs jejaring sosial. Selain
Juniper yang telah disebutkan di atas, organisasi lain yang banyak menggali manfaat dari
Linkedin adalah Thrivent. Thrivent mencari kandidat yang memiliki semangat entrepreneurial
dan menemukan Linkedin adalah alat yang efektif untuk melakukan pencarian semacam ini.
Facebook dan situs jejaring sosial lain juga menjanjikan. FedEx misalnya, melakukan studi
korelasi antara data karyawan dengan data kepuasan konsumen. Mereka mencari tahu
bagaimana perbandingan apa yang dikatakan karyawan tentang FedEx dalam situs jejaring
sosial dan situs web karir dengan apa yang dikatakan karyawan dalam survey engagement.
“Karyawan adalah duta brand, dan social media adalah seperti mikrofon besar yang
menyuarakan tentang perusahaan Anda,” ujar Bennett. “Kepuasan karyawan hari ini akan
keluar melampaui tempat kerja dan memasuki ranah social. Apabila ada karyawan tidak puas
dan menampilkannya di social media, maka kita punya masalah.”
3.3 JALAN YANG PANJANG UNTUK MERAIH BIG DATA
Sama seperti penelitian bisnis pada umumnya, proses penggunaan big data menuntut para
profesional untuk mengetahui objektif bisnis apa yang ingin diraih, menciptakan cara untuk
mendapatkan data yang relevan, menentukan bagaimana penelitian dan interpretasi akan
diaktualisasikan, merancang variabel penelitian, dan mengimplementasikan penelitian yang
telah direncanakan.
Namun begitu, penting untuk diketahui bahwa ada dua tantangan yang terbesar dari big data
yaitu bagaimana mendapatkan data yang diinginkan dan mengintegrasikan data yang
berbeda.
10. 3.4 PERBEDAAN BIG DATA DENGAN BUSINESS INTELLIGENCE
Perbedaan yang mendasar adalah bagaimana konsep Big Data dan Business Intelligence
memproses data.Untuk menghadapi volume yang tinggi, prinsip Business Intelligence
mengajak kita untuk membersihkan data yang ada. Proses pembersihan ini akan membuang
residu yang dianggap tidak penting. Sedangkan prinsip Big Data adalah untuk tidak
membuang data apapun karena residu tersebut mungkin akan menjadi penting sejalannya
waktu.
Untuk menghadapi velositas yang tinggi, prinsip Business Intelligence mengajak kita untuk
melakukan operasi batch secara teratur. Operasi ini akan medorong data dari sistem
transaksi ke data warehouse untuk diproses selanjutnya. Sedangkan prinsip Big Data adalah
real-time processing.
Untuk menghadapi variasi data yang tinggi, prinsip Business Intelligence mengajak kita untuk
menciptakan struktur melalui ekstraksi, transformasi dan membuang residu yang tersisa. Big
Data memiliki pendekatan yang serupa namun tanpa harus membuang data mentah yang
kita miliki. Misalnya dari sebuah unstructured data kita bisa melakukan entity resolution untuk
mengekstrak konteks sebuah kata (contoh: Apple adalah perusahaan atau label rekaman
atau buah). Kalkulasi ini biasanya dilakukan secara real time.
11. BAB IV
PENUTUP
4.1 Kesimpulan
Kesimpulan makalah ini adalah :
Big Data bukanlah semata-mata hanya soal ukuran, bukan hanya tentang data yang
berukuran raksasa. Big data adalah data berukuran raksasa yang volumenya terus
bertambah, terdiri dari berbagai jenis atau varietas data, terbentuk secara terus menerus
dengan kecepatan tertentu dan harus diproses dengan kecepatan tertentu pula.
Momen awal ketenaran istilah ‘big data’ adalah kesuksesan Google dalam memberdayakan
‘big data’ dengan menggunakan teknologi canggihnya yang disebut Bigtable beserta
teknologi-teknologi pendukungnya.
4.2 Saran
Penerapan Big Data sebaiknya dilakukan sesuai kebutuhan perusahaan sehingga dapat
menghasilkan strategi bisnis yang solutif dan implementatif.
12. DAFTAR PUSTAKA
Sutanto, Taufik. (2013). Big Data & Kurikulum: Berbagi Pengalaman Kecil.
http://sutanto.org/bigdatakurikulum/
Nandonurhadi. (2013). Sejarah Big Data dan Big Data Landscape.
http://nandonurhadi.wordpress.com/2013/07/25/sejarah-big-data-dan-big-data-landscape/
https://id.wikipedia.org/