1. Data yang diperlukan untuk penelitian ini antara lain:
a. Data Primer
- Jumlah SKS yang diambil oleh mahasiswa Poltek Telkom
- Nilai IPK yang diperoleh mahasiswa Poltek Telkom
b. Data Sampel
- Jumlah SKS dan Nilai IPK sebagian mahasiswa Poltek Telkom
c. Data Populasi
- Jumlah SKS dan Nilai IPK seluruh mahasiswa Poltek Telkom
d. Skala pengukuran
- Jumlah SKS (rasio)
- Nilai
1. STATISTIKA
PROBABILITAS
TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI
PONDOK MODERN SUMBER DAYA AT-TAQWA
STT POMOSDA
TAHUN AKADEMIK 2012-2013
i
2. HALAMAN PENGARANG DAN COPYRIGHT
Penulis:
1. M.Imam Bahrul Ulum
2. M. Nur Fuad
3. Ida Retno Nur Azizah
4. Fiki Amalia
5. Muslim Adi Mulyo
6. Wahyu Adi Nugroho
7. Sugiono
8. Yanson Ali K.
9. Malik
10.
Dilarang menerbitkan kembali, menyebarluaskan atau menyimpan baik
sebagian maupun seluruh isi buku dalam bentuk dan dengan cara apapun
tanpa izin tertulis dari pihak terkait.
Hak cipta dilindungi undang-undang
No part of this document may be copied, reproduced, printed, distributed,
modified, removed and amended in any form by any means without prior
written authorization
ii
3. KATA PENGANTAR
Assalamu’alaikum Wr. Wb
Segala puji bagi Allah SWT karena dengan karunia-Nya courseware
ini dapat diselesaikan.
Atas nama Sekolah tinggi teknologi pondok modern sumber daya
at-taqwa, kami sangat menghargai dan ingin menyampaikan terima
kasih kepada penulis, penerjemah dan penyunting yang telah
memberikan tenaga, pikiran, dan waktu sehingga courseware ini dapat
tersusun.
Tak ada gading yang tak retak, di dunia ini tidak ada yang sempurna,
oleh karena itu kami harapkan para pengguna buku ini dapat
memberikan masukan perbaikan demi pengembangan selanjutnya.
Semoga courseware ini dapat memberikan manfaat dan membantu
seluruh Sivitas Sekolah tinggi teknologi pondok modern sumber
daya at-taqwa dalam memahami dan mengikuti materi perkuliahan di
STT POMOSDA
Amin.
Wassalamu’alaikum Wr. Wb.
Nganjuk 05-12-2012
iii
4. DAFTAR ISI
DAFTAR ISI...........................................................................iv
1 MENGENAL DATA.....................................................1
1.1 Populasi dan Sampel..........................................................1
1.2 Skala Pengukuran..............................................................3
2 STATISTIKA DESKRIPTIF.........................................1
2.1 Ukuran Pemusatan..............................................................2
2.2 Ukuran Penyebaran.............................................................2
2.3 Ukuran Letak......................................................................3
2.4 Distribusi Frekuensi............................................................3
2.5 Penyajian dalam Bentuk Grafik..........................................5
3 PELUANG, PELUANG BERSYARAT, DAN
KAIDAH BAYES ...................................................3
3.1 Ruang Sampel dan Kejadian...............................................4
3.2 Peluang...............................................................................5
3.3 Peluang Bersyarat...............................................................6
3.4 Kaidah Bayes......................................................................9
4 PEUBAH ACAK, DISTRIBUSI PELUANG
DISKRET, DAN DISTRIBUSI PELUANG
KONTINU.............................................................15
4.1 Peubah Acak ....................................................................16
4.2 Distribusi Peluang Diskret................................................16
4.3 Distribusi Peluang Kontinu..............................................17
Latihan ...................................................................................20
5 DISTRIBUSI PELUANG KHUSUS DISKRET DAN
KONTINU ..............................................................1
5.1 Distribusi Peluang Diskret..................................................2
5.1.1 Distribusi Bernoulli dan Binomial..................................2
5.1.2 Distribusi Poisson..........................................................5
5.2 Distribusi Peluang Kontinu.............................................10
iv
5. 5.2.1 Distribusi Normal........................................................10
5.2.2 Distribusi Normal Baku .............................................12
5.2.3 Distribusi Uniform .......................................................14
5.2.4 Distribusi Eksponensial.................................................15
Latihan....................................................................................19
6 DISTRIBUSI SAMPLING DAN DALIL LIMIT
PUSAT.....................................................................1
6.1 Distribusi Sampling.........................................................2
6.2 Dalil Limit Pusat..............................................................3
DAFTAR ISI...........................................................................iv
1 MENGENAL DATA.....................................................1
1.1 Populasi dan Sampel..........................................................1
1.2 Skala Pengukuran..............................................................3
2 STATISTIKA DESKRIPTIF.........................................1
2.1 Ukuran Pemusatan..............................................................2
2.2 Ukuran Penyebaran.............................................................2
2.3 Ukuran Letak......................................................................3
2.4 Distribusi Frekuensi............................................................3
2.5 Penyajian dalam Bentuk Grafik..........................................5
3 PELUANG, PELUANG BERSYARAT, DAN
KAIDAH BAYES ...................................................3
3.1 Ruang Sampel dan Kejadian...............................................4
3.2 Peluang...............................................................................5
3.3 Peluang Bersyarat...............................................................6
3.4 Kaidah Bayes......................................................................9
4 PEUBAH ACAK, DISTRIBUSI PELUANG
DISKRET, DAN DISTRIBUSI PELUANG
KONTINU.............................................................15
4.1 Peubah Acak ....................................................................16
4.2 Distribusi Peluang Diskret................................................16
4.3 Distribusi Peluang Kontinu..............................................17
Latihan ...................................................................................20
5 DISTRIBUSI PELUANG KHUSUS DISKRET DAN
KONTINU ..............................................................1
v
6. 5.1 Distribusi Peluang Diskret..................................................2
5.1.1 Distribusi Bernoulli dan Binomial..................................2
5.1.2 Distribusi Poisson..........................................................5
5.2 Distribusi Peluang Kontinu.............................................10
5.2.1 Distribusi Normal........................................................10
5.2.2 Distribusi Normal Baku .............................................12
5.2.3 Distribusi Uniform .......................................................14
5.2.4 Distribusi Eksponensial.................................................15
Latihan....................................................................................19
6 DISTRIBUSI SAMPLING DAN DALIL LIMIT
PUSAT.....................................................................1
6.1 Distribusi Sampling.........................................................2
6.2 Dalil Limit Pusat..............................................................3
DAFTAR PUSTAKA.....Error: Reference source not found
vi
7. 1 MENGENAL DATA
Overview
Dalam sebuah penelitian, data adalah sebagai komponen utamanya. Tanpa
data, kita tidak bisa membuat kesimpulan apapun berkaitan dengan penelitian
yang telah dilakukan. Berkaitan dengan data, ada beberapa karakteristik data
yang perlu untuk kita kenali antara lain sumber data (primer, sekunder) jenis
pengambilan datanya (sampel,populasi) dan skala pengukurannya.
Pengetahuan tentang karakteristik data ini tentunya sangat diperlukan agar
analisa yang kita lakukan terhadap data menjadi lebih relevan dan lebih tepat.
Tujuan
1. Mahasiswa memahami konsep data primer ,sekunder, sampel , populasi.
2. Mahasiswa memahami skala pengukuran data
3. Mahasiswa dapat memberikan contoh data primer, sekunder, sampel dan
populasi
4. Mahasiswa dapat memberikan contoh data sampel berdasarkan jenis skala
pengukurannya
1.1 Populasi dan Sampel
Mengenal Data 1
8. Persoalan-persoalan yang muncul dalam berbagai bidang, hampir seratus
persen berhubungan dengan data. Data dalam bidang statistika merupakan
keterangan atau informasi mengenai suatu kejadian, biasanya dinyatakan
dengan angka. Diharapkan nantinya data dapat memberikan informasi lebih
banyak bagi yang bersangkutan. Sebelum membahas tentang data, terlebih
dahulu akan dibahas sekilas tentang statistika, populasi, dan sampel. Statistika
yaitu suatu ilmu yang mempelajari tentang data, meliputi teknik pengambilan
data, pengolahan dan penyajiannya, kemudian analisis dan kesimpulan serta
pengambilan keputusan dari kesimpulan yang diperoleh lewat analisis.
Sedangkan data itu sendiri merupakan keterangan yang menggambarkan
kondisi saat itu.
Berdasarkan sumbernya data dibedakan menjadi dua, yaitu 1) data primer dan
2) data sekunder. Data primer adalah keterangan atau informasi secara umum
yang diperoleh oleh dari penelitian peneliti sendiri. Sedangkan data sekunder
merupakan data yang diambil dari penelitian orang lain pada suatu publikasi.
Berkaitan dengan pengambilan data, terdapat dua istilah yaitu populasi dan
sampel. Populasi adalah seluruh objek yang diamati. Sedangkan sampel
adalah objek yang diamati adalah sebagian dari populasi. Diharapkan
pengambilan sampel yang dilakukan dapat mewakili populasi. Beberapa hal
yang mendasari pengambilan sampel adalah :
1. Waktu
Bila waktu untuk penelitian terbatas, maka pengambilan sampel dapat
dipilih sebagai alternatif pengambilan data.
2. Biaya
Untuk penelitian mengenai suatu komponen yang harganya mahal, bila
pengambilan populasi dilakukan, maka biaya yang dikeluarkan akan
besar. Sehingga untuk biaya yang terbatas, perlu dilakukan pengambilan
sampel.
3. Populasi tidak pasti
Salah satu contoh populasi tidak pasti adalah, bila penelitian kita tentang
orang berpenyakit flu burung, maka kita akan kesulitan menentukan
populasinya, karena tanpa pemeriksaan akan sulit ditentukan seseorang
Mengenal Data 2
9. kena flu burung atau tidak. Sehingga pengambilan sampel perlu
dilakukan yaitu pasien flu burung pada suatu rumah sakit.
4. Ketelitian
Hal ini berhubungan dengan waktu dan biaya yang terbatas. Misal biaya
dan waktu penelitian terbatas, maka jumlah tenaga yang membantu
penelitian akan menjadi pertimbangan, sehingga hasilnya pengolahannya
berpengaruh pada tingkat ketelitian.
1.2 Skala Pengukuran
Skala pengukuran merupakan bagian yang paling mendekati
pengukuran data baik secara diskret maupun kontinu. Skala ini sangat penting,
karena berkaitan dengan pemilihan teknik analisis statistika yang sangat
bergantung pada sifat data dan skala pengukuran yang digunakan. Ditinjau
berdasarkan skala pengukurannya, data dapat dibedakan menjadi beberapa
kelompok, yaitu ( dari yang terendah sampai yang tertinggi ) :
a. Skala Nominal
Data yang termasuk dalam kelompok ini memiliki ciri bahwa data tidak
memiliki tingkatan. Satu – satunya operator matematika yang berlaku
adalah persamaan dan pertidaksamaan.
Contohnya adalah data tentang jenis kelamin, agama, jenis penyakit dan
sebagainya.
b. Skala Ordinal
Sudah ada tingkatan pada data yang masuk kelompok ini, hanya saja
belum ada ketentuan jarak yang sama antar tingkatan,serta ada hubungan
lebih dari.
Contohnya adalah data tentang golongan kepegawaian, kepangkatan, nilai
huruf, peserta kontes kecantikan, jenis komputer dan sebagainya.
c. Skala Interval
Selain sudah memiliki tingkatan seperti data pada skala ordinal, data yang
masuk dalam kelompok ini juga memiliki sifat bahwa jarak antar
tingkatan adalah sama. Hal ini diperiksa melalui selisih antar tingkatan
selalu tetap Sebagai contoh data suhu yang diukur dalam Celcius, selisih
antara suhu 30 dan 29 akan sama dengan selisih suhu 10 dan 11 atau
Mengenal Data 3
10. dengan yang lainnya. Ciri lain dari data ini adalah nilai 0 belum memiliki
arti sebenarnya ( tidak ada).
Contohnya adalah suhu 0 derajat bukan berarti tidak ada suhu, tahun 0
bukan berarti tidak ada tahun.
d. Skala Rasio
Data yang memiliki skala ini memiliki tingkatan yang paling tinggi.
Semua sifat pada skala interval juga ada pada data skala rasio ini.
Tambahan sifat untuk jenis data ini adalah nilai 0 sudah memiliki arti
yang sebenarnya ( tidak ada ).
Contoh adalah data tentang berat, tinggi, harga, volume dan sebagainya.
Dengan mengetahui jenis data yang akan diolah, maka kita dapat menentukan
analisis yang tepat untuk data tersebut. Sebagai contoh data yang memiliki
skala Nominal hanya dapat disajikan dalam bentuk pie chart, bar chart dan
tidak dapat ditentukan ukuran − ukuran statistik seperti mean, standard
deviation dan sebagainya. Data yang berskala Ordinal selain dapat dianalisa
seperti nominal juga dapat dianalisa lebih lanjut tetapi sebelumnya harus
ditransformasi ke bentuk numerik. Tetapi, kadang untuk pengolahan lebih
lanjut, data berskala ordinal dan nominal dapat diolah dengan menggunakan
statistika nonparametrik (tanpa distribusi). Sedangkan data yang berskala
interval atau Rasio dapat dilakukan analisa yang lebih lengkap secara
langsung. Analisa yang dapat dilakukan pada data dengan kedua skala
terakhir ini relatif sama.
Contoh
Sebuah penelitian dilakukan untuk melihat pengaruh kenaikan BBM terhadap
tingkat pengangguran di kota Bandung. Berikut adalah data yang bisa
digunakan dalam penelitian ini :
Data yang diperlukan antara lain data tentang tingkat pengangguran sebelum
kenaikan BBM dan setelah kenaikan BBM
a. Data Sekunder
i. Data tingkat pengangguran sebelum kenaikan BBM (misalkan data
dari BPS atau hasil penelitian lainnya)
ii. Data tingkat pengangguran setelah kenaikan BBM (misalkan data
dari BPS hasil penelitian lainnya)
b. Data Primer
Mengenal Data 4
11. Yaitu data tingkat pengangguran setelah kenaikan BBM yang dicari
sendiri melalui pendataan secara langsung
c. Data Sampel
Data tingkat pengangguran (sebelum dan kenaikan BBM) yang diambil
dari sebagian penduduk kota Bandung
d. Data Populasi
Data tingkat pengangguran (sebelum dan kenaikan BBM) yang diambil
dari seluruh penduduk kota Bandung
e. Skala Pengukuran
Data yang dikumpulkan dalam penelitian ini antara lain meliputi data
tentang usia(rasio), agama (nominal), status perkawinan (nominal), Jenis
Kelamin (nominal) dan status Bekerja (nominal).
Latihan
1. Suatu penelitian dilakukan untuk melihat hubungan antara jumlah sks
dengan nilai IPK yang diperoleh mahasiswa Poltek Telkom. Tentukan
data yang diperlukan untuk penelitian ini beserta jenis datanya (kerjakan
seperti contoh)
2. Suatu penelitian dilakukan untuk melihat hubungan antara frekuensi
penggunaan laboratorium dengan biaya perawatan laboratorium tersebut .
Tentukan data yang diperlukan untuk penelitian ini beserta jenis datanya
(kerjakan seperti contoh)
Mengenal Data 5
12. 2 STATISTIKA DESKRIPTIF
Overview
Suatu data mentah menjadi kurang berguna bila hanya ditampilkan seperti
aslinya. Sebagian orang bahkan sangat kesulitan ketika melihat data dalam
bentuk numerik. Salah satu teknik dalam Statistika untuk menampilkan atau
menyajikan suatu data agar lebih mudah untuk dipahami adalah Statistika
Deskriptif. Dalam Statistika Deskriptif, secara umum data akan disajikan
dalam bentuk tabel maupun dalam bentuk grafik tergantung dari jenis
datanya. Walaupun tampilan data lebih sederhana, tetapi setiap orang dapat
memiliki persepsi yang berbeda – beda berkaitan dengan data tersebut
Tujuan
1. Mahasiswa mengetahui konsep dan jenis - jenis ukuran pemusatan,
ukuran penyebaran dan ukuran letak
2. Mahasiswa dapat menentukan ukuran pemusatan, ukuran penyebaran dan
ukuran letak suatu data
3. Mahasiswa dapat menyajikan data dalam bentuk histogram, boxplot dan
diagram dahan dan daun
Statistika Deskriptif 1
13. 2.1 Ukuran Pemusatan
Terdapat beberapa ukuran pemusatan dalam statistika deskriptif antara lain
mean, median, dan modus.
− Mean adalah rata−rata dari data dan dinotasikan dengan x atau µ,
di mana x menyatakan rata−rata sampel dan µ menyatakan
rata−rata populasi. Secara umum mean memiliki rumusan sebagai
berikut :
x=
∑ xi , n banyaknya sampel
n
µ=
∑ xi
, N banyaknya populasi
N
− Median adalah nilai yang membagi suatu gugus data yang telah terurut
menjadi 2 bagian yang sama. Median memiliki sifat bahwa di bawah
nilai median terdapat 50% data. Cara menentukan median sebagai
berikut : Misal X1, X2, …, Xn adalah data yang sudah terurut dari kecil
ke besar, maka untuk n ganjil median = X n +1 dan untuk n genap
2
1
median = X n + X n +1 .
2 2 2
− Modus yaitu nilai yang paling sering muncul dalam suatu gugus data
Dalam penggunaannya, mean lebih sering digunakan dari pada ukuran
pemusatan lainnya karena keakuratannya dalam menentukan nilai tengah
suatu gugus data, walaupun ada beberapa kasus yang membuat nilai mean
menjadi kurang tangguh, misalkan ada nilai yang dianggap ekstrim.
2.2 Ukuran Penyebaran
Beberapa ukuran penyebaran antara lain :
Statistika Deskriptif 2
14. − Range atau jangkauan yaitu menyatakan selisih antara nilai
maksimum dengan nilai minimum.
− Variansi adalah nilai tengah dari kuadrat penyimpangan antara xi
terhadap x . Variansi merupakan ukuran penyebaran yang sering
digunakan dalam statistika inferensia. Variansi dinotasikan S 2 untuk
sampel dan σ2 untuk populasi. Variansi memiliki rumusan sebagai
berikut :
S2 =
∑ ( xi − x ) 2 , di mana n banyaknya sampel
n −1
σ2 =
∑ ( xi − µ ) 2 , di mana N banyaknya populasi
N
− Simpangan baku merupakan akar dari variansi.
2.3 Ukuran Letak
Kuartil menyatakan nilai−nilai yang membagi gugus data menjadi empat
bagian yang sama besar. Q1 menyatakan kuartil 1 yang memiliki sifat bahwa
¼ data terletak di bawah Q 1. Q2 sama dengan median. Sedangkan Q 3 memiliki
sifat bahwa ¾ data terletak di bawah Q3. Untuk ukuran letak yang lainnya
adalh desil, persentil dll.
2.4 Distribusi Frekuensi
Distribusi frekuensi yaitu penyajian data dalam bentuk tabel. Di mana pada
tabel tersebut menampilkan ciri−ciri penting sejumlah data yang diperoleh
dengan cara mengelompokkan data menjadi beberapa kelas, kemudian dari
masing−masing kelas dihitung banyaknya pengamatan yang masuk.
Langkah-langkah membuat tabel frekuensi :
1. Menentukan banyaknya kelas dengan kaidah Sturges yaitu N = 2 k −1 ,
dimana k =1 +3.3 log N . Banyaknya kelas sebaiknya antara 5
sampai 15.
2. Menentukan interval kelas (KI)
Statistika Deskriptif 3
15. range
KI =
k
KI sebaiknya kelipatan 5.
3. Untuk komposisi kelas, perhatikan bahwa kelas tidak tumpang tindih.
4. Bila tabel distribusi frekuensi, nantinya digunakan untuk membuat
histogram atau poligon, maka komposisinya diubah ke bentuk batas kelas
(batas bawah kikurangi setengah dan batas atas di tambah setengah)
Bila data disajikan sebagai data kelompok (tabel frekuensi), maka ukuran
pemusatan, penyebaran dan letak dapat dihitung dengan menggunakan
rumusan sebagai berikut :
- Ukuran Pemusatan
n
∑ f i xi
i =1
Mean : x = n
∑ fi
i =1
xi = titik tengan kelas, f i = frekuensi kelas
1 f − f
Median : ~ = Bb + 2
x
t (sm ) p
fm
Bb = batas bawah kelas median f t = frekuensi total
f m = frekuensi kelas median p = interval kelas
f sm = frekuensi kumulatif sebelum median
a
Modus : x = Bb +
ˆ p
a +b
a = f m − f am b = f m − f bm
f m = frekuensi kelas modus
f am = frekuensi sebelum kelas modus
f bm = frekuensi sesudah kelas modus
Statistika Deskriptif 4
16. - Ukuran Penyebaran
n n
2
n ∑( f i c i ) 2 − ∑ f i c i
i=
1 i=1
S 2 = p2
n ( n −1)
- Ukuran Letak
Kuarti ( Qi , Q2 , Q3 )
( 4i f t − f sp )
Qi = B b + p , i = 1, 2, 3
fp
f p = frekuensi pada kelas kuartil ke-i
f sp = frekuensi sebelum kuarti
Pada tabel distribusi frekuensi, dapat juga diberikan coding untuk
mempermudah perhitungan statistik. Coding dilakukan dengan cara membagi
kelas menjadi dua yaitu kelas yang ditengah-tengah diberi kode nol,
sedangkan dua kelas di bawah dan di atasnya diberi kode negatif dan positif.
2.5 Penyajian dalam Bentuk Grafik
− Histogram dibuat berdasarkan tabel distribusi frekuensi. Bila datanya
memiliki skala interval atau rasio, maka histogram dapat digunakan untuk
menyajikan data.
− Box plot merupakan bentuk penyajian data yang hanya menggunakan
beberapa statistik yang disebut ringkasan lima angka yaitu nilai
minimum, Q1, median, Q3, nilai maksimum. Pada box plot dapat juga
ditentukan adanya pencilan atau tidak. Pencilan yaitu suatu nilai pada
Statistika Deskriptif 5
17. data yang apabila dibandingkan dengan nilai data yang lain tidak
konsisten. Pencilan dibedakan menjadi pencilan jauh (dalam) dan
pencilan jauh sekali (luar). Untuk menentukan pencilan digunakan
rumusan sebagai berikut :
Pagar dalam (p)
p1 = Q1 − 1.5 ( Q3 − Q1 ) p 2 = Q3 + 1.5 ( Q3 − Q1 )
Pagar luar (P)
P1 = Q1 − 2 ( Q3 − Q1 ) P2 = Q3 + 2 ( Q3 − Q1 )
Pencilan dikatagorikan sebagai pencilan jauh bila letaknya data di antara
pagar dalam dan pagar luar. Sedangkan pencilan jauh sekali, bila data di
luar pagar luar.
− Diagram dahan daun adalah salah satu teknik penyajian data yang
menggunakan data asli secara langsung. Pada dasarnya dalam diagram
dahan daun, penyajian data terbagi atas dua kolom yaitu dahan dan daun,
dimana dahan berisi data dengan satuan yang lebih besar dari pada kolom
daun.
Dari ketiga bentuk penyajian data di atas, dapat dilihat bentuk distribusi data,
apakah simetri, menjulur ke kiri atau ke kanan. Sedangkan untuk memeriksa
x −~x
kemencengan digunakan metode Pearson yaitu Φ = . Jika Φ < 0 ,
S
data menceng ke kiri dan Φ > 0 , data menceng ke kanan.
Contoh 1
Data berikut adalah data penjualan voucher telepon di lima kota provinsi Jawa
barat :
Bulan Bandung Sukabumi Garut Tasik Bogor
1 42 8 32 56 51
2 45 14 33 60 58
3 51 25 41 58 57
4 61 43 52 62 67
5 69 54 62 63 81
6 76 64 72 68 88
7 78 71 77 69 94
Statistika Deskriptif 6
18. 8 78 69 75 71 93
9 72 58 68 69 85
10 62 47 58 67 74
11 51 29 47 61 61
12 44 16 35 58 55
Hasil yang diperoleh (dari pengolahan dengan minitab 15) adalah sebagai
berikut :
Statistika Deskriptif 7
21. Dari keempat kota (Bandung, Sukabumi, garut, dan tasik) rata-rata penjualan
voucher telepon tiap bulannya adalah kota tasik yaitu 63.5 dengan variansi
terkecil 26,091. Untuk kota Bandung dan Garut penjualan voucher tiap
bulannya hampir merata, kota sukabumi penjualan terbanyak pada bulan-
bulan terakhir, sedangkan untuk kota tasik penjualan terbanyak pada bulan-
bulan pertama pada tahun tersebut.
Contoh 2
Data berikut adalah banyaknya turis asing yang masuk ke kota-kota di negara
bagian Amerika tiap bulannya. Bila informasi yang diperoleh seperti tampilan
di bawah tabel, analisis apa yang dapat anda berikan?
Statistika Deskriptif 10
22. Month Atlanta Bismarck New York San Diego Phoenix
1 42 8 32 56 51
2 45 14 33 60 58
3 51 25 41 58 57
4 61 43 52 62 67
5 69 54 62 63 81
6 76 64 72 68 88
7 78 71 77 69 94
8 78 69 75 71 93
9 72 58 68 69 85
10 62 47 58 67 74
11 51 29 47 61 61
12 44 16 35 58 55
Informasi yang diperoleh :
− Ukuran pemusatan, penyebaran, dan letak
N : 60
Mean : 58.42
Median : 61
Modus : 58
Range : 86
Variansi : 338.383
Simpangan baku : 18.395
Minimum :8
Maksimum : 94
Quarti 1, 2, 3: 48, 61, 70.5
- histogram dan boxplotnya sebagai berikut :
Statistika Deskriptif 11
24. Latihan
1. Untuk menentukan kelayakan air sungai pada suatu daerah yang
dikonsumsi oleh penduduk setempat, suatu suspensi diteteskan pada
sampel air sungai tersebut dengan konsentrasi tertentu. Berikut adalah
data yang diperoleh 50 penelitian dari beberapa bagian suatu sungai yang
diberi suspensi dengan konsentrasi yang berbeda-beda :
55. 60. 37. 91. 65.8
8 9 0 3
42. 33. 60. 76. 69.0
3 8 6 0
45. 39. 35. 56. 44.6
9 1 5 0
71. 61. 61. 47. 74.5
7 2 5 2
83. 40. 31. 36. 62.3
2 0 7 7
47. 94. 56. 30. 68.2
3 6 3 0
75. 71. 65. 52. 58.2
3 4 2 6
48. 61. 78. 39. 65.0
0 8 8 8
60. 77. 59. 49. 69.3
7 1 1 5
69. 64. 27. 87. 66.3
8 9 1 1
a. Buatlah diagram dahan daun
b. Buat tabel distribusi frekuensi dan histogramnya
Peluang, Peluang Bersyarat, Kaidah Bayes 1
25. c. Hitung ukuran pemusatan, penyebaran, dan letak, kemudian buat box
plotnya
d. Kesimpulan apa yang bisa dinyatakan dari data tersebut, berdasarkan
a, b, c.
2. Diketahui tabel distribusi frekuensi di bawah yang menyatakan jarak
(dalam ribuan mil) yang ditempuh oleh 191 bis dari suatu travel dan
bis gagal mencapai tujuan.
Batas kelas Frekuensi
0.5 – 20.5 6
20.5 – 40.5 11
40.5 – 60.5 16
60.5 – 80.5 25
80.5 – 100.5 34
100.5 – 120.5 46
120.5 – 140.5 33
140.5 – 160.5 16
160.5 – 180.5 2
180.5 – 200.5 2
a. Buat histogramnya
b. Hitung mean ,simpangan baku Q1 , Q2 dan Q3 nya, beri penjelasan !
c. Buat Boxplot, periksa apakah terdapat pencilan/outlier ?
d. Estimasi proporsi dari semua bis yang beroperasi paling sedikit
100.000 mil dan gagal
Peluang, Peluang Bersyarat, Kaidah Bayes 2
26. e. Berapakah proporsi dari semua bis yang beroperasi antara 50.000
sampai 125.000 mil dan gagal
3 PELUANG, PELUANG BERSYARAT, DAN
KAIDAH BAYES
Overview
Dalam kehidupan nyata, sering kali kita dihadapkan dengan situasi yang tidak
pasti dan dipaksa untuk mengambil keputusan yang paling tepat. Dalam
Statistika, masalah yang berkaitan dengan ketidakpastian dapat dihubungkan
dengan masalah probabilitas (peluang). Kejadian yang pasti terjadi memiliki
peluang = 1, kejadian yang mustahil memiliki peluang = 0 sedangkan
kejadian tidak pasti memiliki peluang antara 0 – 1. Dengan memahami konsep
peluang ini, diharapkan kita dapat mengambil keputusan yang tepat
berdasarkan nilai peluang yang terbesar.
Tujuan
1. Mahasiswa memahami konsep ruang sampel, kejadian dan peluang.
Peluang, Peluang Bersyarat, Kaidah Bayes 3
27. 2. Mahasiswa dapat menghitung peluang suatu kejadian
3. Mahasiswa dapat peluang kejadian A bila kejadian B terjadi dengan
menggunakan konsep peluang bersyarat dan teorema Bayes
3.1 Ruang Sampel dan Kejadian
Ruang sample dari suatu eksperimen merupakan suatu himpunan semua
kemungkinan hasil suatu eksperimen. Ruang sample dinotasikan dengan Ω .
Sedangkan kejadian adalah himpunan bagian dari ruang sample. Kejadian
dikelompokkan menjadi dua yaitu kejadian sederhana (kejadian yang terdiri
dari satu hasil eksperimen) dan kejadian majemuk (kejadian yang terdiri lebih
dari satu hasil eksperimen).
Contoh
Misal suatu eksperimen dilakukan dengan mengamati tiga buah mobil yang
akan keluar dari pintu keluar parkir suatu supermarket, apakah belok ke kiri
(L) atau ke kanan (R). Ruang sample untuk eksperimen tersebut adalah
Ω={ LLL, RLL, LRL, LLR , LRR , RLR , RRL, RRR} . Berikut
adalah beberapa contoh kejadian :
Kejadian Sederhana
- A = { LLL } = adalah kejadian ketiga mobil keluar pintu parkir belok ke
kiri
- B = { RRR } = adalah kejadian ketiga mobil keluar pintu parkir belok ke
kanan
Kejadian Majemuk
- C = { RLL, LRL, LLR } = adalah kejadian tepat satu mobil yang keluar
pintu parkir belok ke kanan
- D = { LLL , RLL, LRL, LLR } = adalah kejadian paling banyak satu
mobil yang keluar pintu parkir belok ke
kanan
Peluang, Peluang Bersyarat, Kaidah Bayes 4
28. 3.2 Peluang
Menurut Athanasios papoulis, untuk mempelajari teori peluang terdapat
beberapa pendekatan yaitu :
1. Definisi Aksioma
Misal Ω adalah ruang sampel yang berhingga dan A suatu kejadian dalam
Ω . Definisi dari pendekatan aksiomatik adalah : untuk setiap kejadian A,
peluang dari A ditulis sebagai P ( A) yang merupakan bilangan real dan
memenuhi aksioma :
1. P ( A) ≥ 0
2. P ( Ω =1)
3. P ( A B ) = P ( A) + P ( B ) , A B = φ
∞ ∞
Bila ruang sampel tak hingga, maka P Ai = ∑ P ( Ai )
i=1 i=1
Sedangkan sifat-sifat peluang adalah :
1. P ( A ) =1 −P ( A)
2. P ( φ) = 0
3. P ( A) ≤ P ( B ), A ⊂B
4. P ( A) ≤1
5. P ( A B ) = P ( A) + P ( B ) − P ( A B )
6. Bila A1 , A2 , , An kejadian dalam Ω , maka
( )
n n n
P Ai = ∑ P ( Ai ) − ∑ P Ai A j −
i =1 i =1 i≠ j
− ( − 1) n −1 P ( A1 A2 An )
7. Bila A1 , A2 , , An kejadian saling lepas, maka
n n
P Ai = ∑ P ( Ai ),
Ai A j = φ i ≠ j
i =1 i =1
P ( A B ) ≤ P ( A) + P ( B )
Peluang, Peluang Bersyarat, Kaidah Bayes 5
29. 2. Objektif
− frekuensi relatif
Andaikan percobaan acak diulang sebanyak n kali. Bila kejadian A terjadi
n kali, maka peluang kejadian A terjadi adalah P ( A) yang
didefiniskan sebagai berikut
n ( A)
P ( A) = lim n ( A) adalah frekuensi relatif kejadian
n→∞ n
A
Sifat-sifat :
n ( A)
1. 0≤ ≤1
n
2. Bila A dan B kejadian yang saling lepas, maka
n ( A B ) n ( A) n ( B )
= +
n n n
− kejadian equally likely
Misal Ω adalah ruang sampel berhingga dengan n kejadian sederhana,
{ } ( )
yaitu Ω = S1 , S 2 , , S n . Andaikan P S i = Pi , maka
1. 0 ≤ Pi ≤ 1
n
2. ∑Pi = 1
i =1
P ( A) = ∑ P ( S i ) = ∑ Pi
3. Bila A =i∈ S i , maka
I Si ∈A i∈I
3.3 Peluang Bersyarat
Peluang bersyarat dari kejadian A bila diberikan atau diketahui kejadian B,
yang dinyatakan dengan notasi P ( A B ) didefinisikan sebagai berikut :
P ( A B)
(
- P A B = ) P ( B)
, P ( B) > 0
Peluang, Peluang Bersyarat, Kaidah Bayes 6
30. P ( A B)
(
- P B A = ) P ( A)
, P ( A) > 0
Dari definisi tersebut diatas, dapat diperoleh bahwa :
P ( A B ) = P ( B A ) P ( A) = P ( A B ) P ( B )
Berikut adalah beberapa aksioma peluang bersyarat :
1. P ( A B ) ≥0
2. P (Ω B ) =1
(
3. P A1 A2 B = P A1 ) ( B ) + P ( A2 B ) , A1 A2 ≠ 0
Contoh 1
Data di bawah ini menyatakan banyaknya resistor berikut toleransinya :
Toleransi
Resistor (ohm) Jumlah
5% 10%
22 10 14 24
47 28 16 44
100 24 8 32
Jumlah 62 38 100
- Berikut adalah definisi dari beberapa kejadian
A adalah kejadian terambilnya resistor 47 ohm
B adalah kejadian terambilnya resistor dengan toleransi 5%
C adalah kejadian terambilnya resistor 100 ohm
- Hitung :
a. P ( A B ) b. P ( A C ) c. P ( B C )
d. P ( A B ) e. P ( A C )
- Jawab :
28
a. P ( A B ) = = 0.28
100
b. P ( A B ) = 0
Peluang, Peluang Bersyarat, Kaidah Bayes 7
31. 24
c. P ( A B ) = = 0.24
100
d. P ( A B ) =
28
62
e. P ( A C ) =0
Contoh 2
Untuk memenuhi kebutuhan jumlah tenaga kerja, tiap tahun PT Telkom
melaksanakan proses rekruitasi karyawan. Dari 100% pendaftar, yang lulus
proses adalah 80%. Sebelum terjun ke lapangan, para karyawan baru
diwajibkan tes pendidikan di divlat, ternyata yang lulus hanya 90%. Karena
untuk memenuhi kebutuhan jumlah karyawan yang besar, PT Telkom
memanggil lagi para pendaftar yang tidak lulus untuk tes pendidikan di divlat,
dan yang lulus hanya 50%. Berapa prosenkah para pendaftar yang lulus
divlat ?
Jawab
Berikut adalah diagram pohon dari pernyataan di atas :
Peluang, Peluang Bersyarat, Kaidah Bayes 8
32. LD
0.9
LR
0.8 0.1
TLD
Rekruitasi
LD
0.2 0.5
TL
R 0.5
TLD
Keterangan
LR : Lulus proses rekruitasi
TL : Tidak Lulus proses rekruitasi
LD : Lulus Divlat
TLD : Tidak Lulus Divlat
Misal prosentase pendaftar yang lulus divlat = DP, maka
P ( DP ) = P ( LD LR ) P ( LR ) +P ( LD TLR ) P ( TLR )
=( 0.9 ) 0.8 +( 0.5) 0.2 =0.82
Jadi pendaftar yang lulus divlat 82%
3.4 Kaidah Bayes
Sebelum membahas kaidah bayes, terlebih dahulu dipelajari mengenai definisi
partisi dari ruang sample. Partisi dari suatu ruang sample yaitu suatu
Peluang, Peluang Bersyarat, Kaidah Bayes 9
33. himpunan dari kejadian-kejadianyang saling lepas (mutually exclusive)
n
F1 , F2 , F3 , ..., Fn sedemikian sehingga Ω= Fi .
i=1
Theorema : Bila F1 , F2 , F3 , ..., Fn adalah partisi dari Ω, maka
n
untuk suatu kejadian E dalam Ω , berlaku P ( E ) = ∑ P ( E Fi ) .
i=1
Theorema tersebut dapat digambarkan pada diagram di bawah ini
F1 F8
F4
E F9
F7
F3
F2
F6
F5
Theorema Bayes
Andaikan kejadian-kejadian F1 , F2 , F3 , ..., Fn merupakan partisi
dari ruang sample Ω dan E adalah suatu kejadian, maka untuk suatu k
P ( Fk ) P ( E Fk )
P ( Fk E ) = n
∑ P ( Fi ) P ( E Fi )
berlaku
i =1
Contoh 1
Peluang, Peluang Bersyarat, Kaidah Bayes 10
34. Sebuah pabrik penghasil video cassette recorder, membeli microchip khusus
LS-24 dari tiga supplier yang berbeda, yaitu Hall electronics (HE), Schuller
Sales (SS), dan Cranford Components (CC). Untuk memenuhi kebutuhan
microchip tersebut, 30% dibeli dari HE, 20% dari SS, dan sisanya dari CC.
Pabrik tersebut memiliki banyak pengalaman dalam hal microchip dari tiga
supplier tersebut. Dari microchip pasokan tiga supplier tersebut 3% chip dari
HE cacat, 5% dari SS cacat, 4% dari CC cacat. Pada saat chip LS-24 tiba, para
kuli langsung mengangkut ke gudang, tanpa memeriksa asal supplier chip
tersebut. Pada saat proses perangkaian, seorang karyawan memilih chip untuk
dipasang pada sebuah VCR, dan menemukan chip tersebut cacat. Berapa
peluang chip tersebut dipasok oleh SS?
Jawab
Misalkan berikut adalah kejadian – kejadian yang terjadi
HE : Terpilih supplier Hall electronics
SS : Terpilih supplier Schuller Sales
CC : Terpilih supplier Cranford Components
Pernyataan tersebut dapat didiagramkan sebagai berikut :
Peluang, Peluang Bersyarat, Kaidah Bayes 11
35. cacat
0.03
HE
0.3
bagus
cacat
Supplier 0.05
Chip SS
0.2
bagus
cacat
0.04
CC
0.5
bagus
Peluang bahwa chip yang cacat tersebut dipasok oleh SS adalah
( ) (
P ( SS ) P C SS )
P SS C =
( ) (
P ( SS ) P C SS + P ( HE ) P C HE + P ( CC ) P C C ) (
=
( 0.2 ) 0.05 = 0.303
( 0.2 ) 0.05 + ( 0.3) 0.03 + ( 0.5) 0.04
Contoh 2
Suatu pabrik memproduksi 3 buah produk A,B dan C yang masing – masing
berjumlah 1000,2000 dan 4000 buah. Peluang terambil akan cacat dari produk
A =2%, Peluang terambil akan cacat dari produk B =3% dan Peluang terambil
akan cacat dari produk C =5%.
Bila diambil sebuah produk secara acak
Peluang, Peluang Bersyarat, Kaidah Bayes 12
36. a. Berapa peluang produk tsb cacat ?
b. Bila ternyata produk tsb cacat, berapa peluang produk tsb adalah
produk B ?
Jawab
Misalkan
A : Terambil produk A
B : Terambil produk B
C : Terambil produk C
F : Terambil produk Fail / Cacat
P(A) = 1/7 P(F|A) = 0,02
P(B) = 2/7 P(F|B) = 0,03
P(C) = 4/7 P(F|C) = 0,05
a. P(F) ?
P ( F ) = P ( F | A) P ( A) + P ( F | B ) P ( B ) + P ( F | C ) P ( C )
1 2 4
= 0,02 + 0,03 + 0,05 = 0,04
7 7 7
b. P(B|F) ?
P( F | B ) P( B ) 0,03. 2 / 7
P( B | F ) = = = 0,214
P( F ) 0,04
Peluang, Peluang Bersyarat, Kaidah Bayes 13
37. Latihan
1. Suatu PT yang bergerak dalam bidang konsultan computer saat ini
memiliki 3 buah proyek. Misal Ai menyatakan proyek ke-i, i = 1, 2, 3
( ) ( )
dan diketahui P A1 = 0.22 , P A2 = 0.25 , P A3 = 0.28 ,( )
P ( A1 A2 ) = 0.11 , P ( A1 A3 ) = 0.05 , P ( A2 A3 ) = 0.07
, P ( A1 A2 A3 ) = 0.01 . Hitung peluang :
c c
a. A1 A2 b. A1 A2
2. Suatu pabrik mempunyai empat buah mesin, yang menghasil barang yang
sama. Mesin I dan II masing-masing menghasilkan 20% dari seluruh
produk, sedangkan mesin III dan IV masing-masing menghasilkan 30%
dari seluruh produk. Dari barang yang diproduksi oleh 4 mesin tersebut,
diketahui cacat dengan rincian, 6% dari mesin I, 5% dari mesin II, 8%
mesin III, dan 8% dari mesin IV. Pada saat pemeriksaan produk, diambil
secara acak suatu barang.
a. Berapa peluang barang tersebut cacat ?
b. Bila barang tersebut cacat, berapa peluang bahwa barang tersebut hasil
produksi mesin II ?
3. Salah satu tujuan diadakannya audit adalah untuk menemukan terjadinya
beberapa kesalahan materi, kesalahan prosedur, maupun kesalahan-
kesalahan dalam pencatatan informasi. Sebuah Kantor Akuntan Publik
yang disewa oleh sebuah perusahaan X yang selama ini telah aktif
melakukan pembukuan terhadap penjualan grosir maupun eceran.
Selanjutnya diketahui bahwa 70% pelanggan merupakan pelanggan
eceran dan diketahui kesalahan pembukuan penjualan eceran 10%,
sedangkan kesalahan pembukuan penjualan grosir 20%.
Apabila seorang auditor menemukan kesalahan, berapa peluang bahwa
pembukuan tersebut berasal dari penjualan eceran ?
Peluang, Peluang Bersyarat, Kaidah Bayes 14
38. 4 PEUBAH ACAK, DISTRIBUSI PELUANG
DISKRET, DAN DISTRIBUSI PELUANG
KONTINU
Overview
Konsep yang mendasari distribusi peluang adalah peubah acak. Peubah acak
biasanya didefinisikan berdasarkan tujuan penelitian yang akan dilakukan.
Berdasarkan jenis bilangannya, peubah acak dapat memiliki nilai yang diskret
dan juga kontinu. Distribusi peluang diskret diturunkan berdasarkan peubah
acak diskret, demikian juga distribusi peluang kontinu juga diturunkan
berdasarkan peubah acak kontinu
Tujuan
1. Mahasiswa mengetahui beberapa jenis distribusi khusus diskret dan
kontinu
2. Mahasiswa dapat menghitung peluang kejadian dari beberapa distribusi
khusus diskret dan kontinu
3. Mahasiswa dapat meyelesaikan berbagai persoalan dan fenomena nyata
yang terkait dengan distribusi peluang diskret dan kontinu.
Peluang, Peluang Bersyarat, Kaidah Bayes 15
39. 4.1 Peubah Acak
Pada suatu percobaan statistik, terdapat satu atau lebih karakteristik yang
dapat diamati atau diukur. Tetapi kadang−kadang seseorang hanya tertarik
untuk mengamati satu macam karakteristik saja. Biasanya setelah proses
pengambilan titik sampel, dilanjutkan dengan pengelompokan yang berkaitan
dengan nilai numerik . Misalkan percobaan pelemparan uang logam sebanyak
3 kali, dengan ruang sampel ( Ω sebagai berikut, dimana A menyatakan
)
angka dan G menyatakan gambar :
S = { AAA, AAG, AGA, GAA, AGG, GAG, GGA, GGG}
Selanjutnya bila hanya munculnya angka saja yang diamati, maka nilai
numeriknya adalah 0, 1, 2, 3, dimana 0 menyatakan angka tidak pernah
muncul, 1 menyatakan angka satu kali, 2 menyatakan angka dua kali, dan 3
menyatakan angka tiga kali. Untuk mengkaitkan ruang sampel dengan nilai
numeriknya yang berupa bilangan real diperlukan suatu fungsi yang
dinamakan peubah acak. Peubah acak dinotasikan dengan huruf kapital,
misal X, Y atau lainnya. Sedangkan nilai−nilainya dinyatakan dengan huruf
kecil, misal x , y atau lainnya.
Bila peubah acak tersebut didefinisikan pada ruang sampel diskret, maka
peubah acaknya disebut peubah acak diskret, dan bila didefinisikan pada
ruang sampel kontinu disebut peubah acak kontinu.
4.2 Distribusi Peluang Diskret
Distribusi peluang diskret yaitu sebuah tabel yang mencantumkan semua
kemungkinan nilai dari suatu peubah acak beserta peluangnya, dimana fungsi
peluang dari peubah acak diskret X didefinisikan sebagai
P ( X = x) = p ( x) .
Sedangkan fungsi distribusi kumulatif dari peubah acak diskret X yaitu F(x)
didefinisikan sebagai berikut
F ( x ) = P ( X ≤ x ) = ∑p ( y ) , ∀ x
y: y ≤x
Peluang, Peluang Bersyarat, Kaidah Bayes 16
40. Mean dan Variansi
Mean X didefinisikan dengan rumus
Mean = E ( x ) = ∑x p ( x )
Variansi = Var ( x) = E ( x 2 ) −( E ( x) ) 2 dimana
E ( x ) = ∑x
2 2
p( x)
Mean (kX) = K Mean(X)
Var (kX ) = k Var ( X )
4.3 Distribusi Peluang Kontinu
Misalkan X adalah peubah acak kontinu, maka distribusi peluang dari X dari
suatu fungsi peluang f ( x ) di antara x = a dan x = b , didefinisikan
sebagai berikut :
b
P (a ≤ X ≤ b) = ∫ f ( x) dx
a
yang menyatakan luas daerah dibawah kurva f ( x) di antara x=a dan
x =b .
Sedangan fungsi distribusi kumulatif dari peubah acak kontinu X, yaitu
F ( x ) didefinisikan sebagai berikut :
x
F ( x) = P ( X ≤ x) = ∫ f ( y ) dy
−∞
Mean dan Variansi
Mean X didefinisikan dengan rumus
Mean = E ( x ) = ∫ x f ( x ) dx
Variansi = Var ( x) = E ( x 2 ) −( E ( x) ) 2 dimana
E ( x 2 ) = ∫ x 2 f ( x ) dx
Peluang, Peluang Bersyarat, Kaidah Bayes 17
41. Contoh 1
Suatu pengamatan mengenai nomor telepon yang di dial oleh mesin penerima
secara acak untuk suatu area tertentu, dedefinisikan peubah acak X sebagai
berikut:
1 , bila nomor yang dipilih terdaftar
X =
0 , bila nomor yang dipilih tidak terdaftar
Bila peluang sebuah nomor terdaftar = 0,3, maka dapat dibuat tabel distribusi
peluang diskret dari pengamatan diatas yaitu
x P(x)
0 0,7
1 0,3
Mean(X) = E ( x) = ∑x p ( x) = 0. 0,7 +1. 0,3 = 0,3
E ( x 2 ) = ∑x 2 p ( x ) = 0. 0,7 +1. 0,3 = 0,3
Var ( x) = E ( x 2 ) −( E ( x ) ) 2 = 0,3 − (0,3) 2 = 0,21
Contoh 2
Misal diberikan tabel distribusi peluang diskret sebagai berikut
X 1 2 3 4 Jumlah
p ( x) 0. 0. 0. 0. 1
4 3 2 1
x.p(x) 0, 0, 0, 0, 2
4 6 6 4
X2. 0, 1, 1, 1, 5
p(x) 4 2 8 6
Dengan perhitungan manual , peluang kumulatifnya adalah:
F(1) = p(1) = 0.4
Peluang, Peluang Bersyarat, Kaidah Bayes 18
42. F(2) = P(X ≤ 2) = p(1) + p(2) = 0.4 + 0.3 = 0.7
F(3) = P(X ≤ 3) = p(1) + p(2) + p(3) = 0.4 + 0.3 + 0.2 = 0.9
F(4) = P(X ≤ 4) = p(1) + p(2) + p(3) + p(4) = 0.4 + 0.3 +0.2 + 0.1=1
Mean(X) = E ( x ) = ∑ p ( x ) =
x 2
Var ( x) = E ( x 2 ) −( E ( x ) ) 2 = 5 −( 2) 2 =1
Contoh 3
Misalkan saya berangkat ke kantor naik bus dan setiap 5 menit bus tiba di
halte. Karena saya berangkat ke kantor tiap hari tidak selalu pada waktu yang
sama, maka saya sampai di halte juga pada waktu yang tidak sama. Misalkan
peubah acak X adalah waktu (kontinu) saya menunggu bus berikutnya dan X
dalam interval [0, 5]. Fungsi padat peluang X didefinisikan sebagai berikut
1 , 0 ≤ x ≤ 5
f ( x) = 5
0 , lainnya
Grafik dari f ( x) adalah
f(x)
0,2
x
Akan dihitung :
a. peluang saya akan menunggu antara 1 sampai 3 menit
b. peluang saya menunggu paling lama 5 menit
c. Rata – rata waktu saya menunggu
d. Peluang kumulatif
Peluang, Peluang Bersyarat, Kaidah Bayes 19
43. Sehingga :
3
3
a. P (1 ≤ X ≤ 3) = ∫ 1 dx =
5
x
5 1
= 2
5
1
5 5
b. P ( X ≤ 5) = ∫ 1
5
dx = ∫ 1 dx = 1
5
−∞ 0
1 1 2 5 25
c. E ( x ) = ∫ x f ( x ) dx = ∫ x dx = x = = 2,5
5 10 0 10
menit
d. Sedangkan CDF dari f ( x ) dapat ditabelkan sebagai berikut :
X 0 1 2 3 4 5
CDF 0 0. 0. 0. 0. 1
2 4 6 8
Latihan
1. Buatlah suatu percobaan statistik dan tentukan peubah acaknya baik yang
diskret maupun kontinu
2. Suatu bisnis layanan surat lewat komputer mempunyai 6 saluran telepon.
Misalkan X menyatakan banyaknya saluran telepon yang digunakan pada
suatu waktu tertentu. Diberikan tabel berikut yang berisi nilai x dan p(x) :
X 0 1 2 3 4 5 6
P(x) 0.1 0.1 0.2 0.2 0.2 0.0 0.04
0 5 0 5 0 6
Hitung peluang berikut ini :
a. paling banyak 3 saluran yang digunakan
b. paling sedikit tiga saluran yang digunakan
c. antara 2 dan 5 saluran yang digunakan
3. Misalkan fungsi padat peluang dari magnitude X dari suatu dynamic load
sebuah jembatan (dalam newtons) diberikan sebagai berikut :
Peluang, Peluang Bersyarat, Kaidah Bayes 20
44. 1 + 3 x , 0 ≤ x ≤ 2
f ( x) = 8 8
0 , lainnya
− Cari rumus F(x) dari f(x) tersebut
− Hitung P( 1 ≤ X ≤ 1.5) dengan menggunakan rumus F(x)
− Hitung P( X > 1)
Peluang, Peluang Bersyarat, Kaidah Bayes 21
45. 5 DISTRIBUSI PELUANG KHUSUS DISKRET
DAN KONTINU
Overview
Dalam kehidupan nyata, terdapat beberapa kejadian yang memiliki bentuk
sebaran tertentu. Bentuk sebaran data tersebut dapat didekati dengan beberapa
jenis distribusi peluang khusus yang terdapat dalam statistika. Dalam suatu
penelitian, adanya pengetahuan tentang bentuk/jenis distribusi suatu data
akan sangat membantu peneliti dalam membuat estimasi – estimasi terkait
dengan data yang diteliti.
Tujuan
1. Mahasiswa mengetahui beberapa jenis distribusi khusus diskret dan
kontinu
2. Mahasiswa dapat menghitung peluang kejadian dari beberapa distribusi
khusus diskret dan kontinu
3. Mahasiswa dapat meyelesaikan berbagai persoalan dan fenomena nyata
yang terkait dengan distribusi peluang diskret dan kontinu.
Distribusi Peluang Khusus 1
46. 5.1 Distribusi Peluang Diskret
5.1.1 Distribusi Bernoulli dan Binomial
Suatu percobaan dikatakan sebagai percobaan binomial, bila memenuhi
asumsi−asumsi berikut :
1. Percobaan dapat diulang sebanyak n kali
2. Ulangan−ulangan identik dan setiap ulangan dapat menghasilkan
satu dari dua kemungkinan outcome yang sama, biasanya
dinotasikan dengan S (sukses) dan F (gagal).
3. Masing−masing ulangan saling bebas
4. Peluang sukses dari ulangan konstan , misalkan peluang sukses p
Bila percobaan tersebut hanya terdiri dari 1 ulangan, maka percobaan tersebut
dinamakan percobaan bernoulli.
Fungsi peluang dari peubah acak X yang berdistribusi binomial sebagai
berikut
n x
p (1 − p ) n −x , x = 0,1, 2, ..., n
b( x ; n, p ) = x
0 , lainnya
Distribusi kumulatif dari peubah acak X yang berdistribusi binomial (X ∼ B
(n, p) ) didefinisikan sebagai berikut
x
P ( X ≤ x ) = B ( x ; n, p ) = ∑ ( y ; n, p ) , x = 0,1, 2, ...., n
b
y=0
Untuk menghitung peluang maupun distribusi kumulatif dari peubah acak X
selain dengan perhitungan di atas dapat menggunakan tabel binomial.
Sedangkan mean dan variansi dari peubah acak X yang berdistribusi binomial
didefiniskan sebagai berikut :
E(X) = n p
Var(X) = n p (1 − p)
Distribusi Peluang Khusus 2
47. Pada distribusi binomial, bila n dan p diubah-ubah sedemikian rupa, maka
akan berpengaruh pada bentuk distribusinya. Dengan menggunakan program
matlab berikut diperoleh gambar distribusi di bawah :
Gambar 5.1. Distribusi binomial n = 10 dan p = 0.5
Distribusi Peluang Khusus 3
48. Gambar 5.2 Distribusi binomial n = 10 dan p = 0.3
Gambar 5.3 Distribusi binomial n = 10 dan p = 0.8
Distribusi Peluang Khusus 4
49. Gambar 5.4 Distribusi binomial n = 15 dan p = 0.5
Dari keempat gambar tersebut dapat dikatakan bahwa :
- untuk n yang sama, p = 0.5, distribusi binomial mendekati distribusi normal.
- untuk n yang sama, p diperkecil, distribusinya menjulur ke kanan
- untuk n yang sama, p diperbesar, distribusinya menjulur ke kiri
- bila n diperbesar, p = 0.5, distribusinya menjulur ke kiri
5.1.2 Distribusi Poisson
Ciri−ciri dari percobaan poisson adalah :
1. Banyaknya hasil percobaan yang terjadi pada selang waktu atau suatu
daerah tertentu tidak tergantung pada banyaknya hasil percobaan yang
terjadi pada selang waktu atau daerah lain yang terpisah
2. Peluang terjadinya satu hasil percobaan selama suatu selang waktu yang
singkat sekali atau dalam suatu daerah yang kecil sebanding dengan
panjang selang waktu tersebut atau besarnya daerah tersebut
3. Peluang bahwa lebih dari satu hasil percobaan akan terjadi dalam selang
waktu yang singkat atau dalam derah yang kecil tersebut dapat diabaikan
Suatu peubah acak X yang berdistribusi poisson, fungsi peluangnya
didefinisikan sebagai berikut :
e −λλ x
P( x ; λ =
) , x =0,1, 2, ....
x!
dimana λ > 0
Distribusi kumulatif dari peubah acak X yang berdistribusi poisson
(X∼P(n,λ)) didefinisikan sebagai berikut
x
P ( X ≤ x ) = ∑ ( y ; λ) , x = 0,1, 2, ...., n
P
y=0
Untuk menghitung peluang maupun distribusi kumulatif dari peubah acak X
selain dengan perhitungan di atas dapat menggunakan tabel poisson.
Sedangkan mean dan variansi dari peubah acak X yang berdistribusi poisson
dengan parameter λ, mempunyai nilai yang sama yaitu λ.
Distribusi Peluang Khusus 5
50. Pada distribusi poisson, bila nilai λ diubah-ubah sedemikian rupa, maka akan
berpengaruh pada bentuk distribusinya. Dengan menggunakan program
matlab berikut diperoleh gambar distribusi di bawah :
Gambar 5.5 Distribusi poisson dengan λ = 5
Gambar 5.6 Distribusi poisson dengan λ = 2
Distribusi Peluang Khusus 6
51. Gambar 5.7 Distribusi poisson dengan λ = 7
Gambar 5.8 Distribusi poisson dengan λ = 8
Distribusi Peluang Khusus 7
52. Gambar 5.9 Distribusi poisson dengan λ = 10
Dari kelima gambar tersebut, dapat dikatakan bahwa untuk x = 0…15 bila
nilai λ lebih kecil dari 7, distribusinya menjulur ke kanan. Sedangkan untuk
nilai λ lebih besar dari 7, distribusinya menjulur ke kiri. Sedangkan untuk
nilai λ = 7 dan 8, distribusinya mendekati normal.
Contoh 1
Misalkan suatu percobaan yang memenuhi percobaan binomial dengan n = 4,
dan peluang sukses p. Dari percobaan tersebut dapat dihitung peluang dari
semua outcome yang mungkin dan hasilnya sebagai berikut :
Outcome x Peluang Outcome x Peluang
SSSS 4 p4 FSSS 3 p3 (1 − p)
SSSF 3 p (1 − p)
3
FSSF 2 p2 (1− p)2
SSFS 3 p3 (1 − p) FSFS 2 p2 (1− p)2
SSFF 2 p2 (1− p)2 FSFF 1 p (1 − p)3
SFSS 3 p3 (1 − p) FFSS 2 p2 (1− p)2
SFSF 2 p2 (1− p)2 FFSF 1 p (1 − p)3
SFFS 2 p2 (1− p)2 FFFS 1 p (1 − p)3
SFFF 1 p (1 − p)3 FFFF 0 (1 − p)4
Distribusi Peluang Khusus 8
53. Sehingga dapat dihitung :
b(3 ; 4, p) = P(FSSS) + P(SFSS) + P(SSFS) + P(SSSF)
= 4 p3 (1 − p)
Contoh 2
Misalkan 20% dari semua copy suatu textbook yang diuji kekuatan sampulnya
rusak. Dan peubah acak X menyatakan banyaknya textbook yang sampulnya
rusak dari 15 copy yang diambil secara acak.
Hitung :
a. Peluang paling banyak 8 copy textbook yang sampulnya rusak
b. Peluang ada 8 copy textbook yang sampulnya rusak
Jawab
Perhitungan manual (dapat menggunakan tabel) :
8
a. P ( X ≤ 8) = ∑ ( y ; 15, 0.2) = B (8 ; 15, 0.2) = 0.999
b
y =0
b. P ( X = 8) = P ( X ≤ 8) − P ( X ≤ 7)
=B (8 ; 15, 0.2) −B (7 ; 15, 0.2)
= 0.999 − 0.996 = 0.003
Contoh 3
Seorang penerbit buku−buku non teknik menyatakan bahwa buku−bukunya
bebas dari kesalahan typograpical, sehingga peluang kesalahan dari sebuah
halaman buku paling sedikit satu kesalahan adalah 0.005 dan kesalahan tiap
halaman saling bebas.
a. Berapa peluang bahwa satu dari novel−novel yang jumlah halamannya
400 akan tepat satu halaman yang salah
b. Berapa peluang paling banyak tiga halaman yang salah
Jawab :
Bila S menyatakan bahawa sebuah halaman buku paling sedikit satu
kesalahan dan F menyatakan tidak ada kesalahan pada halaman buku tersebut.
Misalkan X menyatakan paling sedikit satu kesalahan pada tiap halaman dan
Distribusi Peluang Khusus 9
54. berdistribusi binomial dengan n = 400, p = 0.005. Karena n nya besar dan p
kecil mendekati 0, maka bisa dilakukan pendekatan dengan menggunakan
distribusi poisson, dengan λ = n p = 2, sehingga :
e −2 21
a. P ( X =1) = = 0.271
1!
3
e −2 2 x
b. P ( X ≤ 3) = ∑ x!
x =0
= p (0) + p (1) + p ( 2) + p (3)
= 0.135 + 0.271 + 0.271 + 0.18 = 0.857
5.2 Distribusi Peluang Kontinu
5.2.1 Distribusi Normal
Distribusi peluang kontinu yang paling penting adalah distribusi normal.
Grafik dari suatu distribusi normal disebut kurva normal, bentuknya seperti
lonceng pada gambar dibawah ini. Suatu peubah acak X yang distribusinya
berbentuk lonceng, dinamakan peubah acak normal. Persamaan matematika
dari distribusi peluang peubah acak normal kontinu bergantung pada dua
parameter yaitu µ (rataan) dan σ (simpangan baku). Dengan demikian
fungsi densitas X dapat dinyatakan oleh :
−1 ( )
x −µ 2
1
f ( x) = e 2 σ – ∞ < X < ∞.
2π σ
Distribusi Peluang Khusus 10
55. x
µ
Sifat-sifat distribusi normal :
∞
1. ∫ f ( x ) dx =1
−∞
2. f ( x ) ≥0 , ∀x
3. x lim∞ f ( x) = 0 dan x lim∞ f ( x) = 0
→− →+
4. f ( x + µ ) = f ( − ( x − µ ) )
5. Nilai maksimum dari f terjadi pada x − µ
6. Titik belok dari f terjadi pada x = µ ±σ
Kurva setiap distribusi kontinu dibuat sedemikian rupa sehingga luas
daerah dibawah kurva diantara dua koordinat x = x 1 dan x = x 2 sama
dengan peluang peubah acak X antara x = x1 dan x = x 2 . Hal tersebut
dapat digambarkan sebagai berikut :
x1 µ x2 x
x2
1
x2
−1 ( )
x −µ 2
P ( x1 < X < x 2 ) = ∫ n( x ; µ, σ ) dx = ∫e
2 σ
dx
x1 2π σ x1
= Luas daerah yang diarsir
Distribusi Peluang Khusus 11
56. Untuk mengatasi kesulitan dalam menghitung integral fungsi densitas maka
dibuat table luas kurva normal sehingga akan memudahkan dalam
penggunaannya.
5.2.2 Distribusi Normal Baku
Perhitungan luas dibawah kurva normal antara dua ordinat sembarang sangat
bergantung pada nilai µ dan σ . Dalam hal ini, tak mungkin dibuat tabel
yang berlainan untuk setiap nilai µ dan σ . Oleh karena itu, kita perlu
mentransformasikan setiap peubah acak yang bermacam-macam nilai µ dan
σ nya , menjadi peubah acak normal dengan µ = 0 dan σ = 1. Transformasi
tersebut berbentuk :
X −µ
Z=
σ
dimana X merupakan peubah acak awal sebelum ditransformasi yang
mempunyai rataan = µ dan variansi = σ . Sementara itu, Z merupakan
peubah acak setelah ditransformasi.
Distribusi normal dengan mean 0 dan variansi 1, dinamakan distribusi normal
baku.
Distribusi Peluang Khusus 12
57. σ =1
z
z1 z2 0
Contoh 1
a. P (Z ≤ 1.25) = Φ (1.25) = 0.8944
( pada tabel dilihat baris 1.2 kolom 0.05)
b. P ( - 0.38 ≤ Z ≤ 1.25 ) = P ( Z ≤ 1.25 ) – P ( Z ≤ - 0.38 )
= Φ (1.25 ) - Φ (- 0.38 )
= 0.8944 – 0.3520
= 0.5424
Contoh 2
Misal peubah acak X menyatakan ketidaksesuaian voltase yang
dispesifikasikan pada suatu diode yang dipilih secara acak. X berdistribusi
normal dengan µ = 40 volt dan σ = 1.5 volt. Berapa peluang bahwa :
a. Ketidakcocokan voltase antara 39 dan 42 volt
b. Ketidakcocokan voltase minimal 45 volt
Jawab
a. Ketidakcocokan voltase antara 39 dan 42 volt
39 − 40 X − 40 42 − 40
P ( 39 ≤ X ≤ 42 ) = P ≤ ≤
1.5 1.5 1.5
= P ( - 0.67 ≤ Z ≤ 1.33 )
= Φ (1.33 ) - Φ (- 0.67 )
= 0.9082 – 0.2514
= 0.6568
Distribusi Peluang Khusus 13
58. b. Ketidakcocokan voltase minimal 45 volt
X − 40 45 − 40
P ( X ≥ 45) = P ≥
1.5 1.5
= P ( Z ≥ 3.33 )
= 1 - Φ (3.33)
= 1 – 0.9996
= 0.0004
5.2.3 Distribusi Uniform
Bila X merupakan variabel random uniform kontinu yang terdefinisi pada
selang (A,B) maka fungsi peluang dari X adalah
1
f ( x ; A, B) = A≤ x≤ B
B− A
0 lainnya
Distribusi kumulatif dari peubah acak X yang berdistribusi uniform
didefinisikan sebagai berikut
0 x< A
x− A
P ( X ≤ x) = A≤ x< B
B− A
1 x≥B
Sedangkan mean dan variansi dari peubah acak X yang berdistribusi uniform
dapat dihitung dan bernilai:
1
E ( X ) = ( B + A)
2
1
Var ( X ) = ( B − A) 2
12
Distribusi Peluang Khusus 14
59. 5.2.4 Distribusi Eksponensial
Bila X merupakan variabel random eksponensial dengan parameter λ yang
terdefinisi pada selang (0,∞) maka fungsi peluang dari X adalah
f ( x ; A, B ) = λ e −λx x≥0
0 lainnya
Distribusi eksponensial paling sering digunakan sebagai model distribusi
waktu dalam fasilitas pelayanan customers( waktu tunggu). Pengertian
customers disini tidak harus berupa orang tetapi bisa berupa panggilan telepon
misalnya. Dalam penggunaannya dalam model ini, distribusi eksponensial
sangat berkaitan dengan distribusi Poisson yang telah dibicarakan dalam bab
sebelumnya.
Bila X menyatakan jumlah kejadian yang terjadi dalam selang waktu t, maka
X akan berdistribusi Poisson. Jika α adalah mean X yaitu rata – rata jumlah
kejadian per unit waktu, maka distribusi dari waktu antar 2 kejadian adalah
eksponensial dengan parameter α.
Penggunaan disribusi eksponensial yang lain adalah sebagai model waktu
hidup dari suatu komponen. Biasanya dalam model ini λ disebut sebagai
tingkat kegagalan.
Mean dan variansi dari distribusi eksponensial dengan parameter λ berturut –
1 1
turut , . Pada distribusi eksponensial, bila nilai λ diubah-ubah
λ λ2
sedemikian rupa, maka akan berpengaruh pada bentuk distribusinya. Dengan
menggunakan program matlab berikut diperoleh gambar distribusi di bawah :
Distribusi Peluang Khusus 15
60. Gambar 13. Distribusi eksponensial dengan λ = 2
Gambar 14. Distribusi eksponensial dengan λ = 5
Distribusi Peluang Khusus 16
61. Gambar 15. Distribusi eksponensial dengan λ = 0.5
Dari ketiga gambar tersebut, dapat dikatakan bahwa untuk x = 0…10 bila nilai
λ semakin besar, kurvanya semakin landai.
Contoh 1
Dalam sebuah survai dilakukan pengamatan terhadap waktu kedatangan
angkutan kota yang melewati sebuah jalan tertentu. Dari pengamatan selama 2
jam didapatkan hasil sebagai berikut :
TABEL 1
No Jam No Jam No Jam No Jam No Jam
1 06.01.0 11 06.17.5 21 06.33.4 31 06.47.1 41 07.07.07
3 7 3 8
2 06.02.5 12 06.20.5 22 06.33.5 32 06.49.5 42 07.09.37
6 7 0 5
3 06.03.1 13 06.24.3 23 06.34.1 33 06.50.0 43 07.09.49
4 2 4 4
4 06.04.1 14 06.27.4 24 06.36.3 34 06.50.2 44 07.09.51
0 4 2 2
5 06.06.5 15 06.28.1 25 06.37.5 35 06.56.5 45 07.14.30
7 5 3 1
6 06.08.4 16 06.28.2 26 06.38.4 36 06.57.5 46 07.14.43
6 7 3 9
Distribusi Peluang Khusus 17
62. 7 06.10.4 17 06.28.3 27 06.39.1 37 07.00.5 47 07.16.45
5 3 1 9
8 06.12.0 18 06.28.3 28 06.44.2 38 07.01.1 48 07.17.04
3 8 5 1
9 06.16.0 19 06.29.4 29 06.44.4 39 07.04.5 49 07.17.23
3 5 7 2
10 06.17.1 20 06.31.1 30 06.46.0 40 07.06.1 50 07.17.26
6 9 0 9
Dari data tersebut, kita dapat menghitung waktu tunggu / antar kedatangan
angkutan kota antara pengamatan i dan i+1. Diperoleh 49 nilai yang dihitung
dalam detik
TABEL 2
No Lama No lama No lama No lama No lama
1 113 11 180 21 7 31 157 41 150
2 18 12 215 22 24 32 9 42 12
3 56 13 192 23 138 33 18 43 2
4 121 14 31 24 81 34 389 44 279
5 110 15 12 25 290 35 68 45 13
6 119 16 6 26 28 36 180 46 123
7 18 17 5 27 314 37 12 47 19
8 240 18 67 28 22 38 221 48 9
9 73 19 94 29 73 39 87 49 3
10 41 20 144 30 78 40 48 50
Bila dihitung rata − ratanya nilainya adalah 96 detik. Ini menunjukkan bahwa
rata − rata kedatangan angkutan kota adalah 96 detik. Menurut teori
sebelumnya, waktu antar kedatangan ini akan berdistribusi eksponensial
1
dengan λ = .
96
Dari data pada tabel terakhir dapat dihitung antara lain nilai peluangnya.
Misalkan dihitung waktu kedatangan kurang 80 detik. Dalam hal ini rumus
yang digunakan adalah
n ( x ≤ 80) 27
P(X ≤ 80) = = = 0,55
n (S) 49
Distribusi Peluang Khusus 18
63. Dalam hal ini n ( x ≤ 80) menyatakan banyaknya titik sampel yang nilainya
kurang atau sama dengan 80, sedangkan n(S) menyatakan banyak titik
sampel.
Contoh 2
Misal X peubah acak yang menyatakan waktu respon dari suatu komputer
yang on-line (waktu antara user input dan tampil output-nya). Peubah acak X
berdistribusi eksponensial dengan mean 5 detik. Berapa peluang waktu respon
paling lama 10 detik dan waktu responya antara 5 sampai 10 detik.
Jawab
Bila µ = 1/λ = 5 , maka λ = 0.2
P ( X ≤ 10 ) = F (10) = 1 – e- (0.2) (10) = 1 – 0.135 = 0.865
P ( 5 ≤ X ≤ 10 ) = F (10) – F(5) = 0.233
Latihan
1. Bila 90% dari siswa yang baru mulai belajar pemrograman komputer
akan gagal pada waktu menjalankan program pertamanya, Berapa
peluang bahwa dari 15 siswa yang dipilih secara acak :
a. Paling sedikit 12 siswa gagal menjalankan program pertamanya
b. Antara 10 dan 13 siswa akan gagal menjalankan program
pertamanya
c. Paling banyak 2 siswa berhasil menjalankan program pertamanya
2. Misal X menyatakan daya regang suatu komponen logam tertentu yang
berdistribusi normal dengan µ = 10000 kg/ cm2 dan σ = 100 kg/cm2.
Semua pengukuran dicatat sampai 50 kg/cm2 terdekat. Hitung peluang
bahwa daya regang minimal 10150 kg/cm2 dan daya regang antara 9800
kg/cm2 sampai 10200 kg/cm2
3. Diketahui bahwa mesin penerima panggilan dari suatu kantor konsultan
per menitnya rata−rata menerima 6 panggilan. Berapa peluang bahwa :
a. paling sedikit satu panggilan permenit
b. dalam 4 menit paling sedikit 15 panggilan
Distribusi Peluang Khusus 19
64. 4. Dalam satu minggu suatu komputer pada suatu rental akan mengalami
kelambatan merupakan peubah acak yang berditribusi poisson dengan λ =
0.3. Berapa peluang bahwa
a. suatu komputer akan beroperasi tanpa mengalami kelambatan dalam
waktu 2 minggu
b. paling sedikit lima komputer akan mengalami kelambatan dalam satu
minggu
5. Misal X peubah acak yang menyatakan waktu yang diperlukan petugas
perpustakaan untuk mengecek buku yang baru dipinjam dengan yang
kembali. Nilai harapan untuk waktu pengecekan sekitar 20 detik. Hitung
P ( X ≤ 30 ) dan P ( 20 ≤ X ≤ 30 )
6. Peubah acak X menyatakan waktu antar kedatangan pesawat pada sebuah
bandara, dengan fungsi padat peluang sebagai berikut :
0.5 e −0.5 x , x > 0
f ( x) =
0
, x lainnya
Berapa peluang menunggu paling sedikit 1 menit
7. Diketahui umur dinamo listrik yang diproduksi perusahaan tertentu
menyebar normal dengan mean 6.4 dan simpangan baku 1.1 tahun.
a. Jika sebuah dinamo diberi garansi 5 tahun, berapa peluang bahwa
perusahaan akan memperbaiki dinamo tersebut sebelum habis masa
garansinya ?
b. Jika perusahaan menetapkan bahwa hanya sampai 1% produksinya
diperbaiki sebelum habis masa garansinya, berapa tahun masa
garansi yang diperlukan ?
8. Suatu sistem elektronika mengandung komponen dengan daya tahan T
yang menyebar eksponensial dengan parameter λ = 0.2 . Bila 5
komponen dipasang pada sistem yang berbeda, berapa peluang bahwa
paling sedikit 2 komponen masih berfungsi setelah akhir tahun ke-8 ?
9. Jika dalam setiap satu jam rata-rata terdapat 3 pesawat yang lepas landas.
Tentukan peluang bahwa dalam periode satu jam tertentu jumlah pesawat
yang lepas landas adalah :
a. tepat tiga pesawat
Distribusi Peluang Khusus 20
65. b. kurang dari 4 pesawat
c. paling kurang 3 pesawat
d. antara 2 dan 6 pesawat
Distribusi Peluang Khusus 21
66. 6 DISTRIBUSI SAMPLING DAN DALIL LIMIT
PUSAT
Overview
Dalam sebuah penelitian, keberadaan data sampel sangat diperlukan. Seorang
peneliti biasanya jarang menggunakan data populasi sebagai dasar
pengolahannya karena penggunaan data populasi akan membuat biaya dan
waktu menjadi tidak efisien. Bervariasinya bentuk distribusi data sampel
terkadang juga dapat menyulitkan seorang peneliti untuk membuat
kesimpulan tentang suatu populasi. Keberadaan dalil limit pusat cukup
membantu kita dapat membuat estimasi peluang terkait dengan data sampel
yang kita miliki.
Tujuan
1. Mahasiswa memahami konsep dalil limit pusat
2. Mahasiswa dapat menggunakan dalil limit pusat untuk membuat estimasi
peluang dari suatu data sampel dari berbagai macam populasi
Distribusi Sampling, Dalil Limit Pusat 1
67. 6.1 Distribusi Sampling
Dalam suatu penelitian, dengan berbagai pertimbangan, pengambilan sampel
dilakukan dari pada pengambilan populasi, di mana sampel harus mewakili
populasi. Pengambilan sampel dari populasi yang sama dilakukan secara acak,
sehingga kombinasi yang muncul banyak sekali. Hal tersebut akan
menyebabkan nilai statistik yang bervariasi dari sampel yang satu dengan
yang lain. Sehingga suatu statistik dapat dipandang sebagai suatu peubah acak
yang hanya bergantung pada sampel yang diamati dan mempunyai distribusi
peluang yang disebut distribusi sampling. Misal dari suatu populasi diambil
sampel berukuran n yang diulang sebanyak k kali. Kemudian dihitung
rataannya, maka nilai tengah akan mempunyai distribusi yang dinamakan
distribusi sampling dari nilai tengah. Sebaliknya, jika variansi yang diamati,
maka distribusinya disebut distribusi sampling dari variansi. Tentunya
distribusi sampling tersebut bergantung pada ukuran populasi, ukuran sampel,
dan metode pengambilan sampel yaitu pengambilan sampel dengan
pengembalian atau tanpa pengembalian. Keacakan dari sampel akan sangat
menguntungkan dalam bentuk parameter dan bentuk distribusi. Adapun
distribusi sampling dalam bentuk parameter adalah sebagai berikut :
Misal X berdistribusi sabarang, dengan nilai tengah µ dan variansi σ2, maka :
a. Rata-rata dari rata-rata sampel sama dengan mean populasi
∑ Xi 1
E [ x] = E = nµ = µ
n n
b. Variansi dari rata-rata sampel sama dengan variansi dari populasi dibagi
ukuran sampel
∑X i
n 2 Var ( ∑ X i ) = n 2
1 1
Var ( x ) = Var
= ∑ Var ( X i )
n
1 σ2
= nσ 2 =
n2 n
Distribusi Sampling, Dalil Limit Pusat 2
68. Nilai Var ( x ) diatas sebenarnya adalah nilai untuk pengambilan sampel
dengan pengembalian, hanya saja bila ukuran N relative besar terhadap n,
maka Var ( x ) untuk pengambilan nilai sampel tanpa pengembalian akan
mendekati nilai tersebut.
6.2 Dalil Limit Pusat
Banyak sekali uji dalam statistik yang mengasumsikan data berdistribusi
Normal. Bila syarat ini tidak dipenuhi tentunya akan berakibat pada analsis
serta kesimpulan yang diperoleh. Dalam penelitian kita sering menggunakan
data sampel untuk menyimpulkan sesuatu. Menurut teorema limit Pusat serta
teorema sampling bahwa bila suatu sampel berukuran n diambil dari suatu
populasi yang besar atau takhingga dengan mean = µ dan Simpangan Baku =
σ maka rataan sampel ( x ) akan berdistribusi Normal dengan mean = µ dan
σ
Simpangan Baku = . Dengan eksperimen yang sederhana akan
n
ditunjukkan bahwa teorema ini berlaku. Esperimen ini mungkin belum
sempurna karena jumlah sampel yang dibangkitkan bukan merupakan
keseluruhan kombinasi yang mungkin.
Berikut adalah contoh pengacakan dari populasi distribusi Normal dengan
mean = 0 dan simpangan baku = 1 dengan jumlah sampel = 80.
Distribusi Sampling, Dalil Limit Pusat 3
69. dist Xbar dg ukuran sampel 5
Frequency 15
10
5
0
-1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8
C1
Distribusi Sampling, Dalil Limit Pusat 4
70. dist Xbar dg ukuran sampel 15 populasi normal
20
Frequency
10
0
-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5
C2
dist Xbar dg ukuran sampel 30 populasi normal
15
Frequency
10
5
0
-0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3
C3
Variable N Mean Median Tr Mean StDev SE Mean
C1 80 -0.0662 -0.0462 -0.0615 0.4162 0.0465
C2 80 0.0237 0.0136 0.0269 0.2213 0.0247
C3 80 -0.0188 -0.0000 -0.0190 0.1874 0.0210
P-Value (Anderson-Darling)
C1 0.587
C2 0.897
C3 0.554
Distribusi Sampling, Dalil Limit Pusat 5
71. Dari P-value diatas dapat disimpulkan bahwa semua data x berdistribusi
Normal untuk ukuran sampel 5,15 dan 30 berdasarkan hasil uji Anderson-
Darling. Memang kalau dilihat ukuran sampel= 15 adalah yang paling kuat
indikatornya tetapi ini tidak bisa dijadikan pegangan untuk menyimpulkan
bahwa ukuran sampel = 15 adalah yang terbaik. Ada beberapa alasan antara
lain karena jumlah sampel yang dibangkitkan adalah tidak maksimum. Bila
ditinjau dari nilai mean dan StDev nya maka dapat dilihat untuk semakin
besar sampel yang diambil ternyata akan mendekati mean populasinya (=0).
Sedangkan simpangan bakunya akan semakin kecil untuk ukuran sampel yang
makin besar sesuai teorema limit pusat. Dari hal ini dapat disimpulkan dengan
pengambilan sampel yang besar maka taksiran untuk mean populasi akan
semakin tepat.
Bila hasil eksperimen diatas ditabelkan, maka akan diperoleh hasil
sebagai berikut
mean Simpangan Limit Pusat
baku
Populasi 0 1 mean Sampangan
baku
Sampel - 0.4162 0 0.447
n=5 0.0662
Sampel 0.0237 0.2213 0 0.258
n=15
Sampel - 0.1874 0 0,183
n=30 0.0188
Bila dilihat perbandingan antara hasil eksperimen dengan hasil yang
berdasarkan teorema limit pusat maka dapat disimpulkan nilai –nilai mean
dan simpangan baku pada sampel ukuran 5,15 dan 30 cukup dekat dengan
hasil yang berdasarkan teorema limit pusat.
Distribusi Sampling, Dalil Limit Pusat 6
72. dist Xbar dg ukuran sampel 5 populasi Poisson lamda 2
20
Frequency
10
0
0.5 1.5 2.5 3.5 4.5
C4
dist Xbar dg ukuran sampel 15 populasi Poisson lamda 2
20
Frequency
10
0
1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 3.0
C5
Distribusi Sampling, Dalil Limit Pusat 7
73. dist Xbar dg ukuran sampel 30 populasi Poisson lamda 2
15
10
Frequency
5
0
1.5 2.0 2.5
C6
Variable N Mean Median Tr Mean StDev SE Mean
C4 80 1.9175 2.0000 1.9139 0.5769 0.0645
C5 80 2.0267 2.0000 2.0130 0.3575 0.0400
C6 80 1.9833 1.9667 1.9838 0.2489 0.0278
P-Value
C4 0.008
C5 0.090
C6 0.331
Dari P-value diatas dapat disimpulkan bahwa data x berdistribusi Normal
untuk ukuran sampel 15 dan 30 saja berdasarkan hasil uji Anderson-Darling.
Indikator yang paling kuat ditunjukkan oleh untuk ukuran sampel = 30. Bila
ditinjau dari nilai mean dan StDev nya maka kesimpulan yang hampir sama
dapat diambil yaitu untuk semakin besar sampel yang diambil ternyata akan
mendekati mean populasinya (λ=2). Sedangkan simpangan bakunya akan
semakin kecil untuk ukuran sampel yang makin besar sesuai teorema limit
pusat. Dari hal ini dapat disimpulkan dengan pengambilan sampel yang besar
maka taksiran untuk mean populasi akan semakin tepat.
Dari hasil pengujian dari beberapa macam populasi yang berbeda kemudian
para ahli sepakat bahwa ukuran sampel = 30 adalah cukup baik sehingga
distribusi rataan sampel menjadi Normal .
Distribusi Sampling, Dalil Limit Pusat 8
74. Contoh 1
Nilai kesalahan baku dari nilai tengah penarikan sampel berukuran 36 sebuah
populasi besar adalah 2. Berapa ukuran sampel tersebut harus dinaikkan agar
kesalahan bakunya = 1,2 ?
Jawab
Diketahui sampel dengan n=36 dan σ x = 2
Bila diinginkan σ x = 1,2 n = ?
Misalkan σ 2 : variansi populasi maka
σ2 σ2
σx2 = 4= σ 2 = 144 (nilai σ 2 ini tetap)
n 36
Bila diinginkan σ x = 1,2 maka
σ2 144
σx2 = 1,44 = n = 100
n n
Contoh 2
Sebuah pesawat terbang membawa 4 penumpang. Beban aman untuk 4 orang
penumpang adalah 360 kg. Andaikan seorang penumpang dipilih secara acak
dari distribusi normal dengan mean 75 kg dan simpangan baku 16
Jawab
Diketahui X berdistribusi normal dengan µ x = 75 dan σ x = 16
Misal Y=4X maka µ y = 300 dan σy = 4 x 16 =32
Peluang (terjadi overload) = P (4x > 360)
360 − 300 60
P Z > = P Z > = P ( Z > 1,875 ) = 0,032
32 32
Latihan
1. Bila diketahui data populasi X = {1,2,2,3,3,4} . Lakukan eksperimen
sederhana untuk menunjukkan dalil limit pusat yaitu dengan mengambil
sampel berukuran 3 tanpa pengulangan sebanyak maksimum kombinasi
yang mungkin !
2. Bila semua kemungkinan sampel berukuran 16 ditarik dari suatu populasi
normal dengan nilai tengah 50 dan simpangan baku 5. hitung peluang
Distribusi Sampling, Dalil Limit Pusat 9
75. nilai tengah sampel akan berada dalam selang µ x −1.9σ x sampai
µx − 0.4σ x ?
3. Sebuah perusahaan baterai mengatakan rata – rata umur baterai mereka
30 jam. Bila 16 unit sampel diambil secara acak dan didapatkan
simpangan baku sampel = 5 jam, tentukan nilai rata – rata sampel
terendah yang diijinkan bila perusahaan menetapkan batas µ ± 3 σ ?
4. Rata - rata banyaknya panggilan telepon / jam suatu perusahaan dalam 2
tahun terakhir = 4. Bila dicatat banyaknya telp dalam 2 hari dlm 2 thn
terakhir tsb, hitung bahwa peluang bahwa rata – rata banyak nya telp/jam
>= 5 ?
5. Masa pakai suatu komponen elektronik (dalam tahun) dinyatakan dalam
X merupakan suatu peubah acak yang mengikuti distribusi eksponensial
dengan pdf
1 −x
f ( x) = 5 e ;x> 0
5
0 ; x lainnya
a. Bila 25 buah komponen secara acak, X menyatakan rata-rata masa
pakai 25 komponen tersebut, hitung P (3 < X < 6)
b. Apabila 5 komponen dipasang secara acak pada suatu sistem, hitung
peluang sedikitnya 2 komponen masih berfungsi setelah 8 tahun
pemakaian
Distribusi Sampling, Dalil Limit Pusat 10
76. KESIMPULAN
Dari uraian di atas tampak bahwa uji hipotesis statistika melalui
distribusi probabilitas F Fisher-Snedecor dapat dilakukan pada ujung
bawah. Namun ada masalah di sejumlah buku statistika.
Tabel fungsi distribusi pada distribusi probabilitas F Fisher-
Snedecor di dalam lampiran buku statistika hanya mencantumkan nilai
ujung atas dengan membatasi taraf signifikansi pada = 0,05 dan =
0,01. Karena itu, diperlukan teknik manupulasi tertentu agar uji ujung
bawah dapat dilaksanakan dengan menggunakan tabel dengan nilai
ujung atas.
Kita dapat saja memiliki tabel fungsi distribusi pada distribusi
probabilitas F Fisher-Snedecor yang mencantumkan nilai kritis untuk
ujung atas dan ujung bawah. Dalam hal ini, pengujian pada ujung
bawah dapat dilakukan langsung dengan melihat ke tabel itu.
Sehubungan dengan itu, tidak ada alasan bagi kita untuk terus
meragukan kesahihan pengujian hipotesis statistika pada ujung bawah
distribusi probabilias F Fisher-Snedecor. Di dalam berbagai buku
statistika, pengujian demikian dinyatakan sahih.
Karena itu kita perlu mencari tabel fungsi distribusi F Fisher-
Snedecor yang agak lengkap yakni yang memiliki nilai ujung atas dan
ujung bawah sehingga kita tidak bergantung kepada tabel pada
lampiran sejumlah buku statisika yang tidak memiliki nilai untuk ujung
bawah.
Distribusi Sampling, Dalil Limit Pusat 11
77. REFERENSI
Cryer, Jonathan D. and Robert B. Miller. Statistics for Business: Data
Analysis and Modeling. Second edition. Belmont, CA: Duxbury Press,
1994.
Freund, John E. Modern Elementary Statistics. Fifth edition. New Delhi:
Prentice-Hall of India Private Limited, 1979
Glass, Gene V. and Julian C. Stanley. Statistical Methods in Education and
Psychology. Englewood Cliffs, NJ: Prentice-Hall, Inc., 1970.
Hinkle, Dennis E., William Wiersma, and Stephen J. Jurs. Applied Statistics
for the Behavioral Sciences. Chicago: Rand McNally College
Publishing Company, 1979.
Keeping, E.S. Introduction to Statistical Inference. New York: Van Nostrand
Reinhold Company, 1962.
Kennedy, John B. and Adam M. Neville. Basic Statistical Methods for
Engineers and Scientists. Second edition. New York: Harper and Row,
Publishers, 1976.
Kenny, J.F. and E.S. Keeping. Mathematics of Statistics. Part One. Third
edition. New Delhi: Affiliated East-West Press Pvt. Ltd., 1974.
Mendenhall, William. Introduction to Probability and Statistics. Third edition.
Belmont, CA: Duxbury Press, 1971.
Miller, Irwin and John E. Freund. Probability and Statistics for Engineers.
Second edition. New Delhi: Prentice-Hall of India Private Limited,
1977.
Winer, B.J. Statistical Principles in Experimental Design. Second edition.
Tokyo: McGraw-Hill Kogakusha, Ltd., 1971.
Distribusi Sampling, Dalil Limit Pusat 12
78. REFERENSI
Cryer, Jonathan D. and Robert B. Miller. Statistics for Business: Data
Analysis and Modeling. Second edition. Belmont, CA: Duxbury Press,
1994.
Freund, John E. Modern Elementary Statistics. Fifth edition. New Delhi:
Prentice-Hall of India Private Limited, 1979
Glass, Gene V. and Julian C. Stanley. Statistical Methods in Education and
Psychology. Englewood Cliffs, NJ: Prentice-Hall, Inc., 1970.
Hinkle, Dennis E., William Wiersma, and Stephen J. Jurs. Applied Statistics
for the Behavioral Sciences. Chicago: Rand McNally College
Publishing Company, 1979.
Keeping, E.S. Introduction to Statistical Inference. New York: Van Nostrand
Reinhold Company, 1962.
Kennedy, John B. and Adam M. Neville. Basic Statistical Methods for
Engineers and Scientists. Second edition. New York: Harper and Row,
Publishers, 1976.
Kenny, J.F. and E.S. Keeping. Mathematics of Statistics. Part One. Third
edition. New Delhi: Affiliated East-West Press Pvt. Ltd., 1974.
Mendenhall, William. Introduction to Probability and Statistics. Third edition.
Belmont, CA: Duxbury Press, 1971.
Miller, Irwin and John E. Freund. Probability and Statistics for Engineers.
Second edition. New Delhi: Prentice-Hall of India Private Limited,
1977.
Winer, B.J. Statistical Principles in Experimental Design. Second edition.
Tokyo: McGraw-Hill Kogakusha, Ltd., 1971.
Distribusi Sampling, Dalil Limit Pusat 12