1. Dağılım Ölçütleri
Tacettin İnandı, Doç. Dr.
Mustafa Kemal Üniversitesi Tıp Fakültesi Halk Sağlığı
e-posta: inandit@gmail.com
1
2. Sunum Kapsamı
1. Ön Tanımlar, Kavramlar
2. Dağılım ölçütleri ne anlama gelir
3. Dağılım ölçütleri nelerdir
4. Nasıl hesaplanırlar
5. Nerede kullanılırlar, hangi durumda hangi ölçütler seçilir
2
3. Ön Tanımlar
• Değişken
• Veri, veri dizisi, (seti)
• Dağılım
• Ölçüt: bir yargıya varmak ya da değer biçmek için başvurulan ilke,
kıstas, mısdak, kriter
Değişken Veri dizisi
Gözlem-ölçüm
Ölçütler
Dağılım
3
4. Dağılım ölçütleri ne işe yarar?
Yüzlerce binlerce kişiden, denekten elde edilmiş veri dizilerini
tanımlanması
Büyük bir veri setinin özelliklerini birkaç rakamla özetlenmesi
4
5. Dağılım ölçütleri nelerdir
1. Merkezi Eğilim 2. Değişimi Gösteren 3. Çarpıklık 4. Basıklık
Ölçütleri: Yer Ölçütler: Yaygınlık
gösteren ölçütler ölçütleri
Ortalama (mean) Değişim genişliği , aralığı Çarpıklık Basıklık
• Aritmetik o. (range) katsayıları katsayıları
• Geometrik o. Değişim-Varyans
• Diğer o. Standart sapma
Ortanca (median) Standart hata
Tepe değeri (mode) Değişim katsayısı
Çeyrek Çeyrek sapma
Yüzdelikler Uç değer, aşırı değer
5
6. 1. Merkezi Eğilim Ölçütleri
• Ortalama (mean)
• Ortanca (median)
• Tepe değeri (mode)
• Çeyrek ve yüzdelikler (Quartiles and percentiles)
• Ortasınır değer( Mid-range value)
6
10. Aritmetik ortalamanın özellikleri
Sık kullanılan ölçütlerden biridir
Genellikle standart sapma ile birlikte verilir
= 12.1 ±2.1
Sınıflandırılmış verilerde hesaplama farklıdır
10
11. Sayısal verilerde sınıflandırma
Değişim Aralığı: En büyük değer – En küçük değer (R)
Sınıf Sayısı: Veri dizisindeki grup sayısı (k)
Sınıf: Bir alt ve üst sınır ile belirlenmiş veri grubu
Sınıf Aralığı: Ardışık iki sınıfın alt ya da üst sınırları arasındaki fark (c)
Sınıf Sınırları: Bir sınıfta yer alabilecek en küçük ve en büyük değerleri gösterir. A.S.
(Alt Sınır) ve Ü.S. (Üst Sınır)
Sınıf Değeri: Bir sınıfın alt ve üst sınırlarının ortalamasıdır. (s)
Sınıf Frekansı: Sınıftaki değer sayısını gösterir. (f)
Sınıf Göreli Frekansı (%): Sınıfın frekansının toplam değer sayısı (n) içindeki payını
gösterir. (%f)
13. Örnek: Sıklık çizelgesi hazırlanmış yaş değişkenleri
Sınıf Sıklık=fj Sınıf değeri=sj fj*sj
19-21 2 20 2*20=40
22-24 4 23 4*23=92
25-27 6 26 6*26=156
28-30 14 29 14*29=406
31-33 7 32 7*32=224
34-36 12 35 12*35=420
37-39 2 38 2*38=76
40-42 3 41 3*41=123
Toplam 50 1537
14. Aşırı değerlerden etkilenir
Yeniden ölçüm yapılabilir
Çıkartılabilir
En yakın değere yakın bir değer atanabilir
Aşırı değerlerden etkilenir, özellikle denek sayılarının az olması durumunda
aşırı değerlerden fazla etkilenir
0,1,2,3,4,5,6,7,8,9,40
= 0+1+2+3+….= 85/11 =7.72
= 0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7,8,8,9,9,40 = 125/21= 5.95
14
15. Aritmetik ortalamayı ne zaman kullanmalı?
- merkezi dağılımda
- dağılım yaklaşık olarak simetrikse
OK
15
16. Geometrik ortalama
• İki sayının çarpımının karekökü olarak
tanımlanabilecek geometrik ortalama, n adet sayı
olması halinde bu sayıların çarpımının n.inci
dereceden kökü
G geometrik ortalama sembolüdür
16
17. Geometrik ortalama nerede kullanır
• Ortalama oranları
• Değişim oranları
• Logaritmik dağılım gösteren bakterilerin çoğalması,
nüfus artışı gibi durumlar
• Fiyat indeksleri, faiz oranları
17
18. Geometrik Ortalamanın özellikleri
• Geometrik ortalama bulabilmek için verilerin pozitif
değerde olması gerekmektedir yani veri değerlerinin
özellikle sıfır veya negatif olmaması gerekmektedir.
• Eğer tek bir veri değer sıfır ise, geometrik ortalama almak
anlamsız olacaktır.
• Ayrıca verilerin ölçülme ölçeğinin oransal olması gerekir
18
19. Harmonik Ortalama
Bir veri setinde bulunan n adet elemanın çarpma işlemine
göre terslerinin ortalamasının tersinin alınmasıyla elde edilen
yer ölçüsüdür. Genellikle basit seriler için kullanışlıdır.
19
20. Harmonik Ortalama’nın
Kullanım Alanları
• • Belirli fiyat tipleri,
• • Zaman serileri,
• için kullanışlıdır.
• Örnek: Zaman birimi başına hız, para birimi başına
• satın alınan birim sayısı.
20
21. 1. Merkezi Eğilim Ölçütleri
• Ortalama (mean)
• Ortanca (median)
• Tepe değeri (mode)
• Çeyrek ve yüzdelikler (Quartiles and percentiles)
• Ortasınır değer( Mid-range value)
21
22. Ortanca - Medyan
• Dağılımı büyükten küçüğe ya da küçükten büyüğe sıraladığımızda
ortada yer alan değer
Dağılımı iki eşit parçaya bölen değişken değeri:
Değerlerin %50’si ortancanın altında
Değerlerin %50’si ortancanın üzerinde
• 10, 23, 17, 5, 64, 19, 28, 3
3, 5, 17, 19, 23, 28, 64
Ortanca genellikle en küçük ve en büyük değerlerle birlikte verilir
22
24. Ortancanın özelliği
• Veri setinde aşırı uçlu elemanlar olduğunda aritmetik ortalamaya
göre daha güvenilirdir.
• Medyan, veri setindeki tüm elemanlardan etkilenmez
• Birim sayısındaki değişmelerden etkilenir, uç değerlerden etkilenmez
• Medyanın standart hatası, aritmetik ortalamanınkinden daha
büyüktür
24
25. 1. Merkezi Eğilim Ölçütleri
• Ortalama (mean)
• Ortanca (median)
• Tepe değeri (mode)
• Çeyrek ve yüzdelikler (Quartiles and percentiles)
• Ortasınır değer( Mid-range value)
25
26. Tepe Değeri - Mode
• Bir dağılımda en çok tekrarlayan değerdir
• 1,2,2,3,3,3,3,4,5,6,6,7
• En çok tekrarlayan değer
26
27. Tepe değerinin özellikleri
• Denek sayısı az olduğunda tepe değer güvenilir bir ölçü değildir.
• Bazı örneklemlerde bir tepe değer yerine iki ya da daha çok tepe
değer olabilir. Bu durumda ya tepe değerini hesaplamaktan vazgeçilir
ya da frekans tablosu tek tepe değerli bir dağılım olacak şekilde
yeniden düzenlenir.
• Tepe değer hesaplanırken birimlerin tümü işleme katılmadığı için uç
değerlerden etkilenmez.
• Nicel ve nitel verilerin her iki türü için de uygundur.
• Eğrisi J, ters J ve U şeklinde olan veriler için tepe değer kullanılmaz.
27
28. Tepe değeri
Değişkenin en sık görülen değeri
Tepe Değeri
20
18
16
14
12
N 10
8
6
4
28
2
0
32. Ortalama, ortanca ve tepe değeri seçimi
Değişken Türü Çarpıklık Ölçüt seçimi
İsimsel Tepe değeri
Sıralı Ortanca
Eşit aralıklı /oranlı Yok Ortalama
Eşit aralıklı/oranlı Var Ortanca
32
33. Değişken türleri ile ortalama, ortanca ve tepe değeri
Değişken Türü Ölçütler
İsimsel Tepe değeri
Sıralı Ortanca, tepe değeri
Ortalama, ortanca, tepe
Eşit aralıklı /oranlı/sürekli
değeri
33
35. Mod, Medyan ve Aritmetik Ortalama Karşılaştırılması
• Dağılımında(+)asimetri varsa: x > medyan > mod
• Dağılımında(-)asimetri varsa: x < medyan < mod
35
36. 1. Merkezi Eğilim Ölçütleri
• Ortalama (mean)
• Ortanca (median)
• Tepe değeri (mode)
• Çeyrek ve yüzdelikler (Quartiles and percentiles)
• Ortasınır değer( Mid-range value)
36
37. Çeyrek ve yüzdelikler
• Bir veri setini büyükten küçüğe veya küçükten büyüğe
sıraladığımızda dört eşit parçaya ayıran üç değere çeyrek adı
verilir.
• İlk % 25 birinci çeyrek (Q1)
• % 50’lik değere ikinci çeyrek (Q2) = medyan, ortanca
• % 75’lik değere üçüncü çeyrek (Q3)
37
38. Çeyrekler
ORTANCA
X X
minimum Q1 (Q2) Q3 maximum
25% 25% 25% 25%
12 30 45 57 70
38
39. 1. Merkezi Eğilim Ölçütleri
• Ortalama (mean)
• Ortanca (median)
• Tepe değeri (mode)
• Çeyrek ve yüzdelikler (Quartiles and percentiles)
• Ortasınır değer( Mid-range value)
39
40. Ortasınır değer
• En küçük değer ile en büyük değerin toplanıp ikiye bölünmesi
ile elde edilir
• Sık kullanılan bir ölçü değildir
40
41. Dağılım türü ile ortalama, ortanca
ve tepe değeri ilişkisi
Değişken Türü Ölçütler
Tepe değeri
İsimsel (Nominal)
(Mode)
Ortanca, tepe değeri
Sıralı (Ordinal)
(Median, mode)
Eşit aralıklı /oranlı/sürekli Ortalama, ortanca, tepe
(Interval/Ratio/continious) değeri (Mean, median, mode)
41
42. Dağılım ölçütleri nelerdir
1. Merkezi Eğilim 2. Değişimi Gösteren 3. Çarpıklık 4. Basıklık
Ölçütleri Yer Ölçütler: Yaygınlık
gösteren ölçütler ölçütleri
Ortalama (mean) Değişim genişliği , aralığı Çarpıklık Basıklık
• Aritmetik o. (range) katsayıları katsayıları
• Geometrik o. Varyans
• Diğer o. Standart sapma
Ortanca (median) Standart hata
Tepe değeri (mode) Değişim katsayısı
Çeyrekler Çeyrek sapma
Yüzdelikler Uç değer, aşırı değer
42
43. 2. Değişim gösteren ölçütler
• Verilerin belli bir konumdan olan uzaklaşmalarını
gösterir
• Değişim genişliği , aralığı (range)
• Değişim- Varyans
• Standart sapma
• Değişim katsayısı
• Standart hata
• Çeyrek sapma
• Uç değer, aşırı değer
43
44. Değişim Genişliği (Range, R)
En küçük ve en büyük değerin çıkartılması ile elde edilir
Genişlik = xen büyük – xen küçük
Örnek:
22 23 31 35 36 37 38 39 40 41 42 43 44
44
Genişlik = 44 - 22 = 22
45. 2. Değişim gösteren ölçütler
• Verilerin belli bir konumdan olan uzaklaşmalarını
gösterir
• Değişim genişliği , aralığı (range)
• Değişim - Varyans
• Standart sapma
• Değişim katsayısı
• Standart hata
• Çeyrek sapma
• Uç değer, aşırı değer
45
46. Değişim - Varyans
• Varyans gözlem sonuçlarının aritmetik ortalamadan ne
ölçüde farklı olabileceğini ortaya koyan bir ölçü
• Birim değerlerinin ortalamadan sapmalarının kareler
toplamının birim sayısına bölünmesi ile elde edilir
• Kitle (evren) varyansı , örneklem varyansı s2 ile
gösterilir.
46
48. Değişim (variance)
Farkın ortalamaya göre toplamı= 0
Farkın karesinin toplamı
Varyans = farkın karesinin
toplamının, ortalamaya göre
ortalaması
Ortalama
48
49. Değişim - Varyans
x : ortalama
xi : değer
N : sayı
Fark: x - xi
Farkın karesi: (x - xi)²
Farkın karesi toplamı: (x - xi)²
xi ²
x xi ² xi ² -
Varyans = N
49
N N
50. 2. Değişim gösteren ölçütler
• Verilerin belli bir konumdan olan uzaklaşmalarını
gösterir
• Değişim genişliği , aralığı (range)
• Varyans
• Standart sapma
• Değişim katsayısı
• Standart hata
• Çeyrek sapma
• Uç değer, aşırı değer
50
51. Standart Sapma
• Ortalamalardan ayrılışları gösterir
• Kitle standart sapması , örneklem standart sapması s ile
gösterilir.
• Sık kullanılan değişim ölçüsü
• Standart sapma varyansın kareköküdür (Standart
sapmanın karesi varyansı verir)
51
52. Standart Sapma
Standart sapma = Varyansın karekökü
= σ²
s= s²
m = 36.5 Kg
s² = 257 Kg2
s 2= 257 = 16 Kg
52
53. Ortalama
14
12
10
8
N
6
4
2
0
Standart Standart
Sapma Sapma 53
54. 2. Değişim gösteren ölçütler
• Verilerin belli bir konumdan olan uzaklaşmalarını
gösterir
• Değişim genişliği , aralığı (range)
• Varyans
• Standart sapma
• Değişim katsayısı
• Standart hata
• Çeyrek sapma
• Uç değer, aşırı değer
54
57. 2. Değişim gösteren ölçütler
• Verilerin belli bir konumdan olan uzaklaşmalarını
gösterir
• Değişim genişliği , aralığı (range)
• Varyans
• Standart sapma
• Değişim katsayısı
• Standart hata
• Çeyrek sapma
• Uç değer, aşırı değer
57
58. Standart Hata (SE, SEM)
• Örneklem ortalamasının toplum (evren) ortalamasını temsil
ederken oluşan hata
• Standart sapma bir veri dizisinde değişkenlerin ortalmaya göre
ne kadar saptığını gösterirken, standart hata ortalamanın
toplumdaki dağılımı hakkında bilgi verir
• Standart hata bir kestirim hatasıdır
• Standart hata ne kadar küçükse örneklem istatistiği anakütle
parametresine o derece yakın , parametre hakkında o kadar
duyarlı bir kestirim olacaktır.
• Standart hata büyüdükçe bu kestirimin duyarlılığı o derece
duyarlı olmaktan çıkacaktır
58
59. Standart Hata
s = örneklemin standart sapması
n = örneklem sayısı
Örneklem büyüklüğü arttıkça standart hata azalır
59
60. 2. Değişim gösteren ölçütler
• Verilerin belli bir konumdan olan uzaklaşmalarını
gösterir
• Değişim genişliği , aralığı (range)
• Varyans
• Standart sapma
• Değişim katsayısı
• Standart hata
• Çeyrek sapma
• Uç değer, aşırı değer
60
61. Sapan Değer ve Kutu Çizimleri
Minimum 1st Median 3rd Maximum
Quartile Quartile
Kutu çizimleri, verilerin çeyrek değerlerine dayalı grafiklerdir.
1- Birinci çeyrek değer, ortanca, üçüncü çeyrek değer bir çizgi üzerinde
sıralanır.
2- Ortancadan yatay çizgiye bir dik çizilir.
3- Birinci ve üçüncü çeyrek değerlerden de dik çıkılarak bir kutu
oluşturulur.
4- En küçük değer A=Q1-1,5(Q3-Q1)
61
5- En büyük değer B=Q3+1,5(Q3-Q1) belirlenir.
62. Uç Değer
Verilerimizde A dan daha küçük olan veri
ya da B den daha büyük olan veri var ise
bu değerlere uç değer denir.
Uç değerin sapan değer olup olmadığı
belirlenen alt ve üst sınırlar ile saptanır
Alt sınır A=(Q1-1,5d)
Üst sınır B=(Q3+1,5d)
d=Q3-Q1
Uç değer A dan küçük ise ya da B den
büyük ise sapan değerdir.
62
63. Dağılım ölçütleri nelerdir
1. Merkezi Eğilim 2. Değişimi Gösteren 3. Çarpıklık 4. Basıklık
Ölçütleri Yer Ölçütler: Yaygınlık
gösteren ölçütler ölçütleri
Ortalama (mean) Değişim genişliği , aralığı Çarpıklık Basıklık
• Aritmetik o. (range) katsayıları katsayıları
• Geometrik o. Değişim-varyans
• Diğer o. Standart sapma
Ortanca (median) Standart hata
Tepe değeri (mode) Değişim katsayısı
Çeyrekler Çeyrek sapma
Yüzdelikler Uç değer, aşırı değer
63
64. 3. Dağılımın Çarpıklığı
• Dağılımın simetrik olamayışının ölçülmesidir.
• Çarpıklık üçüncü standardize edilmiş moment
• Pozitif çarpıklık: Bu halde sağdaki kuyruk daha uzundur.
Dağılımın kütlesi grafiğin sol tarafında konsantre olmustur. Bu
türlü dağılım sağdan çarpıkolarak anılır.
• Negatif çarpıklık: Bu halde soldaki kuyruk daha uzundur ve
dağılımın kütlesi grafiğin sağ tarafında konsantre olmustur. Bu
türlü dağılım soldan çarpıkolarak anılır.
64
69. Dağılım ölçütleri nelerdir
1. Merkezi Eğilim 2. Değişimi Gösteren 3. Çarpıklık 4. Basıklık
Ölçütleri Yer Ölçütler: Yaygınlık
gösteren ölçütler ölçütleri
Ortalama (mean) Değişim genişliği , aralığı Çarpıklık Basıklık
• Aritmetik o. (range) katsayıları katsayıları
• Geometrik o. Varyans
• Diğer o. Standart sapma
Ortanca (median) Standart hata
Tepe değeri (mode) Değişim katsayısı
Çeyrekler Çeyrek sapma
Yüzdelikler Uç değer, aşırı değer
69
70. 4. Sivrilik- Basıklık Ölçütleri
• Veri setinin basıklık karekteri pek dikkate alınmayan bir özelliği
• Dördüncü standarize edilmiş moment şöyle tanımlanır;
• Dördüncü standardize edilmiş moment için en küçük
değer 1dir; bu nedenle en küçük basıklık fazlalığı değeri -2
olur. Dördüncü moment ve kümülant değeri için üst bir
sınırlama yoktur ve üst değer artı sonsuz kadar büyük olabilir.
Bu nedenle basıklık ölçüsü değeri -2 ile artı sonsuzluk arasında
bulunabilir.
• Basıklık ölçütü -2 ile +
70
71. Basıklık Katsayısı
Basık dağılım
Daha basık dagılım
• Basıklığın ölçüsü basıklık katsayısı ile belirlenir.
71
72. n
( x j x) 4
j 1
BK n
S4
Burada:
BK: Basıklık katsayısı
Xj:j inci gözlemin değeri
S4: standart sapmanın dördüncü kuvveti
BK=3 ise dağılımın basıklığı normal ağılım
ile aynıdır.
BK>3 ise dağılım normal dağılımdan daha
dikdir.
BK<3 ise dağılım normal dağılımdan daha
basıktır.
72
73. Dağılım ölçütleri nelerdir
1. Merkezi Eğilim 2. Değişimi Gösteren 3. Çarpıklık 4. Basıklık
Ölçütleri Yer Ölçütler: Yaygınlık
gösteren ölçütler ölçütleri
Ortalama (mean) Değişim genişliği , aralığı Çarpıklık Basıklık
• Aritmetik o. (range) katsayıları katsayıları
• Geometrik o. Değişim-varyans
• Diğer o. Standart sapma
Ortanca (median) Standart hata
Tepe değeri (mode) Değişim katsayısı
Çeyrekler Çeyrek sapma
Yüzdelikler Uç değer, aşırı değer
73
76. Eşit aralıklı ve oranlı bir değişkenden elde edilmiş ancak
normal dağılım özelliği göstermeyen bir veri setinde
hangi merkezi eğilim ölçütünü kullanmak uygundur?
Ortanca
76