SlideShare uma empresa Scribd logo
1 de 16
Статистик боловсруулалт.
Эмнэлэг, биологийн өгөгдлүүдэд математик статистикийн аргуудын тусламжтайгаар
боловсруулалт хийж судалгааны ажлынхаа чиглэлийг тогтоох, үр дүнгээ онолын
үндэслэлтэй баталгаажуулах нь чухал. Статистик боловсруулалт нь эмнэлэг, биологийн
үзүүлэлтийн ямар нэг аргаар цуглуулсан өгөгдөл дээр шинжилгээ хийж тодорхой тайлбар
өгөх, чиг хандлагыг тодорхойлоход ашиглагдана.
Ямар нэг X хэмжигдэхүүн өгөгджээ. Х хэмжигдэхүүн гэдэг нь тухайлбал “уушигны архаг
үрэвсэлтэй хүмүүсийн өдөрт дундажаар татдаг тамхины тоо”, “ямар нэг өвчнөөр
өвчлөгсөдийн эмийн зардал”, гэх мэт та бүхний сонирхон судлаж байгаа янз бүрийн
үзүүлэлтүүд байж болно. X нь санамсаргүй хэмжигдэхүүн байна. Учир нь судалгаанд
хамрагдаж байгаа тухайн объект ямар ч үр дүн үзүүлж болзошгүй билээ. Энэ санамсаргүй
хэмжигдэхүүнийг судлах шаардлагатай гэе. Уг хэмжигдэхүүний хувьд nxxx ,,, 21  гэсэн
ажиглалтын (туршилтын) утгууд өгөгдсөн байг. nxxx ,,, 21  тоонуудыг түүвэр гэх ба түүвэр нь
Х хэмжигдэхүүнийг судлахын тулд та бүхний олж цуглуулсан тоонууд юм. Энэ ажиглалтын
утгуудаар x хэмжигдэхүүнийг бүхэлд нь тодорхойлох хэрэгтэй болж байна.
Анхны n ширхэг түүврийн дотор kyyy ,,, 21  k ширхэг өөр утга байг. Эдгээр утгуудын
абсолют давтамжуудыг харгалзан kHHH ,,, 21  гэж тэмдэглэе. Тэгвэл харьцангуй
давтамжууд ),1(; ki
тооажиглалтын
тамжАбсалютдав
n
H
h i
i байна.
Жишээ 1. Уушигны архаг үрэвсэлтэй хүмүүсийн өдөрт дундажаар татдаг тамхины тоо
дараах байдлаар өгөгджээ.
n=40: {12,18,6,10,9,5,8,11,14,11,12,15,8,17,12,6,7,12,13,9,11,20,7,14,13,12,13,19,
15,12,8,15,11,14,14,9,7,15,6,11} Энд k=16 ба үүнийг ашиглан давтамжийн таблиц буюу
статистик эгнээг байгуулбал:
y(i) H(i) h(i) ∑h(i)
5 1 0.025 0.025
6 3 0.075 0.1
7 3 0.075 0.175
8 3 0.075 0.25
9 3 0.075 0.325
10 1 0.025 0.35
11 5 0.125 0.475
12 6 0.15 0.625
13 3 0.075 0.7
14 4 0.1 0.8
15 4 0.1 0.9
16 0 0 0.9
17 1 0.025 0.925
18 1 0.025 0.95
19 1 0.025 0.975
20 1 0.025 1
Нийлбэр 40 1 -
Хүснэгт ¹1
Зураг ¹1
Зураг ¹2
Ажиглалтын утгуудын авч болох бүх боломжит утгуудын олонлогыг эх олонлог гэнэ. Эх
олонлог нь тоологдом элементтэй бол уг хэмжигдэхүүнийг дискрет санамсаргүй
хэмжигдэхүүн гэнэ (Жишээ 1). Эсрэг тохиолдолд тасралтгүй санамсаргүй хэмжигдэхүүн гэнэ.
Тасралтгүй санамсаргүй хэмжигдэхүүнийг судлахын тулд дээрхи жишээтэй адилаар
давтамжийн таблицийг байгуулах нь ямар ч үр дүнгүй. Иймээс статистик эгнээг санамсаргүй
хэмжигдэхүүний утгуудын олонлогыг интервалуудад хувааж байгуулдаг. Тухайлбал Жишээ
1-ийн өгөгдлөөр статистик эгнээг дараах байдлаар байгуулж болно.
интервал H(i) h(i) ∑h(i)
[5;7[ 4 0.1 0.1
[7;9[ 6 0.15 0.15
[9;11[ 4 0.1 0.1
[11;13[ 11 0.275 0.275
[13;15[ 7 0.175 0.175
[15;17[ 4 0.1 0.1
[17;19[ 2 0.05 0.05
[19;20] 2 0.05 0.05
Нийлбэр 40 1 -
Хүснэгт ¹2
Зураг ¹3
Зураг ¹4
Жишээ 2. Ямар нэг өвчнөөр өвчлөгсөдийн хэвтэн эмчлүүлсэн эмийн зардал:
Өвчтөнүүдийн эмийн зардал дараахь хүснэгтээр өгөгдөв.
Анги Зарцуулалт тоо h(i)
1 0-10000 233 0.085411
2 10000-20000 354 0.129765
3 20000-30000 498 0.182551
4 30000-40000 621 0.227639
5 40000-50000 501 0.183651
6 50000-60000 332 0.121701
7 60000-70000 189 0.069282
2728 1
Хүснэгт ¹3
Ажиглалтын интервалд түүврийн харьцангуй давтамжийг харгалзуулсан дараах хэлбэрийн
дүрслэлийг гистограмм гэнэ (Зураг ¹1,3,5). Гистограммын хэрчмийн дундажуудыг холбосон
тахир шугамыг полигон гэнэ (Зураг ¹4,6).
0
0.05
0.1
0.15
0.2
0.25
0-10000 10000-
20000
20000-
30000
30000-
40000
40000-
50000
50000-
60000
60000-
70000
Зураг ¹5
Зураг ¹6
Гистограмм ба полигоноос үндэслэн судалж байгаа санамсаргүй хэмжигдэхүүн тоон шулуун
дээр яаж тархсаныг тодорхойлж болно. Yүнийг санамсаргүй хэмжигдэхүүний нягтын функц
гэнэ. Полигон нь санамсаргүй хэмжигдэхүүний тархалтын нягтын функцийн ойролцоо
дүрслэл юм. Практикт хамгийн элбэг тохиолддог тархалт нь хэвийн тархалт юм. (Зураг ¹7)
Зураг ¹7
Хэвийн тархалттай санамсаргүй хэмжигдэхүүний нягтын функцийн томъѐо дараах ерөнхий
хэлбэртэй байна.
;
2
1 2
2
2
)( x
ey
Зарим тасралтгүй санамсаргүй хэмжигдэхүүний нягтын функц
Зарим тасралтгүй санамсаргүй хэмжигдэхүүний нягтын функцийн график
Түүврийн тоон характеристикууд.
Санамсаргүй хэмжигдэхүүний дундаж:
;
1
)(
1
1
21
n
i
in x
n
xxx
n
x  - Арифметик дундаж.
Yүний зэрэгцээ дараахь байдлаар тодорхойлогдсон медиан гэж нэрлэгдэх хэмжигдэхүүнийг
өргөн ашигладаг. Анх өгөгдсөн nxxx ,,, 21  түүврийг багаас нь их рүү нь эрэмбэлэх замаар
)()2()1( ,,, nxxx  гэсэн эрэмблэгдсэн цувааг зохиоѐ. Энд )()2()1( nxxx  байна. Тэгвэл
түүврийн медиан n – сондгой бол ;
)
2
1
(
nxm - дундах утга, n – тэгш бол );(
2
1
)1
2
()
2
(
nn xxm -
дундах хоѐр утгын дундаж байна.
Жишээ 3. n-сондгой үед: n=11, {5,7,8,3,4,9,14,2,7,10,12}- түүвэр өгөгдсөн байг. Эрэмблэгдсэн
цуваа нь {2,3,4,5,7,7,8,9,10,12,14} болно. ;7)6(
)
2
111
(
xxm байна.
Жишээ 4. n – тэгш үед: n=10, {9,7,3,14,17,9,8,10,5,2} - түүвэр өгөгдсөн байг. Эрэмблэгдсэн
цуваа нь {2,3,5,7,8,9,9,10,14,17} болно. ;5.8)98(
2
1
)(
2
1
)(
2
1
)6()5(
)1
2
10
()
2
10
(
xxxxm байна.
Түүврийн медианы гол шинж нь ажиглалтын бүх утгуудын 50-аас багагүй % нь m медианаас
ихгүй утга авдаг, мөн 50-аас багагүй % нь их буюу тэнцүү утга авдаг байна.
Тасралтгүй санамсаргүй хэмжигдэхүүний нягтын функц өгөгдсөн үед медиан нь нягтын
функцийн график болон OX тэнхлэг хоѐрын хооронд хашигдсан хэсгийн талбайг таллан
хуваагч босоо шулууны координат байна.
Зураг ¹3
Хамгийн их давтамжтай хэмжигдэхүүний утгыг түүврийн моод гэж нэрлээд modx гэж
тэмдэглэнэ. modx нь нягтын функцийг максимумд хүргэх утга.
Санамсаргүй хэмжигдэхүүний хазайлт:
Санамсаргүй хэмжигдэхүүний дундаж нь түүний авах утгуудын дундаж байрлалыг заадаг
бол энэ дундаж байрлалаас санамсаргүй хэмжигдэхүүний авах утгууд дундажаар хир хазайх
хазайлтыг дисперс хэмээх тоон характеристик тодорхойлдог. Дисперс буюу дундаж квадрат
хазайлт нь ;)(
1
1
1
22
n
i
i xx
n
s томъѐогоор бодогдоно. ;)(
1
1
1
2
n
i
i xx
n
s -стандарт
хазайлт гэнэ.
Жишээлбэл ;
2
1 2
2
2
)(x
ey тархалтын нягт бүхий хэвийн тархалтын хувьд x , ;s
байдаг. Хэвийн тархалтын хувьд ],[ sxsx интервалд ойролцоогоор бүх ажиглалтын
утгуудын 68% байрлана. ]2,2[ sxsx интервалд ойролцоогоор 95%, ]3,3[ sxsx
интервалд ойролцоогоор 99.7% нь байрлана.
Корреляцийн коэффициент.
Судалж буй хэмжигдэхүүнүүдийн хоорондын хамаарлыг тодорхойлдог тоон
характеристикийг корреляцийн коэффициент гэнэ.
),(,),,(),,( 2211 nn yxyxyx  гэсэн ажиглалтын хос утгууд өгөгдсөн байг. Корреляцийн
коэффициент дараахь томъѐогоор олдоно.
;
)()(
)()(
1
2
1
2
1
n
i
i
n
i
i
n
i
ii
yyxx
yyxx
r Yүнийг Пирсоны корреляцийн коэффициент гэнэ. 11 r
байна. r нь 1-д ойртох тусам x,y санамсаргүй хэмжигдэхүүний хамаарлын хүч
сул нягт маш нягт гэсэн чиглэлд өөрчлөгдөнө.
Жишээ ¹5. 10000 хүнд ноогдох дотрын их эмчийн тоо, нас баралтын тоо дараахь
хүснэгтээр өгөгджээ. /1999 оны дүн/. Эдгээрийн хамаарлын хүчийг тооцоѐ.
Их эмч нас баралт
Архангай 1.92 63
Баян Өлгий 1.63 20
Баянхонгор 1.3 92
Булган 0.75 45
Говь Алтай 1.48 72
Говь Сүмбэр 3.82 15
Дархан Уул 1.9 36
Дорноговь 1.19 43
Дорнод 2.01 43
Дундговь 1.65 30
Завхан 0.86 44
Орхон 2.59 23
Өвөрхангай 1.02 81
Өмнөговь 1.3 43
Сүхбаатар 3.01 34
Сэлэнгэ 1.48 64
Төв 1.77 55
Увс 2.01 52
Ховд 1.39 73
Хөвсгөл 1.53 94
Хэнтий 1.03 45
Корреляцийн коэф -0.48533
Корреляцийн анализ.
Судалж байгаа хэмжигдэхүүнүүдийн хоорондын хамаарлыг үнэлэхэдээ ажиглалтын
утгуудыг ашигладаг. Ө.х. корреляцийн коэффициентийн ойролцоо утгыг олсон. Иймд бид
ажиглалтын утгуудыг ашиглаж олсон корреляцийн коэффициентодоо хэдэн хувийн
магадлалтай итгэж болох вэ? гэсэн асуудал гарч ирнэ. Yүний тулд 0:0H гэсэн
таамаглал дэвшүүлье. 2n чөлөөний зэрэг бүхий Стьюдентийн тархалтын ;
1
2
2
r
n
rtàæ
утгыг шалгана. Стьюдентийн тархалтын таблицаас
2,
2
n
t утгыг олно.
2,
2
n
àæ tt бол
0:0H таамаглалыг няцаана. Ө.х. x,y хэмжигдэхүүнүүдийг корреляци хамааралтай гэж
үзнэ. ( 0:1H ). Энэ нь r корреляцийн коэффициентод 1 магадлалтайгаар итгэж болно
гэсэн үг.
2,
2
n
àæ tt бол 0:0H таамаглалыг хүлээж авна. x,y хэмжигдэхүүнүүдийг
корреляци хамааралгүй гэж үзнэ.
Жишээ ¹6. 10000 хүнд ноогдох дотрын их эмчийн тоо, нас баралтын тоо хоѐрын хамаарал r
-г таамаглалаар шалгая.
Их эмч нас баралт
1 Архангай 1.92 63
2 Баян Өлгий 1.63 20
3 Баянхонгор 1.3 92
4 Булган 0.75 45
5 Говь Алтай 1.48 72
6 Говь Сүмбэр 3.82 15
7 Дархан Уул 1.9 36
8 Дорноговь 1.19 43
9 Дорнод 2.01 43
10 Дундговь 1.65 30
11 Завхан 0.86 44
12 Орхон 2.59 23
13 Өвөрхангай 1.02 81
14 Өмнөговь 1.3 43
15 Сүхбаатар 3.01 34
16 Сэлэнгэ 1.48 64
17 Төв 1.77 55
18 Увс 2.01 52
19 Ховд 1.39 73
20 Хөвсгөл 1.53 94
21 Хэнтий 1.03 45
Корреляцийн коэф -0.48532697
t аж -2.41954934
;09.2
221,
2
05.0
2,
2
tt
n
19,025.0ttàæ байгаа тул r=-0.48532697 ач холбогдолтой гэдэгт итгэх
магадлал нь 1-0.05=0.95 буюу x,y хэмжигдэхүүнүүд хоорондоо хамааралтай.
Регрессийн анализ.
),(,),,(),,( 2211 nn yxyxyx  гэсэн 2 хэмжээст түүвэр өгөгджээ. Корреляцийн коэффициентийг
бодож энэ 2 хэмжигдэхүүн хоорондоо функцэн хамааралтай эсэхийг тогтоосон бол
регрессийн анализаар ийм хамаарлуудын хэлбэрийг тогтоож, ойролцоогоор байгуулах
болно. Статистик хамааралтай хэмжигдэхүүнүүдээс функцэн хамаарлыг илрүүлэхийн тулд
юуны түрүүнд ямар хэлбэртэй хамаарал байж болохыг тодорхойлох хэрэгтэй. Yүний тулд
OX тэнхлэг дээр хүчин зүйлийн шинж тэмдэг буюу үл хамаарах хувьсагчийг, OY тэнхлэг дээр
үр дүнгийн шинж тэмдэг буюу хамаарах хувьсагчийг авч өгөгдсөн цэгүүдийг байгуулна.
Тэдгээрийг хамгийн оновчтой илэрхийлэх функц буюу регрессийн тэгшитгэлийг
тодорхойлно. Регрессийн тэгшитгэлийн параметрүүдийг ажиглалтын утгуудын
тусламжтайгаар тооцож гаргана. Энэ зорилгод параметрийг үнэлэхэд өргөн ашигладаг
ХБКАргыг хэрэглэнэ.
Шугаман регресс.
Өгөгдсөн хос хэмжигдэхүүнүүдийн хамаарал шугаман функцээр тодорхойлогдох боломжтой
гэе.
y=ax+b; Энд a,b үл мэдэгдэх параметрүүд.
Ажиглалтын утгуудаар байгуулсан цэгүүдэд хамгийн ойр байхаар y=ax+b; шулуун байгуулах
буюу уг шулууны a,b үл мэдэгдэх параметрүүдийг олох шаардлагатай.
niyx ii ,1),( - туршилтын утга.
nibaxx ii ,1),( - онолын утга.
Туршилтын утга ба онолын утгын ялгаврыг алдаа гэж нэрлээд nii ,1; гэж тэмдэглэе.
nibaxy iii ,1);( алдаануудын квадратуудын нийлбэр хамгийн бага байхаар a, b -г
олно гэдэг нь min))((
1
2
1
2
n
i
ii
n
i
i baxyS буюу олон хувьсагчийн функцийн
экстремумын олох бодлогод шилжинэ. Yүний тулд n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
ybnxa
yxxbxa
b
S
a
S
11
111
2
0
0
систем тэгшитгэлийг бодож a,b -г олдог билээ.
Жишээ ¹7. 10000 хүнд ноогдох дотрын их эмчийн тоо, нас баралтын тоо дараахь
хүснэгтээр өгөгджээ. /1999 оны дүн/.
Их эмч нас баралт
Булган 0.75 45
Завхан 0.86 44
Өвөрхангай 1.02 81
Хэнтий 1.03 45
Дорноговь 1.19 43
Баянхонгор 1.3 92
Өмнөговь 1.3 43
Ховд 1.39 73
Говь Алтай 1.48 72
Сэлэнгэ 1.48 64
Хөвсгөл 1.53 94
Баян Өлгий 1.63 20
Дундговь 1.65 30
Төв 1.77 55
Дархан Уул 1.9 36
Архангай 1.92 63
Дорнод 2.01 43
Увс 2.01 52
Орхон 2.59 23
Сүхбаатар 3.01 34
Говь Сүмбэр 3.82 15
0
10
20
30
40
50
60
70
80
90
100
0.75
1.02
1.19
1.3
1.48
1.53
1.65
1.9
2.01
2.59
3.82
Шилжих дундажийн аргаар засварлавал:
Их эмч
нас
баралт*
0.86 56.6666667
1.02 56.6666667
1.03 56.3333333
1.19 60
1.3 59.3333333
1.3 69.3333333
1.39 62.6666667
1.48 69.6666667
1.48 76.6666667
1.53 59.3333333
1.63 48
1.65 35
1.77 40.3333333
1.9 51.3333333
1.92 47.3333333
2.01 52.6666667
2.01 39.3333333
2.59 36.3333333
3.01 24
0
10
20
30
40
50
60
70
80
90
0.86
1.03
1.3
1.39
1.48
1.63
1.77
1.92
2.01
3.01
a -17.9287
b 82.00235
y= -17.9287*x+82.00235.
Регрессийн тэгшитгэлийн стандарт алдаа.
Регрессийн тэгшитгэлээр гарган авч байгаа bxay ixi
онолын утгуудын найдвартай эсэх
нь регрессийн шугамын ойролцоох ажиглалтын утгуудын алдаагаар тодорхойлогдоно. Энэ
алдааны их, багыг үзүүлж буй хэмжигдэхүүнийг регрессийн тэгшитгэлийн стандарт алдаа
гэж нэрлэх бөгөөд дараахь томъѐогоор олдоно.
;
)(
1
2
kn
yy
n
i
xi
yx
i
Энд k регрессийн тэгшитгэл дэхь параметрийн тоо.
a ба b параметрүүдийн стандарт хазайлтууд ;
)(
1
1
2
n
i
i
yxa
xx
S ;
)(
1
1
2
2
n
i
i
yxb
xx
x
n
S
томъѐонуудаар олдоно.
Регрессийн шугаман загварын параметрийн итгэлтэй эсэхийг таамаглалаар шалгах.
Туршилтын n ширхэг хос утгыг ашиглан x,y санамсаргүй хэмжигдэхүүнүүдийн хоорондын
хамаарлыг ойролцоогоор y=ax+b; олсон. x,y санамсаргүй хэмжигдэхүүнүүдийн жинхэнэ
хамаарлыг ;21 iii xy гэвэл ;, 21 ba гэж олдсон гэсэн үг.
Регрессийн шугаман тэгшитгэлийн a,b параметрүүд нийт x,y санамсаргүй
хэмжигдэхүүнүүдийн хувьд тохирох эсэхийг шалгах шаардлагатай. Yүний тулд дараахь
таамаглалуудыг шалгадаг.
a параметрийн хувьд:
0: 10H таамаглалыг шалгая. Эсрэг таамаглал нь )0:( 11H .
;
a
àæ
S
a
t утгыг олно. Стьюдентийн t тархалтын таблицаас
2,
2
n
t утгыг олж,
2,
2
n
àæ tt бол
0: 10H таамаглалыг няцаана. 0: 11H таамаглалыг хүлээж авна. Энэ нь a
параметрийн утга ач холбогдолтойг харуулна. Харин
2,
2
n
àæ tt бол 0: 10H таамаглалыг
хүлээж авах буюу a параметрийн утгыг ач холбогдолгүй гэж үзнэ.
Хэрвээ 0: 10H таамаглалыг няцаасан бол a параметрийн итгэх завсарыг дараахь
байдлаар байгуулна.
[,]
2,
2
2,
2
a
n
a
n
StaSta
Ө.х. a параметрийн жинхэнэ утгыг дээрхи интервалд байна гэдэгт 1 магадлалтайгаар
итгэж болно гэсэн үг.
b параметрийг дээрхитэй адилаар үнэлнэ.
Шугаман бус регресс.
),(),,(),,( 2211 nn yxyxyx  хэмжигдэхүүнүүд шугаман хамааралтай биш ямар нэгэн муруйгаар
зурагдах хамааралтай байг. Энэ үед уг хамаарал нь ямар төрлийн муруй болох ө.х. y -нь x -
ээс ойролцоогоор ямар функцээр хамаарч байгааг тогтоох нь чухал юм. Жишээ болгож
1. ;
bxa
x
y - гипербол,
2. ;a
xby - зэрэгт функц буюу логарифм муруй,
3. ;x
b
eay - экспоненциал функц
4. ;2
cxbxay - парабол функцын ангиудыг авч үзье.
1. Гипербол
Хэрэв өгөгдсөн цэгүүд ;
bxa
x
y гипербол муруйтай ойролцоо оршиж байна гэж үзвэл
энэхүү гипербол муруйн а,b параметрийг ХБКАргаар олно.
;
11
; b
x
a
ybxa
x
y болно. ;
1
*;
1
*
x
x
y
y гэж орлуулбал ;** bxay болж y*,x*
хэмжигдэхүүнүүдийн хувьд шугаман регрессийн бодлогод шилжинэ. Анхны өгөгдлүүдээс
),(),,(),,( ***
2
*
2
*
1
*
1 nn yxyxyx  утгуудыг бодож олно.
n
k
k
n
k
k
n
k
kk
n
k
k
n
k
k
ybnxa
yxxbxa
1
*
1
*
1
**
1
*
1
2*
)(
Систем тэгшитгэлийг бодож a,b -г олно.
2. Зэрэгт функц буюу логарифм муруй
lg/;a
xby
lgy=lgb+algx; болно.
;lg*;lg* xxyy гэж орлуулбал ;lg** bxay болж y*,x* хэмжигдэхүүнүүдийн хувьд
шугаман регрессийн бодлогод шилжинэ. Анхны өгөгдлүүдээс ),(),,(),,( ***
2
*
2
*
1
*
1 nn yxyxyx 
утгуудыг бодож олно.
n
k
k
n
k
k
n
k
kk
n
k
k
n
k
k
ybnxa
yxxbxa
1
*
1
*
1
**
1
*
1
2*
lg
lg)(
Систем тэгшитгэлийг бодож a,lgb -г олно. lgb олдсон тул энэ
утгыг ашиглаж b-г олно.
3. Экспоненциал функц
;x
b
eay функцийн хувьд ;)(
1
bx
eay гэдгээс x
eX
1
гэж орлуулбал ;b
Xay болж
дээрхитэй ижилээр бодогдоно.
4. Парабол
Хэрэв өгөгдсөн цэгүүд ;2
cxbxay параболтой ойролцоо оршиж байна гэж үзвэл энэхүү
параболын a,b,c параметрүүдийг олоходоо мөн л ХБКАргыг хэрэглэнэ. Туршилтын утгуудад
хамгийн ойр параболыг байгуулна гэдэг нь алдааны квадратуудын нийлбэр хамгийн байхаар
a,b,c -г олно гэсэн үг.
min))((
1
22
n
i
iii cxbxayS
Олон хувьсагчийн функцын экстремум байх зайлшгүй нөхцөл ѐсоор
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
yxxcxbxa
yxxcxbxa
yxcxban
c
S
b
S
a
S
1
2
1
4
1
3
1
2
11
3
1
2
1
11
2
1
0
0
0
(1)
Систем тэгшитгэлийг бодож a,b,c -г олно.
Жишээ ¹8. Ажилласан жил ба хөдөлмөрийн бүтээмжийн хоорондын хамаарал дараахь
хүснэгтээр өгөгдөв.
x y
1 1 7
2 3 17
3 6 16
4 8 29
5 12 26
0
5
10
15
20
25
30
35
1 3 6 8 12
Дээрхи өгөгдөлийн хувьд (1) системийг бодвол:
a 0.385
b 4.02
c -0.1765
гэж олдоно. Ингэснээр ажилласан жил, хөдөлмөрийн бүтээмж хоѐрын хоорондын хамаарал
;1765.002.485.3 2
xxy регрессийн тэгшитгэлээр илэрхийлэгдэнэ.
Детерминацийн коэффициент
Регрессийн шинжилгээнд дараахь 3 квадратлаг хэлбэрийг ашигладаг.
1. ;)(
1
2
n
i
i yySST - туршилтын утгуудын хазайлтуудын квадратуудын нийлбэр
2. ;)(
1
2
n
i
x yySSR i
- регрессийн утгуудын хазайлтуудын квадратуудын нийлбэр
3. ;)(
1
2
n
i
xi i
yySSE - алдааны (үлдэгдлийн) квадратуудын нийлбэр
Энд iy - ажиглалтын утга
y - ажиглалтын утгуудын арифметик дундаж
ixy - регрессийн тэгшитгэлээр тооцсон онолын утга.
Эдгээр квадратуудын нийлбэрүүдийн хувьд дараахь томъѐо хүчинтэй.
SST=SSR+SSE; /:SST
;1
SST
SSE
SST
SSR
(*)
Энэ тэгшитгэлийн эхний харьцааг детерминацийн коэффициент гэж нэрлээд ;2
SST
SSR
R гэж
тэмдэглэнэ. Детерминацийн коэффициент 0-1 хооронд утга авах бөгөөд хамаарах хувьсагч
(y) - д үл хамаарах хувьсагч (x) хэдэн хувийн нөлөө үзүүлж байгааг заана. (*) тэгшитгэлийн
хоѐр дахь харьцаа нь бусад хүчин зүйлийн нөлөөллийн хувийг заана.
Жишээ ¹9. Ажилласан жил ба хөдөлмөрийн бүтээмжийн хоорондын хамааралын
детерминацийн коэффициентийг тодорхойльѐ.
y(i) y(x(i)) y(x(i))-y кв y(i)-y кв
7 7.69 11.31 127.92 -12 144
17 14.32 4.68 21.9 -2 4
16 21.61 2.61 6.81 -3 9
29 24.71 5.71 32.6 10 100
26 26.67 7.67 58.83 7 49
248.06 306
;81.02
R гэж гарна. Энэ нь ажилсан жил хөдөлмөрийн бүтээмжийн 81 орчим хувийг
тодорхойлдог бөгөөд 19 орчим хувь нь бусад хүчин зүйлээс (нас, боловсрол, авъяас . . .)
хамаардаг байна

Mais conteúdo relacionado

Mais procurados

Д.БА206 СТАТИСТИК ХЭМЖИГДЭХҮҮН
Д.БА206 СТАТИСТИК ХЭМЖИГДЭХҮҮНД.БА206 СТАТИСТИК ХЭМЖИГДЭХҮҮН
Д.БА206 СТАТИСТИК ХЭМЖИГДЭХҮҮН
Nomuuntk
 
Lecture11
Lecture11Lecture11
Lecture11
Bbujee
 
статистик мэдээллийн алдааг шалгах, хүснэгт, график
статистик мэдээллийн алдааг шалгах, хүснэгт, графикстатистик мэдээллийн алдааг шалгах, хүснэгт, график
статистик мэдээллийн алдааг шалгах, хүснэгт, график
altaamecs
 
Lecture 6,7
Lecture 6,7Lecture 6,7
Lecture 6,7
Bbujee
 
Б.ЗАМАНДИЙЖАВ - КОМПАНИЙ ҮНЭ ЦЭНЭД НӨЛӨӨЛӨХ ХҮЧИН ЗҮЙЛСИЙН ШИНЖИЛГЭЭ
Б.ЗАМАНДИЙЖАВ - КОМПАНИЙ ҮНЭ ЦЭНЭД НӨЛӨӨЛӨХ ХҮЧИН ЗҮЙЛСИЙН ШИНЖИЛГЭЭБ.ЗАМАНДИЙЖАВ - КОМПАНИЙ ҮНЭ ЦЭНЭД НӨЛӨӨЛӨХ ХҮЧИН ЗҮЙЛСИЙН ШИНЖИЛГЭЭ
Б.ЗАМАНДИЙЖАВ - КОМПАНИЙ ҮНЭ ЦЭНЭД НӨЛӨӨЛӨХ ХҮЧИН ЗҮЙЛСИЙН ШИНЖИЛГЭЭ
batnasanb
 
тойм статистик лекц 2
тойм статистик лекц 2тойм статистик лекц 2
тойм статистик лекц 2
zorigoo.sph
 
Lekts13. dinamik egnee jisheetei buten
Lekts13.  dinamik egnee jisheetei butenLekts13.  dinamik egnee jisheetei buten
Lekts13. dinamik egnee jisheetei buten
Anhaa8941
 
тойм статистик лекц 2
тойм статистик лекц 2тойм статистик лекц 2
тойм статистик лекц 2
Serod Khuyagaa
 

Mais procurados (20)

сэдэв 2-хотш
сэдэв 2-хотшсэдэв 2-хотш
сэдэв 2-хотш
 
Д.БА206 СТАТИСТИК ХЭМЖИГДЭХҮҮН
Д.БА206 СТАТИСТИК ХЭМЖИГДЭХҮҮНД.БА206 СТАТИСТИК ХЭМЖИГДЭХҮҮН
Д.БА206 СТАТИСТИК ХЭМЖИГДЭХҮҮН
 
Lecture11
Lecture11Lecture11
Lecture11
 
статистик мэдээллийн алдааг шалгах, хүснэгт, график
статистик мэдээллийн алдааг шалгах, хүснэгт, графикстатистик мэдээллийн алдааг шалгах, хүснэгт, график
статистик мэдээллийн алдааг шалгах, хүснэгт, график
 
Lecture 6,7
Lecture 6,7Lecture 6,7
Lecture 6,7
 
Б.ЗАМАНДИЙЖАВ - КОМПАНИЙ ҮНЭ ЦЭНЭД НӨЛӨӨЛӨХ ХҮЧИН ЗҮЙЛСИЙН ШИНЖИЛГЭЭ
Б.ЗАМАНДИЙЖАВ - КОМПАНИЙ ҮНЭ ЦЭНЭД НӨЛӨӨЛӨХ ХҮЧИН ЗҮЙЛСИЙН ШИНЖИЛГЭЭБ.ЗАМАНДИЙЖАВ - КОМПАНИЙ ҮНЭ ЦЭНЭД НӨЛӨӨЛӨХ ХҮЧИН ЗҮЙЛСИЙН ШИНЖИЛГЭЭ
Б.ЗАМАНДИЙЖАВ - КОМПАНИЙ ҮНЭ ЦЭНЭД НӨЛӨӨЛӨХ ХҮЧИН ЗҮЙЛСИЙН ШИНЖИЛГЭЭ
 
Говь ХК
Говь ХКГовь ХК
Говь ХК
 
Files
FilesFiles
Files
 
Lekts01
Lekts01Lekts01
Lekts01
 
тойм статистик лекц 2
тойм статистик лекц 2тойм статистик лекц 2
тойм статистик лекц 2
 
Sampling 2
Sampling   2Sampling   2
Sampling 2
 
Lecture 5 6
Lecture 5 6Lecture 5 6
Lecture 5 6
 
Lekts13. dinamik egnee jisheetei buten
Lekts13.  dinamik egnee jisheetei butenLekts13.  dinamik egnee jisheetei buten
Lekts13. dinamik egnee jisheetei buten
 
Бизнесийн хэлбэрүүд
Бизнесийн хэлбэрүүдБизнесийн хэлбэрүүд
Бизнесийн хэлбэрүүд
 
Lecture №3
Lecture №3Lecture №3
Lecture №3
 
Маркетингийн үндэс
Маркетингийн үндэсМаркетингийн үндэс
Маркетингийн үндэс
 
тойм статистик лекц 2
тойм статистик лекц 2тойм статистик лекц 2
тойм статистик лекц 2
 
Lesson31
Lesson31Lesson31
Lesson31
 
Маркетингийн орчин
Маркетингийн орчин Маркетингийн орчин
Маркетингийн орчин
 
Lekts2. statistik ajilglalt
Lekts2.  statistik ajilglaltLekts2.  statistik ajilglalt
Lekts2. statistik ajilglalt
 

Semelhante a Stat bolovsruulalt1

Lekts10 shugaman zagvariin parametr
Lekts10 shugaman zagvariin parametrLekts10 shugaman zagvariin parametr
Lekts10 shugaman zagvariin parametr
Anhaa8941
 
Lecture_4_Numerical_Descriptive_Measures.pdf
Lecture_4_Numerical_Descriptive_Measures.pdfLecture_4_Numerical_Descriptive_Measures.pdf
Lecture_4_Numerical_Descriptive_Measures.pdf
ariusahui2023
 
Lekts5 tarhaltiin tsuvaanii dundaj, helbelzliin uzuuleltuud
Lekts5 tarhaltiin tsuvaanii dundaj, helbelzliin uzuuleltuud Lekts5 tarhaltiin tsuvaanii dundaj, helbelzliin uzuuleltuud
Lekts5 tarhaltiin tsuvaanii dundaj, helbelzliin uzuuleltuud
Anhaa8941
 
hugatsaanii tsuvaa
hugatsaanii tsuvaahugatsaanii tsuvaa
hugatsaanii tsuvaa
Turu Turuu
 
Descriptive statistic
Descriptive statisticDescriptive statistic
Descriptive statistic
altaamecs
 
экстраполяци хийх энгийн арга
экстраполяци хийх энгийн аргаэкстраполяци хийх энгийн арга
экстраполяци хийх энгийн арга
Serod Khuyagaa
 
Lekts9 shugaman regress korr shinjilgee
Lekts9 shugaman regress korr shinjilgeeLekts9 shugaman regress korr shinjilgee
Lekts9 shugaman regress korr shinjilgee
Anhaa8941
 
Таамаглал шалгах
Таамаглал шалгахТаамаглал шалгах
Таамаглал шалгах
serod_hsum
 

Semelhante a Stat bolovsruulalt1 (20)

Lekts 6
Lekts 6Lekts 6
Lekts 6
 
Lekts10 shugaman zagvariin parametr
Lekts10 shugaman zagvariin parametrLekts10 shugaman zagvariin parametr
Lekts10 shugaman zagvariin parametr
 
bs4-1
bs4-1bs4-1
bs4-1
 
Lecture_4_Numerical_Descriptive_Measures.pdf
Lecture_4_Numerical_Descriptive_Measures.pdfLecture_4_Numerical_Descriptive_Measures.pdf
Lecture_4_Numerical_Descriptive_Measures.pdf
 
Econ ch 4
Econ ch 4Econ ch 4
Econ ch 4
 
Ch01 03
Ch01 03Ch01 03
Ch01 03
 
Analitek geometrhicheeliin lektsiin huraangui.odon
Analitek geometrhicheeliin lektsiin huraangui.odonAnalitek geometrhicheeliin lektsiin huraangui.odon
Analitek geometrhicheeliin lektsiin huraangui.odon
 
Lekts5 tarhaltiin tsuvaanii dundaj, helbelzliin uzuuleltuud
Lekts5 tarhaltiin tsuvaanii dundaj, helbelzliin uzuuleltuud Lekts5 tarhaltiin tsuvaanii dundaj, helbelzliin uzuuleltuud
Lekts5 tarhaltiin tsuvaanii dundaj, helbelzliin uzuuleltuud
 
Econ ch 1
Econ ch 1Econ ch 1
Econ ch 1
 
нямдаваа (2)
нямдаваа (2)нямдаваа (2)
нямдаваа (2)
 
hugatsaanii tsuvaa
hugatsaanii tsuvaahugatsaanii tsuvaa
hugatsaanii tsuvaa
 
Ханшийн нөлөөлөл
Ханшийн нөлөөлөлХаншийн нөлөөлөл
Ханшийн нөлөөлөл
 
Tootson bodoh matematic lekts
Tootson bodoh matematic lektsTootson bodoh matematic lekts
Tootson bodoh matematic lekts
 
asdasda
asdasdaasdasda
asdasda
 
spss
spssspss
spss
 
Descriptive statistic
Descriptive statisticDescriptive statistic
Descriptive statistic
 
Таамаглал шалгах
Таамаглал шалгахТаамаглал шалгах
Таамаглал шалгах
 
экстраполяци хийх энгийн арга
экстраполяци хийх энгийн аргаэкстраполяци хийх энгийн арга
экстраполяци хийх энгийн арга
 
Lekts9 shugaman regress korr shinjilgee
Lekts9 shugaman regress korr shinjilgeeLekts9 shugaman regress korr shinjilgee
Lekts9 shugaman regress korr shinjilgee
 
Таамаглал шалгах
Таамаглал шалгахТаамаглал шалгах
Таамаглал шалгах
 

Mais de Akhyt (20)

ЛЕКЦ №2.pdf
ЛЕКЦ №2.pdfЛЕКЦ №2.pdf
ЛЕКЦ №2.pdf
 
СЕМИНАР №6.pdf
СЕМИНАР №6.pdfСЕМИНАР №6.pdf
СЕМИНАР №6.pdf
 
СЕМИНАР №7.pdf
СЕМИНАР №7.pdfСЕМИНАР №7.pdf
СЕМИНАР №7.pdf
 
ЛЕКЦ №4.pdf
ЛЕКЦ №4.pdfЛЕКЦ №4.pdf
ЛЕКЦ №4.pdf
 
СЕМИНАР №2.pdf
СЕМИНАР №2.pdfСЕМИНАР №2.pdf
СЕМИНАР №2.pdf
 
ЛЕКЦ №1.pdf
ЛЕКЦ №1.pdfЛЕКЦ №1.pdf
ЛЕКЦ №1.pdf
 
СЕМИНАР №1.pdf
СЕМИНАР №1.pdfСЕМИНАР №1.pdf
СЕМИНАР №1.pdf
 
ЛЕКЦ №3.pdf
ЛЕКЦ №3.pdfЛЕКЦ №3.pdf
ЛЕКЦ №3.pdf
 
БИЕ ДААЛТ ЛЕКЦ №3.pdf
БИЕ ДААЛТ ЛЕКЦ №3.pdfБИЕ ДААЛТ ЛЕКЦ №3.pdf
БИЕ ДААЛТ ЛЕКЦ №3.pdf
 
БИЕ ДААЛТ ЛЕКЦ №4.pdf
БИЕ ДААЛТ ЛЕКЦ №4.pdfБИЕ ДААЛТ ЛЕКЦ №4.pdf
БИЕ ДААЛТ ЛЕКЦ №4.pdf
 
БИЕ ДААЛТ ЛЕКЦ №2.pdf
БИЕ ДААЛТ ЛЕКЦ №2.pdfБИЕ ДААЛТ ЛЕКЦ №2.pdf
БИЕ ДААЛТ ЛЕКЦ №2.pdf
 
СЕМИНАР №4.pdf
СЕМИНАР №4.pdfСЕМИНАР №4.pdf
СЕМИНАР №4.pdf
 
БИЕ ДААЛТ ЛЕКЦ №1.pdf
БИЕ ДААЛТ ЛЕКЦ №1.pdfБИЕ ДААЛТ ЛЕКЦ №1.pdf
БИЕ ДААЛТ ЛЕКЦ №1.pdf
 
Day 1
Day 1Day 1
Day 1
 
Indesign -surah_bichig__
Indesign  -surah_bichig__Indesign  -surah_bichig__
Indesign -surah_bichig__
 
Articulate quizmaker
Articulate quizmakerArticulate quizmaker
Articulate quizmaker
 
Internet
InternetInternet
Internet
 
Adobe photoshop
Adobe photoshopAdobe photoshop
Adobe photoshop
 
Day 4
Day 4Day 4
Day 4
 
Day 3
Day 3Day 3
Day 3
 

Stat bolovsruulalt1

  • 1. Статистик боловсруулалт. Эмнэлэг, биологийн өгөгдлүүдэд математик статистикийн аргуудын тусламжтайгаар боловсруулалт хийж судалгааны ажлынхаа чиглэлийг тогтоох, үр дүнгээ онолын үндэслэлтэй баталгаажуулах нь чухал. Статистик боловсруулалт нь эмнэлэг, биологийн үзүүлэлтийн ямар нэг аргаар цуглуулсан өгөгдөл дээр шинжилгээ хийж тодорхой тайлбар өгөх, чиг хандлагыг тодорхойлоход ашиглагдана. Ямар нэг X хэмжигдэхүүн өгөгджээ. Х хэмжигдэхүүн гэдэг нь тухайлбал “уушигны архаг үрэвсэлтэй хүмүүсийн өдөрт дундажаар татдаг тамхины тоо”, “ямар нэг өвчнөөр өвчлөгсөдийн эмийн зардал”, гэх мэт та бүхний сонирхон судлаж байгаа янз бүрийн үзүүлэлтүүд байж болно. X нь санамсаргүй хэмжигдэхүүн байна. Учир нь судалгаанд хамрагдаж байгаа тухайн объект ямар ч үр дүн үзүүлж болзошгүй билээ. Энэ санамсаргүй хэмжигдэхүүнийг судлах шаардлагатай гэе. Уг хэмжигдэхүүний хувьд nxxx ,,, 21  гэсэн ажиглалтын (туршилтын) утгууд өгөгдсөн байг. nxxx ,,, 21  тоонуудыг түүвэр гэх ба түүвэр нь Х хэмжигдэхүүнийг судлахын тулд та бүхний олж цуглуулсан тоонууд юм. Энэ ажиглалтын утгуудаар x хэмжигдэхүүнийг бүхэлд нь тодорхойлох хэрэгтэй болж байна. Анхны n ширхэг түүврийн дотор kyyy ,,, 21  k ширхэг өөр утга байг. Эдгээр утгуудын абсолют давтамжуудыг харгалзан kHHH ,,, 21  гэж тэмдэглэе. Тэгвэл харьцангуй давтамжууд ),1(; ki тооажиглалтын тамжАбсалютдав n H h i i байна. Жишээ 1. Уушигны архаг үрэвсэлтэй хүмүүсийн өдөрт дундажаар татдаг тамхины тоо дараах байдлаар өгөгджээ. n=40: {12,18,6,10,9,5,8,11,14,11,12,15,8,17,12,6,7,12,13,9,11,20,7,14,13,12,13,19, 15,12,8,15,11,14,14,9,7,15,6,11} Энд k=16 ба үүнийг ашиглан давтамжийн таблиц буюу статистик эгнээг байгуулбал: y(i) H(i) h(i) ∑h(i) 5 1 0.025 0.025 6 3 0.075 0.1 7 3 0.075 0.175 8 3 0.075 0.25 9 3 0.075 0.325 10 1 0.025 0.35 11 5 0.125 0.475 12 6 0.15 0.625 13 3 0.075 0.7 14 4 0.1 0.8 15 4 0.1 0.9 16 0 0 0.9 17 1 0.025 0.925 18 1 0.025 0.95 19 1 0.025 0.975 20 1 0.025 1 Нийлбэр 40 1 - Хүснэгт ¹1
  • 2. Зураг ¹1 Зураг ¹2 Ажиглалтын утгуудын авч болох бүх боломжит утгуудын олонлогыг эх олонлог гэнэ. Эх олонлог нь тоологдом элементтэй бол уг хэмжигдэхүүнийг дискрет санамсаргүй хэмжигдэхүүн гэнэ (Жишээ 1). Эсрэг тохиолдолд тасралтгүй санамсаргүй хэмжигдэхүүн гэнэ. Тасралтгүй санамсаргүй хэмжигдэхүүнийг судлахын тулд дээрхи жишээтэй адилаар давтамжийн таблицийг байгуулах нь ямар ч үр дүнгүй. Иймээс статистик эгнээг санамсаргүй хэмжигдэхүүний утгуудын олонлогыг интервалуудад хувааж байгуулдаг. Тухайлбал Жишээ 1-ийн өгөгдлөөр статистик эгнээг дараах байдлаар байгуулж болно. интервал H(i) h(i) ∑h(i) [5;7[ 4 0.1 0.1 [7;9[ 6 0.15 0.15 [9;11[ 4 0.1 0.1 [11;13[ 11 0.275 0.275 [13;15[ 7 0.175 0.175 [15;17[ 4 0.1 0.1 [17;19[ 2 0.05 0.05 [19;20] 2 0.05 0.05 Нийлбэр 40 1 - Хүснэгт ¹2
  • 3. Зураг ¹3 Зураг ¹4 Жишээ 2. Ямар нэг өвчнөөр өвчлөгсөдийн хэвтэн эмчлүүлсэн эмийн зардал: Өвчтөнүүдийн эмийн зардал дараахь хүснэгтээр өгөгдөв. Анги Зарцуулалт тоо h(i) 1 0-10000 233 0.085411 2 10000-20000 354 0.129765 3 20000-30000 498 0.182551 4 30000-40000 621 0.227639 5 40000-50000 501 0.183651 6 50000-60000 332 0.121701 7 60000-70000 189 0.069282 2728 1 Хүснэгт ¹3 Ажиглалтын интервалд түүврийн харьцангуй давтамжийг харгалзуулсан дараах хэлбэрийн дүрслэлийг гистограмм гэнэ (Зураг ¹1,3,5). Гистограммын хэрчмийн дундажуудыг холбосон тахир шугамыг полигон гэнэ (Зураг ¹4,6).
  • 4. 0 0.05 0.1 0.15 0.2 0.25 0-10000 10000- 20000 20000- 30000 30000- 40000 40000- 50000 50000- 60000 60000- 70000 Зураг ¹5 Зураг ¹6 Гистограмм ба полигоноос үндэслэн судалж байгаа санамсаргүй хэмжигдэхүүн тоон шулуун дээр яаж тархсаныг тодорхойлж болно. Yүнийг санамсаргүй хэмжигдэхүүний нягтын функц гэнэ. Полигон нь санамсаргүй хэмжигдэхүүний тархалтын нягтын функцийн ойролцоо дүрслэл юм. Практикт хамгийн элбэг тохиолддог тархалт нь хэвийн тархалт юм. (Зураг ¹7) Зураг ¹7 Хэвийн тархалттай санамсаргүй хэмжигдэхүүний нягтын функцийн томъѐо дараах ерөнхий хэлбэртэй байна. ; 2 1 2 2 2 )( x ey
  • 5. Зарим тасралтгүй санамсаргүй хэмжигдэхүүний нягтын функц Зарим тасралтгүй санамсаргүй хэмжигдэхүүний нягтын функцийн график
  • 6.
  • 7. Түүврийн тоон характеристикууд. Санамсаргүй хэмжигдэхүүний дундаж: ; 1 )( 1 1 21 n i in x n xxx n x  - Арифметик дундаж. Yүний зэрэгцээ дараахь байдлаар тодорхойлогдсон медиан гэж нэрлэгдэх хэмжигдэхүүнийг өргөн ашигладаг. Анх өгөгдсөн nxxx ,,, 21  түүврийг багаас нь их рүү нь эрэмбэлэх замаар )()2()1( ,,, nxxx  гэсэн эрэмблэгдсэн цувааг зохиоѐ. Энд )()2()1( nxxx  байна. Тэгвэл түүврийн медиан n – сондгой бол ; ) 2 1 ( nxm - дундах утга, n – тэгш бол );( 2 1 )1 2 () 2 ( nn xxm - дундах хоѐр утгын дундаж байна. Жишээ 3. n-сондгой үед: n=11, {5,7,8,3,4,9,14,2,7,10,12}- түүвэр өгөгдсөн байг. Эрэмблэгдсэн цуваа нь {2,3,4,5,7,7,8,9,10,12,14} болно. ;7)6( ) 2 111 ( xxm байна. Жишээ 4. n – тэгш үед: n=10, {9,7,3,14,17,9,8,10,5,2} - түүвэр өгөгдсөн байг. Эрэмблэгдсэн цуваа нь {2,3,5,7,8,9,9,10,14,17} болно. ;5.8)98( 2 1 )( 2 1 )( 2 1 )6()5( )1 2 10 () 2 10 ( xxxxm байна. Түүврийн медианы гол шинж нь ажиглалтын бүх утгуудын 50-аас багагүй % нь m медианаас ихгүй утга авдаг, мөн 50-аас багагүй % нь их буюу тэнцүү утга авдаг байна. Тасралтгүй санамсаргүй хэмжигдэхүүний нягтын функц өгөгдсөн үед медиан нь нягтын функцийн график болон OX тэнхлэг хоѐрын хооронд хашигдсан хэсгийн талбайг таллан хуваагч босоо шулууны координат байна. Зураг ¹3 Хамгийн их давтамжтай хэмжигдэхүүний утгыг түүврийн моод гэж нэрлээд modx гэж тэмдэглэнэ. modx нь нягтын функцийг максимумд хүргэх утга. Санамсаргүй хэмжигдэхүүний хазайлт: Санамсаргүй хэмжигдэхүүний дундаж нь түүний авах утгуудын дундаж байрлалыг заадаг бол энэ дундаж байрлалаас санамсаргүй хэмжигдэхүүний авах утгууд дундажаар хир хазайх хазайлтыг дисперс хэмээх тоон характеристик тодорхойлдог. Дисперс буюу дундаж квадрат хазайлт нь ;)( 1 1 1 22 n i i xx n s томъѐогоор бодогдоно. ;)( 1 1 1 2 n i i xx n s -стандарт хазайлт гэнэ. Жишээлбэл ; 2 1 2 2 2 )(x ey тархалтын нягт бүхий хэвийн тархалтын хувьд x , ;s байдаг. Хэвийн тархалтын хувьд ],[ sxsx интервалд ойролцоогоор бүх ажиглалтын утгуудын 68% байрлана. ]2,2[ sxsx интервалд ойролцоогоор 95%, ]3,3[ sxsx интервалд ойролцоогоор 99.7% нь байрлана.
  • 8. Корреляцийн коэффициент. Судалж буй хэмжигдэхүүнүүдийн хоорондын хамаарлыг тодорхойлдог тоон характеристикийг корреляцийн коэффициент гэнэ. ),(,),,(),,( 2211 nn yxyxyx  гэсэн ажиглалтын хос утгууд өгөгдсөн байг. Корреляцийн коэффициент дараахь томъѐогоор олдоно. ; )()( )()( 1 2 1 2 1 n i i n i i n i ii yyxx yyxx r Yүнийг Пирсоны корреляцийн коэффициент гэнэ. 11 r байна. r нь 1-д ойртох тусам x,y санамсаргүй хэмжигдэхүүний хамаарлын хүч сул нягт маш нягт гэсэн чиглэлд өөрчлөгдөнө. Жишээ ¹5. 10000 хүнд ноогдох дотрын их эмчийн тоо, нас баралтын тоо дараахь хүснэгтээр өгөгджээ. /1999 оны дүн/. Эдгээрийн хамаарлын хүчийг тооцоѐ. Их эмч нас баралт Архангай 1.92 63 Баян Өлгий 1.63 20 Баянхонгор 1.3 92 Булган 0.75 45 Говь Алтай 1.48 72 Говь Сүмбэр 3.82 15 Дархан Уул 1.9 36 Дорноговь 1.19 43 Дорнод 2.01 43 Дундговь 1.65 30 Завхан 0.86 44 Орхон 2.59 23 Өвөрхангай 1.02 81 Өмнөговь 1.3 43 Сүхбаатар 3.01 34 Сэлэнгэ 1.48 64 Төв 1.77 55 Увс 2.01 52 Ховд 1.39 73 Хөвсгөл 1.53 94 Хэнтий 1.03 45 Корреляцийн коэф -0.48533 Корреляцийн анализ. Судалж байгаа хэмжигдэхүүнүүдийн хоорондын хамаарлыг үнэлэхэдээ ажиглалтын утгуудыг ашигладаг. Ө.х. корреляцийн коэффициентийн ойролцоо утгыг олсон. Иймд бид ажиглалтын утгуудыг ашиглаж олсон корреляцийн коэффициентодоо хэдэн хувийн магадлалтай итгэж болох вэ? гэсэн асуудал гарч ирнэ. Yүний тулд 0:0H гэсэн таамаглал дэвшүүлье. 2n чөлөөний зэрэг бүхий Стьюдентийн тархалтын ; 1 2 2 r n rtàæ утгыг шалгана. Стьюдентийн тархалтын таблицаас 2, 2 n t утгыг олно. 2, 2 n àæ tt бол 0:0H таамаглалыг няцаана. Ө.х. x,y хэмжигдэхүүнүүдийг корреляци хамааралтай гэж үзнэ. ( 0:1H ). Энэ нь r корреляцийн коэффициентод 1 магадлалтайгаар итгэж болно гэсэн үг. 2, 2 n àæ tt бол 0:0H таамаглалыг хүлээж авна. x,y хэмжигдэхүүнүүдийг корреляци хамааралгүй гэж үзнэ.
  • 9. Жишээ ¹6. 10000 хүнд ноогдох дотрын их эмчийн тоо, нас баралтын тоо хоѐрын хамаарал r -г таамаглалаар шалгая. Их эмч нас баралт 1 Архангай 1.92 63 2 Баян Өлгий 1.63 20 3 Баянхонгор 1.3 92 4 Булган 0.75 45 5 Говь Алтай 1.48 72 6 Говь Сүмбэр 3.82 15 7 Дархан Уул 1.9 36 8 Дорноговь 1.19 43 9 Дорнод 2.01 43 10 Дундговь 1.65 30 11 Завхан 0.86 44 12 Орхон 2.59 23 13 Өвөрхангай 1.02 81 14 Өмнөговь 1.3 43 15 Сүхбаатар 3.01 34 16 Сэлэнгэ 1.48 64 17 Төв 1.77 55 18 Увс 2.01 52 19 Ховд 1.39 73 20 Хөвсгөл 1.53 94 21 Хэнтий 1.03 45 Корреляцийн коэф -0.48532697 t аж -2.41954934 ;09.2 221, 2 05.0 2, 2 tt n 19,025.0ttàæ байгаа тул r=-0.48532697 ач холбогдолтой гэдэгт итгэх магадлал нь 1-0.05=0.95 буюу x,y хэмжигдэхүүнүүд хоорондоо хамааралтай. Регрессийн анализ. ),(,),,(),,( 2211 nn yxyxyx  гэсэн 2 хэмжээст түүвэр өгөгджээ. Корреляцийн коэффициентийг бодож энэ 2 хэмжигдэхүүн хоорондоо функцэн хамааралтай эсэхийг тогтоосон бол регрессийн анализаар ийм хамаарлуудын хэлбэрийг тогтоож, ойролцоогоор байгуулах болно. Статистик хамааралтай хэмжигдэхүүнүүдээс функцэн хамаарлыг илрүүлэхийн тулд юуны түрүүнд ямар хэлбэртэй хамаарал байж болохыг тодорхойлох хэрэгтэй. Yүний тулд OX тэнхлэг дээр хүчин зүйлийн шинж тэмдэг буюу үл хамаарах хувьсагчийг, OY тэнхлэг дээр үр дүнгийн шинж тэмдэг буюу хамаарах хувьсагчийг авч өгөгдсөн цэгүүдийг байгуулна. Тэдгээрийг хамгийн оновчтой илэрхийлэх функц буюу регрессийн тэгшитгэлийг тодорхойлно. Регрессийн тэгшитгэлийн параметрүүдийг ажиглалтын утгуудын тусламжтайгаар тооцож гаргана. Энэ зорилгод параметрийг үнэлэхэд өргөн ашигладаг ХБКАргыг хэрэглэнэ.
  • 10. Шугаман регресс. Өгөгдсөн хос хэмжигдэхүүнүүдийн хамаарал шугаман функцээр тодорхойлогдох боломжтой гэе. y=ax+b; Энд a,b үл мэдэгдэх параметрүүд. Ажиглалтын утгуудаар байгуулсан цэгүүдэд хамгийн ойр байхаар y=ax+b; шулуун байгуулах буюу уг шулууны a,b үл мэдэгдэх параметрүүдийг олох шаардлагатай. niyx ii ,1),( - туршилтын утга. nibaxx ii ,1),( - онолын утга. Туршилтын утга ба онолын утгын ялгаврыг алдаа гэж нэрлээд nii ,1; гэж тэмдэглэе. nibaxy iii ,1);( алдаануудын квадратуудын нийлбэр хамгийн бага байхаар a, b -г олно гэдэг нь min))(( 1 2 1 2 n i ii n i i baxyS буюу олон хувьсагчийн функцийн экстремумын олох бодлогод шилжинэ. Yүний тулд n i i n i i n i ii n i i n i i ybnxa yxxbxa b S a S 11 111 2 0 0 систем тэгшитгэлийг бодож a,b -г олдог билээ.
  • 11. Жишээ ¹7. 10000 хүнд ноогдох дотрын их эмчийн тоо, нас баралтын тоо дараахь хүснэгтээр өгөгджээ. /1999 оны дүн/. Их эмч нас баралт Булган 0.75 45 Завхан 0.86 44 Өвөрхангай 1.02 81 Хэнтий 1.03 45 Дорноговь 1.19 43 Баянхонгор 1.3 92 Өмнөговь 1.3 43 Ховд 1.39 73 Говь Алтай 1.48 72 Сэлэнгэ 1.48 64 Хөвсгөл 1.53 94 Баян Өлгий 1.63 20 Дундговь 1.65 30 Төв 1.77 55 Дархан Уул 1.9 36 Архангай 1.92 63 Дорнод 2.01 43 Увс 2.01 52 Орхон 2.59 23 Сүхбаатар 3.01 34 Говь Сүмбэр 3.82 15 0 10 20 30 40 50 60 70 80 90 100 0.75 1.02 1.19 1.3 1.48 1.53 1.65 1.9 2.01 2.59 3.82
  • 12. Шилжих дундажийн аргаар засварлавал: Их эмч нас баралт* 0.86 56.6666667 1.02 56.6666667 1.03 56.3333333 1.19 60 1.3 59.3333333 1.3 69.3333333 1.39 62.6666667 1.48 69.6666667 1.48 76.6666667 1.53 59.3333333 1.63 48 1.65 35 1.77 40.3333333 1.9 51.3333333 1.92 47.3333333 2.01 52.6666667 2.01 39.3333333 2.59 36.3333333 3.01 24 0 10 20 30 40 50 60 70 80 90 0.86 1.03 1.3 1.39 1.48 1.63 1.77 1.92 2.01 3.01 a -17.9287 b 82.00235 y= -17.9287*x+82.00235. Регрессийн тэгшитгэлийн стандарт алдаа. Регрессийн тэгшитгэлээр гарган авч байгаа bxay ixi онолын утгуудын найдвартай эсэх нь регрессийн шугамын ойролцоох ажиглалтын утгуудын алдаагаар тодорхойлогдоно. Энэ алдааны их, багыг үзүүлж буй хэмжигдэхүүнийг регрессийн тэгшитгэлийн стандарт алдаа гэж нэрлэх бөгөөд дараахь томъѐогоор олдоно. ; )( 1 2 kn yy n i xi yx i Энд k регрессийн тэгшитгэл дэхь параметрийн тоо. a ба b параметрүүдийн стандарт хазайлтууд ; )( 1 1 2 n i i yxa xx S ; )( 1 1 2 2 n i i yxb xx x n S томъѐонуудаар олдоно. Регрессийн шугаман загварын параметрийн итгэлтэй эсэхийг таамаглалаар шалгах.
  • 13. Туршилтын n ширхэг хос утгыг ашиглан x,y санамсаргүй хэмжигдэхүүнүүдийн хоорондын хамаарлыг ойролцоогоор y=ax+b; олсон. x,y санамсаргүй хэмжигдэхүүнүүдийн жинхэнэ хамаарлыг ;21 iii xy гэвэл ;, 21 ba гэж олдсон гэсэн үг. Регрессийн шугаман тэгшитгэлийн a,b параметрүүд нийт x,y санамсаргүй хэмжигдэхүүнүүдийн хувьд тохирох эсэхийг шалгах шаардлагатай. Yүний тулд дараахь таамаглалуудыг шалгадаг. a параметрийн хувьд: 0: 10H таамаглалыг шалгая. Эсрэг таамаглал нь )0:( 11H . ; a àæ S a t утгыг олно. Стьюдентийн t тархалтын таблицаас 2, 2 n t утгыг олж, 2, 2 n àæ tt бол 0: 10H таамаглалыг няцаана. 0: 11H таамаглалыг хүлээж авна. Энэ нь a параметрийн утга ач холбогдолтойг харуулна. Харин 2, 2 n àæ tt бол 0: 10H таамаглалыг хүлээж авах буюу a параметрийн утгыг ач холбогдолгүй гэж үзнэ. Хэрвээ 0: 10H таамаглалыг няцаасан бол a параметрийн итгэх завсарыг дараахь байдлаар байгуулна. [,] 2, 2 2, 2 a n a n StaSta Ө.х. a параметрийн жинхэнэ утгыг дээрхи интервалд байна гэдэгт 1 магадлалтайгаар итгэж болно гэсэн үг. b параметрийг дээрхитэй адилаар үнэлнэ. Шугаман бус регресс. ),(),,(),,( 2211 nn yxyxyx  хэмжигдэхүүнүүд шугаман хамааралтай биш ямар нэгэн муруйгаар зурагдах хамааралтай байг. Энэ үед уг хамаарал нь ямар төрлийн муруй болох ө.х. y -нь x - ээс ойролцоогоор ямар функцээр хамаарч байгааг тогтоох нь чухал юм. Жишээ болгож 1. ; bxa x y - гипербол, 2. ;a xby - зэрэгт функц буюу логарифм муруй,
  • 14. 3. ;x b eay - экспоненциал функц 4. ;2 cxbxay - парабол функцын ангиудыг авч үзье. 1. Гипербол Хэрэв өгөгдсөн цэгүүд ; bxa x y гипербол муруйтай ойролцоо оршиж байна гэж үзвэл энэхүү гипербол муруйн а,b параметрийг ХБКАргаар олно. ; 11 ; b x a ybxa x y болно. ; 1 *; 1 * x x y y гэж орлуулбал ;** bxay болж y*,x* хэмжигдэхүүнүүдийн хувьд шугаман регрессийн бодлогод шилжинэ. Анхны өгөгдлүүдээс ),(),,(),,( *** 2 * 2 * 1 * 1 nn yxyxyx  утгуудыг бодож олно. n k k n k k n k kk n k k n k k ybnxa yxxbxa 1 * 1 * 1 ** 1 * 1 2* )( Систем тэгшитгэлийг бодож a,b -г олно. 2. Зэрэгт функц буюу логарифм муруй lg/;a xby lgy=lgb+algx; болно. ;lg*;lg* xxyy гэж орлуулбал ;lg** bxay болж y*,x* хэмжигдэхүүнүүдийн хувьд шугаман регрессийн бодлогод шилжинэ. Анхны өгөгдлүүдээс ),(),,(),,( *** 2 * 2 * 1 * 1 nn yxyxyx  утгуудыг бодож олно.
  • 15. n k k n k k n k kk n k k n k k ybnxa yxxbxa 1 * 1 * 1 ** 1 * 1 2* lg lg)( Систем тэгшитгэлийг бодож a,lgb -г олно. lgb олдсон тул энэ утгыг ашиглаж b-г олно. 3. Экспоненциал функц ;x b eay функцийн хувьд ;)( 1 bx eay гэдгээс x eX 1 гэж орлуулбал ;b Xay болж дээрхитэй ижилээр бодогдоно. 4. Парабол Хэрэв өгөгдсөн цэгүүд ;2 cxbxay параболтой ойролцоо оршиж байна гэж үзвэл энэхүү параболын a,b,c параметрүүдийг олоходоо мөн л ХБКАргыг хэрэглэнэ. Туршилтын утгуудад хамгийн ойр параболыг байгуулна гэдэг нь алдааны квадратуудын нийлбэр хамгийн байхаар a,b,c -г олно гэсэн үг. min))(( 1 22 n i iii cxbxayS Олон хувьсагчийн функцын экстремум байх зайлшгүй нөхцөл ѐсоор n i ii n i i n i i n i i n i ii n i i n i i n i i n i i n i i n i i yxxcxbxa yxxcxbxa yxcxban c S b S a S 1 2 1 4 1 3 1 2 11 3 1 2 1 11 2 1 0 0 0 (1) Систем тэгшитгэлийг бодож a,b,c -г олно. Жишээ ¹8. Ажилласан жил ба хөдөлмөрийн бүтээмжийн хоорондын хамаарал дараахь хүснэгтээр өгөгдөв. x y 1 1 7 2 3 17 3 6 16 4 8 29 5 12 26 0 5 10 15 20 25 30 35 1 3 6 8 12 Дээрхи өгөгдөлийн хувьд (1) системийг бодвол: a 0.385 b 4.02 c -0.1765
  • 16. гэж олдоно. Ингэснээр ажилласан жил, хөдөлмөрийн бүтээмж хоѐрын хоорондын хамаарал ;1765.002.485.3 2 xxy регрессийн тэгшитгэлээр илэрхийлэгдэнэ. Детерминацийн коэффициент Регрессийн шинжилгээнд дараахь 3 квадратлаг хэлбэрийг ашигладаг. 1. ;)( 1 2 n i i yySST - туршилтын утгуудын хазайлтуудын квадратуудын нийлбэр 2. ;)( 1 2 n i x yySSR i - регрессийн утгуудын хазайлтуудын квадратуудын нийлбэр 3. ;)( 1 2 n i xi i yySSE - алдааны (үлдэгдлийн) квадратуудын нийлбэр Энд iy - ажиглалтын утга y - ажиглалтын утгуудын арифметик дундаж ixy - регрессийн тэгшитгэлээр тооцсон онолын утга. Эдгээр квадратуудын нийлбэрүүдийн хувьд дараахь томъѐо хүчинтэй. SST=SSR+SSE; /:SST ;1 SST SSE SST SSR (*) Энэ тэгшитгэлийн эхний харьцааг детерминацийн коэффициент гэж нэрлээд ;2 SST SSR R гэж тэмдэглэнэ. Детерминацийн коэффициент 0-1 хооронд утга авах бөгөөд хамаарах хувьсагч (y) - д үл хамаарах хувьсагч (x) хэдэн хувийн нөлөө үзүүлж байгааг заана. (*) тэгшитгэлийн хоѐр дахь харьцаа нь бусад хүчин зүйлийн нөлөөллийн хувийг заана. Жишээ ¹9. Ажилласан жил ба хөдөлмөрийн бүтээмжийн хоорондын хамааралын детерминацийн коэффициентийг тодорхойльѐ. y(i) y(x(i)) y(x(i))-y кв y(i)-y кв 7 7.69 11.31 127.92 -12 144 17 14.32 4.68 21.9 -2 4 16 21.61 2.61 6.81 -3 9 29 24.71 5.71 32.6 10 100 26 26.67 7.67 58.83 7 49 248.06 306 ;81.02 R гэж гарна. Энэ нь ажилсан жил хөдөлмөрийн бүтээмжийн 81 орчим хувийг тодорхойлдог бөгөөд 19 орчим хувь нь бусад хүчин зүйлээс (нас, боловсрол, авъяас . . .) хамаардаг байна