Bài giảng 4 dưới đây sẽ cung cấp những nguyên tắc cơ bản cũng như cách kiểm định giả thuyết với các phạm trù dữ liệu khác nhau.
Nguyên tắc cơ bản của kiểm định giả thuyết
Phương pháp kiểm định giả thuyết
Z - Kiểm định giá trị trung bình (biết σ)
P – giá trị tiếp cận để kiểm định giả thiết
Ước lượng khoảng tin cậy
Kiểm định 1 tail
T-test giả thuyết cho giá trị trung bình
Z-test giả thuyết cho tỉ lệ
2. Kiểm định giả thuyết với các phạm trù dữ liệu
X2 kiểm định sự khác biệt giữa 2 tỷ lệ (biến độc lập)
X2 kiểm định khác biệt giữa các tỷ lệ (biến độc lập)
X2 kiểm định Độc lập
Các tài liệu tham khảo sau đây là kiến thức cơ bản, giúp hiểu nội dung của bài giảng:
_ Patrick Dattalo, Xác định kích thước mẫu: Sự cân bằng về , sự chính xác, và tính thực tiễn, Oxford University Press Hoa Kỳ, 2008 (Chương 2 và Chương 3)
_ JAMES T. McCLAVE, P. GEORGE BENSON, TERRY SlNClCH, Khóa học đầu tiên trong số liệu thống kê kinh doanh, Prentice Hall; 8 ấn bản năm 2000 (Chương 1 và Chương 2)
_ Mario F. Triola, Thống kê cơ bản, Addison Wesley; 9 ấn bản, 2003 (Chương 6 và Chương 7)
Để biết thêm chi tiết về các hoạt động và nghiên cứu của DEPOCEN truy cập:
Website: http://depocen.org/vn/
LinkedIn: http://linkd.in/1GnHrHB
Facebook: DEPOCEN
"Challenges of financial regulation in the post crisis world"- "Những thách t...
(4) Giới thiệu về thống kê cho các ngành khoa học xã hội_Bài giảng 4: Kiểm định giả thuyết
1. Giới thiệu về thống kê
DEPOCEN
Chương 6
Cơ bản về kiểm định giả thuyết:
kiểm định một mẫu
2. Chủ đề
•Các phương pháp kiểm định giả thuyết
•Z -test trung bình (σ biết)
• p-Value trong kiểm định giả thuyết
•Liên hệ với ước lượng khoảng tin cậy
•Kiểm định một phía
• t -test cho trung bình
•Z -test cho tỉ lệ
4. Là câu giả sử trong phép kiểm định
e.g. trung bình số TV bán được trong 1h ít nhất
là 3 (H0: µ ≥ 3)
Bắt đầu với giả sử rằng giả thuyết “trống”
là đúng TRUE.
Giả thuyết “trống”, H0
•Giả thuyết “trống” có thể chấp nhận hoặc bác
bỏ
5. Là ngược lại với giả thuyết “trống”
e.g. trung bình số TV bán được trong 1h nhỏ
hơn 3 (H1: µ < 3)
Đối thuyết có thể chấp nhận hoặc không
Đối thuyết, H1
6. Các bước:
Đặt giả thuyết “trống” (H0: µ ≥ 3)
Xác định đối thuyết (H1: µ < 3)
Trong một vài tình huống, đối thuyết sẽ dễ
được xác định trước tiên.
Định nghĩa bài toán
7. Tổng thể
Giả sử
Tuổi trung bình
Tổng thể là 50
Giả thuyết “trống”
Loại bỏ
Trung bình
Mẫu là 20
MẫuGiả thuyết trống
50?20 =≅= µXIs
Quy trình kiểm định giả
thuyết
No, not likely!
8. Sample Meanµ = 50
Sampling Distribution
Ta có một
mẫu có trung
bình là ...
... Trong tình huống
này, đây là trung bình
tổng thể
... Tuy nhiên, ta
loại bỏ giả
thuyết vì µ = 50.
20
H0
Lí do loại bỏ H0
9. Xác định giá trị của thống kê mẫu mà khả năng
giả thuyết “trống” không xảy ra là đúng, còn
được gọi là miền bác bỏ phân phối mẫu (bác bỏ
giả thuyết)
Kí hiệu: α (alpha)
Một vài giá trị cụ thể: 0.01, 0.05, 0.10
Được chọn bởi người nghiên cứu ngay lúc bắt
đầu
Cho ta giá trị giới hạn của phép kiểm định
Mức ý nghĩa, α
10. Mức ý nghĩa, α và miền
bác bỏ
H0: µ ≥ 3
H1: µ < 3
0
0
0
H0: µ ≤ 3
H1: µ > 3
H0: µ = 3
H1: µ ≠ 3
α
α
α/2
Giá trị
giới hạn
Miền bác bỏ
11. Sai lầm loại I:
Loại bỏ giả thuyết trống khi nó đúng
Đưa đến một hậu quả nghiêm trọng
Xác suất của sai lầm loại I là α
Gọi là mức ý nghĩa
Sai lầm loại II:
Không bác bỏ khi giả thuyết trống sai
Xác suất của sai lầm loại II là β (Beta)
Các sai lầm khi lựa chọn
12. H0
Hypothesis Test
Trường hợp
Quyết định H0 True H0 False
Không
Bác bỏ
H0
1 - α
Type II
Error (β )
Bác bỏ
H0
Type I
Error
(α )
Power
(1 - β)
Các khả năng
14. Giá trị thực của tham số tổng thể
Tăng khi sự sai khác giữa tham số giả thuyết trống và
giá trị thực giảm
Mức ý nghĩa α
Tăng khi α giảm
Độ lệch chuẩn tổng thể σ
Tăng khi σ tăng
Cỡ mẫu n
Tăng khi n giảm
Các tác nhân ảnh hưởng sai lầm loại II: β
α
β
β σ
β
n
15. Chuyển từ thống kê mẫu(e.g., ) sang biến
ngẫu nhiên chuẩn tắc Z
So sánh với giá trị giới hạn của Z
Nếu thống kê Z nằm trong miền giới hạn, bác bỏ H0;
ngược lại không bác bỏ H0
Thống kê Z-Test (σ biết)
Thống kê Z
X
n
XX
Z
X
X
σ
µ
σ
µ −
=
−
=
16. • Là giá trị nhỏ nhất mà H0 có thể bị bác bỏ, gọi là mức
ý nghĩa quan sát:
P-giá trị = P(D | H1 đúng), với D: là 1 miền
Không tr c ti p cho ta k t lu n v giự ế ế ậ ề ả
thuy t mà ch gián ti p cho ta k t lu n v ế ỉ ế ế ậ ề
vi c ch p nh n và bác b đ i thuy tệ ấ ậ ỏ ố ế
Được sử dụng khi đưa ra quyết định:
Nếu p-giá trị ≥ α, không bác bỏ H0
Nếu p-giá trị < α, bác bỏ H0
Kiểm định p-giá trị
17. 1. Xác định H0 H0: µ ≥ 3
2. Xác định H1 H1 : µ < 3
3. Chọn α α = .05
4. Chọn cỡ mẫu n n = 100
5. Chọn kiểm định Z Test (or p Value)
Kiểm định giả thuyết: các bước
trung bình số TV bán được trong
1h ít nhất là 3 (H0: µ ≥ 3)
18. 6. Xác định giá trị giới hạn Z = -1.645
7. thu thập số liệu 100 values
8. tính toán thống kê kiểm định Computed Test Stat.= -2
9. đưa ra kết luận thống kê bác bỏ giả thuyết
10. Thể hiện kết luận thống kê trung bình số TV bán được
trong 1h nhỏ hơn 3
Kiểm định giả thuyết: các bước
(continued)
19. Giả sử:
Tổng thể có phân phối chuẩn
Nếu không chuẩn, ta dùng cỡ mẫu lớn
Giả thuyết trống chỉ có dấu ≤ or ≥
Thống kê kiểm định Z:
Kiểm định Z 1-phía đối
với trung bình (σ biết)
n
xx
z
x
x
σ
µ
σ
µ −
=
−
=
20. Z0
α
Reject H0
Z0
Reject H0
α
H0: µ ≥ 0
H1: µ < 0
H0: µ ≤ 0
H1: µ > 0
Mức ý nghĩa phải nhỏ
hơn µ = 0
Giá trị nhỏ nhất không mâu
thuẫn H0!
Miền bác bỏ
21. Có trung bình bao nhiêu hộp
ngũ cốc chứa nhiều hơn 368
grams? Một mẫu ngẫu nhiên
gồm 25 có X = 372.5. Công
ty có độ sai lệch lý thuyết là
σ = 15 grams. Hãy kiểm
định với mức ý nghĩa
α=0.05.
368 gm.
Ví dụ kiểm định 1-phía
H0:
µ ≤ 368
H1: µ > 368
_
22. Z .04 .06
1.6 .5495 .5505 .5515
1.7 .5591 .5599 .5608
1.8 .5671 .5678 .5686
.5738 .5750
Z0
σZ = 1
1.645
.50
-.05
.45
.05
1.9 .5744
Standardized Normal
Probability Table (Portion)
What Is Z Given α = 0.05?
α = .05
Tìm giá trị giới hạn:
1-phía
Giá trị giới
hạn= 1.645
23. α = 0.05
n = 25
Giá trị giới hạn: 1.645
Thống kê kiểm định:
Kết luận:
Tức là:
Không bác bỏ với α = .05
Không có chứng cớ xác
thực là trung bình lớn
hơn hoặc bằng 368
Z0 1.645
.05
Reject
Example Solution: One Tail
H0: µ ≤ 368
H1: µ > 368
50.1=
−
=
n
X
Z
σ
µ
24. Z0 1.50
p Value
.0668
Z Value of Sample
Statistic
From Z Table:
Lookup 1.50
.9332
Sử dụng đối
thuyết để
tính trực
tiếp phép
kiểm định
1.0000
- .9332
.0668
p –giá trị = P(Z ≥ 1.50) = 0.0668
p Value Solution
25. 0 1.50 Z
Reject
(p Value = 0.0668) ≥ (α = 0.05).
Không thể bác bỏ.
p Value = 0.0668
α = 0.05
Test Statistic Is In the Do Not Reject Region
p Value Solution
26. Có bao nhiêu hộp ngũ cốc có
trọng lượng 368 gram? Một
mẫu ngẫu nhiên gồm 25 hộp
có X = 372.5. Công ty có
độ sai lệch lý thuyết là σ =
15 grams. Hãy kiểm định
với mức ý nghĩa α=0.05.
368 gm.
Ví dụ kiểm định hai phía
H0: µ = 368
H1: µ ≠ 368
27. α = 0.05
n = 25
Giá trị giới hạn: ±1.96
Thống kê kiểm định:
Kết luận:
Tức là:
Không thể bác bỏ với α = .05
Không có chứng cứ rõ
ràng khẳng định trung
bình không bằng 368
Z0 1.96
.025
Reject
Example Solution: Two Tail
-1.96
.025
H0: µ = 386
H1: µ ≠ 386
50.1
25
15
3685.372
=
−
=
−
=
n
X
Z
σ
µ
28. Liên hệ với khoảng tin cậy
Cho X = 372.5, σ = 15 and n = 25,
The 95% Confidence Interval is:
372.5 - (1.96) 15/ 25 to 372.5 + (1.96) 15/ 25
or
366.62 ≤ µ ≤ 378.38
nếu khoảng tin cậy chứa trung bình của giả
thuyết (368), ta không thể bác bỏ giả thuyết
trống, nếu ngược lại thì ta bác bỏ.
_
29. Giả sử:
Tổng thể có phân phối chuẩn
Nếu không chuẩn, ta chỉ sử dụng được khi biết phân
phối hơi nghiêng & cỡ mẫu lớn
Kiểm định tham số:
Thống kê t:
t-kiểm định: σ không biết
n
S
X
t
µ−
=
30. Ví dụ: kiểm định 1-phía với t-Test
Có bao nhiêu hộp ngũ cốc chứa
nhiều hơn 368 grams? Biết một
mẫu ngẫu nhiên gồm 36 hộp có
X = 372.5, và S = 15. hãy kiểm
định với α=0.01.
368 gm.
H0: µ ≤ 368
H1: µ >
368
σ is not
given,
_
31. α = 0.01
n = 36, df = 35
Giá trị giới hạn: 2.4377
Test Statistic:
Kết luận:
Tức là:
Không thể bác bỏ với α = .01
Không có chứng cứ rõ ràng
khẳng định trung bình thực
tế lớn hơn 368
Z0 2.4377
.01
Reject
Example Solution: One Tail
H0: µ ≤ 368
H1: µ > 368
80.1
36
15
3685.372
=
−
=
−
=
n
S
X
t
µ
32. Liên quan đến các biến định tính
Là % của biến định tính trong tổng thể
Nếu xuất hiện 2 biến định tính, ta có phân phối 2 chiều.
Mẫu tỉ lệ(ps):
Tỉ lệ
sizesample
successesofnumber
n
X
ps ==
33. Ví dụ: dùng kiểm định Z cho tỉ lệ
•Bài toán: một công ty marketing nhận
được 4% phản hồi từ dịch vụ Mail.
•Cách tiếp cận: để kiểm tra, họ tiến hành
khảo sát 500 người với 25 phản hồi.
•Yêu cầu: kiểm định với α = .05
34. α = .05
n = 500
Không thể bác bỏ vớiKhông thể bác bỏ với α = .05
Z Test for Proportion:
H0: p = .04
H1: p ≠ .04
Critical Values: ± 1.96
Thống kê kiểm định:
Kết luận:
Tức là:
Không đủ chứng cứ khẳng
định rằng tỉ lệ công ty nhận
được phản hồi là 4% .
Z ≅
p - p
p (1 - p)
n
s
=
.04 -.05
.04 (1 - .04)
500
= 1.14
Z0
Reject Reject
.025.025