Enviar pesquisa
Carregar
Kirk' Experimental Design, Chapter 2
•
1 gostou
•
1,510 visualizações
Kevin Chun-Hsien Hsu
Seguir
如何進行隨機化分配?
Leia menos
Leia mais
Dados e análise
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 50
Baixar agora
Baixar para ler offline
Recomendados
Kirk' Experimental Design, Chapter 4
Kirk' Experimental Design, Chapter 4
Kevin Chun-Hsien Hsu
repeated-measure-ANOVA
repeated-measure-ANOVA
Kevin Chun-Hsien Hsu
Kirk' Experimental Design, Chapter 5
Kirk' Experimental Design, Chapter 5
Kevin Chun-Hsien Hsu
Kirk' Experimental Design, Chapter 3
Kirk' Experimental Design, Chapter 3
Kevin Chun-Hsien Hsu
等級檢定
等級檢定
clinic
Kirk' Experimental Design, Chapter 1
Kirk' Experimental Design, Chapter 1
Kevin Chun-Hsien Hsu
Chi square
Chi square
Kevin Chun-Hsien Hsu
Statistical computing 00
Statistical computing 00
Kevin Chun-Hsien Hsu
Recomendados
Kirk' Experimental Design, Chapter 4
Kirk' Experimental Design, Chapter 4
Kevin Chun-Hsien Hsu
repeated-measure-ANOVA
repeated-measure-ANOVA
Kevin Chun-Hsien Hsu
Kirk' Experimental Design, Chapter 5
Kirk' Experimental Design, Chapter 5
Kevin Chun-Hsien Hsu
Kirk' Experimental Design, Chapter 3
Kirk' Experimental Design, Chapter 3
Kevin Chun-Hsien Hsu
等級檢定
等級檢定
clinic
Kirk' Experimental Design, Chapter 1
Kirk' Experimental Design, Chapter 1
Kevin Chun-Hsien Hsu
Chi square
Chi square
Kevin Chun-Hsien Hsu
Statistical computing 00
Statistical computing 00
Kevin Chun-Hsien Hsu
[1062BPY12001] Data analysis with R / April 26
[1062BPY12001] Data analysis with R / April 26
Kevin Chun-Hsien Hsu
[1062BPY12001] Data analysis with R / April 19
[1062BPY12001] Data analysis with R / April 19
Kevin Chun-Hsien Hsu
[1062BPY12001] Data analysis with R / week 4
[1062BPY12001] Data analysis with R / week 4
Kevin Chun-Hsien Hsu
[1062BPY12001] Data analysis with R / week 3
[1062BPY12001] Data analysis with R / week 3
Kevin Chun-Hsien Hsu
[1062BPY12001] Data analysis with R / week 2
[1062BPY12001] Data analysis with R / week 2
Kevin Chun-Hsien Hsu
語言議題
語言議題
Kevin Chun-Hsien Hsu
Regression 0410
Regression 0410
Kevin Chun-Hsien Hsu
Statistical computing 03
Statistical computing 03
Kevin Chun-Hsien Hsu
Statistical computing 01
Statistical computing 01
Kevin Chun-Hsien Hsu
Multiple regression
Multiple regression
Kevin Chun-Hsien Hsu
Model III ANOVA & Simple Main Effects
Model III ANOVA & Simple Main Effects
Kevin Chun-Hsien Hsu
Essentials of EEG/MEG
Essentials of EEG/MEG
Kevin Chun-Hsien Hsu
APA style
APA style
Kevin Chun-Hsien Hsu
資料檢索
資料檢索
Kevin Chun-Hsien Hsu
R intro 20140716-basic
R intro 20140716-basic
Kevin Chun-Hsien Hsu
R intro 20140716-advance
R intro 20140716-advance
Kevin Chun-Hsien Hsu
Mais conteúdo relacionado
Mais de Kevin Chun-Hsien Hsu
[1062BPY12001] Data analysis with R / April 26
[1062BPY12001] Data analysis with R / April 26
Kevin Chun-Hsien Hsu
[1062BPY12001] Data analysis with R / April 19
[1062BPY12001] Data analysis with R / April 19
Kevin Chun-Hsien Hsu
[1062BPY12001] Data analysis with R / week 4
[1062BPY12001] Data analysis with R / week 4
Kevin Chun-Hsien Hsu
[1062BPY12001] Data analysis with R / week 3
[1062BPY12001] Data analysis with R / week 3
Kevin Chun-Hsien Hsu
[1062BPY12001] Data analysis with R / week 2
[1062BPY12001] Data analysis with R / week 2
Kevin Chun-Hsien Hsu
語言議題
語言議題
Kevin Chun-Hsien Hsu
Regression 0410
Regression 0410
Kevin Chun-Hsien Hsu
Statistical computing 03
Statistical computing 03
Kevin Chun-Hsien Hsu
Statistical computing 01
Statistical computing 01
Kevin Chun-Hsien Hsu
Multiple regression
Multiple regression
Kevin Chun-Hsien Hsu
Model III ANOVA & Simple Main Effects
Model III ANOVA & Simple Main Effects
Kevin Chun-Hsien Hsu
Essentials of EEG/MEG
Essentials of EEG/MEG
Kevin Chun-Hsien Hsu
APA style
APA style
Kevin Chun-Hsien Hsu
資料檢索
資料檢索
Kevin Chun-Hsien Hsu
R intro 20140716-basic
R intro 20140716-basic
Kevin Chun-Hsien Hsu
R intro 20140716-advance
R intro 20140716-advance
Kevin Chun-Hsien Hsu
Mais de Kevin Chun-Hsien Hsu
(16)
[1062BPY12001] Data analysis with R / April 26
[1062BPY12001] Data analysis with R / April 26
[1062BPY12001] Data analysis with R / April 19
[1062BPY12001] Data analysis with R / April 19
[1062BPY12001] Data analysis with R / week 4
[1062BPY12001] Data analysis with R / week 4
[1062BPY12001] Data analysis with R / week 3
[1062BPY12001] Data analysis with R / week 3
[1062BPY12001] Data analysis with R / week 2
[1062BPY12001] Data analysis with R / week 2
語言議題
語言議題
Regression 0410
Regression 0410
Statistical computing 03
Statistical computing 03
Statistical computing 01
Statistical computing 01
Multiple regression
Multiple regression
Model III ANOVA & Simple Main Effects
Model III ANOVA & Simple Main Effects
Essentials of EEG/MEG
Essentials of EEG/MEG
APA style
APA style
資料檢索
資料檢索
R intro 20140716-basic
R intro 20140716-basic
R intro 20140716-advance
R intro 20140716-advance
Kirk' Experimental Design, Chapter 2
1.
2013-03-5 (@世新大學社心系) 實驗設計 樣本與實驗操弄:如何進行隨機化分配? 13年3月5⽇日星期⼆二
2.
關於作業 ✤ 請在今天決定分組,每一組上限四人 ✤ 每組繳一份作業,請回答下列這些題目: ✤
Kirk Ch 1, Review Exercise: 3, 4, 5, 9, 10, 11 ✤ Kirk Ch 2, Review Exercise: 2, 4, 5, 9, 10, 12, 13, 15, 17, 19 ✤ 格式:請以 word 檔交件。字體12 point,1.5行高。每一題之間要分 頁,作答的字數請限制在一頁之內。第一行請以章節、題號開始。 ✤ 繳交期限:3月 11日 13年3月5⽇日星期⼆二
3.
Previously in Experimental
Design... ✤ 上週介紹實驗法的基本概念: ✤ manipulation: 操弄 ✤ 研究者操弄一個或數個獨變項 ✤ random assignment ✤ 採用隨機分配的方式排除干擾變項 ✤ observation/ measurement ✤ 觀察依變項 ✤ 本週進一步介紹基本的實驗設計類型 13年3月5⽇日星期⼆二
4.
實驗設計類型 ✤ t test
for independent samples 獨立樣本t 檢定 ✤ Completely Randomized Design (CRD) 完全隨機化設計 ✤ Randomized Block Design (RBD) 隨機化區集設計 ✤ Latin Square Design (LSD) 拉丁方格 ✤ Completely Randomized Factorial Design (CRFD) 完全隨機化複因子 設計 13年3月5⽇日星期⼆二
5.
✤ t test
for independent samples 獨立樣本t 檢定 ✤ 用法:從兩個母群抽樣並且估計各自的平均值,然後檢驗平均值是 否相等。 ✤ 統計假設: 13年3月5⽇日星期⼆二
6.
✤ t test
for independent samples 獨立樣本t 檢定 ✤ 用法:從兩個母群抽樣並且估計各自的平均值,然後檢驗平均值是 否相等。 ✤ 統計假設: ✤ H0: µ1 - µ2 = 0 ✤ H1: µ1 - µ2 ≠ 0 13年3月5⽇日星期⼆二
7.
✤ t test
for independent samples 獨立樣本t 檢定 ✤ 範例:比較兩種矯正煙癮的治療方式的效果,以每天消耗的香煙數 量當作依變項。 ✤ 受試者 (Si) ✤ i = 1~30 ✤ IV: 治療方式 (A) ✤ aj ; j = 1, 2 ✤ DV: Yij Levels Group1 Subjects1 Subjects2 : : Subjects15 a1 a1 : : a1 Group2 Subjects16 Subjects17 : : Subjects30 a2 a2 : : a2 13年3月5⽇日星期⼆二
8.
✤ Completely Randomized
Design (CRD, CR-p) 完全隨機化設計 ✤ p: 實驗組別的數量 ✤ 用法:獨變項的組別數量有三組以上,觀察各組的依變項之平均值 有無差異。 ✤ 統計假設: 13年3月5⽇日星期⼆二
9.
✤ Completely Randomized
Design (CRD, CR-p) 完全隨機化設計 ✤ p: 實驗組別的數量 ✤ 用法:獨變項的組別數量有三組以上,觀察各組的依變項之平均值 有無差異。 ✤ 統計假設: ✤ H0: µ1 = µ2 = µ3 ✤ H1: µj ≠ µj’ for some j and j’, j ≠ j’ 13年3月5⽇日星期⼆二
10.
✤ Completely Randomized
Design (CRD, CR-p) 完全隨機化設計 ✤ 範例:比較三種矯正煙癮的治療方式的效果,以每天消耗的香煙數 量當作依變項。 ✤ 受試者 (Si) ✤ i = 1~45 ✤ IV: 治療方式 (A) ✤ aj ; j = 1, 2, 3 ✤ DV: Yij Levels Group1 Subjects1 Subjects2 : : Subjects15 a1 a1 : : a1 Group2 Subjects16 Subjects17 : : Subjects30 a2 a2 : : a2 Group3 Subjects31 Subjects32 : : Subjects45 a3 a3 : : a3 13年3月5⽇日星期⼆二
11.
✤ DV 的表現主要來自五個效果: 1.獨變項
IV (aj) 2.個別受試者,或者實驗情境的限制 3.受試者每次表現反應時隨機的變動 4.測量/紀錄 過程的誤差 5.其他無法排除的干擾變項 ✤ 前述的“煙癮治療”研究的測量值如何被這些因素影 響? 13年3月5⽇日星期⼆二
12.
✤ DV: Yij ✤
i: 受試者; j: 實驗組別 (treatment) ✤ Y17,2 = 3 ✤ 第17號受試者在第二個實驗組別下的測量值為 3 ✤ 以煙癮治療的例子來說: ✤ 第17號受試者接受第二種治療方式之後每日消耗3根 香煙 13年3月5⽇日星期⼆二
13.
✤ Completely Randomized
Design (CRD, CR-p) 完全隨機化設計 ✤ 範例:針對45位受試者比較三種矯正煙癮的治療方式的效果,以每 天消耗的香煙數量當作依變項。 ✤ Yij = µ + "j + #i(j) (i = 1,..., n; j = 1,...,p) Yij 受試者 i 在第 j 個實驗組別下的依變項 µ 母群的平均值,各實驗組別平均觀察值(µ1, µ2, µ3)的總平均值。µ 為固定值。 "j (alpha) 第j個實驗組別的效果,等於該組平均值與母群平均值的 差異量(µj–µ)。同一個實驗組別之下每個觀察值有一樣的 "j。 #i(j) (epsilon) Yij的殘差值,等於 Yij – µ – "j。 13年3月5⽇日星期⼆二
14.
✤ 干擾因素可以分為可控制的與不可控制的兩類。 ✤ 隨機化
(randomization) ✤ 不可控制的因素可利用隨機化程序來削減其影響,比如受試者的氣 質。 ✤ 隨機指定哪些受試者應該接受哪些處理(treatments),以及實驗進行的 次序(order)。 ✤ 區集 (blocking) ✤ 將可控制的因素變成區集(Blocks),同一個區集之內受試者的狀態盡 量一致。 隨機化與區集 13年3月5⽇日星期⼆二
15.
✤ dependent samples
相依樣本 ✤ 針對受試者的氣質進行控制,確保不同實驗組別之間的差別來自獨 變項的影響。 ✤ 消除內在校度的威脅 (threats of internal validity) ✤ 採用相依樣本的時候「隨機分配」以及「分析」的做法都比獨立樣 本的情況更為複雜。下列各種狀況都視為相依樣本: ✤ 受試者接受每一種實驗組別,重複測量(repeated measure)各種組別 之下的表現 ✤ 先測量某個與研究議題有關的指標,然後採用這個指標將受試者 分成數個區集(blocking, subject matching) ✤ 搜集許多組雙胞胎,或者採用來自同一個家庭成長的個體 ✤ 由受試者自己指定的匹配對象 13年3月5⽇日星期⼆二
16.
✤ 以相依樣本的方式來改進煙癮治療研究: ✤ IV:
兩種治療程序 ✤ DV: 持續治療六個月之後每天抽幾根煙 ✤ 假設每個受試者只能接受一種實驗組別,不適合進行重複測量。 ✤ 什麼因素會影響 DV的效果? ✤ e.g.: 接受治療之前每天抽幾根煙? ✤ 根據治療前的抽煙習慣將受試者分組,將每一個區集的受試者隨 機分到實驗組別之下。 13年3月5⽇日星期⼆二
17.
✤ 以相依樣本的方式來改進煙癮治療研究: ✤ 根據治療前的抽煙習慣將受試者分組,
將每一個區集的受試者隨機分到實 驗組別之下。 ✤ LevelsLevels Block1 a1 a2 Block2 a1 a2 Block3 a1 a2 : : : Block15 a1 a2 Levels Group1 Subjects1 Subjects2 : : Subjects15 a1 a1 : : a1 Group2 Subjects16 Subjects17 : : Subjects30 a2 a2 : : a2 13年3月5⽇日星期⼆二
18.
✤ Randomized Block
Design (RBD, RB-p) 隨機化區集設計 ✤ p: 實驗組別的數量 ✤ 用法:獨變項的組別數量有三組以上, 將受試者依照某個特性分成 區集,然後將各區集之下的受試者隨機分配到實驗組別之下。 ✤ e.g.: 將45個受試者分成15個區集 ✤ 統計假設: ✤ 如果第二個虛無假設不成立,代表將某個干擾效果移除殘差項。 ✤ H0: µ.1 = µ.2 = µ.3 ✤ H0: µ1. = µ2. = ⋯⋯ = µ15. ✤ H1: µ.j ≠ µ.j’ for some j and j’, j ≠ j’ LevelsLevelsLevels Block1 a1 a2 a3 Block2 a1 a2 a3 Block3 a1 a2 a3 : : : : Block15 a1 a2 a3 13年3月5⽇日星期⼆二
19.
✤ Randomized Block
Design (RBD, RB-p) 隨機化區集設計 ✤ Yij = µ + "j + $i + #ij (i = 1,..., n; j = 1,...,p) LevelsLevelsLevels Block1 a1 a2 a3 Block2 a1 a2 a3 Block3 a1 a2 a3 : : : : Block15 a1 a2 a3 Yij 受試者 i 在第 j 個實驗組別下的依變項 µ 母群的平均值。µ為固定值。 "j (alpha) 第j個實驗組別的效果,等於該組平均 值與母群平均值的差異量(µ.j–µ)。同一個實驗 組別之下每個觀察值有一樣的 "j。 $i (pi) 第i個區集的效果,等於該區集平均值與母 群平均值的差異量(µ i.–µ)。 #i(j) (epsilon) Yij的殘差值,等於 Yij – µ – "j – $i。 13年3月5⽇日星期⼆二
20.
✤ Completely Randomized
Design (CRD, CR-p) 完全隨機化設計 ✤ Yij = µ + "j + #i(j) (i = 1,..., n; j = 1,...,p) ✤ #ij = Yij – µ – "j ✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計 ✤ Yij = µ + "j + $i + #ij (i = 1,..., n; j = 1,...,p) ✤ #ij = Yij – µ – "j – $i 13年3月5⽇日星期⼆二
21.
✤ Completely Randomized
Design (CRD, CR-p) 完全隨機化設計 ✤ #ij = Yij – µ – "j ✤ ∑∑#2 = ∑∑(Yij – µ – "j)2 ✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計 ✤ #ij = Yij – µ – "j – $i ✤ ∑∑#2 = ∑∑(Yij – µ – "j – $i)2 ✤ 採用 RB-p 設計來進行變異數分析時,其殘差平方和不包含區集的效 果,並且小於 CR-p的殘差平方和。 ✤ RB-p 設計可以提供比較大的F統計值,較容易拒絕H0。 13年3月5⽇日星期⼆二
22.
✤ Latin Square
Design (LSD, LS-p) 拉丁方格 ✤ p: 實驗組別的數量 ✤ 特點:排除兩個干擾變項 ✤ 用法:將受試者依照兩個特性分成區集,然後將各區集之下的受試 者隨機分配到實驗組別之下。兩種特性的區集數量必須和實驗組別 一樣。 ✤ e.g.: 觀察三種治療方式。根據治療前每天抽煙數量、抽煙年數定出 九個區集(3 x 3)。 < 1 年 1~5年 >5年 c1 c2 c3 <1包 b1 a1 a2 a3 1~3包 b2 a2 a3 a1 >3包 b3 a3 a1 a2 13年3月5⽇日星期⼆二
23.
✤ Latin Square
Design (LSD, LS-p) 拉丁方格 ✤ p: 實驗組別的數量 ✤ 特點:排除兩個干擾變項 ✤ 用法:將受試者依照兩個特性分成區集,然後將各區集之下的受試 者隨機分配到實驗組別之下。兩種特性的區集數量必須和實驗組別 一樣。 ✤ e.g.: 觀察三種治療方式。根據治療前每天抽煙數量、抽煙年數定出 九個區集(3 x 3)。 ✤ 統計假設: ✤ H0: µ1.. = µ2.. = µ3.. (實驗組別的平均表現一致) ✤ H0: µ.1. = µ.2. = µ.3. (第一類區集的平均值無差異) ✤ H0: µ..1 = µ..2 = µ..3 (第二類區集的平均值無差異) 13年3月5⽇日星期⼆二
24.
✤ Completely Randomized
Design (CRD, CR-p) 完全隨機化設計 ✤ Yij = µ + "j + #i(j) ✤ ∑∑#2 = ∑∑(Yij – µ – "j)2 ✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計 ✤ Yij = µ + "j + $i + #ij ✤ ∑∑#2 = ∑∑(Yij – µ – "j – $i)2 ✤ Latin Square Design (LSD, LS-p) 拉丁方格 ✤ Yij = µ + "j + !k + "l + $i + #ij ✤ ∑∑#2 = ∑∑(Yij – µ – "j – !k – "l – $i)2 13年3月5⽇日星期⼆二
25.
✤ 目前為止介紹了三種基本的實驗設計,而且都只考量一個獨變項。 ✤ CR-p
完全隨機化設計 ✤ 無法排除任何干擾變項的影響。 ✤ RB-p 隨機化區集設計 ✤ 針對一個干擾變項將受試者分成數個區集,觀察區集的效果,同 時減少殘差項 (∑∑#2)。 ✤ LS-p 拉丁方格 ✤ 針對兩個干擾變項將受試者分成數個區集,兩種區集的數量與實 驗組別一樣。有效的 LS-p可以取得更小的殘差項。 13年3月5⽇日星期⼆二
26.
✤ Completely Randomized
Factorial Design (CRF-pq) 完全隨機化複因子 設計 ✤ 特點:觀察兩種獨變項各自的效果,以及兩者的交互作用。 ✤ e.g.: 室內光照(5燭光, 30燭光)與字體大小(9-point, 12-point, 15-point)對 閱讀速度的影響 ✤ 實驗組別: a1b1、 a1b2、 a1b3、 a2b1、 a2b2、 a2b3 ✤ 將受試者隨機分配到各實驗組別,然後進行二因子變異數分析。 13年3月5⽇日星期⼆二
27.
✤ Completely Randomized
Factorial Design (CRF-pq) 完全隨機化複因子 設計 ✤ 特點:觀察兩種獨變項各自的效果,以及兩者的交互作用。 ✤ e.g.: 室內光照(5燭光, 30燭光)與字體大小(9-point, 12-point, 15-point)對 閱讀速度的影響 ✤ Yijk = µ + "j + !k + ("!)jk + #i(jk) ✤ Yijk 受試者 i 在每一種實驗組合之下的表現 µ 母群的平均值。µ為固定值。 "j 第一個獨變項的j個實驗組別的效果,等於該組平 均值與母群平均值的差異量(µ.j–µ)。 &k 第二個獨變項的k個實驗組別的效果,等於該組 平均值與母群平均值的差異量(µ.k–µ)。 ("&)jk 交互作用 #i(j) (epsilon) Yij的殘差值,等於 Yij – µ – "j – $i。 13年3月5⽇日星期⼆二
28.
✤ Completely Randomized
Factorial Design (CRF-pq) 完全隨機化複因子 設計 ✤ 特點:觀察兩種獨變項各自的效果,以及兩者的交互作用。 ✤ e.g.: 室內光照(5燭光, 30燭光)與字體大小(9-point, 12-point, 15-point)對 閱讀速度的影響 ✤ 統計假設: ✤ H0: µ1. = µ2. ✤ H0: µ.1 = µ.2 = µ.3 ✤ H0: µjk – µj’k – µjk’ + µj’k’ = 0 ✤ 室內光照之主效果 (main effect) ✤ 字體大小之主效果 (main effect) ✤ 交互作用 (interaction) 13年3月5⽇日星期⼆二
29.
有交互作用 無交互作用 從趨勢來看: (a): 高光度情況下的閱讀速度較快。9-point字體大小的閱讀速度最 慢,12、15-point兩種情況下似乎沒有差異。另外,15-point之下的 光度的效果在較另外兩種字體不明顯。 (b):
高光度情況下的閱讀速度較快。9-point字體大小的閱讀速度最 慢,12、15-point兩種情況下似乎沒有差異。字體大小及光照沒有 交互作用。 13年3月5⽇日星期⼆二
30.
關於實驗設計的幾個步驟 ✤ 列出與研究主題相關的獨變項、依變項、干擾變項 ✤ 選擇受試的單位以及數量 ✤
決定分配受試者、實驗刺激的方式 ✤ 選擇統計方法,進行推論統計(statistical inference) 13年3月5⽇日星期⼆二
31.
推論統計(statistical inference) ✤ 研究假設:吸煙會造成高血壓 ✤
實務上,研究者無法觀察母群的每個人來檢視這個研究假設,但是可以 使用“推論統計”,以實驗設計的方式觀察有無吸煙的兩組小樣本的高 血壓發生率,藉此來推斷母群的表現。 ✤ 一般推論統計的做法有兩種: ✤ 假設檢定 (hypothesis testing) ✤ 信賴區間 (interval estimation) 13年3月5⽇日星期⼆二
32.
假設檢定(hypothesis testing) ✤ 將「研究主題預測的效果」轉換成「對立假設
(H1)」。比如,有吸煙 習慣者的血壓比無吸煙者的還要高: ✤ H1: µ1–µ2 > 0; or H1: β> 0 ✤ 任何非 H1 的狀況就是「虛無假設 (H0)」 ✤ H0: µ1–µ2 ≤ 0; or H0: β≤ 0 13年3月5⽇日星期⼆二
33.
假設檢定(hypothesis testing) ✤ sampling
distribution (抽樣分佈) ✤ 研究者常常從母群中隨機選出一組樣本,然後取得這組樣本的統計 值。下一次抽樣取得的統計值與先前抽樣的結果往往有差異。進行 許多次抽樣之後每一次的統計值形成一組分布,該分布稱為「 抽樣 分佈」。 ✤ central limit theorem (中央極限定理) ✤ 採用適當數量的樣本計算平均數的時後,不論母群的機率分佈的形 狀為何,抽樣分佈的形狀會趨近於常態分佈。 13年3月5⽇日星期⼆二
34.
✤ 範例:3967個中文形聲字的筆畫數、字頻(取log)、音旁結合度、義旁結 合度各自有不同的分佈形狀。 筆劃數: 字頻(log) 音旁結合度 義旁結合度 Mean =
13.13 Mean = 4.51 Mean = 7.36 Mean = 86.78 母群(N = 3967) 13年3月5⽇日星期⼆二
35.
✤ 範例:3967個中文形聲字的筆畫數、字頻(取log)、音旁結合度、義旁結 合度各自有不同的分佈形狀。 筆劃數: 字頻(log) 音旁結合度 義旁結合度 Mean =
13.13 Mean = 4.51 Mean = 7.36 Mean = 86.78 母群(N = 3967) 小樣本(N = 15) Mean = 11.93 Mean = 4.2 Mean = 9.07 Mean = 127.53 13年3月5⽇日星期⼆二
36.
✤ 範例:3967個中文形聲字的筆畫數、字頻(取log)、音旁結合度、義旁結 合度各自有不同的分佈形狀。 筆劃數: 字頻(log) 音旁結合度 義旁結合度 Mean =
13.13 Mean = 4.51 Mean = 7.36 Mean = 86.78 母群(N = 3967) 小樣本(N = 15) Mean = 11.93 Mean = 4.2 Mean = 9.07 Mean = 127.53 小樣本(N = 30) Mean = 12.86 Mean = 4.31 Mean = 7.43 Mean = 93.13 13年3月5⽇日星期⼆二
37.
✤ 採用N=15或30 重複抽樣1000次,得到1000組平均值,四種詞彙變數的 抽樣分佈都趨近於常態分佈: 筆劃數: 字頻(log) 音旁結合度 義旁結合度 Mean
= 13.13 Mean = 4.51 Mean = 7.36 Mean = 86.78 母群(N = 3967) 13年3月5⽇日星期⼆二
38.
✤ 採用N=15或30 重複抽樣1000次,得到1000組平均值,四種詞彙變數的 抽樣分佈都趨近於常態分佈: 筆劃數: 字頻(log) 音旁結合度 義旁結合度 Mean
= 13.13 Mean = 4.51 Mean = 7.36 Mean = 86.78 母群(N = 3967) 小樣本(N = 15) Mean = 13.10 Mean = 4.5 Mean = 7.4 Mean = 86.75 13年3月5⽇日星期⼆二
39.
✤ 採用N=15或30 重複抽樣1000次,得到1000組平均值,四種詞彙變數的 抽樣分佈都趨近於常態分佈: 筆劃數: 字頻(log) 音旁結合度 義旁結合度 Mean
= 13.13 Mean = 4.51 Mean = 7.36 Mean = 86.78 母群(N = 3967) 小樣本(N = 15) Mean = 13.10 Mean = 4.5 Mean = 7.4 Mean = 86.75 小樣本(N = 30) Mean = 13.14 Mean = 4.50 Mean = 7.35 Mean = 86.78 13年3月5⽇日星期⼆二
40.
假設檢定(hypothesis testing) ✤ test
statistics 檢定統計量/統計數 ✤ 驗證「統計假設」的統計數值 ✤ 比如,檢驗兩個平均數是否相等: ✤ Z 統計數 (z statistics):已知母群的標準差 ✤ T 統計數 (t statistics):未知母群的標準差 13年3月5⽇日星期⼆二
41.
✤ 即使未知母群的標準差,樣本數夠大的時候t分數的分佈曲線接近z分 數。 13年3月5⽇日星期⼆二
42.
✤ 以單一樣本T檢定為例。假設某大學的學生平均智商為 115,請問學生 會成員的智商是否高於一般學生的平均值? ✤
1. 提出統計假設 ✤ H0: µ ≤ 115 H1: µ > 115 ✤ 2. 選擇檢定統計量。未知母群的變異情況,採用T分數。 ✤ 3. 決定樣本數以及抽樣分佈:抽樣61人,其自由度為60,此時T分佈曲 線趨近於常態分佈。 ✤ 4. 指定顯著水準 (") ✤ 5. 搜集數據並且決定是否接受虛無假設 13年3月5⽇日星期⼆二
43.
✤ 4. 指定顯著水準 ✤
T分數越接近零表示樣本的平均數與期望值相似。T分數距離中央越 遠,|T| 越大,表示極有可能樣本的µ 不等於期望值,就可以拒絕 H0。根據機率函數可以將T 分數轉換為機率值,一般認為H0發生的 機率低於 0.05的時候表示可以承擔錯誤的判斷。 臨界區 臨界值 13年3月5⽇日星期⼆二
44.
✤ 4. 指定顯著水準 ✤
統計假設明確的預期統計量之間 的差異方向時採用單尾檢定: ✤ H0: µ ≤ 115 H1: µ > 115 ✤ 統計假設不預期統計量之間的差 異方向,只預期有無差異時採用 雙尾檢定: ✤ H0: µ = 115 H1: µ ≠ 115 ✤ 此時臨界值定在"/2 ✤ 比較一下,單尾/雙尾 檢定之下,哪 一種情況的臨界值距離0比較近?會 不會影響結果? 13年3月5⽇日星期⼆二
45.
✤ 依據統計檢定量作出決定的後果: ✤ 一般將
" 定在 0.05。 ✤ 將實驗數據帶入公式2.5-1可以估計β。 ✤ 1–β就是統計效果量(power),代表可以拒絕H0的機率。一般研究者 認為β大於0.8代表該研究效果值得信任。 真實情況真實情況 H0為真 H0為假 研究者的決定 無法拒絕 H0 正確接受H0 probability = 1 – " 第二類型錯誤 probability = β 研究者的決定 拒絕H0 第一類型錯誤 Type I error probability = " 正確拒絕H0 probability = 1 – β 13年3月5⽇日星期⼆二
46.
✤ 母群的平均智商為115。樣本的平均值為117.5 (n
= 61),標準差為12.5。 13年3月5⽇日星期⼆二
47.
推論統計(statistical inference) ✤ 研究假設:吸煙會造成高血壓 ✤
實務上,研究者無法觀察母群的每個人來檢視這個研究假設,但是可以 使用“推論統計”,以實驗設計的方式觀察有無吸煙的兩組小樣本的高 血壓發生率,藉此來推斷母群的表現。 ✤ 一般推論統計的做法有兩種: ✤ 假設檢定 (hypothesis testing) ✤ 信賴區間 (interval estimation) 13年3月5⽇日星期⼆二
48.
✤ 常見的信賴區間做法 (未知母群的標準差): ✤
以樣本平均數為中心,估計上限(97.5%)、下限 (2.5%) 的位置 ✤ 如果期望值介於上限、下限之內就表示無法拒絕H0 ✤ 相較於假設檢定,估計信賴區間可以提供平均值以及樣本變異的狀 況 13年3月5⽇日星期⼆二
49.
13年3月5⽇日星期⼆二
50.
「實驗設計」與「推論統計」的步驟 ✤ 1. 提出統計假設(H0
& H1) ✤ 2. 選擇檢定統計量。未知母群的 變異情況,採用T分數。 ✤ 3. 決定樣本數以及抽樣分佈。 ✤ 4. 指定顯著水準 (α) ✤ 5. 搜集數據並且決定是否接受虛 無假設 ✤ 1. 列出與研究主題相關的獨變 項、依變項、干擾變項 ✤ 2. 選擇受試的單位及數量 ✤ 3. 決定分配受試者、實驗刺激的 方式 ✤ 4. 選擇統計方法,進行推論統計 ✤ 5. 搜集數據並且決定是否接受虛 無假設 13年3月5⽇日星期⼆二
Baixar agora