SlideShare uma empresa Scribd logo
1 de 50
Baixar para ler offline
2013-03-5 (@世新大學社心系)
實驗設計
樣本與實驗操弄:如何進行隨機化分配?
13年3月5⽇日星期⼆二
關於作業
✤ 請在今天決定分組,每一組上限四人
✤ 每組繳一份作業,請回答下列這些題目:
✤ Kirk	
 Ch	
 1,	
 Review	
 Exercise:	
 3,	
 4,	
 5,	
 9,	
 10,	
 11
✤ Kirk	
 Ch	
 2,	
 Review	
 Exercise:	
 2,	
 4,	
 5,	
 9,	
 10,	
 12,	
 13,	
 15,	
 17,	
 19
✤ 格式:請以	
 word	
 檔交件。字體12	
 point,1.5行高。每一題之間要分
頁,作答的字數請限制在一頁之內。第一行請以章節、題號開始。
✤ 繳交期限:3月	
 11日
13年3月5⽇日星期⼆二
Previously in Experimental Design...
✤ 上週介紹實驗法的基本概念:
✤ manipulation:	
 操弄
✤ 研究者操弄一個或數個獨變項
✤ random	
 assignment
✤ 採用隨機分配的方式排除干擾變項
✤ observation/	
 measurement
✤ 觀察依變項
✤ 本週進一步介紹基本的實驗設計類型
13年3月5⽇日星期⼆二
實驗設計類型
✤ t test for independent samples 獨立樣本t	
 檢定
✤ Completely Randomized Design (CRD)	
 完全隨機化設計
✤ Randomized Block Design (RBD) 隨機化區集設計
✤ Latin Square Design (LSD)	
 拉丁方格
✤ Completely Randomized Factorial Design (CRFD) 完全隨機化複因子
設計
13年3月5⽇日星期⼆二
✤ t test for independent samples 獨立樣本t	
 檢定
✤ 用法:從兩個母群抽樣並且估計各自的平均值,然後檢驗平均值是
否相等。
✤ 統計假設:
13年3月5⽇日星期⼆二
✤ t test for independent samples 獨立樣本t	
 檢定
✤ 用法:從兩個母群抽樣並且估計各自的平均值,然後檢驗平均值是
否相等。
✤ 統計假設:
✤ H0: µ1 - µ2 = 0
✤ H1: µ1 - µ2 ≠ 0
13年3月5⽇日星期⼆二
✤ t test for independent samples 獨立樣本t	
 檢定
✤ 範例:比較兩種矯正煙癮的治療方式的效果,以每天消耗的香煙數
量當作依變項。
✤ 受試者	
 (Si)
✤ i	
 =	
 1~30
✤ IV:	
 治療方式	
 (A)
✤ aj	
 ;	
 j	
 =	
 1,	
 2
✤ DV:	
 Yij
Levels
Group1
Subjects1
Subjects2
:
:
Subjects15
a1
a1
:
:
a1
Group2
Subjects16
Subjects17
:
:
Subjects30
a2
a2
:
:
a2
13年3月5⽇日星期⼆二
✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計	
 
✤ p:	
 實驗組別的數量
✤ 用法:獨變項的組別數量有三組以上,觀察各組的依變項之平均值
有無差異。
✤ 統計假設:
13年3月5⽇日星期⼆二
✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計	
 
✤ p:	
 實驗組別的數量
✤ 用法:獨變項的組別數量有三組以上,觀察各組的依變項之平均值
有無差異。
✤ 統計假設:
✤ H0: µ1 = µ2 = µ3
✤ H1: µj ≠ µj’ for some j and j’, j ≠ j’
13年3月5⽇日星期⼆二
✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計	
 
✤ 範例:比較三種矯正煙癮的治療方式的效果,以每天消耗的香煙數
量當作依變項。
✤ 受試者	
 (Si)
✤ i	
 =	
 1~45
✤ IV:	
 治療方式	
 (A)
✤ aj	
 ;	
 j	
 =	
 1,	
 2,	
 3
✤ DV:	
 Yij
Levels
Group1
Subjects1
Subjects2
:
:
Subjects15
a1
a1
:
:
a1
Group2
Subjects16
Subjects17
:
:
Subjects30
a2
a2
:
:
a2
Group3
Subjects31
Subjects32
:
:
Subjects45
a3
a3
:
:
a3
13年3月5⽇日星期⼆二
✤ DV 的表現主要來自五個效果:
1.獨變項	
 IV	
 (aj)
2.個別受試者,或者實驗情境的限制
3.受試者每次表現反應時隨機的變動
4.測量/紀錄	
 過程的誤差
5.其他無法排除的干擾變項
✤ 前述的“煙癮治療”研究的測量值如何被這些因素影
響?
13年3月5⽇日星期⼆二
✤ DV: Yij
✤ i: 受試者;	
 j:	
 實驗組別	
 (treatment)
✤ Y17,2	
 =	
 3
✤ 第17號受試者在第二個實驗組別下的測量值為	
 3
✤ 以煙癮治療的例子來說:
✤ 第17號受試者接受第二種治療方式之後每日消耗3根
香煙
13年3月5⽇日星期⼆二
✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計	
 
✤ 範例:針對45位受試者比較三種矯正煙癮的治療方式的效果,以每
天消耗的香煙數量當作依變項。
✤ Yij = µ + "j + #i(j) (i = 1,..., n; j = 1,...,p)
Yij 受試者	
 i	
 在第	
 j	
 個實驗組別下的依變項
µ 母群的平均值,各實驗組別平均觀察值(µ1,	
 µ2,	
 µ3)的總平均值。µ
為固定值。
"j
(alpha) 第j個實驗組別的效果,等於該組平均值與母群平均值的
差異量(µj–µ)。同一個實驗組別之下每個觀察值有一樣的 "j。
#i(j) (epsilon) Yij的殘差值,等於	
 Yij – µ – "j。
13年3月5⽇日星期⼆二
✤ 干擾因素可以分為可控制的與不可控制的兩類。
✤ 隨機化	
 (randomization)
✤ 不可控制的因素可利用隨機化程序來削減其影響,比如受試者的氣
質。
✤ 隨機指定哪些受試者應該接受哪些處理(treatments),以及實驗進行的
次序(order)。
✤ 區集	
 (blocking)
✤ 將可控制的因素變成區集(Blocks),同一個區集之內受試者的狀態盡
量一致。
隨機化與區集
13年3月5⽇日星期⼆二
✤ dependent samples 相依樣本
✤ 針對受試者的氣質進行控制,確保不同實驗組別之間的差別來自獨
變項的影響。
✤ 消除內在校度的威脅	
 (threats	
 of	
 internal	
 validity)
✤ 採用相依樣本的時候「隨機分配」以及「分析」的做法都比獨立樣
本的情況更為複雜。下列各種狀況都視為相依樣本:
✤ 受試者接受每一種實驗組別,重複測量(repeated	
 measure)各種組別
之下的表現	
 
✤ 先測量某個與研究議題有關的指標,然後採用這個指標將受試者
分成數個區集(blocking,	
 subject	
 matching)
✤ 搜集許多組雙胞胎,或者採用來自同一個家庭成長的個體
✤ 由受試者自己指定的匹配對象
13年3月5⽇日星期⼆二
✤ 以相依樣本的方式來改進煙癮治療研究:
✤ IV:	
 兩種治療程序
✤ DV:	
 持續治療六個月之後每天抽幾根煙
✤ 假設每個受試者只能接受一種實驗組別,不適合進行重複測量。
✤ 什麼因素會影響	
 DV的效果?
✤ e.g.:	
 接受治療之前每天抽幾根煙?
✤ 根據治療前的抽煙習慣將受試者分組,將每一個區集的受試者隨
機分到實驗組別之下。
13年3月5⽇日星期⼆二
✤ 以相依樣本的方式來改進煙癮治療研究:
✤ 根據治療前的抽煙習慣將受試者分組,	
 將每一個區集的受試者隨機分到實
驗組別之下。
✤
LevelsLevels
Block1 a1 a2
Block2 a1 a2
Block3 a1 a2
: : :
Block15 a1 a2
Levels
Group1
Subjects1
Subjects2
:
:
Subjects15
a1
a1
:
:
a1
Group2
Subjects16
Subjects17
:
:
Subjects30
a2
a2
:
:
a2
13年3月5⽇日星期⼆二
✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計	
 
✤ p:	
 實驗組別的數量
✤ 用法:獨變項的組別數量有三組以上,	
 將受試者依照某個特性分成
區集,然後將各區集之下的受試者隨機分配到實驗組別之下。
✤ e.g.:	
 將45個受試者分成15個區集
✤ 統計假設:
✤ 如果第二個虛無假設不成立,代表將某個干擾效果移除殘差項。
✤ H0: µ.1 = µ.2 = µ.3
✤ H0: µ1. = µ2. = ⋯⋯ = µ15.
✤ H1: µ.j ≠ µ.j’ for some j and j’, j ≠ j’
LevelsLevelsLevels
Block1 a1 a2 a3
Block2 a1 a2 a3
Block3 a1 a2 a3
: : : :
Block15 a1 a2 a3
13年3月5⽇日星期⼆二
✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計	
 
✤ Yij = µ + "j + $i + #ij (i = 1,..., n; j = 1,...,p)
LevelsLevelsLevels
Block1 a1 a2 a3
Block2 a1 a2 a3
Block3 a1 a2 a3
: : : :
Block15 a1 a2 a3
Yij 受試者	
 i	
 在第	
 j	
 個實驗組別下的依變項
µ 母群的平均值。µ為固定值。
"j
(alpha) 第j個實驗組別的效果,等於該組平均
值與母群平均值的差異量(µ.j–µ)。同一個實驗
組別之下每個觀察值有一樣的 "j。
$i
(pi) 第i個區集的效果,等於該區集平均值與母
群平均值的差異量(µ i.–µ)。
#i(j) (epsilon) Yij的殘差值,等於	
 Yij – µ – "j – $i。
13年3月5⽇日星期⼆二
✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計	
 
✤ Yij = µ + "j + #i(j) (i = 1,..., n; j = 1,...,p)
✤ #ij = Yij – µ – "j
✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計	
 
✤ Yij = µ + "j + $i + #ij (i = 1,..., n; j = 1,...,p)
✤ #ij = Yij – µ – "j – $i
13年3月5⽇日星期⼆二
✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計	
 
✤ #ij = Yij – µ – "j
✤
∑∑#2 = ∑∑(Yij – µ – "j)2
✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計	
 
✤ #ij = Yij – µ – "j – $i
✤
∑∑#2 = ∑∑(Yij – µ – "j – $i)2
✤ 採用 RB-p 設計來進行變異數分析時,其殘差平方和不包含區集的效
果,並且小於 CR-p的殘差平方和。
✤ RB-p 設計可以提供比較大的F統計值,較容易拒絕H0。
13年3月5⽇日星期⼆二
✤ Latin Square Design (LSD, LS-p) 拉丁方格	
 
✤ p:	
 實驗組別的數量
✤ 特點:排除兩個干擾變項
✤ 用法:將受試者依照兩個特性分成區集,然後將各區集之下的受試
者隨機分配到實驗組別之下。兩種特性的區集數量必須和實驗組別
一樣。
✤ e.g.:	
 觀察三種治療方式。根據治療前每天抽煙數量、抽煙年數定出
九個區集(3	
 x	
 3)。
< 1 年 1~5年 >5年
c1 c2 c3
<1包 b1 a1 a2 a3
1~3包 b2 a2 a3 a1
>3包 b3 a3 a1 a2
13年3月5⽇日星期⼆二
✤ Latin Square Design (LSD, LS-p) 拉丁方格	
 
✤ p:	
 實驗組別的數量
✤ 特點:排除兩個干擾變項
✤ 用法:將受試者依照兩個特性分成區集,然後將各區集之下的受試
者隨機分配到實驗組別之下。兩種特性的區集數量必須和實驗組別
一樣。
✤ e.g.:	
 觀察三種治療方式。根據治療前每天抽煙數量、抽煙年數定出
九個區集(3	
 x	
 3)。
✤ 統計假設:
✤ H0: µ1.. = µ2.. = µ3.. (實驗組別的平均表現一致)
✤ H0: µ.1. = µ.2. = µ.3. (第一類區集的平均值無差異)
✤ H0: µ..1 = µ..2 = µ..3 (第二類區集的平均值無差異)
13年3月5⽇日星期⼆二
✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計	
 
✤ Yij = µ + "j + #i(j)
✤
∑∑#2 = ∑∑(Yij – µ – "j)2
✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計	
 
✤ Yij = µ + "j + $i + #ij
✤
∑∑#2 = ∑∑(Yij – µ – "j – $i)2
✤ Latin Square Design (LSD, LS-p) 拉丁方格	
 
✤ Yij = µ + "j + !k + "l + $i + #ij
✤
∑∑#2 = ∑∑(Yij – µ – "j – !k – "l – $i)2
13年3月5⽇日星期⼆二
✤ 目前為止介紹了三種基本的實驗設計,而且都只考量一個獨變項。
✤ CR-p 完全隨機化設計	
 
✤ 無法排除任何干擾變項的影響。
✤ RB-p 隨機化區集設計	
 
✤ 針對一個干擾變項將受試者分成數個區集,觀察區集的效果,同
時減少殘差項	
 (∑∑#2)。
✤ LS-p	
 拉丁方格	
 
✤ 針對兩個干擾變項將受試者分成數個區集,兩種區集的數量與實
驗組別一樣。有效的 LS-p可以取得更小的殘差項。
13年3月5⽇日星期⼆二
✤ Completely Randomized Factorial Design (CRF-pq) 完全隨機化複因子
設計	
 
✤ 特點:觀察兩種獨變項各自的效果,以及兩者的交互作用。
✤ e.g.:	
 室內光照(5燭光,	
 30燭光)與字體大小(9-point,	
 12-point,	
 15-point)對
閱讀速度的影響
✤ 實驗組別:	
 a1b1、	
 a1b2、	
 a1b3、	
 a2b1、	
 a2b2、	
 a2b3
✤ 將受試者隨機分配到各實驗組別,然後進行二因子變異數分析。
13年3月5⽇日星期⼆二
✤ Completely Randomized Factorial Design (CRF-pq) 完全隨機化複因子
設計	
 
✤ 特點:觀察兩種獨變項各自的效果,以及兩者的交互作用。
✤ e.g.:	
 室內光照(5燭光,	
 30燭光)與字體大小(9-point,	
 12-point,	
 15-point)對
閱讀速度的影響
✤ Yijk = µ + "j + !k + ("!)jk + #i(jk)
✤
Yijk 受試者	
 i	
 在每一種實驗組合之下的表現
µ 母群的平均值。µ為固定值。
"j
第一個獨變項的j個實驗組別的效果,等於該組平
均值與母群平均值的差異量(µ.j–µ)。
&k
第二個獨變項的k個實驗組別的效果,等於該組
平均值與母群平均值的差異量(µ.k–µ)。
("&)jk 交互作用
#i(j) (epsilon) Yij的殘差值,等於	
 Yij – µ – "j – $i。
13年3月5⽇日星期⼆二
✤ Completely Randomized Factorial Design (CRF-pq) 完全隨機化複因子
設計	
 
✤ 特點:觀察兩種獨變項各自的效果,以及兩者的交互作用。
✤ e.g.:	
 室內光照(5燭光,	
 30燭光)與字體大小(9-point,	
 12-point,	
 15-point)對
閱讀速度的影響
✤ 統計假設:
✤ H0: µ1. = µ2.
✤ H0: µ.1 = µ.2 = µ.3
✤ H0: µjk – µj’k – µjk’ + µj’k’ = 0
✤ 室內光照之主效果	
 (main	
 effect)
✤ 字體大小之主效果	
 (main	
 effect)
✤ 交互作用	
 (interaction)
13年3月5⽇日星期⼆二
有交互作用 無交互作用
從趨勢來看:
(a):	
 高光度情況下的閱讀速度較快。9-point字體大小的閱讀速度最
慢,12、15-point兩種情況下似乎沒有差異。另外,15-point之下的
光度的效果在較另外兩種字體不明顯。
(b):	
 高光度情況下的閱讀速度較快。9-point字體大小的閱讀速度最
慢,12、15-point兩種情況下似乎沒有差異。字體大小及光照沒有
交互作用。
13年3月5⽇日星期⼆二
關於實驗設計的幾個步驟
✤ 列出與研究主題相關的獨變項、依變項、干擾變項
✤ 選擇受試的單位以及數量
✤ 決定分配受試者、實驗刺激的方式
✤ 選擇統計方法,進行推論統計(statistical	
 inference)
13年3月5⽇日星期⼆二
推論統計(statistical inference)
✤ 研究假設:吸煙會造成高血壓
✤ 實務上,研究者無法觀察母群的每個人來檢視這個研究假設,但是可以
使用“推論統計”,以實驗設計的方式觀察有無吸煙的兩組小樣本的高
血壓發生率,藉此來推斷母群的表現。
✤ 一般推論統計的做法有兩種:
✤ 假設檢定	
 (hypothesis	
 testing)
✤ 信賴區間	
 (interval	
 estimation)
13年3月5⽇日星期⼆二
假設檢定(hypothesis testing)
✤ 將「研究主題預測的效果」轉換成「對立假設 (H1)」。比如,有吸煙
習慣者的血壓比無吸煙者的還要高:
✤ H1:	
 µ1–µ2	
 >	
 0;	
 or	
 H1:	
 β>	
 0
✤ 任何非 H1 的狀況就是「虛無假設 (H0)」
✤ H0:	
 µ1–µ2	
 ≤	
 0;	
 or	
 H0:	
 β≤	
 0
13年3月5⽇日星期⼆二
假設檢定(hypothesis testing)
✤ sampling distribution (抽樣分佈)
✤ 研究者常常從母群中隨機選出一組樣本,然後取得這組樣本的統計
值。下一次抽樣取得的統計值與先前抽樣的結果往往有差異。進行
許多次抽樣之後每一次的統計值形成一組分布,該分布稱為「	
 抽樣
分佈」。
✤ central limit theorem (中央極限定理)
✤ 採用適當數量的樣本計算平均數的時後,不論母群的機率分佈的形
狀為何,抽樣分佈的形狀會趨近於常態分佈。
13年3月5⽇日星期⼆二
✤ 範例:3967個中文形聲字的筆畫數、字頻(取log)、音旁結合度、義旁結
合度各自有不同的分佈形狀。
筆劃數:
字頻(log)
音旁結合度
義旁結合度
Mean = 13.13
Mean = 4.51
Mean = 7.36
Mean = 86.78
母群(N	
 =	
 3967)
13年3月5⽇日星期⼆二
✤ 範例:3967個中文形聲字的筆畫數、字頻(取log)、音旁結合度、義旁結
合度各自有不同的分佈形狀。
筆劃數:
字頻(log)
音旁結合度
義旁結合度
Mean = 13.13
Mean = 4.51
Mean = 7.36
Mean = 86.78
母群(N	
 =	
 3967) 小樣本(N	
 =	
 15)
Mean = 11.93
Mean = 4.2
Mean = 9.07
Mean = 127.53
13年3月5⽇日星期⼆二
✤ 範例:3967個中文形聲字的筆畫數、字頻(取log)、音旁結合度、義旁結
合度各自有不同的分佈形狀。
筆劃數:
字頻(log)
音旁結合度
義旁結合度
Mean = 13.13
Mean = 4.51
Mean = 7.36
Mean = 86.78
母群(N	
 =	
 3967) 小樣本(N	
 =	
 15)
Mean = 11.93
Mean = 4.2
Mean = 9.07
Mean = 127.53
小樣本(N	
 =	
 30)
Mean = 12.86
Mean = 4.31
Mean = 7.43
Mean = 93.13
13年3月5⽇日星期⼆二
✤ 採用N=15或30	
 重複抽樣1000次,得到1000組平均值,四種詞彙變數的
抽樣分佈都趨近於常態分佈:
筆劃數:
字頻(log)
音旁結合度
義旁結合度
Mean = 13.13
Mean = 4.51
Mean = 7.36
Mean = 86.78
母群(N	
 =	
 3967)
13年3月5⽇日星期⼆二
✤ 採用N=15或30	
 重複抽樣1000次,得到1000組平均值,四種詞彙變數的
抽樣分佈都趨近於常態分佈:
筆劃數:
字頻(log)
音旁結合度
義旁結合度
Mean = 13.13
Mean = 4.51
Mean = 7.36
Mean = 86.78
母群(N	
 =	
 3967) 小樣本(N	
 =	
 15)
Mean = 13.10
Mean = 4.5
Mean = 7.4
Mean = 86.75
13年3月5⽇日星期⼆二
✤ 採用N=15或30	
 重複抽樣1000次,得到1000組平均值,四種詞彙變數的
抽樣分佈都趨近於常態分佈:
筆劃數:
字頻(log)
音旁結合度
義旁結合度
Mean = 13.13
Mean = 4.51
Mean = 7.36
Mean = 86.78
母群(N	
 =	
 3967) 小樣本(N	
 =	
 15)
Mean = 13.10
Mean = 4.5
Mean = 7.4
Mean = 86.75
小樣本(N	
 =	
 30)
Mean = 13.14
Mean = 4.50
Mean = 7.35
Mean = 86.78
13年3月5⽇日星期⼆二
假設檢定(hypothesis testing)
✤ test statistics 檢定統計量/統計數
✤ 驗證「統計假設」的統計數值
✤ 比如,檢驗兩個平均數是否相等:
✤ Z	
 統計數	
 (z	
 statistics):已知母群的標準差
✤ T	
 統計數	
 (t	
 statistics):未知母群的標準差
13年3月5⽇日星期⼆二
✤ 即使未知母群的標準差,樣本數夠大的時候t分數的分佈曲線接近z分
數。
13年3月5⽇日星期⼆二
✤ 以單一樣本T檢定為例。假設某大學的學生平均智商為	
 115,請問學生
會成員的智商是否高於一般學生的平均值?
✤ 1.	
 提出統計假設
✤ 	
 	
 	
 	
 	
 	
 	
 	
 	
 	
 H0:	
 µ	
 ≤	
 115	
 	
 	
 	
 	
 H1:	
 µ	
 >	
 115
✤ 2.	
 選擇檢定統計量。未知母群的變異情況,採用T分數。
✤ 3.	
 決定樣本數以及抽樣分佈:抽樣61人,其自由度為60,此時T分佈曲
線趨近於常態分佈。
✤ 4.	
 指定顯著水準	
 (")
✤ 5.	
 搜集數據並且決定是否接受虛無假設
13年3月5⽇日星期⼆二
✤ 4.	
 指定顯著水準
✤ T分數越接近零表示樣本的平均數與期望值相似。T分數距離中央越
遠,|T|	
 越大,表示極有可能樣本的µ	
 不等於期望值,就可以拒絕
H0。根據機率函數可以將T	
 分數轉換為機率值,一般認為H0發生的
機率低於	
 0.05的時候表示可以承擔錯誤的判斷。
臨界區
臨界值
13年3月5⽇日星期⼆二
✤ 4.	
 指定顯著水準
✤ 統計假設明確的預期統計量之間
的差異方向時採用單尾檢定:
✤ H0:	
 µ	
 ≤	
 115	
 	
 	
 	
 	
 H1:	
 µ	
 >	
 115
✤ 統計假設不預期統計量之間的差
異方向,只預期有無差異時採用
雙尾檢定:
✤ H0:	
 µ	
 =	
 115	
 	
 	
 	
 	
 H1:	
 µ	
 ≠	
 115
✤
此時臨界值定在"/2
✤ 比較一下,單尾/雙尾	
 檢定之下,哪
一種情況的臨界值距離0比較近?會
不會影響結果?
13年3月5⽇日星期⼆二
✤ 依據統計檢定量作出決定的後果:
✤ 一般將 " 定在	
 0.05。
✤ 將實驗數據帶入公式2.5-1可以估計β。
✤ 1–β就是統計效果量(power),代表可以拒絕H0的機率。一般研究者
認為β大於0.8代表該研究效果值得信任。
真實情況真實情況
H0為真 H0為假
研究者的決定
無法拒絕 H0
正確接受H0
probability = 1 – "
第二類型錯誤
probability = β
研究者的決定
拒絕H0
第一類型錯誤
Type I error
probability = "
正確拒絕H0
probability = 1 – β
13年3月5⽇日星期⼆二
✤ 母群的平均智商為115。樣本的平均值為117.5	
 (n	
 =	
 61),標準差為12.5。
13年3月5⽇日星期⼆二
推論統計(statistical inference)
✤ 研究假設:吸煙會造成高血壓
✤ 實務上,研究者無法觀察母群的每個人來檢視這個研究假設,但是可以
使用“推論統計”,以實驗設計的方式觀察有無吸煙的兩組小樣本的高
血壓發生率,藉此來推斷母群的表現。
✤ 一般推論統計的做法有兩種:
✤ 假設檢定	
 (hypothesis	
 testing)
✤ 信賴區間	
 (interval	
 estimation)
13年3月5⽇日星期⼆二
✤ 常見的信賴區間做法	
 (未知母群的標準差):
✤ 以樣本平均數為中心,估計上限(97.5%)、下限	
 (2.5%)	
 的位置
✤ 如果期望值介於上限、下限之內就表示無法拒絕H0
✤ 相較於假設檢定,估計信賴區間可以提供平均值以及樣本變異的狀
況
13年3月5⽇日星期⼆二
13年3月5⽇日星期⼆二
「實驗設計」與「推論統計」的步驟
✤ 1.	
 提出統計假設(H0 & H1)
✤ 2.	
 選擇檢定統計量。未知母群的
變異情況,採用T分數。
✤ 3.	
 決定樣本數以及抽樣分佈。
✤ 4.	
 指定顯著水準	
 (α)
✤ 5.	
 搜集數據並且決定是否接受虛
無假設
✤ 1.	
 列出與研究主題相關的獨變
項、依變項、干擾變項
✤ 2.	
 選擇受試的單位及數量
✤ 3.	
 決定分配受試者、實驗刺激的
方式
✤ 4.	
 選擇統計方法,進行推論統計
✤ 5.	
 搜集數據並且決定是否接受虛
無假設
13年3月5⽇日星期⼆二

Mais conteúdo relacionado

Mais de Kevin Chun-Hsien Hsu (16)

[1062BPY12001] Data analysis with R / April 26
[1062BPY12001] Data analysis with R / April 26[1062BPY12001] Data analysis with R / April 26
[1062BPY12001] Data analysis with R / April 26
 
[1062BPY12001] Data analysis with R / April 19
[1062BPY12001] Data analysis with R / April 19[1062BPY12001] Data analysis with R / April 19
[1062BPY12001] Data analysis with R / April 19
 
[1062BPY12001] Data analysis with R / week 4
[1062BPY12001] Data analysis with R / week 4[1062BPY12001] Data analysis with R / week 4
[1062BPY12001] Data analysis with R / week 4
 
[1062BPY12001] Data analysis with R / week 3
[1062BPY12001] Data analysis with R / week 3[1062BPY12001] Data analysis with R / week 3
[1062BPY12001] Data analysis with R / week 3
 
[1062BPY12001] Data analysis with R / week 2
[1062BPY12001] Data analysis with R / week 2[1062BPY12001] Data analysis with R / week 2
[1062BPY12001] Data analysis with R / week 2
 
語言議題
語言議題語言議題
語言議題
 
Regression 0410
Regression 0410Regression 0410
Regression 0410
 
Statistical computing 03
Statistical computing 03Statistical computing 03
Statistical computing 03
 
Statistical computing 01
Statistical computing 01Statistical computing 01
Statistical computing 01
 
Multiple regression
Multiple regressionMultiple regression
Multiple regression
 
Model III ANOVA & Simple Main Effects
Model III ANOVA & Simple Main EffectsModel III ANOVA & Simple Main Effects
Model III ANOVA & Simple Main Effects
 
Essentials of EEG/MEG
Essentials of EEG/MEGEssentials of EEG/MEG
Essentials of EEG/MEG
 
APA style
APA styleAPA style
APA style
 
資料檢索
資料檢索資料檢索
資料檢索
 
R intro 20140716-basic
R intro 20140716-basicR intro 20140716-basic
R intro 20140716-basic
 
R intro 20140716-advance
R intro 20140716-advanceR intro 20140716-advance
R intro 20140716-advance
 

Kirk' Experimental Design, Chapter 2

  • 2. 關於作業 ✤ 請在今天決定分組,每一組上限四人 ✤ 每組繳一份作業,請回答下列這些題目: ✤ Kirk Ch 1, Review Exercise: 3, 4, 5, 9, 10, 11 ✤ Kirk Ch 2, Review Exercise: 2, 4, 5, 9, 10, 12, 13, 15, 17, 19 ✤ 格式:請以 word 檔交件。字體12 point,1.5行高。每一題之間要分 頁,作答的字數請限制在一頁之內。第一行請以章節、題號開始。 ✤ 繳交期限:3月 11日 13年3月5⽇日星期⼆二
  • 3. Previously in Experimental Design... ✤ 上週介紹實驗法的基本概念: ✤ manipulation: 操弄 ✤ 研究者操弄一個或數個獨變項 ✤ random assignment ✤ 採用隨機分配的方式排除干擾變項 ✤ observation/ measurement ✤ 觀察依變項 ✤ 本週進一步介紹基本的實驗設計類型 13年3月5⽇日星期⼆二
  • 4. 實驗設計類型 ✤ t test for independent samples 獨立樣本t 檢定 ✤ Completely Randomized Design (CRD) 完全隨機化設計 ✤ Randomized Block Design (RBD) 隨機化區集設計 ✤ Latin Square Design (LSD) 拉丁方格 ✤ Completely Randomized Factorial Design (CRFD) 完全隨機化複因子 設計 13年3月5⽇日星期⼆二
  • 5. ✤ t test for independent samples 獨立樣本t 檢定 ✤ 用法:從兩個母群抽樣並且估計各自的平均值,然後檢驗平均值是 否相等。 ✤ 統計假設: 13年3月5⽇日星期⼆二
  • 6. ✤ t test for independent samples 獨立樣本t 檢定 ✤ 用法:從兩個母群抽樣並且估計各自的平均值,然後檢驗平均值是 否相等。 ✤ 統計假設: ✤ H0: µ1 - µ2 = 0 ✤ H1: µ1 - µ2 ≠ 0 13年3月5⽇日星期⼆二
  • 7. ✤ t test for independent samples 獨立樣本t 檢定 ✤ 範例:比較兩種矯正煙癮的治療方式的效果,以每天消耗的香煙數 量當作依變項。 ✤ 受試者 (Si) ✤ i = 1~30 ✤ IV: 治療方式 (A) ✤ aj ; j = 1, 2 ✤ DV: Yij Levels Group1 Subjects1 Subjects2 : : Subjects15 a1 a1 : : a1 Group2 Subjects16 Subjects17 : : Subjects30 a2 a2 : : a2 13年3月5⽇日星期⼆二
  • 8. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計 ✤ p: 實驗組別的數量 ✤ 用法:獨變項的組別數量有三組以上,觀察各組的依變項之平均值 有無差異。 ✤ 統計假設: 13年3月5⽇日星期⼆二
  • 9. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計 ✤ p: 實驗組別的數量 ✤ 用法:獨變項的組別數量有三組以上,觀察各組的依變項之平均值 有無差異。 ✤ 統計假設: ✤ H0: µ1 = µ2 = µ3 ✤ H1: µj ≠ µj’ for some j and j’, j ≠ j’ 13年3月5⽇日星期⼆二
  • 10. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計 ✤ 範例:比較三種矯正煙癮的治療方式的效果,以每天消耗的香煙數 量當作依變項。 ✤ 受試者 (Si) ✤ i = 1~45 ✤ IV: 治療方式 (A) ✤ aj ; j = 1, 2, 3 ✤ DV: Yij Levels Group1 Subjects1 Subjects2 : : Subjects15 a1 a1 : : a1 Group2 Subjects16 Subjects17 : : Subjects30 a2 a2 : : a2 Group3 Subjects31 Subjects32 : : Subjects45 a3 a3 : : a3 13年3月5⽇日星期⼆二
  • 11. ✤ DV 的表現主要來自五個效果: 1.獨變項 IV (aj) 2.個別受試者,或者實驗情境的限制 3.受試者每次表現反應時隨機的變動 4.測量/紀錄 過程的誤差 5.其他無法排除的干擾變項 ✤ 前述的“煙癮治療”研究的測量值如何被這些因素影 響? 13年3月5⽇日星期⼆二
  • 12. ✤ DV: Yij ✤ i: 受試者; j: 實驗組別 (treatment) ✤ Y17,2 = 3 ✤ 第17號受試者在第二個實驗組別下的測量值為 3 ✤ 以煙癮治療的例子來說: ✤ 第17號受試者接受第二種治療方式之後每日消耗3根 香煙 13年3月5⽇日星期⼆二
  • 13. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計 ✤ 範例:針對45位受試者比較三種矯正煙癮的治療方式的效果,以每 天消耗的香煙數量當作依變項。 ✤ Yij = µ + "j + #i(j) (i = 1,..., n; j = 1,...,p) Yij 受試者 i 在第 j 個實驗組別下的依變項 µ 母群的平均值,各實驗組別平均觀察值(µ1, µ2, µ3)的總平均值。µ 為固定值。 "j (alpha) 第j個實驗組別的效果,等於該組平均值與母群平均值的 差異量(µj–µ)。同一個實驗組別之下每個觀察值有一樣的 "j。 #i(j) (epsilon) Yij的殘差值,等於 Yij – µ – "j。 13年3月5⽇日星期⼆二
  • 14. ✤ 干擾因素可以分為可控制的與不可控制的兩類。 ✤ 隨機化 (randomization) ✤ 不可控制的因素可利用隨機化程序來削減其影響,比如受試者的氣 質。 ✤ 隨機指定哪些受試者應該接受哪些處理(treatments),以及實驗進行的 次序(order)。 ✤ 區集 (blocking) ✤ 將可控制的因素變成區集(Blocks),同一個區集之內受試者的狀態盡 量一致。 隨機化與區集 13年3月5⽇日星期⼆二
  • 15. ✤ dependent samples 相依樣本 ✤ 針對受試者的氣質進行控制,確保不同實驗組別之間的差別來自獨 變項的影響。 ✤ 消除內在校度的威脅 (threats of internal validity) ✤ 採用相依樣本的時候「隨機分配」以及「分析」的做法都比獨立樣 本的情況更為複雜。下列各種狀況都視為相依樣本: ✤ 受試者接受每一種實驗組別,重複測量(repeated measure)各種組別 之下的表現 ✤ 先測量某個與研究議題有關的指標,然後採用這個指標將受試者 分成數個區集(blocking, subject matching) ✤ 搜集許多組雙胞胎,或者採用來自同一個家庭成長的個體 ✤ 由受試者自己指定的匹配對象 13年3月5⽇日星期⼆二
  • 16. ✤ 以相依樣本的方式來改進煙癮治療研究: ✤ IV: 兩種治療程序 ✤ DV: 持續治療六個月之後每天抽幾根煙 ✤ 假設每個受試者只能接受一種實驗組別,不適合進行重複測量。 ✤ 什麼因素會影響 DV的效果? ✤ e.g.: 接受治療之前每天抽幾根煙? ✤ 根據治療前的抽煙習慣將受試者分組,將每一個區集的受試者隨 機分到實驗組別之下。 13年3月5⽇日星期⼆二
  • 17. ✤ 以相依樣本的方式來改進煙癮治療研究: ✤ 根據治療前的抽煙習慣將受試者分組, 將每一個區集的受試者隨機分到實 驗組別之下。 ✤ LevelsLevels Block1 a1 a2 Block2 a1 a2 Block3 a1 a2 : : : Block15 a1 a2 Levels Group1 Subjects1 Subjects2 : : Subjects15 a1 a1 : : a1 Group2 Subjects16 Subjects17 : : Subjects30 a2 a2 : : a2 13年3月5⽇日星期⼆二
  • 18. ✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計 ✤ p: 實驗組別的數量 ✤ 用法:獨變項的組別數量有三組以上, 將受試者依照某個特性分成 區集,然後將各區集之下的受試者隨機分配到實驗組別之下。 ✤ e.g.: 將45個受試者分成15個區集 ✤ 統計假設: ✤ 如果第二個虛無假設不成立,代表將某個干擾效果移除殘差項。 ✤ H0: µ.1 = µ.2 = µ.3 ✤ H0: µ1. = µ2. = ⋯⋯ = µ15. ✤ H1: µ.j ≠ µ.j’ for some j and j’, j ≠ j’ LevelsLevelsLevels Block1 a1 a2 a3 Block2 a1 a2 a3 Block3 a1 a2 a3 : : : : Block15 a1 a2 a3 13年3月5⽇日星期⼆二
  • 19. ✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計 ✤ Yij = µ + "j + $i + #ij (i = 1,..., n; j = 1,...,p) LevelsLevelsLevels Block1 a1 a2 a3 Block2 a1 a2 a3 Block3 a1 a2 a3 : : : : Block15 a1 a2 a3 Yij 受試者 i 在第 j 個實驗組別下的依變項 µ 母群的平均值。µ為固定值。 "j (alpha) 第j個實驗組別的效果,等於該組平均 值與母群平均值的差異量(µ.j–µ)。同一個實驗 組別之下每個觀察值有一樣的 "j。 $i (pi) 第i個區集的效果,等於該區集平均值與母 群平均值的差異量(µ i.–µ)。 #i(j) (epsilon) Yij的殘差值,等於 Yij – µ – "j – $i。 13年3月5⽇日星期⼆二
  • 20. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計 ✤ Yij = µ + "j + #i(j) (i = 1,..., n; j = 1,...,p) ✤ #ij = Yij – µ – "j ✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計 ✤ Yij = µ + "j + $i + #ij (i = 1,..., n; j = 1,...,p) ✤ #ij = Yij – µ – "j – $i 13年3月5⽇日星期⼆二
  • 21. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計 ✤ #ij = Yij – µ – "j ✤ ∑∑#2 = ∑∑(Yij – µ – "j)2 ✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計 ✤ #ij = Yij – µ – "j – $i ✤ ∑∑#2 = ∑∑(Yij – µ – "j – $i)2 ✤ 採用 RB-p 設計來進行變異數分析時,其殘差平方和不包含區集的效 果,並且小於 CR-p的殘差平方和。 ✤ RB-p 設計可以提供比較大的F統計值,較容易拒絕H0。 13年3月5⽇日星期⼆二
  • 22. ✤ Latin Square Design (LSD, LS-p) 拉丁方格 ✤ p: 實驗組別的數量 ✤ 特點:排除兩個干擾變項 ✤ 用法:將受試者依照兩個特性分成區集,然後將各區集之下的受試 者隨機分配到實驗組別之下。兩種特性的區集數量必須和實驗組別 一樣。 ✤ e.g.: 觀察三種治療方式。根據治療前每天抽煙數量、抽煙年數定出 九個區集(3 x 3)。 < 1 年 1~5年 >5年 c1 c2 c3 <1包 b1 a1 a2 a3 1~3包 b2 a2 a3 a1 >3包 b3 a3 a1 a2 13年3月5⽇日星期⼆二
  • 23. ✤ Latin Square Design (LSD, LS-p) 拉丁方格 ✤ p: 實驗組別的數量 ✤ 特點:排除兩個干擾變項 ✤ 用法:將受試者依照兩個特性分成區集,然後將各區集之下的受試 者隨機分配到實驗組別之下。兩種特性的區集數量必須和實驗組別 一樣。 ✤ e.g.: 觀察三種治療方式。根據治療前每天抽煙數量、抽煙年數定出 九個區集(3 x 3)。 ✤ 統計假設: ✤ H0: µ1.. = µ2.. = µ3.. (實驗組別的平均表現一致) ✤ H0: µ.1. = µ.2. = µ.3. (第一類區集的平均值無差異) ✤ H0: µ..1 = µ..2 = µ..3 (第二類區集的平均值無差異) 13年3月5⽇日星期⼆二
  • 24. ✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計 ✤ Yij = µ + "j + #i(j) ✤ ∑∑#2 = ∑∑(Yij – µ – "j)2 ✤ Randomized Block Design (RBD, RB-p) 隨機化區集設計 ✤ Yij = µ + "j + $i + #ij ✤ ∑∑#2 = ∑∑(Yij – µ – "j – $i)2 ✤ Latin Square Design (LSD, LS-p) 拉丁方格 ✤ Yij = µ + "j + !k + "l + $i + #ij ✤ ∑∑#2 = ∑∑(Yij – µ – "j – !k – "l – $i)2 13年3月5⽇日星期⼆二
  • 25. ✤ 目前為止介紹了三種基本的實驗設計,而且都只考量一個獨變項。 ✤ CR-p 完全隨機化設計 ✤ 無法排除任何干擾變項的影響。 ✤ RB-p 隨機化區集設計 ✤ 針對一個干擾變項將受試者分成數個區集,觀察區集的效果,同 時減少殘差項 (∑∑#2)。 ✤ LS-p 拉丁方格 ✤ 針對兩個干擾變項將受試者分成數個區集,兩種區集的數量與實 驗組別一樣。有效的 LS-p可以取得更小的殘差項。 13年3月5⽇日星期⼆二
  • 26. ✤ Completely Randomized Factorial Design (CRF-pq) 完全隨機化複因子 設計 ✤ 特點:觀察兩種獨變項各自的效果,以及兩者的交互作用。 ✤ e.g.: 室內光照(5燭光, 30燭光)與字體大小(9-point, 12-point, 15-point)對 閱讀速度的影響 ✤ 實驗組別: a1b1、 a1b2、 a1b3、 a2b1、 a2b2、 a2b3 ✤ 將受試者隨機分配到各實驗組別,然後進行二因子變異數分析。 13年3月5⽇日星期⼆二
  • 27. ✤ Completely Randomized Factorial Design (CRF-pq) 完全隨機化複因子 設計 ✤ 特點:觀察兩種獨變項各自的效果,以及兩者的交互作用。 ✤ e.g.: 室內光照(5燭光, 30燭光)與字體大小(9-point, 12-point, 15-point)對 閱讀速度的影響 ✤ Yijk = µ + "j + !k + ("!)jk + #i(jk) ✤ Yijk 受試者 i 在每一種實驗組合之下的表現 µ 母群的平均值。µ為固定值。 "j 第一個獨變項的j個實驗組別的效果,等於該組平 均值與母群平均值的差異量(µ.j–µ)。 &k 第二個獨變項的k個實驗組別的效果,等於該組 平均值與母群平均值的差異量(µ.k–µ)。 ("&)jk 交互作用 #i(j) (epsilon) Yij的殘差值,等於 Yij – µ – "j – $i。 13年3月5⽇日星期⼆二
  • 28. ✤ Completely Randomized Factorial Design (CRF-pq) 完全隨機化複因子 設計 ✤ 特點:觀察兩種獨變項各自的效果,以及兩者的交互作用。 ✤ e.g.: 室內光照(5燭光, 30燭光)與字體大小(9-point, 12-point, 15-point)對 閱讀速度的影響 ✤ 統計假設: ✤ H0: µ1. = µ2. ✤ H0: µ.1 = µ.2 = µ.3 ✤ H0: µjk – µj’k – µjk’ + µj’k’ = 0 ✤ 室內光照之主效果 (main effect) ✤ 字體大小之主效果 (main effect) ✤ 交互作用 (interaction) 13年3月5⽇日星期⼆二
  • 29. 有交互作用 無交互作用 從趨勢來看: (a): 高光度情況下的閱讀速度較快。9-point字體大小的閱讀速度最 慢,12、15-point兩種情況下似乎沒有差異。另外,15-point之下的 光度的效果在較另外兩種字體不明顯。 (b): 高光度情況下的閱讀速度較快。9-point字體大小的閱讀速度最 慢,12、15-point兩種情況下似乎沒有差異。字體大小及光照沒有 交互作用。 13年3月5⽇日星期⼆二
  • 30. 關於實驗設計的幾個步驟 ✤ 列出與研究主題相關的獨變項、依變項、干擾變項 ✤ 選擇受試的單位以及數量 ✤ 決定分配受試者、實驗刺激的方式 ✤ 選擇統計方法,進行推論統計(statistical inference) 13年3月5⽇日星期⼆二
  • 31. 推論統計(statistical inference) ✤ 研究假設:吸煙會造成高血壓 ✤ 實務上,研究者無法觀察母群的每個人來檢視這個研究假設,但是可以 使用“推論統計”,以實驗設計的方式觀察有無吸煙的兩組小樣本的高 血壓發生率,藉此來推斷母群的表現。 ✤ 一般推論統計的做法有兩種: ✤ 假設檢定 (hypothesis testing) ✤ 信賴區間 (interval estimation) 13年3月5⽇日星期⼆二
  • 32. 假設檢定(hypothesis testing) ✤ 將「研究主題預測的效果」轉換成「對立假設 (H1)」。比如,有吸煙 習慣者的血壓比無吸煙者的還要高: ✤ H1: µ1–µ2 > 0; or H1: β> 0 ✤ 任何非 H1 的狀況就是「虛無假設 (H0)」 ✤ H0: µ1–µ2 ≤ 0; or H0: β≤ 0 13年3月5⽇日星期⼆二
  • 33. 假設檢定(hypothesis testing) ✤ sampling distribution (抽樣分佈) ✤ 研究者常常從母群中隨機選出一組樣本,然後取得這組樣本的統計 值。下一次抽樣取得的統計值與先前抽樣的結果往往有差異。進行 許多次抽樣之後每一次的統計值形成一組分布,該分布稱為「 抽樣 分佈」。 ✤ central limit theorem (中央極限定理) ✤ 採用適當數量的樣本計算平均數的時後,不論母群的機率分佈的形 狀為何,抽樣分佈的形狀會趨近於常態分佈。 13年3月5⽇日星期⼆二
  • 35. ✤ 範例:3967個中文形聲字的筆畫數、字頻(取log)、音旁結合度、義旁結 合度各自有不同的分佈形狀。 筆劃數: 字頻(log) 音旁結合度 義旁結合度 Mean = 13.13 Mean = 4.51 Mean = 7.36 Mean = 86.78 母群(N = 3967) 小樣本(N = 15) Mean = 11.93 Mean = 4.2 Mean = 9.07 Mean = 127.53 13年3月5⽇日星期⼆二
  • 36. ✤ 範例:3967個中文形聲字的筆畫數、字頻(取log)、音旁結合度、義旁結 合度各自有不同的分佈形狀。 筆劃數: 字頻(log) 音旁結合度 義旁結合度 Mean = 13.13 Mean = 4.51 Mean = 7.36 Mean = 86.78 母群(N = 3967) 小樣本(N = 15) Mean = 11.93 Mean = 4.2 Mean = 9.07 Mean = 127.53 小樣本(N = 30) Mean = 12.86 Mean = 4.31 Mean = 7.43 Mean = 93.13 13年3月5⽇日星期⼆二
  • 38. ✤ 採用N=15或30 重複抽樣1000次,得到1000組平均值,四種詞彙變數的 抽樣分佈都趨近於常態分佈: 筆劃數: 字頻(log) 音旁結合度 義旁結合度 Mean = 13.13 Mean = 4.51 Mean = 7.36 Mean = 86.78 母群(N = 3967) 小樣本(N = 15) Mean = 13.10 Mean = 4.5 Mean = 7.4 Mean = 86.75 13年3月5⽇日星期⼆二
  • 39. ✤ 採用N=15或30 重複抽樣1000次,得到1000組平均值,四種詞彙變數的 抽樣分佈都趨近於常態分佈: 筆劃數: 字頻(log) 音旁結合度 義旁結合度 Mean = 13.13 Mean = 4.51 Mean = 7.36 Mean = 86.78 母群(N = 3967) 小樣本(N = 15) Mean = 13.10 Mean = 4.5 Mean = 7.4 Mean = 86.75 小樣本(N = 30) Mean = 13.14 Mean = 4.50 Mean = 7.35 Mean = 86.78 13年3月5⽇日星期⼆二
  • 40. 假設檢定(hypothesis testing) ✤ test statistics 檢定統計量/統計數 ✤ 驗證「統計假設」的統計數值 ✤ 比如,檢驗兩個平均數是否相等: ✤ Z 統計數 (z statistics):已知母群的標準差 ✤ T 統計數 (t statistics):未知母群的標準差 13年3月5⽇日星期⼆二
  • 42. ✤ 以單一樣本T檢定為例。假設某大學的學生平均智商為 115,請問學生 會成員的智商是否高於一般學生的平均值? ✤ 1. 提出統計假設 ✤ H0: µ ≤ 115 H1: µ > 115 ✤ 2. 選擇檢定統計量。未知母群的變異情況,採用T分數。 ✤ 3. 決定樣本數以及抽樣分佈:抽樣61人,其自由度為60,此時T分佈曲 線趨近於常態分佈。 ✤ 4. 指定顯著水準 (") ✤ 5. 搜集數據並且決定是否接受虛無假設 13年3月5⽇日星期⼆二
  • 43. ✤ 4. 指定顯著水準 ✤ T分數越接近零表示樣本的平均數與期望值相似。T分數距離中央越 遠,|T| 越大,表示極有可能樣本的µ 不等於期望值,就可以拒絕 H0。根據機率函數可以將T 分數轉換為機率值,一般認為H0發生的 機率低於 0.05的時候表示可以承擔錯誤的判斷。 臨界區 臨界值 13年3月5⽇日星期⼆二
  • 44. ✤ 4. 指定顯著水準 ✤ 統計假設明確的預期統計量之間 的差異方向時採用單尾檢定: ✤ H0: µ ≤ 115 H1: µ > 115 ✤ 統計假設不預期統計量之間的差 異方向,只預期有無差異時採用 雙尾檢定: ✤ H0: µ = 115 H1: µ ≠ 115 ✤ 此時臨界值定在"/2 ✤ 比較一下,單尾/雙尾 檢定之下,哪 一種情況的臨界值距離0比較近?會 不會影響結果? 13年3月5⽇日星期⼆二
  • 45. ✤ 依據統計檢定量作出決定的後果: ✤ 一般將 " 定在 0.05。 ✤ 將實驗數據帶入公式2.5-1可以估計β。 ✤ 1–β就是統計效果量(power),代表可以拒絕H0的機率。一般研究者 認為β大於0.8代表該研究效果值得信任。 真實情況真實情況 H0為真 H0為假 研究者的決定 無法拒絕 H0 正確接受H0 probability = 1 – " 第二類型錯誤 probability = β 研究者的決定 拒絕H0 第一類型錯誤 Type I error probability = " 正確拒絕H0 probability = 1 – β 13年3月5⽇日星期⼆二
  • 46. ✤ 母群的平均智商為115。樣本的平均值為117.5 (n = 61),標準差為12.5。 13年3月5⽇日星期⼆二
  • 47. 推論統計(statistical inference) ✤ 研究假設:吸煙會造成高血壓 ✤ 實務上,研究者無法觀察母群的每個人來檢視這個研究假設,但是可以 使用“推論統計”,以實驗設計的方式觀察有無吸煙的兩組小樣本的高 血壓發生率,藉此來推斷母群的表現。 ✤ 一般推論統計的做法有兩種: ✤ 假設檢定 (hypothesis testing) ✤ 信賴區間 (interval estimation) 13年3月5⽇日星期⼆二
  • 48. ✤ 常見的信賴區間做法 (未知母群的標準差): ✤ 以樣本平均數為中心,估計上限(97.5%)、下限 (2.5%) 的位置 ✤ 如果期望值介於上限、下限之內就表示無法拒絕H0 ✤ 相較於假設檢定,估計信賴區間可以提供平均值以及樣本變異的狀 況 13年3月5⽇日星期⼆二
  • 50. 「實驗設計」與「推論統計」的步驟 ✤ 1. 提出統計假設(H0 & H1) ✤ 2. 選擇檢定統計量。未知母群的 變異情況,採用T分數。 ✤ 3. 決定樣本數以及抽樣分佈。 ✤ 4. 指定顯著水準 (α) ✤ 5. 搜集數據並且決定是否接受虛 無假設 ✤ 1. 列出與研究主題相關的獨變 項、依變項、干擾變項 ✤ 2. 選擇受試的單位及數量 ✤ 3. 決定分配受試者、實驗刺激的 方式 ✤ 4. 選擇統計方法,進行推論統計 ✤ 5. 搜集數據並且決定是否接受虛 無假設 13年3月5⽇日星期⼆二