O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.
統計学がわかる第3章
- カイ2乗検定-
http://kogolab.chillout.jp/elearn/hamburger/
チキンの売り上げが少ない?
ワクワクバーガー
ポテトの売り上げは上々
フライドチキンの売り上げはイマイチ
ワクワクバーガーのフライドチキンは
モグモグバーガーと比べて売れていないのか?
ポテトとチキンの売り上げを調べる
お店 ポテト チキン 合計
ワクワクバーガー 435 165 600
モグモグバーガー 265 135 400
チキンのポテトに対する割合
ワクワクバーガー:
モグモグバーガー:
ワクワクバーガーはモグモグバー...
はじめに仮説を立てる- 帰無仮説-
まず仮説を立てるところから出発
「〇〇である」ということを仮に立て、
その仮説を肯定するか否定するかを後で決める
【仮説】ワクワクバーガーとモグモグバーガーの間で
ポテトとチキンの売り上げの割合に差はない
あ...
はじめに仮説を立てる- 対立仮説-
帰無仮説を採択する
差はない
帰無仮説を棄却する
差はないとは言えない、つまり差はある
仮説を検討する(1)
お店 ポテト チキン 合計
ワクワクバーガー 435 165 600
モグモグバーガー 265 135 400
合計 700 300 1000
「売り上げの割合に差はない」という帰無仮説を立て
る
両店合わせたポテトとチキ...
仮説を検討する(2)
売り上げ ポテト チキン 合計
ワクワクバーガー 435(420) 165(180) 600
モグモグバーガー 265(280) 135(120) 400
合計 700 300 1000
実際の売り上げ個数=観測度数
同じ...
観測度数と期待度数を比べる
ワクワクバーガー
ポテトは実際のほうが多い
観測度数435に対して期待度数420
モグモグバーガー
チキンは実際のほうが少ない
観測度数165に対して期待度数180
このズレは「差がある」のか、「差がない」のか
カイ2乗値
売り上げ ポテト チキン 合計
ワクワクバーガー 435(420) 165(180) 600
モグモグバーガー 265(280) 135(120) 400
合計 700 300 1000
カイ2乗値
観測度数と期待度数のズレを数値化...
カイ2乗値の性質を知る- ピンポン玉実験-
白とオレンジのピンポン玉がそれぞれ50個ずつ
無作為に10個取り出す
取り出した中に白とオレンジのピンポン球は
それぞれ何個含まれているか
期待度数
白 オレンジ
5 5
カイ2乗値の性質を知る- ピンポン玉実験-
観測度数
白 オレンジ 起こる確率 カイ2乗値
5 5 最も起こりやすい 0
6 4 起こりやすい 0.4
7 3 起こりにくい 1.6
8 2 かなり起こりにくい 3.6
9 1 非常に起こりにくい...
カイ2乗分布
カイ2乗分布
横軸にカイ2乗値、縦軸に確率密度をとる
カイ2乗値小=> 確率密度大
カイ2乗値大=> 確率密度小
自由度によるカイ2乗分布の変化
白とオレンジのピンポン球を10個取る場合
白の数が決まればオレンジの数も決まる
自由度:
自由度が変わるとカイ2乗分布も変わる
2 − 1 = 1
カイ2乗値と自由度を求める
お店 ポテト チキン 合計
ワクワクバーガー 435/420 165/180 600
モグモグバーガー 265/280 135/120 400
合計 700 300 1000
カイ2乗値
自由度
(行の数 ) (列の...
確率を求める(1)
カイ2乗分布表
自由度 確率:0.05 確率:0.01
1 3.84 6.63
2 5.99 9.21
3 7.81 11.34
4 9.49 13.28
5 11.07 15.09
自由度:1, 確率: 0.05のとき、カ...
確率を求める(2)
「確率が0.05のときのカイ2乗値が3.84である」とは?
カイ2乗値が3.84以上になる確率が0.05
確率を求める(3)
自由度:1, 確率:0.05 -> カイ2乗値: 3.84
カイ2乗値が3.84よりも大きい=>5%の確率で起こる
カイ2乗値が3.84よりも小さい=>95%の確率で起こる
自由度:1, 確率:0.01 -> カイ2乗値: ...
有意水準を設定する
「確率1-5%の間」というのは本当に「起こりにくい」
ことなのか?
有意水準を設定する
有意水準よりも小さい確率=> 「起こりにくい」
有意水準よりも大きい確率=> 「起こりにくいと
はいえない」
有意水準は伝統的に5%かあ...
仮説検定をおこなう
有意水準を5%に設定した場合
「ワクワクバーガーとモグモグバーガーでは
ポテトとチキンの売り上げの割合に差はない」
とする帰無仮説を立てる
この帰無仮説を前提とした場合の
カイ2乗値は4.46, 確率は5%以下
有意水準:5...
仮説検定をおこなう
母集団について仮説を立て、
その仮説が正しいかどうかを標本から推測することを
「仮説検定」あるいは「検定」と呼ぶ
検定の結果、
「ワクワクバーガーとモグモグバーガーでは
ポテトとチキンの売り上げの割合に差はある」
という残念...
まとめ
仮説検定の方法
「〇〇と〇〇との間には差はない」
という帰無仮説を立てる
期待度数と観測度数のズレを見るため
カイ2乗値を計算する
カイ2乗値の出現確率を調べる
有意水準を基準として帰無仮説を棄却するか、
あるいは採択するかを決める
Próximos SlideShares
Carregando em…5
×

統計学がわかる 第3章 -カイ2乗検定-

2.560 visualizações

Publicada em

部署内勉強会 資料

Publicada em: Dados e análise
  • Entre para ver os comentários

  • Seja a primeira pessoa a gostar disto

統計学がわかる 第3章 -カイ2乗検定-

  1. 1. 統計学がわかる第3章 - カイ2乗検定-
  2. 2. http://kogolab.chillout.jp/elearn/hamburger/
  3. 3. チキンの売り上げが少ない? ワクワクバーガー ポテトの売り上げは上々 フライドチキンの売り上げはイマイチ ワクワクバーガーのフライドチキンは モグモグバーガーと比べて売れていないのか?
  4. 4. ポテトとチキンの売り上げを調べる お店 ポテト チキン 合計 ワクワクバーガー 435 165 600 モグモグバーガー 265 135 400 チキンのポテトに対する割合 ワクワクバーガー: モグモグバーガー: ワクワクバーガーはモグモグバーガーよりも チキンが売れていない? 本当にこの求め方でいいの? 165/435 ≃ 0.38 135/265 ≃ 0.51
  5. 5. はじめに仮説を立てる- 帰無仮説- まず仮説を立てるところから出発 「〇〇である」ということを仮に立て、 その仮説を肯定するか否定するかを後で決める 【仮説】ワクワクバーガーとモグモグバーガーの間で ポテトとチキンの売り上げの割合に差はない あえて「差はない」という仮説を最初に立てる 帰無仮説
  6. 6. はじめに仮説を立てる- 対立仮説- 帰無仮説を採択する 差はない 帰無仮説を棄却する 差はないとは言えない、つまり差はある
  7. 7. 仮説を検討する(1) お店 ポテト チキン 合計 ワクワクバーガー 435 165 600 モグモグバーガー 265 135 400 合計 700 300 1000 「売り上げの割合に差はない」という帰無仮説を立て る 両店合わせたポテトとチキンの割合は7:3 両店とも同じ割合(7:3)で売れたらどうなるか?
  8. 8. 仮説を検討する(2) 売り上げ ポテト チキン 合計 ワクワクバーガー 435(420) 165(180) 600 モグモグバーガー 265(280) 135(120) 400 合計 700 300 1000 実際の売り上げ個数=観測度数 同じ割合で売れた場合の売り上げ個数=期待度数
  9. 9. 観測度数と期待度数を比べる ワクワクバーガー ポテトは実際のほうが多い 観測度数435に対して期待度数420 モグモグバーガー チキンは実際のほうが少ない 観測度数165に対して期待度数180 このズレは「差がある」のか、「差がない」のか
  10. 10. カイ2乗値 売り上げ ポテト チキン 合計 ワクワクバーガー 435(420) 165(180) 600 モグモグバーガー 265(280) 135(120) 400 合計 700 300 1000 カイ2乗値 観測度数と期待度数のズレを数値化したもの 期待度数と観測度数のズレ大=カイ2乗値大 ∑ (観測度数−期待度数) 2 期待度数 + + ⋯ ≃ 4.46 (435−420) 2 420 (165−180) 2 180
  11. 11. カイ2乗値の性質を知る- ピンポン玉実験- 白とオレンジのピンポン玉がそれぞれ50個ずつ 無作為に10個取り出す 取り出した中に白とオレンジのピンポン球は それぞれ何個含まれているか 期待度数 白 オレンジ 5 5
  12. 12. カイ2乗値の性質を知る- ピンポン玉実験- 観測度数 白 オレンジ 起こる確率 カイ2乗値 5 5 最も起こりやすい 0 6 4 起こりやすい 0.4 7 3 起こりにくい 1.6 8 2 かなり起こりにくい 3.6 9 1 非常に起こりにくい 6.4 確率が小さくなるほどカイ2乗値は大きくなる
  13. 13. カイ2乗分布 カイ2乗分布 横軸にカイ2乗値、縦軸に確率密度をとる カイ2乗値小=> 確率密度大 カイ2乗値大=> 確率密度小
  14. 14. 自由度によるカイ2乗分布の変化 白とオレンジのピンポン球を10個取る場合 白の数が決まればオレンジの数も決まる 自由度: 自由度が変わるとカイ2乗分布も変わる 2 − 1 = 1
  15. 15. カイ2乗値と自由度を求める お店 ポテト チキン 合計 ワクワクバーガー 435/420 165/180 600 モグモグバーガー 265/280 135/120 400 合計 700 300 1000 カイ2乗値 自由度 (行の数 ) (列の数 ) ∑ ≃ 4.46 (観測度数−期待度数) 2 期待度数 −1 × −1 = 1
  16. 16. 確率を求める(1) カイ2乗分布表 自由度 確率:0.05 確率:0.01 1 3.84 6.63 2 5.99 9.21 3 7.81 11.34 4 9.49 13.28 5 11.07 15.09 自由度:1, 確率: 0.05のとき、カイ2乗値: 3.84 自由度:1, 確率: 0.01のとき、カイ2乗値: 6.63
  17. 17. 確率を求める(2) 「確率が0.05のときのカイ2乗値が3.84である」とは? カイ2乗値が3.84以上になる確率が0.05
  18. 18. 確率を求める(3) 自由度:1, 確率:0.05 -> カイ2乗値: 3.84 カイ2乗値が3.84よりも大きい=>5%の確率で起こる カイ2乗値が3.84よりも小さい=>95%の確率で起こる 自由度:1, 確率:0.01 -> カイ2乗値: 6.63 カイ2乗値が6.63よりも大きい=>1%の確率で起こる カイ2乗値が6.63よりも小さい=>99%の確率で起こる 「ワクワクバーガーとモグモグバーガーの間では ポテトとチキンの売り上げの割合に差がない」 という帰無仮説を立てたとき、 そのカイ2乗値が4.46をとる確率は1-5%の間である
  19. 19. 有意水準を設定する 「確率1-5%の間」というのは本当に「起こりにくい」 ことなのか? 有意水準を設定する 有意水準よりも小さい確率=> 「起こりにくい」 有意水準よりも大きい確率=> 「起こりにくいと はいえない」 有意水準は伝統的に5%かあるいは1% 有意水準:5% => カイ2乗値4.46は起こりにくい 有意水準:1% => カイ2乗値4.46は起こりにくいとはい えない
  20. 20. 仮説検定をおこなう 有意水準を5%に設定した場合 「ワクワクバーガーとモグモグバーガーでは ポテトとチキンの売り上げの割合に差はない」 とする帰無仮説を立てる この帰無仮説を前提とした場合の カイ2乗値は4.46, 確率は5%以下 有意水準:5%なので「起こりにくいこと」である 「起こりにくいこと」が起こってしまったのは、 最初の帰無仮説が間違っていたからである 帰無仮説を棄却する 「売り上げの割合に差はある」 とする対立仮説を採択する
  21. 21. 仮説検定をおこなう 母集団について仮説を立て、 その仮説が正しいかどうかを標本から推測することを 「仮説検定」あるいは「検定」と呼ぶ 検定の結果、 「ワクワクバーガーとモグモグバーガーでは ポテトとチキンの売り上げの割合に差はある」 という残念な結果に
  22. 22. まとめ 仮説検定の方法 「〇〇と〇〇との間には差はない」 という帰無仮説を立てる 期待度数と観測度数のズレを見るため カイ2乗値を計算する カイ2乗値の出現確率を調べる 有意水準を基準として帰無仮説を棄却するか、 あるいは採択するかを決める

×