Enviar pesquisa
Carregar
Eureka agora tech talk 20170829
•
0 gostou
•
108 visualizações
S
Shinnosuke Ohkubo
Seguir
Rによるやさしい統計学 https://www.amazon.co.jp/dp/4274067106 で学んだ内容を、業務への活かし方を想定しつつ復習がてらまとめてみました。
Leia menos
Leia mais
Dados e análise
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 18
Baixar agora
Baixar para ler offline
Recomendados
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
Tomoyuki Hioki
Sns
Sns
Ken Ogura
秘密計算を用いた時系列情報の安全な集計方法
秘密計算を用いた時系列情報の安全な集計方法
成泰 奈良
非分離冗長重複変換の事例学習設計における効果的辞書更新
非分離冗長重複変換の事例学習設計における効果的辞書更新
Shogo Muramatsu
Get To The Point: Summarization with Pointer-Generator Networks_acl17_論文紹介
Get To The Point: Summarization with Pointer-Generator Networks_acl17_論文紹介
Masayoshi Kondo
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
Shunichi Sekiguchi
ベイズ統計によるデータ解析
ベイズ統計によるデータ解析
Kunihiro Hisatsune
Tokyor24 doradora09
Tokyor24 doradora09
Nobuaki Oshiro
Recomendados
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
Tomoyuki Hioki
Sns
Sns
Ken Ogura
秘密計算を用いた時系列情報の安全な集計方法
秘密計算を用いた時系列情報の安全な集計方法
成泰 奈良
非分離冗長重複変換の事例学習設計における効果的辞書更新
非分離冗長重複変換の事例学習設計における効果的辞書更新
Shogo Muramatsu
Get To The Point: Summarization with Pointer-Generator Networks_acl17_論文紹介
Get To The Point: Summarization with Pointer-Generator Networks_acl17_論文紹介
Masayoshi Kondo
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
PILCO - 第一回高橋研究室モデルベース強化学習勉強会
Shunichi Sekiguchi
ベイズ統計によるデータ解析
ベイズ統計によるデータ解析
Kunihiro Hisatsune
Tokyor24 doradora09
Tokyor24 doradora09
Nobuaki Oshiro
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
Vit Horky
The six step guide to practical project management
The six step guide to practical project management
MindGenius
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
Mais conteúdo relacionado
Destaque
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
Vit Horky
The six step guide to practical project management
The six step guide to practical project management
MindGenius
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
Destaque
(20)
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
Skeleton Culture Code
Skeleton Culture Code
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
How to have difficult conversations
How to have difficult conversations
Introduction to Data Science
Introduction to Data Science
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
The six step guide to practical project management
The six step guide to practical project management
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Eureka agora tech talk 20170829
1.
統計的仮説検定を ABテストの判断に役立てる 2017/08/29 Shinnosuke Ohkubo@Agora
Tech Talk
2.
自己紹介 ● データアナリスト 兼
サーバーサイドエンジニア ○ (データアナリスト歴 1年ちょっと) ● 大久保 晋之介 ● 江戸川区民
3.
Webサービスに携わっていると ・ABテスト、することがある ・例:LP 1 と
LP 2 の平均滞在時間(秒)を比較 ・判断に迷う時「統計的仮説検定」を使ってジャッジすることが可能 ・今回は「統計的仮説検定」のざっくり手順についての話 ※分散 = データのバラつきのこと。次の式で求められる 【LP 1】 合計 平均 分散 user_id 1 3 5 7 9 11 13 15 17 19 滞在時間 10 12 7 9 11 5 20 3 15 11 103 10.3 23.79 【LP 2】 user_id 2 4 6 8 10 12 14 16 18 20 滞在時間 9 11 6 8 10 4 19 2 14 10 93 9.3 23.79
4.
統計的仮説検定とは ・一般的に以下5つのステップで「有意差」を調べる手法
5.
有意差について ・「有意差」とは、偶然や誤差で生じた差ではない「意味の有る差」のこと ・「有意差がない」という判断は「等しい」ということではない。 実験や調査で得られた条件間の差は偶然でも(つまり標本抽出による誤差によっても)十 分起こり得る程度の差ですよ、という意味。 「有意差がない」というのは「統計的に意味のある差ではない」ということ
6.
色々な検定について ・検定のステップが5つあるというのは一般的に同じ ・今回は2標本t検定を行う
7.
1.母集団に関する帰無仮説と対立仮説を設定する ・帰無仮説H0:μ1 = μ2
(2つの母平均は等しい) # = 採択されると有意差なし ・対立仮説H1:μ1 != μ2 (2つの母平均は等しくない) # = 採択されると有意差あり ・対立仮説より、この検定は 両側検定 ※ 対立仮説が「a != b」などの場合、両側検定。同仮説が「 a>b」などの場合は片側検定 ※ 今回知りたいのは、10人のサンプルユーザーの平均に差があるかではなく、その背景にいる母集団(今回な ら今後LPに流入してくるユーザー)の平均、つまり「母平均」に差があるかを知りたい 【LP 1】 合計 平均 分散 user_id 1 3 5 7 9 11 13 15 17 19 滞在時間 10 12 7 9 11 5 20 3 15 11 103 10.3 23.79 【LP 2】 user_id 2 4 6 8 10 12 14 16 18 20 滞在時間 9 11 6 8 10 4 19 2 14 10 93 9.3 23.79
8.
2.検定統計量を選ぶ ・今回「2標本t検定」を選択したので、検定統計量 t は自動的に以下に決まる 【LP
1】 合計 平均 分散 user_id 1 3 5 7 9 11 13 15 17 19 滞在時間 10 12 7 9 11 5 20 3 15 11 103 10.3 23.79 【LP 2】 user_id 2 4 6 8 10 12 14 16 18 20 滞在時間 9 11 6 8 10 4 19 2 14 10 93 9.3 23.79 ※X1 = 10.3, X2 = 9.3, n1 = 10, n2 = 10, σ1^2 = 23.79, σ2^2 = 23.79
9.
2.検定統計量を選ぶ ・今回「2標本t検定」を選択したので、以下の 検定統計量 t
は、帰無仮説のもとで自由 度v = n1 + n2 - 2の t分布に自動的に従う ※n1 = 10, n2 = 10 ※検定統計量 t が t 分布に従うの意味は後ほど ... 検定統計量 t t分布
10.
2.検定統計量を選ぶ ・検定毎に「検定統計量」「帰無仮説のもとで検定統計量が従う分布」は違う 検定統計量 帰無仮説のもとで検定統計量が 従う分布 2標本t検定 自由度 n1
+ n2 - 2の t分布 無相関検定 自由度 n - 2の t分布 独立性の検定 自由度1のカイ二乗分布 ... ... ...
11.
3.有意水準αの値を決める ・有意水準 = 本当は差がないのに「差がある」と判断してしまう誤りを犯す確率 ・5%,
1%がよく使われる。今回は5%、つまりα = 0.05とする
12.
4.データから検定統計量の実現値を求める ・以下の式に数字を当てはめるだけ ※X1 = 10.3,
X2 = 9.3, n1 = 10, n2 = 10, σ1^2 = 23.79, σ2^2 = 23.79 ・正解は、t = 0.45846
13.
5.検定統計量の実現値と棄却域の比較 ・検定統計量の実現値(t = 0.45846)が ・棄却域に入る
→ 帰無仮説を棄却 & 対立仮説を採択 ・棄却域に入る → 帰無仮説を採択 ・棄却域 = 帰無仮説のもとで、非常に生じにくい(ある一定の確率 α=有意水準でしか生じない)検定統計量の 値の範囲 ※右図の赤枠部分が、検定統計量 t が非常に取りづらい範囲 検定統計量tがこの範囲の値を取る時、帰無仮説は棄却される ・帰無仮説H0:μ1 = μ2 (2つの母平均は等しい) # = 採択されると有意差なし ・対立仮説H1:μ1 != μ2 (2つの母平均は等しくない) # = 採択されると有意差あり
14.
5.検定統計量の実現値と棄却域の比較 ・棄却域は何によって決まるか ・分布の形状(今回は自由度 18 (=10+10-2)
のt分布) ・有意水準α(今回は0.05) ※統計界隈でよく使われる R言語では 以下のように指定することで一発で臨界値(棄却域と 採択域の境界値)が求められる > qt(0.025, 18) # -2.100922 > qt(0.025, 18, lower.tail=FALSE) # 2.100922
15.
5.検定統計量の実現値と棄却域の比較 ・結論 ・帰無分布の棄却域 t <
-2.100922, 2.100922 < t ・検定統計量t = 0.45846 ・上記より検定統計量 tは棄却域に入らない。 よって帰無仮説H0(2つの母平均は等しい)は採択される。 ・有意差なし //
16.
検定の難しさとは ・検定は種類が多い。事例に応じて、適切な検定を選択する必要がある ・検定は前提条件を求めるものがある。 用いるデータが前提条件に合致するか事前に調べる必要がある(ことがある) 例:今回用いた「2標本t検定」は以下が前提として必要 ● 標本抽出が無作為に行われていること(無作為抽出) ● 母集団の分布が正規分布に従っていること(正規性) ●
2つの母集団の分散が均質であること(分散の等質性)
17.
検定は絶対なのか ・有意水準5%などを指定していることからもわかるように、得られた結果は絶対ではない (有意水準 = 本当は差がないのに「差がある」と判断してしまう誤りを犯す確率) ・意思決定に役立てる一つのツールとして使うのが良いのではないか(個人的意見)
18.
参考文献 Rによるやさしい統計学 https://www.amazon.co.jp/dp/4274067106 検定の種類と洗濯方法 https://www.statweb.jp/method/sentaku-houhou
Baixar agora