SlideShare uma empresa Scribd logo
1 de 5
ポアソン分布の式を
忘れない方法
及び二項分布との関係
2014-07-25 下野寿之
数式には馴染んでるけど、確率分布は
覚え切れない人向けの資料です。
ポアソン分布とは
よく教科書にある例:
プロイセン陸軍で1875年から1894年の間に
年間で馬に蹴られて死亡した兵士数」の例:
→ パラメータ0.61のポアソン分布によく従う。
教科書的な定義 :
バラメータ n と p=λ/n の二項分布の n→+∞ の極限分布が
パラメータ λ のポアソン分布になる。(ポアソンの極限分布 1837年)
ポアソン分布の密度関数の式 : λk e-λ / k!
平均も分散も λ に等しい。
← この事実は、日常生活上も広く実用的に応用できる。
期待値λ個の現象は、実際の観測をすると λから “平均的” に √ λ 個揺らぐ。
( √ は平方根のルート ) 100個なら10個揺らぐし、1万回なら100個揺らぐ。
— このページは Wikipedia からたくさん引用しています。
l
ポアソン分布の確率密度の式を
忘れない方法 :
λk e-λ / k! ← 大事なのに、意外と覚えにくい. ..
日常生活で年に10回くらい応用できる場面があるのに.. (!?)
ということで、簡単に自然に思い出せる方法 :
「テイラー展開」 (ちょっと昔の高校数学) を使う。
eλ = 1 + λ + λ2/2! + λ3/3! + λ4/4! + λ5/5! + …
両辺を eλ で割る。
1 = e-λ + λe-λ + λ2e-λ/2! + λ3e-λ/3! + …
右辺の各項を 0, 1, 2, 3,.. と番号付けしたときの
番号 k の所が求めたい確率に等しい!
—主たる話は以上!
..
補足 : 二項分布をポアソン分布で表す
λ ← np と代入するとして、パラメータnとpの二項分布に対して
nCk pk (1-p)n-k = { λk e-λ / k! } × { (n-λ)(n-k) e-(n-λ) / (n-k)! } × n!(e/n)n
つまり、k のみをいろいろ動かして値を比で比較したいとき、定数倍を消去して
nCk pk (1-p)n-k ∝ { λk e-λ / k! } × { (n-λ)(n-k) e-(n-λ) / (n-k)! }
すなわち、二項分布(n,p) の密度関数は、
(1) λ←np のポアソン分布の密度関数
(2) λ←n(1-p) のポアソン分布の
密度関数のグラフを
x=n/2の直線で鏡映して
作られる関数
積を定数倍したものになる(右図参照)。
この考え方はカイ2乗検定の導出にも
使える(多分)。
(参考) 前ページのグラフを生成するRコード
plot(-2:12,dbinom((-2:12),10,.7),type="b", lty=2,
ylim=c(0,0.4),cex=1.5,lwd=2,xlab="",ylab="", main="How a binom dist. is derived from
two Poisson dist. through multiplication")
points ( -2:12, dpois(-2:12,7) , type="b", lty=2, col="blue1", pch=16)
points ( 12:-2, dpois(-2:12,3) , type="b", lty=2, col="red2", pch=16)
abline(v=c(0,5,10),lty=c(3,2,3),lwd=c(1,1.5,1),col=c(1,"red2",1))
legend(x=-2, y=0.41, legend=c("Binom( 10 , 0.7 )","Poisson(7)","Poisson(3) mirror
reflected by x=5")
, bg="white", col=c("black","blue","red"),pch=c(1,16,16),lwd=c(1.5,1,1),lty=2)
— 前ページで「多分」と書いたのは、著者が5年前に見つけたと思ったのだが、
今この文書を作成中にその方法をよく思い出せないので、自信が無いため。
— ここに書いた話は 10年位前に著者が自分で気が付いたことを、いろいろな人にしゃべってきて
誰も知らないので、とりあえず書きまとめておくことで、今後の説明の手間を軽減するために作った。
ただし、二項分布をポアソン分布の積で表す話は、そのような話をある人から聞いて、自分で再構成した
ものである。参考文献があれば、是非知りたい。

Mais conteúdo relacionado

Mais de Toshiyuki Shimono

Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...Toshiyuki Shimono
 
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...Toshiyuki Shimono
 
BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)Toshiyuki Shimono
 
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案Toshiyuki Shimono
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...Toshiyuki Shimono
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...Toshiyuki Shimono
 
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)Toshiyuki Shimono
 
企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案Toshiyuki Shimono
 
新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなど新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなどToshiyuki Shimono
 
ページャ lessを使いこなす
ページャ lessを使いこなすページャ lessを使いこなす
ページャ lessを使いこなすToshiyuki Shimono
 
Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理Toshiyuki Shimono
 
データ全貌把握の方法170324
データ全貌把握の方法170324データ全貌把握の方法170324
データ全貌把握の方法170324Toshiyuki Shimono
 
Macで開発環境を整える170420
Macで開発環境を整える170420Macで開発環境を整える170420
Macで開発環境を整える170420Toshiyuki Shimono
 
大きなテキストデータを閲覧するには
大きなテキストデータを閲覧するには大きなテキストデータを閲覧するには
大きなテキストデータを閲覧するにはToshiyuki Shimono
 
A Hacking Toolset for Big Tabular Files (3)
A Hacking Toolset for Big Tabular Files (3)A Hacking Toolset for Big Tabular Files (3)
A Hacking Toolset for Big Tabular Files (3)Toshiyuki Shimono
 
Washingtondc b20161214 (2/3)
Washingtondc b20161214 (2/3)Washingtondc b20161214 (2/3)
Washingtondc b20161214 (2/3)Toshiyuki Shimono
 
耐巨大性を備えた表データ分析用コマンド群
耐巨大性を備えた表データ分析用コマンド群耐巨大性を備えた表データ分析用コマンド群
耐巨大性を備えた表データ分析用コマンド群Toshiyuki Shimono
 

Mais de Toshiyuki Shimono (20)

Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...
 
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...
 
Sqlgen190412.pdf
Sqlgen190412.pdfSqlgen190412.pdf
Sqlgen190412.pdf
 
BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)
 
Seminar0917
Seminar0917Seminar0917
Seminar0917
 
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
 
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
 
企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案
 
新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなど新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなど
 
ページャ lessを使いこなす
ページャ lessを使いこなすページャ lessを使いこなす
ページャ lessを使いこなす
 
Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理
 
データ全貌把握の方法170324
データ全貌把握の方法170324データ全貌把握の方法170324
データ全貌把握の方法170324
 
Macで開発環境を整える170420
Macで開発環境を整える170420Macで開発環境を整える170420
Macで開発環境を整える170420
 
大きなテキストデータを閲覧するには
大きなテキストデータを閲覧するには大きなテキストデータを閲覧するには
大きなテキストデータを閲覧するには
 
A Hacking Toolset for Big Tabular Files (3)
A Hacking Toolset for Big Tabular Files (3)A Hacking Toolset for Big Tabular Files (3)
A Hacking Toolset for Big Tabular Files (3)
 
Washingtondc b20161214 (2/3)
Washingtondc b20161214 (2/3)Washingtondc b20161214 (2/3)
Washingtondc b20161214 (2/3)
 
耐巨大性を備えた表データ分析用コマンド群
耐巨大性を備えた表データ分析用コマンド群耐巨大性を備えた表データ分析用コマンド群
耐巨大性を備えた表データ分析用コマンド群
 
bin4tsv
bin4tsvbin4tsv
bin4tsv
 

Último

TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationYukiTerazawa
 
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラムKochi Eng Camp
 
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料Tokyo Institute of Technology
 
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~Kochi Eng Camp
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2Tokyo Institute of Technology
 
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024koheioishi1
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ssusere0a682
 
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料Takayuki Itoh
 

Último (8)

TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
 
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
 
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
 
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
 
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
 
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
 

ポアソン分布の式を忘れない方法 及び 二項分布との関係 How to avoid forgetting the formula of the probability mass functoin of the Poisson distribution

  • 2. ポアソン分布とは よく教科書にある例: プロイセン陸軍で1875年から1894年の間に 年間で馬に蹴られて死亡した兵士数」の例: → パラメータ0.61のポアソン分布によく従う。 教科書的な定義 : バラメータ n と p=λ/n の二項分布の n→+∞ の極限分布が パラメータ λ のポアソン分布になる。(ポアソンの極限分布 1837年) ポアソン分布の密度関数の式 : λk e-λ / k! 平均も分散も λ に等しい。 ← この事実は、日常生活上も広く実用的に応用できる。 期待値λ個の現象は、実際の観測をすると λから “平均的” に √ λ 個揺らぐ。 ( √ は平方根のルート ) 100個なら10個揺らぐし、1万回なら100個揺らぐ。 — このページは Wikipedia からたくさん引用しています。 l
  • 3. ポアソン分布の確率密度の式を 忘れない方法 : λk e-λ / k! ← 大事なのに、意外と覚えにくい. .. 日常生活で年に10回くらい応用できる場面があるのに.. (!?) ということで、簡単に自然に思い出せる方法 : 「テイラー展開」 (ちょっと昔の高校数学) を使う。 eλ = 1 + λ + λ2/2! + λ3/3! + λ4/4! + λ5/5! + … 両辺を eλ で割る。 1 = e-λ + λe-λ + λ2e-λ/2! + λ3e-λ/3! + … 右辺の各項を 0, 1, 2, 3,.. と番号付けしたときの 番号 k の所が求めたい確率に等しい! —主たる話は以上! ..
  • 4. 補足 : 二項分布をポアソン分布で表す λ ← np と代入するとして、パラメータnとpの二項分布に対して nCk pk (1-p)n-k = { λk e-λ / k! } × { (n-λ)(n-k) e-(n-λ) / (n-k)! } × n!(e/n)n つまり、k のみをいろいろ動かして値を比で比較したいとき、定数倍を消去して nCk pk (1-p)n-k ∝ { λk e-λ / k! } × { (n-λ)(n-k) e-(n-λ) / (n-k)! } すなわち、二項分布(n,p) の密度関数は、 (1) λ←np のポアソン分布の密度関数 (2) λ←n(1-p) のポアソン分布の 密度関数のグラフを x=n/2の直線で鏡映して 作られる関数 積を定数倍したものになる(右図参照)。 この考え方はカイ2乗検定の導出にも 使える(多分)。
  • 5. (参考) 前ページのグラフを生成するRコード plot(-2:12,dbinom((-2:12),10,.7),type="b", lty=2, ylim=c(0,0.4),cex=1.5,lwd=2,xlab="",ylab="", main="How a binom dist. is derived from two Poisson dist. through multiplication") points ( -2:12, dpois(-2:12,7) , type="b", lty=2, col="blue1", pch=16) points ( 12:-2, dpois(-2:12,3) , type="b", lty=2, col="red2", pch=16) abline(v=c(0,5,10),lty=c(3,2,3),lwd=c(1,1.5,1),col=c(1,"red2",1)) legend(x=-2, y=0.41, legend=c("Binom( 10 , 0.7 )","Poisson(7)","Poisson(3) mirror reflected by x=5") , bg="white", col=c("black","blue","red"),pch=c(1,16,16),lwd=c(1.5,1,1),lty=2) — 前ページで「多分」と書いたのは、著者が5年前に見つけたと思ったのだが、 今この文書を作成中にその方法をよく思い出せないので、自信が無いため。 — ここに書いた話は 10年位前に著者が自分で気が付いたことを、いろいろな人にしゃべってきて 誰も知らないので、とりあえず書きまとめておくことで、今後の説明の手間を軽減するために作った。 ただし、二項分布をポアソン分布の積で表す話は、そのような話をある人から聞いて、自分で再構成した ものである。参考文献があれば、是非知りたい。