SlideShare uma empresa Scribd logo
1 de 34
Baixar para ler offline
第43回  TokyoWebMining
@sanoche16
1
名前:@sanoche16
職業:コンサルタント
得意:マーケティングサイエンス
好き:R,  Python,  Linux,  PHP,  Ruby
2
本⽇日の発表に含まれる内容はすべて個⼈人の
⾒見見解であり、必ずしも所属団体の⾒見見解では
ありません。
3
¡  マーケティングにおけるベイジアンモデリングの
必要性
¡  線形ガウス状態空間モデルの基本概念念
¡  線形ガウス状態空間モデルへの季節性変数の取込
¡  線形ガウス状態空間モデルへのマーケティング変
数の取込
¡  パラメータ推定と実装⽅方法
¡  おわりに・参考資料料
4
¡  マーケティングにおけるベイジアンモデリングの
必要性
¡  線形ガウス状態空間モデルの基本概念念
¡  線形ガウス状態空間モデルへの季節性変数の取込
¡  線形ガウス状態空間モデルへのマーケティング変
数の取込
¡  パラメータ推定と実装⽅方法
¡  おわりに・参考資料料
5
PDCA
サイクル
6
多岐に渡って、より精度度の⾼高い分析・予測が求められている
セグメンテー
ション
ポジショニング
ターゲティング
マーケティング戦略略と戦術
考
慮
事
項
求
め
ら
れ
る
分
析
手
法
製品
(Product)
価格
(Price)
流流通
(Place)
販促
(Promotion)
•  市場・顧客の
細分化
?  顧客はどの単位で
分けるべきか
?  マーケティング施
策の単位を作成
•  優先セグメン
トを明確化
?  収益性の⾼高いセグ
メントはどれか
?  今後成⻑⾧長するセグ
メントはどれか
•  売るべき商
品・サービ
スの明確化
?  どんな商品が
求められてい
るか
•  提供価格の
決定・原価
の管理理
?  いくらで商品
を売るべきか
?  どこまで質を
⾼高めるべきか
•  チャネルの
選定
?  どこで商品を
売るべきか
•  販促活動に
よる売上拡
⼤大
?  誰にコストを
かけるべきか
?  いくらまでコ
ストをかける
べきか
クラスター分析
アソシエー
ション分析
回帰分析
離散選択モデル
階層ベイズ
(LTV計測)
時系列分析
因子分析
主成分分析
コレスポンデ
ンス分析
MDS 回帰分析
ニューラル
ネットワーク
決定木
項目反応
理論
最適化
※分析手法は様々なシーンで活用できるため、よく利用される観点で一例
を示した
7
単純な⼿手法によるモデリング
• 線形回帰分析により特定の商品の購買確
率率率を予測
• 投⼊入変数として、年年齢、最終購買⽇日、年年
間購買回数を利利⽤用
分析結果と問題点
• 良良いと予測された顧客は説明変数の最⼤大
(or  最⼩小)の値を持つ顧客になってしまう
➔  本来は優先すべきではない顧客を優先
してしまう
顧客 年齢
最終
購買日
年間購買
回数
新商品
購買有無
Aさん 24歳 14/12/01 15階 有
Bさん 42歳 15/02/06 12階 無
Cさん 36歳 15/01/10 9階 有
… … … … …
顧客 年齢
最終
購買日
年間購買
回数
予測購買
確率
Xさん 2歳 14/02/27 42階 89%
Yさん 4歳 14/02/25 28階 88%
Zさん 4歳 14/02/26 29階 88%
… … … … …
4.3
2.6
5.3
0
1
2
3
4
5
6
年齢 最終購買日 年間購買回数
標準化偏回帰係数
線形回帰分析
予測確率高
8
説明変数を多い場合はかなり不安定なモデルとなってしまう
※1)  http://escience.anu.edu.au/lecture/cg/Spline/printCG.en.html
3次スプライン B-‐‑‒スプライン ガウス型基底関数
基底変換を⽤用いたアプローチ
3次スプライン関数の式:
推定するパラメータベクトル
Ø  利利⽤用する説明変数は1つ
Ø  推定するパラメータは数⼗十
にもなる
※1
9
頻度度主義でのアプローチ
データ数:0
•  情報は⼀一切切なし
ベイズ統計を⽤用いたアプローチ
•  事前分布を更更新
•  分散が⼩小さくなり、推定値の確
からしさを分布で表現
データ数:1
データ数:2
•  データはたまたま取れた値のみ
利利⽤用できる
•  データの広がり(=分散)は
分からない
•  事前分布を設定
•  (無情報事前分布や勘と経験か
ら)
•  標本分散を利利⽤用して⺟母分散を推
定可能
•  但し、2つのデータの近さからの
み推定される(=不不安定)
•  事前分布を更更新
•  分散が⼩小さくなり、推定値の確
からしさを分布で表現
事前分布を更新 事前分布を更新
u  マーケティングの領領域では、現在も⾮非常に多くの統計的
⼿手法を⽤用いた分析が求められている
–  きちんとしたモデリングにはそれなりの柔軟性が必要
u  柔軟なモデリングを⾏行行うためには必要なパラメータはか
なり多くなってしまう
–  パラメータが多くても安定的なモデルの構築が必要になる
u  ベイジアンモデリングを利利⽤用することで、安定的かつ柔
軟なモデリングを⾏行行うことが可能になる
–  事前分布を設定することで、スパースなデータに対しても安定
的なモデリングが可能になる
10
¡  マーケティングにおけるベイジアンモデリングの
必要性
¡  線形ガウス状態空間モデルの基本概念念
¡  線形ガウス状態空間モデルへの季節性変数の取込
¡  線形ガウス状態空間モデルへのマーケティング変
数の取込
¡  パラメータ推定と実装⽅方法
¡  おわりに・参考資料料
11
12
時点の変化に関わる影響
ü  週末になったので、来客数が増加
した
ü  夏になったので、来客数が増加し
た
特定時点での要因による影響
ü  割引を実施したので、来客数が増
加した
ü  たまたま⾬雨が降降ったので、来客数
が増加した
あるレストランの⽇日別来店者数
割引実施
週末
13
あるレストランの⽇日別来店者数
観測値:実際に取得されたデータ
トレンド:観測値から特定時点の要因を排除した潜在的な値
•  トレンドの変化を抽出することで時点の変化に関わる影響を分析
•  トレンドと観測値を⽤用いて、特定時点での要因による影響を分析
14
具体例例
q  以下の3つの条件を満たす形で変化するデータについて考える
1.  時点の変化に伴う変化量量は、1時点前の変化量量と同様となる傾向がある
2.  時点の変化に伴って⼀一定のノイズが発⽣生する
3.  実際の観測に伴って⼀一定のノイズが発⽣生する
•  t時点における変動している変数をµtと置
く
•  (仮定1から)µtは、µt-µt-1=µt-1-µt-2を満た
す µt=2µt-1-µt-2
•  (仮定2から)ノイズをvtのN(0, σ1
2)に従
う正規分布とする(更新ノイズ)
•  t時点における観測値をytと置く
•  (仮定3から)ノイズをwtのN(0,  σ2
2)に
従う正規分布とする(観測ノイズ)
時点の変化に関わる影響 特定時点での要因による影響
µt-2
µtµt-1
yt-2
yt-1
yt
ytはyt-1からの影響は受けず、µtからの影響のみ受けるトレンド
15
時点の変化に関わる影響 特定時点での要因による影響
ベクトル・行列で表現
一般化
システムモデル 観測モデル
状態ベクトル
線形ガウス状態空間モデル
u  状態空間モデルでは、潜在変数を含む状態ベクトルを⽤用
いて時系列列データの分析を⾏行行う
–  時点の変化に伴って推移するトレンド成分を抽出することで、
トレンドの動きとトレンドと実測値の関係の分析が可能になる
u  線形ガウス状態空間モデルはシステムモデル・観測モデ
ルの2つにより構成される
–  システムモデルにより時点の変化による影響を分析
–  観測モデルに特定時点の要因による影響を分析
16
¡  マーケティングにおけるベイジアンモデリングの
必要性
¡  線形ガウス状態空間モデルの基本概念念
¡  線形ガウス状態空間モデルへの季節性変数の取込
¡  線形ガウス状態空間モデルへのマーケティング変
数の取込
¡  パラメータ推定と実装⽅方法
¡  おわりに・参考資料料
17
18
あるレストランの⽇日別来店者数
2nd week1st week
トレンドの週平均
トレンドの週平均
(月)
(火)
(水)
(木)
(土)
(金)
(日)
(月)
(火)
(水)
(木)
(土)
(金)
(日)
時点の変化に関わる曜日の影響のみをモデルとして表現
時点の変化の関係をシステムモデルに組み込んでいく
19
時点の変化に関わる影響 特定時点での要因による影響
曜日効果の取込
状態ベクトルを拡張することで、曜⽇日効果も表現できる
観測モデルへの反映
Ø  観測モデルはその時点の
成分以外は排除する
u  状態ベクトルに対して、1週間の和がゼロとなるような
成分を加えることで、曜⽇日効果を組込むことが可能
–  観測モデルでは、実測値に影響を与える成分をその時点のもの
に限定することで、時点の変化による影響と区別する
20
¡  マーケティングにおけるベイジアンモデリングの
必要性
¡  線形ガウス状態空間モデルの基本概念念
¡  線形ガウス状態空間モデルへの季節性変数の取込
¡  線形ガウス状態空間モデルへのマーケティング変
数の取込
¡  パラメータ推定と実装⽅方法
¡  おわりに・参考資料料
21
22
あるレストランの⽇日別来店者数
割引実施
時点の変化に関わらず一定の値を持つ成分を表現
⼀一定の値を持つ成分をシステムモデルに組み込み、割引効果を測定
割引の実施は、時点の変化とは無
関係に、特定の日のみ影響を与え
る
23
時点の変化に関わる影響 特定時点での要因による影響
時点によらない項の組込
時点によらない成分を組込むことで、値引き効果も表現できる
観測モデルへの反映
ftはt時点の値引きの
有無を表すフラグ
u  マーケティング変数は、システムモデルで時点の変化を
排除することでモデルへの組み込みが可能
–  不不定期な割引など、周期性がないマーケティング施策に関する
変数は、時点の変化による影響がないようにモデルに組み込む
24
¡  マーケティングにおけるベイジアンモデリングの
必要性
¡  線形ガウス状態空間モデルの基本概念念
¡  線形ガウス状態空間モデルへの季節性変数の取込
¡  線形ガウス状態空間モデルへのマーケティング変
数の取込
¡  パラメータ推定と実装⽅方法
¡  おわりに・参考資料料
25
26
1期先予測とフィルタリングを⽤用いて状態ベクトルの分布を推定
概要
t-‐‑‒1時点までの実測値のデータを利利⽤用して、t期にお
けるxtの分布を考える
予測分布 フィルタ分布
分布
t時点まので実測値のデータを利利⽤用してt時点でのxt
の分布を考える
t-1のフィルタ分布
t-1の予測分布
i時点の状態
予測
予測
予測
フィルタリング
フィルタリング
i時点のデータ
を利用
27
過去を振り返って状態ベクトルを表現し、定性的な⽰示唆が得られる
i時点の状態
予測
予測
予測
フィルタリング
フィルタリング
i時点のデータ
を利用
固定区間平滑滑化アルゴリズム
ü  予測分布とフィルタ分布によりT時点までのデータを⽤用いてp(xT|yT)がわかってい
る
→  T-‐‑‒1から逐次的に状態ベクトルを求められる
フィルタ分布 予測分布
28
フィルタリング
q  逐次学習型の状態空間モデルにおけるパラメータ推定では、予測分布・フィルタリン
グ・平滑滑化を繰り返すことで、状態ベクトルを求めていく
•  線形ガウス状態空間モデルにおいて、利用
される
•  最小化する推定誤差にガウス分布を仮定
•  計算速度が速い
•  ⾮非線形の状態空間モデルに対応するフィ
ルタリングアルゴリズム
•  粒粒⼦子(パーティクル)を発⽣生させてノン
パラメトリックに最適解を求める
カルマンフィルタ パーティクルフィルタ
バッチ学習を行う際にはフィルタリングではなく、MCMCの利用も可能
u  Stanを⽤用いたMCMCでのパラメータ推定の例例は下記に完全版があ
ります(データもあります)
29
u  状態空間モデルでは、予測分布・フィルタ分布・平滑滑化
分布の3つを利利⽤用し、トレンドの推定・予測を⾏行行う
–  予測分布により⼀一期先の予測を⾏行行う
–  フィルタ分布に特定時点における状態ベクトルの分布を表現す
る
–  平滑滑化分布により以前の時点における状態ベクトルの分布を表
現する
u  カルマンフィルタを利利⽤用することで⾼高速な計算・オンラ
イン学習が可能
30
¡  マーケティングにおけるベイジアンモデリングの
必要性
¡  線形ガウス状態空間モデルの基本概念念
¡  線形ガウス状態空間モデルへの季節性変数の取込
¡  線形ガウス状態空間モデルへのマーケティング変
数の取込
¡  パラメータ推定と実装⽅方法
¡  おわりに・参考資料料
31
u  状態空間モデルとはシステムモデルと観測モデルを⽤用い
て、分析を⾏行行うメタモデル
–  システムモデルと観測モデルは⾃自由に設定できる
–  ⾮非線形のモデルを利利⽤用した場合は、パーティクルフィルタを利利
⽤用することで、状態ベクトルを求めることが可能
u  パラメータの推定は必ずしも逐次学習をする必要はない
–  バッチ処理理にはMCMCを⽤用いた推定が可能
32
u  状態空間モデルの概要
v  予測にいかす統計モデリングの基本  樋⼝口知之(2011)
v  データ同化⼊入⾨門  樋⼝口知之(2011)
v  時系列列解析⼊入⾨門  北北川源四郎郎(2005)
v  Rによるベイジアン動的線形モデル  G.ペトリス,  S.ペトローネ,  P.カンパニョー
リ,  和合  肇,  萩原  淳⼀一郎郎(2013)
u  状態空間モデルの活⽤用について
v  時系列列解析⼊入⾨門  北北川源四郎郎(2005)
u  その他
v  RStanで『予測にいかす統計モデリングの基本』の売上データの分析をトレース
してみた  berobero11(2013)
v  逐次モンテカルロ/(粒粒⼦子|パーティクル|モンテカルロ)フィルタを実装してみた  
teramonagi(2014)
33
ご静聴ありがとうございました。
34

Mais conteúdo relacionado

Mais procurados

階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
shima o
 
PRML上巻勉強会 at 東京大学 資料 第1章前半
PRML上巻勉強会 at 東京大学 資料 第1章前半PRML上巻勉強会 at 東京大学 資料 第1章前半
PRML上巻勉強会 at 東京大学 資料 第1章前半
Ohsawa Goodfellow
 

Mais procurados (20)

トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?
 
時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数
 
順序データでもベイズモデリング
順序データでもベイズモデリング順序データでもベイズモデリング
順序データでもベイズモデリング
 
ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択
 
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM) 一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
 
機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化機械学習モデルのハイパパラメータ最適化
機械学習モデルのハイパパラメータ最適化
 
最適輸送の計算アルゴリズムの研究動向
最適輸送の計算アルゴリズムの研究動向最適輸送の計算アルゴリズムの研究動向
最適輸送の計算アルゴリズムの研究動向
 
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
 
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
[DL輪読会]Revisiting Deep Learning Models for Tabular Data  (NeurIPS 2021) 表形式デー...[DL輪読会]Revisiting Deep Learning Models for Tabular Data  (NeurIPS 2021) 表形式デー...
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
 
「世界モデル」と関連研究について
「世界モデル」と関連研究について「世界モデル」と関連研究について
「世界モデル」と関連研究について
 
1 4.回帰分析と分散分析
1 4.回帰分析と分散分析1 4.回帰分析と分散分析
1 4.回帰分析と分散分析
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
 
Variational AutoEncoder
Variational AutoEncoderVariational AutoEncoder
Variational AutoEncoder
 
Prophet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツールProphet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツール
 
PRML上巻勉強会 at 東京大学 資料 第1章前半
PRML上巻勉強会 at 東京大学 資料 第1章前半PRML上巻勉強会 at 東京大学 資料 第1章前半
PRML上巻勉強会 at 東京大学 資料 第1章前半
 
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
 
距離とクラスタリング
距離とクラスタリング距離とクラスタリング
距離とクラスタリング
 

Destaque

マーケティングサイエンス徹底入門と実践Part2
マーケティングサイエンス徹底入門と実践Part2マーケティングサイエンス徹底入門と実践Part2
マーケティングサイエンス徹底入門と実践Part2
宏喜 佐野
 
Pystan for nlp
Pystan for nlpPystan for nlp
Pystan for nlp
Xiangze
 
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
. .
 
ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33
horihorio
 

Destaque (10)

分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
 
マーケティングサイエンス徹底入門と実践Part2
マーケティングサイエンス徹底入門と実践Part2マーケティングサイエンス徹底入門と実践Part2
マーケティングサイエンス徹底入門と実践Part2
 
セグメンテーションの考え方・使い方 - TokyoR #44
セグメンテーションの考え方・使い方 - TokyoR #44セグメンテーションの考え方・使い方 - TokyoR #44
セグメンテーションの考え方・使い方 - TokyoR #44
 
Pystan for nlp
Pystan for nlpPystan for nlp
Pystan for nlp
 
状態空間モデル等による多変量時系列データ解析
状態空間モデル等による多変量時系列データ解析状態空間モデル等による多変量時系列データ解析
状態空間モデル等による多変量時系列データ解析
 
PyMC mcmc
PyMC mcmcPyMC mcmc
PyMC mcmc
 
時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17
 
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
 
カルマンフィルタについて
カルマンフィルタについてカルマンフィルタについて
カルマンフィルタについて
 
ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33
 

ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング