O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.

ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング

22.728 visualizações

Publicada em

状態空間モデルの概要とマーケティング施策等の周期性・モデル表現について解説しています

Publicada em: Marketing
  • Entre para ver os comentários

ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング

  1. 1. 第43回  TokyoWebMining @sanoche16 1
  2. 2. 名前:@sanoche16 職業:コンサルタント 得意:マーケティングサイエンス 好き:R,  Python,  Linux,  PHP,  Ruby 2
  3. 3. 本⽇日の発表に含まれる内容はすべて個⼈人の ⾒見見解であり、必ずしも所属団体の⾒見見解では ありません。 3
  4. 4. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 4
  5. 5. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 5
  6. 6. PDCA サイクル 6 多岐に渡って、より精度度の⾼高い分析・予測が求められている セグメンテー ション ポジショニング ターゲティング マーケティング戦略略と戦術 考 慮 事 項 求 め ら れ る 分 析 手 法 製品 (Product) 価格 (Price) 流流通 (Place) 販促 (Promotion) •  市場・顧客の 細分化 ?  顧客はどの単位で 分けるべきか ?  マーケティング施 策の単位を作成 •  優先セグメン トを明確化 ?  収益性の⾼高いセグ メントはどれか ?  今後成⻑⾧長するセグ メントはどれか •  売るべき商 品・サービ スの明確化 ?  どんな商品が 求められてい るか •  提供価格の 決定・原価 の管理理 ?  いくらで商品 を売るべきか ?  どこまで質を ⾼高めるべきか •  チャネルの 選定 ?  どこで商品を 売るべきか •  販促活動に よる売上拡 ⼤大 ?  誰にコストを かけるべきか ?  いくらまでコ ストをかける べきか クラスター分析 アソシエー ション分析 回帰分析 離散選択モデル 階層ベイズ (LTV計測) 時系列分析 因子分析 主成分分析 コレスポンデ ンス分析 MDS 回帰分析 ニューラル ネットワーク 決定木 項目反応 理論 最適化 ※分析手法は様々なシーンで活用できるため、よく利用される観点で一例 を示した
  7. 7. 7 単純な⼿手法によるモデリング • 線形回帰分析により特定の商品の購買確 率率率を予測 • 投⼊入変数として、年年齢、最終購買⽇日、年年 間購買回数を利利⽤用 分析結果と問題点 • 良良いと予測された顧客は説明変数の最⼤大 (or  最⼩小)の値を持つ顧客になってしまう ➔  本来は優先すべきではない顧客を優先 してしまう 顧客 年齢 最終 購買日 年間購買 回数 新商品 購買有無 Aさん 24歳 14/12/01 15階 有 Bさん 42歳 15/02/06 12階 無 Cさん 36歳 15/01/10 9階 有 … … … … … 顧客 年齢 最終 購買日 年間購買 回数 予測購買 確率 Xさん 2歳 14/02/27 42階 89% Yさん 4歳 14/02/25 28階 88% Zさん 4歳 14/02/26 29階 88% … … … … … 4.3 2.6 5.3 0 1 2 3 4 5 6 年齢 最終購買日 年間購買回数 標準化偏回帰係数 線形回帰分析 予測確率高
  8. 8. 8 説明変数を多い場合はかなり不安定なモデルとなってしまう ※1)  http://escience.anu.edu.au/lecture/cg/Spline/printCG.en.html 3次スプライン B-‐‑‒スプライン ガウス型基底関数 基底変換を⽤用いたアプローチ 3次スプライン関数の式: 推定するパラメータベクトル Ø  利利⽤用する説明変数は1つ Ø  推定するパラメータは数⼗十 にもなる ※1
  9. 9. 9 頻度度主義でのアプローチ データ数:0 •  情報は⼀一切切なし ベイズ統計を⽤用いたアプローチ •  事前分布を更更新 •  分散が⼩小さくなり、推定値の確 からしさを分布で表現 データ数:1 データ数:2 •  データはたまたま取れた値のみ 利利⽤用できる •  データの広がり(=分散)は 分からない •  事前分布を設定 •  (無情報事前分布や勘と経験か ら) •  標本分散を利利⽤用して⺟母分散を推 定可能 •  但し、2つのデータの近さからの み推定される(=不不安定) •  事前分布を更更新 •  分散が⼩小さくなり、推定値の確 からしさを分布で表現 事前分布を更新 事前分布を更新
  10. 10. u  マーケティングの領領域では、現在も⾮非常に多くの統計的 ⼿手法を⽤用いた分析が求められている –  きちんとしたモデリングにはそれなりの柔軟性が必要 u  柔軟なモデリングを⾏行行うためには必要なパラメータはか なり多くなってしまう –  パラメータが多くても安定的なモデルの構築が必要になる u  ベイジアンモデリングを利利⽤用することで、安定的かつ柔 軟なモデリングを⾏行行うことが可能になる –  事前分布を設定することで、スパースなデータに対しても安定 的なモデリングが可能になる 10
  11. 11. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 11
  12. 12. 12 時点の変化に関わる影響 ü  週末になったので、来客数が増加 した ü  夏になったので、来客数が増加し た 特定時点での要因による影響 ü  割引を実施したので、来客数が増 加した ü  たまたま⾬雨が降降ったので、来客数 が増加した あるレストランの⽇日別来店者数 割引実施 週末
  13. 13. 13 あるレストランの⽇日別来店者数 観測値:実際に取得されたデータ トレンド:観測値から特定時点の要因を排除した潜在的な値 •  トレンドの変化を抽出することで時点の変化に関わる影響を分析 •  トレンドと観測値を⽤用いて、特定時点での要因による影響を分析
  14. 14. 14 具体例例 q  以下の3つの条件を満たす形で変化するデータについて考える 1.  時点の変化に伴う変化量量は、1時点前の変化量量と同様となる傾向がある 2.  時点の変化に伴って⼀一定のノイズが発⽣生する 3.  実際の観測に伴って⼀一定のノイズが発⽣生する •  t時点における変動している変数をµtと置 く •  (仮定1から)µtは、µt-µt-1=µt-1-µt-2を満た す µt=2µt-1-µt-2 •  (仮定2から)ノイズをvtのN(0, σ1 2)に従 う正規分布とする(更新ノイズ) •  t時点における観測値をytと置く •  (仮定3から)ノイズをwtのN(0,  σ2 2)に 従う正規分布とする(観測ノイズ) 時点の変化に関わる影響 特定時点での要因による影響 µt-2 µtµt-1 yt-2 yt-1 yt ytはyt-1からの影響は受けず、µtからの影響のみ受けるトレンド
  15. 15. 15 時点の変化に関わる影響 特定時点での要因による影響 ベクトル・行列で表現 一般化 システムモデル 観測モデル 状態ベクトル 線形ガウス状態空間モデル
  16. 16. u  状態空間モデルでは、潜在変数を含む状態ベクトルを⽤用 いて時系列列データの分析を⾏行行う –  時点の変化に伴って推移するトレンド成分を抽出することで、 トレンドの動きとトレンドと実測値の関係の分析が可能になる u  線形ガウス状態空間モデルはシステムモデル・観測モデ ルの2つにより構成される –  システムモデルにより時点の変化による影響を分析 –  観測モデルに特定時点の要因による影響を分析 16
  17. 17. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 17
  18. 18. 18 あるレストランの⽇日別来店者数 2nd week1st week トレンドの週平均 トレンドの週平均 (月) (火) (水) (木) (土) (金) (日) (月) (火) (水) (木) (土) (金) (日) 時点の変化に関わる曜日の影響のみをモデルとして表現 時点の変化の関係をシステムモデルに組み込んでいく
  19. 19. 19 時点の変化に関わる影響 特定時点での要因による影響 曜日効果の取込 状態ベクトルを拡張することで、曜⽇日効果も表現できる 観測モデルへの反映 Ø  観測モデルはその時点の 成分以外は排除する
  20. 20. u  状態ベクトルに対して、1週間の和がゼロとなるような 成分を加えることで、曜⽇日効果を組込むことが可能 –  観測モデルでは、実測値に影響を与える成分をその時点のもの に限定することで、時点の変化による影響と区別する 20
  21. 21. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 21
  22. 22. 22 あるレストランの⽇日別来店者数 割引実施 時点の変化に関わらず一定の値を持つ成分を表現 ⼀一定の値を持つ成分をシステムモデルに組み込み、割引効果を測定 割引の実施は、時点の変化とは無 関係に、特定の日のみ影響を与え る
  23. 23. 23 時点の変化に関わる影響 特定時点での要因による影響 時点によらない項の組込 時点によらない成分を組込むことで、値引き効果も表現できる 観測モデルへの反映 ftはt時点の値引きの 有無を表すフラグ
  24. 24. u  マーケティング変数は、システムモデルで時点の変化を 排除することでモデルへの組み込みが可能 –  不不定期な割引など、周期性がないマーケティング施策に関する 変数は、時点の変化による影響がないようにモデルに組み込む 24
  25. 25. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 25
  26. 26. 26 1期先予測とフィルタリングを⽤用いて状態ベクトルの分布を推定 概要 t-‐‑‒1時点までの実測値のデータを利利⽤用して、t期にお けるxtの分布を考える 予測分布 フィルタ分布 分布 t時点まので実測値のデータを利利⽤用してt時点でのxt の分布を考える t-1のフィルタ分布 t-1の予測分布 i時点の状態 予測 予測 予測 フィルタリング フィルタリング i時点のデータ を利用
  27. 27. 27 過去を振り返って状態ベクトルを表現し、定性的な⽰示唆が得られる i時点の状態 予測 予測 予測 フィルタリング フィルタリング i時点のデータ を利用 固定区間平滑滑化アルゴリズム ü  予測分布とフィルタ分布によりT時点までのデータを⽤用いてp(xT|yT)がわかってい る →  T-‐‑‒1から逐次的に状態ベクトルを求められる フィルタ分布 予測分布
  28. 28. 28 フィルタリング q  逐次学習型の状態空間モデルにおけるパラメータ推定では、予測分布・フィルタリン グ・平滑滑化を繰り返すことで、状態ベクトルを求めていく •  線形ガウス状態空間モデルにおいて、利用 される •  最小化する推定誤差にガウス分布を仮定 •  計算速度が速い •  ⾮非線形の状態空間モデルに対応するフィ ルタリングアルゴリズム •  粒粒⼦子(パーティクル)を発⽣生させてノン パラメトリックに最適解を求める カルマンフィルタ パーティクルフィルタ バッチ学習を行う際にはフィルタリングではなく、MCMCの利用も可能
  29. 29. u  Stanを⽤用いたMCMCでのパラメータ推定の例例は下記に完全版があ ります(データもあります) 29
  30. 30. u  状態空間モデルでは、予測分布・フィルタ分布・平滑滑化 分布の3つを利利⽤用し、トレンドの推定・予測を⾏行行う –  予測分布により⼀一期先の予測を⾏行行う –  フィルタ分布に特定時点における状態ベクトルの分布を表現す る –  平滑滑化分布により以前の時点における状態ベクトルの分布を表 現する u  カルマンフィルタを利利⽤用することで⾼高速な計算・オンラ イン学習が可能 30
  31. 31. ¡  マーケティングにおけるベイジアンモデリングの 必要性 ¡  線形ガウス状態空間モデルの基本概念念 ¡  線形ガウス状態空間モデルへの季節性変数の取込 ¡  線形ガウス状態空間モデルへのマーケティング変 数の取込 ¡  パラメータ推定と実装⽅方法 ¡  おわりに・参考資料料 31
  32. 32. u  状態空間モデルとはシステムモデルと観測モデルを⽤用い て、分析を⾏行行うメタモデル –  システムモデルと観測モデルは⾃自由に設定できる –  ⾮非線形のモデルを利利⽤用した場合は、パーティクルフィルタを利利 ⽤用することで、状態ベクトルを求めることが可能 u  パラメータの推定は必ずしも逐次学習をする必要はない –  バッチ処理理にはMCMCを⽤用いた推定が可能 32
  33. 33. u  状態空間モデルの概要 v  予測にいかす統計モデリングの基本  樋⼝口知之(2011) v  データ同化⼊入⾨門  樋⼝口知之(2011) v  時系列列解析⼊入⾨門  北北川源四郎郎(2005) v  Rによるベイジアン動的線形モデル  G.ペトリス,  S.ペトローネ,  P.カンパニョー リ,  和合  肇,  萩原  淳⼀一郎郎(2013) u  状態空間モデルの活⽤用について v  時系列列解析⼊入⾨門  北北川源四郎郎(2005) u  その他 v  RStanで『予測にいかす統計モデリングの基本』の売上データの分析をトレース してみた  berobero11(2013) v  逐次モンテカルロ/(粒粒⼦子|パーティクル|モンテカルロ)フィルタを実装してみた   teramonagi(2014) 33
  34. 34. ご静聴ありがとうございました。 34

×