SlideShare uma empresa Scribd logo
1 de 31
Baixar para ler offline
第39回 TokyoWebMining 
@sanoche16 
1
名前:@sanoche16 
職業:コンサルタント 
得意:マーケティングサイエンス 
好き:R, Python, Linux, PHP, Ruby 
大志:世の中にイノベーションを 
2
本日の発表に含まれる内容はすべて個人の 見解であり、必ずしも所属団体の見解では ありません。 
3
現代のマーケテイング全体像 
離散選択モデルの概要 
–ロジットモデル 
–入れ子ロジットモデル 
–プロビットモデル 
–混合ロジットモデル 
4
5 
ソーシャルメ ディアマーケ ティング 
Web広告 
キャンペーン 管理 
LPO/動的コン テンツ 
スマホ 
比較サイト 
ライフ 
スタイル 
SNSの利用 
スマホ 
マーケティング 担当者 
消費者 
エリアマーケ ティング 
マーケット 
新規参入 
ニッチ商品 
One To One マーケティングの必要性が拡大
6 
製品の設計 
資材調達 
製造 
価格設定 
販売 
プロモーション 
流通 
サービス 
製品の製造 
製品の販売 
顧客の細分化 
市場の選 択/集中 
ポジショ ニング 
製品開発 
サービス 開発 
価格設定 
資材調達 
流通 
セールス フォース 
販売促進 
広告 
価値の選択 
価値の提供 
価値の伝達 
従来のマーケティングプロセス1) 
新しいマーケティングプロセス 
1)マーケティングマネジメント第12版日本語訳版より 
モノを作って 
売る 
多くのマス市場が 
ミクロ市場に分裂 
STP分析 
「ターゲットとアプローチの明確化」 
4P(マーケティング・ミックス) 
「マーケティング・ミックスの検討・実行」 
STP+4Pによるミクロ市場への適切な対応・適応が求められている
7 
Segmentation 
Targeting 
Positioning 
Product 
Price 
Place 
Promotion 
STP分析 
4P(マーケティング・ミックス) 
目的 
マーケティング戦略の立案 
マーケティング戦術の実行 
概要 
マス市場を適切なミクロ市場に分け (Segmentation)、どの市場に対して (Targeting)、どのようにアプローチする か(Positioning)を検討 
STP分析により立案したポジショニング目標≒ブランディング を達成すべく、商品・サービス提供の計画・実行・検証・高 度化(PDCA)を行い、ミクロ市場でのNo.1を目指す 
実行期間 
(市場によるものの)プロダクト・ライフ サイクルに合わせて、長期スパン(数年~ 5年間)で検討される 
実行・検証・高度化を行うための効果的なアプローチを行う ため、短期スパン(数週間~数か月)で検討される 
マーケティン グサイエンス の活用余地 
•市場分析(市場セグメンテーション、 プロデジーモデル、ポジショニング マップ等) 
•需要予測(普及モデル、時系列解析 等) … 
•ニーズ分析(知覚マップ、コンジョイント分析、顧客セグ メンテーション等) 
•プロモーションROI分析(アトリビューション分析等) 
•消費者行動の理解(離散選択モデル、購買行動モデリング 等) … 
前回の発表内容 
今回の発表内容
マーケティングの領域は大きく、戦略的マーケティング と戦術的マーケティングに分かれる 
–戦略的マーケティングではターゲットを選定し、アプローチ方 針を立案 
–戦術的マーケティングでは定義されたアプローチ方針達成に向 け、極力効率的に施策を実施 
分析により明らかにすべきことと分析方法の対応は非常 に重要である 
–ネクストアクションの決定に役立つ、適切な分析方法を選択 
–可能であれば上位概念はフレームワークを利用 
8
企画側に響く分析・目的を常に持った分析を行うために 心掛けていることはありますか? 
分析結果をアクショナブルにするために工夫しているこ とはありますか? 
9
現代のマーケテイング全体像 
離散選択モデルの概要 
–ロジットモデル 
–入れ子ロジットモデル 
–プロビットモデル 
–混合ロジットモデル 
10
11 
離散選択モデルの概要 
複数の選択肢の中から選択肢を1つ選択する消費者行動をモデル化したもの (例)次の選挙はどこに投票するか、どの飲料を買おうか、etc… 
特に、以下の3点を満たす場面を想定している 
1.選択する選択肢は必ず1つである(複数の選択肢も考慮する場合は、複数の選 択肢を選ぶという選択肢を作ればよい) 
2.必ずいずれかの選択肢を選択する(選択しない可能性がある場合は選択しな いという選択肢を作ればよい) 
3.選択肢の数は有限である(いくつ購入するかをモデル化する場合には離散選 択モデルがそぐわない場合がある⇔回帰分析) 
どこに行こうかなぁ… 
いずれかの選択肢を必ず1つ選択 
a 
b 
c
12 
選択肢の吟味 
意思決定 
ポ イ ン ト 
•意思決定者はそれぞれの選択肢から魅力 =効用を得られると考える 
•選択肢がそれぞれ持っている特徴が選択 肢の効用に影響を与え、効用は定量化さ れていると考える 
•意思決定者は、その意思決定に際して、 効用が最大の選択肢を常に選択すると考 える(効用の最大化) 
•選択肢は必ず1つだけ選択される 
効用:90 
夜景:☆☆☆☆★ 
食事:☆☆☆★★ 
価格:☆☆☆☆★ 
効用:80 
夜景:☆☆☆☆☆ 
食事:☆☆☆☆★ 
価格:☆★★★★ 
効用:60 
夜景:☆★★★★ 
食事:☆☆★★★ 
価格:☆☆☆★★ 
効用:90 
夜景:☆☆☆☆★ 
食事:☆☆☆★★ 
価格:☆☆☆☆★ 
選択 
どのように効用を定量化するか?
13 
(意思決定者・選択肢毎の) 効用 
利用データイメージ 
概要 
モデルへの組 み込み 
観測要因 
選択行動に影響している、 観測されている情報 例)性別、年齢、商品価格、色… 
多くの場合は説明変数に対して 
線形モデルを仮定 
非観測要因 
選択行動に影響しているものの、 観測されていない情報 例)その時の気分、感覚的なイメージ… 
ランダム項として、確率分布を仮定 
確定項 
ランダム項 
顧客 
性別 
A価格 
B価格 
C価格 
選択 結果 
Aさん 
男性 
200 
180 
150 
B 
Bさん 
男性 
210 
170 
160 
B 
Cさん 
女性 
190 
180 
140 
A 
… 
… 
… 
… 
… 
… 
nさんの選択肢jに 対する効用 
パラメータの推定 
仮定した確率分布によりモデルが決定
14 
顧客属性 データ 
選択肢 データ 
離散選択モデル 
•年齢 
•性別 
•年収 ・・・ 
•価格 
•スペック 
•保証期間 ・・・ 
アウトプット 
インプット 
Aさん 
選択肢1:40% 選択肢2:10% 選択肢3:50% 
Bさん 
選択肢1:70% 選択肢2:20% 選択肢3:10% 
実際の選択 
モデルのなかで 求まる定数 
確率分布 
「特定の確率分布に従う確率変数が閾値を下回る確率」が 選択肢の選択確率となる 
ランダム項について様々な確率分布を考慮し、柔軟にモデル化を行っていく
15 
離散選択モデル、ランダム項の分布と特徴 
ランダム項 の分布 
パラメータ 推定 
制約等 
ロジットモデル 
極値分布 
プロビットモデル 
多変量正規分布 
入れ子ロジット モデル 
極値分布 
混合ロジット モデル 
極値分布 
最尤推定 
シミュレーション 
最尤推定 
シミュレーション 
IIAを仮定 
誤差分布が 正規分布を仮定 
サブセットのなかでIIA を仮定 
誤差分布は1つに限定 (⇔ベイズ推定)
現代のマーケテイング全体像 
離散選択モデルの概要 
–ロジットモデル 
–入れ子ロジットモデル 
–プロビットモデル 
–混合ロジットモデル 
16
17 
概要 
Luce(1959)によりロ ジットモデルの式が 導出され、翌年に効 用最大化をモデル化 できることがすぐに 証明された 
モデルが閉じた形で 表現されるため、解 釈しやすく、幅広い 領域で利用されてき た 
モデル化 
ランダム項の確率分布を ガンベル分布と仮定 
アウトプット 
ロジットモデルの P(確率)は必ず0から1 の範囲に入る 
すべての選択肢の選 択確率の合計は必ず1 になる 
nさんが選択肢iを選ぶ確率 
選択肢iの効用が、その 他のすべての選択肢の 効用より大きい確率
18 
車購入での利用例 
•T社とH社の車で顧客が迷っている状況をモデル化する 
それぞれの車の価格(P)、燃費(C)を用いて購買行動をモデリング 
•効用を以下のように表現 
確定項
19 
Rでの実行例 
> #libraryの読み込み 
> library(mlogit) 
> data("Train", package = "mlogit") 
> #データの作成 
> Tr <- mlogit.data(Train, shape = "wide", varying = 4:11, choice = "choice", 
+ sep = "", opposite = c("price", "time", "change", "comfort"), 
+ alt.levels = c("choice1", "choice2"), id = "id") 
> head(Tr, n=10) 
id choiceid choice alt price time change comfort chid 
1.choice1 1 1 TRUE 1 -2400 -150 0 -1 1 
1.choice2 1 1 FALSE 2 -4000 -150 0 -1 1 
2.choice1 1 2 TRUE 1 -2400 -150 0 -1 2 
2.choice2 1 2 FALSE 2 -3200 -130 0 -1 2 
3.choice1 1 3 TRUE 1 -2400 -115 0 -1 3 
3.choice2 1 3 FALSE 2 -4000 -115 0 0 3 
4.choice1 1 4 FALSE 1 -4000 -130 0 -1 4 
4.choice2 1 4 TRUE 2 -3200 -150 0 0 4 
5.choice1 1 5 FALSE 1 -2400 -150 0 -1 5 
5.choice2 1 5 TRUE 2 -3200 -150 0 0 5 
1さんが choice1・ choice2から choice1を選択
20 
Rでの実行例 
> summary(Train.ml) 
Call: 
mlogit(formula = choice ~ price + time + change + comfort, data = Tr, 
method = "nr", print.level = 0) 
…略… 
Coefficients : 
Estimate Std. Error t-value Pr(>|t|) 
choice2:(intercept) -0.03249805 0.04108023 -0.7911 0.4289 
price 0.00148495 0.00007479 19.8550 < 2.2e-16 *** 
time 0.02873396 0.00267475 10.7427 < 2.2e-16 *** 
change 0.32581324 0.05950424 5.4755 4.364e-08 *** 
comfort 0.94704645 0.06498665 14.5729 < 2.2e-16 *** 
--- 
Signif. codes: 0 ・**・0.001 ・*・0.01 ・・0.05 ・・0.1 ・・1 
Log-Likelihood: -1723.8 
McFadden R^2: 0.15089 
Likelihood ratio test : chisq = 612.66 (p.value = < 2.22e-16) 
係数の推定値を算出
21 
2つの選択肢の選択確率比 
離散選択モデル 
他の選択肢の影響を受けていない 
= 
The independence from irrelevant alternatives(IIA) 
•IIAが成立している場合は、特定の2つの選択肢 以外の特徴が変化しても、2つの選択肢の選択 確率比は一定であることを意味している 
•多くの場合で実際にIIAが成り立っている消費者 行動がたくさん観測されている 
•ほとんどの要因が観測変数としてとらえられている 場合は、IIAは問題にはならない 
•一方で、次の例のように常にIIAが成り立つとは考 えにくい場合も多く存在する 
A電鉄の電車とB交通のバスの選択肢があ る通勤に際して、市場に新たにC交通がバ スを運営し新規参入した場合、これまでの A電鉄とB交通の顧客比は一定になりえ か? 
•モデルがIIAを満たす原因はランダム項が選択肢 毎に独立しているためである。 
⇒より柔軟なモデルが必要
現代のマーケテイング全体像 
離散選択モデルの概要 
–ロジットモデル 
–入れ子ロジットモデル 
–プロビットモデル 
–混合ロジットモデル 
22
23 
概要 
多くの研究者により、 エネルギー、輸送、 住宅、通信業界など に適用された 
GEV(一般化極値モ デル)のなかでは比 較的シンプルな形で あり、解釈しやすい 
選択肢はいくつかの サブグループに分割 してモデル化を行う 
モデル化 
ランダム項の累積確率分 布を以下とする 
λを入れ子k内の選択肢間 独立性を表す 
(すべてのkについて λk=1であれば、ロジッ トモデルと等しくなる) 
アウトプット 
階層構造を持ったロ ジットモデルになっ ており、IIAが成り立 たない事象もモデル 化している 
自転 車 
自家 用車 
バス 
電車 
交通 機関 
保有 
車両 
入れ子ロジットの2選択確率比率は以下となる
現代のマーケテイング全体像 
離散選択モデルの概要 
–ロジットモデル 
–入れ子ロジットモデル 
–プロビットモデル 
–混合ロジットモデル 
24
25 
概要 
ロジットモデルでは 制限されていた、以 下の3つを組み込み可 能にする 
1.Random taste variationを表現 
2.IIAを表現 
3.非観測データが 相関を持ってい るパネルデータ にも適用可能 
モデル化 
ランダム項を多変量正規 分布と仮定 
アウトプット 
シミュレーションに よりパラメータを推 定 
個人ごとに確定項の パラメータを推定
現代のマーケテイング全体像 
離散選択モデルの概要 
–ロジットモデル 
–入れ子ロジットモデル 
–プロビットモデル 
–混合ロジットモデル 
26
27 
概要 
ロジットモデルで推 定していたβを確率分 布として一般化を行 う 
プロビットモデルと 同様にRandom taste variationを表現 
比較的シンプルなシ ミュレーションで推 定可能 
モデル化 
ランダム項を多変量正規 分布と仮定 
アウトプット 
シミュレーションに よりパラメータを推 定 
個人ごとに確定項の パラメータを推定
28 
Rでの実行例 
> #libraryの読み込み > library(mlogit) > data("Train", package = "mlogit") > #データの作成 > Tr <- mlogit.data(Train, shape = "wide", varying = 4:11, choice = "choice", + sep = "", opposite = c("price", "time", "change", "comfort"), + alt.levels = c("choice1", "choice2"), id = "id") > head(Tr, n=10) id choiceid choice alt price time change comfort chid 1.choice1 1 1 TRUE 1 -2400 -150 0 -1 1 1.choice2 1 1 FALSE 2 -4000 -150 0 -1 1 2.choice1 1 2 TRUE 1 -2400 -150 0 -1 2 2.choice2 1 2 FALSE 2 -3200 -130 0 -1 2 3.choice1 1 3 TRUE 1 -2400 -115 0 -1 3 3.choice2 1 3 FALSE 2 -4000 -115 0 0 3 4.choice1 1 4 FALSE 1 -4000 -130 0 -1 4 4.choice2 1 4 TRUE 2 -3200 -150 0 0 4 5.choice1 1 5 FALSE 1 -2400 -150 0 -1 5 5.choice2 1 5 TRUE 2 -3200 -150 0 0 5 
1さんが choice1・ choice2から choice1を選択
29 
Rでの実行例 
> # mixed logitの実行(共分散あり) 
> Train.mxlc <- mlogit(choice ~ price + time + change + comfort, 
+ Tr, panel = TRUE, rpar = c(time = "cn", change = "n", 
+ comfort = "ln"), 
+ correlation = TRUE, R = 100, halton = NA) 
> # mixed logitの実行(共分散なし) 
> Train.mxlu <- update(Train.mxlc, correlation = FALSE) 
> summary(Train.mxlc) 
…略… 
McFadden R^2: 0.23345 
…略… 
> summary(Train.mxlu) 
…略… 
McFadden R^2: 0.21703 
…略… 
←McFadden決定係数が向上
30 
離散選択モデルからのインプリケーション 
ネクストアクションの例 
商 品 
•色の嗜好 
•サイズの嗜好 
•機能の必要性 
•商品改革 
価 格 
•キャンペーンの効果 
•値上げ時の需要予測 
•価格戦略立案 
チ ャ ネ ル 
•チャネル変更によるリフト効果 
•適正商品配分 
•チャネル最適化 
プ ロ モ ー シ ョ ン 
•広告効果測定 
•商品種類との親和性 
•広告予算編成
ご静聴ありがとうございました。 
31

Mais conteúdo relacionado

Mais procurados

心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズHiroshi Shimizu
 
5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnetNagi Teramo
 
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~nocchi_airport
 
DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)Masaru Tokuoka
 
ベイズモデリングと仲良くするために
ベイズモデリングと仲良くするためにベイズモデリングと仲良くするために
ベイズモデリングと仲良くするためにShushi Namba
 
反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するかSAKAUE, Tatsuya
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編Hiroshi Shimizu
 
100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」Shinohara Masahiro
 
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデルMasashi Komori
 
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門shima o
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定Akira Masuda
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門Kawamoto_Kazuhiko
 
傾向スコアの概念とその実践
傾向スコアの概念とその実践傾向スコアの概念とその実践
傾向スコアの概念とその実践Yasuyuki Okumura
 
ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33horihorio
 
状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38horihorio
 
2 7.一般化線形混合モデル
2 7.一般化線形混合モデル2 7.一般化線形混合モデル
2 7.一般化線形混合モデルlogics-of-blue
 
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知Yuya Takashina
 

Mais procurados (20)

2 3.GLMの基礎
2 3.GLMの基礎2 3.GLMの基礎
2 3.GLMの基礎
 
心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ
 
5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet
 
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
StanとRでベイズ統計モデリング読書会 Chapter 7(7.6-7.9) 回帰分析の悩みどころ ~統計の力で歌うまになりたい~
 
DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)
 
ベイズモデリングと仲良くするために
ベイズモデリングと仲良くするためにベイズモデリングと仲良くするために
ベイズモデリングと仲良くするために
 
反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編
 
Rで学ぶロバスト推定
Rで学ぶロバスト推定Rで学ぶロバスト推定
Rで学ぶロバスト推定
 
100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
 
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
 
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
 
傾向スコアの概念とその実践
傾向スコアの概念とその実践傾向スコアの概念とその実践
傾向スコアの概念とその実践
 
ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33
 
状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38
 
2 7.一般化線形混合モデル
2 7.一般化線形混合モデル2 7.一般化線形混合モデル
2 7.一般化線形混合モデル
 
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知
 

Destaque

Pystan for nlp
Pystan for nlpPystan for nlp
Pystan for nlpXiangze
 
セグメンテーションの考え方・使い方 - TokyoR #44
セグメンテーションの考え方・使い方 - TokyoR #44セグメンテーションの考え方・使い方 - TokyoR #44
セグメンテーションの考え方・使い方 - TokyoR #44horihorio
 
状態空間モデル等による多変量時系列データ解析
状態空間モデル等による多変量時系列データ解析状態空間モデル等による多変量時系列データ解析
状態空間モデル等による多変量時系列データ解析businessanalytics
 
時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17horihorio
 
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47horihorio
 
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた. .
 
カルマンフィルタについて
カルマンフィルタについてカルマンフィルタについて
カルマンフィルタについてtiny_ak
 

Destaque (8)

Pystan for nlp
Pystan for nlpPystan for nlp
Pystan for nlp
 
セグメンテーションの考え方・使い方 - TokyoR #44
セグメンテーションの考え方・使い方 - TokyoR #44セグメンテーションの考え方・使い方 - TokyoR #44
セグメンテーションの考え方・使い方 - TokyoR #44
 
PyMC mcmc
PyMC mcmcPyMC mcmc
PyMC mcmc
 
状態空間モデル等による多変量時系列データ解析
状態空間モデル等による多変量時系列データ解析状態空間モデル等による多変量時系列データ解析
状態空間モデル等による多変量時系列データ解析
 
時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17
 
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
 
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
 
カルマンフィルタについて
カルマンフィルタについてカルマンフィルタについて
カルマンフィルタについて
 

マーケティングサイエンス徹底入門と実践Part2

  • 2. 名前:@sanoche16 職業:コンサルタント 得意:マーケティングサイエンス 好き:R, Python, Linux, PHP, Ruby 大志:世の中にイノベーションを 2
  • 4. 現代のマーケテイング全体像 離散選択モデルの概要 –ロジットモデル –入れ子ロジットモデル –プロビットモデル –混合ロジットモデル 4
  • 5. 5 ソーシャルメ ディアマーケ ティング Web広告 キャンペーン 管理 LPO/動的コン テンツ スマホ 比較サイト ライフ スタイル SNSの利用 スマホ マーケティング 担当者 消費者 エリアマーケ ティング マーケット 新規参入 ニッチ商品 One To One マーケティングの必要性が拡大
  • 6. 6 製品の設計 資材調達 製造 価格設定 販売 プロモーション 流通 サービス 製品の製造 製品の販売 顧客の細分化 市場の選 択/集中 ポジショ ニング 製品開発 サービス 開発 価格設定 資材調達 流通 セールス フォース 販売促進 広告 価値の選択 価値の提供 価値の伝達 従来のマーケティングプロセス1) 新しいマーケティングプロセス 1)マーケティングマネジメント第12版日本語訳版より モノを作って 売る 多くのマス市場が ミクロ市場に分裂 STP分析 「ターゲットとアプローチの明確化」 4P(マーケティング・ミックス) 「マーケティング・ミックスの検討・実行」 STP+4Pによるミクロ市場への適切な対応・適応が求められている
  • 7. 7 Segmentation Targeting Positioning Product Price Place Promotion STP分析 4P(マーケティング・ミックス) 目的 マーケティング戦略の立案 マーケティング戦術の実行 概要 マス市場を適切なミクロ市場に分け (Segmentation)、どの市場に対して (Targeting)、どのようにアプローチする か(Positioning)を検討 STP分析により立案したポジショニング目標≒ブランディング を達成すべく、商品・サービス提供の計画・実行・検証・高 度化(PDCA)を行い、ミクロ市場でのNo.1を目指す 実行期間 (市場によるものの)プロダクト・ライフ サイクルに合わせて、長期スパン(数年~ 5年間)で検討される 実行・検証・高度化を行うための効果的なアプローチを行う ため、短期スパン(数週間~数か月)で検討される マーケティン グサイエンス の活用余地 •市場分析(市場セグメンテーション、 プロデジーモデル、ポジショニング マップ等) •需要予測(普及モデル、時系列解析 等) … •ニーズ分析(知覚マップ、コンジョイント分析、顧客セグ メンテーション等) •プロモーションROI分析(アトリビューション分析等) •消費者行動の理解(離散選択モデル、購買行動モデリング 等) … 前回の発表内容 今回の発表内容
  • 8. マーケティングの領域は大きく、戦略的マーケティング と戦術的マーケティングに分かれる –戦略的マーケティングではターゲットを選定し、アプローチ方 針を立案 –戦術的マーケティングでは定義されたアプローチ方針達成に向 け、極力効率的に施策を実施 分析により明らかにすべきことと分析方法の対応は非常 に重要である –ネクストアクションの決定に役立つ、適切な分析方法を選択 –可能であれば上位概念はフレームワークを利用 8
  • 10. 現代のマーケテイング全体像 離散選択モデルの概要 –ロジットモデル –入れ子ロジットモデル –プロビットモデル –混合ロジットモデル 10
  • 11. 11 離散選択モデルの概要 複数の選択肢の中から選択肢を1つ選択する消費者行動をモデル化したもの (例)次の選挙はどこに投票するか、どの飲料を買おうか、etc… 特に、以下の3点を満たす場面を想定している 1.選択する選択肢は必ず1つである(複数の選択肢も考慮する場合は、複数の選 択肢を選ぶという選択肢を作ればよい) 2.必ずいずれかの選択肢を選択する(選択しない可能性がある場合は選択しな いという選択肢を作ればよい) 3.選択肢の数は有限である(いくつ購入するかをモデル化する場合には離散選 択モデルがそぐわない場合がある⇔回帰分析) どこに行こうかなぁ… いずれかの選択肢を必ず1つ選択 a b c
  • 12. 12 選択肢の吟味 意思決定 ポ イ ン ト •意思決定者はそれぞれの選択肢から魅力 =効用を得られると考える •選択肢がそれぞれ持っている特徴が選択 肢の効用に影響を与え、効用は定量化さ れていると考える •意思決定者は、その意思決定に際して、 効用が最大の選択肢を常に選択すると考 える(効用の最大化) •選択肢は必ず1つだけ選択される 効用:90 夜景:☆☆☆☆★ 食事:☆☆☆★★ 価格:☆☆☆☆★ 効用:80 夜景:☆☆☆☆☆ 食事:☆☆☆☆★ 価格:☆★★★★ 効用:60 夜景:☆★★★★ 食事:☆☆★★★ 価格:☆☆☆★★ 効用:90 夜景:☆☆☆☆★ 食事:☆☆☆★★ 価格:☆☆☆☆★ 選択 どのように効用を定量化するか?
  • 13. 13 (意思決定者・選択肢毎の) 効用 利用データイメージ 概要 モデルへの組 み込み 観測要因 選択行動に影響している、 観測されている情報 例)性別、年齢、商品価格、色… 多くの場合は説明変数に対して 線形モデルを仮定 非観測要因 選択行動に影響しているものの、 観測されていない情報 例)その時の気分、感覚的なイメージ… ランダム項として、確率分布を仮定 確定項 ランダム項 顧客 性別 A価格 B価格 C価格 選択 結果 Aさん 男性 200 180 150 B Bさん 男性 210 170 160 B Cさん 女性 190 180 140 A … … … … … … nさんの選択肢jに 対する効用 パラメータの推定 仮定した確率分布によりモデルが決定
  • 14. 14 顧客属性 データ 選択肢 データ 離散選択モデル •年齢 •性別 •年収 ・・・ •価格 •スペック •保証期間 ・・・ アウトプット インプット Aさん 選択肢1:40% 選択肢2:10% 選択肢3:50% Bさん 選択肢1:70% 選択肢2:20% 選択肢3:10% 実際の選択 モデルのなかで 求まる定数 確率分布 「特定の確率分布に従う確率変数が閾値を下回る確率」が 選択肢の選択確率となる ランダム項について様々な確率分布を考慮し、柔軟にモデル化を行っていく
  • 15. 15 離散選択モデル、ランダム項の分布と特徴 ランダム項 の分布 パラメータ 推定 制約等 ロジットモデル 極値分布 プロビットモデル 多変量正規分布 入れ子ロジット モデル 極値分布 混合ロジット モデル 極値分布 最尤推定 シミュレーション 最尤推定 シミュレーション IIAを仮定 誤差分布が 正規分布を仮定 サブセットのなかでIIA を仮定 誤差分布は1つに限定 (⇔ベイズ推定)
  • 16. 現代のマーケテイング全体像 離散選択モデルの概要 –ロジットモデル –入れ子ロジットモデル –プロビットモデル –混合ロジットモデル 16
  • 17. 17 概要 Luce(1959)によりロ ジットモデルの式が 導出され、翌年に効 用最大化をモデル化 できることがすぐに 証明された モデルが閉じた形で 表現されるため、解 釈しやすく、幅広い 領域で利用されてき た モデル化 ランダム項の確率分布を ガンベル分布と仮定 アウトプット ロジットモデルの P(確率)は必ず0から1 の範囲に入る すべての選択肢の選 択確率の合計は必ず1 になる nさんが選択肢iを選ぶ確率 選択肢iの効用が、その 他のすべての選択肢の 効用より大きい確率
  • 18. 18 車購入での利用例 •T社とH社の車で顧客が迷っている状況をモデル化する それぞれの車の価格(P)、燃費(C)を用いて購買行動をモデリング •効用を以下のように表現 確定項
  • 19. 19 Rでの実行例 > #libraryの読み込み > library(mlogit) > data("Train", package = "mlogit") > #データの作成 > Tr <- mlogit.data(Train, shape = "wide", varying = 4:11, choice = "choice", + sep = "", opposite = c("price", "time", "change", "comfort"), + alt.levels = c("choice1", "choice2"), id = "id") > head(Tr, n=10) id choiceid choice alt price time change comfort chid 1.choice1 1 1 TRUE 1 -2400 -150 0 -1 1 1.choice2 1 1 FALSE 2 -4000 -150 0 -1 1 2.choice1 1 2 TRUE 1 -2400 -150 0 -1 2 2.choice2 1 2 FALSE 2 -3200 -130 0 -1 2 3.choice1 1 3 TRUE 1 -2400 -115 0 -1 3 3.choice2 1 3 FALSE 2 -4000 -115 0 0 3 4.choice1 1 4 FALSE 1 -4000 -130 0 -1 4 4.choice2 1 4 TRUE 2 -3200 -150 0 0 4 5.choice1 1 5 FALSE 1 -2400 -150 0 -1 5 5.choice2 1 5 TRUE 2 -3200 -150 0 0 5 1さんが choice1・ choice2から choice1を選択
  • 20. 20 Rでの実行例 > summary(Train.ml) Call: mlogit(formula = choice ~ price + time + change + comfort, data = Tr, method = "nr", print.level = 0) …略… Coefficients : Estimate Std. Error t-value Pr(>|t|) choice2:(intercept) -0.03249805 0.04108023 -0.7911 0.4289 price 0.00148495 0.00007479 19.8550 < 2.2e-16 *** time 0.02873396 0.00267475 10.7427 < 2.2e-16 *** change 0.32581324 0.05950424 5.4755 4.364e-08 *** comfort 0.94704645 0.06498665 14.5729 < 2.2e-16 *** --- Signif. codes: 0 ・**・0.001 ・*・0.01 ・・0.05 ・・0.1 ・・1 Log-Likelihood: -1723.8 McFadden R^2: 0.15089 Likelihood ratio test : chisq = 612.66 (p.value = < 2.22e-16) 係数の推定値を算出
  • 21. 21 2つの選択肢の選択確率比 離散選択モデル 他の選択肢の影響を受けていない = The independence from irrelevant alternatives(IIA) •IIAが成立している場合は、特定の2つの選択肢 以外の特徴が変化しても、2つの選択肢の選択 確率比は一定であることを意味している •多くの場合で実際にIIAが成り立っている消費者 行動がたくさん観測されている •ほとんどの要因が観測変数としてとらえられている 場合は、IIAは問題にはならない •一方で、次の例のように常にIIAが成り立つとは考 えにくい場合も多く存在する A電鉄の電車とB交通のバスの選択肢があ る通勤に際して、市場に新たにC交通がバ スを運営し新規参入した場合、これまでの A電鉄とB交通の顧客比は一定になりえ か? •モデルがIIAを満たす原因はランダム項が選択肢 毎に独立しているためである。 ⇒より柔軟なモデルが必要
  • 22. 現代のマーケテイング全体像 離散選択モデルの概要 –ロジットモデル –入れ子ロジットモデル –プロビットモデル –混合ロジットモデル 22
  • 23. 23 概要 多くの研究者により、 エネルギー、輸送、 住宅、通信業界など に適用された GEV(一般化極値モ デル)のなかでは比 較的シンプルな形で あり、解釈しやすい 選択肢はいくつかの サブグループに分割 してモデル化を行う モデル化 ランダム項の累積確率分 布を以下とする λを入れ子k内の選択肢間 独立性を表す (すべてのkについて λk=1であれば、ロジッ トモデルと等しくなる) アウトプット 階層構造を持ったロ ジットモデルになっ ており、IIAが成り立 たない事象もモデル 化している 自転 車 自家 用車 バス 電車 交通 機関 保有 車両 入れ子ロジットの2選択確率比率は以下となる
  • 24. 現代のマーケテイング全体像 離散選択モデルの概要 –ロジットモデル –入れ子ロジットモデル –プロビットモデル –混合ロジットモデル 24
  • 25. 25 概要 ロジットモデルでは 制限されていた、以 下の3つを組み込み可 能にする 1.Random taste variationを表現 2.IIAを表現 3.非観測データが 相関を持ってい るパネルデータ にも適用可能 モデル化 ランダム項を多変量正規 分布と仮定 アウトプット シミュレーションに よりパラメータを推 定 個人ごとに確定項の パラメータを推定
  • 26. 現代のマーケテイング全体像 離散選択モデルの概要 –ロジットモデル –入れ子ロジットモデル –プロビットモデル –混合ロジットモデル 26
  • 27. 27 概要 ロジットモデルで推 定していたβを確率分 布として一般化を行 う プロビットモデルと 同様にRandom taste variationを表現 比較的シンプルなシ ミュレーションで推 定可能 モデル化 ランダム項を多変量正規 分布と仮定 アウトプット シミュレーションに よりパラメータを推 定 個人ごとに確定項の パラメータを推定
  • 28. 28 Rでの実行例 > #libraryの読み込み > library(mlogit) > data("Train", package = "mlogit") > #データの作成 > Tr <- mlogit.data(Train, shape = "wide", varying = 4:11, choice = "choice", + sep = "", opposite = c("price", "time", "change", "comfort"), + alt.levels = c("choice1", "choice2"), id = "id") > head(Tr, n=10) id choiceid choice alt price time change comfort chid 1.choice1 1 1 TRUE 1 -2400 -150 0 -1 1 1.choice2 1 1 FALSE 2 -4000 -150 0 -1 1 2.choice1 1 2 TRUE 1 -2400 -150 0 -1 2 2.choice2 1 2 FALSE 2 -3200 -130 0 -1 2 3.choice1 1 3 TRUE 1 -2400 -115 0 -1 3 3.choice2 1 3 FALSE 2 -4000 -115 0 0 3 4.choice1 1 4 FALSE 1 -4000 -130 0 -1 4 4.choice2 1 4 TRUE 2 -3200 -150 0 0 4 5.choice1 1 5 FALSE 1 -2400 -150 0 -1 5 5.choice2 1 5 TRUE 2 -3200 -150 0 0 5 1さんが choice1・ choice2から choice1を選択
  • 29. 29 Rでの実行例 > # mixed logitの実行(共分散あり) > Train.mxlc <- mlogit(choice ~ price + time + change + comfort, + Tr, panel = TRUE, rpar = c(time = "cn", change = "n", + comfort = "ln"), + correlation = TRUE, R = 100, halton = NA) > # mixed logitの実行(共分散なし) > Train.mxlu <- update(Train.mxlc, correlation = FALSE) > summary(Train.mxlc) …略… McFadden R^2: 0.23345 …略… > summary(Train.mxlu) …略… McFadden R^2: 0.21703 …略… ←McFadden決定係数が向上
  • 30. 30 離散選択モデルからのインプリケーション ネクストアクションの例 商 品 •色の嗜好 •サイズの嗜好 •機能の必要性 •商品改革 価 格 •キャンペーンの効果 •値上げ時の需要予測 •価格戦略立案 チ ャ ネ ル •チャネル変更によるリフト効果 •適正商品配分 •チャネル最適化 プ ロ モ ー シ ョ ン •広告効果測定 •商品種類との親和性 •広告予算編成