アドテクと機械学習システムの開発@SMN・サンカク・CodeIQワークショップ

Copyright 2015 So-net Media Networks Corp. All rights reserved
アドテクと機械学習システムの開発
2017.9.10
ソネット・メディア・ネットワークス(株)
a.i lab.
舘野啓

•DSP “Logicad” における機械学習技術
•機械学習 (a little) deep dive
•実ビジネスにおける機械学習
•機械学習システムの開発
agenda
2

• DSP "Logicad" を主力事業とする
ソニーグループのアドテク企業
• 2015年12月東証マザーズ上場
ソネット・メディア・ネットワークスについて
4

• ミッション
• 機械学習によるLogicadの高機能・高精度化のための研究開発とシステム
開発
• デジタルマーケティング領域での新規事業のための研究開発
• 成り立ち
• ソニー(株)の研究所メンバーを中心に2014年発足
• 特徴
• 機械学習アルゴリズムのゼロベースでの研究開発からプロダクトの開発ま
で一気通貫で行うチーム力
• 生データと顧客の両方に直結した理想的な環境
a.i lab.について
"a.i" = ambitious innovation
5

DSP "Logicad"における機械学習技術

Real Time Bidding(RTB)とは
DSP
demand
side
platform
DSP
demand
side
platform
SSP
supply
side
platform
DSP
demand
side
platform
広告主
A
広告主
B
───
───
───
───
───
───
枠
ad a1
ad a2
ad b1
ad b2
auction
ad a
───
───
───
───
───
───
ad
a
¥a
¥ｂ
広告を表示する
サイト
¥a>¥b
最大 10万req./sec
2000億req./month
レスポンス時間
SMN：3-5ms 他社：～50ms 7

Real Time Bidding(RTB)とは
DSP
demand
side
platform
DSP
demand
side
platform
SSP
supply
side
platform
DSP
demand
side
platform
広告主
A
広告主
B
───
───
───
───
───
───
枠
ad a1
ad a2
ad b1
ad b2
───
───
───
───
───
───
¥a
¥ｂ
広告を表示する
サイト
どんな広告を
(what)
誰に (who)
いつ (when)
幾らで
(how much)
どこ{で,に} (where)
なぜ (why)メディア・ユーザ・広告主がハッピーになる
ためには決めなきゃいけないことたくさん
ad a
ad
a
¥a>¥b
auction
8

SMNの人工知能エンジン：VALIS-Engine
9
• web上の
行動履歴
• 広告主
データ
etc.

• ユーザの性別、年代を推定
機械学習の適用例：デモグラ推定誰に (who)
10

• ダイナミッククリエイティブ
• 複数商品の写真などを組み合わせて一つのバ
ナーを動的に生成
• どう組み合わせるか？
e.g. 閲覧した商品＋ユーザにおすすめの商品
• “ユーザにおすすめの商品”？
• そのユーザが買いそう・気に入りそうな商品を
予測
• “この商品を買った人はこんな商品も買っています”
• Jaccard係数などによる商品相関
• 行列の穴埋め問題として行列分解(Matrix
factorization) (後述)
機械学習の適用例：リコメンデーション何を (what)
11
閲覧
提示

機械学習 (a little) deep dive

機械学習とは
CV
機械学習アルゴリズム
＝データからの学び方
予測モデル
(確率の計算式)
新たな
リクエスト
0.152%
0.245%
0.084%
───
───
───
───
───
───
枠
───
───
───
───
───
───
枠
ad a2
ad b1
ad c3
───
───
───
───
───
───
枠
───
───
───
───
───
───
枠
教師データ＝お手本
配信設定
ad a1
ad b1
ad c1
予測結果(CV確率)
ad a1
ad b1
ad c1
学習
予測
予測したいもの特徴量＝予測の手がかり
imp
予測モデル =
モデル＋
学習されたパラメータ
予測のための特徴量
13

アドテク系でよく見る機械学習手法
線形回帰・ロジスティック回帰 Matrix Factorization
Factorization Machines
Deep Learningはいずこ・行動ログ＝大量・高次元データにはまだコストがかかりすぎる
・クリエイティブ画像の解析などへの適用@R&D
シンプルな回帰/分類手法マッチング手法 (リコメンデーション)
汎用的な回帰/分類/マッチング手法
14

• 解きたい課題
• 特徴量で表現されたサンプルの、連続量やカテゴリを予測したい
• e.g. 年収予測(回帰)、男女予測(分類)
• モデル
• 特徴
• シンプル：どの特徴量がどの程度重要か？がパラメータwを見ればわかる
• 高速：学習・予測ともデータ量・特徴量次元数に対して線形で実行可能
線形回帰・ロジスティック回帰
線形回帰
ロジスティック回帰
アドテク系ではベーシックな手法 [Chapelle15]
各特徴量に
対応する重み
特徴量パラメータ
15

• 欠点
• 複雑な特徴量を扱おうとすると大変
e.g. 組み合わせ特徴量
線形回帰・ロジスティック回帰
各特徴量の組み合わせ
に対応する重み
e.g. ドメインと広告商材の組み合わせ： 10^6 × 10^3 ～ 10^9
⇒適切なパラメータを求めるのに十分なサンプル数と計算資源が必要
16

• 2種類のサンプル同士のマッチングの良さを予測＝リコメンデーション
Matrix Factorization
4 5
3 4
5 4
1 3 1
ユーザ
アイテム
4 5
3 4
5 4
1 3 1
未知の評価値を
予測
評価行列
高い予測評価値の
アイテムを推薦
17

• モデル
4 5
3 4
5 4
1 3 1
アイテム
潜在ベクトル
ユーザ潜在
ベクトル
V
UR
ユーザの
潜在ベクトル
アイテムの
潜在ベクトル
パラメータ
[Koren09][神嶌]
18

• 特徴
• サンプルの特徴量が不要(ログのみで予測可能; 協調フィルタリング)
• 欠点
• ログがないサンプルに対しては予測できない(cold start problem)
• サンプルの特徴量を取り込めない
19

• サンプル同士の組み合わせや特徴量を考慮して、連続量やカテゴリを予測
したい
• e.g. ユーザとコンテンツの組み合わせ・ユーザ特徴量・コンテンツ特徴
量・評価時の特徴量から、評価値を予測
Factorization Machines [Rendle10]
予測
サンプル自体を
表現するベクトル
特徴量ベクトル
20

• モデル
• 線形回帰モデルに加え、各特徴量に対応する潜在ベクトルの内積で重みづけた組
み合わせ特徴量で予測
• 特徴
• 特徴量とサンプル同士の相性の両方を考慮した予測が可能
• 特徴量の組み合わせ爆発を起こすことなく組み合わせ特徴量を利用可能
Factorization Machines
線形モデル
組み合わせ
特徴量
内積
各特徴量に対応する
重み
𝒘
𝑽
𝑘
(潜在ベクトル
の次元数)
𝑛
各特徴量に対応する
潜在ベクトル
パラメータ
USのDSP事業者AdRollがクリック予測に利用 [AdRoll15]
21

ノードの出力を確率分布でモデル化して、ベイズ推定で統一的に扱う決定木
決定木経験ベイズ木
• 二値／カテゴリカル
（二値／多クラス分類木）
• 連続値
（二乗誤差に基づく回帰木）
タスクに応じた確率分布
ベルヌーイ分布、正規分布、
ポアソン分布、指数分布・・
• 交差エントロピー
• Ｇｉｎｉ指数（分散）
周辺尤度
ルール
なし事前分布
ノードの出力
（扱う課題）
分割の規準
分割の停止
ノードをまたいで
汎化性能を向
上させる仕組み
ベイズ推定
経験ベイズ木 [関野16]
決定木の良さ
を活かしつつ
高精度化！
パラメータフリー化！
任意の分布に
一般化！
22

実ビジネスにおける機械学習

機械学習の未来はバラ色……のはず？
24

vs. “それっぽさ”
仕事やってる感
ＡＩ一丁
つらみしかないPj.
なるほど
chat
chat
chat
まだ“それっぽい”アウトプットで消耗してるの？
• “価値”を生み出しているか？
• データを中心とするサイクルがまわるか？
25
以上。

• そもそも価値あるプロダクトなのか？
• (´Д`;) 貧弱なラインナップのコンテンツ配信サービスにおけるリコメンデーション
• 機械学習はベースの価値をブーストする役割の場合が多い
• なんらかの”課題”を解決しているか？
• (´Д`;) フォームなら10秒で終わるのになぜか対話しなきゃいけないチャットボット
• faster, easier, cheaper / 不可能を可能に
• 精度向上＝正義か？
• (´Д`;) 精度が求められない＝計測されない＝”それっぽさ”……
• 精度向上の探求こそ機械学習エンジニアとしての成長機会
”価値”を生み出しているか？
26
価値あるプロダクト、価値ある機能を作ろう

• データが集まる仕組みが無い機械学習プロダクトでは……
• 機械学習部分は作りっぱなし
• 改善できない
• あれ、精度≠正義……？
• 最初のデータ集めに苦労
• e.g. 単体機能としての顔認識 ⇔ Facebookにおける顔認識
• 頑張るしかない＝つらい、コストがかかる＝回収が求められる……
• 既存のサイクルへの機械学習導入
• 機械学習が無くても死なない＝ある意味(後述)気楽
データを中心とするサイクルがまわるか？
27
データが集まる仕組みは死守せよ
集まらな(くてよ)いなら逃げよ

デジタルマーケティング領域での機械学習
28
自動化最適化
高次の意思決定
• データに取り込めていない情報の考慮
• 戦略に基づく“質的な”選択
データに基づく意思決定
ルーチンワーク
時間との勝負の処理

機械学習システムの開発

• 効果の予測が難しい
• プロジェクトのコスパがわからん、検証スケジュールが引きづらい
• 期待値コントロールが難しい
• 「KPI倍増いくでしょ！(ﾆｯｺﾘ)」「KPI倍増しないと意味ないよね(ﾑｯｽﾘ)」
• スタンスは真逆なのにハードルはただ高まる
機械学習は苦しい [比戸14]
30
プロジェクトとして
不確実性の高い投資(R&D)としてトップに理解してもらう

31
• システムとしてのテストに難儀
• 学習結果はデータに依存＝”正解”が判りづらい
• 「それっぽい精度が出た！」＞システムに関しては無情報
• 予測結果の分布が実際の分布と合わない……実装がまずいのかモデルが悪いのか？
• 精度検証(≠システムテスト)にもっと難儀
• テストを丁寧にやって正しく実装できた！精度が出ない！ orz
• 「すごい精度が出た！」＞多分そもそも何かがおかしい
• パラメータチューニング：学習に時間がかかる場合、とにかく時間を食う
• っていうか完成の定義は？＞時間を切るか、bizインパクトと見合えばずっと続ける
機械学習は苦しい
システムとして
地道に、丁寧に、システマティックにやる [久保17][Komiya14]

コンバージョン予測システム
32
KVS
(ユーザ
データ)
ログ
imp, CV
ユーザ特徴量学習用データ
集約
バッチ
学習済み
パラメータ
学習用サーバ入札用サーバ
学習依頼
API
学習設定
学習予測 req.
入札
superset
監視・分析
配信結果
学習結果

コンバージョン予測システム
検証用システム監視＆分析
33
α β Λ … AR値
0.1 0.1 1 0.813
0.1 0.1 10 0.824
0.1 1 1 0.806
学習設定etc. 管理用
レポジトリ
学習用データ
起動・deploy
テスト結果
(精度)
Superset
学習・テスト用
検証の実行、結果の管理を楽に日々の配信テスト結果、学習結果など
Google
spreadsheet
データサイエンティスト

35
• 今まで世の中でできなかったことができると楽しい
• 「へー、これぐらい予測できるんだ！」は楽しい
• 頭を使うのは楽しい
• e.g. 富豪的プログラミングや雑なシステム設計ではダメ、
どうすれば効率的にデータを扱えるか？
• 世の中に介入できると楽しい
• “社会にダイナミズムをもたらす”！
機械学習は楽しい
適切な条件化で

• [AdRoll15] Factorization Machines
http://tech.adroll.com/blog/data-science/2015/08/25/factorization-machines.html
• [Chapelle15] Chapelle, O., et al., Simple and scalable response prediction for display advertising, ACM TIST, 2015.
• [比戸14] 比戸, あなたの業務に機械学習を活用する5つのポイント https://www.slideshare.net/shoheihido/5-
38372284
• [神嶌] 神嶌, 推薦システムのアルゴリズム http://www.kamishima.net/archive/recsysdoc.pdf
• [Komiya14] 機械学習分野におけるテストの自動化 https://goo.gl/EHEV9M
• [Koren09] Koren, Y., et al., Matrix factorization techniques for recommender systems, Computer, 2009.
• [久保17] 機械学習モデルの実装における、テストについて
http://qiita.com/icoxfog417/items/67764a6756c4548b5fb8
• [Netflix12] Netflix Recommendations: Beyond the 5 stars (Part 1) https://medium.com/netflix-techblog/netflix-
recommendations-beyond-the-5-stars-part-1-55838468f429
• [Rendle10] Rendle, S., Factorization Machines, ICDM, 2010.
• [関野16] 関野, 経験ベイズ木, IBIS2016 D2-18, 2016.
参考資料
37

• アドテクにおける機械学習技術
• https://www.slideshare.net/ttpooh/tokyo-data-night-tokyodn
• セレンディピティと機械学習
• https://www.slideshare.net/ttpooh/ss-64890255
• Java でつくる低レイテンシ実装の技巧
• http://www.slideshare.net/nappa_zzz/java-70326737
• 秒間5万リクエストを処理するリアルタイム広告システム
• http://www.slideshare.net/yasuda/20140430-q-
contokyo2014bs33yasuda
SMN公開資料
38

アドテクと機械学習システムの開発@SMN・サンカク・CodeIQワークショップ

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a アドテクと機械学習システムの開発@SMN・サンカク・CodeIQワークショップ

Semelhante a アドテクと機械学習システムの開発@SMN・サンカク・CodeIQワークショップ (20)

アドテクと機械学習システムの開発@SMN・サンカク・CodeIQワークショップ