SlideShare uma empresa Scribd logo
1 de 32
23卒向け秋季オンライン勉強会
2021/11/6(土) オンライン勉強会
MicroAd inc. システム開発本部
福島大祐
自己紹介
福島 大祐
株式会社マイクロアド システム開発本部 機械学習エンジニア
【担当領域】
• CTR/CVR 予測
• ダイナミックレコメンド
• 入札戦略
【略歴】
• 金沢大学
• 名古屋工業大学大学院
▶ 機械学習, 病理画像解析
• マイクロアド 新卒入社 (2 年目)
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 1 / 31
Contents
1 Real Time Bidding (RTB) とは
2 RTB の入札戦略
3 CTR/CVR 予測
4 マイクロアドにおける CTR/CVR 予測システム
5 機械学習エンジニアの業務内容
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 2 / 31
基本用語
広告主 : 広告を出すことで製品の認知度をあげたりブランド形成を行いたい
媒体主 : 運営しているメディア (Web サイトなど) に広告を掲載して利益を得たい
インプレッション : 広告の表示のこと
クリック : 広告クリックのこと
コンバージョン : 広告により成果を達成 (商品の購買, 申し込みなど) すること
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 3 / 31
Contents
1 Real Time Bidding (RTB) とは
2 RTB の入札戦略
3 CTR/CVR 予測
4 マイクロアドにおける CTR/CVR 予測システム
5 機械学習エンジニアの業務内容
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 4 / 31
Real Time Bidding (RTB)
RTB
1 インプレッションに対してリアルタイムで入札を行う仕組み
オークション
SSP DSP
できるだけ収益を多くしたい できるだけ
効率よく配信したい
メディア 広告
• SSP(Supply Side Platform) : メディアの収益を最大化するプラットフォーム
• DSP(Demand Side Platform) : 広告配信を最適化するプラットフォーム
広告主と媒体主の利害を一致するべく開発された取引形態
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 5 / 31
RTB の仕組み
広告枠
サイト訪問
SSP
DSP1
DSP3
DSP2
Step 1
• ユーザーがサイトに訪問し, SSP に広告リクエストを送信
•
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 6 / 31
RTB の仕組み
広告枠
サイト訪問
SSP
DSP1
DSP3
DSP2
Step 1
• ユーザーがサイトに訪問し, SSP に広告リクエストを送信
• SSP は接続している DSP に広告の入札をリクエスト
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 7 / 31
RTB の仕組み
広告枠
サイト訪問
SSP
DSP1
DSP3
DSP2
旅行広告
転職広告
車広告
10円
15円
20円
Step 2
• DSP はそれぞれ入札する広告と入札額を決定
▶ 入札する広告や入札額の決定は DSP ごとの入札ロジックに依存
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 8 / 31
RTB の仕組み
広告枠
サイト訪問
SSP
DSP1
DSP3
DSP2
旅行広告
転職広告
車広告
10円
15円
20円
Step 3
• DSP は SSP にレスポンスを返す
•
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 9 / 31
RTB の仕組み
サイト訪問
SSP
DSP1
DSP3
DSP2
旅行広告
転職広告
車広告
10円
15円
20円
転職広告
Step 3
• DSP は SSP にレスポンスを返す
• SSP はその中から最も高い値段のついた広告を選択し表示
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 10 / 31
Contents
1 Real Time Bidding (RTB) とは
2 RTB の入札戦略
3 CTR/CVR 予測
4 マイクロアドにおける CTR/CVR 予測システム
5 機械学習エンジニアの業務内容
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 11 / 31
入札戦略
■ DSP は入札リクエストに対して, いくらで入札するのが良いのか?
• 直感的には
▶ 広告効果が高い ⇒ 高い入札額
▶ 広告効果が低い ⇒ 低い入札額
入札戦略
入札額決定関数
入札リクエスト
入札額
(ユーザー, 広告, ページ情報, ...)
入札戦略の目的
• 目標値 (広告主の期待する広告効果) の達成
• スムーズな予算消化
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 12 / 31
RTB における CTR/CVR 予測
マイクロアドでは, 入札額は目標 CPC/CPA と予測 CTR/CVR の積に依存 1
入札額 ∝
{
CPC × CTR (CPC 目標の場合)
CPA × CVR (CPA 目標の場合)
(1)
CPC (Cost per Click) : 1 クリックあたりのコスト
CPA (Cost per Action) : 1 コンバージョン (購買, 申込 . . .) あたりのコスト
• 上記で計算したベース入札額を以下を考慮して補正して入札
▶ 目標値との乖離具合
▶ 予算の消化具合
▶ 予測落札額
1
Optimal Real-Time Bidding for Display Advertising [Zhang, 2014]
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 13 / 31
RTB における CTR/CVR 予測
入札額を決定する上で, CTR/CVR 予測は重要な要素の一つ
CTR/CVR予測
...
入札戦略 入札額
リクエスト
より適切な入札額を求めるために, 正確な CTR/CVR 予測が必要
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 14 / 31
Contents
1 Real Time Bidding (RTB) とは
2 RTB の入札戦略
3 CTR/CVR 予測
4 マイクロアドにおける CTR/CVR 予測システム
5 機械学習エンジニアの業務内容
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 15 / 31
問題設定
■ 入札リクエストに対する, クリック (or コンバージョン) するかどうかの二値分類問題
• 学習データセット : {(xi, yi)}N
i=1
▶ x : 特徴ベクトル
▶ y ∈ {0, 1} : 正解ラベル (クリックされた場合 1)
広告ID URL ユーザーID 曜日 クリック
http://aaa.co.jp/hoge
http://bbb.com/fuga
xxxxxxxxxx
yyyyyyyyy
34345
11671
金曜日
木曜日
0
1
• CTR = P(y = 1|x)
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 16 / 31
問題設定
■ データセットの特徴
• ほとんどの特徴量がカテゴリ変数
• 非常に不均衡
▶ インプレッション : 数億 / day  に対し, クリックはせいぜい数%程度
• カーディナリティの高い特徴量が多数
▶ URL, タグ ID ect...
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 17 / 31
予測モデル
■ 以下の制約を満たせる 2 クラス分類モデルであれば利用可能
• RTB のレスポンス時間は 100ms 程度
▶ ネットワークの通信時間も考慮すれば, アプリケーションで使える時間は 50ms 程度
▶ その中で, CTR/CVR 予測に使える時間は数 ms ⇒ 推論速度に制約
■ 以前は扱いやすさや推論が高速なメリットからロジスティック回帰が主流
p(y = 1|x) =
1
1 + e−w⊤x
(2)
• 昨今では, ロジスティック回帰以外にも多数提案・実用されている
▶ factorization machine ベース
▶ Deep learnining ベース
▶ GBDT ベース
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 18 / 31
マイクロアドでの予測モデル
マイクロアドでは, GBDT フレームワークの1つである, LightGBM を利用
• カテゴリ変数の扱いが容易
• 高い識別性能
Table: マイクロアドの RTB ログを用いた比較実験の結果
手法  Normalized Entropy PR-AUC
Entity Embedding2 + logistic redression 0.890435 0.030371
Entity Embedding + XGBoost   0.842168 0.041808
LightGBM   0.832628 0.046433
2
Entity Embeddings of Categorical Variables, [Cheng Guo, 2016]
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 19 / 31
確率補正
■ 以下の理由から, 予測モデルの出力をそのまま CTR として扱うことは不適切
• 学習データから負例のアンダーサンプリングを行っている.
▶ 学習時間の短縮や使用メモリの制限から, 負例をランダムにアンダーサンプリングして使用
=⇒ 学習データの分布が本来の分布とずれ, 予測値が不当に高騰
• 表現力の高いモデルなどは予測が極端になりやすく, 予測値をそのまま確率として解釈
することが不適切
マイクロアドでは, この問題に対し, Isotonic Regression による確率補正 3 で対処
3
Predicting Good Probabilities With Supervised Learning [Alexandru Niculescu-Mizil, 2005]
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 20 / 31
Isotonic Regression による確率補正
2クラス分類器の学習データとは別に, Isotonic Regrssion の学習データを準備
• 学習データセット : {(f(xi), yi)}N
i=1
▶ f(·) : 別データで学習済みの 2 クラス分類器
▶ yi ∈ {0, 1} : クリックラベル
Isotonic Regression では, 次の単調増加な等張関数 m(·) を学習する
yi = m(f(xi)) + ϵ (3)
Isotonic Regression学習
学習データ
補正用データ
分類器学習
学習済みモデルで推論
(under samplingなし, 直近データ)
step 1
step 2
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 21 / 31
Isotonic Regression による確率補正
Isotonic Regresssion の学習には pair-adjacent violators(PAV) algorithm を用いる
1 {(fi, yi)}N
i=1 を fi の順にソート
2 m̂(fi) = yi で初期化
3 正解ラベルの順序に間違いがあれば平均値で
置換
4 推論の際に学習データセット中にない値は, 最
近傍の値を出力
つまり,
• 分類器が事例を正しくランク付けできている部分では少ない事例で平均化
• ランク付けが間違っている部分 (分類器の信頼度が低い部分) では, より多くの事例で平
均化
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 22 / 31
推論時
Isotonic Regression
LightGBM 予測CTR
リクエスト
■ 特徴量
• 特徴量は入札リクエストに乗ってくるものの他に別の予測モデルで予測したものも利用
▶ web ページのカテゴリ推定
▶ ユーザーのデモグラ推定
• ユーザーの行動系特徴量も利用
▶ 24 時間以内のアクセス回数 など
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 23 / 31
Contents
1 Real Time Bidding (RTB) とは
2 RTB の入札戦略
3 CTR/CVR 予測
4 マイクロアドにおける CTR/CVR 予測システム
5 機械学習エンジニアの業務内容
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 24 / 31
実際の運用
■ 機械学習モデルの実装から学習サイクルまでを円滑に管理するための学習基盤が必要
• 学習の自動化・監視
▶ 毎時間対象の RTB ログが蓄積
▶ より新しいデータを予測モデルに反映したい ⇒ 定期的な予測モデルの再学習が必要
• テスト・デプロイの整備
マイクロアドでは, 機械学習基盤を GCP (Google Cloud Platform) で構築
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 25 / 31
学習実行基盤
機械学習のモデルの学習は AI-Platform Training で定期実行
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 26 / 31
Contents
1 Real Time Bidding (RTB) とは
2 RTB の入札戦略
3 CTR/CVR 予測
4 マイクロアドにおける CTR/CVR 予測システム
5 機械学習エンジニアの業務内容
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 27 / 31
機械学習エンジニアの業務内容
主な業務内容
機械学習プロジェクトに関する調査・開発・運用全般
■  既存プロダクトの改善
• 精度改善 (例: CTR 予測の精度改善)
▶ 論文・事例調査, 実験 ⇒ A/B テスト
• 運用改善
■  新規プロダクトの提案・導入
• ビジネス課題を機械学習の問題に落とし込み
• 既存研究など調査・検証 ⇒ 開発
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 28 / 31
プロジェクト紹介
■ CTR/CVR 予測
• 広告の CTR/CVR を予測する
• 特に CVR 予測の精度改善中
▶ 広告主も広告効果に直結する CPA の方
を気にする
■ 入札戦略
• 最中力領域
• 予測した CTR/CVR などから入札額を決定
する
• 効率的なペーシングやナップサック問題によ
る手法を調査中
■ トピック判定
• web ページのカテゴリを推定する
• ターゲティングや CTR/CVR 予測に利用
• 精度改善中
■ 落札額予測
• リクエストがいくらで落札可能か予測する
• 入札額の決定に利用
■ ユーザーデモグラ推定
• ユーザーのデモグラフィックを推定する
• ターゲティングや CTR/CVR 予測に利用
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 29 / 31
技術スタック
業務でよく使うもの
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 30 / 31
以下で情報発信もしています!
Twitter
@microad dev
技術ブログ
developers.microad.co.jp
Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 31 / 31

Mais conteúdo relacionado

Mais procurados

機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計Takahiro Kubo
 
最適輸送の解き方
最適輸送の解き方最適輸送の解き方
最適輸送の解き方joisino
 
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018Takahiro Kubo
 
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII
 
数学で解き明かす深層学習の原理
数学で解き明かす深層学習の原理数学で解き明かす深層学習の原理
数学で解き明かす深層学習の原理Taiji Suzuki
 
RTBにおける機械学習の活用事例
RTBにおける機械学習の活用事例RTBにおける機械学習の活用事例
RTBにおける機械学習の活用事例MicroAd, Inc.(Engineer)
 
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer近年のHierarchical Vision Transformer
近年のHierarchical Vision TransformerYusuke Uchida
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Modelscvpaper. challenge
 
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2Preferred Networks
 
分散学習のあれこれ~データパラレルからモデルパラレルまで~
分散学習のあれこれ~データパラレルからモデルパラレルまで~分散学習のあれこれ~データパラレルからモデルパラレルまで~
分散学習のあれこれ~データパラレルからモデルパラレルまで~Hideki Tsunashima
 
アドテクに機械学習を組み込むための推論の高速化
アドテクに機械学習を組み込むための推論の高速化アドテクに機械学習を組み込むための推論の高速化
アドテクに機械学習を組み込むための推論の高速化MicroAd, Inc.(Engineer)
 
差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)Kentaro Minami
 
マイクロアドにおけるCTR予測への取り組み
マイクロアドにおけるCTR予測への取り組みマイクロアドにおけるCTR予測への取り組み
マイクロアドにおけるCTR予測への取り組みMicroAd, Inc.(Engineer)
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門Kawamoto_Kazuhiko
 
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language ModelsDeep Learning JP
 
Triplet Loss 徹底解説
Triplet Loss 徹底解説Triplet Loss 徹底解説
Triplet Loss 徹底解説tancoro
 
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用Hiroyuki Masuda
 
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会takehikoihayashi
 
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方BrainPad Inc.
 
組合せ最適化入門:線形計画から整数計画まで
組合せ最適化入門:線形計画から整数計画まで組合せ最適化入門:線形計画から整数計画まで
組合せ最適化入門:線形計画から整数計画までShunji Umetani
 

Mais procurados (20)

機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計
 
最適輸送の解き方
最適輸送の解き方最適輸送の解き方
最適輸送の解き方
 
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
 
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
 
数学で解き明かす深層学習の原理
数学で解き明かす深層学習の原理数学で解き明かす深層学習の原理
数学で解き明かす深層学習の原理
 
RTBにおける機械学習の活用事例
RTBにおける機械学習の活用事例RTBにおける機械学習の活用事例
RTBにおける機械学習の活用事例
 
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
 
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
 
分散学習のあれこれ~データパラレルからモデルパラレルまで~
分散学習のあれこれ~データパラレルからモデルパラレルまで~分散学習のあれこれ~データパラレルからモデルパラレルまで~
分散学習のあれこれ~データパラレルからモデルパラレルまで~
 
アドテクに機械学習を組み込むための推論の高速化
アドテクに機械学習を組み込むための推論の高速化アドテクに機械学習を組み込むための推論の高速化
アドテクに機械学習を組み込むための推論の高速化
 
差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)差分プライバシーとは何か? (定義 & 解釈編)
差分プライバシーとは何か? (定義 & 解釈編)
 
マイクロアドにおけるCTR予測への取り組み
マイクロアドにおけるCTR予測への取り組みマイクロアドにおけるCTR予測への取り組み
マイクロアドにおけるCTR予測への取り組み
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
 
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models
 
Triplet Loss 徹底解説
Triplet Loss 徹底解説Triplet Loss 徹底解説
Triplet Loss 徹底解説
 
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
 
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
 
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方
 
組合せ最適化入門:線形計画から整数計画まで
組合せ最適化入門:線形計画から整数計画まで組合せ最適化入門:線形計画から整数計画まで
組合せ最適化入門:線形計画から整数計画まで
 

Semelhante a RTBにおける機械学習の活用事例

確率的深層学習における中間層の改良と高性能学習法の提案
確率的深層学習における中間層の改良と高性能学習法の提案確率的深層学習における中間層の改良と高性能学習法の提案
確率的深層学習における中間層の改良と高性能学習法の提案__106__
 
レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方Shun Nukui
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定Morpho, Inc.
 
Sano tokyowebmining 201625_v04
Sano tokyowebmining 201625_v04Sano tokyowebmining 201625_v04
Sano tokyowebmining 201625_v04Masakazu Sano
 
Decision Transformer: Reinforcement Learning via Sequence Modeling
Decision Transformer: Reinforcement Learning via Sequence ModelingDecision Transformer: Reinforcement Learning via Sequence Modeling
Decision Transformer: Reinforcement Learning via Sequence ModelingTomoya Oda
 
強化学習の実適用に向けた課題と工夫
強化学習の実適用に向けた課題と工夫強化学習の実適用に向けた課題と工夫
強化学習の実適用に向けた課題と工夫Masahiro Yasumoto
 
リクルートにおける画像解析事例紹介と周辺技術紹介
リクルートにおける画像解析事例紹介と周辺技術紹介リクルートにおける画像解析事例紹介と周辺技術紹介
リクルートにおける画像解析事例紹介と周辺技術紹介Recruit Technologies
 
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)Shintaro Yoshida
 
20170806 Discriminative Optimization
20170806 Discriminative Optimization20170806 Discriminative Optimization
20170806 Discriminative OptimizationTakuya Minagawa
 
KDDCUP2020 RL Track : 強化学習部門入賞の手法紹介
KDDCUP2020 RL Track : 強化学習部門入賞の手法紹介KDDCUP2020 RL Track : 強化学習部門入賞の手法紹介
KDDCUP2020 RL Track : 強化学習部門入賞の手法紹介NTTDOCOMO-ServiceInnovation
 
Retty recommendation project
Retty recommendation projectRetty recommendation project
Retty recommendation projectJiro Iwanaga
 
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座Silicon Studio Corporation
 
Active Learning と Bayesian Neural Network
Active Learning と Bayesian Neural NetworkActive Learning と Bayesian Neural Network
Active Learning と Bayesian Neural NetworkNaoki Matsunaga
 
アプリケーションの性能最適化の実例1
アプリケーションの性能最適化の実例1 アプリケーションの性能最適化の実例1
アプリケーションの性能最適化の実例1 RCCSRENKEI
 
30分でわかる広告エンジンの作り方
30分でわかる広告エンジンの作り方30分でわかる広告エンジンの作り方
30分でわかる広告エンジンの作り方Daisuke Yamazaki
 
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTURE Project
 
パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩t_ichioka_sg
 
Towards Performant Video Recognition
Towards Performant Video RecognitionTowards Performant Video Recognition
Towards Performant Video Recognitioncvpaper. challenge
 

Semelhante a RTBにおける機械学習の活用事例 (20)

確率的深層学習における中間層の改良と高性能学習法の提案
確率的深層学習における中間層の改良と高性能学習法の提案確率的深層学習における中間層の改良と高性能学習法の提案
確率的深層学習における中間層の改良と高性能学習法の提案
 
レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
 
Sano tokyowebmining 201625_v04
Sano tokyowebmining 201625_v04Sano tokyowebmining 201625_v04
Sano tokyowebmining 201625_v04
 
Decision Transformer: Reinforcement Learning via Sequence Modeling
Decision Transformer: Reinforcement Learning via Sequence ModelingDecision Transformer: Reinforcement Learning via Sequence Modeling
Decision Transformer: Reinforcement Learning via Sequence Modeling
 
強化学習の実適用に向けた課題と工夫
強化学習の実適用に向けた課題と工夫強化学習の実適用に向けた課題と工夫
強化学習の実適用に向けた課題と工夫
 
リクルートにおける画像解析事例紹介と周辺技術紹介
リクルートにおける画像解析事例紹介と周辺技術紹介リクルートにおける画像解析事例紹介と周辺技術紹介
リクルートにおける画像解析事例紹介と周辺技術紹介
 
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
人が注目する箇所を当てるSaliency Detectionの最新モデル UCNet(CVPR2020)
 
20170806 Discriminative Optimization
20170806 Discriminative Optimization20170806 Discriminative Optimization
20170806 Discriminative Optimization
 
KDDCUP2020 RL Track : 強化学習部門入賞の手法紹介
KDDCUP2020 RL Track : 強化学習部門入賞の手法紹介KDDCUP2020 RL Track : 強化学習部門入賞の手法紹介
KDDCUP2020 RL Track : 強化学習部門入賞の手法紹介
 
Retty recommendation project
Retty recommendation projectRetty recommendation project
Retty recommendation project
 
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
 
Active Learning と Bayesian Neural Network
Active Learning と Bayesian Neural NetworkActive Learning と Bayesian Neural Network
Active Learning と Bayesian Neural Network
 
3DFeat-Net
3DFeat-Net3DFeat-Net
3DFeat-Net
 
アプリケーションの性能最適化の実例1
アプリケーションの性能最適化の実例1 アプリケーションの性能最適化の実例1
アプリケーションの性能最適化の実例1
 
30分でわかる広告エンジンの作り方
30分でわかる広告エンジンの作り方30分でわかる広告エンジンの作り方
30分でわかる広告エンジンの作り方
 
ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介ADVENTUREの他のモジュール・関連プロジェクトの紹介
ADVENTUREの他のモジュール・関連プロジェクトの紹介
 
パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩パターン認識モデル初歩の初歩
パターン認識モデル初歩の初歩
 
Towards Performant Video Recognition
Towards Performant Video RecognitionTowards Performant Video Recognition
Towards Performant Video Recognition
 

Mais de MicroAd, Inc.(Engineer)

20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用
20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用
20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用MicroAd, Inc.(Engineer)
 
Kafka Connect:Iceberg Sink Connectorを使ってみる
Kafka Connect:Iceberg Sink Connectorを使ってみるKafka Connect:Iceberg Sink Connectorを使ってみる
Kafka Connect:Iceberg Sink Connectorを使ってみるMicroAd, Inc.(Engineer)
 
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話MicroAd, Inc.(Engineer)
 
Chromeの3rd Party Cookie廃止とインターネット広告への影響
Chromeの3rd Party Cookie廃止とインターネット広告への影響Chromeの3rd Party Cookie廃止とインターネット広告への影響
Chromeの3rd Party Cookie廃止とインターネット広告への影響MicroAd, Inc.(Engineer)
 
ベアメタルで実現するSpark&Trino on K8sなデータ基盤
ベアメタルで実現するSpark&Trino on K8sなデータ基盤ベアメタルで実現するSpark&Trino on K8sなデータ基盤
ベアメタルで実現するSpark&Trino on K8sなデータ基盤MicroAd, Inc.(Engineer)
 
DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)
DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)
DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)MicroAd, Inc.(Engineer)
 
InternetWeek2022 - インターネット広告の羅針盤
InternetWeek2022 - インターネット広告の羅針盤InternetWeek2022 - インターネット広告の羅針盤
InternetWeek2022 - インターネット広告の羅針盤MicroAd, Inc.(Engineer)
 
マイクロアドにおけるデータストアの使い分け
マイクロアドにおけるデータストアの使い分けマイクロアドにおけるデータストアの使い分け
マイクロアドにおけるデータストアの使い分けMicroAd, Inc.(Engineer)
 
データセンターネットワークの構成について
データセンターネットワークの構成についてデータセンターネットワークの構成について
データセンターネットワークの構成についてMicroAd, Inc.(Engineer)
 
インフラ領域の技術スタックや業務内容について紹介
インフラ領域の技術スタックや業務内容について紹介インフラ領域の技術スタックや業務内容について紹介
インフラ領域の技術スタックや業務内容について紹介MicroAd, Inc.(Engineer)
 
アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜
アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜
アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜MicroAd, Inc.(Engineer)
 
アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜MicroAd, Inc.(Engineer)
 
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜MicroAd, Inc.(Engineer)
 
アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜MicroAd, Inc.(Engineer)
 
社内問い合わせ&申請・承認業務の 管理方法 - Jira Service Management 事例紹介 -
社内問い合わせ&申請・承認業務の 管理方法 - Jira Service Management 事例紹介 -社内問い合わせ&申請・承認業務の 管理方法 - Jira Service Management 事例紹介 -
社内問い合わせ&申請・承認業務の 管理方法 - Jira Service Management 事例紹介 -MicroAd, Inc.(Engineer)
 
Digdagを用いた大規模広告配信ログデータの加工と運用
Digdagを用いた大規模広告配信ログデータの加工と運用Digdagを用いた大規模広告配信ログデータの加工と運用
Digdagを用いた大規模広告配信ログデータの加工と運用MicroAd, Inc.(Engineer)
 
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~MicroAd, Inc.(Engineer)
 
インターネット広告の概要とシステム設計
インターネット広告の概要とシステム設計インターネット広告の概要とシステム設計
インターネット広告の概要とシステム設計MicroAd, Inc.(Engineer)
 
アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング
アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング
アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング MicroAd, Inc.(Engineer)
 

Mais de MicroAd, Inc.(Engineer) (20)

20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用
20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用
20240229 DEIM2024 【技術報告】広告配信における安定して拡張性のある大量データ処理基盤の必要性と活用
 
Kafka Connect:Iceberg Sink Connectorを使ってみる
Kafka Connect:Iceberg Sink Connectorを使ってみるKafka Connect:Iceberg Sink Connectorを使ってみる
Kafka Connect:Iceberg Sink Connectorを使ってみる
 
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
Apache Kafkaでの大量データ処理がKubernetesで簡単にできて嬉しかった話
 
Chromeの3rd Party Cookie廃止とインターネット広告への影響
Chromeの3rd Party Cookie廃止とインターネット広告への影響Chromeの3rd Party Cookie廃止とインターネット広告への影響
Chromeの3rd Party Cookie廃止とインターネット広告への影響
 
ベアメタルで実現するSpark&Trino on K8sなデータ基盤
ベアメタルで実現するSpark&Trino on K8sなデータ基盤ベアメタルで実現するSpark&Trino on K8sなデータ基盤
ベアメタルで実現するSpark&Trino on K8sなデータ基盤
 
DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)
DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)
DDD&Scalaで作られたプロダクトはその後どうなったか?(Current state of products made with DDD & Scala)
 
InternetWeek2022 - インターネット広告の羅針盤
InternetWeek2022 - インターネット広告の羅針盤InternetWeek2022 - インターネット広告の羅針盤
InternetWeek2022 - インターネット広告の羅針盤
 
マイクロアドにおけるデータストアの使い分け
マイクロアドにおけるデータストアの使い分けマイクロアドにおけるデータストアの使い分け
マイクロアドにおけるデータストアの使い分け
 
データセンターネットワークの構成について
データセンターネットワークの構成についてデータセンターネットワークの構成について
データセンターネットワークの構成について
 
インフラ領域の技術スタックや業務内容について紹介
インフラ領域の技術スタックや業務内容について紹介インフラ領域の技術スタックや業務内容について紹介
インフラ領域の技術スタックや業務内容について紹介
 
アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜
アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜
アドテクを支える基盤 〜10Tバイト/日のビッグデータを処理する〜
 
アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜
 
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
マイクロアドのデータ基盤について アドテクを支える基盤〜10Tバイト/日のビッグデータを処理する〜
 
アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜アドテクを支える技術 〜1日40億リクエストを捌くには〜
アドテクを支える技術 〜1日40億リクエストを捌くには〜
 
社内問い合わせ&申請・承認業務の 管理方法 - Jira Service Management 事例紹介 -
社内問い合わせ&申請・承認業務の 管理方法 - Jira Service Management 事例紹介 -社内問い合わせ&申請・承認業務の 管理方法 - Jira Service Management 事例紹介 -
社内問い合わせ&申請・承認業務の 管理方法 - Jira Service Management 事例紹介 -
 
Digdagを用いた大規模広告配信ログデータの加工と運用
Digdagを用いた大規模広告配信ログデータの加工と運用Digdagを用いた大規模広告配信ログデータの加工と運用
Digdagを用いた大規模広告配信ログデータの加工と運用
 
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
これから機械学習エンジニアとして戦っていくみなさんへ ~MLOps というマインドセットについて~
 
インターネット広告の概要とシステム設計
インターネット広告の概要とシステム設計インターネット広告の概要とシステム設計
インターネット広告の概要とシステム設計
 
アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング
アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング
アドテクに携わって培った アプリをハイパフォーマンスに保つ設計とコーディング
 
Cumulus Linuxを導入したワケ
Cumulus Linuxを導入したワケCumulus Linuxを導入したワケ
Cumulus Linuxを導入したワケ
 

RTBにおける機械学習の活用事例

  • 2. 自己紹介 福島 大祐 株式会社マイクロアド システム開発本部 機械学習エンジニア 【担当領域】 • CTR/CVR 予測 • ダイナミックレコメンド • 入札戦略 【略歴】 • 金沢大学 • 名古屋工業大学大学院 ▶ 機械学習, 病理画像解析 • マイクロアド 新卒入社 (2 年目) Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 1 / 31
  • 3. Contents 1 Real Time Bidding (RTB) とは 2 RTB の入札戦略 3 CTR/CVR 予測 4 マイクロアドにおける CTR/CVR 予測システム 5 機械学習エンジニアの業務内容 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 2 / 31
  • 4. 基本用語 広告主 : 広告を出すことで製品の認知度をあげたりブランド形成を行いたい 媒体主 : 運営しているメディア (Web サイトなど) に広告を掲載して利益を得たい インプレッション : 広告の表示のこと クリック : 広告クリックのこと コンバージョン : 広告により成果を達成 (商品の購買, 申し込みなど) すること Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 3 / 31
  • 5. Contents 1 Real Time Bidding (RTB) とは 2 RTB の入札戦略 3 CTR/CVR 予測 4 マイクロアドにおける CTR/CVR 予測システム 5 機械学習エンジニアの業務内容 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 4 / 31
  • 6. Real Time Bidding (RTB) RTB 1 インプレッションに対してリアルタイムで入札を行う仕組み オークション SSP DSP できるだけ収益を多くしたい できるだけ 効率よく配信したい メディア 広告 • SSP(Supply Side Platform) : メディアの収益を最大化するプラットフォーム • DSP(Demand Side Platform) : 広告配信を最適化するプラットフォーム 広告主と媒体主の利害を一致するべく開発された取引形態 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 5 / 31
  • 7. RTB の仕組み 広告枠 サイト訪問 SSP DSP1 DSP3 DSP2 Step 1 • ユーザーがサイトに訪問し, SSP に広告リクエストを送信 • Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 6 / 31
  • 8. RTB の仕組み 広告枠 サイト訪問 SSP DSP1 DSP3 DSP2 Step 1 • ユーザーがサイトに訪問し, SSP に広告リクエストを送信 • SSP は接続している DSP に広告の入札をリクエスト Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 7 / 31
  • 9. RTB の仕組み 広告枠 サイト訪問 SSP DSP1 DSP3 DSP2 旅行広告 転職広告 車広告 10円 15円 20円 Step 2 • DSP はそれぞれ入札する広告と入札額を決定 ▶ 入札する広告や入札額の決定は DSP ごとの入札ロジックに依存 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 8 / 31
  • 10. RTB の仕組み 広告枠 サイト訪問 SSP DSP1 DSP3 DSP2 旅行広告 転職広告 車広告 10円 15円 20円 Step 3 • DSP は SSP にレスポンスを返す • Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 9 / 31
  • 11. RTB の仕組み サイト訪問 SSP DSP1 DSP3 DSP2 旅行広告 転職広告 車広告 10円 15円 20円 転職広告 Step 3 • DSP は SSP にレスポンスを返す • SSP はその中から最も高い値段のついた広告を選択し表示 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 10 / 31
  • 12. Contents 1 Real Time Bidding (RTB) とは 2 RTB の入札戦略 3 CTR/CVR 予測 4 マイクロアドにおける CTR/CVR 予測システム 5 機械学習エンジニアの業務内容 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 11 / 31
  • 13. 入札戦略 ■ DSP は入札リクエストに対して, いくらで入札するのが良いのか? • 直感的には ▶ 広告効果が高い ⇒ 高い入札額 ▶ 広告効果が低い ⇒ 低い入札額 入札戦略 入札額決定関数 入札リクエスト 入札額 (ユーザー, 広告, ページ情報, ...) 入札戦略の目的 • 目標値 (広告主の期待する広告効果) の達成 • スムーズな予算消化 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 12 / 31
  • 14. RTB における CTR/CVR 予測 マイクロアドでは, 入札額は目標 CPC/CPA と予測 CTR/CVR の積に依存 1 入札額 ∝ { CPC × CTR (CPC 目標の場合) CPA × CVR (CPA 目標の場合) (1) CPC (Cost per Click) : 1 クリックあたりのコスト CPA (Cost per Action) : 1 コンバージョン (購買, 申込 . . .) あたりのコスト • 上記で計算したベース入札額を以下を考慮して補正して入札 ▶ 目標値との乖離具合 ▶ 予算の消化具合 ▶ 予測落札額 1 Optimal Real-Time Bidding for Display Advertising [Zhang, 2014] Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 13 / 31
  • 15. RTB における CTR/CVR 予測 入札額を決定する上で, CTR/CVR 予測は重要な要素の一つ CTR/CVR予測 ... 入札戦略 入札額 リクエスト より適切な入札額を求めるために, 正確な CTR/CVR 予測が必要 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 14 / 31
  • 16. Contents 1 Real Time Bidding (RTB) とは 2 RTB の入札戦略 3 CTR/CVR 予測 4 マイクロアドにおける CTR/CVR 予測システム 5 機械学習エンジニアの業務内容 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 15 / 31
  • 17. 問題設定 ■ 入札リクエストに対する, クリック (or コンバージョン) するかどうかの二値分類問題 • 学習データセット : {(xi, yi)}N i=1 ▶ x : 特徴ベクトル ▶ y ∈ {0, 1} : 正解ラベル (クリックされた場合 1) 広告ID URL ユーザーID 曜日 クリック http://aaa.co.jp/hoge http://bbb.com/fuga xxxxxxxxxx yyyyyyyyy 34345 11671 金曜日 木曜日 0 1 • CTR = P(y = 1|x) Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 16 / 31
  • 18. 問題設定 ■ データセットの特徴 • ほとんどの特徴量がカテゴリ変数 • 非常に不均衡 ▶ インプレッション : 数億 / day  に対し, クリックはせいぜい数%程度 • カーディナリティの高い特徴量が多数 ▶ URL, タグ ID ect... Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 17 / 31
  • 19. 予測モデル ■ 以下の制約を満たせる 2 クラス分類モデルであれば利用可能 • RTB のレスポンス時間は 100ms 程度 ▶ ネットワークの通信時間も考慮すれば, アプリケーションで使える時間は 50ms 程度 ▶ その中で, CTR/CVR 予測に使える時間は数 ms ⇒ 推論速度に制約 ■ 以前は扱いやすさや推論が高速なメリットからロジスティック回帰が主流 p(y = 1|x) = 1 1 + e−w⊤x (2) • 昨今では, ロジスティック回帰以外にも多数提案・実用されている ▶ factorization machine ベース ▶ Deep learnining ベース ▶ GBDT ベース Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 18 / 31
  • 20. マイクロアドでの予測モデル マイクロアドでは, GBDT フレームワークの1つである, LightGBM を利用 • カテゴリ変数の扱いが容易 • 高い識別性能 Table: マイクロアドの RTB ログを用いた比較実験の結果 手法  Normalized Entropy PR-AUC Entity Embedding2 + logistic redression 0.890435 0.030371 Entity Embedding + XGBoost   0.842168 0.041808 LightGBM   0.832628 0.046433 2 Entity Embeddings of Categorical Variables, [Cheng Guo, 2016] Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 19 / 31
  • 21. 確率補正 ■ 以下の理由から, 予測モデルの出力をそのまま CTR として扱うことは不適切 • 学習データから負例のアンダーサンプリングを行っている. ▶ 学習時間の短縮や使用メモリの制限から, 負例をランダムにアンダーサンプリングして使用 =⇒ 学習データの分布が本来の分布とずれ, 予測値が不当に高騰 • 表現力の高いモデルなどは予測が極端になりやすく, 予測値をそのまま確率として解釈 することが不適切 マイクロアドでは, この問題に対し, Isotonic Regression による確率補正 3 で対処 3 Predicting Good Probabilities With Supervised Learning [Alexandru Niculescu-Mizil, 2005] Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 20 / 31
  • 22. Isotonic Regression による確率補正 2クラス分類器の学習データとは別に, Isotonic Regrssion の学習データを準備 • 学習データセット : {(f(xi), yi)}N i=1 ▶ f(·) : 別データで学習済みの 2 クラス分類器 ▶ yi ∈ {0, 1} : クリックラベル Isotonic Regression では, 次の単調増加な等張関数 m(·) を学習する yi = m(f(xi)) + ϵ (3) Isotonic Regression学習 学習データ 補正用データ 分類器学習 学習済みモデルで推論 (under samplingなし, 直近データ) step 1 step 2 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 21 / 31
  • 23. Isotonic Regression による確率補正 Isotonic Regresssion の学習には pair-adjacent violators(PAV) algorithm を用いる 1 {(fi, yi)}N i=1 を fi の順にソート 2 m̂(fi) = yi で初期化 3 正解ラベルの順序に間違いがあれば平均値で 置換 4 推論の際に学習データセット中にない値は, 最 近傍の値を出力 つまり, • 分類器が事例を正しくランク付けできている部分では少ない事例で平均化 • ランク付けが間違っている部分 (分類器の信頼度が低い部分) では, より多くの事例で平 均化 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 22 / 31
  • 24. 推論時 Isotonic Regression LightGBM 予測CTR リクエスト ■ 特徴量 • 特徴量は入札リクエストに乗ってくるものの他に別の予測モデルで予測したものも利用 ▶ web ページのカテゴリ推定 ▶ ユーザーのデモグラ推定 • ユーザーの行動系特徴量も利用 ▶ 24 時間以内のアクセス回数 など Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 23 / 31
  • 25. Contents 1 Real Time Bidding (RTB) とは 2 RTB の入札戦略 3 CTR/CVR 予測 4 マイクロアドにおける CTR/CVR 予測システム 5 機械学習エンジニアの業務内容 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 24 / 31
  • 26. 実際の運用 ■ 機械学習モデルの実装から学習サイクルまでを円滑に管理するための学習基盤が必要 • 学習の自動化・監視 ▶ 毎時間対象の RTB ログが蓄積 ▶ より新しいデータを予測モデルに反映したい ⇒ 定期的な予測モデルの再学習が必要 • テスト・デプロイの整備 マイクロアドでは, 機械学習基盤を GCP (Google Cloud Platform) で構築 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 25 / 31
  • 27. 学習実行基盤 機械学習のモデルの学習は AI-Platform Training で定期実行 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 26 / 31
  • 28. Contents 1 Real Time Bidding (RTB) とは 2 RTB の入札戦略 3 CTR/CVR 予測 4 マイクロアドにおける CTR/CVR 予測システム 5 機械学習エンジニアの業務内容 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 27 / 31
  • 29. 機械学習エンジニアの業務内容 主な業務内容 機械学習プロジェクトに関する調査・開発・運用全般 ■  既存プロダクトの改善 • 精度改善 (例: CTR 予測の精度改善) ▶ 論文・事例調査, 実験 ⇒ A/B テスト • 運用改善 ■  新規プロダクトの提案・導入 • ビジネス課題を機械学習の問題に落とし込み • 既存研究など調査・検証 ⇒ 開発 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 28 / 31
  • 30. プロジェクト紹介 ■ CTR/CVR 予測 • 広告の CTR/CVR を予測する • 特に CVR 予測の精度改善中 ▶ 広告主も広告効果に直結する CPA の方 を気にする ■ 入札戦略 • 最中力領域 • 予測した CTR/CVR などから入札額を決定 する • 効率的なペーシングやナップサック問題によ る手法を調査中 ■ トピック判定 • web ページのカテゴリを推定する • ターゲティングや CTR/CVR 予測に利用 • 精度改善中 ■ 落札額予測 • リクエストがいくらで落札可能か予測する • 入札額の決定に利用 ■ ユーザーデモグラ推定 • ユーザーのデモグラフィックを推定する • ターゲティングや CTR/CVR 予測に利用 Fukushima Daisuke (MicroAd inc.) 2021/11/6(土) 29 / 31