11. P11user response model
• 2つのモデルを使用
• Quadratic Feature model
• 素性ベクトル: コンテンツ x、プレゼンテーション p (ポジション)、
コンテンツとプレゼンテーションの組み合わせ素性
• Gradient Boosted Decision Tree Model
• Gradient boosted decision tree [18]を使ったモデル
y = aTx + bTp + x T W p + c
p* = argmax Q(x, p)
p p
= argmax θTp
y = hGBDT (x, p)
p* = argmax Q (x, p)
p
(subject to constraints on p)
(subject to constraints on p)
コンテンツ プレゼンテーション 組み合わせ
Q(x, p) = g(y)
(user response y を予測)
(gは満足度指標 )
(user response y を予測)
Q(x, p) = g(y)
12. P12素性
• Content features
• クエリとその検索結果に関する情報を含む
learning to rankでよく使われる素性
• 比較のため [23] の素性と同じものを使用
• Presentation features
• 本研究で新規に導入した、表示方法についての素性
13. P13Content features
• Global result set features
• 返ってきたすべての結果からの素性
• 各バーティカルのコンテンツの有用性を示す
• Query features
• クエリのunigram, bigram, 共起統計量などの語彙素性
• クエリクラシファイアの出力や、実績ベースのクエリ素性など
• Corpus level features
• 各バーティカルやWeb検索のドキュメントに関する、クエリとは独立な素性
• 実績CTRやユーザの嗜好など
• Search result features
• 各検索結果からの素性
• 個々の結果のレレバンシスコアやランキング素性
• いくつかのバーティカル固有のメタ素性も抽出
• 映画バーティカル: 映画のポスターが使えるか、映画が公開中か、など
ニュースバーティカル: 過去数時間でヒットした記事数
14. P14Presentation features
• Binary indicators
• ポジション素性
• Categorical features
• マルチメディアタイプ (テキスト or 画像) や、テキストの書体
• Numerical features
• グラフィカルなアイテムの明るさやコントラストなど
• Other features
• User responseに影響を与えるような要素についての素性
例:"グラフィカルアイテムのすぐ上にあるテキストアイテム"