SlideShare uma empresa Scribd logo
1 de 21
Baixar para ler offline
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
01
分散表現を用いたリアルタイム学習型


セッションベース推薦システム
梛木 佑真1  岡本 一志1


1電気通信大学 大学院情報理工学研究科 情報学専攻
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
02
はじめに
• 情報推薦におけるセッションとは [S.Wang+, 2019]


• 1つのイベントまたは一定期間内に


収集または消費されたアイテムのセット


→ バスケットデータ


• 一定期間に起こった行動や


イベントのコレクション


→ セッションデータ


• セッションデータの例


• サブスクリプション方式の


音楽配信サービスにおける再生履歴


• ECサイトにおける商品閲覧履歴
S. Wang, C. Longbing, W. Yan: A Survey on Session-based Recommender Systems,


arXiv, arXiv:1902.04864, 2019.
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
Session-Based Recommender Systems (SBRS)


セッションベース推薦システム
• 定義: 既知のセッション情報(ex. 直近の過去セッション)が部分的に


与えられた場合に,セッション内/セッション間に埋め込まれた複雑な関係を


モデル化し,未知のセッション情報を予測する推薦システム [S. Wang+, 2019]


• 性質


• セッション構造を維持して情報の損失を最小限に抑える


• ユーザ情報を必ずしも必要としない
03
S. Wang, C. Longbing, W. Yan: A Survey on
Session-based Recommender Systems,


arXiv, arXiv:1902.04864, 2019.
B C A B ?
A
セッション
アイテム
ユーザ
t
時刻
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
分散表現を活用する推薦システム
• 加法構成性をもつ分散表現


• 分散表現: オブジェクト(単語,アイテム etc.)を高次元ベクトルで表現する手法


• 加法構成性をもつ分散表現: 加法構成性(ベクトル演算による意味計算が可能)を


もつことが実験で明らかにされている分散表現 (ex. Word2Vec [T. Mikolov+, 2013] )


• 加法構成性をもつ分散表現を活用する推薦システムの例


• Item2Vec [O. Barkan+, 2016]:


Word2Vecを商品購買履歴に応用して商品の分散表現を構築


• user2vec [M. Grbovic+, 2015]: 文書をユーザに置き換えてユーザの分散表現を学習
文
04
T. Mikolov, et al.: Distributed Representations of Words and Phrases and their Compositonality, Proc. of Advances in Neural Information Processing Systems 26, pp.3111–3119, 2013.


O. Barkan, N. Koenigstein: Item2Vec: Neural Item Embedding for Collaborative Filtering, In 2016 IEEE 26th Int. Workshop on Machine Learning for Signal Processing (MLSP), pp.1–6, 2016.


M. Grbovic et al.: E-commerce in your inbox: Product Recommendations at Scale, Proc. of the 21st ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining, pp.1809–1818, 2015.
単語
文章
バスケット

セッション
アイテム
ユーザ
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
ユーザの分散表現の導入に伴う課題
05
M. Grbovic et al.: E-commerce in your inbox: Product Recommendations at Scale,


Proc. of the 21st ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining, pp.1809–1818, 2015.


Q. Le, T. Mikolov: Distributed Representations of Sentences and Documents, Proc. of the 31st Int. Conf. on Machine Learning, pp.1188–1196,2014.
異なるアルゴリズムの予測精度([Q. Le+, 2014] Figure.10より引用)
• user2vec: GrbovicらによるProd2Vecに含まれるシステムの1つ [M. Grbovic+, 2015]
• ユーザとアイテムの分散表現(ユーザ・アイテム分散表現)を同時に学習


• ユーザとアイテムで共通するベクトル空間内で最近傍k個の商品を見つけて推薦


• ユーザ表現の構築にはParagraph2Vec(テキストをユーザに見立てる)を適用


• Paragraph2Vec: テキストの分散表現を構築するモデル [Q. Le+, 2014]


• ユーザ表現の導入の利点・欠点


• 利点: パーソナライズな推薦生成が可能になり,


推薦精度の向上に貢献


• 欠点: ユーザの嗜好は短期的に変化


→ 構築からの時間経過により精度が急低下

→ 精度維持には頻繁なユーザ表現の再構築が必要


• ユーザの急な嗜好変化にすぐに対応できない


• 新規ユーザにすぐに対応できない
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
研究課題
• 加法構成性をもつ分散表現を活用するSBRSの研究は限られており,


システム評価のために推薦精度(ex. Recall@k)しか


確認していないことが多い


→ 既存システムとItem2Vecベースシステムの推薦の

  精度・多様性・新規性の評価・比較による,

  アイテム分散表現のセッションデータへの有効性の確認
• ユーザ表現の導入は推薦精度向上に貢献することが期待されるが,


ユーザの嗜好は短期的に変化するため,頻繁な分散表現の再構築が必要


→ アイテム分散表現の階層化・集約演算によるユーザ表現の

  リアルタイムな構築法の提案
06
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
• Wangらの主張 [Wang+, 2015]: 次バスケット推薦をタスクとする推薦システムは推薦生成に
向け,ユーザの一般的な嗜好を考慮するだけでなく,連続的な行動も探求すべき


• 2つの要素(一般的な嗜好と連続的な行動)を考慮するシステムは


優れた性能を獲得しており,WangらはこれをHybrid modelと呼んでいる


• 本研究はWangらの主張を支持し,Hybrid modelのアイデアを次バスケット推薦


だけでなく,同じSBRSのタスクである次アイテム推薦にも適用できると考える
SBRSがモデル化すべき要素
07
P. Wang et al.: Learning Hierarchical Representation Model for Next Basket Recommendation,


Proc. of the 38th Int. ACM SIGIR Conf. on Research and Development in Information Retrieval, 403–412, 2015.
ユーザの連続的な行動
最新セッションにおいて


出現したアイテム


およびその順序
ユーザの一般的な嗜好
ユーザが典型的に


どのようなアイテムを好むか
Hybrid

model
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
既存システムとの比較
08
• O. Barkan, N. Koenigstein: Item2Vec: Neural Item Embedding for Collaborative Filtering,


In 2016 IEEE 26th Int. Workshop on Machine Learning for Signal Processing (MLSP), pp.1–6, 2016.


• M. Grbovic et al.: E-commerce in your inbox: Product Recommendations at Scale,


Proc. of the 21st ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining, pp.1809–1818, 2015.


• S. Rendle et al.: Factorizing Personalized Markov Chains for Next-basket Recommendation, Proc. of the 19th Int. Conf. on World Wide Web, pp.811–820, 2010.


• B. Hidasi et al.: Session-based Recommendations with Recurrent Neural Networks, Int. Conf. on Learning Representations, arXiv, arXiv:1511.06939, 2016.


• J. Li, P. Ren, Z. Chen, Z. Ren, T. Lian, J. Ma: Neural Attentive Session-based Recommendation,


Proc. of the 2017 ACM on Conf. on Information and Knowledge Management, pp.1419–1428, 2017.
システム モデルタイプ 連続的な行動 一般的な嗜好 課題など
Item2Vec 分散表現 ✕ ✕ 提案システムの要素技術
user2vec 分散表現 ✕ ⃝ 短期変化するユーザ嗜好への対応
FPMC
マルコフ連鎖

行列因子分解
⃝ ⃝ 計算コスト大
GRU4Rec RNN ⃝ ✕ 説明性が低い,厳密すぎる順序考慮
NARM RNN ⃝ ⃝ Attention機構による改善,課題は同上
提案システム 分散表現 ⃝ ⃝
ユーザ嗜好へのリアルタイムな対応,

緩和された順序考慮,説明性向上
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
リアルタイム
ユーザ

表現構築
提案システム


分散表現の構築・更新
09
A B A B ?
アイテム分散表現構築
xv = (0.46,⋯,0.49) ∈ ℝd
Item2Vec
セッション表現構築/更新
ユーザ表現構築/更新
C D
x1
s = xA x2
s = f(x1
s , xB)
x3
s = f(x2
s , xA) x4
s = f(x3
s , xC)
v
x1
u = x4
s x1
s′

= xD x2
s′

= f(x1
s′

, xB)
xu = g(x1
u, x3
s′

)
zu = h(x1
u, x2
s′

)
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
10
提案システム


セッション表現の更新方法
• セッション表現の役割: 連続的な行動のモデル化


• セッション表現の更新関数に求める条件


• 厳密でなくとも順序関係を考慮


• 小さい計算コスト(計算回数がアイテム出現につき1回と多いため)


• 案1. コサイン類似度(COS: Cosine Similarity): アイテムの類似性を考慮


• 案2. 順序差減衰(ODD: Order Difference Decay): アイテムの出現順序を考慮


更新関数 記号 要素
入力
既存のセッション表現
新たに出現したアイテムの分散表現
出力 更新されたセッション表現
x′

s
xv
xs
ws = cos(x′

s, xv)
ws = exp(−λ) xs = wsx′

s + xv λ: 崩壊定数(ハイパーパラメータ)
xs = w1x′

s + w2xv
(w1, w2) ∈ {(ws,1 − ws), (1 − ws, ws), (ws,1), (1,ws)}
f
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
11
提案システム


ユーザ表現の更新方法
• ユーザ表現の役割: 一般的な嗜好のモデル化


• ユーザ表現の更新関数に求める条件


• 出現アイテム系列において注目すべき点(嗜好中心や主目的)の推定に繋がる


• できる限り小さい計算コスト(セッション表現よりも更新回数が少ないため)


• コンテキストセッション数 はハイパーパラメータ, を最新セッション表現とする


• コサイン類似度による各セッションの重み付け


• 加重平均・加重和によるユーザ表現更新


更新関数 記号 要素
入力
コンテキストセッション  (過去 セッション)に

含まれる各セッションのセッション表現

出力 更新されたユーザ表現
xs∈Cu
xu
ws∈Cu
= cos(xsl
, xs∈Cu
)
xu =
∑s∈Cu
(wsxs)
{∑s∈Cu
ws,1}
Cu
c
sl
c
g
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
12
提案システム


リアルタイムユーザ表現の構築方法
• リアルタイムユーザ表現とは


ユーザへの推薦生成が必要になった時点で,連続的な行動と一般的な嗜好の2つの要素を


協調して捉えるよう試みる,アイテム分散表現ベースのベクトル表現


• リアルタイムユーザ表現の構築関数に求める条件


• 2つの要素を協調的に捉える(各要素の影響度を必要に応じて調整する)計算方法


• 小さい計算コスト(多数のユーザに任意のタイミングでの推薦生成ができるようにする)


• コサイン類似度による重み計算


• 加重平均・加重和によるリアルタイムユーザ表現構築
構築関数 記号 要素
入力
最新セッションのセッション表現
ユーザ表現
出力 リアルタイムユーザ表現
xsl
zu
wz = cos(xsl
, xu)
xu
zu = w1xsl
+ w2xu (w1, w2) ∈ {(wz,1 − wz), (1 − wz, wz), (wz,1), (1,wz)}
h
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
13
提案システム


推薦アイテム探索: NN型探索
• 近傍(NN: Nearest Neighbors)型探索:

リアルタイムユーザの近傍アイテムを


推薦アイテム集合  とする


• 最も単純な探索法


• 距離が近い順に優先して推薦
• NN型探索の利点


• 1回の近傍探索で済み,計算コスト小


• ターゲットユーザの行動と嗜好のみ


考慮しており,精度向上が期待


• NN型探索の欠点


• ノイズとなるアイテムの影響を受けやすい


• 同じような推薦が繰り返される


可能性がある
リアルタイム


ユーザ
リアルタイムユーザの


近傍アイテム
R
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
14
提案システム


推薦アイテム探索: CF型探索
• 協調フィルタリング

(CF: Collaborative Filtering)型探索:

リアルタイムユーザと,その近傍ユーザ


それぞれの近傍アイテムを考慮して


推薦アイテム集合  を生成


• 協調フィルタリングのような探索法


• 共通近傍アイテムを優先して推薦
• CF型探索のねらい


• 複数ユーザの考慮による,ノイズと


なりうるアイテムからの影響低減


• 多様性や新規性の向上


(ユーザの嗜好を揺さぶるような推薦)


• アイテムに対するユーザの関連付けが


容易なことによる説明性向上
リアルタイム


ユーザ
近傍ユーザ
共通近傍


アイテム
リアルタイムユーザの


近傍アイテム
近傍ユーザの


近傍アイテム
R
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
15
評価実験


セッションデータセット
• 主に以下の前処理を実施


• 出現回数が5回未満のアイテムと長さが1のセッションを除外


• 同セッション内で同アイテムが連続して出現する場合は1つにまとめる


• TrivagoとREES46には購入など複数の行動が含まれるが,閲覧相当のログのみ抽出


• DIGINETICAには匿名ユーザによるログが含まれる(上表ではカウント対象外)
データセット 概要 アイテム セッション ユーザ
Trivago 1 ホテル検索サイトのユーザセッション 179,484 337,816 295,165
REES46 2
大規模マルチカテゴリー

オンラインストアの行動データ
124,452 1,369,062 786,015
DIGINETICA 3
ECサイトの検索エンジンのログから

抽出されたユーザセッション
44,484 194,232 54,444
*1 https://recsys.trivago.cloud/challenge/dataset/


*2 https://www.kaggle.com/mkechinov/ecommerce-behavior-data-
from-multi-category-store


REES46 Marketing Platform: https://rees46.com/


*3 https://competitions.codalab.org/competitions/
11161#learn_the_details-data2
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
16
評価実験


評価方法とベースライン
• 評価方法


1. データセットをタイムスタンプを元に訓練・検証・テストセットに分割


2. 検証・テストセットに含まれる各セッションの最後のアイテムをターゲットとする


3. 訓練・検証セットを使い,各システムのハイパーパラメータチューニングを行う


4. 3で決まった最適な設定において,訓練・検証・テストセットを使い,評価する(指標は後述)


• 各システムはターゲットの予測を試み,ランク付けされた推薦アイテム集合  を生成


• ベースライン: POP, S-POP, FPMC, Item2Vec, 提案システム4種の計8システム


• POP, S-POPはそれぞれ広域(セッションデータ全体)・局所(セッション内)人気ベース


• Item2Vecは直前アイテム分散表現の近傍アイテムを推薦


• 提案システムはセッション表現更新法(COS, ODD)と推薦アイテム探索法(NN, CF)を変えた4種
データセット 訓練 検証 テスト
Trivago 2018.11.01 09:00:00 ~ 11.07 00:59:59 11.07 01:00:00 ~ 04:59.59 05:00:00 ~ 08:59:14
REES46 2020.03.01 00:00:00 ~ 03.06 18:59:59 03.06 19:00:00 ~ 19:59:59 20:00:00 ~ 23:59:38
DIGINETICA 2016.01.01 ~ 2016.05.22 05.22 ~ 05.27 05.28 ~ 06.01
R
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
17
評価実験


評価指標
• 以下3つの観点で各システムのセッションデータに対する有効性を詳しく確認


• 精度: システムがターゲットアイテムをどれほど正確に予測できているか


• 多様性: どの程度幅広く様々なアイテムが推薦されているか


• 新規性: ユーザにとって未知のアイテムがどの程度推薦されているか
観点 指標 定義 説明
精度
Recall@k
予測集合が実際の結果をどれほど再現(網羅)しているか

本実験では対象は単一アイテムであるためヒット率と同じ
MRR@k
予測集合内のランキングを考慮した評価指標

(k+1)位以下の場合は0として扱う
多様性
DIV@k

[Hu+, 2017]
ターゲットに対する推薦アイテム集合ペアの非重複率
新規性
MCAN@k

[Wang+, 2018]
コンテキスト(過去一定期間に閲覧したアイテム集合)と

ターゲットに対する推薦アイテム集合のペアの非重複率
1
N ∑
v∈Vt
{v} ∩ Rv
k
1
N ∑
v∈Vt
1
rank(v, Rv)
2
N(N − 1) ∑
i≠j
(
1 −
|Ri ∩ Rj |
|Ri ∪ Rj | )
1
N ∑
v∈Vt
(
1 −
|c ∩ Rv |
k )
L. Hu et al.: Diversifying Personalized Recommendation with User-session Context,


Proc. of the 26th Int. Joint Conf. on Arti
fi
cial Intelligence (IJCAI), pp.1858–1864, 2017.


S. Wang et al.: Attention-Based Transactional Context Embedding for Next-Item Recommendation,


Proc. of the AAAI Conf. on Arti
fi
cial Intelligence, vol.32, no.1, pp.2532–2539, 2018.
推薦生成成功ターゲットアイテム集合:        / ターゲットアイテム   に対する推薦アイテム集合:     
Vt (|Vt | = N) Rv (|Rv | = k)
v ∈ Vt
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
評価実験


評価結果: Recall@k
REES46 DIGINETICA
Recall@20 [%] Trivago REES46 DIGINETICA
POP 0.750 8.55 0.887
S-POP 18.0 23.4 14.6
FPMC 40.1 計測不可 18.5
Item2Vec 26.8 37.0 29.0
proposal-COS (NN) 31.6 36.2 29.3
proposal-COS (CF) 32.2 36.4 29.7
proposal-ODD (NN) 32.6 34.8 33.0
proposal-ODD (CF) 33.3 35.4 34.1
2021年度 人工知能学会全国大会(第35回)
2021.06.08
Trivago
18
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
REES46 DIGINETICA
REES46
2021年度 人工知能学会全国大会(第35回)
2021.06.08
Trivago
MRR@20 [%] Trivago REES46 DIGINETICA
POP 0.170 2.30 0.204
S-POP 12.8 13.3 9.81
FPMC 11.3 計測不可 5.98
Item2Vec 7.20 13.2 8.51
proposal-COS (NN) 11.3 12.6 9.66
proposal-COS (CF) 12.1 14.2 10.8
proposal-ODD (NN) 7.97 8.31 7.27
proposal-ODD (CF) 9.58 12.0 9.74
評価実験


評価結果: MRR@k
19
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
20
評価実験


評価結果: 多様性と新規性
評価指標 多様性: DIV@20 新規性: MCAN@20
データセット Trivago REES46 DIGINETICA Trivago REES46 DIGINETICA
POP 0.1107 1.537 0.1961 99.9 96.9 99.9
S-POP 23.31 39.39 28.92 90.9 79.8 88.1
FPMC 99.76 計測不可 99.68 84.4 計測不可 95.7
Item2Vec 99.97 99.52 99.90 97.5 93.3 97.5
proposal-COS (NN) 99.96 99.49 99.87 92.0 85.6 91.7
proposal-COS (CF) 99.96 99.51 99.87 94.9 89.1 94.7
proposal-ODD (NN) 99.92 99.53 99.91 91.7 86.5 91.0
proposal-ODD (CF) 99.92 99.56 99.91 95.4 90.7 95.7
2021年度 人工知能学会全国大会(第35回)
2021.06.08 /21
おわりに
• 本研究のまとめ
• 分散表現を用いたセッション・ユーザ表現のリアルタイム学習型


セッションベース推薦システムを提案


• アイテム・セッション・ユーザの分散表現がすべて同じベクトル空間上に


存在することを活かした2つの推薦アイテム探索法を提案


• 提案システムは精度・多様性・新規性の3つの観点がバランスよく優れている


傾向が見られるが,データセットによってはItem2vecより劣ることがある


• CF型探索は推薦の説明性の向上が期待でき,いずれの観点でもNN型探索より優れている


• 今後の研究計画


• 多層ニューラルネットワークベースシステム(ex. GRU4Rec [Hidasi+, 2016])との比較


• 近似最近傍探索アルゴリズムの導入(計算コスト削減)


• 他の分散表現モデル(ex. GloVe [Pennington+, 2014])の活用
21
B. Hidasi et al.: Session-based Recommendations with Recurrent Neural Networks,


Int. Conf. on Learning Representations, arXiv, arXiv:1511.06939, 2016.


J. Pennington et al.: Global Vectors for Word Representation,


Proc. of the 2014 Conf. on Empirical Methods in Natural Language Processing, 1532–1543, 2014.

Mais conteúdo relacionado

Mais procurados

機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual TalksYuya Unno
 
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAttentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAGIRobots
 
レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方Shun Nukui
 
協調フィルタリング入門
協調フィルタリング入門協調フィルタリング入門
協調フィルタリング入門hoxo_m
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門Shuyo Nakatani
 
論文紹介「A Perspective View and Survey of Meta-Learning」
論文紹介「A Perspective View and Survey of Meta-Learning」論文紹介「A Perspective View and Survey of Meta-Learning」
論文紹介「A Perspective View and Survey of Meta-Learning」Kota Matsui
 
機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明Satoshi Hara
 
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイARISE analytics
 
最適輸送の解き方
最適輸送の解き方最適輸送の解き方
最適輸送の解き方joisino
 
トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?hoxo_m
 
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and EditingDeep Learning JP
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!TransformerArithmer Inc.
 
CV分野におけるサーベイ方法
CV分野におけるサーベイ方法CV分野におけるサーベイ方法
CV分野におけるサーベイ方法Hirokatsu Kataoka
 
レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法Takeshi Mikami
 
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用SSII
 
情報推薦システム入門:講義スライド
情報推薦システム入門:講義スライド情報推薦システム入門:講義スライド
情報推薦システム入門:講義スライドKenta Oku
 
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3までYahoo!デベロッパーネットワーク
 
Generative Models(メタサーベイ )
Generative Models(メタサーベイ )Generative Models(メタサーベイ )
Generative Models(メタサーベイ )cvpaper. challenge
 
[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative Models[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative ModelsDeep Learning JP
 

Mais procurados (20)

機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks
 
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAttentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門まで
 
レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方
 
協調フィルタリング入門
協調フィルタリング入門協調フィルタリング入門
協調フィルタリング入門
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門
 
論文紹介「A Perspective View and Survey of Meta-Learning」
論文紹介「A Perspective View and Survey of Meta-Learning」論文紹介「A Perspective View and Survey of Meta-Learning」
論文紹介「A Perspective View and Survey of Meta-Learning」
 
機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明
 
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイ
 
最適輸送の解き方
最適輸送の解き方最適輸送の解き方
最適輸送の解き方
 
トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?
 
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!Transformer
 
ゼロから始める転移学習
ゼロから始める転移学習ゼロから始める転移学習
ゼロから始める転移学習
 
CV分野におけるサーベイ方法
CV分野におけるサーベイ方法CV分野におけるサーベイ方法
CV分野におけるサーベイ方法
 
レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法
 
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用
 
情報推薦システム入門:講義スライド
情報推薦システム入門:講義スライド情報推薦システム入門:講義スライド
情報推薦システム入門:講義スライド
 
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
 
Generative Models(メタサーベイ )
Generative Models(メタサーベイ )Generative Models(メタサーベイ )
Generative Models(メタサーベイ )
 
[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative Models[DL輪読会]Flow-based Deep Generative Models
[DL輪読会]Flow-based Deep Generative Models
 

Semelhante a 分散表現を用いたリアルタイム学習型セッションベース推薦システム

多様なユースケースに対応可能なユーザ参加型モバイルセンシング基盤の実装と評価(DICOMO 2016)
多様なユースケースに対応可能なユーザ参加型モバイルセンシング基盤の実装と評価(DICOMO 2016)多様なユースケースに対応可能なユーザ参加型モバイルセンシング基盤の実装と評価(DICOMO 2016)
多様なユースケースに対応可能なユーザ参加型モバイルセンシング基盤の実装と評価(DICOMO 2016)Ubi NAIST
 
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy LearningDiscriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy LearningTomoyasuOkada
 
オブジェクト指向入門3
オブジェクト指向入門3オブジェクト指向入門3
オブジェクト指向入門3Kenta Hattori
 
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)Sho Nakamura
 
「モダンな」可視化アプリケーション開発とはどのようなものか?
「モダンな」可視化アプリケーション開発とはどのようなものか?「モダンな」可視化アプリケーション開発とはどのようなものか?
「モダンな」可視化アプリケーション開発とはどのようなものか?Keiichiro Ono
 
AngularモダンWeb開発研修の紹介
AngularモダンWeb開発研修の紹介AngularモダンWeb開発研修の紹介
AngularモダンWeb開発研修の紹介Staffnet_Inc
 
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」Shuji Morisaki
 
文献紹介:Temporal Convolutional Networks for Action Segmentation and Detection
文献紹介:Temporal Convolutional Networks for Action Segmentation and Detection文献紹介:Temporal Convolutional Networks for Action Segmentation and Detection
文献紹介:Temporal Convolutional Networks for Action Segmentation and DetectionToru Tamaki
 
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術Yoichi Motomura
 
WWW2017 Recommender Systems ふりかえり
WWW2017 Recommender Systems ふりかえりWWW2017 Recommender Systems ふりかえり
WWW2017 Recommender Systems ふりかえりyyammt
 
[DL Hacks]Visdomを使ったデータ可視化
[DL Hacks]Visdomを使ったデータ可視化[DL Hacks]Visdomを使ったデータ可視化
[DL Hacks]Visdomを使ったデータ可視化Deep Learning JP
 
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98thYoichi Motomura
 
Information20120312
Information20120312Information20120312
Information20120312b-slash
 
2008 icse-granularity in software product lines
2008 icse-granularity in software product lines2008 icse-granularity in software product lines
2008 icse-granularity in software product linesn-yuki
 
情報システム障害解析のための知識グラフ構築の試み / Constructing a knowledge graph for information sys...
情報システム障害解析のための知識グラフ構築の試み / Constructing a knowledge graph for information sys...情報システム障害解析のための知識グラフ構築の試み / Constructing a knowledge graph for information sys...
情報システム障害解析のための知識グラフ構築の試み / Constructing a knowledge graph for information sys...Shinji Takao
 
挑戦の道具としてのチケット駆動開発(長編版)
挑戦の道具としてのチケット駆動開発(長編版)挑戦の道具としてのチケット駆動開発(長編版)
挑戦の道具としてのチケット駆動開発(長編版)Makoto SAKAI
 
Sigir2013 勉強会資料
Sigir2013 勉強会資料Sigir2013 勉強会資料
Sigir2013 勉強会資料Mitsuo Yamamoto
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺n_hidekey
 

Semelhante a 分散表現を用いたリアルタイム学習型セッションベース推薦システム (20)

多様なユースケースに対応可能なユーザ参加型モバイルセンシング基盤の実装と評価(DICOMO 2016)
多様なユースケースに対応可能なユーザ参加型モバイルセンシング基盤の実装と評価(DICOMO 2016)多様なユースケースに対応可能なユーザ参加型モバイルセンシング基盤の実装と評価(DICOMO 2016)
多様なユースケースに対応可能なユーザ参加型モバイルセンシング基盤の実装と評価(DICOMO 2016)
 
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy LearningDiscriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning
 
オブジェクト指向入門3
オブジェクト指向入門3オブジェクト指向入門3
オブジェクト指向入門3
 
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
 
Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用
Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用
Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用
 
「モダンな」可視化アプリケーション開発とはどのようなものか?
「モダンな」可視化アプリケーション開発とはどのようなものか?「モダンな」可視化アプリケーション開発とはどのようなものか?
「モダンな」可視化アプリケーション開発とはどのようなものか?
 
Quality characteristics
Quality characteristicsQuality characteristics
Quality characteristics
 
AngularモダンWeb開発研修の紹介
AngularモダンWeb開発研修の紹介AngularモダンWeb開発研修の紹介
AngularモダンWeb開発研修の紹介
 
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
 
文献紹介:Temporal Convolutional Networks for Action Segmentation and Detection
文献紹介:Temporal Convolutional Networks for Action Segmentation and Detection文献紹介:Temporal Convolutional Networks for Action Segmentation and Detection
文献紹介:Temporal Convolutional Networks for Action Segmentation and Detection
 
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
 
WWW2017 Recommender Systems ふりかえり
WWW2017 Recommender Systems ふりかえりWWW2017 Recommender Systems ふりかえり
WWW2017 Recommender Systems ふりかえり
 
[DL Hacks]Visdomを使ったデータ可視化
[DL Hacks]Visdomを使ったデータ可視化[DL Hacks]Visdomを使ったデータ可視化
[DL Hacks]Visdomを使ったデータ可視化
 
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
 
Information20120312
Information20120312Information20120312
Information20120312
 
2008 icse-granularity in software product lines
2008 icse-granularity in software product lines2008 icse-granularity in software product lines
2008 icse-granularity in software product lines
 
情報システム障害解析のための知識グラフ構築の試み / Constructing a knowledge graph for information sys...
情報システム障害解析のための知識グラフ構築の試み / Constructing a knowledge graph for information sys...情報システム障害解析のための知識グラフ構築の試み / Constructing a knowledge graph for information sys...
情報システム障害解析のための知識グラフ構築の試み / Constructing a knowledge graph for information sys...
 
挑戦の道具としてのチケット駆動開発(長編版)
挑戦の道具としてのチケット駆動開発(長編版)挑戦の道具としてのチケット駆動開発(長編版)
挑戦の道具としてのチケット駆動開発(長編版)
 
Sigir2013 勉強会資料
Sigir2013 勉強会資料Sigir2013 勉強会資料
Sigir2013 勉強会資料
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺
 

Mais de Okamoto Laboratory, The University of Electro-Communications

Mais de Okamoto Laboratory, The University of Electro-Communications (18)

クラウドソーシングにおける協調的な共同作業に対する組織構成システム
クラウドソーシングにおける協調的な共同作業に対する組織構成システムクラウドソーシングにおける協調的な共同作業に対する組織構成システム
クラウドソーシングにおける協調的な共同作業に対する組織構成システム
 
リンク予測に基づく共同研究者推薦システムの試作
リンク予測に基づく共同研究者推薦システムの試作リンク予測に基づく共同研究者推薦システムの試作
リンク予測に基づく共同研究者推薦システムの試作
 
Visualizing the Importance of Floor-Plan Image Features in Rent-Prediction Mo...
Visualizing the Importance of Floor-Plan Image Features in Rent-Prediction Mo...Visualizing the Importance of Floor-Plan Image Features in Rent-Prediction Mo...
Visualizing the Importance of Floor-Plan Image Features in Rent-Prediction Mo...
 
Directed Graph-based Researcher Recommendation by Random Walk with Restart an...
Directed Graph-based Researcher Recommendation by Random Walk with Restart an...Directed Graph-based Researcher Recommendation by Random Walk with Restart an...
Directed Graph-based Researcher Recommendation by Random Walk with Restart an...
 
間取り図を用いた賃料予測モデルに関する一検討
間取り図を用いた賃料予測モデルに関する一検討間取り図を用いた賃料予測モデルに関する一検討
間取り図を用いた賃料予測モデルに関する一検討
 
Development of a Collaborator Recommender System Based on Directed Graph Model
Development of a Collaborator Recommender System Based on Directed Graph ModelDevelopment of a Collaborator Recommender System Based on Directed Graph Model
Development of a Collaborator Recommender System Based on Directed Graph Model
 
Rent Prediction Models with Floor Plan Images
Rent Prediction Models with Floor Plan ImagesRent Prediction Models with Floor Plan Images
Rent Prediction Models with Floor Plan Images
 
アイテム分散表現の階層化・集約演算に基づくセッションベース推薦システム
アイテム分散表現の階層化・集約演算に基づくセッションベース推薦システムアイテム分散表現の階層化・集約演算に基づくセッションベース推薦システム
アイテム分散表現の階層化・集約演算に基づくセッションベース推薦システム
 
発売日前のレビューとPU-Learningを用いた
スパムレビュー検出
発売日前のレビューとPU-Learningを用いた
スパムレビュー検出発売日前のレビューとPU-Learningを用いた
スパムレビュー検出
発売日前のレビューとPU-Learningを用いた
スパムレビュー検出
 
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
 
重回帰分析による推薦の透明性を有したモデルベース協調フィルタリング
重回帰分析による推薦の透明性を有したモデルベース協調フィルタリング重回帰分析による推薦の透明性を有したモデルベース協調フィルタリング
重回帰分析による推薦の透明性を有したモデルベース協調フィルタリング
 
数式からみるWord2Vec
数式からみるWord2Vec数式からみるWord2Vec
数式からみるWord2Vec
 
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
 
単語の分散表現の 購買履歴への応用
単語の分散表現の 購買履歴への応用単語の分散表現の 購買履歴への応用
単語の分散表現の 購買履歴への応用
 
機関リポジトリから収集した学術論文のテキスト解析に関する一検討
機関リポジトリから収集した学術論文のテキスト解析に関する一検討機関リポジトリから収集した学術論文のテキスト解析に関する一検討
機関リポジトリから収集した学術論文のテキスト解析に関する一検討
 
Text Analysis of Academic Papers Archived in Institutional Repositories
Text Analysis of Academic Papers Archived in Institutional RepositoriesText Analysis of Academic Papers Archived in Institutional Repositories
Text Analysis of Academic Papers Archived in Institutional Repositories
 
Families of Triangular Norm Based Kernel Function and Its Application to Kern...
Families of Triangular Norm Based Kernel Function and Its Application to Kern...Families of Triangular Norm Based Kernel Function and Its Application to Kern...
Families of Triangular Norm Based Kernel Function and Its Application to Kern...
 
これから始めるディープラーニング
これから始めるディープラーニングこれから始めるディープラーニング
これから始めるディープラーニング
 

分散表現を用いたリアルタイム学習型セッションベース推薦システム

  • 2. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 02 はじめに • 情報推薦におけるセッションとは [S.Wang+, 2019] • 1つのイベントまたは一定期間内に 
 収集または消費されたアイテムのセット 
 → バスケットデータ • 一定期間に起こった行動や 
 イベントのコレクション 
 → セッションデータ • セッションデータの例 • サブスクリプション方式の 
 音楽配信サービスにおける再生履歴 • ECサイトにおける商品閲覧履歴 S. Wang, C. Longbing, W. Yan: A Survey on Session-based Recommender Systems, arXiv, arXiv:1902.04864, 2019.
  • 3. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 Session-Based Recommender Systems (SBRS) 
 セッションベース推薦システム • 定義: 既知のセッション情報(ex. 直近の過去セッション)が部分的に 
 与えられた場合に,セッション内/セッション間に埋め込まれた複雑な関係を 
 モデル化し,未知のセッション情報を予測する推薦システム [S. Wang+, 2019] • 性質 • セッション構造を維持して情報の損失を最小限に抑える • ユーザ情報を必ずしも必要としない 03 S. Wang, C. Longbing, W. Yan: A Survey on Session-based Recommender Systems, arXiv, arXiv:1902.04864, 2019. B C A B ? A セッション アイテム ユーザ t 時刻
  • 4. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 分散表現を活用する推薦システム • 加法構成性をもつ分散表現 • 分散表現: オブジェクト(単語,アイテム etc.)を高次元ベクトルで表現する手法 • 加法構成性をもつ分散表現: 加法構成性(ベクトル演算による意味計算が可能)を 
 もつことが実験で明らかにされている分散表現 (ex. Word2Vec [T. Mikolov+, 2013] ) • 加法構成性をもつ分散表現を活用する推薦システムの例 • Item2Vec [O. Barkan+, 2016]: 
 Word2Vecを商品購買履歴に応用して商品の分散表現を構築 • user2vec [M. Grbovic+, 2015]: 文書をユーザに置き換えてユーザの分散表現を学習 文 04 T. Mikolov, et al.: Distributed Representations of Words and Phrases and their Compositonality, Proc. of Advances in Neural Information Processing Systems 26, pp.3111–3119, 2013. O. Barkan, N. Koenigstein: Item2Vec: Neural Item Embedding for Collaborative Filtering, In 2016 IEEE 26th Int. Workshop on Machine Learning for Signal Processing (MLSP), pp.1–6, 2016. M. Grbovic et al.: E-commerce in your inbox: Product Recommendations at Scale, Proc. of the 21st ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining, pp.1809–1818, 2015. 単語 文章 バスケット
 セッション アイテム ユーザ
  • 5. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 ユーザの分散表現の導入に伴う課題 05 M. Grbovic et al.: E-commerce in your inbox: Product Recommendations at Scale, 
 Proc. of the 21st ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining, pp.1809–1818, 2015. Q. Le, T. Mikolov: Distributed Representations of Sentences and Documents, Proc. of the 31st Int. Conf. on Machine Learning, pp.1188–1196,2014. 異なるアルゴリズムの予測精度([Q. Le+, 2014] Figure.10より引用) • user2vec: GrbovicらによるProd2Vecに含まれるシステムの1つ [M. Grbovic+, 2015] • ユーザとアイテムの分散表現(ユーザ・アイテム分散表現)を同時に学習 • ユーザとアイテムで共通するベクトル空間内で最近傍k個の商品を見つけて推薦 • ユーザ表現の構築にはParagraph2Vec(テキストをユーザに見立てる)を適用 • Paragraph2Vec: テキストの分散表現を構築するモデル [Q. Le+, 2014] • ユーザ表現の導入の利点・欠点 • 利点: パーソナライズな推薦生成が可能になり, 
 推薦精度の向上に貢献 • 欠点: ユーザの嗜好は短期的に変化 
 → 構築からの時間経過により精度が急低下
 → 精度維持には頻繁なユーザ表現の再構築が必要 • ユーザの急な嗜好変化にすぐに対応できない • 新規ユーザにすぐに対応できない
  • 6. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 研究課題 • 加法構成性をもつ分散表現を活用するSBRSの研究は限られており, 
 システム評価のために推薦精度(ex. Recall@k)しか 
 確認していないことが多い 
 → 既存システムとItem2Vecベースシステムの推薦の
   精度・多様性・新規性の評価・比較による,
   アイテム分散表現のセッションデータへの有効性の確認 • ユーザ表現の導入は推薦精度向上に貢献することが期待されるが, 
 ユーザの嗜好は短期的に変化するため,頻繁な分散表現の再構築が必要 
 → アイテム分散表現の階層化・集約演算によるユーザ表現の
   リアルタイムな構築法の提案 06
  • 7. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 • Wangらの主張 [Wang+, 2015]: 次バスケット推薦をタスクとする推薦システムは推薦生成に 向け,ユーザの一般的な嗜好を考慮するだけでなく,連続的な行動も探求すべき • 2つの要素(一般的な嗜好と連続的な行動)を考慮するシステムは 
 優れた性能を獲得しており,WangらはこれをHybrid modelと呼んでいる • 本研究はWangらの主張を支持し,Hybrid modelのアイデアを次バスケット推薦 
 だけでなく,同じSBRSのタスクである次アイテム推薦にも適用できると考える SBRSがモデル化すべき要素 07 P. Wang et al.: Learning Hierarchical Representation Model for Next Basket Recommendation, 
 Proc. of the 38th Int. ACM SIGIR Conf. on Research and Development in Information Retrieval, 403–412, 2015. ユーザの連続的な行動 最新セッションにおいて 
 出現したアイテム 
 およびその順序 ユーザの一般的な嗜好 ユーザが典型的に どのようなアイテムを好むか Hybrid
 model
  • 8. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 既存システムとの比較 08 • O. Barkan, N. Koenigstein: Item2Vec: Neural Item Embedding for Collaborative Filtering, 
 In 2016 IEEE 26th Int. Workshop on Machine Learning for Signal Processing (MLSP), pp.1–6, 2016. • M. Grbovic et al.: E-commerce in your inbox: Product Recommendations at Scale, 
 Proc. of the 21st ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining, pp.1809–1818, 2015. • S. Rendle et al.: Factorizing Personalized Markov Chains for Next-basket Recommendation, Proc. of the 19th Int. Conf. on World Wide Web, pp.811–820, 2010. • B. Hidasi et al.: Session-based Recommendations with Recurrent Neural Networks, Int. Conf. on Learning Representations, arXiv, arXiv:1511.06939, 2016. • J. Li, P. Ren, Z. Chen, Z. Ren, T. Lian, J. Ma: Neural Attentive Session-based Recommendation, 
 Proc. of the 2017 ACM on Conf. on Information and Knowledge Management, pp.1419–1428, 2017. システム モデルタイプ 連続的な行動 一般的な嗜好 課題など Item2Vec 分散表現 ✕ ✕ 提案システムの要素技術 user2vec 分散表現 ✕ ⃝ 短期変化するユーザ嗜好への対応 FPMC マルコフ連鎖
 行列因子分解 ⃝ ⃝ 計算コスト大 GRU4Rec RNN ⃝ ✕ 説明性が低い,厳密すぎる順序考慮 NARM RNN ⃝ ⃝ Attention機構による改善,課題は同上 提案システム 分散表現 ⃝ ⃝ ユーザ嗜好へのリアルタイムな対応,
 緩和された順序考慮,説明性向上
  • 9. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 リアルタイム ユーザ
 表現構築 提案システム 分散表現の構築・更新 09 A B A B ? アイテム分散表現構築 xv = (0.46,⋯,0.49) ∈ ℝd Item2Vec セッション表現構築/更新 ユーザ表現構築/更新 C D x1 s = xA x2 s = f(x1 s , xB) x3 s = f(x2 s , xA) x4 s = f(x3 s , xC) v x1 u = x4 s x1 s′  = xD x2 s′  = f(x1 s′  , xB) xu = g(x1 u, x3 s′  ) zu = h(x1 u, x2 s′  )
  • 10. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 10 提案システム セッション表現の更新方法 • セッション表現の役割: 連続的な行動のモデル化 • セッション表現の更新関数に求める条件 • 厳密でなくとも順序関係を考慮 • 小さい計算コスト(計算回数がアイテム出現につき1回と多いため) • 案1. コサイン類似度(COS: Cosine Similarity): アイテムの類似性を考慮 • 案2. 順序差減衰(ODD: Order Difference Decay): アイテムの出現順序を考慮 更新関数 記号 要素 入力 既存のセッション表現 新たに出現したアイテムの分散表現 出力 更新されたセッション表現 x′  s xv xs ws = cos(x′  s, xv) ws = exp(−λ) xs = wsx′  s + xv λ: 崩壊定数(ハイパーパラメータ) xs = w1x′  s + w2xv (w1, w2) ∈ {(ws,1 − ws), (1 − ws, ws), (ws,1), (1,ws)} f
  • 11. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 11 提案システム ユーザ表現の更新方法 • ユーザ表現の役割: 一般的な嗜好のモデル化 • ユーザ表現の更新関数に求める条件 • 出現アイテム系列において注目すべき点(嗜好中心や主目的)の推定に繋がる • できる限り小さい計算コスト(セッション表現よりも更新回数が少ないため) • コンテキストセッション数 はハイパーパラメータ, を最新セッション表現とする • コサイン類似度による各セッションの重み付け • 加重平均・加重和によるユーザ表現更新 更新関数 記号 要素 入力 コンテキストセッション  (過去 セッション)に
 含まれる各セッションのセッション表現
 出力 更新されたユーザ表現 xs∈Cu xu ws∈Cu = cos(xsl , xs∈Cu ) xu = ∑s∈Cu (wsxs) {∑s∈Cu ws,1} Cu c sl c g
  • 12. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 12 提案システム リアルタイムユーザ表現の構築方法 • リアルタイムユーザ表現とは 
 ユーザへの推薦生成が必要になった時点で,連続的な行動と一般的な嗜好の2つの要素を 
 協調して捉えるよう試みる,アイテム分散表現ベースのベクトル表現 • リアルタイムユーザ表現の構築関数に求める条件 • 2つの要素を協調的に捉える(各要素の影響度を必要に応じて調整する)計算方法 • 小さい計算コスト(多数のユーザに任意のタイミングでの推薦生成ができるようにする) • コサイン類似度による重み計算 • 加重平均・加重和によるリアルタイムユーザ表現構築 構築関数 記号 要素 入力 最新セッションのセッション表現 ユーザ表現 出力 リアルタイムユーザ表現 xsl zu wz = cos(xsl , xu) xu zu = w1xsl + w2xu (w1, w2) ∈ {(wz,1 − wz), (1 − wz, wz), (wz,1), (1,wz)} h
  • 13. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 13 提案システム 推薦アイテム探索: NN型探索 • 近傍(NN: Nearest Neighbors)型探索:
 リアルタイムユーザの近傍アイテムを 
 推薦アイテム集合  とする • 最も単純な探索法 • 距離が近い順に優先して推薦 • NN型探索の利点 • 1回の近傍探索で済み,計算コスト小 • ターゲットユーザの行動と嗜好のみ 
 考慮しており,精度向上が期待 • NN型探索の欠点 • ノイズとなるアイテムの影響を受けやすい • 同じような推薦が繰り返される 
 可能性がある リアルタイム 
 ユーザ リアルタイムユーザの 
 近傍アイテム R
  • 14. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 14 提案システム 推薦アイテム探索: CF型探索 • 協調フィルタリング
 (CF: Collaborative Filtering)型探索:
 リアルタイムユーザと,その近傍ユーザ 
 それぞれの近傍アイテムを考慮して 
 推薦アイテム集合  を生成 • 協調フィルタリングのような探索法 • 共通近傍アイテムを優先して推薦 • CF型探索のねらい • 複数ユーザの考慮による,ノイズと 
 なりうるアイテムからの影響低減 • 多様性や新規性の向上 
 (ユーザの嗜好を揺さぶるような推薦) • アイテムに対するユーザの関連付けが 
 容易なことによる説明性向上 リアルタイム 
 ユーザ 近傍ユーザ 共通近傍 
 アイテム リアルタイムユーザの 
 近傍アイテム 近傍ユーザの 
 近傍アイテム R
  • 15. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 15 評価実験 セッションデータセット • 主に以下の前処理を実施 • 出現回数が5回未満のアイテムと長さが1のセッションを除外 • 同セッション内で同アイテムが連続して出現する場合は1つにまとめる • TrivagoとREES46には購入など複数の行動が含まれるが,閲覧相当のログのみ抽出 • DIGINETICAには匿名ユーザによるログが含まれる(上表ではカウント対象外) データセット 概要 アイテム セッション ユーザ Trivago 1 ホテル検索サイトのユーザセッション 179,484 337,816 295,165 REES46 2 大規模マルチカテゴリー
 オンラインストアの行動データ 124,452 1,369,062 786,015 DIGINETICA 3 ECサイトの検索エンジンのログから
 抽出されたユーザセッション 44,484 194,232 54,444 *1 https://recsys.trivago.cloud/challenge/dataset/ 
 *2 https://www.kaggle.com/mkechinov/ecommerce-behavior-data- from-multi-category-store 
 REES46 Marketing Platform: https://rees46.com/ *3 https://competitions.codalab.org/competitions/ 11161#learn_the_details-data2
  • 16. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 16 評価実験 評価方法とベースライン • 評価方法 1. データセットをタイムスタンプを元に訓練・検証・テストセットに分割 2. 検証・テストセットに含まれる各セッションの最後のアイテムをターゲットとする 3. 訓練・検証セットを使い,各システムのハイパーパラメータチューニングを行う 4. 3で決まった最適な設定において,訓練・検証・テストセットを使い,評価する(指標は後述) • 各システムはターゲットの予測を試み,ランク付けされた推薦アイテム集合  を生成 • ベースライン: POP, S-POP, FPMC, Item2Vec, 提案システム4種の計8システム • POP, S-POPはそれぞれ広域(セッションデータ全体)・局所(セッション内)人気ベース • Item2Vecは直前アイテム分散表現の近傍アイテムを推薦 • 提案システムはセッション表現更新法(COS, ODD)と推薦アイテム探索法(NN, CF)を変えた4種 データセット 訓練 検証 テスト Trivago 2018.11.01 09:00:00 ~ 11.07 00:59:59 11.07 01:00:00 ~ 04:59.59 05:00:00 ~ 08:59:14 REES46 2020.03.01 00:00:00 ~ 03.06 18:59:59 03.06 19:00:00 ~ 19:59:59 20:00:00 ~ 23:59:38 DIGINETICA 2016.01.01 ~ 2016.05.22 05.22 ~ 05.27 05.28 ~ 06.01 R
  • 17. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 17 評価実験 評価指標 • 以下3つの観点で各システムのセッションデータに対する有効性を詳しく確認 • 精度: システムがターゲットアイテムをどれほど正確に予測できているか • 多様性: どの程度幅広く様々なアイテムが推薦されているか • 新規性: ユーザにとって未知のアイテムがどの程度推薦されているか 観点 指標 定義 説明 精度 Recall@k 予測集合が実際の結果をどれほど再現(網羅)しているか
 本実験では対象は単一アイテムであるためヒット率と同じ MRR@k 予測集合内のランキングを考慮した評価指標
 (k+1)位以下の場合は0として扱う 多様性 DIV@k
 [Hu+, 2017] ターゲットに対する推薦アイテム集合ペアの非重複率 新規性 MCAN@k
 [Wang+, 2018] コンテキスト(過去一定期間に閲覧したアイテム集合)と
 ターゲットに対する推薦アイテム集合のペアの非重複率 1 N ∑ v∈Vt {v} ∩ Rv k 1 N ∑ v∈Vt 1 rank(v, Rv) 2 N(N − 1) ∑ i≠j ( 1 − |Ri ∩ Rj | |Ri ∪ Rj | ) 1 N ∑ v∈Vt ( 1 − |c ∩ Rv | k ) L. Hu et al.: Diversifying Personalized Recommendation with User-session Context, 
 Proc. of the 26th Int. Joint Conf. on Arti fi cial Intelligence (IJCAI), pp.1858–1864, 2017. S. Wang et al.: Attention-Based Transactional Context Embedding for Next-Item Recommendation, 
 Proc. of the AAAI Conf. on Arti fi cial Intelligence, vol.32, no.1, pp.2532–2539, 2018. 推薦生成成功ターゲットアイテム集合:        / ターゲットアイテム   に対する推薦アイテム集合:      Vt (|Vt | = N) Rv (|Rv | = k) v ∈ Vt
  • 18. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 評価実験 評価結果: Recall@k REES46 DIGINETICA Recall@20 [%] Trivago REES46 DIGINETICA POP 0.750 8.55 0.887 S-POP 18.0 23.4 14.6 FPMC 40.1 計測不可 18.5 Item2Vec 26.8 37.0 29.0 proposal-COS (NN) 31.6 36.2 29.3 proposal-COS (CF) 32.2 36.4 29.7 proposal-ODD (NN) 32.6 34.8 33.0 proposal-ODD (CF) 33.3 35.4 34.1 2021年度 人工知能学会全国大会(第35回) 2021.06.08 Trivago 18
  • 19. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 REES46 DIGINETICA REES46 2021年度 人工知能学会全国大会(第35回) 2021.06.08 Trivago MRR@20 [%] Trivago REES46 DIGINETICA POP 0.170 2.30 0.204 S-POP 12.8 13.3 9.81 FPMC 11.3 計測不可 5.98 Item2Vec 7.20 13.2 8.51 proposal-COS (NN) 11.3 12.6 9.66 proposal-COS (CF) 12.1 14.2 10.8 proposal-ODD (NN) 7.97 8.31 7.27 proposal-ODD (CF) 9.58 12.0 9.74 評価実験 評価結果: MRR@k 19
  • 20. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 20 評価実験 評価結果: 多様性と新規性 評価指標 多様性: DIV@20 新規性: MCAN@20 データセット Trivago REES46 DIGINETICA Trivago REES46 DIGINETICA POP 0.1107 1.537 0.1961 99.9 96.9 99.9 S-POP 23.31 39.39 28.92 90.9 79.8 88.1 FPMC 99.76 計測不可 99.68 84.4 計測不可 95.7 Item2Vec 99.97 99.52 99.90 97.5 93.3 97.5 proposal-COS (NN) 99.96 99.49 99.87 92.0 85.6 91.7 proposal-COS (CF) 99.96 99.51 99.87 94.9 89.1 94.7 proposal-ODD (NN) 99.92 99.53 99.91 91.7 86.5 91.0 proposal-ODD (CF) 99.92 99.56 99.91 95.4 90.7 95.7
  • 21. 2021年度 人工知能学会全国大会(第35回) 2021.06.08 /21 おわりに • 本研究のまとめ • 分散表現を用いたセッション・ユーザ表現のリアルタイム学習型 
 セッションベース推薦システムを提案 • アイテム・セッション・ユーザの分散表現がすべて同じベクトル空間上に 
 存在することを活かした2つの推薦アイテム探索法を提案 • 提案システムは精度・多様性・新規性の3つの観点がバランスよく優れている 
 傾向が見られるが,データセットによってはItem2vecより劣ることがある • CF型探索は推薦の説明性の向上が期待でき,いずれの観点でもNN型探索より優れている • 今後の研究計画 • 多層ニューラルネットワークベースシステム(ex. GRU4Rec [Hidasi+, 2016])との比較 • 近似最近傍探索アルゴリズムの導入(計算コスト削減) • 他の分散表現モデル(ex. GloVe [Pennington+, 2014])の活用 21 B. Hidasi et al.: Session-based Recommendations with Recurrent Neural Networks, 
 Int. Conf. on Learning Representations, arXiv, arXiv:1511.06939, 2016. J. Pennington et al.: Global Vectors for Word Representation, 
 Proc. of the 2014 Conf. on Empirical Methods in Natural Language Processing, 1532–1543, 2014.