初心者機械学習:アーティスト推薦システム
- 11. イメージ
BUMP OF
CHCIEKN
RADWIMPS 西野カナ 嵐
Alice 1 ? ? ?
User1 1 1 1 1
User2 1 0 1 0
User3 0 1 0 0
User4 1 0 1 0
User5 0 0 1 1
User6 0 1 1 0
今回はこのように,
1.Userのinputしたアーティストを少なくとも一件は聴いている
2.Userのinputしたアーティストと同じクラスタのアーティスト達
の2つでデータを絞り込むことによって,行列演算の精度を上げようと考えた。
- 21. (2)協調フィルタリングの原理
アイテム1 アイテム2 アイテム3 アイテム4 アイテム5
アリス 5 3 4 4 ?
User1 3 1 2 3 3
User2 4 3 4 3 5
User3 3 3 1 5 4
User4 1 5 5 2 1
私はアリスに対してアイテム5を推薦するべきかどうか?
1.ピアユーザの決定
前に出たピアソン相関係数から算出。
User1~4はそれぞれ,類似度が
0.85,
0.70,
0.00,
-0.79
Editor's Notes
- Syrup16g,BUMP OF CHICKEN きのこ帝国
- 明示的には、レビュー評価
暗示的には、ログを解析することによる。
- データもとがわかったところで、先にアーティストを如何にして出すか、の結論の紹介
ここから難しい話になる。
- ここで後述するクラスタリングからBUMPとRADは同じ5番のグループになる。
- 最初は適当に色を割り当てている。
- 色ごとに重心をとっています
- 一番近い重心の色に変わっていく。
- 重心をそれぞれのクラスタでとりなおすと、ばつの部分が移動します。
- 再度重心から距離を計算し、近いところへ色を変更します…こういうながれをばつが移動しなくなるまでやる。
- クラスタに偏りはあるものの、大体300~400程度のクラスタに分割することができた。
- ユーザ1,ユーザ2が近いことを協調しておく。
- Netfilxのコンペで採用された手法