O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.

Deim2015「各種メタデータの特徴を考慮した未知レシピへのメタデータ自動付与方式」

714 visualizações

Publicada em

各種メタデータの特徴を考慮した未知レシピへのメタデータ自動付与方式

Publicada em: Alimentos
  • Seja o primeiro a comentar

Deim2015「各種メタデータの特徴を考慮した未知レシピへのメタデータ自動付与方式」

  1. 1. 各種メタデータの特徴を考慮した 未知レシピへのメタデータ自動付与方式
  2. 2. 背景(推薦精度の高精度化) 推薦精度の高精度化 レシピに適切なメタデータを付与 メタデータなしレシピ群 メタデータ付与済みレシピ群 子供が喜ぶレシピが 見つけにくい 子供が喜ぶレシピが 豊富! ただし大量のレシピデータに適切なメタデータを 人手で付与することは容易ではない 1
  3. 3. 本研究の狙い メタデータ付与 済みデータ 未知レシピ 類似度分析に基づく未知レシピへの メタデータ自動付与 メタデータ付レシピとの類似度分析に基づいたメタ データ自動付与方式の開発を行う. 2
  4. 4. 本研究で扱うメタデータ 先行研究(気分で料理を検索するシステム)にて扱っている 6軸のメタデータを採用する. 上記6軸のメタデータ付与済みレシピ500件 以下の6軸を -5 〜 5 で評価 からだ こころ 味 時間 お金 アレンジ [-5 [-5 [-5 [-5 [-5 [-5 ⇔ ⇔ ⇔ ⇔ ⇔ ⇔ 5] 5] 5] 5] 5] 5] (元気)(お疲れ) (ワクワク)(シクシク) (こってり) (本格) (豪華) (アレンジ) (あっさり) (お手軽) (安く) (定番) マスターレシピ 3
  5. 5. 提案手法の開発手順 メタデータ付与 済みデータ (マスターレシピ)未知レシピ ①マスターレシピ群の 特徴ベクトル抽出 ②未知レシピ群の 特徴ベクトル抽出 ③マスターレシピ群に対する未知レシピ群の 類似度分析に基づくメタデータ自動付与 4
  6. 6. メタデータ自動付与方法① マスターレシピの最も類似度の上位のメタデータを そのままコピーして,未知レシピに付与する(TOPコピー) U(i) = M1(i) U(i):未知レシピの各気分データ M1(i):類似度ランク1位のレシピの気分データ i:{からだ,ココロ,味,時間,お金,アレンジ} 未知レシピ マスターレシピ 5
  7. 7. メタデータ自動付与方法② マスターレシピの類似度の上位3件のメタデータを 平均してコピー(3件平均コピー) U(i) = Mn(i):対象未知レシピと類似度順 序がn番のマスターレシピの各気 分データ 3 M1(i) + M2(i) + M3(i) 未知レシピ マスターレシピ マスターレシピ マスターレシピ 6
  8. 8. メタデータ自動付与方法③ マスターレシピの類似度の上位3件のメタデータに類似度順位を 考慮した重みを加えたものを平均してコピー(3件重み平均コピー) U(i) = S1 + S2 + S3 S1*M1(i) + S2*M2(i) + S3*M3(i) Sm:対象未知レシピと類似 度順位がm番のマスター レシピとの類似度 未知レシピ マスターレシピ マスターレシピマスターレシピ 7
  9. 9. メタデータ自動付与方法④ マスターレシピの類似度の上位5件のメタデータを 平均してコピー(5件平均コピー) U(i) = 5 M1(i) + M2(i) + M3(i) + M4(i) + M5(i) 未知レシピ マスターレシピ マスターレシピ マスターレシピ マスターレシピ マスターレシピ 8
  10. 10. メタデータ自動付与方法⑤ マスターレシピの類似度上位5件のメタデータに,類似度順位を 考慮した重みを加えたものを平均してコピー(5件重み平均コピー) U(i) = S1 + S2 + S3 + S4 + S5 S1*M1(i) + S2*M2(i) + S3*M3(i) + S4*M4(i) + S5*M5(i) 未知レシピ マスターレシピ マスターレシピ マスターレシピ マスターレシピ マスターレシピ 9
  11. 11. 評価実験のまとめ 10 これまでに行った5種類のメタデータ自動付与方式により 付与されたメタデータの妥当性は十分高いとはいえない. からだ,こころ,味,時間,お金,アレンジの 各軸の特徴を,一つのベクトルで表すのは無理がある. 軸ごとの特徴量を個別に抽出!
  12. 12. 軸ごとに特徴量を抽出 からだ こころ 味 時間 お金 アレンジ ○○ハンバーグ お弁当にぴったり・・・ パパッとできる・・・・ お疲れ レシピ 元気 シクシク ウキウキ お疲れ 元気 お手軽 本格 安く 豪華に 定番 アレンジ
  13. 13. 軸の再検討 時間とからだの相関 0.55 時間とお金の相関 0.70 時間とアレンジの相関 0.35 味とからだの相関 0.76 味と時間の相関 0.68 味とお金の相関 0.65 味とアレンジの相関 0.25 お金とからだの相関 0.70 お金とアレンジの相関 0.38 アレンジとからだの相関 0.14 「こころ」と「味」は, 相関が高い こころとからだの相関 0.81 こころと味の相関 0.95 こころと時間の相関 0.63 こころとお金の相関 0.71 こころとアレンジの相関 0.23 味軸に統合 6軸間の相関をとり,その妥当性を確認した. 12
  14. 14. 「味」軸の特徴を考慮したレシピ特徴抽出 13 レシピ中の「あっさり(-5)」 「(+5)こってり」 材料,調味料,調理手順で判別することができる お酢,塩,茹でる,… あっさり度の高いレシピと,こってり度の高いレシピ数件を 形態素解析し,特徴語をレシピベクトルとして採用する. あっさり度の高いレシピ こってり度の高いレシピ 特徴語抽出 特徴語抽出 「あっさり」を表す特徴語 肉汁,油,炒める,… 「こってり」を表す特徴語 レシピ レシピ
  15. 15. レシピ中の「お疲れ(-5)」 「(+5)元気」 材料,調味料,調理手順で判別することができる 「からだ」軸の特徴を考慮したレシピ特徴抽出 14 お酢,ガーリック,薬膳,… お疲れ度の高いレシピと,元気度の高いレシピ数件を 形態素解析し,特徴語をレシピベクトルとして採用する. お疲れ度の高いレシピ 元気度の高いレシピ 特徴語抽出 特徴語抽出 「お疲れ」を表す特徴語 肉汁,ステーキ,焼く,… 「元気」を表す特徴語 レシピ レシピ
  16. 16. 調理動作辞書を作成し,時間のかかり具合を算出. この時,動詞の数も考慮する. 切る 時間がかかる 蒸す 時間がかからない お手軽度を 高くする 本格度を 高くする 15 「時間」軸の特徴を考慮したレシピ特徴抽出
  17. 17. 材料毎の平均値段表を作成 ステーキ:369円/100g キャベツ:93円/1玉 さんま:125円/1匹 「食品統計」のようなデータを用い、1食あたりの 金額を算出する。 算出された値段を正規化し,-5〜5のデータ値と、 合計金額で出力する。 16 「お金」軸の特徴を考慮したレシピ特徴抽出
  18. 18. 17 未知レシピ 入力された未知レシピと同名のレシピを検索し, そのレシピに頻出する名詞と動詞を取得する. それを定番メニューとして,Edit Distanceにもとづいて アレンジ度を算出する. ②アレンジ度の算出 「アレンジ」軸の特徴を考慮したレシピ特徴抽出 レシピ レシピ レシピ レシピ 同名のレシピ ①動詞,名詞を抽出
  19. 19. まとめ 18 マスターレシピとの類似度分析に基づく未知 レシピへのメタデータ自動付与方式の提案 – 6軸(からだ,こころ,味,時間,お金,アレンジ) ごとに,特徴を調査 – 各軸の特徴を考慮したレシピ特徴ベクトルの抽 出方式を検討 今後の課題 – 評価実験を行い,提案方式の有効性を検証

×