SlideShare a Scribd company logo
1 of 25
AIL 最終発表会
2017/1/21(土) チーム: taose-deeplearning
三浦笑峰(smilenannan) 松島達也(Tmats)
釘島昌史(Kxxxxxxxx) 次田叡令(tsugitta)
久保静真(kuboshizuma)
1
プロジェクト概要
2
プロジェクト
CookWhat
野菜を撮影するだけで、その野菜を使った
レシピを提案してくれるアプリケーション
3
プロジェクトの目的
一人暮らしの大学生は献立を考えるのは大変
1. 一人分だと食材が余ってしまう
2. 献立考えるが面倒くさい
写真を撮るだけで余った食材を使った
レシピを提案してくれる
4
アプリケーションの意義
普段から料理をする人は42%、自炊したい人は82%
自炊をもっと手軽にしたい
( http://lab.oceanize.co.jp/cooking/ ) 5
デモ
6
デモ
デモを行います
7
8
アプリケーション構成
9
アプリケーション全体像
レシピの取得
画像から食材
の認識
食材を指定して
レシピのリクエスト
画像認識API
レシピAPIiOSクライアント
10
iOSクライアント
• 一切の無駄を排除し、直感的かつ最短の操作で最適なレ
シピに巡り会える
• オレンジを基調とした、どこか馴染みのある色合いによ
り、利用者の生活にすんなりと溶け込むことが可能に
11
レシピAPI
• 材料からレシピをレコメンドするAPIが公開されていな
かったため、自作。
• 楽天のレシピAPIからレシピのデータだけは集められた
ので、レシピのDBを構築。(レシピ数約5,000件)
• 食材を入力すると、その食材を使ったレシピを出力する。
12
画像認識API
• iOSで撮影した画像に写っている野菜を検出して
その野菜の名前を出力するAPI
→1枚に複数の野菜が写っていても対応
• 物体の検出と
検出した物体がどの野菜かを識別
13
画像処理・認識
14
画像認識の仕組み
検出
識別
人参
ピーマン
トマト
流れ
15
画像認識の仕組み
検出
トマト
人参? トマト?
16
画像認識の仕組み
検出
検出プロセス
17
画像認識の仕組み
検出
➡食材の大きさによらず検出できる
18
画像認識の仕組み
検出
切り出した画像
検出用
CNN
2クラス分類
食材or食材以外
19
画像認識の仕組み
検出
検出結果
20
画像認識の仕組み
検出
検出された画像
識別用
CNN
多クラス分類
ピーマンor玉ねぎor...
21
工夫点
• ノイズに強い物体検出
検出されない
22
工夫点
• ノイズに強い物体検出
– 今回の物体検出の工夫
• 訓練データを1から作成させることで性能を向上
• 食材以外を食材として認識しない
– 一般的な物体を検出するアルゴリズム
• 食材以外も認識してしまい、識別性能を落とす
23
今後の課題
• データの拡張
– 現実に近い写真の追加
• アンサンブル
– 複数の識別器を用いた分類
➡ロバスト性の向上
24
おわり
25

More Related Content

What's hot

Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Hideki Tsunashima
 

What's hot (20)

【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models
 
Superpixel Sampling Networks
Superpixel Sampling NetworksSuperpixel Sampling Networks
Superpixel Sampling Networks
 
[DL Hacks]Visdomを使ったデータ可視化
[DL Hacks]Visdomを使ったデータ可視化[DL Hacks]Visdomを使ったデータ可視化
[DL Hacks]Visdomを使ったデータ可視化
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
【論文読み会】BEiT_BERT Pre-Training of Image Transformers.pptx
 
MLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for VisionMLP-Mixer: An all-MLP Architecture for Vision
MLP-Mixer: An all-MLP Architecture for Vision
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)
 
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
 
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
 
Neural scene representation and rendering の解説(第3回3D勉強会@関東)
Neural scene representation and rendering の解説(第3回3D勉強会@関東)Neural scene representation and rendering の解説(第3回3D勉強会@関東)
Neural scene representation and rendering の解説(第3回3D勉強会@関東)
 
実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE
 
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
 
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
 
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
 
Layer Normalization@NIPS+読み会・関西
Layer Normalization@NIPS+読み会・関西Layer Normalization@NIPS+読み会・関西
Layer Normalization@NIPS+読み会・関西
 
【DL輪読会】Flow Matching for Generative Modeling
【DL輪読会】Flow Matching for Generative Modeling【DL輪読会】Flow Matching for Generative Modeling
【DL輪読会】Flow Matching for Generative Modeling
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)
 
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
Disentanglement Survey:Can You Explain How Much Are Generative models Disenta...
 
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
20180115_東大医学部機能生物学セミナー_深層学習の最前線とこれから_岡野原大輔
 

CookWhat - 食材画像からのレシピ提案-