SlideShare uma empresa Scribd logo
1 de 44
1
Face Alignment at 3000 FPS
via Regressing Local Binary
Features
解説者
東京大学 佐藤洋一研究室
博士1年 tackson某
関東CV勉強会 2014年8月2日
CVPR 2014論文紹介
2
発表者プロフィール
• 略歴
– 東京高専から東大工学部に2年次編入
– 学部:セグメンテーション @ 東大 苗村研
– 修士:ステレオ @ 東大 苗村研(MSRAインターン)
– 博士:3次元復元 @ 東大 佐藤洋一研
• 興味のある分野
– 3次元形状復元・ステレオ
– MRF最適化・グラフカット
– セグメンテーション
• Twitterアカウント
3
Face Alignment at 3000 FPS
via Regressing Local Binary
Features
Shaoqing Ren Xudong Cao Yichen Wei Jian Sun
中国科学技術大学
(インターン生)
MSRAのVisual Computingグループ研究者
(Associate/Lead/Principal Researcher)
指導教員が入っていないのが気になる
現地では筆頭不在でWei氏がオーラル発表
4
Face Alignmentとは
事前に定義された
顔のlandmarksの
位置の推定
提案手法:最高精度&最高速度(3000 fps)
5
本研究の位置づけ
Active Shape Model [BMVC ’92]
Optimizationベース
・エネルギー関数を最小化
・”wild“環境で低性能
Regressionベース
ベストな形状更新を
直接予測
Active Appearance Model [ECCV ’98, PAMI ’01]
Cascaded Regression [CVPR ‘10]
Explicit Shape Regression [CVPR ‘12]
3000 FPS via Local Binary Features [CVPR ‘14]
(See [Cao+ CVPR ‘12] & [Burgos-Artizzu+ ICCV ‘13] for more discussions)
Under Occlusion [ICCV ‘13]
6
提案手法の特徴
■ 従来手法と同じ
• Regressionベース
• Cascaded Regression Framework
• Shape-Indexed Feature
• Ensemble Regression(Random Forest)
■ 提案ポイント
• Local Binary Feature
• Local FeatureをGlobalにRegression
• 3000 FPSの秘訣
7
提案手法の特徴
■ 従来手法と同じ
• Regressionベース
• Cascaded Regression Framework
• Shape-Indexed Feature
• Ensemble Regression(Random Forest)
■ 提案ポイント
• Local Binary Feature
• Local FeatureをGlobalにRegression
• 3000 FPSの秘訣
8
Face Alignment via Regression (学習)
min
𝑅
𝑖
𝑆𝑖
∗
− 𝑆𝑖
0
+ 𝑅 𝐼𝑖, 𝑆𝑖
0
最適な変位量関数𝑹を様々なパターンで学習
今の形状正解形状 変位量関数
学
習
用
デ
ー
タ
… …
𝑖 = 1 𝑖 = 𝑁training image 𝐼𝑖
9
Face Alignment via Regression (テスト)
画像・形状ペアから直接 変位量を予測
更新後の形状𝑆1
𝑆1 = 𝑆0 + 𝑅 𝐼, 𝑆0
テ
ス
ト
デ
ー
タ
training image 𝐼𝑖
入力:画像𝐼と初期形状𝑆0
10
1回の更新だけじゃ
あんまりうまくいかないのかな
11
提案手法の特徴
■ 従来手法と同じ
• Regressionベース
• Cascaded Regression Framework
• Shape-Indexed Feature
• Ensemble Regression(Random Forest)
■ 提案ポイント
• Local Binary Feature
• Local FeatureをGlobalにRegression
• 3000 FPSの秘訣
12Cascaded Regression [Dollar+ CVPR
‘10]
training images 𝑖
training images 𝑖
ステージごとに段階的に変位量𝑹 𝒕
を学習
𝑅 𝑡
を学習
𝑅 𝑡で形状更新
𝑅 𝑡+1を学習
13Cascaded Regression [Dollar+ CVPR
‘10]
𝑺 𝐟𝐢𝐧𝐚𝐥
= 𝑺 𝟎
+ 𝑹 𝟏
+ 𝑹 𝟐
+ ⋯ + 𝑹 𝑻
𝑺 𝟎
𝑺 𝟏
𝑺 𝑻
⋯
coarse fine
coarse-to-fineな変形列を自然に生成 [Cao+ CVPR ‘12]
14
全体像はわかったけど
具体的な学習方法の
イメージがわかないゾ
𝑹 𝑰, 𝑺 の学習 ??
15
提案手法の特徴
■ 従来手法と同じ
• Regressionベース
• Cascaded Regression Framework
• Shape-Indexed Feature
• Ensemble Regression(Random Forest)
■ 提案ポイント
• Local Binary Feature
• Local FeatureをGlobalにRegression
• 3000 FPSの秘訣
16Shape-Indexed Feature [Fleuret+ JMLR
‘08]
𝑅 𝐼, 𝑆 = Δ𝑆
形状正解形状 変位量関数
𝑅 = argmin
𝑅
𝑖
(𝑆𝑖
∗
− 𝑆𝑖) − 𝑅 𝐼𝑖, 𝑆𝑖
画像と今の形状 正解への変位
マッピングの学習
𝑟 𝑓 𝐼, 𝑆 = Δ𝑆
要するに
Shape-Indexed Feature:
今の形状に相対的な画像特徴量
正確には特徴量と変位のマッピング
17Shape-Indexed Feature [Fleuret+ JMLR
‘08]
つまり 形状に相対的な座標上での画像特徴抽出
 絶対座標
 形状中心から
の相対座標
Pose-variationになるべくinvariantに特徴抽出
一番近いlandmark
からの相対座標
[Cao+ CVPR ‘12]
2つのlandmarks
の線形結合座標
[B-A+ ICCV ‘13]
18Shape-Indexed Feature [Fleuret+ JMLR
‘08]
実際の特徴量は pixel-difference features
2画素(p, q) の輝度値の差
𝑓 𝐼, 𝑆 =
𝐼 𝑝1
− 𝐼 𝑞1
𝐼 𝑝2
− 𝐼 𝑞2
𝐼 𝑝3
− 𝐼 𝑞3
⋮
𝐼 𝑝 𝑛
− 𝐼 𝑞 𝑛
画素ペア集合
サンプル点(p, q) はうまいこといい感じに選ぶ [Cao+ CVPR ‘12]
19
あとは特徴量 𝒇 𝑰, 𝑺 と
変位量𝜟𝑺の対応関係
𝒓 𝒕
𝒇 𝑰, 𝑺 = 𝚫𝑺
を学習すればいいんだね!
まさに回帰問題だね!
20
提案手法の特徴
■ 従来手法と同じ
• Regressionベース
• Cascaded Regression Framework
• Shape-Indexed Feature
• Ensemble Regression (Random Forest)
■ 提案ポイント
• Local Binary Feature
• Local FeatureをGlobalにRegression
• 3000 FPSの秘訣
21
Ensemble Regression (Random Forest)
Δ𝑆1
Δ𝑆4
Δ𝑆2 Δ𝑆3 Δ𝑆6
Δ𝑆 𝑁
Δ𝑆2
Δ𝑆9
Δ𝑆7 Δ𝑆3 Δ𝑆1
Δ𝑆4
𝑓1
𝑓1
Δ𝑆1
Δ𝑆4
Δ𝑆7 Δ𝑆8 Δ𝑆2
Δ𝑆 𝑁
𝑓1, Δ𝑆1 , 𝑓2, Δ𝑆2 , 𝑓3, Δ𝑆3 , 𝑓4, Δ𝑆4 , …, 𝑓𝑁, Δ𝑆 𝑁
学習
データ
subset
で学習
subset
で学習
subset
で学習
22
Ensemble Regression (Random Forest)
Δ𝑆1
Δ𝑆4
Δ𝑆2 Δ𝑆3 Δ𝑆6
Δ𝑆 𝑁
Δ𝑆2
Δ𝑆9
Δ𝑆7 Δ𝑆3 Δ𝑆1
Δ𝑆4
𝑓1
𝑓1
Δ𝑆1
Δ𝑆4
Δ𝑆7 Δ𝑆8 Δ𝑆2
Δ𝑆 𝑁
𝑓1, Δ𝑆1 , 𝑓2, Δ𝑆2 , 𝑓3, Δ𝑆3 , 𝑓4, Δ𝑆4 , …, 𝑓𝑁, Δ𝑆 𝑁
学習
データ
subset
で学習
subset
で学習
subset
で学習
テストデータ 𝒕 の回帰予測
r 𝒕 = 𝑚𝑒𝑎𝑛 Δ𝑆2, Δ𝑆2, Δ𝑆 𝑁, Δ𝑆2, Δ𝑆9
𝒕
𝒕
𝒕
𝒕
𝒕
𝒕
※ これを直接使うと[Cao+ CVPR ‘12]とほぼ同じアプローチ
23
これでベースラインは
カンペキだね☆
24
提案手法の特徴
■ 従来手法と同じ
• Regressionベース
• Cascaded Regression Framework
• Shape-Indexed Feature
• Ensemble Regression (Random Forest)
■ 提案ポイント
• Local Binary Feature
• Local FeatureをGlobalにRegression
• 3000 FPSの秘訣
25
Global Regression vs Local Regression
 landmark同士の相互作用やcontextを考慮できる
 その利点を生かしきれない現実面での事情
(学習データ不足・学習時間・学習手法の性能)
全landmark同時の回帰学習 [Cao+ CVPR ‘12]
Landmarkごとの個別の回帰学習
26
Local Binary Feature
Δ𝑆1
Δ𝑆4
Δ𝑆2 Δ𝑆3 Δ𝑆6
Δ𝑆 𝑁
Δ𝑆2
Δ𝑆9
Δ𝑆7 Δ𝑆3 Δ𝑆1
Δ𝑆4
Δ𝑆1
Δ𝑆4
Δ𝑆7 Δ𝑆8 Δ𝑆2
Δ𝑆 𝑁
𝒕
𝒕
𝒕
𝒕
𝒕
𝒕
Landmark周辺の
Shape-Indexed Featureで回帰学習
ローカルな回帰予測は精度が低いので捨てる (!)
Binary Features
1 0 0 0 0 0 0 1 0 1 0 0
27
提案手法の特徴
■ 従来手法と同じ
• Regressionベース
• Cascaded Regression Framework
• Shape-Indexed Feature
• Ensemble Regression (Random Forest)
■ 提案ポイント
• Local Binary Feature
• Local FeatureをGlobalにRegression
• 3000 FPSの秘訣
28Local Binary Features の Global
Regression
0 0 1 0 0 … 0
0 1 0 0 0 … 1
Local Binary Features
…
0…00…1 0…0 0…0
全Landmarkの
Binary Featureを結合
min
𝑊
𝑖
𝑺𝒊
∗
− 𝑺𝒊 + 𝑊𝝓𝒊 2
2
+ 𝑊 2
2
今の形状正解形状
1 0 0 0 0 … 0
全landmarkの特徴量を使ったGlobal回帰学習
(Local回帰→ Global回帰の2段階回帰)
 あるLandmarkが遮蔽されてても他が助けてくれる
over-fitting回避
29
こ れ で よ う や く
回 帰 の 学 習 部 分 の
話 は お し ま い ☆
次 は 実 行 時 の 話
30
提案手法の特徴
■ 従来手法と同じ
• Regressionベース
• Cascaded Regression Framework
• Shape-Indexed Feature
• Ensemble Regression (Random Forest)
■ 提案ポイント
• Local Binary Feature
• Local FeatureをGlobalにRegression
• 3000 FPSの秘訣
31
実行時の動作:3000FPSの秘訣
とってもスパース
𝚫𝑺 = 𝑊𝝓
形状更新の予測
0 0 1 0 0 … 0
0 1 0 0 0 … 1
…
1 0 0 0 0 … 0
Treeだからとっても速い
テストデータ
 とっても高速な積計算
𝝓 が1になるところだけ
𝑊の列ベクトルを参照して
加算するだけで良い
32
実験
33
3つのデータセットで評価
ESR [Cao+ CVPR’ 12]
同著者らの手法
グローバル回帰
SDM [Xiong+ CVPR ’13]
Supervisedな勾配法
LBF手法は精度も速度も state-of-the-art
※ LFPWデータセット
人力で3.28
34
難しいデータセット(300-W)の結果
35
提案手法がSDMとESRに勝ってるケース
36
失敗例
37
Global学習 vs Local 学習
Local学習のほうがより良い特徴抽出できる
38
Global回帰するときの特徴量
Binary特徴は学習結果の完全な情報を保持
Δ𝑆1
Δ𝑆4
Δ𝑆2 Δ𝑆3 Δ𝑆6
Δ𝑆 𝑁
Δ𝑆2
Δ𝑆9
Δ𝑆7 Δ𝑆3 Δ𝑆1
Δ𝑆4
Δ𝑆1
Δ𝑆4
Δ𝑆7 Δ𝑆8 Δ𝑆2
Δ𝑆 𝑁
𝑚𝑒𝑎𝑛 Δ𝑆2, Δ𝑆2, Δ𝑆 𝑁, Δ𝑆2, Δ𝑆9
vs
0 0 0 11 0 0 0 0 1 0 0
39
デモ動画
40
実際のデモ
昨晩実装したものをお見せします
41
42
参考文献
• 今回の論文
Shaoqing Ren, Xudong Cao, Yichen Wei, Jian Sun, Face Alignment at
3000 FPS via Regressing Local Binary Features (CVPR 2014).
• Cascaded Regressionの論文(今回のアプローチの大元??)
Piotr Dollár, Peter Welinder, Pietro Perona, Cascaded Pose Regression
(CVPR 2010).
• 今回の論文と同じ著者グループ(実質のベースライン。ただし
Random Forestではなく別の方法でEnsemble Regressionしてる)
Xudong Cao, Yichen Wei, Fang Wen, Jian Sun, Face Alignment by
Explicit Shape Regression (CVPR 2012).
• 上論文に対してocclusionを考慮(そこまで大きな改善ではない)
Xavier P. Burgos-Artizzu, Pietro Perona, Piotr Dollar, Robust face
landmark estimation under occlusion (ICCV 2013).
43
おことわり
スライドに使われた画像は
ネット上の画像群から無作為に抽出されたもので
発表者個人の趣向を代表するものではありません
44
THANK YOU 
本日の発表内容は
• Face Alignment
• Regressionアプローチ
– Cascaded Regression
– Shape-Indexed Feature
– Ensemble Regression
• 提案手法
– Local Binary Feature
– Local FeatureのGlobal Regression
でした

Mais conteúdo relacionado

Mais procurados

今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン
Shinya Shimizu
 
はじめてのパターン認識 第5章 k最近傍法(k_nn法)
はじめてのパターン認識 第5章 k最近傍法(k_nn法)はじめてのパターン認識 第5章 k最近傍法(k_nn法)
はじめてのパターン認識 第5章 k最近傍法(k_nn法)
Motoya Wakiyama
 

Mais procurados (20)

MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチMIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
 
Sift特徴量について
Sift特徴量についてSift特徴量について
Sift特徴量について
 
【DL輪読会】Segment Anything
【DL輪読会】Segment Anything【DL輪読会】Segment Anything
【DL輪読会】Segment Anything
 
非参照型メトリクスを用いた放射線動画の評価
非参照型メトリクスを用いた放射線動画の評価非参照型メトリクスを用いた放射線動画の評価
非参照型メトリクスを用いた放射線動画の評価
 
深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎深層学習によるHuman Pose Estimationの基礎
深層学習によるHuman Pose Estimationの基礎
 
Deep Learningと画像認識   ~歴史・理論・実践~
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~
 
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法についてSfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法について
 
今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン今さら聞けないカーネル法とサポートベクターマシン
今さら聞けないカーネル法とサポートベクターマシン
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)
 
動画像を用いた経路予測手法の分類
動画像を用いた経路予測手法の分類動画像を用いた経路予測手法の分類
動画像を用いた経路予測手法の分類
 
【CVPR 2019】DeepSDF: Learning Continuous Signed Distance Functions for Shape R...
【CVPR 2019】DeepSDF: Learning Continuous Signed Distance Functions for Shape R...【CVPR 2019】DeepSDF: Learning Continuous Signed Distance Functions for Shape R...
【CVPR 2019】DeepSDF: Learning Continuous Signed Distance Functions for Shape R...
 
【ECCV 2022】NeDDF: Reciprocally Constrained Field for Distance and Density
【ECCV 2022】NeDDF: Reciprocally Constrained Field for Distance and Density【ECCV 2022】NeDDF: Reciprocally Constrained Field for Distance and Density
【ECCV 2022】NeDDF: Reciprocally Constrained Field for Distance and Density
 
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
 
Lucas kanade法について
Lucas kanade法についてLucas kanade法について
Lucas kanade法について
 
はじめてのパターン認識 第5章 k最近傍法(k_nn法)
はじめてのパターン認識 第5章 k最近傍法(k_nn法)はじめてのパターン認識 第5章 k最近傍法(k_nn法)
はじめてのパターン認識 第5章 k最近傍法(k_nn法)
 
動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット
 
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度
 
MLaPP 4章 「ガウシアンモデル」
MLaPP 4章 「ガウシアンモデル」MLaPP 4章 「ガウシアンモデル」
MLaPP 4章 「ガウシアンモデル」
 
4 データ間の距離と類似度
4 データ間の距離と類似度4 データ間の距離と類似度
4 データ間の距離と類似度
 
顕著性マップの推定手法
顕著性マップの推定手法顕著性マップの推定手法
顕著性マップの推定手法
 

Semelhante a 関東CV勉強会20140802(Face Alignment at 3000fps)

Light weightbinocular sigasia2012_face
Light weightbinocular sigasia2012_faceLight weightbinocular sigasia2012_face
Light weightbinocular sigasia2012_face
ishii yasunori
 
SSII2014 チュートリアル資料
SSII2014 チュートリアル資料SSII2014 チュートリアル資料
SSII2014 チュートリアル資料
Masayuki Tanaka
 
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
kanejaki
 
Or seminar2011final
Or seminar2011finalOr seminar2011final
Or seminar2011final
Mikio Kubo
 

Semelhante a 関東CV勉強会20140802(Face Alignment at 3000fps) (20)

SLAMチュートリアル大会資料(ORB-SLAM)
SLAMチュートリアル大会資料(ORB-SLAM)SLAMチュートリアル大会資料(ORB-SLAM)
SLAMチュートリアル大会資料(ORB-SLAM)
 
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
論文紹介「PointNetLK: Robust & Efficient Point Cloud Registration Using PointNet」
 
SLAM勉強会(PTAM)
SLAM勉強会(PTAM)SLAM勉強会(PTAM)
SLAM勉強会(PTAM)
 
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東) BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
 
Direct Sparse Odometryの解説
Direct Sparse Odometryの解説Direct Sparse Odometryの解説
Direct Sparse Odometryの解説
 
ICCV2019読み会「Learning Meshes for Dense Visual SLAM」
ICCV2019読み会「Learning Meshes for Dense Visual SLAM」ICCV2019読み会「Learning Meshes for Dense Visual SLAM」
ICCV2019読み会「Learning Meshes for Dense Visual SLAM」
 
Light weightbinocular sigasia2012_face
Light weightbinocular sigasia2012_faceLight weightbinocular sigasia2012_face
Light weightbinocular sigasia2012_face
 
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
Soft Rasterizer: A Differentiable Renderer for Image-based 3D ReasoningSoft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
 
点群深層学習 Meta-study
点群深層学習 Meta-study点群深層学習 Meta-study
点群深層学習 Meta-study
 
SSII2014 チュートリアル資料
SSII2014 チュートリアル資料SSII2014 チュートリアル資料
SSII2014 チュートリアル資料
 
確率モデルを用いた3D点群レジストレーション
確率モデルを用いた3D点群レジストレーション確率モデルを用いた3D点群レジストレーション
確率モデルを用いた3D点群レジストレーション
 
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)
 
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
CEDEC 2007 ゲーム開発者向け最新技術論文の解説・実装講座
 
Or seminar2011final
Or seminar2011finalOr seminar2011final
Or seminar2011final
 
グラフデータの機械学習における特徴表現の設計と学習
グラフデータの機械学習における特徴表現の設計と学習グラフデータの機械学習における特徴表現の設計と学習
グラフデータの機械学習における特徴表現の設計と学習
 
関数データ解析の概要とその方法
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法
 
ICCV2011 report
ICCV2011 reportICCV2011 report
ICCV2011 report
 
関東コンピュータビジョン勉強会
関東コンピュータビジョン勉強会関東コンピュータビジョン勉強会
関東コンピュータビジョン勉強会
 
20170806 Discriminative Optimization
20170806 Discriminative Optimization20170806 Discriminative Optimization
20170806 Discriminative Optimization
 

関東CV勉強会20140802(Face Alignment at 3000fps)