SlideShare a Scribd company logo
1 of 22
Download to read offline
Introduction
Object Proposal Methods
Conclusions
Fast Object Proposal Methods
BING & Edge Boxes
山中高夫
情報理工学科
上智大学
文献紹介
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
文献リスト: Fast Object Proposal Methods
[1] J. Hosang, R. Benenson, and B. Schiele, “How good are
detection proposals, really?,” British Machine Vision Conference,
2014.
[2] M.-M. Cheng, Z. Zhang, W.-Y. Lin, and P. Torr, “BING:
Binarized Normed Gradients for Objectness Estimation at 300fps,”
IEEE Conference on Computer Vision and Pattern Recognition,
2014.
[3] Q. Zhao, Z. Liu, and B. Yin, “Cracking BING and Beyond,”
British Machine Vision Conference, 2014.
[4] C. L. Zitnick and P. Dollar, “Edge Boxes: Locating Object
Proposals from Edges,” European Conference on Computer Vision,
2014.
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
Object Proposal
背景
画像中の物体が存在しそうな場所を box として複数提案する
(1,000∼10,000 boxes 程度)
できる限り少ない提案 Box 数で画像中に存在する全ての物体
をカバーするように Box を提案する手法が望ましい
応用例として,物体検出の前処理があげられ,Sliding Window
で多数の窓を調べる代わりに,Object Proposal で提案された
Box だけ調べることで効率的に物体を検出できる
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
本発表の目的
目的
Object Proposal Methods の中で
も,リアルタイム処理に適した
BING[Cheng, CVPR2014] と
Edge Boxes[Zitnick, ECCV2014]
の手法を紹介する
adapted from [Hosang, BMVC2014]
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Contents
1 Object Proposal Methods
BING: Binarized Normed Gradients
Edge Boxes
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
BING の概要
画像を様々なサイズ・アスペクト比に変換して勾配振幅を計算
→ 8x8 画素の Box の値が対応する Window の 64 次元勾配特徴
量(NG Feature, gl)
フィルタースコア sl = w · gl
Objectness スコア ol = vi · sl + ti(i は Window のサイズ)
Non-Maximal Suppression (NMS) で重複する Window を除去
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
BING: 学習方法
Objectness スコアの計算式
sl = w · gl
ol = vi · sl + ti
Stage 1: w の学習
線形 SVM を使用する。真の Object Window を Positive デー
タ,ランダムにサンプリングした背景の Window を Negative
データに設定して学習する。
Stage 2: vi, ti の学習
線形 SVM を使用する。学習画像の全 Box に対して,フィル
タースコア sl を計算し,NMS で選択された Box を真の Object
Window からラベリングし,線形 SVM の学習データとする。
学習は画像サイズ i ごとに行う。
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
BING: フィルタ係数の二値化
w の二値化
w ≈ ∑
Nw
j=1 βjaj (aj ∈ {−1, 1}64, βj ∈ ℜ)
aj = a+
j − a+
j (a+
j ∈ {0, 1}64)
b ∈ {0, 1}64 とすると,w · b ≈ ∑
Nw
j=1 βj(2a+
j · b − |b|)
[28] Hare, Saffari & Torr, "Efficient online structured output learning for
keypoint-based object tracking," CVPR2012
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
BING: 勾配特徴量の二値化
勾配特徴量 gl の二値化
gl が 8 ビットで表現されているとして,上位 Ng ビットで近似
する
gl ≈ ∑
Ng
k=1 28−kbk,l (bk,l は 64 次元のバイナリ特徴量)
フィルタスコア sl = w · gl ≈ ∑
Nw
j=1 βj ∑
Ng
k=1 Cj,k
ただし,Cj,k = 28−k(2a+
j · bk,l − |bk,l|)
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
BING: 評価結果
検出 Window の正誤判定基準
バイナリ基底ベクトル数: Nw = 2
勾配特徴量二値化時のビット数: Ng = 4
正誤判定基準: IoU = 0.5
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
BING: 検出例
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Contents
1 Object Proposal Methods
BING: Binarized Normed Gradients
Edge Boxes
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes の概要
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 手法 (1)
Edge Groups & Affinities
与えられた画像の各画素 p に対してエッジ検出を行い,各画素
に主方向 θp とエッジ強度 mp を割り当てる。計算を効率的に
するため,mp > 0.1 の画素をエッジとする。(Fig.1 2 段目)
8 近傍のエッジを連結し,主方向差の和が π/2 になるまで
エッジをグループ化する。(Fig.1 3 段目)
2 つのエッジグループ si, sj 間の affinity を以下の式で計算
する。
a(si, sj) = | cos(θi − θij) cos(θj − θij)|γ
ただし,
θi, θj: それぞれ si, sj の主方向
θij: si, sj の平均位置間の方向
γ: 感度を調節するパラメータ(γ = 2)
2 画素以上離れているエッジグループ間の affinity は 0 とする。
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 手法 (2)
wb(si) の計算
Bounding Box b に対して,その中に含まれる全てのエッジグ
ループ si に wb(si) ∈ [0, 1] を割り当てる。
- si が Bounding Box に完全に含まれる場合 · · · wb(si) = 1
- 外にある場合や境界につながっている場合 · · · wb(si) = 0
境界につながっているエッジグループの集合を Sb とし,
si ∈ Sb のエッジに対して wb(si) = 0 に設定する。
それ以外の si に対して,以下の式で wb(si) を計算する。
wb(si) = 1 − maxT ∏
|T|−1
j a(tj, tj+1)
ただし,t1 ∈ Sb, t|T| = si
つまり,上式は si から境界までの最大 affinity になる経路で計
算する。
境界につながる経路がない場合は wb(si) = 1 である。
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 手法 (3)
Bounding Box Scoring
Bounding Box の Objectness Score を以下の式で計算する。
hb =
∑i wb(si)mi
2(bw + bh)κ
ただし,
mi: エッジグループ si に含む全てのエッジ強度 mp の和
bw, bh: Bounding Box の幅と高さ
κ: パラメータ (κ = 1.5)
Bounding Box 中央のエッジは境界に近いエッジより重要性が
低いことを考慮する。
hin
b = hb −
∑p∈bin mp
2(bw + bh)κ
ただし,bin は内側の領域を表す(bw/2, bh/2 の領域)
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 手法 (4)
Search Strategy
Bounding Box の候補は,位置,スケール,アスペクト比に対
する Sliding Window で設定する。
ステップサイズは隣の Window との重なりが IoU = α となる
ように設定する。
- スケールの範囲: σ = 1000 画素∼画像全体
- アスペクト比の範囲: 1/τ ∼ τ (τ = 3)
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 手法 (5)
Refinement
全ての Sliding Window に対する Objectness Score を計算後,
hin
b が閾値以上の Box に対して,位置を再調整 (refinement)
する。
位置の再調整では,閾値以上の Box の周辺の位置,スケール,
アスペクト比を網羅的に調べて最大となる Box を検出する。
位置再調整後,Non-Maximal Suppression (NMS) により IoU
が β 以上の Box を除去する。
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 評価結果(パラメータに対する変化)
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 評価結果(提案数と IoU に対する変化)
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
BING: Binarized Normed Gradients
Edge Boxes
Edge Boxes: 検出例
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
Introduction
Object Proposal Methods
Conclusions
まとめ
Object Proposal は,物体検出などより
複雑な認識処理の前処理として使用さ
れることが想定されているので,でき
る限り高速な処理が望まれる
BING や Edge Boxes は非常に高速な処
理が可能であり,1 枚の処理にかかる
時間は BING が 0.2s,Edge Boxes が
0.3s である
特に Edge Boxes は高速で精度も高い
ことが報告されている [Hosang,
BMVC2014] ので,様々なアプリケー
ションに応用が期待できる。 adapted from [Hosang,
BMVC2014]
2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods

More Related Content

What's hot

動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセットToru Tamaki
 
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習cvpaper. challenge
 
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View SynthesisDeep Learning JP
 
Mask-RCNNを用いたキャベツの結球認識
Mask-RCNNを用いたキャベツの結球認識Mask-RCNNを用いたキャベツの結球認識
Mask-RCNNを用いたキャベツの結球認識Masahiro Tsukano
 
[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習Deep Learning JP
 
CycleGANによる異種モダリティ画像生成を用いた股関節MRIの筋骨格セグメンテーション
CycleGANによる異種モダリティ画像生成を用いた股関節MRIの筋骨格セグメンテーションCycleGANによる異種モダリティ画像生成を用いた股関節MRIの筋骨格セグメンテーション
CycleGANによる異種モダリティ画像生成を用いた股関節MRIの筋骨格セグメンテーション奈良先端大 情報科学研究科
 
MixMatch: A Holistic Approach to Semi- Supervised Learning
MixMatch: A Holistic Approach to Semi- Supervised LearningMixMatch: A Holistic Approach to Semi- Supervised Learning
MixMatch: A Holistic Approach to Semi- Supervised Learningharmonylab
 
グラフニューラルネットワークとグラフ組合せ問題
グラフニューラルネットワークとグラフ組合せ問題グラフニューラルネットワークとグラフ組合せ問題
グラフニューラルネットワークとグラフ組合せ問題joisino
 
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)Takao Yamanaka
 
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative ModelDeep Learning JP
 
R-CNNの原理とここ数年の流れ
R-CNNの原理とここ数年の流れR-CNNの原理とここ数年の流れ
R-CNNの原理とここ数年の流れKazuki Motohashi
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成Yoshitaka Ushiku
 
初めてのグラフカット
初めてのグラフカット初めてのグラフカット
初めてのグラフカットTsubasa Hirakawa
 
Semi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learningSemi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learningYusuke Uchida
 
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)STAIR Lab, Chiba Institute of Technology
 
[DL輪読会]Object-Centric Learning with Slot Attention
[DL輪読会]Object-Centric Learning with Slot Attention[DL輪読会]Object-Centric Learning with Slot Attention
[DL輪読会]Object-Centric Learning with Slot AttentionDeep Learning JP
 
[DL輪読会]representation learning via invariant causal mechanisms
[DL輪読会]representation learning via invariant causal mechanisms[DL輪読会]representation learning via invariant causal mechanisms
[DL輪読会]representation learning via invariant causal mechanismsDeep Learning JP
 
Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩Hiroto Honda
 
[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object Detection[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object DetectionDeep Learning JP
 

What's hot (20)

動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット
 
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
 
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
 
Mask-RCNNを用いたキャベツの結球認識
Mask-RCNNを用いたキャベツの結球認識Mask-RCNNを用いたキャベツの結球認識
Mask-RCNNを用いたキャベツの結球認識
 
[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習[DL輪読会]相互情報量最大化による表現学習
[DL輪読会]相互情報量最大化による表現学習
 
CycleGANによる異種モダリティ画像生成を用いた股関節MRIの筋骨格セグメンテーション
CycleGANによる異種モダリティ画像生成を用いた股関節MRIの筋骨格セグメンテーションCycleGANによる異種モダリティ画像生成を用いた股関節MRIの筋骨格セグメンテーション
CycleGANによる異種モダリティ画像生成を用いた股関節MRIの筋骨格セグメンテーション
 
MixMatch: A Holistic Approach to Semi- Supervised Learning
MixMatch: A Holistic Approach to Semi- Supervised LearningMixMatch: A Holistic Approach to Semi- Supervised Learning
MixMatch: A Holistic Approach to Semi- Supervised Learning
 
グラフニューラルネットワークとグラフ組合せ問題
グラフニューラルネットワークとグラフ組合せ問題グラフニューラルネットワークとグラフ組合せ問題
グラフニューラルネットワークとグラフ組合せ問題
 
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
 
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
【DL輪読会】NeRF-VAE: A Geometry Aware 3D Scene Generative Model
 
R-CNNの原理とここ数年の流れ
R-CNNの原理とここ数年の流れR-CNNの原理とここ数年の流れ
R-CNNの原理とここ数年の流れ
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成
 
初めてのグラフカット
初めてのグラフカット初めてのグラフカット
初めてのグラフカット
 
Semi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learningSemi supervised, weakly-supervised, unsupervised, and active learning
Semi supervised, weakly-supervised, unsupervised, and active learning
 
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
画像キャプションと動作認識の最前線 〜データセットに注目して〜(第17回ステアラボ人工知能セミナー)
 
[DL輪読会]Object-Centric Learning with Slot Attention
[DL輪読会]Object-Centric Learning with Slot Attention[DL輪読会]Object-Centric Learning with Slot Attention
[DL輪読会]Object-Centric Learning with Slot Attention
 
[DL輪読会]representation learning via invariant causal mechanisms
[DL輪読会]representation learning via invariant causal mechanisms[DL輪読会]representation learning via invariant causal mechanisms
[DL輪読会]representation learning via invariant causal mechanisms
 
Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩Deep Learningによる超解像の進歩
Deep Learningによる超解像の進歩
 
[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object Detection[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object Detection
 

Viewers also liked

論文紹介: Fast R-CNN&Faster R-CNN
論文紹介: Fast R-CNN&Faster R-CNN論文紹介: Fast R-CNN&Faster R-CNN
論文紹介: Fast R-CNN&Faster R-CNNTakashi Abe
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標圭輔 大曽根
 
物体検出の話Up用
物体検出の話Up用物体検出の話Up用
物体検出の話Up用Takashi Abe
 
Deformable Part Modelとその発展
Deformable Part Modelとその発展Deformable Part Modelとその発展
Deformable Part Modelとその発展Takao Yamanaka
 
顕著性マップの推定手法
顕著性マップの推定手法顕著性マップの推定手法
顕著性マップの推定手法Takao Yamanaka
 
Objectnessとその周辺技術
Objectnessとその周辺技術Objectnessとその周辺技術
Objectnessとその周辺技術Takao Yamanaka
 
Fisher線形判別分析とFisher Weight Maps
Fisher線形判別分析とFisher Weight MapsFisher線形判別分析とFisher Weight Maps
Fisher線形判別分析とFisher Weight MapsTakao Yamanaka
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明Haruka Ozaki
 
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDBMasahiro Akita
 
KantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object RecognitionKantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object Recognitionbelltailjp
 
混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)Takao Yamanaka
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)Takanori Ogata
 

Viewers also liked (15)

論文紹介: Fast R-CNN&Faster R-CNN
論文紹介: Fast R-CNN&Faster R-CNN論文紹介: Fast R-CNN&Faster R-CNN
論文紹介: Fast R-CNN&Faster R-CNN
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
 
物体検出の話Up用
物体検出の話Up用物体検出の話Up用
物体検出の話Up用
 
20140131 R-CNN
20140131 R-CNN20140131 R-CNN
20140131 R-CNN
 
Deformable Part Modelとその発展
Deformable Part Modelとその発展Deformable Part Modelとその発展
Deformable Part Modelとその発展
 
顕著性マップの推定手法
顕著性マップの推定手法顕著性マップの推定手法
顕著性マップの推定手法
 
PRML 5.3-5.4
PRML 5.3-5.4PRML 5.3-5.4
PRML 5.3-5.4
 
PRML Chapter 5
PRML Chapter 5PRML Chapter 5
PRML Chapter 5
 
Objectnessとその周辺技術
Objectnessとその周辺技術Objectnessとその周辺技術
Objectnessとその周辺技術
 
Fisher線形判別分析とFisher Weight Maps
Fisher線形判別分析とFisher Weight MapsFisher線形判別分析とFisher Weight Maps
Fisher線形判別分析とFisher Weight Maps
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
 
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
日本最大の即レスサービス「アンサー」を支える Amazon DynamoDB
 
KantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object RecognitionKantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object Recognition
 
混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
 

高速な物体候補領域提案手法 (Fast Object Proposal Methods)

  • 1. Introduction Object Proposal Methods Conclusions Fast Object Proposal Methods BING & Edge Boxes 山中高夫 情報理工学科 上智大学 文献紹介 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 2. Introduction Object Proposal Methods Conclusions 文献リスト: Fast Object Proposal Methods [1] J. Hosang, R. Benenson, and B. Schiele, “How good are detection proposals, really?,” British Machine Vision Conference, 2014. [2] M.-M. Cheng, Z. Zhang, W.-Y. Lin, and P. Torr, “BING: Binarized Normed Gradients for Objectness Estimation at 300fps,” IEEE Conference on Computer Vision and Pattern Recognition, 2014. [3] Q. Zhao, Z. Liu, and B. Yin, “Cracking BING and Beyond,” British Machine Vision Conference, 2014. [4] C. L. Zitnick and P. Dollar, “Edge Boxes: Locating Object Proposals from Edges,” European Conference on Computer Vision, 2014. 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 3. Introduction Object Proposal Methods Conclusions Object Proposal 背景 画像中の物体が存在しそうな場所を box として複数提案する (1,000∼10,000 boxes 程度) できる限り少ない提案 Box 数で画像中に存在する全ての物体 をカバーするように Box を提案する手法が望ましい 応用例として,物体検出の前処理があげられ,Sliding Window で多数の窓を調べる代わりに,Object Proposal で提案された Box だけ調べることで効率的に物体を検出できる 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 4. Introduction Object Proposal Methods Conclusions 本発表の目的 目的 Object Proposal Methods の中で も,リアルタイム処理に適した BING[Cheng, CVPR2014] と Edge Boxes[Zitnick, ECCV2014] の手法を紹介する adapted from [Hosang, BMVC2014] 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 5. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Contents 1 Object Proposal Methods BING: Binarized Normed Gradients Edge Boxes 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 6. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes BING の概要 画像を様々なサイズ・アスペクト比に変換して勾配振幅を計算 → 8x8 画素の Box の値が対応する Window の 64 次元勾配特徴 量(NG Feature, gl) フィルタースコア sl = w · gl Objectness スコア ol = vi · sl + ti(i は Window のサイズ) Non-Maximal Suppression (NMS) で重複する Window を除去 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 7. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes BING: 学習方法 Objectness スコアの計算式 sl = w · gl ol = vi · sl + ti Stage 1: w の学習 線形 SVM を使用する。真の Object Window を Positive デー タ,ランダムにサンプリングした背景の Window を Negative データに設定して学習する。 Stage 2: vi, ti の学習 線形 SVM を使用する。学習画像の全 Box に対して,フィル タースコア sl を計算し,NMS で選択された Box を真の Object Window からラベリングし,線形 SVM の学習データとする。 学習は画像サイズ i ごとに行う。 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 8. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes BING: フィルタ係数の二値化 w の二値化 w ≈ ∑ Nw j=1 βjaj (aj ∈ {−1, 1}64, βj ∈ ℜ) aj = a+ j − a+ j (a+ j ∈ {0, 1}64) b ∈ {0, 1}64 とすると,w · b ≈ ∑ Nw j=1 βj(2a+ j · b − |b|) [28] Hare, Saffari & Torr, "Efficient online structured output learning for keypoint-based object tracking," CVPR2012 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 9. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes BING: 勾配特徴量の二値化 勾配特徴量 gl の二値化 gl が 8 ビットで表現されているとして,上位 Ng ビットで近似 する gl ≈ ∑ Ng k=1 28−kbk,l (bk,l は 64 次元のバイナリ特徴量) フィルタスコア sl = w · gl ≈ ∑ Nw j=1 βj ∑ Ng k=1 Cj,k ただし,Cj,k = 28−k(2a+ j · bk,l − |bk,l|) 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 10. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes BING: 評価結果 検出 Window の正誤判定基準 バイナリ基底ベクトル数: Nw = 2 勾配特徴量二値化時のビット数: Ng = 4 正誤判定基準: IoU = 0.5 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 11. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes BING: 検出例 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 12. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Contents 1 Object Proposal Methods BING: Binarized Normed Gradients Edge Boxes 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 13. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes の概要 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 14. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 手法 (1) Edge Groups & Affinities 与えられた画像の各画素 p に対してエッジ検出を行い,各画素 に主方向 θp とエッジ強度 mp を割り当てる。計算を効率的に するため,mp > 0.1 の画素をエッジとする。(Fig.1 2 段目) 8 近傍のエッジを連結し,主方向差の和が π/2 になるまで エッジをグループ化する。(Fig.1 3 段目) 2 つのエッジグループ si, sj 間の affinity を以下の式で計算 する。 a(si, sj) = | cos(θi − θij) cos(θj − θij)|γ ただし, θi, θj: それぞれ si, sj の主方向 θij: si, sj の平均位置間の方向 γ: 感度を調節するパラメータ(γ = 2) 2 画素以上離れているエッジグループ間の affinity は 0 とする。 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 15. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 手法 (2) wb(si) の計算 Bounding Box b に対して,その中に含まれる全てのエッジグ ループ si に wb(si) ∈ [0, 1] を割り当てる。 - si が Bounding Box に完全に含まれる場合 · · · wb(si) = 1 - 外にある場合や境界につながっている場合 · · · wb(si) = 0 境界につながっているエッジグループの集合を Sb とし, si ∈ Sb のエッジに対して wb(si) = 0 に設定する。 それ以外の si に対して,以下の式で wb(si) を計算する。 wb(si) = 1 − maxT ∏ |T|−1 j a(tj, tj+1) ただし,t1 ∈ Sb, t|T| = si つまり,上式は si から境界までの最大 affinity になる経路で計 算する。 境界につながる経路がない場合は wb(si) = 1 である。 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 16. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 手法 (3) Bounding Box Scoring Bounding Box の Objectness Score を以下の式で計算する。 hb = ∑i wb(si)mi 2(bw + bh)κ ただし, mi: エッジグループ si に含む全てのエッジ強度 mp の和 bw, bh: Bounding Box の幅と高さ κ: パラメータ (κ = 1.5) Bounding Box 中央のエッジは境界に近いエッジより重要性が 低いことを考慮する。 hin b = hb − ∑p∈bin mp 2(bw + bh)κ ただし,bin は内側の領域を表す(bw/2, bh/2 の領域) 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 17. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 手法 (4) Search Strategy Bounding Box の候補は,位置,スケール,アスペクト比に対 する Sliding Window で設定する。 ステップサイズは隣の Window との重なりが IoU = α となる ように設定する。 - スケールの範囲: σ = 1000 画素∼画像全体 - アスペクト比の範囲: 1/τ ∼ τ (τ = 3) 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 18. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 手法 (5) Refinement 全ての Sliding Window に対する Objectness Score を計算後, hin b が閾値以上の Box に対して,位置を再調整 (refinement) する。 位置の再調整では,閾値以上の Box の周辺の位置,スケール, アスペクト比を網羅的に調べて最大となる Box を検出する。 位置再調整後,Non-Maximal Suppression (NMS) により IoU が β 以上の Box を除去する。 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 19. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 評価結果(パラメータに対する変化) 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 20. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 評価結果(提案数と IoU に対する変化) 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 21. Introduction Object Proposal Methods Conclusions BING: Binarized Normed Gradients Edge Boxes Edge Boxes: 検出例 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods
  • 22. Introduction Object Proposal Methods Conclusions まとめ Object Proposal は,物体検出などより 複雑な認識処理の前処理として使用さ れることが想定されているので,でき る限り高速な処理が望まれる BING や Edge Boxes は非常に高速な処 理が可能であり,1 枚の処理にかかる 時間は BING が 0.2s,Edge Boxes が 0.3s である 特に Edge Boxes は高速で精度も高い ことが報告されている [Hosang, BMVC2014] ので,様々なアプリケー ションに応用が期待できる。 adapted from [Hosang, BMVC2014] 2015/11/06 上智大学 山中高夫 Fast Object Proposal Methods