SlideShare uma empresa Scribd logo
1 de 10
1
MIL
Machine Intelligence Lab.
複数枚の画像からの
photo-consistency
3.2 デプスマップ復元
2015/3/28
第28回コンピュータビジョン勉強会@関東
原田研究室 助教 金崎朝子
2
MIL
Machine Intelligence Lab.
複数枚の画像からのphoto-consistency
三次元形状を復元するには正確なVisibility情報
(物体上の点がどのカメラに見えているか)が
必要である
正確なVisibility情報を得るためには
逆に形状情報が必要である
vs.
いわゆるチキン・エッグ問題
3
MIL
Machine Intelligence Lab.
(図2.18)オクルージョン問題
• 近傍6画像を使ってPhoto-consistency
関数(NCC)をプロットした結果(赤線)
http://mi.eng.cam.ac.u
k/~cipolla/archive/Pres
entations/2007-PAMI-
Volumetric-Graph-
Cuts.pdf
NCC値
深さ
平均
正しい深さ
平均したらダメな理由:
オクルージョンが発生
しているカメラから計算
されるNCC(外れ値)を
足しこんでしまっている
から。
4
MIL
Machine Intelligence Lab.
(図2.18)Vogiatzisら[24][37]の手法
• 近傍6画像を使ってPhoto-consistency
関数(NCC)をプロットした結果(赤線)
http://mi.eng.cam.ac.u
k/~cipolla/archive/Pres
entations/2007-PAMI-
Volumetric-Graph-
Cuts.pdf
NCC値
深さ
[37] Vogiatzis, George, Carlos
Hernández, Philip HS Torr, and
Roberto Cipolla.
Multi-view Stereo via Volumetric
Graph-cuts and Occlusion Robust
Photo-Consistency.
PAMI, vol. 29, No. 12, 2007.
極大値
カーネル関数
カーネル関数和
外れ値に影響されにくい!
5
MIL
Machine Intelligence Lab.
(図2.18)Vogiatzisら[24][37]の手法
• 近傍6画像を使ってPhoto-consistency
関数(NCC)をプロットした結果(赤線)
http://mi.eng.cam.ac.u
k/~cipolla/archive/Pres
entations/2007-PAMI-
Volumetric-Graph-
Cuts.pdf
NCC値
深さ
極大値
カーネル関数
カーネル関数和
𝑔 𝑝 𝑑 =
𝑖=1
𝑁
𝑗
𝑓𝑝
𝑖
𝑑𝑗
𝑖
𝑊(𝑑 − 𝑑𝑗
𝑖
)
𝑑𝑗
𝑖
: 各𝑓𝑝
𝑖 𝑑 の極大値
各photo-consistencyカーブ カーネル関数
(ex. gaussian)
[37] Vogiatzis, George, Carlos
Hernández, Philip HS Torr, and
Roberto Cipolla.
Multi-view Stereo via Volumetric
Graph-cuts and Occlusion Robust
Photo-Consistency.
PAMI, vol. 29, No. 12, 2007.
外れ値に影響されにくい!
6
MIL
Machine Intelligence Lab.
3.2 デプスマップ復元
• 一番単純な方法: 各ピクセルで上式が最大になるデプスを求める。
𝑔 𝑝 𝑑 =
𝑖=1
𝑁
𝑗
𝑓𝑝
𝑖
𝑑𝑗
𝑖
𝑊(𝑑 − 𝑑𝑗
𝑖
)
𝑑𝑗
𝑖
: 各𝑓𝑝
𝑖
𝑑 の極大値
各photo-consistencyカーブ カーネル関数
(ex. gaussian)
テクスチャー欠如
テクスチャー反復
註9
確証のない深さ値を効果的に
フィルタリングすることで~[19]
[19] Michael Goesele, Brian
Curless, and Steven M. Seitz.
Multi-view stereo revisited.
CVPR, 2006.
a depth value 𝑑 is 𝑣𝑎𝑙𝑖𝑑 if
𝑁𝐶𝐶 𝑅, 𝐶𝑗, 𝑑 > 𝑡ℎ𝑟𝑒𝑠ℎ
for at least two views in 𝐂.
7
MIL
Machine Intelligence Lab.
3.2 デプスマップ復元
• 一番単純な方法: 各ピクセルで上式が最大になるデプスを求める。
𝑔 𝑝 𝑑 =
𝑖=1
𝑁
𝑗
𝑓𝑝
𝑖
𝑑𝑗
𝑖
𝑊(𝑑 − 𝑑𝑗
𝑖
)
𝑑𝑗
𝑖
: 各𝑓𝑝
𝑖
𝑑 の極大値
各photo-consistencyカーブ カーネル関数
(ex. gaussian)
[13] Neill D. Campbell, George
Vogiatzis, Carlos Hernández, and
Roberto Cipolla.
Using Multiple Hypotheses to
Improve Depth-Maps for Multi-
View Stereo. ECCV, 2008.
図2.19
に該当
テクスチャー欠如
テクスチャー反復
滑らかさの
regularization項
を加える!
8
MIL
Machine Intelligence Lab.
3.2 デプスマップ復元
以下のエネルギー最適化問題を解く。
𝐸 𝑑 𝑝 =
𝑝∈𝐼
𝐸 𝑢(𝑑 𝑝) + 𝜆
(𝑝,𝑞)∈N
𝐸 𝑏(𝑑 𝑝, 𝑑 𝑞)
regularization項
𝐸 𝑢 𝑑 𝑝 = −𝑔 𝑝 𝑑
𝐸 𝑏 𝑑 𝑝, 𝑑 𝑞 = 𝑑 𝑝 − 𝑑 𝑞
・・・ピクセル𝑝の深さを𝑑 𝑝にするコスト
・・・隣り合うピクセル𝑝と𝑞の深さを
連続的(スムース)にするコスト
𝑝:
𝑑 𝑝:
𝐼:
N:
𝜆:
ピクセル
𝑝の深さ(この問題の変数)
画像中のピクセルの集合
隣り合うピクセルのペアの集合
重み比のパラメータ
[38] Oliver Woodford, Philip Torr, Ian
Reid, and Andrew Fitzgibbon.
Global stereo reconstruction under
second-order smoothness priors.
PAMI, vol.31, No. 12, 2009.
𝐸 𝑏 𝑑 𝑝, 𝑑 𝑞, 𝑑 𝑟 ≒ 𝑑 𝑝 − 2𝑑 𝑞 + 𝑑 𝑟
註10 こんなのも。
9
MIL
Machine Intelligence Lab.
3.2 デプスマップ復元
以下のエネルギー最適化問題を解く。
𝐸 𝑑 𝑝 =
𝑝∈𝐼
𝐸 𝑢(𝑑 𝑝) + 𝜆
(𝑝,𝑞)∈N
𝐸 𝑏(𝑑 𝑝, 𝑑 𝑞)
regularization項
𝐸 𝑢 𝑑 𝑝 = −𝑔 𝑝 𝑑
𝐸 𝑏 𝑑 𝑝, 𝑑 𝑞 = 𝑑 𝑝 − 𝑑 𝑞
・・・ピクセル𝑝の深さを𝑑 𝑝にするコスト
・・・隣り合うピクセル𝑝と𝑞の深さを
連続的(スムース)にするコスト
𝑝:
𝑑 𝑝:
𝐼:
N:
𝜆:
ピクセル
𝑝の深さ(この問題の変数)
画像中のピクセルの集合
隣り合うピクセルのペアの集合
重み比のパラメータ
ふつう離散化して最適なの探す
(ex. 0cm, 0.1cm, …, 10cmの100通り)
MRF
たとえば
Graph-Cuts
とかで解く
@rezoolab
@tackson5
※(8月30日)コンピュータビジョン最適化勉強会@関東
の資料は素晴らしかったです
10
MIL
Machine Intelligence Lab.
複数枚の画像からのphoto-consistency 3.2 デプスマップ復元
以上です。

Mais conteúdo relacionado

Mais procurados

SLAMチュートリアル大会資料(ORB-SLAM)
SLAMチュートリアル大会資料(ORB-SLAM)SLAMチュートリアル大会資料(ORB-SLAM)
SLAMチュートリアル大会資料(ORB-SLAM)Masaya Kaneko
 
CNN-SLAMざっくり
CNN-SLAMざっくりCNN-SLAMざっくり
CNN-SLAMざっくりEndoYuuki
 
LSD-SLAM:Large Scale Direct Monocular SLAM
LSD-SLAM:Large Scale Direct Monocular SLAMLSD-SLAM:Large Scale Direct Monocular SLAM
LSD-SLAM:Large Scale Direct Monocular SLAMEndoYuuki
 
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)Masaya Kaneko
 
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~SSII
 
SLAM勉強会(3) LSD-SLAM
SLAM勉強会(3) LSD-SLAMSLAM勉強会(3) LSD-SLAM
SLAM勉強会(3) LSD-SLAMIwami Kazuya
 
論文読み会2018 (CodeSLAM)
論文読み会2018 (CodeSLAM)論文読み会2018 (CodeSLAM)
論文読み会2018 (CodeSLAM)Masaya Kaneko
 
SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)
SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)
SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)SSII
 
第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM邦洋 長谷川
 
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII
 
論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...
論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...
論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...Takuma Yagi
 
論文読み会(DeMoN;CVPR2017)
論文読み会(DeMoN;CVPR2017)論文読み会(DeMoN;CVPR2017)
論文読み会(DeMoN;CVPR2017)Masaya Kaneko
 
Probabilistic Graphical Models 輪読会 #1
Probabilistic Graphical Models 輪読会 #1Probabilistic Graphical Models 輪読会 #1
Probabilistic Graphical Models 輪読会 #1Takuma Yagi
 
Graph Refinement based Tree Extraction using Mean-Field Networks and Graph Ne...
Graph Refinement based Tree Extraction using Mean-Field Networks and Graph Ne...Graph Refinement based Tree Extraction using Mean-Field Networks and Graph Ne...
Graph Refinement based Tree Extraction using Mean-Field Networks and Graph Ne...yukihiro domae
 
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)Takuma Yagi
 
確率的深層学習における中間層の改良と高性能学習法の提案
確率的深層学習における中間層の改良と高性能学習法の提案確率的深層学習における中間層の改良と高性能学習法の提案
確率的深層学習における中間層の改良と高性能学習法の提案__106__
 
Light weightbinocular sigasia2012_face
Light weightbinocular sigasia2012_faceLight weightbinocular sigasia2012_face
Light weightbinocular sigasia2012_faceishii yasunori
 
ディジタル信号処理 課題解説 その6
ディジタル信号処理 課題解説 その6ディジタル信号処理 課題解説 その6
ディジタル信号処理 課題解説 その6noname409
 
MIRU2016 チュートリアル
MIRU2016 チュートリアルMIRU2016 チュートリアル
MIRU2016 チュートリアルShunsuke Ono
 

Mais procurados (20)

SLAMチュートリアル大会資料(ORB-SLAM)
SLAMチュートリアル大会資料(ORB-SLAM)SLAMチュートリアル大会資料(ORB-SLAM)
SLAMチュートリアル大会資料(ORB-SLAM)
 
CNN-SLAMざっくり
CNN-SLAMざっくりCNN-SLAMざっくり
CNN-SLAMざっくり
 
LSD-SLAM:Large Scale Direct Monocular SLAM
LSD-SLAM:Large Scale Direct Monocular SLAMLSD-SLAM:Large Scale Direct Monocular SLAM
LSD-SLAM:Large Scale Direct Monocular SLAM
 
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
 
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
 
SLAM勉強会(3) LSD-SLAM
SLAM勉強会(3) LSD-SLAMSLAM勉強会(3) LSD-SLAM
SLAM勉強会(3) LSD-SLAM
 
論文読み会2018 (CodeSLAM)
論文読み会2018 (CodeSLAM)論文読み会2018 (CodeSLAM)
論文読み会2018 (CodeSLAM)
 
SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)
SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)
SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)
 
第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM第41回関東CV勉強会 CNN-SLAM
第41回関東CV勉強会 CNN-SLAM
 
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
 
論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...
論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...
論文紹介:Using the Forest to See the Trees: A Graphical. Model Relating Features,...
 
論文読み会(DeMoN;CVPR2017)
論文読み会(DeMoN;CVPR2017)論文読み会(DeMoN;CVPR2017)
論文読み会(DeMoN;CVPR2017)
 
Probabilistic Graphical Models 輪読会 #1
Probabilistic Graphical Models 輪読会 #1Probabilistic Graphical Models 輪読会 #1
Probabilistic Graphical Models 輪読会 #1
 
Graph Refinement based Tree Extraction using Mean-Field Networks and Graph Ne...
Graph Refinement based Tree Extraction using Mean-Field Networks and Graph Ne...Graph Refinement based Tree Extraction using Mean-Field Networks and Graph Ne...
Graph Refinement based Tree Extraction using Mean-Field Networks and Graph Ne...
 
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
 
Camera calibration
Camera calibrationCamera calibration
Camera calibration
 
確率的深層学習における中間層の改良と高性能学習法の提案
確率的深層学習における中間層の改良と高性能学習法の提案確率的深層学習における中間層の改良と高性能学習法の提案
確率的深層学習における中間層の改良と高性能学習法の提案
 
Light weightbinocular sigasia2012_face
Light weightbinocular sigasia2012_faceLight weightbinocular sigasia2012_face
Light weightbinocular sigasia2012_face
 
ディジタル信号処理 課題解説 その6
ディジタル信号処理 課題解説 その6ディジタル信号処理 課題解説 その6
ディジタル信号処理 課題解説 その6
 
MIRU2016 チュートリアル
MIRU2016 チュートリアルMIRU2016 チュートリアル
MIRU2016 チュートリアル
 

Destaque

cvsaisentan5 Multi View Stereo 3.3
cvsaisentan5 Multi View Stereo 3.3cvsaisentan5 Multi View Stereo 3.3
cvsaisentan5 Multi View Stereo 3.3Takuya Minagawa
 
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチMIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチHironobu Fujiyoshi
 
実践コンピュータビジョン 3章 画像間の写像
実践コンピュータビジョン 3章 画像間の写像実践コンピュータビジョン 3章 画像間の写像
実践コンピュータビジョン 3章 画像間の写像yaju88
 
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみたORB-SLAMを動かしてみた
ORB-SLAMを動かしてみたTakuya Minagawa
 
Sift特徴量について
Sift特徴量についてSift特徴量について
Sift特徴量についてla_flance
 
T TIME 滞在時間割キャンペーン(第4回販促会議企画コンペティション)
T TIME 滞在時間割キャンペーン(第4回販促会議企画コンペティション)T TIME 滞在時間割キャンペーン(第4回販促会議企画コンペティション)
T TIME 滞在時間割キャンペーン(第4回販促会議企画コンペティション)Keita Takizawa
 

Destaque (7)

cvsaisentan5 Multi View Stereo 3.3
cvsaisentan5 Multi View Stereo 3.3cvsaisentan5 Multi View Stereo 3.3
cvsaisentan5 Multi View Stereo 3.3
 
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチMIRU2013チュートリアル:SIFTとそれ以降のアプローチ
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
 
実践コンピュータビジョン 3章 画像間の写像
実践コンピュータビジョン 3章 画像間の写像実践コンピュータビジョン 3章 画像間の写像
実践コンピュータビジョン 3章 画像間の写像
 
2008-12-07_PTAM_Kansai.AR
2008-12-07_PTAM_Kansai.AR2008-12-07_PTAM_Kansai.AR
2008-12-07_PTAM_Kansai.AR
 
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみたORB-SLAMを動かしてみた
ORB-SLAMを動かしてみた
 
Sift特徴量について
Sift特徴量についてSift特徴量について
Sift特徴量について
 
T TIME 滞在時間割キャンペーン(第4回販促会議企画コンペティション)
T TIME 滞在時間割キャンペーン(第4回販促会議企画コンペティション)T TIME 滞在時間割キャンペーン(第4回販促会議企画コンペティション)
T TIME 滞在時間割キャンペーン(第4回販促会議企画コンペティション)
 

第28回コンピュータビジョン勉強会@関東(kanejaki担当分)

  • 1. 1 MIL Machine Intelligence Lab. 複数枚の画像からの photo-consistency 3.2 デプスマップ復元 2015/3/28 第28回コンピュータビジョン勉強会@関東 原田研究室 助教 金崎朝子
  • 3. 3 MIL Machine Intelligence Lab. (図2.18)オクルージョン問題 • 近傍6画像を使ってPhoto-consistency 関数(NCC)をプロットした結果(赤線) http://mi.eng.cam.ac.u k/~cipolla/archive/Pres entations/2007-PAMI- Volumetric-Graph- Cuts.pdf NCC値 深さ 平均 正しい深さ 平均したらダメな理由: オクルージョンが発生 しているカメラから計算 されるNCC(外れ値)を 足しこんでしまっている から。
  • 4. 4 MIL Machine Intelligence Lab. (図2.18)Vogiatzisら[24][37]の手法 • 近傍6画像を使ってPhoto-consistency 関数(NCC)をプロットした結果(赤線) http://mi.eng.cam.ac.u k/~cipolla/archive/Pres entations/2007-PAMI- Volumetric-Graph- Cuts.pdf NCC値 深さ [37] Vogiatzis, George, Carlos Hernández, Philip HS Torr, and Roberto Cipolla. Multi-view Stereo via Volumetric Graph-cuts and Occlusion Robust Photo-Consistency. PAMI, vol. 29, No. 12, 2007. 極大値 カーネル関数 カーネル関数和 外れ値に影響されにくい!
  • 5. 5 MIL Machine Intelligence Lab. (図2.18)Vogiatzisら[24][37]の手法 • 近傍6画像を使ってPhoto-consistency 関数(NCC)をプロットした結果(赤線) http://mi.eng.cam.ac.u k/~cipolla/archive/Pres entations/2007-PAMI- Volumetric-Graph- Cuts.pdf NCC値 深さ 極大値 カーネル関数 カーネル関数和 𝑔 𝑝 𝑑 = 𝑖=1 𝑁 𝑗 𝑓𝑝 𝑖 𝑑𝑗 𝑖 𝑊(𝑑 − 𝑑𝑗 𝑖 ) 𝑑𝑗 𝑖 : 各𝑓𝑝 𝑖 𝑑 の極大値 各photo-consistencyカーブ カーネル関数 (ex. gaussian) [37] Vogiatzis, George, Carlos Hernández, Philip HS Torr, and Roberto Cipolla. Multi-view Stereo via Volumetric Graph-cuts and Occlusion Robust Photo-Consistency. PAMI, vol. 29, No. 12, 2007. 外れ値に影響されにくい!
  • 6. 6 MIL Machine Intelligence Lab. 3.2 デプスマップ復元 • 一番単純な方法: 各ピクセルで上式が最大になるデプスを求める。 𝑔 𝑝 𝑑 = 𝑖=1 𝑁 𝑗 𝑓𝑝 𝑖 𝑑𝑗 𝑖 𝑊(𝑑 − 𝑑𝑗 𝑖 ) 𝑑𝑗 𝑖 : 各𝑓𝑝 𝑖 𝑑 の極大値 各photo-consistencyカーブ カーネル関数 (ex. gaussian) テクスチャー欠如 テクスチャー反復 註9 確証のない深さ値を効果的に フィルタリングすることで~[19] [19] Michael Goesele, Brian Curless, and Steven M. Seitz. Multi-view stereo revisited. CVPR, 2006. a depth value 𝑑 is 𝑣𝑎𝑙𝑖𝑑 if 𝑁𝐶𝐶 𝑅, 𝐶𝑗, 𝑑 > 𝑡ℎ𝑟𝑒𝑠ℎ for at least two views in 𝐂.
  • 7. 7 MIL Machine Intelligence Lab. 3.2 デプスマップ復元 • 一番単純な方法: 各ピクセルで上式が最大になるデプスを求める。 𝑔 𝑝 𝑑 = 𝑖=1 𝑁 𝑗 𝑓𝑝 𝑖 𝑑𝑗 𝑖 𝑊(𝑑 − 𝑑𝑗 𝑖 ) 𝑑𝑗 𝑖 : 各𝑓𝑝 𝑖 𝑑 の極大値 各photo-consistencyカーブ カーネル関数 (ex. gaussian) [13] Neill D. Campbell, George Vogiatzis, Carlos Hernández, and Roberto Cipolla. Using Multiple Hypotheses to Improve Depth-Maps for Multi- View Stereo. ECCV, 2008. 図2.19 に該当 テクスチャー欠如 テクスチャー反復 滑らかさの regularization項 を加える!
  • 8. 8 MIL Machine Intelligence Lab. 3.2 デプスマップ復元 以下のエネルギー最適化問題を解く。 𝐸 𝑑 𝑝 = 𝑝∈𝐼 𝐸 𝑢(𝑑 𝑝) + 𝜆 (𝑝,𝑞)∈N 𝐸 𝑏(𝑑 𝑝, 𝑑 𝑞) regularization項 𝐸 𝑢 𝑑 𝑝 = −𝑔 𝑝 𝑑 𝐸 𝑏 𝑑 𝑝, 𝑑 𝑞 = 𝑑 𝑝 − 𝑑 𝑞 ・・・ピクセル𝑝の深さを𝑑 𝑝にするコスト ・・・隣り合うピクセル𝑝と𝑞の深さを 連続的(スムース)にするコスト 𝑝: 𝑑 𝑝: 𝐼: N: 𝜆: ピクセル 𝑝の深さ(この問題の変数) 画像中のピクセルの集合 隣り合うピクセルのペアの集合 重み比のパラメータ [38] Oliver Woodford, Philip Torr, Ian Reid, and Andrew Fitzgibbon. Global stereo reconstruction under second-order smoothness priors. PAMI, vol.31, No. 12, 2009. 𝐸 𝑏 𝑑 𝑝, 𝑑 𝑞, 𝑑 𝑟 ≒ 𝑑 𝑝 − 2𝑑 𝑞 + 𝑑 𝑟 註10 こんなのも。
  • 9. 9 MIL Machine Intelligence Lab. 3.2 デプスマップ復元 以下のエネルギー最適化問題を解く。 𝐸 𝑑 𝑝 = 𝑝∈𝐼 𝐸 𝑢(𝑑 𝑝) + 𝜆 (𝑝,𝑞)∈N 𝐸 𝑏(𝑑 𝑝, 𝑑 𝑞) regularization項 𝐸 𝑢 𝑑 𝑝 = −𝑔 𝑝 𝑑 𝐸 𝑏 𝑑 𝑝, 𝑑 𝑞 = 𝑑 𝑝 − 𝑑 𝑞 ・・・ピクセル𝑝の深さを𝑑 𝑝にするコスト ・・・隣り合うピクセル𝑝と𝑞の深さを 連続的(スムース)にするコスト 𝑝: 𝑑 𝑝: 𝐼: N: 𝜆: ピクセル 𝑝の深さ(この問題の変数) 画像中のピクセルの集合 隣り合うピクセルのペアの集合 重み比のパラメータ ふつう離散化して最適なの探す (ex. 0cm, 0.1cm, …, 10cmの100通り) MRF たとえば Graph-Cuts とかで解く @rezoolab @tackson5 ※(8月30日)コンピュータビジョン最適化勉強会@関東 の資料は素晴らしかったです