2
本論文
• Visual SLAM: Why Bundle Adjust?
– 著者: A. P. Bustos, T. Chin, A. Eriksson and I. Reid
– 採択会議: ICRA2019 (arXivには2019/2/11投稿)
Andrew Davison 大先生も絶賛
3
本論文 (おまけ)
• Visual SLAM: Why Bundle Adjust?
– 著者: A. P. Bustos, T. Chin, A. Eriksson and I. Reid
– 採択会議: ICRA2019 (arXivには2019/2/11投稿)
一番最初のVisual SLAMである
MonoSLAM [Davison+, PAMI’07]
のメンバーの一人
[1] A. J. Davison, I. D. Reid, N. M. Molton, and O. Stasse, “MonoSLAM: real-time single camera SLAM,” IEEE TPAMI, vol. 29,
no. 6, pp. 1– 16, 2007
4
本論文 (おまけ)
• Visual SLAM: Why Bundle Adjust?
– 著者: A. P. Bustos, T. Chin, A. Eriksson and I. Reid
– 採択会議: ICRA2019 (arXivには2019/2/11投稿)
[1] H. Strasdat, J. M. M. Montiel, and A. J. Davison, “Visual SLAM: Why Filter?” Image and Vision Computing, vol. 30, no. 2,
pp. 65–77, 2012
20
提案手法
• VSLAMのカメラ軌跡推定を2つの問題に分離
1. カメラの回転 𝐑𝑗
Rotation Averaging[1]
2. カメラの位置𝐭𝑗 (と3D地図 𝐗)
Known Rotation Problem (KRot)[2]
𝐮𝑖,𝑗
[1] A. Eriksson, C. Olsson, F. Kahl, and T.-J. Chin, “Rotation averaging and strong duality,” in CVPR, 2018.
[2] Q. Zhang, T.-J. Chin, and H. M. Le, “A fast resection-intersection method for the known rotation problem,” in CVPR, 2018.
3D地図に依存することなくカメラの回転を求めることが可能に!
(従来よりもTracking失敗しにくいシステムに)
21
提案手法
• VSLAMのカメラ軌跡推定を2つの問題に分離
1. カメラの回転 𝐑𝑗
Rotation Averaging[1]
2. カメラの位置𝐭𝑗 (と3D地図 𝐗)
Known Rotation Problem (KRot)[2]
𝐮𝑖,𝑗
[おまけ] 本論文の著者の1人であるTat-Jun Chin氏は両問題に対する解法
の論文に関わっており, CVPR2018で採択[1][2](片方はoral)
[1] A. Eriksson, C. Olsson, F. Kahl, and T.-J. Chin, “Rotation averaging and strong duality,” in CVPR, 2018.
[2] Q. Zhang, T.-J. Chin, and H. M. Le, “A fast resection-intersection method for the known rotation problem,” in CVPR, 2018.
• カメラの回転成分{𝐑𝑗}の最適化[1]
22
1. Rotation Averaging
2
1
3
4
5
𝐑2
絶対座標
𝐑3
𝐑4
𝐑5
𝐑1
[1] A. Chatterjee and V. Madhav Govindu, “Efficient and robust largescale rotation averaging,” in ICCV, 2013.
• カメラの回転成分{𝐑𝑗}の最適化[1]
1. 特徴点マッチングより相対的なカメラ回転{𝐑 𝑖𝑗}を求める
2. 相対的なカメラ回転{𝐑 𝑖𝑗}から絶対座標系での回転{𝐑𝑗}を求める
23
1. Rotation Averaging
2
1
3
4
5
𝐑2
絶対座標
𝐑3
𝐑4
𝐑5
𝐑1
[1] A. Chatterjee and V. Madhav Govindu, “Efficient and robust largescale rotation averaging,” in ICCV, 2013.
• カメラの回転成分{𝐑𝑗}の最適化[1]
1. 特徴点マッチングより相対的なカメラ回転{𝐑 𝑖𝑗}を求める
2. 相対的なカメラ回転{𝐑 𝑖𝑗}から絶対座標系での回転{𝐑𝑗}を求める
𝐑12
24
1. Rotation Averaging
21. 特徴点マッチングにより基礎行列の計算
2. SVDによる行列分解
𝐱2
T
𝐅12 𝐱1 = 0
𝐄12 = 𝐊2 𝐅12 𝐊1
𝐄12 = 𝐭12 × 𝐑12
特徴点 𝐱1 特徴点 𝐱2
1
3
4
5
[1] A. Chatterjee and V. Madhav Govindu, “Efficient and robust largescale rotation averaging,” in ICCV, 2013.
25
1. Rotation Averaging
• カメラの回転成分{𝐑𝑗}の最適化[1]
1. 特徴点マッチングより相対的なカメラ回転{𝐑 𝑖𝑗}を求める
2. 相対的なカメラ回転{𝐑 𝑖𝑗}から絶対座標系での回転{𝐑𝑗}を求める
絶対座標
min
𝐑1,𝐑2
𝐑12 − 𝐑2 𝐑1
−1
𝐹
= 2 2 sin
∠(𝐑12 𝐑2 𝐑1
−1 −1)
2
𝐑12
2
1
𝐑2
𝐑1
相対座標系の回転は 絶対座標系での
回転で表現可能
𝐑12
2
1
𝐑2
𝐑1
−1
3
4
5
[1] A. Chatterjee and V. Madhav Govindu, “Efficient and robust largescale rotation averaging,” in ICCV, 2013.
[2] A. Eriksson, C. Olsson, F. Kahl, and T.-J. Chin, “Rotation averaging and strong duality,” in CVPR, 2018.
(Chordal distance[2])
27
1. Rotation Averaging
• カメラの回転成分{𝐑𝑗}の最適化[1]
1. 特徴点マッチングより相対的なカメラ回転{𝐑 𝑖𝑗}を求める
2. 相対的なカメラ回転{𝐑 𝑖𝑗}から絶対座標系での回転{𝐑𝑗}を求める
→ 各カメラの回転方向{𝑹𝑗}を求めることができた
𝐑12
2
1
𝐑2
𝐑1
絶対座標
3
4
5
𝐑23
𝐑34
𝐑45
𝐑51
𝐑52
𝐑53𝐑14
𝐑24
𝐑13
𝐑3
𝐑4
𝐑5
[1] A. Chatterjee and V. Madhav Govindu, “Efficient and robust largescale rotation averaging,” in ICCV, 2013.
28
2. Known Rotation Problem (KRot)
• カメラの回転から, カメラ位置と3D点の最適化[1]
– 2Dカメラ画像上に投影し最小化 (Bundle Adjustmentに近い)
min
𝐗 𝑖 ,{𝐭 𝑗}
max
𝑖,𝑗
𝐮𝑖,𝑗 − 𝑓 𝐗 𝑖 𝐑𝑗, 𝐭𝑗 𝟐
s. t. 𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
> 0 ∀𝑖, 𝑗
KRot
最大要素の最小化
(𝐿∞最適化)
[1] Q. Zhang, T.-J. Chin, and H. M. Le, “A fast resection-intersection method for the known rotation problem,” in CVPR, 2018.
カメラ姿勢 [𝐑𝑗, 𝐭𝑗]
𝒖𝑖,𝑗
3D位置 𝐗 𝑖
投影点
𝑓 𝐗 𝑖 𝐑𝑗, 𝐭𝑗)
𝑍𝑗+1
[𝐑𝑗+1, 𝐭𝑗+1]
𝒖𝑖,𝑗+1
画像 𝑍𝑗
29
2. Known Rotation Problem (KRot)
• カメラの回転から, カメラ位置と3D点の最適化[1]
– 2Dカメラ画像上に投影し最小化 (Bundle Adjustmentに近い)
min
𝐗 𝑖 ,{𝐭 𝑗}
max
𝑖,𝑗
𝐮𝑖,𝑗 − 𝑓 𝐗 𝑖 𝐑𝑗, 𝐭𝑗 𝟐
s. t. 𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
> 0 ∀𝑖, 𝑗
Bundle AdjustmentKRot
2乗誤差の和の最小化
(𝐿2最適化)
最大要素の最小化
(𝐿∞最適化)
[1] Q. Zhang, T.-J. Chin, and H. M. Le, “A fast resection-intersection method for the known rotation problem,” in CVPR, 2018.
30
2. Known Rotation Problem (KRot)
• カメラの回転から, カメラ位置と3D点の最適化[1]
– 2Dカメラ画像上に投影し最小化 (Bundle Adjustmentに近い)
min
𝐗 𝑖 ,{𝐭 𝑗}
max
𝑖,𝑗
𝐮𝑖,𝑗 − 𝑓 𝐗 𝑖 𝐑𝑗, 𝐭𝑗 𝟐
s. t. 𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
> 0 ∀𝑖, 𝑗
Bundle AdjustmentKRot
2乗誤差の和の最小化
(𝐿2最適化)
最大要素の最小化
(𝐿∞最適化)
• 再投影誤差の𝑳 𝟐最小化はhard non-
convex problem[2]
• 良い初期解が必要
• 𝑳∞最適化で書き直すとsingle local
optimumを持つようになる[2]
• Outlierに対して非常に敏感
(だがL2も同じくらい敏感(?))
𝐿2関数 𝐿∞関数
[1] Q. Zhang, T.-J. Chin, and H. M. Le, “A fast resection-intersection method for the known rotation problem,” in CVPR, 2018.
[2] F. Kahl and R. Hartley, “Multiple-view geometry under the L∞-norm,” PAMI, vol. 30, no. 9, pp. 1603–1617, 2008.
31
2. Known Rotation Problem (KRot)
• カメラの回転から, カメラ位置と3D点の最適化[1]
– 以下をどう最適化するか?
• Res-Int (Resection-Intersection)[1]
min
𝐗 𝑖 ,{𝐭 𝑗}
max
𝑖,𝑗
𝐮𝑖,𝑗 − 𝑓 𝐗 𝑖 𝐑𝑗, 𝐭𝑗 𝟐
s. t. 𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
> 0 ∀𝑖, 𝑗
KRot
[1] Q. Zhang, T.-J. Chin, and H. M. Le, “A fast resection-intersection method for the known rotation problem,” in CVPR, 2018.
[2] F. Kahl and R. Hartley, “Multiple-view geometry under the L∞-norm,” PAMI, vol. 30, no. 9, pp. 1603–1617, 2008.
32
2. Known Rotation Problem (KRot)
• カメラの回転から, カメラ位置と3D点の最適化[1]
– 以下をどう最適化するか?
• Res-Int (Resection-Intersection)[1]
min
𝐗 𝑖 ,{𝐭 𝑗}
max
𝑖,𝑗
𝐮𝑖,𝑗 − 𝑓 𝐗 𝑖 𝐑𝑗, 𝐭𝑗 𝟐
s. t. 𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
> 0 ∀𝑖, 𝑗
KRot
[1] Q. Zhang, T.-J. Chin, and H. M. Le, “A fast resection-intersection method for the known rotation problem,” in CVPR, 2018.
[2] F. Kahl and R. Hartley, “Multiple-view geometry under the L∞-norm,” PAMI, vol. 30, no. 9, pp. 1603–1617, 2008.
𝑓 𝐗 𝑖 𝐑𝑗, 𝐭𝑗 =
𝐑𝑗
(1:2)
𝐗 𝑖 + 𝐭𝑗
(1:2)
𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
=
𝑓𝐱
𝐳
+ 𝑐 𝑥
𝑓𝐲
𝐳
+ 𝑐 𝑦
カメラの投影モデル
(簡単のため内部パラメータ𝑲 = 𝑰 𝟑×𝟑)
𝑓 = 1
z𝑖
[𝑥𝑖, 𝑦𝑖, 𝑧𝑖]
[𝑥𝑖/𝑧𝑖, 𝑦𝑖/𝑧𝑖, 1]
𝑐 𝑥 = 𝑐 𝑦 = 0
33
2. Known Rotation Problem (KRot)
• カメラの回転から, カメラ位置と3D点の最適化[1]
– 以下をどう最適化するか?
• Res-Int (Resection-Intersection)[1]
[1] Q. Zhang, T.-J. Chin, and H. M. Le, “A fast resection-intersection method for the known rotation problem,” in CVPR, 2018.
[2] F. Kahl and R. Hartley, “Multiple-view geometry under the L∞-norm,” PAMI, vol. 30, no. 9, pp. 1603–1617, 2008.
min
𝐗 𝑖 ,{𝐭 𝑗}
max
𝑖,𝑗
𝐮𝑖,𝑗 −
𝐑𝑗
(1:2)
𝐗 𝑖 + 𝐭𝑗
(1:2)
𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
𝟐
s. t. 𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
> 0 ∀𝑖, 𝑗
KRot
𝑓 𝐗 𝑖 𝐑𝑗, 𝐭𝑗 =
𝐑𝑗
(1:2)
𝐗 𝑖 + 𝐭𝑗
(1:2)
𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
=
𝑓𝐱
𝐳
+ 𝑐 𝑥
𝑓𝐲
𝐳
+ 𝑐 𝑦
カメラの投影モデル
(簡単のため内部パラメータ𝑲 = 𝑰 𝟑×𝟑)
𝑓 = 1
z𝑖
[𝑥𝑖, 𝑦𝑖, 𝑧𝑖]
[𝑥𝑖/𝑧𝑖, 𝑦𝑖/𝑧𝑖, 1]
𝑐 𝑥 = 𝑐 𝑦 = 0
34
2. Known Rotation Problem (KRot)
• Res-Int (Resection-Intersection)[1]
[1] Q. Zhang, T.-J. Chin, and H. M. Le, “A fast resection-intersection method for the known rotation problem,” in CVPR, 2018.
min
𝐗 𝑖 ,{𝐭 𝑗}
max
𝑖,𝑗
𝐮𝑖,𝑗 −
𝐑𝑗
(1:2)
𝐗 𝑖 + 𝐭𝑗
(1:2)
𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
𝟐
s. t. 𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
> 0 ∀𝑖, 𝑗
KRot
35
2. Known Rotation Problem (KRot)
• Res-Int (Resection-Intersection)[1]
[1] Q. Zhang, T.-J. Chin, and H. M. Le, “A fast resection-intersection method for the known rotation problem,” in CVPR, 2018.
min
𝐗 𝑖 ,{𝐭 𝑗}
max
𝑖,𝑗
𝐮𝑖,𝑗 −
𝐑𝑗
(1:2)
𝐗 𝑖 + 𝐭𝑗
(1:2)
𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
𝟐
s. t. 𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
> 0 ∀𝑖, 𝑗
KRot
min
𝐗 𝑖
max
𝑗
𝐮𝑖,𝑗 −
𝐑𝑗
(1:2)
𝐗 𝑖 + 𝐭𝑗
(1:2)
𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
𝟐
s. t. 𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
> 0 ∀𝑗
min
𝐭 𝑗
max
𝑖
𝐮𝑖,𝑗 −
𝐑𝑗
(1:2)
𝐗 𝑖 + 𝐭𝑗
(1:2)
𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
𝟐
s. t. 𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
> 0 ∀𝑖
Int𝒊
Res𝒋
{𝐭𝑗}を固定
{𝑿𝒊}を固定
36
2. Known Rotation Problem (KRot)
• Res-Int (Resection-Intersection)[1]
[1] Q. Zhang, T.-J. Chin, and H. M. Le, “A fast resection-intersection method for the known rotation problem,” in CVPR, 2018.
min
𝐗 𝑖
max
𝑗
𝐮𝑖,𝑗 −
𝐑𝑗
(1:2)
𝐗 𝑖 + 𝐭𝑗
(1:2)
𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
𝟐
s. t. 𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
> 0 ∀𝑗
min
𝐭 𝑗
max
𝑖
𝐮𝑖,𝑗 −
𝐑𝑗
(1:2)
𝐗 𝑖 + 𝐭𝑗
(1:2)
𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
𝟐
s. t. 𝐑𝑗
(3)
𝐗 𝑖 + 𝐭𝑗
(3)
> 0 ∀𝑖
Int𝒊
Res𝒋
IntとResの交互最適化を高速に解く[1]
大体3秒(画像15枚, 3D点3000個)
𝐮𝑖,𝑗 𝑖 = 1
𝑿𝑖 𝑖 = 1
𝑖 𝑿𝑖 Int 𝑖
𝑿𝑖 𝑖 = 1
45
実験2
• カメラの大きな回転への耐性
– Smart-phoneで撮影したカメラの回転映像
– ORB-SLAM[1]では初期化すらできないが, L-infinity SLAMでは
きちんと復元できた
[1] R. Mur-Artal, J. Montiel, and J. Tardos, “ORB-SLAM: a versatile and accurate monocular SLAM system,” IEEE TRO,
vol. 31, no. 5, pp.1147–1163, 2015.
47
参考資料
• 本論文の著者が関連する論文
– A. Eriksson, C. Olsson, F. Kahl, and T.-J. Chin, “Rotation averaging and strong duality,”
in CVPR, 2018.
– Q. Zhang, T.-J. Chin, and H. M. Le, “A fast resection-intersection method for the known
rotation problem,” in CVPR, 2018.
• Rotation Averagingの実装に採用した論文
– A. Chatterjee and V. Madhav Govindu, “Efficient and robust largescale rotation
averaging,” in ICCV, 2013.
• KRot (Loop Closing版, 詳細は論文へ)でベースにしていた論文
– K. Sim and R. Hartley, “Recovering camera motion using L∞ minimization,” in CVPR,
2006, pp. 1230–1237.
• 𝑳∞-normを使った定式化関連
– F. Kahl and R. Hartley, “Multiple-view geometry under the L∞-norm,” IEEE Transactions
on Pattern Analysis and Machine Intelligence, vol. 30, no. 9, pp. 1603–1617, 2008.
– C. Olsson, A. Eriksson, and F. Kahl, “Efficient optimization for 𝐿∞- problems using
pseudoconvexity,” in ICCV, 2007.