LSD-SLAM:Large Scale Direct Monocular SLAM

LSD-SLAM:
Large-Scale Direct Monocular SLAM
単眼カメラによる直接的な大規模SLAM
Jakob Engel and Thomas Schöps and Daniel Cremers
Technical University Munich

目次
• SLAMとは
• 概要
• 関連研究の紹介と批評
• 数学的要素の導入
• アルゴリズム
• 評価
• 結論

SLAM (Simultaneous Localization And Mapping)
LRFやカメラ，またオドメータから得た情報から，自己位置と環境地図を
同時に生成するアルゴリズムのこと．
方法によっては，高精度な結果を安定して出力できる．
ロバスト性

概要
• 広域の環境地図生成と正確な自己位置推定ができる
• CPUが1つでも実時間的な処理ができる
• 単眼カメラで高精度な距離測定が可能
以下のような新しいSLAMを提案する

関連研究
• 特徴点に基づく方法
• 直接的な方法
• ポーズグラフ最適化

関連研究
特徴点に基づく方法直接的な方法
抜き出した特徴点と自己位置との
位置関係を計算する
画像全体の輝度から計算する

関連研究
特徴点に基づく方法直接的な方法
特徴点の情報しか使えない
特徴点の個数が精度に影響
画像全体の情報を使える
高いロバスト性

関連研究 -直接的な方法-
全密深度マップ
Full Dense Depth Map
準密深度マップ
Semi Dense Depth Map
画像の全ピクセルに対する距離
情報を保持する
処理が非常に重い
一つ前のフレームとの差分情報
のみを保持する
処理が軽い

数学的要素の導入
3次元姿勢変換の表現
重み付き最小二乗法の導入
不確かさの伝播

3次元剛体変換
𝐺 =
𝑅 𝑡
0 1
with 𝑅 ∈ 𝑆𝑂 3 𝑎𝑛𝑑 𝑡 ∈ ℝ3
3次元剛体変換 𝐺 ∈ 𝑆𝐸(3)
𝑆𝑂 3 : 3次元の回転群
回転運動・並進運動

3次元相似変換
𝐺 =
𝑠𝑅 𝑡
0 1
with 𝑅 ∈ 𝑆𝑂 3 ,
3次元相似変換 𝑆 ∈ 𝑆𝑖𝑚(3)
𝑆𝑂 3 : 3次元の回転群
𝑡 ∈ ℝ3
and 𝑠 ∈ ℝ+
回転運動・並進運動・スケーリング

ガウス・ニュートン法による最適化
𝐸 𝝃 =
𝑖
𝐼𝑟𝑒𝑓 𝐩𝑖 − 𝐼 𝜔 𝐩𝑖, 𝐷𝑟𝑒𝑓 𝐩𝑖 , 𝝃
2
=: 𝑟𝑖
2
(𝝃)
𝛿𝝃 𝑛
= − 𝐉T
𝐉
−1
𝐉T
r 𝝃 n
with 𝐉 =
𝜕𝐫 𝝐 ∘ 𝝃 𝑛
𝜕𝝐
𝝐=0
𝝃(𝑛+1) = 𝛿𝝃(𝑛) ∘ 𝝃(𝑛)
以下の誤差関数を最小にするような 𝝃を求める
ガウス・ニュートン法より
以上を繰り返す

重み付きガウス・ニュートン法による最適化
𝐸 𝝃 =
𝑖
𝑟𝑖
2
(𝝃) 𝐸 𝝃 =
𝑖
𝑤𝑖 𝝃 𝑟𝑖
2
(𝝃)
重み付きガウス・ニュートン法を導入する
𝛿𝝃 𝑛
=
− 𝐉T
𝐉
−1
𝐉T
r 𝝃 n
𝛿𝝃 𝑛
=
− 𝐉T
𝐖𝐉
−1
𝐉T
𝐖r 𝝃 n
外れ値に対して鈍感になりロバスト性を
確保できる

マップ表現方法
キーフレーム
(KF)
画像（逆）深度マップ（逆）深度マップの分散

マップ表現方法
キーフレーム相似変換

剛体変換
キーフレームと
カメラ映像を比較し
深度マップを得る
キーフレームと
キーフレームの
相似変換を計算する
剛体変換

トラッキング
現在のキーフレームと新しく得られたカメラ画像間の
剛体変換を推定する

トラッキング
with
𝑟𝑝 𝐩, 𝝃 𝑗𝑖 ≔ 𝐼𝑖 𝐩 − 𝐼 𝜔 𝐩, 𝐷𝑖 𝐩 , 𝝃 𝑗𝑖
𝜎𝑟 𝑝
2 𝐩, 𝝃 𝑗𝑖 ≔ 2𝜎𝐼
2
+
𝜕𝑟𝑝 𝐩, 𝝃 𝑗𝑖
𝜕𝐷𝑖 𝐩
2
𝑉𝑖(𝐩)
ガウス・ニュートン法を適応して，剛体変換を求める
分散で正規化
Huber Norm
𝑟2
𝛿
≔
𝑟2
2𝛿
𝑖𝑓 𝑟 ≤ 𝛿
𝑟 −
𝛿
2
𝑜𝑡ℎ𝑒𝑟𝑤𝑖𝑠𝑒
𝐸 𝑝 𝝃 𝑗𝑖 =
𝐩∈Ω 𝐷𝑖
𝑟𝑝
2
𝐩, 𝝃 𝑗𝑖
𝜎𝑟 𝑝
2
𝐩, 𝝃 𝑗𝑖
𝛿
現在のキーフレームを 𝐾𝑖 = (𝐼𝑖, 𝐷𝑖, 𝑉𝑖) とすると

キーフレーム遷移の判別
𝑑𝑖𝑠𝑡 𝜉𝑗𝑖 > 𝑠
新規キーフレーム
生成
T
閾値
𝑑𝑖𝑠𝑡 𝝃 𝑗𝑖 ≔ 𝝃 𝑗𝑖
𝑇
𝐖𝝃 𝑗𝑖
𝝃 𝑗𝑖: 3D並進と3D回転を表現するベクトル
𝐖: 重み付けのための行列
既存キーフレーム
改善F
現在取得しているマップ域からの
離れ具合を判別

既存キーフレームの改善

新規キーフレームの生成
現在のキーフレーム

新規のキーフレーム
剛体変換

マップ最適化
剛体変換

マップ最適化
深度の平均値を
キーフレーム間で一定にする
剛体変換

マップ最適化
深度の平均値を
キーフレーム間で一定にする
剛体変換
深度スケール変化

マップ最適化
相似変換
キーフレームが持っている情報は
深度の平均値一定だが
前キーフレームからの相似変換で
実際のスケールが得られる

マップ最適化
相似変換を求める
𝐸 𝑝 𝝃 𝑗𝑖 ≔
𝐩∈𝛀 𝐷𝑖
𝑟𝑝
2
𝐩, 𝝃 𝑗𝑖
𝜎𝑟 𝑝
2
𝐩, 𝝃 𝑗𝑖
+
𝑟𝑑
2
𝐩, 𝝃 𝑗𝑖
𝜎𝑟 𝑑
2
𝐩, 𝝃 𝑗𝑖
𝛿
𝑟𝑑 𝐩, 𝝃 𝑗𝑖 ≔ 𝐩′
3 − 𝐷𝑗( 𝐩′
1,2)
𝜎𝑟 𝑑
2
𝐩, 𝝃 𝑗𝑖 ≔ 𝑉𝑗 𝐩′
1,2
𝜕𝑟𝑑 𝐩′, 𝜉𝑗𝑖
𝜕𝐷𝑗 𝐩′
1,2
2
+ 𝑉𝑖 𝐩
𝜕𝑟𝑑 𝐩, 𝜉𝑗𝑖
𝜕𝐷𝑖 𝐩
2

マップ最適化
局所的なキーフレームの相似変換を推定してきたが，
バックグラウンドでは，マップを常に最適化し続けている
→外部論文
𝐸 𝜉 𝑊1, 𝜉 𝑊2, … , 𝜉 𝑊𝑛 ≔
𝜉 𝑗𝑖,Σ 𝑗𝑖 ∈𝜖
𝜉𝑗𝑖 ∘ 𝜉 𝑊𝑖
−1
∘ 𝜉 𝑊𝑗
𝑇
𝑗𝑖
(𝜉𝑗𝑖 ∘ 𝜉 𝑊𝑖
−1
∘ 𝜉 𝑊𝑗)
−1

評価
公開されているデータセットに対する評価
屋外環境で，カメラを手に持ちながら長い距離を移動

データセットに対する推定結果の評価
A Benchmark for the Evaluation of RGB-D SLAM Sytems
素早い回転動作
ローリング
シャッター

データセットに対する推定結果の評価
𝑅𝑀𝑆𝐸 =
1
𝑁
𝑖=1
𝑦𝑖 − 𝑦𝑖
2
𝑦𝑖:実測値 𝑦𝑖:予測値
[9] 単眼VO
[15] 単眼SLAM
[14] direct RGB-D SLAM
[7] keypoint RGB-D SLAM
x: トラッキング失敗
-: 利用不可能

屋外環境における推定結果の評価
20cmのところから，10mのところまで
大規模なマップ構築をすることができた

結論
500m以上の距離を手持ち撮影した映像で
トラッキングとマッピングを行った
深度が20cmから10mまで変化する大規模な環境だったが
精度の高い3次元マップの構築と自己位置推定に成功した
他の方法と比べても処理が軽いうえ
高精度・高ロバスト性が確保できることを示せた
キーフレーム間の相似変換を求めるアルゴリズムを提示した
深度マップの構築に対して，ノイズ（分散）を確率的観点から導入した
既存研究にない新しいアプローチは以下の2点

LSD-SLAM:Large Scale Direct Monocular SLAM

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a LSD-SLAM:Large Scale Direct Monocular SLAM

Semelhante a LSD-SLAM:Large Scale Direct Monocular SLAM (20)

LSD-SLAM:Large Scale Direct Monocular SLAM