SlideShare uma empresa Scribd logo
1 de 41
LSD-SLAM:
Large-Scale Direct Monocular SLAM
単眼カメラによる直接的な大規模SLAM
Jakob Engel and Thomas Schöps and Daniel Cremers
Technical University Munich
目次
• SLAMとは
• 概要
• 関連研究の紹介と批評
• 数学的要素の導入
• アルゴリズム
• 評価
• 結論
SLAM (Simultaneous Localization And Mapping)
LRFやカメラ,またオドメータから得た情報から,自己位置と環境地図を
同時に生成するアルゴリズムのこと.
方法によっては,高精度な結果を安定して出力できる.
ロバスト性
概要
• 広域の環境地図生成と正確な自己位置推定ができる
• CPUが1つでも実時間的な処理ができる
• 単眼カメラで高精度な距離測定が可能
以下のような新しいSLAMを提案する
実行結果
関連研究
• 特徴点に基づく方法
• 直接的な方法
• ポーズグラフ最適化
関連研究
特徴点に基づく方法 直接的な方法
抜き出した特徴点と自己位置との
位置関係を計算する
画像全体の輝度から計算する
関連研究
特徴点に基づく方法 直接的な方法
特徴点の情報しか使えない
特徴点の個数が精度に影響
画像全体の情報を使える
高いロバスト性
関連研究
特徴点に基づく方法 直接的な方法
特徴点の情報しか使えない
特徴点の個数が精度に影響
画像全体の情報を使える
高いロバスト性
関連研究 -直接的な方法-
全密深度マップ
Full Dense Depth Map
準密深度マップ
Semi Dense Depth Map
画像の全ピクセルに対する距離
情報を保持する
処理が非常に重い
一つ前のフレームとの差分情報
のみを保持する
処理が軽い
関連研究 -直接的な方法-
全密深度マップ
Full Dense Depth Map
準密深度マップ
Semi Dense Depth Map
画像の全ピクセルに対する距離
情報を保持する
処理が非常に重い
一つ前のフレームとの差分情報
のみを保持する
処理が軽い
数学的要素の導入
3次元姿勢変換の表現
重み付き最小二乗法の導入
不確かさの伝播
3次元剛体変換
𝐺 =
𝑅 𝑡
0 1
with 𝑅 ∈ 𝑆𝑂 3 𝑎𝑛𝑑 𝑡 ∈ ℝ3
3次元剛体変換 𝐺 ∈ 𝑆𝐸(3)
𝑆𝑂 3 : 3次元の回転群
回転運動・並進運動
3次元相似変換
𝐺 =
𝑠𝑅 𝑡
0 1
with 𝑅 ∈ 𝑆𝑂 3 ,
3次元相似変換 𝑆 ∈ 𝑆𝑖𝑚(3)
𝑆𝑂 3 : 3次元の回転群
𝑡 ∈ ℝ3
and 𝑠 ∈ ℝ+
回転運動・並進運動・スケーリング
ガウス・ニュートン法による最適化
𝐸 𝝃 =
𝑖
𝐼𝑟𝑒𝑓 𝐩𝑖 − 𝐼 𝜔 𝐩𝑖, 𝐷𝑟𝑒𝑓 𝐩𝑖 , 𝝃
2
=: 𝑟𝑖
2
(𝝃)
𝛿𝝃 𝑛
= − 𝐉T
𝐉
−1
𝐉T
r 𝝃 n
with 𝐉 =
𝜕𝐫 𝝐 ∘ 𝝃 𝑛
𝜕𝝐
𝝐=0
𝝃(𝑛+1) = 𝛿𝝃(𝑛) ∘ 𝝃(𝑛)
以下の誤差関数を最小にするような 𝝃を求める
ガウス・ニュートン法より
以上を繰り返す
重み付きガウス・ニュートン法による最適化
𝐸 𝝃 =
𝑖
𝑟𝑖
2
(𝝃) 𝐸 𝝃 =
𝑖
𝑤𝑖 𝝃 𝑟𝑖
2
(𝝃)
重み付きガウス・ニュートン法を導入する
𝛿𝝃 𝑛
=
− 𝐉T
𝐉
−1
𝐉T
r 𝝃 n
𝛿𝝃 𝑛
=
− 𝐉T
𝐖𝐉
−1
𝐉T
𝐖r 𝝃 n
外れ値に対して鈍感になりロバスト性を
確保できる
アルゴリズム
マップ表現方法
キーフレーム
(KF)
画像 (逆)深度マップ (逆)深度マップの分散
マップ表現方法
キーフレーム 相似変換
剛体変換
キーフレームと
カメラ映像を比較し
深度マップを得る
キーフレームと
キーフレームの
相似変換を計算する
剛体変換
トラッキング
現在のキーフレームと新しく得られたカメラ画像間の
剛体変換を推定する
トラッキング
with
𝑟𝑝 𝐩, 𝝃 𝑗𝑖 ≔ 𝐼𝑖 𝐩 − 𝐼 𝜔 𝐩, 𝐷𝑖 𝐩 , 𝝃 𝑗𝑖
𝜎𝑟 𝑝
2 𝐩, 𝝃 𝑗𝑖 ≔ 2𝜎𝐼
2
+
𝜕𝑟𝑝 𝐩, 𝝃 𝑗𝑖
𝜕𝐷𝑖 𝐩
2
𝑉𝑖(𝐩)
ガウス・ニュートン法を適応して,剛体変換を求める
分散で正規化
Huber Norm
𝑟2
𝛿
≔
𝑟2
2𝛿
𝑖𝑓 𝑟 ≤ 𝛿
𝑟 −
𝛿
2
𝑜𝑡ℎ𝑒𝑟𝑤𝑖𝑠𝑒
𝐸 𝑝 𝝃 𝑗𝑖 =
𝐩∈Ω 𝐷𝑖
𝑟𝑝
2
𝐩, 𝝃 𝑗𝑖
𝜎𝑟 𝑝
2
𝐩, 𝝃 𝑗𝑖
𝛿
現在のキーフレームを 𝐾𝑖 = (𝐼𝑖, 𝐷𝑖, 𝑉𝑖) とすると
キーフレーム遷移の判別
𝑑𝑖𝑠𝑡 𝜉𝑗𝑖 > 𝑠
新規キーフレーム
生成
T
閾値
𝑑𝑖𝑠𝑡 𝝃 𝑗𝑖 ≔ 𝝃 𝑗𝑖
𝑇
𝐖𝝃 𝑗𝑖
𝝃 𝑗𝑖: 3D並進と3D回転を表現するベクトル
𝐖: 重み付けのための行列
既存キーフレーム
改善F
現在取得しているマップ域からの
離れ具合を判別
既存キーフレームの改善
新規キーフレームの生成
現在のキーフレーム
新規キーフレームの生成
現在のキーフレーム
新規のキーフレーム
剛体変換
新規キーフレームの生成
現在のキーフレーム
新規のキーフレーム
剛体変換
新規キーフレームの生成
マップ最適化
現在のキーフレーム
新規のキーフレーム
剛体変換
マップ最適化
現在のキーフレーム
新規のキーフレーム
深度の平均値を
キーフレーム間で一定にする
剛体変換
マップ最適化
新規のキーフレーム
深度の平均値を
キーフレーム間で一定にする
剛体変換
深度スケール変化
マップ最適化
新規のキーフレーム
深度の平均値を
キーフレーム間で一定にする
剛体変換
深度スケール変化
マップ最適化
新規のキーフレーム
相似変換
キーフレームが持っている情報は
深度の平均値一定だが
前キーフレームからの相似変換で
実際のスケールが得られる
マップ最適化
相似変換を求める
𝐸 𝑝 𝝃 𝑗𝑖 ≔
𝐩∈𝛀 𝐷𝑖
𝑟𝑝
2
𝐩, 𝝃 𝑗𝑖
𝜎𝑟 𝑝
2
𝐩, 𝝃 𝑗𝑖
+
𝑟𝑑
2
𝐩, 𝝃 𝑗𝑖
𝜎𝑟 𝑑
2
𝐩, 𝝃 𝑗𝑖
𝛿
𝑟𝑑 𝐩, 𝝃 𝑗𝑖 ≔ 𝐩′
3 − 𝐷𝑗( 𝐩′
1,2)
𝜎𝑟 𝑑
2
𝐩, 𝝃 𝑗𝑖 ≔ 𝑉𝑗 𝐩′
1,2
𝜕𝑟𝑑 𝐩′, 𝜉𝑗𝑖
𝜕𝐷𝑗 𝐩′
1,2
2
+ 𝑉𝑖 𝐩
𝜕𝑟𝑑 𝐩, 𝜉𝑗𝑖
𝜕𝐷𝑖 𝐩
2
マップ最適化
局所的なキーフレームの相似変換を推定してきたが,
バックグラウンドでは,マップを常に最適化し続けている
→外部論文
𝐸 𝜉 𝑊1, 𝜉 𝑊2, … , 𝜉 𝑊𝑛 ≔
𝜉 𝑗𝑖,Σ 𝑗𝑖 ∈𝜖
𝜉𝑗𝑖 ∘ 𝜉 𝑊𝑖
−1
∘ 𝜉 𝑊𝑗
𝑇
𝑗𝑖
(𝜉𝑗𝑖 ∘ 𝜉 𝑊𝑖
−1
∘ 𝜉 𝑊𝑗)
−1
結果
評価
公開されているデータセットに対する評価
屋外環境で,カメラを手に持ちながら長い距離を移動
データセットに対する推定結果の評価
A Benchmark for the Evaluation of RGB-D SLAM Sytems
素早い回転動作
ローリング
シャッター
データセットに対する推定結果の評価
𝑅𝑀𝑆𝐸 =
1
𝑁
𝑖=1
𝑦𝑖 − 𝑦𝑖
2
𝑦𝑖:実測値 𝑦𝑖:予測値
[9] 単眼VO
[15] 単眼SLAM
[14] direct RGB-D SLAM
[7] keypoint RGB-D SLAM
x: トラッキング失敗
-: 利用不可能
屋外環境における推定結果の評価
20cmのところから,10mのところまで
大規模なマップ構築をすることができた
結論
500m以上の距離を手持ち撮影した映像で
トラッキングとマッピングを行った
深度が20cmから10mまで変化する大規模な環境だったが
精度の高い3次元マップの構築と自己位置推定に成功した
他の方法と比べても処理が軽いうえ
高精度・高ロバスト性が確保できることを示せた
キーフレーム間の相似変換を求めるアルゴリズムを提示した
深度マップの構築に対して,ノイズ(分散)を確率的観点から導入した
既存研究にない新しいアプローチは以下の2点

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Visual slam
Visual slamVisual slam
Visual slam
 
関東コンピュータビジョン勉強会
関東コンピュータビジョン勉強会関東コンピュータビジョン勉強会
関東コンピュータビジョン勉強会
 
[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video Processing (NeRF...
[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video  Processing (NeRF...[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video  Processing (NeRF...
[DL輪読会]Neural Radiance Flow for 4D View Synthesis and Video Processing (NeRF...
 
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading
 
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみたORB-SLAMを動かしてみた
ORB-SLAMを動かしてみた
 
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
 
Structure from Motion
Structure from MotionStructure from Motion
Structure from Motion
 
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
 
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
 
[DL輪読会]End-to-end Recovery of Human Shape and Pose
[DL輪読会]End-to-end Recovery of Human Shape and Pose[DL輪読会]End-to-end Recovery of Human Shape and Pose
[DL輪読会]End-to-end Recovery of Human Shape and Pose
 
20180424 orb slam
20180424 orb slam20180424 orb slam
20180424 orb slam
 
ロボティクスにおける SLAM 手法と実用化例
ロボティクスにおける SLAM 手法と実用化例ロボティクスにおける SLAM 手法と実用化例
ロボティクスにおける SLAM 手法と実用化例
 
20190825 vins mono
20190825 vins mono20190825 vins mono
20190825 vins mono
 
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
 
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
【DL輪読会】"Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
 
SLAM開発における課題と対策の一例の紹介
SLAM開発における課題と対策の一例の紹介SLAM開発における課題と対策の一例の紹介
SLAM開発における課題と対策の一例の紹介
 
LiDAR-SLAM チュートリアル資料
LiDAR-SLAM チュートリアル資料LiDAR-SLAM チュートリアル資料
LiDAR-SLAM チュートリアル資料
 
Camera calibration
Camera calibrationCamera calibration
Camera calibration
 
[DL輪読会]ViNG: Learning Open-World Navigation with Visual Goals
[DL輪読会]ViNG: Learning Open-World Navigation with Visual Goals[DL輪読会]ViNG: Learning Open-World Navigation with Visual Goals
[DL輪読会]ViNG: Learning Open-World Navigation with Visual Goals
 
[DL輪読会]BANMo: Building Animatable 3D Neural Models from Many Casual Videos
[DL輪読会]BANMo: Building Animatable 3D Neural Models from Many Casual Videos[DL輪読会]BANMo: Building Animatable 3D Neural Models from Many Casual Videos
[DL輪読会]BANMo: Building Animatable 3D Neural Models from Many Casual Videos
 

Semelhante a LSD-SLAM:Large Scale Direct Monocular SLAM

Online moving camera_background_subtraction
Online moving camera_background_subtractionOnline moving camera_background_subtraction
Online moving camera_background_subtraction
Daichi Suzuo
 
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
Yoichi Shirasawa
 
Light weightbinocular sigasia2012_face
Light weightbinocular sigasia2012_faceLight weightbinocular sigasia2012_face
Light weightbinocular sigasia2012_face
ishii yasunori
 
OpenFOAMの混相流用改造solver(S-CLSVOF法)の設定・使い方
OpenFOAMの混相流用改造solver(S-CLSVOF法)の設定・使い方OpenFOAMの混相流用改造solver(S-CLSVOF法)の設定・使い方
OpenFOAMの混相流用改造solver(S-CLSVOF法)の設定・使い方
takuyayamamoto1800
 
データマイニング勉強会3
データマイニング勉強会3データマイニング勉強会3
データマイニング勉強会3
Yohei Sato
 

Semelhante a LSD-SLAM:Large Scale Direct Monocular SLAM (20)

Online moving camera_background_subtraction
Online moving camera_background_subtractionOnline moving camera_background_subtraction
Online moving camera_background_subtraction
 
[DL輪読会]SOLAR: Deep Structured Representations for Model-Based Reinforcement L...
[DL輪読会]SOLAR: Deep Structured Representations for Model-Based Reinforcement L...[DL輪読会]SOLAR: Deep Structured Representations for Model-Based Reinforcement L...
[DL輪読会]SOLAR: Deep Structured Representations for Model-Based Reinforcement L...
 
Tokyo r #43
Tokyo r #43Tokyo r #43
Tokyo r #43
 
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
GN-Net: The Gauss-Newton Loss for Deep Direct SLAMの解説
 
PRML 6.4-6.5
PRML 6.4-6.5PRML 6.4-6.5
PRML 6.4-6.5
 
ZytleBot: ROSベースの自律移動ロボットへのFPGAの統合に向けて
ZytleBot: ROSベースの自律移動ロボットへのFPGAの統合に向けてZytleBot: ROSベースの自律移動ロボットへのFPGAの統合に向けて
ZytleBot: ROSベースの自律移動ロボットへのFPGAの統合に向けて
 
CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...
CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...
CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...
 
論文読み会(DeMoN;CVPR2017)
論文読み会(DeMoN;CVPR2017)論文読み会(DeMoN;CVPR2017)
論文読み会(DeMoN;CVPR2017)
 
博士論文本審査スライド
博士論文本審査スライド博士論文本審査スライド
博士論文本審査スライド
 
卒論(島田)
卒論(島田)卒論(島田)
卒論(島田)
 
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
 
(文献紹介) 画像復元:Plug-and-Play ADMM
(文献紹介) 画像復元:Plug-and-Play ADMM(文献紹介) 画像復元:Plug-and-Play ADMM
(文献紹介) 画像復元:Plug-and-Play ADMM
 
Light weightbinocular sigasia2012_face
Light weightbinocular sigasia2012_faceLight weightbinocular sigasia2012_face
Light weightbinocular sigasia2012_face
 
Deep learning for acoustic modeling in parametric speech generation
Deep learning for acoustic modeling in parametric speech generationDeep learning for acoustic modeling in parametric speech generation
Deep learning for acoustic modeling in parametric speech generation
 
OpenFOAMの混相流用改造solver(S-CLSVOF法)の設定・使い方
OpenFOAMの混相流用改造solver(S-CLSVOF法)の設定・使い方OpenFOAMの混相流用改造solver(S-CLSVOF法)の設定・使い方
OpenFOAMの混相流用改造solver(S-CLSVOF法)の設定・使い方
 
A Brief Survey of Schrödinger Bridge (Part I)
A Brief Survey of Schrödinger Bridge (Part I)A Brief Survey of Schrödinger Bridge (Part I)
A Brief Survey of Schrödinger Bridge (Part I)
 
データマイニング勉強会3
データマイニング勉強会3データマイニング勉強会3
データマイニング勉強会3
 
1章前半
1章前半1章前半
1章前半
 
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
 
[DL Hacks]Self-Attention Generative Adversarial Networks
[DL Hacks]Self-Attention Generative Adversarial Networks[DL Hacks]Self-Attention Generative Adversarial Networks
[DL Hacks]Self-Attention Generative Adversarial Networks
 

LSD-SLAM:Large Scale Direct Monocular SLAM