5. 先行研究
[1] Yan Yan, Yuxing Mao, and Bo Li. SECOND: Sparsely EmbeddedCconvolutional Detection. Sensors, 18(10):3337, 2018
[2] Yin Zhou and Oncel Tuzel. Voxelnet: End-to-end learning for point cloud based 3d object detection.
In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pages 4490–4499, 2018. 5
SECOND[1]
● VoxelNet[2]の精度を落とさず4.6倍高速化
● 他の既存手法と比較し精度は劣るが実行時間が短い
● 車・自転車・歩行者のマルチクラス検出に非対応
8. Voxel Encoder Network(VEN)の改良
クラス検出
位置推定
方向推定
8Yin Zhou and Oncel Tuzel. Voxelnet: End-to-end learning for point cloud based 3d object detection.
In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pages 4490–4499, 2018.
● 転移畳込みによる計算の効率化
9. Sparse Middle Network(SMN)の改良
● フィルタリングで起こる特徴量減少の抑制
9
クラス検出
位置推定
方向推定
[2] Benjamin Graham and Laurens van der Maaten. Submanifold sparse convolutional networks. arXiv preprint arXiv:1706.01307, 2017.
[3] Ben Graham. Sparse 3d convolutional neural networks. arXiv preprint arXiv:1505.02890, 2015.
10. Regison Proposal Network(RPN)の改良
10
クラス検出
位置推定
方向推定
Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Identity mappings in deep residual networks.
In European conference on computer vision, pages 630–645. Springer, 2016.
● ショートカットコネクションにより正確な位置情報の伝播
11. 評価
● KITTI 3D Object Detection Dataset [4] の学習用データを
train/testに分割
● 評価指標: Average Precision
● 対象クラス: 車・自転車・歩行者
● レベル: Easy, Moderate, Hard
11
CPU Intel Xeon Gold 6126 2.60GHz
GPU NVIDIA Tesla V100 16GB
実行環境 VEN Voxel Encoder Network
SMN Sparse Middle Network
RPN Region Proposal Network
ネットワークの略称
[4] Andreas Geiger, Philip Lenz, and Raquel Urtasun. Are we ready for autonomous driving? the kitti vision benchmark suite.
In Conference on Computer Vision and Pattern Recognition (CVPR), 2012