出典: Mingxing Tan,Ruoming Pang,Quoc V. Le:EfficientDet: Scalable and Efficient Object Detection,Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition(CVPR2020)
公開URL:https://arxiv.org/pdf/1911.09070
概要:本論文では物体検出のためのニュラールネットワークアーキテクチャ設計の選択肢を体系的に調査し、効率を改善するいくつかの最適化を提案しています。まず簡単で高速にマルチスケール特徴を融合するBiFPN、次に物体検出器の複数のパラメータを同時に変更するcompound scalingを提案し、それらに基づいて物体検出器であるEfficientDetを開発しています。これによあり幅広いリソース制約において一貫して従来手法よりも優れた効率を達成しました。
18. Ablation Study (Disentagling backbone and BiFPN)
backboneであるEfficientNetとBiFPNがどれほど寄与しているか
• backboneのRetinaNet detector with ResNet50とFPNから始める
• backboneをEfficientNet-B3に置き換え
•より少ないparametersとFLOPSで約3APの増加
• FPNとBiFPNに置き換え
•より少ないparametersとFLOPSで約4APの増加
18
19. Ablation Study (BiFPN Cross-scale Connections)
BiFPN以外のCross-scale Connectionsの特徴ネットワークとの比較
•他手法で少ないParamsとFLOPsで高い精度
19
20. Ablation Study (Softmax vs Fast Normalized Fusion)
BiFPNの特徴量の重み付け手法の比較
•似た挙動だが採用したFast Fusionが近い精度で約1.3倍高速
•入力が2つのノードで比較。学習と共に急速に重みが変化している
如何に異なる解像度の入力が不均等に寄与しているかを示す
20