6. 関連研究
• 2 stage (detection と recognition双方のモデルが独立)
– Textboxes: A fast text detector with a single deep neural network [Liao
et.al. AAAI2017]
• DetectionにSSDベースの手法を用い、recognitionniはCRNNを使っている
– Rosetta: Large Scale System for Text Detection and Recognition in
Images[Borisyuk et.al. KDD 2018]
• P.7で紹介。FBの実運用システム。
• End-to-End (単一モデルで推論)
– Towards end-to-end text spotting with convolutional recurrent neural
networks. [Li et.al. ICCV2017]
• P.8で紹介
6
7. 関連研究: 実運用システムの例:
Rosetta: Large Scale System for Text Detection and Recognition
in Images[Borisyuk et.al. KDD 2018]
• Facebookの実運用システムのモデル。text detectionとtext
recognitionの2つのモデルを使っている。
7
8. 関連研究: Towards End-to-end Text Spotting with Convolutional
Recurrent Neural Networks[Li et.al. ICCV2017]
1. Text Proposal Network(TPN)で文字領域認識
2. 1の文字領域中の文字をLSTM + attentionを用いて文字認識
8