2. Strictly Confidential/Copyright SIGMAXYZ Inc. all rights reserved. 1
Deep Learningを活用することで従来より遥かに精度の高い、
OCR技術をコアとしたドキュメント運用自動化ソリューション(≒超高級高性能OCR)
ディープシグマDPAとは ~概要
3. Copyright SIGMAXYZ Inc. all rights reserved. 2
OCRパッケージ・AI-API・DNNのコンペによる技術検証を実施し、
ビジネス・業務・システム要件を満たすことができるソリューションを選択
なぜディープシグマDPAを始めたのか - OCR関連技術検証
ビジネス要件
業務要件
ビジネス要件の明確化
業務要件(最終出力、
目座す精度、レスポン
ス)を検証要件へ反映
プ
ロ
セ
ス
ポ
イ
ン
ト
初期調査 技術検証実施
②
③
検証要件の明確化
①画像補正(入力画像)要件
②レイアウト認識要件
③文字認識要件
④最終出力(項目補正)要件
⑤既存システム連携要件
検証要件の整理
①
④
⑤
OCRパッケージ
AI-API
DL構築
既存システム
①, ②, ③, ④
③
①, ②, ③
④, ⑤
①, ②, ③
各社(OCR、AI-API、
DL)最小限の技術検証
要件に絞り、短期での
技術検証を実施
4. Copyright SIGMAXYZ Inc. all rights reserved. 3
従来のOCRではフォーマットの座標を特定・設定し、各項目の場所を切り取った上で
文字を認識しており、項目が同じでも座標が異なる場合は別の帳票として扱う
なぜディープシグマDPAを始めたのか - 従来のOCRの方式
★基準座標
● ●
●●
①基準座標からの
距離や座標を基準に
読取箇所を認識
②行・文字の
切り出し
③文字認識
④辞書補正
Deep
Learning
の導入が
遅れてい
るエリア
7. ディープシグマDPA 伝票情報処理自動化サービス
Copyright SIGMAXYZ Inc. all rights reserved. 6
Deep Sigma DPAは学習用のデータが数百枚単位で必要なため、フォーマット数が多
く、月間百枚以下の読み取りが必要な業務には別ソリューションを提供
用途に合わせたOCRソリューション
処理枚数 月間1万枚以上 月間数百枚~数千枚
目標精度 手入力を最小限にする 手入力での確認・修正を前提とする
対象帳票 証明書・申込書・レシート 等 請求書・注文書 等
フォーマット 数種に限定 多種類を処理
8. Copyright SIGMAXYZ Inc. all rights reserved. 7
マイクロソフト社のComputer Visionを活用し、帳票種類・項目・金額を自動認識する
ソリューション
伝票情報処理自動化サービス
Microsoft Azure
Azure Cognitive Services
Computer Vision