SlideShare a Scribd company logo
1 of 12
Download to read offline
2017/02/11 CV勉強会@関東
クレジットカード番号認識
皆川卓也
自己紹介
2
テクニカル・ソリューション・アーキテクト
皆川 卓也(みながわ たくや)
フリーエンジニア(ビジョン&ITラボ)
「コンピュータビジョン勉強会@関東」主催
博士(工学)
略歴:
1999-2003年
日本HP(後にアジレント・テクノロジーへ分社)にて、ITエンジニアとしてシステム構築、プリ
セールス、プロジェクトマネジメント、サポート等の業務に従事
2004-2009年
コンピュータビジョンを用いたシステム/アプリ/サービス開発等に従事
2007-2010年
慶應義塾大学大学院 後期博士課程にて、コンピュータビジョンを専攻
単位取得退学後、博士号取得(2014年)
2009年-現在
フリーランスとして、コンピュータビジョンのコンサル/研究/開発等に従事
http://visitlab.jp
プログラム概要
 入力としてクレジットカード画像を与えられた時、クレジッ
トカード番号を読み取り、その位置と認識結果を出力す
るプログラムをOpenCVを使って作成
 https://github.com/takmin/CreditNumberRecognizer
 約3年前に作成
入力画像 文字+座標
開発プログラム
1234 5678 9876 5432
開発の経緯
4
2013年9月頃、とある企業から画像からクレジットカード番号を
認識するプログラムが欲しいと打診される。
必ずできる自信もなかったので、成功報酬として請ける。(はじ
めての成功報酬案件)
博士論文の執筆と重なり、しんどい思いをしながら開発を
進め、どうにかお客さんが気に入るものが出来上がる
半年以上放置された後、状況が変わったからとキャンセル
される
2015年4月頃、売れる見込みもないためオープンソースに
する
地味に難しい問題
5
 浮かし彫りの文字で、背景画像に様々なパターンがある
ため、単純な文字領域の二値化ができない。(OCRが使
えない)
 光沢/反射がある
 学習画像を集めるのが困難
 お客さんが従業員のものを(加工して)集めて、70枚程度
処理の流れ
6
数字列領域の検出
数字の切り取り
特徴量抽出
Support Vector Machine
数字領域(高さ)の切り出し
 エッジ画像の投影(プロジェクション)から算出(MSER)
数字の切り出し
 数列領域からエッジ画像のプロジェクションを用いて数
字を切り出し。
 コスト関数が最も小さくなる切り出し方を求める。
 文字の幅とプロジェクションの分布
 分枝限定法で全探索
 4-4-4-4(Visa, etc), 4-6-5 (AMEX,etc), 4-6-4 (Diners)のうち、
最もコストの低かったものを採用
特徴量の抽出
 5回の交差検定で実験 (%)
 One-vs-One SVM
Image Features 1st 2nd 3rd 4th 5th Average
Gray Scale
(Base line)
50.3% 52.3% 53.8% 53.1% 52.0% 52.3%
LBP 61.9% 70.1% 65.5% 66.3% 60.7% 64.9%
HOG 92.4% 92.9% 92.9% 90.8% 91.8% 92.2%
Sobel 98.5% 98.5% 95.9% 93.9% 94.4% 96.2%
Gabor 50.8% 51.3% 52.3% 53.6% 50.0% 51.6%
Sobel +
MaxPooling
99.0% 97.5% 97.5% 96.4% 95.9% 97.3%
Gabor +
MaxPooling
96.4% 98.0% 97.0% 94.4% 95.4% 96.2%
特徴量の抽出
10
 Sobel Filterを用いて4方向のエッジ成分を取得
 Max Poolingで変形にロバストに
 最終的に1文字あたり240次元の特徴量
4方向の
エッジ
Max
Pooling
11
デモ
まとめ
12
 せっかく作ったのに誰にも使われないのは寂しいので宣
伝してみた
 案件は逃したが「案件の取り方」については学ばせても
らった
 限られた期間の中で開発したので、まだまだ精度を上げ
る余地がある
 傾きの補正
 動画の活用
 Data Augmentation
 (Deepでない) CNN等特徴量の改良

More Related Content

What's hot

What's hot (20)

「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料「コンピュータビジョン勉強会@関東」紹介資料
「コンピュータビジョン勉強会@関東」紹介資料
 
20170806 Discriminative Optimization
20170806 Discriminative Optimization20170806 Discriminative Optimization
20170806 Discriminative Optimization
 
Semantic segmentation2
Semantic segmentation2Semantic segmentation2
Semantic segmentation2
 
How to feed myself with computer vision
How to feed myself with computer visionHow to feed myself with computer vision
How to feed myself with computer vision
 
20180424 orb slam
20180424 orb slam20180424 orb slam
20180424 orb slam
 
cvsaisentan5 Multi View Stereo 3.3
cvsaisentan5 Multi View Stereo 3.3cvsaisentan5 Multi View Stereo 3.3
cvsaisentan5 Multi View Stereo 3.3
 
Pn learning takmin
Pn learning takminPn learning takmin
Pn learning takmin
 
Cvpr2017事前読み会
Cvpr2017事前読み会Cvpr2017事前読み会
Cvpr2017事前読み会
 
Show and tell takmin
Show and tell takminShow and tell takmin
Show and tell takmin
 
CVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNetCVPR2018のPointCloudのCNN論文とSPLATNet
CVPR2018のPointCloudのCNN論文とSPLATNet
 
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning[CV勉強会]Active Object Localization with Deep Reinfocement Learning
[CV勉強会]Active Object Localization with Deep Reinfocement Learning
 
20160717 dikf
20160717 dikf20160717 dikf
20160717 dikf
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
 
3DFeat-Net
3DFeat-Net3DFeat-Net
3DFeat-Net
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summary
 
20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading20180527 ORB SLAM Code Reading
20180527 ORB SLAM Code Reading
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection survey
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
 
Point net
Point netPoint net
Point net
 

Similar to 20170211クレジットカード認識

Service Design Roundtable on 2/15/2014, Y. Sawatani
Service Design Roundtable on 2/15/2014, Y. SawataniService Design Roundtable on 2/15/2014, Y. Sawatani
Service Design Roundtable on 2/15/2014, Y. Sawatani
Yuriko Sawatani
 

Similar to 20170211クレジットカード認識 (20)

Service Design Roundtable on 2/15/2014, Y. Sawatani
Service Design Roundtable on 2/15/2014, Y. SawataniService Design Roundtable on 2/15/2014, Y. Sawatani
Service Design Roundtable on 2/15/2014, Y. Sawatani
 
機械学習 温故知新(第47回 Machine Learning 15minutes! Broadcast)
機械学習 温故知新(第47回 Machine Learning 15minutes! Broadcast)機械学習 温故知新(第47回 Machine Learning 15minutes! Broadcast)
機械学習 温故知新(第47回 Machine Learning 15minutes! Broadcast)
 
機械学習による推定ユーザー属性の安定供給のための施策(第56回 Machine Learning 15minutes! Broadcast)
機械学習による推定ユーザー属性の安定供給のための施策(第56回 Machine Learning 15minutes! Broadcast)機械学習による推定ユーザー属性の安定供給のための施策(第56回 Machine Learning 15minutes! Broadcast)
機械学習による推定ユーザー属性の安定供給のための施策(第56回 Machine Learning 15minutes! Broadcast)
 
UXデザインが大事なのはわかるけど エンジニアの私ができることってなんでしょう?
UXデザインが大事なのはわかるけどエンジニアの私ができることってなんでしょう?UXデザインが大事なのはわかるけどエンジニアの私ができることってなんでしょう?
UXデザインが大事なのはわかるけど エンジニアの私ができることってなんでしょう?
 
サービスデザインとUXDそしてデザインプロセス
サービスデザインとUXDそしてデザインプロセスサービスデザインとUXDそしてデザインプロセス
サービスデザインとUXDそしてデザインプロセス
 
エンジニアの立場で考えるUXデザイン
エンジニアの立場で考えるUXデザインエンジニアの立場で考えるUXデザイン
エンジニアの立場で考えるUXデザイン
 
使う人の体験を時間軸で考えよう 〜UXデザインの視点を取り入れる
使う人の体験を時間軸で考えよう〜UXデザインの視点を取り入れる使う人の体験を時間軸で考えよう〜UXデザインの視点を取り入れる
使う人の体験を時間軸で考えよう 〜UXデザインの視点を取り入れる
 
UXデザインとコンセプト評価 ~俺様企画はだめなのよ
UXデザインとコンセプト評価~俺様企画はだめなのよUXデザインとコンセプト評価~俺様企画はだめなのよ
UXデザインとコンセプト評価 ~俺様企画はだめなのよ
 
人々が“社会と関わっている実感”をデザインすることはを目指して
人々が“社会と関わっている実感”をデザインすることはを目指して人々が“社会と関わっている実感”をデザインすることはを目指して
人々が“社会と関わっている実感”をデザインすることはを目指して
 
研究室紹介
研究室紹介研究室紹介
研究室紹介
 
「業務システムにモバイルを!実践エンタープライズモバイル開発プロジェクト」
「業務システムにモバイルを!実践エンタープライズモバイル開発プロジェクト」 「業務システムにモバイルを!実践エンタープライズモバイル開発プロジェクト」
「業務システムにモバイルを!実践エンタープライズモバイル開発プロジェクト」
 
Microsoft AI と深層学習
Microsoft AI と深層学習Microsoft AI と深層学習
Microsoft AI と深層学習
 
UXデザイン概論
UXデザイン概論UXデザイン概論
UXデザイン概論
 
アドテクノロジーのサービスにおけるアジャイル開発
アドテクノロジーのサービスにおけるアジャイル開発アドテクノロジーのサービスにおけるアジャイル開発
アドテクノロジーのサービスにおけるアジャイル開発
 
Portfolio ver01
Portfolio ver01Portfolio ver01
Portfolio ver01
 
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation
 
”安藤昌也さん”のUX論 ~ 利他的な「私」
”安藤昌也さん”のUX論 ~ 利他的な「私」”安藤昌也さん”のUX論 ~ 利他的な「私」
”安藤昌也さん”のUX論 ~ 利他的な「私」
 
WebController for V-Sido Connect:WebRTCとWebGLで作る人型ロボット遠隔操縦システム(1)
WebController for V-Sido Connect:WebRTCとWebGLで作る人型ロボット遠隔操縦システム(1)WebController for V-Sido Connect:WebRTCとWebGLで作る人型ロボット遠隔操縦システム(1)
WebController for V-Sido Connect:WebRTCとWebGLで作る人型ロボット遠隔操縦システム(1)
 
見やすいアウトプットのつくりかた
見やすいアウトプットのつくりかた見やすいアウトプットのつくりかた
見やすいアウトプットのつくりかた
 
掃除道2級に関するQ&A
掃除道2級に関するQ&A掃除道2級に関するQ&A
掃除道2級に関するQ&A
 

More from Takuya Minagawa

車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術
Takuya Minagawa
 

More from Takuya Minagawa (15)

Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and Architecture
 
MobileNeRF
MobileNeRFMobileNeRF
MobileNeRF
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal Problems
 
ConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdf
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事
 
20210711 deepI2P
20210711 deepI2P20210711 deepI2P
20210711 deepI2P
 
20201010 personreid
20201010 personreid20201010 personreid
20201010 personreid
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)
 
20200704 bsp net
20200704 bsp net20200704 bsp net
20200704 bsp net
 
20190825 vins mono
20190825 vins mono20190825 vins mono
20190825 vins mono
 
Visual slam
Visual slamVisual slam
Visual slam
 
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey
 
object detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: surveyobject detection with lidar-camera fusion: survey
object detection with lidar-camera fusion: survey
 
車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術車載カメラの映像から歩行者に関わる危険を予測する技術
車載カメラの映像から歩行者に関わる危険を予測する技術
 

Recently uploaded

Recently uploaded (7)

Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 

20170211クレジットカード認識