Mais conteúdo relacionado
Semelhante a GCPUG Sapporo vol.2 ML Night (20)
GCPUG Sapporo vol.2 ML Night
- 2. 今日話すこと
• 自己紹介 & 会社紹介
• 毎朝体操
• 採点の仕組
• 深層学習の導入
– 隔週更新している採点エンジンが1ヶ月前か
ら深層学習に切り変わっている話
• まとめ
• 付録(求人 & 技術紹介)
2
- 4. 山 口 陽 平
@melleo1978
• 所属 & 経歴
– 有限会社 来栖川電算 取締役
– Mashup Awards 9 優秀賞受賞
– 名古屋工業大学大学院 博士前期課程修了
– IPA未踏ソフトウェア創造事業 採択
• 自己紹介 企画 ~ 実装まで全部やる人
– 認識技術 & アルゴリズム の研究開発
• 文字認識,物体認識,動作認識,行動認識
– 言語処理系 の研究開発
• 分散DB,仮想機械,コンパイラ
• 好きなGCP BigQuery
※実物に髪の毛はありません。
4
- 5. 山 口 陽 平
@melleo1978
• [実践]画像認識 を執筆 WEB+DB PRESS Vol.83
– これから画像認識をはじめる人におススメ
5
– OpenCV の使い
方や実装例
– SIFTなどの各種
アルゴリズムや
特定物体認識の
しくみ
– 精度改善への取
り組み方
- 6. 来栖川電算
設立 2003年(名古屋工業大学発ベンチャー) 従業員 38人
• SF世界の技術を実現し、社会に役立てる
– 人工知能技術のライセンス販売・研究・SI
• 文字認識,物体認識,動作認識,行動認識
– スマホアプリの企画・制作・運営
スマートライフ技術
NTTドコモ様との共同研究
スマートドライブ技術
大手自動車メーカー様むけ
メイドさん
もふくめて
6
- 11. 150,000 DL 突破
112 ヶ国の 20 ~ 50 代女性が自宅・職場・旅先で活用
11
0.0%
10.0%
20.0%
30.0%
40.0%
18~24歳 25~34歳 35~44歳 45~54歳 55~64歳 65歳以上
男
32.7
%女
67.3
%
15053
いいね!
- 12. 知名度上昇中
”風変わり” なアプリなので様々なメディアが注目
• Mashup Award 9
– 日本最大のアプリコンテストで優秀賞
• アプリソムリエ
– 【石井寛子アプリ事始】「毎朝体操」
超最先端ラジオ体操第1!?
• 週刊朝日
– 【おすすめアプリ生活】あなたの“ラジ
オ体操度”が測れる「毎朝体操」
• 日経新聞
– 職場で気軽に体ほぐし ヨガ・体操…
お助けアプリ
• 文化放送
– ドコモ団塊倶楽部
– 8月23日(土)11:00 ~ 13:00
– アプリ紹介コーナー(生放送)
12
- 13. マグニチュード3~4
みんなのラジオ体操の熱量を合計するとヤバい!
• 13.581 GJ2014年6月22日時点
– 実はラジオ体操は運動強度が高い!
熱量 状況
1.500 GJ 雷の平均のエネルギー
1.770 GJ
質量1kgの物体が木星の引力圏から脱出するために
必要な運動エネルギー
2.000 GJ マグニチュード3の地震のエネルギー
4.184 GJ TNT火薬1トンの爆発のエネルギー
8.532 GJ 世界の人口1人あたりの年間消費電力量(2002年)
13.581 GJ 毎朝体操の総熱量 2014年6月22日時点
64.100 GJ マグニチュード4の地震のエネルギー
運動強度 状況
2.0 METS 電車の中で立っている
3.0 METS 庭仕事・野球の野手
3.5 METS 平地での自転車
4.0 METS ハイキング・速足
4.5 METS ラジオ体操
6.0 METS 階段昇降・卓球
9.0 METS
水泳・高強度の長距離
走・筋力トレーニング
13
- 20. 導かれた方式
頑健なアルゴリズム × ビッグデータ × エッジヘビー
• 分類タスクへの還元(頑健なアルゴリズム)
– 腕の軌道のズレが分かるほどのセンサではな
いが、腕の動きの種類なら分かりそう。
• 網羅的なデータ収集(ビッグデータ)
– 個人差により全く異なるデータになる上、そ
の影響が少ない分析方法がなさそう(データが
多様体を形成 ⇒ 部分空間ごとに異なる法則に支
配)。
• リアルタイムな分類(エッジヘビー)
– 古いスマホでも動作する軽量な実装がいる。
20
- 25. 深層学習の導入
膨大な軽量特徴 × 集団学習 ⇒ 深層学習(DNN)
• 1. 手法の変更
– 採点における分類タスクを置き換え
– 旧手法:膨大な軽量特徴 × 集団学習
– 新手法:深層学習
• 2. TensorFlow Manager
– TensorFlow で作った深層学習のための環境
• 3. TensorFlow Compiler
– TensorFlow で学習したモデルを軽量な実行形
式へ変換する最適化コンパイラ
25
- 28. 小規模実験
かなりチューンされた手法に勝つのは容易ではない
• 事例数(データオーギュメンテーションなし)
– 訓練 1,409,410,検証 145,452
• 処理時間(サーバで測定)
– 旧:訓練 0.5h,検証 17.0s
– 新:訓練 16.8h / 95.8epoch (GPU),検証 72.0s
28
種目 手法 Accuracy※ Recall※ Precision※ F-Measure※
ラジオ体操第1 旧 78.5% 77.6% 78.2% 77.7%
ラジオ体操第1 新 79.1% 76.3% 81.2% 76.6%
※種目ごとに、それを構成する運動に関する評価値を求め、平均したものです。
※アプリでは平滑化などの後処理が入っているので、1~3% ほど良くなります。
- 29. リリース規模実験1
事例が増えるとパラメータが多い深層学習が有利に
• 事例数(データオーギュメンテーションなし)
– 訓練 27,822,604,検証 27,453,840
• 処理時間(サーバで測定)
– 旧:訓練 8.0h,検証 0.9h
– 新:訓練 23.7h / 29.4epoch (GPU),検証 6.2h
29
種目 手法 Accuracy Recall Precision F-Measure
ラジオ体操第1 旧 83.2% 84.3% 82.8% 83.4%
ラジオ体操第1 新 86.8% 87.1% 87.6% 87.1%
ラジオ体操第2 旧 81.8% 81.3% 82.6% 81.7%
ラジオ体操第2 新 84.5% 83.1% 85.2% 83.7%
※いろいろ改良されているので
小規模実験とは比較できない
- 31. まとめ
旧新手法は一長一短なので ”使い分け” が重要
• 膨大な軽量特徴 × 集団学習
– 学習が大変速いので傾向を把握するにはよ
い。物理現象に対応するハイパーパラメータ
にあたりを付けるのに使える。
• 深層学習
– 事例とパラメータが増えれば猛烈に賢くな
る。
– 学習時間が長すぎるので実験を回しづらい。
– 推論にかかる時間やメモリ容量を抑える実装
を作らないと、スマホには組み込めない。
31
- 36. TensorFlow Compiler
TensorFlow で学習した DNN を効率的な実装へ変換
• DNN の推論計算を近似し
て、高速化・省メモリ化
– 量子化,パラメータの削
減,計算順序の変更,計算
の共有,基底による分解,
確率的近似,カスケード,
…
• 限界性能を引き出す実装
– アーキテクチャに最適化さ
れたコード(専用命令,
キャッシュ戦略),…
36
- 37. なぜ作った?
現状の TensorFlow はモバイルアプリにのらない
• メモリ使用量の問題
– TensorFlow を Android で動かすと数百 MB、
弊社の実装なら数 MB 未満
• そもそも DNN の推論が遅い問題
– そもそも TensorFlow は汎用性に重きをおいて
いるのであまり速くない。近似により、従来
手法に匹敵する速さで、従来手法より賢い、
推論器を得られる。しかもタスクごとにドメ
イン知識を駆使して特徴を設計しなくてよ
い。
37
- 42. 新オフィス
勉強会 もやってるよ! メイドさん お手製の夕食も出るよ!
• 新オフィス
– 移転:2016 年 6 月
– 面積:以前の 2 倍!
• 最寄駅
– JR中央線 鶴舞駅
– 名古屋市営地下鉄
• 鶴舞線 鶴舞駅
• 名城線 矢場町駅
• 桜通線 新栄駅
42
いつでも
見学OK
- 46. 情景画像文字認識とは
いわゆる “OCR” とは ”扱う画像” が違う
• 悪環境下での文字認識
– 手書き・様々な書体・かすれ・点描・きつい
パース・統一性のない並び・逆光・陰・影・
グラデーション・モアレなど
• 使える場面
– 屋外でのスマホカメラを使った棚卸し
– 車載カメラからの標識認識
– 商品パッケージからの成分情報抽出
– キーワードによるアルバム・ビデオの頭出し
46
- 63. 事例:動作推定API
ドコモ と 来栖川電算 の共同研究
• 加速度データから人の動作や行動を検出
– 静止,歩き,走り,自転車,睡眠,食事
• 動作と直接対応しない行動も検出可能
• スマホ・スマートウォッチに対応
– Android,Android Wear,…
• 加速度データにアクセスできる API を備えたウェアラブルデバイス
– ※次の画像は画像中のデバイスに対応していることを保証するものではありません。
63