SlideShare uma empresa Scribd logo
1 de 26
Baixar para ler offline
機械学習プロジェクトを始
める前に押さえておきたい
ポイント
〜⼤事なことは全てチョコボールが
教えてくれる〜
ビジネス⽂脈におけるデータ分析(主に機械学習)の活⽤を議論
するLT会
@yoichi_t
2019/06/06
• 時⽥ 陽⼀(@yoichi_t)
• 所属:株式会社Glia Computing
(https://www.glia-computing.com/)
• 2018年8⽉に設⽴(Co-Founder)
• 機械学習/データ分析のPoC、導⼊⽀援、コンサル
• 過去所属
• AI系ベンチャーにて、機械学習/データ分析のPoCなどを担当
• Web系広告会社にて、広告配信の最適化、ユーザ分析などを担当
• ⼤⼿警備会社研究所にて、⼈物⾏動の研究
• NAIST(修⼠)、機械学習(強化学習)/統計でロボット制御を研究
⾃⼰紹介
AI/機械学習プロジェクトを
始める時に注意すべきポイント
• 具体的な技術/ツールの話はない
• AI/機械学習プロジェクトの設計
イメージを掴むために具体的な事例
を交えてお話しします
20190606_ml_and_buisiness
• 時⽥ 陽⼀(@yoichi_t)
• チョコボールの秘密の解明をライフワークにしている
⾃⼰紹介(続き)
チョコボール 統計
機械学習プロジェクトを始
める前に押さえておきたい
ポイント
〜⼤事なことは全てチョコボールが
教えてくれる〜
ビジネス⽂脈におけるデータ分析(主に機械学習)の活⽤を議論
するLT会
@yoichi_t
2019/06/06
「AI アルゴリズム」にデータを⼊れたら
なんでもできる
「AI アルゴリズム」にデータを⼊れたら
なんでもできる
何でもはできないよ。
学習データから抽出できることだけ。
AI/機械学習って?
• データの性質を抽出し、その性質に基づいて未知のデータの予測を
するための技術
何でもはできないよ。
学習データから抽出できること
だけ。
ビジネスへの応⽤
「プロジェクト設計」が⼤事
• 何を解決するのか?
• 結果をどう活⽤するのか?
• データは?
①何を解決するのか?
えらい⼈
データサイエンティスト
おもちゃのカンヅメを効率的
に⼿に⼊れたい
• 出現傾向を調べよう!
• 出現確率は?
• 配置に傾向は?
• 予測モデルを構築!
• パッケージに差異は
①何を解決するのか?
えらい⼈
データサイエンティスト
おもちゃのカンヅメを効率的
に⼿に⼊れたい
• 出現傾向を調べよう!
• 出現確率は?
• 配置に傾向は?
• 予測モデルを構築!
• パッケージに差異は
ちょっと待って!
ググった?
①何を解決するのか?
メルカリで売ってるよ
どう贔屓⽬にみてもこっちの⽅が安い
①何を解決するのか?
• 最もシンプルな⼿段を使うべき
• 簡単に解決できるなら別の課題に
アプローチする
本当に「機械学
習」が最善の⼿で
すか?
• ビジネスインパクトがない課題を
扱っても発展がない
本業に即した課題
を扱うべき
②意思決定/オペレーションを意識
最新の調査によると、銀のエン
ゼルの出現確率は5%弱です!
じゃー100個買えばエンゼルが
5個出るんだね!
データサイエンティスト
えらい⼈
(5%ということは、、、)
②意思決定/オペレーションを意識
Ø 必要な試⾏回数は
「幾何分布」、または、「負の⼆項分布」に従う
Ø 出現確率の事後分布に基づき期待値を算出
𝑓 𝑥|𝑘, 𝐷 = (
𝑘 + 𝑥 − 1
𝑥
𝜃- 1 − 𝜃 . 𝑝 𝜃|𝐷 𝑑𝜃
負の⼆項分布
どこまでのリスクを⾒込んで予算
を積むか
施策(意思決定)につながる出⼒
事後分布
②意思決定/オペレーションを
意識
• どんな情報が求められているのか?
• どんな情報を出すべきなのか?
「意思決定」につ
ながる出⼒を出し
ていますか?
• リスクが0はあり得ない
• 「精度100%じゃないと使えない」→
だったらやめましょう
リスクの⾒積もり
に基づいた意思決
定
③データと課題の関係性
データサイエンティスト
画像データ20枚しか⽤意でき
なかった。。。
もっとデータを作らねば。。。
うちには「ビッグデータ」が
ある
(⼿書き、未アノテーション、
⽋損、負例なし)
えらい⼈
数年後
③データと課題の関係性
ChocoballDetector
• こういう画像が数百枚
• チョコボールをDetectionして数を
数えたい
• アノテーション作業は超⼤変
• 22枚の画像データで学習
• そこそこの精度
• 「データが多いほど汎化性能が⾼い」は真
• ChocoballDetectorは22枚で学習
• 個数が分かれば良いというタスク
• データの条件を固定(過学習)
• 過学習は悪か?
• アプリケーションは限られた範囲での利⽤を想定
• 利⽤シーンの中で使えれば良い
③データと課題の関係性
③データと課題の関係性
• 何を課題にするかでアプローチが変わる
• 運⽤時の条件とデータ収集の条件は同じ
にする必要がある
「課題」に合わせ
てデータを⽤意し
ていますか?
• 「未知のクラス」を認識することは難し
い
• OpenWorld問題
学習データの外の
世界を認識するこ
とは難しい
課題設計が重要
• 本当に「機械学習」が最善の⼿ですか?
• 本業に即した課題を扱う
どのような問題を解くか
• 「意思決定」につながる出⼒を出していますか?
• リスクの⾒積もりに基づいた意思決定
意思決定/オペレーションを意識した出⼒
• データから抽出できることしかできない
• 学習データの外の世界を認識することは難しい
課題に合わせてデータのアプローチを決める
課題(ビジネスドメイン)に対する深い知⾒
• ビジネスドメインの知識 x 機械学習/統計の知識
• 良いパートナーを⾒つける
GliaComputingでは課題設計からプロジェクト進⾏を
サポートするツールを開発中
チョコボールは⾯⽩い
味毎の重量傾向
の違いを推定
90%信⽤区間:
3.5%~10.4%
エンゼルの出現確率を推定
ピーナツ
イチゴ
チョコバナナ
個数の変化点推定

Mais conteúdo relacionado

Mais procurados

PyData.Tokyo Hackathon#2 TensorFlow
PyData.Tokyo Hackathon#2 TensorFlowPyData.Tokyo Hackathon#2 TensorFlow
PyData.Tokyo Hackathon#2 TensorFlowAkira Shibata
 
Sano tokyowebmining 36_20140526
Sano tokyowebmining 36_20140526Sano tokyowebmining 36_20140526
Sano tokyowebmining 36_20140526Masakazu Sano
 
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいことMLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいことRakuten Group, Inc.
 
つながる目録、つながるサービス@図書館総合展(2015.11.12)
つながる目録、つながるサービス@図書館総合展(2015.11.12)つながる目録、つながるサービス@図書館総合展(2015.11.12)
つながる目録、つながるサービス@図書館総合展(2015.11.12)Ikki Ohmukai
 
20150421 日経ビッグデータカンファレンス
20150421 日経ビッグデータカンファレンス20150421 日経ビッグデータカンファレンス
20150421 日経ビッグデータカンファレンスAkira Shibata
 
PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1Akira Shibata
 

Mais procurados (7)

PyData.Tokyo Hackathon#2 TensorFlow
PyData.Tokyo Hackathon#2 TensorFlowPyData.Tokyo Hackathon#2 TensorFlow
PyData.Tokyo Hackathon#2 TensorFlow
 
Sano tokyowebmining 36_20140526
Sano tokyowebmining 36_20140526Sano tokyowebmining 36_20140526
Sano tokyowebmining 36_20140526
 
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいことMLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
 
つながる目録、つながるサービス@図書館総合展(2015.11.12)
つながる目録、つながるサービス@図書館総合展(2015.11.12)つながる目録、つながるサービス@図書館総合展(2015.11.12)
つながる目録、つながるサービス@図書館総合展(2015.11.12)
 
20150421 日経ビッグデータカンファレンス
20150421 日経ビッグデータカンファレンス20150421 日経ビッグデータカンファレンス
20150421 日経ビッグデータカンファレンス
 
PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1PyData Tokyo Tutorial & Hackathon #1
PyData Tokyo Tutorial & Hackathon #1
 
Mlct 20150430v2
Mlct 20150430v2Mlct 20150430v2
Mlct 20150430v2
 

Semelhante a 20190606_ml_and_buisiness

「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史Leading Edge Co.,Ltd.
 
20230216_Python機械学習プログラミング.pdf
20230216_Python機械学習プログラミング.pdf20230216_Python機械学習プログラミング.pdf
20230216_Python機械学習プログラミング.pdfShintaro Fukushima
 
20190514 tddot truestar
20190514 tddot truestar20190514 tddot truestar
20190514 tddot truestarToshikuni Fuji
 
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~株式会社Consumer first
 
みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様Takeshi Akutsu
 
IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用
IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用
IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用ナレッジコミュニケーション
 
モデリングの彼方に未来を見た
モデリングの彼方に未来を見たモデリングの彼方に未来を見た
モデリングの彼方に未来を見たHagimoto Junzo
 
エッジヘビーコンピューティングと機械学習
エッジヘビーコンピューティングと機械学習エッジヘビーコンピューティングと機械学習
エッジヘビーコンピューティングと機械学習Preferred Networks
 
企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキルRakuten Group, Inc.
 
Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Kenji Noguchi
 
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステムJunichi Noda
 
TIS 戦略技術センター AI技術推進室紹介
TIS 戦略技術センター AI技術推進室紹介TIS 戦略技術センター AI技術推進室紹介
TIS 戦略技術センター AI技術推進室紹介Takahiro Kubo
 
先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際Tetsutaro Watanabe
 
【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」
【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」
【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」GIG inc.
 
Power BI の可能性?見(魅)せてやるよ!!!その本気ってやつをな
Power BI の可能性?見(魅)せてやるよ!!!その本気ってやつをなPower BI の可能性?見(魅)せてやるよ!!!その本気ってやつをな
Power BI の可能性?見(魅)せてやるよ!!!その本気ってやつをなYugo Shimizu
 

Semelhante a 20190606_ml_and_buisiness (20)

「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
 
20230216_Python機械学習プログラミング.pdf
20230216_Python機械学習プログラミング.pdf20230216_Python機械学習プログラミング.pdf
20230216_Python機械学習プログラミング.pdf
 
【Pm zen】pmはいつ学び始めるべきか? 20160311
【Pm zen】pmはいつ学び始めるべきか? 20160311【Pm zen】pmはいつ学び始めるべきか? 20160311
【Pm zen】pmはいつ学び始めるべきか? 20160311
 
20190514 tddot truestar
20190514 tddot truestar20190514 tddot truestar
20190514 tddot truestar
 
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~大切なお客様を、一生のお客様に  ~自社・競合データから導く、結果につながるデータ分析の最新事例~
大切なお客様を、一生のお客様に ~自社・競合データから導く、結果につながるデータ分析の最新事例~
 
Go + Pulsar WebSocket APIの利用事例 #pulsarjp
Go + Pulsar WebSocket APIの利用事例 #pulsarjpGo + Pulsar WebSocket APIの利用事例 #pulsarjp
Go + Pulsar WebSocket APIの利用事例 #pulsarjp
 
爆速機械学習サービス応用:実践編#yjdsw1
爆速機械学習サービス応用:実践編#yjdsw1爆速機械学習サービス応用:実践編#yjdsw1
爆速機械学習サービス応用:実践編#yjdsw1
 
みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様
 
Io t labo20180312pub
Io t labo20180312pubIo t labo20180312pub
Io t labo20180312pub
 
IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用
IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用
IoT × 機械学習 製造機器のデジタル数字認識と IoT によるデータ収集・活用
 
モデリングの彼方に未来を見た
モデリングの彼方に未来を見たモデリングの彼方に未来を見た
モデリングの彼方に未来を見た
 
エッジヘビーコンピューティングと機械学習
エッジヘビーコンピューティングと機械学習エッジヘビーコンピューティングと機械学習
エッジヘビーコンピューティングと機械学習
 
企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル
 
Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ Tableau Developers Club Season2 - 外部サービス連携デモ
Tableau Developers Club Season2 - 外部サービス連携デモ
 
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
 
TIS 戦略技術センター AI技術推進室紹介
TIS 戦略技術センター AI技術推進室紹介TIS 戦略技術センター AI技術推進室紹介
TIS 戦略技術センター AI技術推進室紹介
 
先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際先駆者に学ぶ MLOpsの実際
先駆者に学ぶ MLOpsの実際
 
Naite20 cmmi
Naite20 cmmiNaite20 cmmi
Naite20 cmmi
 
【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」
【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」
【Tech Trend Talk vol.5】社外向け勉強会「教師あり学習とプロダクトへの活用 -(GIG)」
 
Power BI の可能性?見(魅)せてやるよ!!!その本気ってやつをな
Power BI の可能性?見(魅)せてやるよ!!!その本気ってやつをなPower BI の可能性?見(魅)せてやるよ!!!その本気ってやつをな
Power BI の可能性?見(魅)せてやるよ!!!その本気ってやつをな
 

Mais de Yoichi Tokita

20200808_PyMCを使えばちょっと複雑な確率モデルも怖くない
20200808_PyMCを使えばちょっと複雑な確率モデルも怖くない20200808_PyMCを使えばちょっと複雑な確率モデルも怖くない
20200808_PyMCを使えばちょっと複雑な確率モデルも怖くないYoichi Tokita
 
20191117_choco_bayes_pub
20191117_choco_bayes_pub20191117_choco_bayes_pub
20191117_choco_bayes_pubYoichi Tokita
 
20191006 bayesian dl_1_pub
20191006 bayesian dl_1_pub20191006 bayesian dl_1_pub
20191006 bayesian dl_1_pubYoichi Tokita
 
20190721 gaussian process
20190721 gaussian process20190721 gaussian process
20190721 gaussian processYoichi Tokita
 
20190609 bayes ml ch3
20190609 bayes ml ch320190609 bayes ml ch3
20190609 bayes ml ch3Yoichi Tokita
 
20190512 bayes hands-on
20190512 bayes hands-on20190512 bayes hands-on
20190512 bayes hands-onYoichi Tokita
 
20190330 chainer meetup chocoball
20190330 chainer meetup chocoball20190330 chainer meetup chocoball
20190330 chainer meetup chocoballYoichi Tokita
 
20190316 bayes modeling
20190316 bayes modeling 20190316 bayes modeling
20190316 bayes modeling Yoichi Tokita
 
20190317 prml ch2 probability Distribution
20190317 prml ch2 probability Distribution20190317 prml ch2 probability Distribution
20190317 prml ch2 probability DistributionYoichi Tokita
 
20190209 bayes modeling_s_pub
20190209 bayes modeling_s_pub20190209 bayes modeling_s_pub
20190209 bayes modeling_s_pubYoichi Tokita
 
チョコボールのエンゼル出現確率をベイズ推定する
チョコボールのエンゼル出現確率をベイズ推定するチョコボールのエンゼル出現確率をベイズ推定する
チョコボールのエンゼル出現確率をベイズ推定するYoichi Tokita
 

Mais de Yoichi Tokita (11)

20200808_PyMCを使えばちょっと複雑な確率モデルも怖くない
20200808_PyMCを使えばちょっと複雑な確率モデルも怖くない20200808_PyMCを使えばちょっと複雑な確率モデルも怖くない
20200808_PyMCを使えばちょっと複雑な確率モデルも怖くない
 
20191117_choco_bayes_pub
20191117_choco_bayes_pub20191117_choco_bayes_pub
20191117_choco_bayes_pub
 
20191006 bayesian dl_1_pub
20191006 bayesian dl_1_pub20191006 bayesian dl_1_pub
20191006 bayesian dl_1_pub
 
20190721 gaussian process
20190721 gaussian process20190721 gaussian process
20190721 gaussian process
 
20190609 bayes ml ch3
20190609 bayes ml ch320190609 bayes ml ch3
20190609 bayes ml ch3
 
20190512 bayes hands-on
20190512 bayes hands-on20190512 bayes hands-on
20190512 bayes hands-on
 
20190330 chainer meetup chocoball
20190330 chainer meetup chocoball20190330 chainer meetup chocoball
20190330 chainer meetup chocoball
 
20190316 bayes modeling
20190316 bayes modeling 20190316 bayes modeling
20190316 bayes modeling
 
20190317 prml ch2 probability Distribution
20190317 prml ch2 probability Distribution20190317 prml ch2 probability Distribution
20190317 prml ch2 probability Distribution
 
20190209 bayes modeling_s_pub
20190209 bayes modeling_s_pub20190209 bayes modeling_s_pub
20190209 bayes modeling_s_pub
 
チョコボールのエンゼル出現確率をベイズ推定する
チョコボールのエンゼル出現確率をベイズ推定するチョコボールのエンゼル出現確率をベイズ推定する
チョコボールのエンゼル出現確率をベイズ推定する
 

20190606_ml_and_buisiness