SlideShare uma empresa Scribd logo
1 de 46
© 2020 dTosh inc.
【DX Tech Play】
AIハンズオンセミナー
予測モデル構築実践
第1部 ⼈⼯知能基礎(講義形式)
第2部 データ整形/モデル構築/評価(講義形式)
第3部 AIモデルの体験(ハンズオン形式) 2020年 06⽉30⽇
講師︓平尾 俊貴
© 2020 dTosh inc.
講師紹介
平尾 俊貴 (ひらお としき)
ソフトウェア開発業務
の⾃動化
産業⽤AIロボットの
MRシミュレーション
ABB Corporate Research (U.S.)McGill University (カナダ)
株式会社 dTosh 代表取締役社⻑
奈良先端科学技術⼤学院⼤学 博⼠研究員
専⾨︓データ分析/機械学習
拠点︓⽇本/カナダ/アメリカ
共同研究開発
2
© 2020 dTosh inc.
講師紹介
⽚⼭ 寛基 (かたやま ひろき)
• ⾳を⽤いた物体形状認識
• ⽔蒸気を⽤いた透明物体
認識
• ロボティクス技術を⽤いた
VR⽤靴型デバイス
(特許出願中/TGS2019出展)
株式会社 dTosh 研究開発エンジニア
奈良先端科学技術⼤学院⼤学 研究員
専⾨︓ロボティクス/ロボット聴覚/データ分析/
拠点︓⽇本
研究 プロジェクト
© 2020 dTosh inc.
⼈⼯知能(AI)は、⾃動化
ではなく、OOOだ︕
4
⾃動化はもう過去の話
© 2020 dTosh inc.
昭和・平成初期
⾃動化 ⼈⼿の作業
効率化
5
AIで拡張化を⽬指す技術だ︕
© 2020 dTosh inc.
昭和・平成初期
⾃動化 ⼈⼿の作業
現代社会
⼈⼿の作業
効率化 新しい発⾒と
知⾒を⽣み出す
新しいビジネスへ拡張︕
AI
効率化
6
© 2020 dTosh inc.
あらゆる領域に⼈⼯知能が適応されてきている︕
7
8© 2020 dTosh inc.
http://www.mlit.go.jp/common/001253666.pdf国⼟交通省ホームページ
© 2020 dTosh inc.
結局、⼈⼯知能(AI)って何︖
9
⼈⼯知能とは、賢さを持つシステム
© 2020 dTosh inc.
1. データを貯める
2. 情報を抽出して、賢くなる[1]
3. 知識を活⽤する
[1] “⼈⼯知能―――機械といかに向き合うか”, Harvard Business Review
10
© 2020 dTosh inc.
他の技術の進化に伴って、⼈⼯知能はより賢くなる
11
1. データ 2. 賢くなる 3. 知識活⽤
© 2020 dTosh inc.
他の技術の進化に伴って、⼈⼯知能はより賢くなる
1. データ 2. 賢くなる 3. 知識活⽤
クラウドコンピューティング
(AutoMLの時代へ︕)
12
© 2020 dTosh inc.
他の技術の進化に伴って、⼈⼯知能はより賢くなる
1. データ 2. 賢くなる 3. 知識活⽤
クラウドコンピューティング
(AutoMLの時代へ︕)
量⼦コンピューティング
(計算処理を⾼速に︕)
13
© 2020 dTosh inc.
他の技術の進化に伴って、⼈⼯知能はより賢くなる
1. データ 2. 賢くなる 3. 知識活⽤
クラウドコンピューティング
(AutoMLの時代へ︕)
量⼦コンピューティング
(計算処理を⾼速に︕)
5G インターネット
(リアルタイムで同期︕)
14
© 2020 dTosh inc.
他の技術の進化に伴って、⼈⼯知能はより賢くなる
1. データ 2. 賢くなる 3. 知識活⽤
クラウドコンピューティング
(AutoMLの時代へ︕)
量⼦コンピューティング
(計算処理を⾼速に︕)
5G インターネット
(リアルタイムで同期︕)
ブロックチェーン
(より安全なAI製品を︕)
15
© 2020 dTosh inc.
AIって、⼈間の仕事を奪うんですか︖
16
© 2020 dTosh inc.
1. AIはあらゆることを⼈間レベルで遂⾏できる特定の
17
© 2020 dTosh inc.
弱いAI
強いAI
特定のタスクのみ処理する
•無⼈レジ
•⾃動運転
…など、実⽤段階にあるAI
⼈間のような⾃意識を持つ
•「ターミネーター」のスカイネット
•「アベンジャーズ」シリーズのウルトロン
…など、フィクションに登場するAI
•アルファ碁
•Googleレンズ
•Siri (⾃然⾔語処理など)
https://ledge.ai/strong-ai/
18
© 2020 dTosh inc.
2. ディープラーニングは物事を説明できる︕できない..
19
© 2020 dTosh inc.
Deep Learningは説明することが苦⼿
できること︓
•⾼精度で予測・認識できる
できないこと︓
•判断根拠を説明できない
(なぜ認識できたのか︖)
AI使⽤するの不安…
XAIの研究が盛んに︕
(Explainable AI)
〇〇病です
なんでだろう..
なんで?
(特徴を⾃動抽出するから)
20
© 2020 dTosh inc.
説明可能なAI
•⽿の形
•⽬の位置
•⽑の⾊
…
1. 特徴分析 2. 従来の分類モデル
これは⽝だ
1. ⾃動で特徴分析・分類
説明不可能なAI
これは⽝だ
96.5%の精度
(⼈間は95%)
21
© 2020 dTosh inc.
3. AIってすぐ作れる︕
(データが整理されていれば..) 23
AIの構築⾃体は簡単になってきた
© 2020 dTosh inc.
1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤
ランダムフォレスト
ディープラーニング
重回帰モデル
決定係数
再現率/適合率/F値
必要なデータの収集
フォーマットの整理
⽋損値などの補完
24
ランダムフォレスト
ディープラーニング
重回帰モデル
AIの構築⾃体は簡単になってきた
© 2020 dTosh inc.
1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤
必要なデータの収集
フォーマットの整理
⽋損値などの補完
決定係数
再現率/適合率/F値
AutoMLツール⼀覧︓Amazon Lex, Auto Keras, H2O.ai, Auto Pytorch
https://qiita.com/daisukelab/items/4fdbf95c74e6206153c9
https://techgrabyte.com/11-automl-tools-automate-machine-learning/
25
ランダムフォレスト
ディープラーニング
重回帰モデル
AIの構築⾃体は簡単になってきた
© 2020 dTosh inc.
1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤
必要なデータの収集
フォーマットの整理
⽋損値などの補完
決定係数
再現率/適合率/F値
•そもそも社内データはデジタル化されているのか?
•様々な角度から収集したデータは存在するのか?
•保持するデータは構造化されているのか?
26
© 2020 dTosh inc. 27
© 2020 dTosh inc.
第2部 データ整形/モデル構築/評価
・説明可能なAIの作り⽅(従来の⼿法)
・説明不可能なAIの作り⽅(Deep Learning)
© 2020 dTosh inc.
説明可能なAI
(従来の⼿法)
説明不可能なAI
(ディープラーニング)
30
© 2020 dTosh inc.
1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤
ランダムフォレスト
ディープラーニング
重回帰モデル
決定係数
再現率/適合率/F値
必要なデータの収集
フォーマットの整理
⽋損値などの補完
31
© 2020 dTosh inc.
1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤
ランダムフォレスト
ディープラーニング
重回帰モデル
決定係数
再現率/適合率/F値
必要なデータの収集
フォーマットの整理
⽋損値などの補完
データを収集する フォーマットを整理する
id ⿐の形 ⽿の⼤きさ ⽑の⾊ .. ラベル
1 ⽝
2 猫
3 ⽝
.. 猫
32
© 2020 dTosh inc.
1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤
ランダムフォレスト
ディープラーニング
重回帰モデル
決定係数
再現率/適合率/F値
必要なデータの収集
フォーマットの整理
⽋損値などの補完
学習データ
(説明可能な学習内容) 学習する 予測する
⽿が⻑くて、垂れ⽬で..
→⽝
⽝です︕
33
© 2020 dTosh inc.
1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤
ランダムフォレスト
ディープラーニング
重回帰モデル
決定係数
再現率/適合率/F値
必要なデータの収集
フォーマットの整理
⽋損値などの補完
•適合率=TP/(TP+FP)
猫と予測した内、どれだけ正しかったか︖
•再現率=TP/(TP+FN)
全ての猫のうち、どれだけ予測できたか︖
猫 犬
猫
True Positive
3
False Positive
2
犬
False Negative
1
True Negative
1
正解の値
予測結果
猫だ︕ 猫だ︕ 猫だ︕猫だ︕ 猫だ︕⽝だ︕ ⽝だ︕
34
© 2020 dTosh inc.
説明可能なAI
(従来の⼿法)
説明不可能なAI
(ディープラーニング)
35
© 2020 dTosh inc.
1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤
ランダムフォレスト
ディープラーニング
重回帰モデル
決定係数
再現率/適合率/F値
必要なデータの収集
フォーマットの整理
⽋損値などの補完
データを収集する フォーマットを整理する
1, 3, 8, 1, 9, 2, …
4, 7, 4, 0, 1, 3, …
…
9, 2, 4, 4, 1, 6, …
ベクトル化
1 5 2 9 18 92
28 2 49 10 29 99
4 2 9 3 12 3
0 18 0 17 2 18
77 42 88 29 11 18
36
© 2020 dTosh inc.
1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤
ランダムフォレスト
ディープラーニング
重回帰モデル
決定係数
再現率/適合率/F値
必要なデータの収集
フォーマットの整理
⽋損値などの補完
1
1
1
1
….
⽝︓90%
猫︓10%
37
© 2020 dTosh inc.
1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤
ランダムフォレスト
ディープラーニング
重回帰モデル
決定係数
再現率/適合率/F値
必要なデータの収集
フォーマットの整理
⽋損値などの補完
•適合率=TP/(TP+FP)
猫と予測した内、どれだけ正しかったか︖
•再現率=TP/(TP+FN)
全ての猫のうち、どれだけ予測できたか︖
猫 犬
猫
True Positive
3
False Positive
2
犬
False Negative
1
True Negative
1
正解の値
予測結果
猫だ︕ 猫だ︕ 猫だ︕猫だ︕ 猫だ︕⽝だ︕ ⽝だ︕
38
具体的なAI開発の流れ
© 2020 dTosh inc.
PoC(概念実証)
何を作るのか︖
データは揃ってるか︖
パイロット検証
実現可能なのか︖
本番環境で動作するか︖
設計・機能
AI開発の具体的な計画
(⾦銭⾯も含め)
システム開発
AIシステムの点検・改良
評価・運⽤
新しいデータ/
AIシステムの更新
40
ハンズオン補⾜資料
© 2020 dTosh inc.
ハンズオンでの注意点
今回の講義はハンズオン形式ですが、基本的に講師がプログラムを動かし
ながら解説する形式となります。
© 2020 dTosh inc.
• どのようにAI開発が進むのか︖そのノウハウを勉強︕
• 質問がありましたら、その都度聞いてください︕
機械学習を扱う流れ
© 2020 dTosh inc.
ビジネスや業務での課題
データの前処理
結果の評価
モデルの選択・学習
ハンズオン⽬的
44© 2020 dTosh inc.
ビジネスや業務での課題
簡単なアンケートのみで
BMI指数の推定
従業員の健康管理が⼤事
しかし、健康診断は毎年1回、全
員分の体重や⾝⻑を測ったり集
めるのは難しい...
機械学習の種類
45© 2020 dTosh inc.
数値⾃体を予測する。
⽬的変数※が連続値
(ex) 価格予測、株価予測
回帰問題 分類問題
所属するクラスを予測する
⽬的変数が離散的な値や名称
(ex) 動物の分類、植物の分類
※⽬的変数と説明変数
⽬的変数とはデータの中でも求めたいデータ (推定したい値) (ex) BMI
説明変数とは予測のために使うデータ (使⽤する値) (ex) 運動の回数、⾷事の時間
データの前処理でのポイント
データには⽋損し
た値が含まれるこ
とがある
これらを処理する
必要あり
© 2020 dTosh inc.
⽋損値 学習・テスト偏り 正規化
⽬的変数の値の
偏りがある場合が
ある。
アンダーサンプリン
グが有効
説明変数の値に
よって⼤きさが違う。
0-1の値に変換す
ることが多い
評価⽤に学習デー
タとテストデータに分
割する
学習 7 : テスト 3くら
いが⼀般的
NumpyやPandasといったライブラリを⽤いてデータをあつかうと便利
モデルの選択・学習でのポイント
今回は、scikit-learnという機械学習ライブラリを使⽤。
他には、tensorflow, keras, pytorchなどが有名
© 2020 dTosh inc.
回帰、分類ともに使⽤
可能な⼿法。
教師あり学習の中では
計算コストが低くく汎⽤
性が⾼い。
SVM ランダムフォレスト 多層パーセプトロン
探索⽊を応⽤した推定⼿
法。
教師あり学習の中では精
度は⾼い。ただ、計算コス
トが⾮常に⾼い
Deep learningの⼊り⼝とし
て、簡単に実装できる。
ただし、精度はあまり⾼くない
結果の評価でのポイント
Matplotlibといった描画ライブラリが有効
skleranには評価⽤の指標の計算関数がある。
© 2020 dTosh inc.
分類問題では正解率、
回帰問題では誤差
数字として表現したい
場合に有効
正解率・誤差 描画 混合⾏列
図にデータを描画して
あげることで、様々な
⾓度からみることがで
きる
改善や分析に有効
分類問題を評価する際に
⾮常に有効な⼿法。
株式会社 dTosh
奈良先端科学技術⼤学院⼤学発ベンチャー
事業内容
© 2020 dTosh inc.
研究開発業務
(奈良先端⼤と連携)
• プログラミング開発環境
の効率化
• ⼈⼯知能技術のビジネ
ス活⽤
技術アドバイザー
(株 Dellと連携)
• ビジネス課題の分析
• 専⾨技術の選定
• 開発業務のサポート
⾼度IT⼈材育成
(奈良先端⼤と連携)
• エンジニア養成講座
• AI⼈材育成講座
• 教材開発
技術アドバイザー
(法⼈向け)
• ビジネス課題の分析
• 専⾨技術の選定
• 開発業務のサポート

Mais conteúdo relacionado

Destaque

Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 

Destaque (20)

Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 

2020.06.30 DELL×NAIST DX Tech Play AIハンズオンセミナー ~予測モデル構築実践~

  • 1. © 2020 dTosh inc. 【DX Tech Play】 AIハンズオンセミナー 予測モデル構築実践 第1部 ⼈⼯知能基礎(講義形式) 第2部 データ整形/モデル構築/評価(講義形式) 第3部 AIモデルの体験(ハンズオン形式) 2020年 06⽉30⽇ 講師︓平尾 俊貴
  • 2. © 2020 dTosh inc. 講師紹介 平尾 俊貴 (ひらお としき) ソフトウェア開発業務 の⾃動化 産業⽤AIロボットの MRシミュレーション ABB Corporate Research (U.S.)McGill University (カナダ) 株式会社 dTosh 代表取締役社⻑ 奈良先端科学技術⼤学院⼤学 博⼠研究員 専⾨︓データ分析/機械学習 拠点︓⽇本/カナダ/アメリカ 共同研究開発 2
  • 3. © 2020 dTosh inc. 講師紹介 ⽚⼭ 寛基 (かたやま ひろき) • ⾳を⽤いた物体形状認識 • ⽔蒸気を⽤いた透明物体 認識 • ロボティクス技術を⽤いた VR⽤靴型デバイス (特許出願中/TGS2019出展) 株式会社 dTosh 研究開発エンジニア 奈良先端科学技術⼤学院⼤学 研究員 専⾨︓ロボティクス/ロボット聴覚/データ分析/ 拠点︓⽇本 研究 プロジェクト
  • 4. © 2020 dTosh inc. ⼈⼯知能(AI)は、⾃動化 ではなく、OOOだ︕ 4
  • 5. ⾃動化はもう過去の話 © 2020 dTosh inc. 昭和・平成初期 ⾃動化 ⼈⼿の作業 効率化 5
  • 6. AIで拡張化を⽬指す技術だ︕ © 2020 dTosh inc. 昭和・平成初期 ⾃動化 ⼈⼿の作業 現代社会 ⼈⼿の作業 効率化 新しい発⾒と 知⾒を⽣み出す 新しいビジネスへ拡張︕ AI 効率化 6
  • 7. © 2020 dTosh inc. あらゆる領域に⼈⼯知能が適応されてきている︕ 7
  • 8. 8© 2020 dTosh inc. http://www.mlit.go.jp/common/001253666.pdf国⼟交通省ホームページ
  • 9. © 2020 dTosh inc. 結局、⼈⼯知能(AI)って何︖ 9
  • 10. ⼈⼯知能とは、賢さを持つシステム © 2020 dTosh inc. 1. データを貯める 2. 情報を抽出して、賢くなる[1] 3. 知識を活⽤する [1] “⼈⼯知能―――機械といかに向き合うか”, Harvard Business Review 10
  • 11. © 2020 dTosh inc. 他の技術の進化に伴って、⼈⼯知能はより賢くなる 11 1. データ 2. 賢くなる 3. 知識活⽤
  • 12. © 2020 dTosh inc. 他の技術の進化に伴って、⼈⼯知能はより賢くなる 1. データ 2. 賢くなる 3. 知識活⽤ クラウドコンピューティング (AutoMLの時代へ︕) 12
  • 13. © 2020 dTosh inc. 他の技術の進化に伴って、⼈⼯知能はより賢くなる 1. データ 2. 賢くなる 3. 知識活⽤ クラウドコンピューティング (AutoMLの時代へ︕) 量⼦コンピューティング (計算処理を⾼速に︕) 13
  • 14. © 2020 dTosh inc. 他の技術の進化に伴って、⼈⼯知能はより賢くなる 1. データ 2. 賢くなる 3. 知識活⽤ クラウドコンピューティング (AutoMLの時代へ︕) 量⼦コンピューティング (計算処理を⾼速に︕) 5G インターネット (リアルタイムで同期︕) 14
  • 15. © 2020 dTosh inc. 他の技術の進化に伴って、⼈⼯知能はより賢くなる 1. データ 2. 賢くなる 3. 知識活⽤ クラウドコンピューティング (AutoMLの時代へ︕) 量⼦コンピューティング (計算処理を⾼速に︕) 5G インターネット (リアルタイムで同期︕) ブロックチェーン (より安全なAI製品を︕) 15
  • 16. © 2020 dTosh inc. AIって、⼈間の仕事を奪うんですか︖ 16
  • 17. © 2020 dTosh inc. 1. AIはあらゆることを⼈間レベルで遂⾏できる特定の 17
  • 18. © 2020 dTosh inc. 弱いAI 強いAI 特定のタスクのみ処理する •無⼈レジ •⾃動運転 …など、実⽤段階にあるAI ⼈間のような⾃意識を持つ •「ターミネーター」のスカイネット •「アベンジャーズ」シリーズのウルトロン …など、フィクションに登場するAI •アルファ碁 •Googleレンズ •Siri (⾃然⾔語処理など) https://ledge.ai/strong-ai/ 18
  • 19. © 2020 dTosh inc. 2. ディープラーニングは物事を説明できる︕できない.. 19
  • 20. © 2020 dTosh inc. Deep Learningは説明することが苦⼿ できること︓ •⾼精度で予測・認識できる できないこと︓ •判断根拠を説明できない (なぜ認識できたのか︖) AI使⽤するの不安… XAIの研究が盛んに︕ (Explainable AI) 〇〇病です なんでだろう.. なんで? (特徴を⾃動抽出するから) 20
  • 21. © 2020 dTosh inc. 説明可能なAI •⽿の形 •⽬の位置 •⽑の⾊ … 1. 特徴分析 2. 従来の分類モデル これは⽝だ 1. ⾃動で特徴分析・分類 説明不可能なAI これは⽝だ 96.5%の精度 (⼈間は95%) 21
  • 22. © 2020 dTosh inc. 3. AIってすぐ作れる︕ (データが整理されていれば..) 23
  • 23. AIの構築⾃体は簡単になってきた © 2020 dTosh inc. 1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤ ランダムフォレスト ディープラーニング 重回帰モデル 決定係数 再現率/適合率/F値 必要なデータの収集 フォーマットの整理 ⽋損値などの補完 24
  • 24. ランダムフォレスト ディープラーニング 重回帰モデル AIの構築⾃体は簡単になってきた © 2020 dTosh inc. 1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤ 必要なデータの収集 フォーマットの整理 ⽋損値などの補完 決定係数 再現率/適合率/F値 AutoMLツール⼀覧︓Amazon Lex, Auto Keras, H2O.ai, Auto Pytorch https://qiita.com/daisukelab/items/4fdbf95c74e6206153c9 https://techgrabyte.com/11-automl-tools-automate-machine-learning/ 25
  • 25. ランダムフォレスト ディープラーニング 重回帰モデル AIの構築⾃体は簡単になってきた © 2020 dTosh inc. 1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤ 必要なデータの収集 フォーマットの整理 ⽋損値などの補完 決定係数 再現率/適合率/F値 •そもそも社内データはデジタル化されているのか? •様々な角度から収集したデータは存在するのか? •保持するデータは構造化されているのか? 26
  • 26. © 2020 dTosh inc. 27
  • 27. © 2020 dTosh inc. 第2部 データ整形/モデル構築/評価 ・説明可能なAIの作り⽅(従来の⼿法) ・説明不可能なAIの作り⽅(Deep Learning)
  • 28. © 2020 dTosh inc. 説明可能なAI (従来の⼿法) 説明不可能なAI (ディープラーニング) 30
  • 29. © 2020 dTosh inc. 1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤ ランダムフォレスト ディープラーニング 重回帰モデル 決定係数 再現率/適合率/F値 必要なデータの収集 フォーマットの整理 ⽋損値などの補完 31
  • 30. © 2020 dTosh inc. 1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤ ランダムフォレスト ディープラーニング 重回帰モデル 決定係数 再現率/適合率/F値 必要なデータの収集 フォーマットの整理 ⽋損値などの補完 データを収集する フォーマットを整理する id ⿐の形 ⽿の⼤きさ ⽑の⾊ .. ラベル 1 ⽝ 2 猫 3 ⽝ .. 猫 32
  • 31. © 2020 dTosh inc. 1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤ ランダムフォレスト ディープラーニング 重回帰モデル 決定係数 再現率/適合率/F値 必要なデータの収集 フォーマットの整理 ⽋損値などの補完 学習データ (説明可能な学習内容) 学習する 予測する ⽿が⻑くて、垂れ⽬で.. →⽝ ⽝です︕ 33
  • 32. © 2020 dTosh inc. 1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤ ランダムフォレスト ディープラーニング 重回帰モデル 決定係数 再現率/適合率/F値 必要なデータの収集 フォーマットの整理 ⽋損値などの補完 •適合率=TP/(TP+FP) 猫と予測した内、どれだけ正しかったか︖ •再現率=TP/(TP+FN) 全ての猫のうち、どれだけ予測できたか︖ 猫 犬 猫 True Positive 3 False Positive 2 犬 False Negative 1 True Negative 1 正解の値 予測結果 猫だ︕ 猫だ︕ 猫だ︕猫だ︕ 猫だ︕⽝だ︕ ⽝だ︕ 34
  • 33. © 2020 dTosh inc. 説明可能なAI (従来の⼿法) 説明不可能なAI (ディープラーニング) 35
  • 34. © 2020 dTosh inc. 1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤ ランダムフォレスト ディープラーニング 重回帰モデル 決定係数 再現率/適合率/F値 必要なデータの収集 フォーマットの整理 ⽋損値などの補完 データを収集する フォーマットを整理する 1, 3, 8, 1, 9, 2, … 4, 7, 4, 0, 1, 3, … … 9, 2, 4, 4, 1, 6, … ベクトル化 1 5 2 9 18 92 28 2 49 10 29 99 4 2 9 3 12 3 0 18 0 17 2 18 77 42 88 29 11 18 36
  • 35. © 2020 dTosh inc. 1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤ ランダムフォレスト ディープラーニング 重回帰モデル 決定係数 再現率/適合率/F値 必要なデータの収集 フォーマットの整理 ⽋損値などの補完 1 1 1 1 …. ⽝︓90% 猫︓10% 37
  • 36. © 2020 dTosh inc. 1. データの構造化 2. 学習モデルの構築 3. 評価・運⽤ ランダムフォレスト ディープラーニング 重回帰モデル 決定係数 再現率/適合率/F値 必要なデータの収集 フォーマットの整理 ⽋損値などの補完 •適合率=TP/(TP+FP) 猫と予測した内、どれだけ正しかったか︖ •再現率=TP/(TP+FN) 全ての猫のうち、どれだけ予測できたか︖ 猫 犬 猫 True Positive 3 False Positive 2 犬 False Negative 1 True Negative 1 正解の値 予測結果 猫だ︕ 猫だ︕ 猫だ︕猫だ︕ 猫だ︕⽝だ︕ ⽝だ︕ 38
  • 37. 具体的なAI開発の流れ © 2020 dTosh inc. PoC(概念実証) 何を作るのか︖ データは揃ってるか︖ パイロット検証 実現可能なのか︖ 本番環境で動作するか︖ 設計・機能 AI開発の具体的な計画 (⾦銭⾯も含め) システム開発 AIシステムの点検・改良 評価・運⽤ 新しいデータ/ AIシステムの更新 40
  • 39. ハンズオンでの注意点 今回の講義はハンズオン形式ですが、基本的に講師がプログラムを動かし ながら解説する形式となります。 © 2020 dTosh inc. • どのようにAI開発が進むのか︖そのノウハウを勉強︕ • 質問がありましたら、その都度聞いてください︕
  • 40. 機械学習を扱う流れ © 2020 dTosh inc. ビジネスや業務での課題 データの前処理 結果の評価 モデルの選択・学習
  • 41. ハンズオン⽬的 44© 2020 dTosh inc. ビジネスや業務での課題 簡単なアンケートのみで BMI指数の推定 従業員の健康管理が⼤事 しかし、健康診断は毎年1回、全 員分の体重や⾝⻑を測ったり集 めるのは難しい...
  • 42. 機械学習の種類 45© 2020 dTosh inc. 数値⾃体を予測する。 ⽬的変数※が連続値 (ex) 価格予測、株価予測 回帰問題 分類問題 所属するクラスを予測する ⽬的変数が離散的な値や名称 (ex) 動物の分類、植物の分類 ※⽬的変数と説明変数 ⽬的変数とはデータの中でも求めたいデータ (推定したい値) (ex) BMI 説明変数とは予測のために使うデータ (使⽤する値) (ex) 運動の回数、⾷事の時間
  • 43. データの前処理でのポイント データには⽋損し た値が含まれるこ とがある これらを処理する 必要あり © 2020 dTosh inc. ⽋損値 学習・テスト偏り 正規化 ⽬的変数の値の 偏りがある場合が ある。 アンダーサンプリン グが有効 説明変数の値に よって⼤きさが違う。 0-1の値に変換す ることが多い 評価⽤に学習デー タとテストデータに分 割する 学習 7 : テスト 3くら いが⼀般的 NumpyやPandasといったライブラリを⽤いてデータをあつかうと便利
  • 44. モデルの選択・学習でのポイント 今回は、scikit-learnという機械学習ライブラリを使⽤。 他には、tensorflow, keras, pytorchなどが有名 © 2020 dTosh inc. 回帰、分類ともに使⽤ 可能な⼿法。 教師あり学習の中では 計算コストが低くく汎⽤ 性が⾼い。 SVM ランダムフォレスト 多層パーセプトロン 探索⽊を応⽤した推定⼿ 法。 教師あり学習の中では精 度は⾼い。ただ、計算コス トが⾮常に⾼い Deep learningの⼊り⼝とし て、簡単に実装できる。 ただし、精度はあまり⾼くない
  • 45. 結果の評価でのポイント Matplotlibといった描画ライブラリが有効 skleranには評価⽤の指標の計算関数がある。 © 2020 dTosh inc. 分類問題では正解率、 回帰問題では誤差 数字として表現したい 場合に有効 正解率・誤差 描画 混合⾏列 図にデータを描画して あげることで、様々な ⾓度からみることがで きる 改善や分析に有効 分類問題を評価する際に ⾮常に有効な⼿法。
  • 46. 株式会社 dTosh 奈良先端科学技術⼤学院⼤学発ベンチャー 事業内容 © 2020 dTosh inc. 研究開発業務 (奈良先端⼤と連携) • プログラミング開発環境 の効率化 • ⼈⼯知能技術のビジネ ス活⽤ 技術アドバイザー (株 Dellと連携) • ビジネス課題の分析 • 専⾨技術の選定 • 開発業務のサポート ⾼度IT⼈材育成 (奈良先端⼤と連携) • エンジニア養成講座 • AI⼈材育成講座 • 教材開発 技術アドバイザー (法⼈向け) • ビジネス課題の分析 • 専⾨技術の選定 • 開発業務のサポート