SlideShare uma empresa Scribd logo
1 de 64
Baixar para ler offline
© Hitachi, Ltd. 2018, 2019. All rights reserved.
株式会社日立製作所 研究開発グループ
システムイノベーションセンタ 主管研究員
ソフトウェアモダナイゼーションラボ長
小川秀人
機械学習システムの
品質保証に向けた課題と
コンソーシアム活動
© Hitachi, Ltd. 2018, 2019. All rights reserved.
目次
1
1.自己紹介など
2.機械学習の概況
3.機械学習の特徴と品質に関する課題
4.機械学習の利活用における留意点
5.機械学習の品質に関する議論
6.社会的コンセンサス形成への動き
7.まとめ
© Hitachi, Ltd. 2018, 2019. All rights reserved.
1.1 自己紹介: 小川秀人
2
ソフトウェア工学の企業内研究者 学生時代は…
『ペンギンは鳥』ソフトウェアテスティング
形式手法
開発プロセス
ソフトウェアプロダクトライン など
弊社グループ向けのソフト開発技術の研究と適用が主な仕事
いわゆる「組込みソフト」と呼ばれる製品たち
(とITシステムも少し)
『鳥は飛ぶ』
『ペンギンは飛べない』
矛盾
第2次AIブーム
博士(情報科学)
© Hitachi, Ltd. 2018, 2019. All rights reserved.
目次
3
1.自己紹介など
2.機械学習の概況
3.機械学習の特徴と品質に関する課題
4.機械学習の利活用における留意点
5.機械学習の品質に関する議論
6.社会的コンセンサス形成への動き
7.まとめ
© Hitachi, Ltd. 2018, 2019. All rights reserved.
2.1 AIに関する概念の整理
4
人工知能(AI)
強いAI 弱いAI
人間と同等の知能の実現 人間のような知的処理の実現
ルールベース
機械学習
メタヒューリスティクス
エキスパートシステム
深層学習
(Deep Learning,
Deep Neural Network)
決定木学習
クラスタリング
などなど
進化的アルゴリズム 群知能 (蟻コロニーなど)
サポートベクターマシン
BRMS
© Hitachi, Ltd. 2018, 2019. All rights reserved.
2.2 AI市場の概況
5
世界市場 300兆円超へ拡大
(2025)
深層学習が 「過度な期待」のピーク期
会話型AIプラットフォームが 黎明期 など
10.3
95.1
317.9
0
50
100
150
200
250
300
350
2015年 2020年 2025年
人工知能市場の
世界需要額見通し
JEITA, 調査統計ガイドブック2017-2018のデータを整形
[兆円]
先進テクノロジのハイプ・サイクル:2018年
ガートナー (2018.8)
関連するテクノロジの強調は小川が追記
© Hitachi, Ltd. 2018, 2019. All rights reserved.
2.3 AI技術の概況
6
技術的には深層学習が主流
(特に画像処理)
0
100
200
300
400
500
600
700
800
900
2014 2015 2016 2017
DL DL以外
コンピュータビジョンに関する
国際会議CVPRの論文数推移
ソフトウェア工学でのアプローチも増加
0
2000
4000
6000
8000
10000
12000
2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
"Software Engineering"とのアンド条件で
ヒットするgoogle scholarの文献数
Artificial Intelligence Machine Learning
Neural Network Deep Learning
深層学習 深層学習以外
© Hitachi, Ltd. 2018, 2019. All rights reserved.
2.4 機械学習を使った製品・サービスの例
7
リソース
最適配置
製造物
検査
生産
最適化
認識
判断
制御
© Hitachi, Ltd. 2018, 2019. All rights reserved.
2.5 (例)最適配置問題
8
どこに何台を配備しておけば
最適に業務を遂行できるか
⇒過去データに基づき到着時間を予測
※実際のデータではありません
全体最適
・平均到着時間を最短に
・コストを最低に
個別最適
・どこでも
今までより早く安く
要件
制約準拠
・必ず30分以内に
・ありえない経路がない
機械学習を用いることで、要件の満足に生じる課題はあるか?
© Hitachi, Ltd. 2018, 2019. All rights reserved.
目次
9
1.自己紹介など
2.機械学習の概況
3.機械学習の特徴と品質に関する課題
4.機械学習の利活用における留意点
5.機械学習の品質に関する議論
6.社会的コンセンサス形成への動き
7.まとめ
© Hitachi, Ltd. 2018, 2019. All rights reserved.
3.1 機械学習と品質に関する議論
10
SQiP ソフトウェア品質シンポジウム
https://www.juse.jp/sqip/symposium/
CEATEC
https://regist.ceatec.com/?act=ConferencesList&event_id=7
組込みシステム産業振興機構 WINK
https://www.kansai-kumikomi.net/wink/seminar_registration/
© Hitachi, Ltd. 2018, 2019. All rights reserved.
3.2 なぜ品質議論が盛んになっているのか
11
人工知能あるいは機械学習への
過剰な期待と不安感
◎ 適切な理解に基づく、適正な利活用による
社会およびビジネスの発展
× 過剰な期待による、失望
不安感による、利活用の抑制
© Hitachi, Ltd. 2018, 2019. All rights reserved.
3.3 AIプロダクト品質保証(QA4AI)コンソーシアム
12
機械学習をはじめとするAI技術は進化しながら普及の一途を辿り、様々な産業の
競争力の源泉となるだけでなく、既存の産業構造を破壊・変革し、新たな産業を創出
しています。それに伴い、AI技術を用いた製品やサービス(AIプロダクト)が生活や
社会、経済に及ぼす影響も大きくなってきています。
しかし、従来型のハードウェアやソフトウェア、サービスなどに比べ、品質の把握、評価、
説明、管理など品質保証技術の確立が進んでいません。特に、機械学習ではデータの
学習によりふるまいが帰納的に決定されるため、「従来型のソフトウェアに対する品質
保証手段が利用困難」「開発プロセスの管理による品質保証が困難」といった特質があ
ります。
一方で、AI技術の進歩が社会に大きな価値をもたらすことが期待されています。
AI技術が安心して活用され進化できるようにするため、従来の発想にとらわれない、
ブレークスルーが求められています。
このため、AIプロダクトに対する品質保証技術の調査・体系化、適用支援・応用、
研究開発ともに、AIプロダクトの品質に対して、技術的特質を踏まえた適切な
理解を社会が持ちうる啓発活動を行うため、様々な技術と知恵を結集できる
コンソーシアムを設立します。
プレスリリース(2018.3.26)より
2018.4.1設立 http://qa4ai.jp/
© Hitachi, Ltd. 2018, 2019. All rights reserved.
3.4 機械学習に対する不安感(1)
13
https://www.tesla.com/jp/blog/tragic-loss
■事例1 2016年のTesla自動運転車の事故
• Autopilotの総計130 million milesの走行で初めて起きた死亡事故
• 全世界では、人運転で60 million milesに一度の事故発生頻度
• 全米では、94 million milesに一度
• 『Autopilotも運転手も、眩しい空に対してトレーラーの
白い側面を認識できず、ブレーキをかけなかった』
http://www.dailymail.co.uk/news/article-3677101/Tesla-toldregulators-fatal-Autopilot-crash-nine-days-happened.html
© Hitachi, Ltd. 2018, 2019. All rights reserved.
3.5 機械学習に対する不安感 (2)
14
■事例2 Google Photosの画像認識
Twitter @jackyalcine
• ユーザの画像に対して、自動的にタグをつける機能
• 黒人に対して、「ゴリラ」とタグづけしたことが、Twitterで拡散し問題化
• 2年後、googleは、「ゴリラ」を禁止語とすることで対処した
https://www.theguardian.com/technology/2018/jan/12/google-racism-ban-gorilla-black-people
© Hitachi, Ltd. 2018, 2019. All rights reserved.
3.6 機械学習に対する不安感 (3)
15
■事例3 Amazonが採用AI開発を停止
https://www.reuters.com/article/amazoncom-jobs-automation/insight-amazon
-scraps-secret-ai-recruiting-tool-that-showed-bias-against-women-idUSL2N1VB1FQ
• 応募用紙の記載によって
応募者を選考するAIを
2014年から開発
• 2015年に、男女差なく評価
できていないことに気づいた
• 学習した実績が男性に偏り
• 結果 “women’s”といった
文字列を含む応募を
低評価していた
• 本件に関する修正はしたが
新たに同様の問題が起こる
可能性を否定できないため
開発を停止
© Hitachi, Ltd. 2018, 2019. All rights reserved. 16
■事例4 優れた識別器でも間違う研究事例 (Adversarial Examples)
Eykholt, Kevin, et al. "Robust Physical-World Attacks
on Deep Learning Visual Classification."
Proceedings of the IEEE Conference on
Computer Vision and Pattern Recognition. 2018.
Ian Goodfellow, Jonathon Shlens, Christian Szegedy, “Explaining and Harnessing Adversarial Examples”, ICLR2015
3.7 AI/機械学習に対する不安感 (4)
パンダ画像にノイズを乗せた画像をテナガザルと判別
停止標識を制限速度と判別 1ピクセルの影響で信号を誤判断
Wicker, Matthew, Xiaowei Huang, and Marta Kwiatkowska.
"Feature-guided black-box safety testing of deep neural networks."
Int. Conf. on Tools and Algorithms for the Construction and Analysis of Systems.
Springer, Cham, 2018.
© Hitachi, Ltd. 2018, 2019. All rights reserved.
3.8 パンダがテナガザルになると何が困るのか?
17
実用上の困りごと
ビジネス上の困りごと (ベンダの立場)
品質保証上の困りごと (ベンダの立場)
・ 誤認識がシステム動作に悪影響を与えるかもしれない
・ 意図的な攻撃に使われるかもしれない
・ 何ができたら完成品として納品できるのだろう
・ これが原因で事故が起きたら、誰がどう責任を取るのだろう
・ どうすれば、こんな問題を事前に発見して品質を上げられるのだろう
・ お客様には何をしたから大丈夫と言えばよいのだろう
© Hitachi, Ltd. 2018, 2019. All rights reserved.
3.9 統計的機械学習の基本的な仕組み
18
学習データ
学習器
モデル
判別器
学習時
利用時
教師あり判別問題の例
計測データ
A群
B群
A群
B群
この計測データはA群
© Hitachi, Ltd. 2018, 2019. All rights reserved.
3.10 機械学習の技術的な利点と課題
19
利点:
汎化
(内挿)
学習器
課題:
ハイパーパラメタ
課題:
学習データの
外側
(外挿)
課題:
学習データの
偏り課題:
コーナー
ケース
課題:
ランダム性
課題:説明性
利点:
境界を定義する
必要がない
課題:過学習
© Hitachi, Ltd. 2018, 2019. All rights reserved.
(補足)ディープニューラルネットワーク
20
多層、多次元入力、多次元出力
入力層 出力層隠れ層1 隠れ層2 隠れ層3
犬
猫
鳥
…
© Hitachi, Ltd. 2018, 2019. All rights reserved.
3.11 文字認識の例
21
「1」 と 「7」 の境界
入力画像
「1」である確率 0.9 0.8 0.5 0.4 0.2 0.1
「7」である確率 0.1 0.2 0.4 0.5 0.8 0.9
機械学習の凄いところは、例示をもとに、この境界を作ってくれること
この境界が『正しい』ということを、示せますか?
人が設計したアルゴリズムで認識するとき、どうやって品質保証していたのか?
・アルゴリズムの妥当性を評価 ⇒ アルゴリズムが正しく実装されていることを検証
・それでも誤判別が起きたとしたら、「仕様の外」
機械学習でなくても難しいこと: 1と7の境界の正解はない
機械学習だから難しいこと: 1と7の境界をどこに定めたかわからない
© Hitachi, Ltd. 2018, 2019. All rights reserved.
3.12 システム開発の観点から見た機械学習の特性
22
従来型ソフトウェア開発 機械学習開発
要件
設計
構築
運用
演繹
段階的詳細化と先行フェーズとの検証 データからの帰納的な知見発掘
データ
帰納
検証
検証
検証
学習要求 クロス
バリデー
ション
実世界
これまでのシステム開発の知見が通用しない危機感
前提:100%正解する機械学習はありえない
課題:「正解を定義できない」対象に対する検証・品質評価
© Hitachi, Ltd. 2018, 2019. All rights reserved.
3.13 機械学習システムの品質課題
23
何が課題で、何を守るべきなのか整理されないまま、不安が先行(少なくとも半年前は)
機械学習システムの品質課題
システム開発での課題
Dev. issues
社会的課題
Social issues
実は今までも
あった課題
機械学習
特有の課題
ビジネス課題
Biz. issues
経済的課題 倫理的課題対顧客の課題
反復プロセス
での品質保証
入力空間が
想定できない状況
での品質保証
仕様に基づく
テストができない
学習データの
品質とは?
機械学習の
経済性
品質の担保を
どう説明するか
問題発生時の
責任範囲
法的課題
社会システム
の課題
© Hitachi, Ltd. 2018, 2019. All rights reserved.
目次
24
1.自己紹介など
2.機械学習の概況
3.機械学習の特徴と品質に関する課題
4.機械学習の利活用における留意点
5.機械学習の品質に関する議論
6.社会的コンセンサス形成への動き
7.まとめ
© Hitachi, Ltd. 2018, 2019. All rights reserved.
4.1 機械学習を含むシステムのライフサイクル
Shipment/Service-in
Assessment Pilot / PoC / Development
訓練データ
セット作成
MLアーキ
テクチャ設計
学習結果
評価 学習
機械学習フレームワーク
出荷前
品質評価
顧客合意
Operation
運用時
データ
モデル
モデル
実行時
検証
実行
オンライン
学習
Maintenance
データ
再構築
ビジネス
KPI
システム開発
履歴収集
それぞれで何をしておいたら、高い品質を提供できると言えるだろうか?
© Hitachi, Ltd. 2018, 2019. All rights reserved.
4.2 留意点/疑問/課題 (訓練データセット)
Assessment Pilot / PoC / Development
訓練データ
セット作成
MLアーキ
テクチャ設計
学習結果
評価 学習
機械学習フレームワーク
出荷前
品質評価
顧客
合意
Operation
運用時
データ
モデル
モデル
実行時
検証
実行
オンライン
学習
Maintenance
データ
再構築
ビジネス
KPI
システム
開発
履歴
収集
Shipment/Service-in
ポイント
・KPIに対する「よいデータ」を顧客とベンダで合意しよう
・合意した「よいデータ」を集めよう
・訓練データに起因する「限界」を理解しよう
疑問/課題
・想定する全運用時をカバーするデータが集められる?
・データを生成することはできる?
・「よいデータ」が事前にわかるの?
・データのクレンジングは誰の仕事?
© Hitachi, Ltd. 2018, 2019. All rights reserved.
4.3 留意点/疑問/課題 (MLアーキテクチャ設計)
Assessment Pilot / PoC / Development
訓練データ
セット作成
MLアーキ
テクチャ設計
学習結果
評価 学習
機械学習フレームワーク
出荷前
品質評価
顧客
合意
Operation
運用時
データ
モデル
モデル
実行時
検証
実行
オンライン
学習
Maintenance
データ
再構築
ビジネス
KPI
システム
開発
履歴
収集
Shipment/Service-in
ポイント
・適当に選んでも結果は何か出てくるが
求めているものが出てくるとは限らない
疑問/課題
・多様な選択肢をどう選ぶか
(学習アルゴリズム、構造、ハイパーパラメータ…)
© Hitachi, Ltd. 2018, 2019. All rights reserved.
4.4 留意点/疑問/課題 (学習)
Assessment Pilot / PoC / Development
訓練データ
セット作成
MLアーキ
テクチャ設計
学習結果
評価 学習
機械学習フレームワーク
出荷前
品質評価
顧客
合意
Operation
運用時
データ
モデル
モデル
実行時
検証
実行
オンライン
学習
Maintenance
データ
再構築
ビジネス
KPI
システム
開発
履歴
収集
Shipment/Service-in
ポイント
・アジャイル(反復的)な取組みになる
疑問/課題
・プロセスだけで品質を評価/保証できる?
(機械学習だけでないアジャイル開発的な課題も混在)
・発見的活動になるため、管理が難しい
© Hitachi, Ltd. 2018, 2019. All rights reserved.
4.5 留意点/疑問/課題 (学習結果の評価)
Assessment Pilot / PoC / Development
訓練データ
セット作成
MLアーキ
テクチャ設計
学習結果
評価 学習
機械学習フレームワーク
出荷前
品質評価
顧客
合意
Operation
運用時
データ
モデル
モデル
実行時
検証
実行
オンライン
学習
Maintenance
データ
再構築
ビジネス
KPI
システム
開発
履歴
収集
Shipment/Service-in
ポイント
・学習結果でプロダクト品質が直接測れる
疑問/課題
・従来のテストに当たるものと思ってよい?
・交差検証や混同行列などの品質保証的な解釈
・機械学習特有のテスト技術とは?
・評価結果がよくないとき、どう修正する?
© Hitachi, Ltd. 2018, 2019. All rights reserved.
4.6 留意点/疑問/課題 (システム開発)
Assessment Pilot / PoC / Development
訓練データ
セット作成
MLアーキ
テクチャ設計
学習結果
評価 学習
機械学習フレームワーク
出荷前
品質評価
顧客
合意
Operation
運用時
データ
モデル
モデル
実行時
検証
実行
オンライン
学習
Maintenance
データ
再構築
ビジネス
KPI
システム
開発
履歴
収集
Shipment/Service-inポイント
・システムでのフェールセーフや
運用によるカバーなど、
システム全体での品質確保を考えよう
疑問/課題
・機械学習と従来型ソフトの責任分担
・後付けで例外処理ルールが増えていく…
© Hitachi, Ltd. 2018, 2019. All rights reserved.
4.7 留意点/疑問/課題 (Assessment)
Assessment Pilot / PoC / Development
訓練データ
セット作成
MLアーキ
テクチャ設計
学習結果
評価 学習
機械学習フレームワーク
出荷前
品質評価
顧客
合意
Operation
運用時
データ
モデル
モデル
実行時
検証
実行
オンライン
学習
Maintenance
データ
再構築
ビジネス
KPI
システム
開発
履歴
収集
Shipment/Service-in
ポイント
・顧客/ユーザが得られる『ビジネス的価値』を
KPIとして合意しよう
・精度をKPIとすることは現実的でない
・100%の精度はないことを前提とした
顧客/ユーザとの作業分担をしよう
・サービスの特性を考慮したKPIを決めよう
疑問/課題
・ビジネスKPIを決められる?計測できる?
・何を約束する?何を約束しない?
© Hitachi, Ltd. 2018, 2019. All rights reserved.
4.8 留意点/疑問/課題 (Shipment/Service-in)
Assessment Pilot / PoC / Development
訓練データ
セット作成
MLアーキ
テクチャ設計
学習結果
評価 学習
機械学習フレームワーク
出荷前
品質評価
顧客
合意
Operation
運用時
データ
モデル
モデル
実行時
検証
実行
オンライン
学習
Maintenance
データ
再構築
ビジネス
KPI
システム
開発
履歴
収集
Shipment/Service-in
ポイント
・ユースケースを想定した評価をしよう
疑問/課題
・第三者検証として何を評価できるか?
・品証独自のテストデータを持つべきか?
・プロセス品証って意味あるの?
ポイント
・運用も含めた品質レベルを合意しよう
(運用形態により守るべきものが異なる)
疑問
・何をエビデンスに品質を説明するのか?
・ 「肌感覚」と違う結果をどう説明する?
© Hitachi, Ltd. 2018, 2019. All rights reserved.
4.9 留意点/疑問/課題 (Operation)
Assessment Pilot / PoC / Development
訓練データ
セット作成
MLアーキ
テクチャ設計
学習結果
評価 学習
機械学習フレームワーク
出荷前
品質評価
顧客
合意
Operation
運用時
データ
モデル
モデル
実行時
検証
実行
オンライン
学習
Maintenance
データ
再構築
ビジネス
KPI
システム
開発
履歴
収集
Shipment/Service-in
ポイント
・運用時に得られるデータと実行履歴を記録しておこう
・重大な異常を検出する仕組みと対処法を用意しておこう
(必要に応じて)
疑問/課題
・個々の事象にどこまで責任を持つ?
(全体最適と個別事象の関係)
・勝手に成長するのも保証する必要がある?
© Hitachi, Ltd. 2018, 2019. All rights reserved.
4.10 留意点/疑問/課題 (データ再構築)
Assessment Pilot / PoC / Development
訓練データ
セット作成
MLアーキ
テクチャ設計
学習結果
評価 学習
機械学習フレームワーク
出荷前
品質評価
顧客
合意
Operation
運用時
データ
モデル
モデル
実行時
検証
実行
オンライン
学習
Maintenance
データ
再構築
ビジネス
KPI
システム
開発
履歴
収集
Shipment/Service-in
ポイント
・データの成長がシステムの成長です
疑問/課題
・学習データを少し変えただけで
今までと全然違う結果になるんですが!?
・運用時に得られたデータで充分とは限らない
© Hitachi, Ltd. 2018, 2019. All rights reserved.
目次
35
1.自己紹介など
2.機械学習の概況
3.機械学習の特徴と品質に関する課題
4.機械学習の利活用における留意点
5.機械学習の品質に関する議論
6.社会的コンセンサス形成への動き
7.まとめ
© Hitachi, Ltd. 2018, 2019. All rights reserved.
5.1 機械学習に対する品質保証の考え方の提案
36
機械学習(ML)の品質保証とは、
• ML搭載したシステム全体のリスクが
• 社会で許容可能なリスク以下であることを示すこと
システム全体のリスク ≦ 社会が許容可能なリスク上限品質保証のゴール:
AI活用により新たに
発生するリスク
従来のシステムのリスク
品質保証のゴールを達成するために、
「(i)AI活用により新たに発生するリスクの低減」 するとともに
「(ii)AI活用の追加利益によって拡大可能なリスク基準の策定と社会的な
合意形成」を実現
従来から許容しているリスク
AI活用の追加利益により
新たに許容可能なリスク
© Hitachi, Ltd. 2018, 2019. All rights reserved.
5.2 機械学習システム品質保証アプローチ
37
①MLシステム検証技術 ②MLシステム品質アセスメント手法
MLテスト
十分性評価
ML品証
ガイド
確率的
品質評価
③社会的コンセンサスの形成
ML品質
レベル
ML品証標準
アクティビティ
ML起因リスクの低減
ML活用の追加利益によって拡大可能な
リスク基準の策定と社会的な合意形成
1.1 手順
1.2 評価基準
・・・
≦
© Hitachi, Ltd. 2018, 2019. All rights reserved.
5.3 機械学習を含む『システム』
38
シ
ス
テ
ム
入
力
シ
ス
テ
ム
出
力
機械学習を用いて
開発したソフトウェア
(DNN)
従来
ソフトウェア
従来
ソフトウェア
従来
ソフトウェア
従来
ソフトウェア
外部環境
External environment
社会
Social
機械学習適用システム
どこで何を守るべきだろうか?
© Hitachi, Ltd. 2018, 2019. All rights reserved.
5.4 リスクの低減策
39
シ
ス
テ
ム
入
力
シ
ス
テ
ム
出
力
機械学習を用いて
開発したソフトウェア
(DNN)
従来
ソフトウェア
従来
ソフトウェア
従来
ソフトウェア
従来
ソフトウェア
外部環境 社会
機械学習適用システム
リスクの低減には様々なアプローチが考えられる
機械学習モデル
に対する事前検証
法律 標準規格保険 インフラ
実行時監視ゲートウェイ
追加学習・更新
安全
機構代替ソフト
安全
運用
© Hitachi, Ltd. 2018, 2019. All rights reserved.
5.5 機械学習の結果を評価する基本的な手法
40
ホールドアウト (Holdout) 混同行列 (Confusion Matrix)
学習データ テストデータ
クロスバリデーション (Cross Validation)
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
A Not A
A True
Positive
False
Positive
Not A False
Negative
True
Negative
正解
予想
Accuracy, Precision, Recall, False Positive Rate, f-measure…
学習曲線 (Learning Curve)
標準的な手法を用いることは、最低限の品質保証として必要
http://scikit-learn.org/stable/auto_examples/model_selection/plot_learning_curve.html
© Hitachi, Ltd. 2018, 2019. All rights reserved.
5.6 全と個
41
全 個
統計的な評価についての
知見は蓄積されてきた
『エッジ・ケース (Edge-case)』
への対応が大きな課題に
© Hitachi, Ltd. 2018, 2019. All rights reserved.
5.7 (技術例A)リファレンスモデル照合によるテスト自動化
42
リファレンスモデルと呼ぶ疑似オラクルを使用することでテスト自動化
⇒テスト量を増加
【DNN】
【リファレンスモデルの例】
■道路交通標識認識の例
【入力値】
標識画像
出
力
入
力
【出力値】
識別結果
入
力
従来の画像
処理技術で
標識の形状
を抽出
評価
OK/NG
if (形状=='丸形'){
assert(
識別結果=='止まれ'
or
識別結果=='進入禁止')}
画像引用元:J. Stallkamp, M. Schlipsing, J. Salmen, and C. Igel. The German Traffic Sign Recognition
Benchmark: A multi-class classification competition. In Proceedings of the IEEE International Joint Conference
on Neural Networks, pages 1453-1460. 2011. http://benchmark.ini.rub.de/?section=gtsrb&subsection=dataset
入
力
速度制限
進入禁止
止まれ
照合⇒評価OK/NG
【正解出力値】
人手で作成
⇒テスト量増加
を阻害
出力
疑似オラクル
として使用
Pseudo oracle
速度制限
進入禁止
止まれ
佐藤、來間、中川、小川 “DNN搭載システムの品質課題と既存技術の活用可能性”, MLSE2018
© Hitachi, Ltd. 2018, 2019. All rights reserved.
5.8 (技術例B) 制約ソルバによる範囲網羅検証
43
DNNのネットワーク構造を論理式化し,論理式の真偽を制約ソルバで検査
⇒指定した範囲内の全入力値について,要件を満たすことを網羅検証可
n_1 = (w_1 * x_1 + b_1) ∧
n_2 = (w_2 * n_1 + b_2) ∧
…
【入力値の範囲を定義する式】
𝜌,
𝜃,
𝜓,
𝜐 𝑜𝑤𝑛,
𝜐𝑖𝑛𝑡
【出力値】
水平方向の
回避指示
入
力
出
力
【DNN】
【入出力値の要件】
他機が右から接近して
いる場合,左3.0度旋回
(Lower1 < x_1 < Upper1) ∧
(Lower2 < x_1 < Upper2) ∧
…
∧ ∧ (𝜃 > 270) => ((y_1 >
y_2)∨ …)
■航空機制御指令装置の例(Stanford大)
自機
他機
𝜌
論理式化
論理式
化𝜃
𝜓
𝜐 𝑜𝑤𝑛
𝜐𝑖𝑛𝑡
【入力値】
範囲指定
Katz, G., Barrett, C., Dill, D.L., Julian, K., Kochenderfer, M.J.:
Reluplex: An Efficient SMT Solver for Verifying Deep Neural Networks,
Computer Aided Verification 2017, pp.97-117 (2017).
【要件の否定を表す式】【DNNのネットワーク構造を表す式】
論理式が真となる解あり
⇒要件を違反する場合あり
© Hitachi, Ltd. 2018, 2019. All rights reserved.
5.9 (技術例C) ニューロンカバレッジ・テスティング
44
DNNを構成するニューロンの活性化状況に基づいてカバレッジ指標を定義
⇒カバレッジを基準にテストの充足性を判定
テスト
入力値1
6
12
のニューロンが活性化
⇒カバレッジ50%
入力
1枚
10枚
100枚
テストケースの追加
テストケースの追加
明神, “AIシステムの品質保証”, JaSST 18
© Hitachi, Ltd. 2018, 2019. All rights reserved.
5.10 (技術例D) 機械学習の説明技術
45
機械学習によってなされた判断の理由を説明する解析技術
⇒ 過不足している教師データの判断などができるようになる
下の画像は、Ribeiro, Marco Tulio, Sameer Singh, and Carlos Guestrin. "Why should i trust you?: Explaining the predictions of any classifier.“
Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. ACM, 2016.
© Hitachi, Ltd. 2018, 2019. All rights reserved.
5.11 機械学習システムの何を評価するかという議論
46
Allowability:
Behavior or result of ML product cannot be completely decided or predicted
because of ML’s inductive nature. Since zero risk is actually impossible,
arrowable risk must be defined. It may be defined on the basis of technical
Limit and social consensus.
Achievability:
Actual risk must be achieved less than the allowable Risk fundamentally.
Robustness:
Possibility of failure in achievement of expected risk must be reduced as
low as reasonably possible.
Avoidability:
Harm should be avoided according to its criticality. Critical harm must be
avoided even if actual risk fails in achievement less than the allowable risk.
Improvability:
When actual risk is more than allowable risk, risk must be decreased as soon
as possible less than the allowable risk by explaining and understanding of
the cause, by controlling the cause and by unregressing the controlled cause.
Improvability, hence, is composed of Explainability and Understandability,
Controllability and Unregressibility.
Y. Nishi, S. Masuda, H. Ogawa and K. Uetsuki, "A Test Architecture for Machine Learning Product,"
IEEE International Conference on Software Testing, Verification and Validation Workshops (ICSTW), Vasteras, 2018, pp. 273-278.
例:MLプロダクト評価の基本原理(A-ARAI)
© Hitachi, Ltd. 2018, 2019. All rights reserved.
5.12 AI搭載システムの検証観点の検討
47
自動車向け機能安全規格ISO26262記載のテスト手法をヒントにして,
AI搭載システムに必要な検証観点,検証アプローチを整理
# 検証観点 検証アプローチ
1 結果が同一となる入力のパターンを
満遍なくカバーして検査する
入力と出力の関係を表す性質を仕様から取得し,それらの性質ごとに入
力値を作成
2 入力のパターンの境界面に誤りがな
いか検査する
入力と出力の関係を表す性質を仕様から取得し,それらの性質の境界
面となる入力値を作成
3 実行パターンを満遍なくカバーして
検査する
実行パターンを制御パスと捉え,異なる制御パスを通る入力を与える
(カバレッジテスト)
4 入出力関係の規則性が崩れるなど,
特徴の異なるケースを検査する
特徴の異なる入出力を,仕様やプログラムロジックから逆算
5 異常値が出力されるケースを検査
する
異常出力を得る入力を,仕様やプログラムロジックから逆算
6 ユースケースの観点から想定外の
入力について検査する
ユースケースの観点から想定外となり得る入力を任意に作成
7 ユースケースシナリオに従って検査
する
ユースケースシナリオに従う入力を任意に作成
・・・
明神, “AIシステムの品質保証”, JaSST 18
© Hitachi, Ltd. 2018, 2019. All rights reserved.
目次
48
1.自己紹介など
2.機械学習の概況
3.機械学習の特徴と品質に関する課題
4.機械学習の利活用における留意点
5.機械学習の品質に関する議論
6.社会的コンセンサス形成への動き
7.まとめ
© Hitachi, Ltd. 2018, 2019. All rights reserved.
6.1 社会的コンセンサス形成に向けて
49
小川はロゴデザイナー兼副運営委員長です
© Hitachi, Ltd. 2018, 2019. All rights reserved.
6.2 AIプロダクト品質保証(QA4AI)コンソーシアム
50
機械学習をはじめとするAI技術は進化しながら普及の一途を辿り、様々な産業の
競争力の源泉となるだけでなく、既存の産業構造を破壊・変革し、新たな産業を創出
しています。それに伴い、AI技術を用いた製品やサービス(AIプロダクト)が生活や
社会、経済に及ぼす影響も大きくなってきています。
しかし、従来型のハードウェアやソフトウェア、サービスなどに比べ、品質の把握、評価、
説明、管理など品質保証技術の確立が進んでいません。特に、機械学習ではデータの
学習によりふるまいが帰納的に決定されるため、「従来型のソフトウェアに対する品質
保証手段が利用困難」「開発プロセスの管理による品質保証が困難」といった特質があ
ります。
一方で、AI技術の進歩が社会に大きな価値をもたらすことが期待されています。
AI技術が安心して活用され進化できるようにするため、従来の発想にとらわれない、
ブレークスルーが求められています。
このため、AIプロダクトに対する品質保証技術の調査・体系化、適用支援・応用、
研究開発ともに、AIプロダクトの品質に対して、技術的特質を踏まえた適切な
理解を社会が持ちうる啓発活動を行うため、様々な技術と知恵を結集できる
コンソーシアムを設立します。
プレスリリース(2018.3.26)より
2018.4.1設立 http://qa4ai.jp/
© Hitachi, Ltd. 2018, 2019. All rights reserved. 51
主な活動内容
1) AI プロダクトの品質保証技術の調査・体系化
2) AI プロダクトの品質保証技術の適用支援・応用例の収集
3) AI プロダクトの品質保証技術の研究開発の促進
4) AI プロダクトの品質保証レベルの策定と、各レベルに必要とされる技術の対応付け
5) AI プロダクトの開発・提供組織による4)の自己宣言の方法の策定
6) 社会への 4)、5)の提示と啓発
プレスリリース(2018.3.26)より
月例会での議論の様子
6.3 QA4AIコンソーシアムの現状
© Hitachi, Ltd. 2018, 2019. All rights reserved.
6.4 QA4AI参加者
52
青木 利晃(北陸先端科学技術大学院大学)*
池田 裕則(東芝インフラシステムズ株式会社)
石川 冬樹(国立情報学研究所)*
伊藤 宏幸(LINE株式会社)
猪又 憲治(三菱電機株式会社)*
今井 健男(ぼのたけ)*
梅津 良昭(株式会社リコー)*
遠藤 征樹(株式会社日立産業制御ソリューションズ)*
大西 秀一(株式会社ヴィッツ)
小川 秀人(株式会社日立製作所)*
荻野 恒太郎(楽天株式会社)*
長田 健一(日立オートモティブシステムズ株式会社)*
柏 良輔(横河電機株式会社)*
岸 知二(早稲田大学)*
鬼頭 正広(アイシン・コムクルーズ株式会社)
窪田 邦夫(カルソニックカンセイ株式会社)*
黒田 園子(パナソニック株式会社)*
榊原 彰(日本マイクロソフト株式会社)*
佐藤 孝司(日本電気株式会社)
島田 さつき(富士通クォリティラボ株式会社)
鈴木 万治(DENSO International America Inc.)*
鈴木 里惇(LINE株式会社)
妹尾 義樹(国立産業技術総合研究所)
田口 研治(株式会社シーエーブイテクノロジーズ)
土屋 知典(富士通株式会社)*
徳 隆宏(オムロン株式会社)*
徳本 晋(株式会社富士通研究所)
西 康晴(電気通信大学)*
濱田 晃一(株式会社ディー・エヌ・エー)*
誉田 直美(日本電気株式会社)*
増田 聡(日本アイ・ビー・エム株式会社)*
町田 欣史(株式会社エヌ・ティ・ティ・データ)*
松谷 峰生(NPO法人ソフトウェアテスト技術振興協会)*
光本 直樹(株式会社デンソー)*
鷲崎 弘宜(早稲田大学)*
国立研究開発法人 宇宙航空研究開発機構 研究開発部門
第三研究ユニット*
特定非営利活動法人 ソフトウェアテスト技術振興協会*
一般財団法人 日本科学技術連盟*
(以上五十音順・「*」は設立発起人・団体を示します)
© Hitachi, Ltd. 2018, 2019. All rights reserved.
6.5 QA4AIコンソーシアムの現況
53
自動運転
(画像・映像系)
産業プロセスデータ
(センサ・数値系)
スマートスピーカー
(音声・自然言語系)
音声・画像生成
(クリエイティブ・ユーザ感性系)
画像引用元:https://dena.com/jp/article/003622
4分野で具体的なプロダクト例を設定し、品質保証の課題と対策を検討
© Hitachi, Ltd. 2018, 2019. All rights reserved.
6.6 日本政府のAI戦略強化
54
AI戦略の抜本的強化に向けた政府の検討状況,
人間中心のAI社会原則検討会議資料
https://www8.cao.go.jp/cstp/tyousakai/humanai/6kai/siryo1-1.pdf
© Hitachi, Ltd. 2018, 2019. All rights reserved. 55
6.7 内閣府 『人間中心のAI社会原則検討会議』
日経新聞 11/27
(1)AIは人間の基本的人権を侵さない
(2)AI教育の充実
(3)個人情報の慎重な管理
(4)AIのセキュリティー確保
(5)公正な競争環境の維持
(6)企業に決定過程の説明責任
(7)国境を越えたデータ利用の環境整備
© Hitachi, Ltd. 2018, 2019. All rights reserved.
6.8 国内外でのAIに関する議論の概況
56
# 分類 コンセンサス形成のための議論・会議体
1 倫理
2 法律
3 技術
4 契約
IEEE
Ethically
Aligned
Design
WEF
C4IR
経産省・産総研国プロ
「機械学習AIの品質保
証に関する研究開発」
経済産業省
「AI・データの利用に関する契約ガイドライン」
AIネットワーク
社会推進会議
「AI開発ガイドライン」
MLSE WAISE等の学術会義
ISO/IEC
JTC1/
SC42
米科学
技術政
策局
「AIの未
来に備
えて」
QA4AI
ア
シ
ロ
マ
23
の
原
則
国内
海外
AI品質マネジメント
検討委員会
内閣府
「人間中心
のAI社会
原則検討
会議」
EU「Develop draft AI
ethics guidelines」
OECD
「AIGO」
人工知能の未来のための
シャルルボワ共通ビジョン
UNESCO
「Roundtable
on AI」
IEC
SMB
163/8
欧米では倫理面の議論が先行、技術面の議論が進展中
IEEE
P7000
シリーズ
ITU-T
© Hitachi, Ltd. 2018, 2019. All rights reserved.
6.9 ISO/IEC JTC1/SC42 Artificial intelligence
57
WG1 Foundational standards
WG2 Big Data
WG3 Trustworthiness
WG4 Use cases and applications
SG1 Computational approaches and characteristics of
artificial intelligence systems
ISO/IEC JTC1/SC42
- Artificial Intelligence Concepts and Terminology ISO/IEC
AWI 22989
- Framework for Artificial Intelligence Systems Using
Machine Learning ISO/IEC AWI 23053
- Approaches to establish trust in AI systems through
transparency, verifiability, explainability, controllability, etc.
- Engineering pitfalls and assess typical associated threats and
risks to AI systems with their mitigation techniques and
methods.
- Approaches to achieve AI systems’ robustness, resiliency,
reliability, accuracy, safety, security, privacy, etc.
- Types of sources of bias in AI systems with a goal of
minimization, including but not limited to statistical bias in AI
systems and AI aided decision making.
情報処理学会
情報規格調査会
SC42専門委員会
杉村 領一氏
(産業技術総合研究所)
SC 42/WG 1 小委員会
基礎標準
杉村 領一氏
(産業技術総合研究所)
SC 42/WG 2 小委員会
ビッグデータ
榎本 義彦
(日本アイ・ビー・エム(株))
SC 42/WG 3 小委員会
信頼性
江川 尚志
(日本電気(株))
SC 42/WG 4 小委員会
ユースケースとアプリケー
ション
丸山 文宏
((株)富士通研究所)
© Hitachi, Ltd. 2018, 2019. All rights reserved.
6.10 IEEE EAD と IEEE P7000シリーズ
58
Ethically Aligned Design
(倫理的に調和したデザイン)
1. 一般原則
2. 自律知能システムへの価値観の組み込み
3. 倫理的研究と設計を導く方法論
4. 汎用人工知能(AGI)と人工超知能(ASI)の
安全性と恩恵
5. 個人情報と個別アクセス制御
6. 自律型兵器システムの再構築
7. 経済的/人道的問題
8. 法律
9. アフェクティブコンピューティング
10. 政策
11. ICT における伝統的倫理観
12. 複合現実
13. ウェルビーング
IEEE P7000シリーズ
システム設計時に倫理的問題に取り組むモデル
プロセス(P7000)
自律システムの透明性(P7001)
データプライバシーの処理(P7002)
アルゴリズム上のバイアスに関する考察(P7003)
子供と学生のデータガバナンスに関する標準
(P7004)
透明性のある雇用者のデータガバナンスに関する
標準(P7005)
パーソナルデータ人工知能エージェントに関する
標準(P7006)
ロボット及び自動システムを倫理的に駆動するた
めのオントロジー標準(P7007)
ロボットや知的自動システムを倫理的に「ナッジ(
そっと促す)」して駆動するための標準(P7008)
自律及び半自律システムのフェイルセーフ設計に
関する標準(P7009)
倫理的な人工知能と自律システムのウェルビーン
グ測定基準に関する標準(P7010)
© Hitachi, Ltd. 2018, 2019. All rights reserved.
6.11 産総研を中心とした品質標準化に向けた動き
59https://staff.aist.go.jp/y.oiwa/aiqa/index-ja.html
将来のJIS/ISO化を見据えた産業界と連携した研究開発の推進
© Hitachi, Ltd. 2018, 2019. All rights reserved.
目次
60
1.自己紹介など
2.機械学習の概況
3.機械学習の特徴と品質に関する課題
4.機械学習の利活用における留意点
5.機械学習の品質に関する議論
6.社会的コンセンサス形成への動き
7.まとめ
© Hitachi, Ltd. 2018, 2019. All rights reserved.
7.1 まとめ
61
・人の支援
・人の代替
・人を超越
・閉じた環境
・開いた環境
・プロダクトQA
・プロセスQA
・機械学習の精度
・システムの品質
・サービスの品質
機械学習
特に『QAと呼ばれる組織』
© Hitachi, Ltd. 2018, 2019. All rights reserved.
7.2 まとめ
62
機械学習システムの
検証技術、品質評価技術
の研究開発
機械学習を含むシステムの
品質保証に関する
産学を超えた議論
機械学習システム
の開発への技術導入
機械学習システムが
社会に受け入れられて
安全・安心・快適な世界を
創造するために
機械学習システムの品質保証に向けた課題とコンソーシアム活動

Mais conteúdo relacionado

Mais procurados

東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」Hitomi Yanaka
 
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII
 
機械学習は化学研究の"経験と勘"を合理化できるか?
機械学習は化学研究の"経験と勘"を合理化できるか?機械学習は化学研究の"経験と勘"を合理化できるか?
機械学習は化学研究の"経験と勘"を合理化できるか?Ichigaku Takigawa
 
優れた研究論文の書き方―7つの提案
優れた研究論文の書き方―7つの提案優れた研究論文の書き方―7つの提案
優れた研究論文の書き方―7つの提案Masanori Kado
 
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language ModelsDeep Learning JP
 
研究室における研究・実装ノウハウの共有
研究室における研究・実装ノウハウの共有研究室における研究・実装ノウハウの共有
研究室における研究・実装ノウハウの共有Naoaki Okazaki
 
機械学習品質管理・保証の動向と取り組み
機械学習品質管理・保証の動向と取り組み機械学習品質管理・保証の動向と取り組み
機械学習品質管理・保証の動向と取り組みShintaro Fukushima
 
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAttentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAGIRobots
 
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"Deep Learning JP
 
グラフデータ分析 入門編
グラフデータ分析 入門編グラフデータ分析 入門編
グラフデータ分析 入門編順也 山口
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向Motokawa Tetsuya
 
XAI (説明可能なAI) の必要性
XAI (説明可能なAI) の必要性XAI (説明可能なAI) の必要性
XAI (説明可能なAI) の必要性西岡 賢一郎
 
ICML 2021 Workshop 深層学習の不確実性について
ICML 2021 Workshop 深層学習の不確実性についてICML 2021 Workshop 深層学習の不確実性について
ICML 2021 Workshop 深層学習の不確実性についてtmtm otm
 
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -tmtm otm
 
【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?Masanao Ochi
 
PFP:材料探索のための汎用Neural Network Potential - 2021/10/4 QCMSR + DLAP共催
PFP:材料探索のための汎用Neural Network Potential - 2021/10/4 QCMSR + DLAP共催PFP:材料探索のための汎用Neural Network Potential - 2021/10/4 QCMSR + DLAP共催
PFP:材料探索のための汎用Neural Network Potential - 2021/10/4 QCMSR + DLAP共催Preferred Networks
 
ChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AIChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AIShota Imai
 
データサイエンティストのつくり方
データサイエンティストのつくり方データサイエンティストのつくり方
データサイエンティストのつくり方Shohei Hido
 

Mais procurados (20)

東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
 
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
 
機械学習は化学研究の"経験と勘"を合理化できるか?
機械学習は化学研究の"経験と勘"を合理化できるか?機械学習は化学研究の"経験と勘"を合理化できるか?
機械学習は化学研究の"経験と勘"を合理化できるか?
 
優れた研究論文の書き方―7つの提案
優れた研究論文の書き方―7つの提案優れた研究論文の書き方―7つの提案
優れた研究論文の書き方―7つの提案
 
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models
 
研究室における研究・実装ノウハウの共有
研究室における研究・実装ノウハウの共有研究室における研究・実装ノウハウの共有
研究室における研究・実装ノウハウの共有
 
機械学習品質管理・保証の動向と取り組み
機械学習品質管理・保証の動向と取り組み機械学習品質管理・保証の動向と取り組み
機械学習品質管理・保証の動向と取り組み
 
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAttentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門まで
 
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
 
グラフデータ分析 入門編
グラフデータ分析 入門編グラフデータ分析 入門編
グラフデータ分析 入門編
 
BERT入門
BERT入門BERT入門
BERT入門
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向
 
XAI (説明可能なAI) の必要性
XAI (説明可能なAI) の必要性XAI (説明可能なAI) の必要性
XAI (説明可能なAI) の必要性
 
ICML 2021 Workshop 深層学習の不確実性について
ICML 2021 Workshop 深層学習の不確実性についてICML 2021 Workshop 深層学習の不確実性について
ICML 2021 Workshop 深層学習の不確実性について
 
研究効率化Tips Ver.2
研究効率化Tips Ver.2研究効率化Tips Ver.2
研究効率化Tips Ver.2
 
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -深層学習の不確実性 - Uncertainty in Deep Neural Networks -
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
 
【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?
 
PFP:材料探索のための汎用Neural Network Potential - 2021/10/4 QCMSR + DLAP共催
PFP:材料探索のための汎用Neural Network Potential - 2021/10/4 QCMSR + DLAP共催PFP:材料探索のための汎用Neural Network Potential - 2021/10/4 QCMSR + DLAP共催
PFP:材料探索のための汎用Neural Network Potential - 2021/10/4 QCMSR + DLAP共催
 
ChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AIChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AI
 
データサイエンティストのつくり方
データサイエンティストのつくり方データサイエンティストのつくり方
データサイエンティストのつくり方
 

Semelhante a 機械学習システムの品質保証に向けた課題とコンソーシアム活動

XP祭り2019 - 日立・ソフトウェア革新部会 ~会社を越境する社内コミュニティ~
XP祭り2019 - 日立・ソフトウェア革新部会 ~会社を越境する社内コミュニティ~XP祭り2019 - 日立・ソフトウェア革新部会 ~会社を越境する社内コミュニティ~
XP祭り2019 - 日立・ソフトウェア革新部会 ~会社を越境する社内コミュニティ~Masanori Kaneko
 
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリングMasanori Kaneko
 
ディープラーニングによるユーザーの行動予測
ディープラーニングによるユーザーの行動予測ディープラーニングによるユーザーの行動予測
ディープラーニングによるユーザーの行動予測澪標アナリティクス
 
ソフトウェアジャパン2018 ITフォーラムセッション(3)
ソフトウェアジャパン2018 ITフォーラムセッション(3)ソフトウェアジャパン2018 ITフォーラムセッション(3)
ソフトウェアジャパン2018 ITフォーラムセッション(3)aitc_jp
 
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論Nobukazu Yoshioka
 
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方BrainPad Inc.
 
AIシステムの要求とプロジェクトマネジメント-後半:機械学習応用システムのための 要求工学と安全性
AIシステムの要求とプロジェクトマネジメント-後半:機械学習応用システムのための要求工学と安全性AIシステムの要求とプロジェクトマネジメント-後半:機械学習応用システムのための要求工学と安全性
AIシステムの要求とプロジェクトマネジメント-後半:機械学習応用システムのための 要求工学と安全性Nobukazu Yoshioka
 
日本語データの活用までの道のり
日本語データの活用までの道のり日本語データの活用までの道のり
日本語データの活用までの道のりHideto Masuoka
 
医療機器ソフトウェア開発を対象とした包括的アセスメントのケーススタディ
医療機器ソフトウェア開発を対象とした包括的アセスメントのケーススタディ医療機器ソフトウェア開発を対象とした包括的アセスメントのケーススタディ
医療機器ソフトウェア開発を対象とした包括的アセスメントのケーススタディMasanori Kaneko
 
AIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術について
AIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術についてAIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術について
AIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術についてFixstars Corporation
 
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計Hironori Washizaki
 
Pmi日本フォーラム2015講演資料(アイ・ティ・イノベーション 井上英明) v1.0_講演用_カスタマイズ
Pmi日本フォーラム2015講演資料(アイ・ティ・イノベーション 井上英明) v1.0_講演用_カスタマイズPmi日本フォーラム2015講演資料(アイ・ティ・イノベーション 井上英明) v1.0_講演用_カスタマイズ
Pmi日本フォーラム2015講演資料(アイ・ティ・イノベーション 井上英明) v1.0_講演用_カスタマイズITinnovation
 
【B-2】AI時代におけるエンジニアの生存戦略
【B-2】AI時代におけるエンジニアの生存戦略【B-2】AI時代におけるエンジニアの生存戦略
【B-2】AI時代におけるエンジニアの生存戦略Developers Summit
 
R&D部門におけるデータ共有・利活用 (AI,MI)は、なぜ難しいのか?
R&D部門におけるデータ共有・利活用 (AI,MI)は、なぜ難しいのか?R&D部門におけるデータ共有・利活用 (AI,MI)は、なぜ難しいのか?
R&D部門におけるデータ共有・利活用 (AI,MI)は、なぜ難しいのか?恵 桂木
 

Semelhante a 機械学習システムの品質保証に向けた課題とコンソーシアム活動 (20)

XP祭り2019 - 日立・ソフトウェア革新部会 ~会社を越境する社内コミュニティ~
XP祭り2019 - 日立・ソフトウェア革新部会 ~会社を越境する社内コミュニティ~XP祭り2019 - 日立・ソフトウェア革新部会 ~会社を越境する社内コミュニティ~
XP祭り2019 - 日立・ソフトウェア革新部会 ~会社を越境する社内コミュニティ~
 
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
 
Extreme Management Center を活用したネットワークの見える化
Extreme Management Center を活用したネットワークの見える化Extreme Management Center を活用したネットワークの見える化
Extreme Management Center を活用したネットワークの見える化
 
ディープラーニングによるユーザーの行動予測
ディープラーニングによるユーザーの行動予測ディープラーニングによるユーザーの行動予測
ディープラーニングによるユーザーの行動予測
 
ソフトウェアジャパン2018 ITフォーラムセッション(3)
ソフトウェアジャパン2018 ITフォーラムセッション(3)ソフトウェアジャパン2018 ITフォーラムセッション(3)
ソフトウェアジャパン2018 ITフォーラムセッション(3)
 
Iot literacy no.5
Iot literacy no.5Iot literacy no.5
Iot literacy no.5
 
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
 
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方
 
AIシステムの要求とプロジェクトマネジメント-後半:機械学習応用システムのための 要求工学と安全性
AIシステムの要求とプロジェクトマネジメント-後半:機械学習応用システムのための要求工学と安全性AIシステムの要求とプロジェクトマネジメント-後半:機械学習応用システムのための要求工学と安全性
AIシステムの要求とプロジェクトマネジメント-後半:機械学習応用システムのための 要求工学と安全性
 
Smfl20201001
Smfl20201001Smfl20201001
Smfl20201001
 
日本語データの活用までの道のり
日本語データの活用までの道のり日本語データの活用までの道のり
日本語データの活用までの道のり
 
医療機器ソフトウェア開発を対象とした包括的アセスメントのケーススタディ
医療機器ソフトウェア開発を対象とした包括的アセスメントのケーススタディ医療機器ソフトウェア開発を対象とした包括的アセスメントのケーススタディ
医療機器ソフトウェア開発を対象とした包括的アセスメントのケーススタディ
 
AIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術について
AIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術についてAIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術について
AIチップ戦国時代における深層学習モデルの推論の最適化と実用的な運用を可能にするソフトウェア技術について
 
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
 
Pmi日本フォーラム2015講演資料(アイ・ティ・イノベーション 井上英明) v1.0_講演用_カスタマイズ
Pmi日本フォーラム2015講演資料(アイ・ティ・イノベーション 井上英明) v1.0_講演用_カスタマイズPmi日本フォーラム2015講演資料(アイ・ティ・イノベーション 井上英明) v1.0_講演用_カスタマイズ
Pmi日本フォーラム2015講演資料(アイ・ティ・イノベーション 井上英明) v1.0_講演用_カスタマイズ
 
【B-2】AI時代におけるエンジニアの生存戦略
【B-2】AI時代におけるエンジニアの生存戦略【B-2】AI時代におけるエンジニアの生存戦略
【B-2】AI時代におけるエンジニアの生存戦略
 
ils2023
ils2023ils2023
ils2023
 
ils2023
ils2023ils2023
ils2023
 
ils.pptx
ils.pptxils.pptx
ils.pptx
 
R&D部門におけるデータ共有・利活用 (AI,MI)は、なぜ難しいのか?
R&D部門におけるデータ共有・利活用 (AI,MI)は、なぜ難しいのか?R&D部門におけるデータ共有・利活用 (AI,MI)は、なぜ難しいのか?
R&D部門におけるデータ共有・利活用 (AI,MI)は、なぜ難しいのか?
 

機械学習システムの品質保証に向けた課題とコンソーシアム活動

  • 1. © Hitachi, Ltd. 2018, 2019. All rights reserved. 株式会社日立製作所 研究開発グループ システムイノベーションセンタ 主管研究員 ソフトウェアモダナイゼーションラボ長 小川秀人 機械学習システムの 品質保証に向けた課題と コンソーシアム活動
  • 2. © Hitachi, Ltd. 2018, 2019. All rights reserved. 目次 1 1.自己紹介など 2.機械学習の概況 3.機械学習の特徴と品質に関する課題 4.機械学習の利活用における留意点 5.機械学習の品質に関する議論 6.社会的コンセンサス形成への動き 7.まとめ
  • 3. © Hitachi, Ltd. 2018, 2019. All rights reserved. 1.1 自己紹介: 小川秀人 2 ソフトウェア工学の企業内研究者 学生時代は… 『ペンギンは鳥』ソフトウェアテスティング 形式手法 開発プロセス ソフトウェアプロダクトライン など 弊社グループ向けのソフト開発技術の研究と適用が主な仕事 いわゆる「組込みソフト」と呼ばれる製品たち (とITシステムも少し) 『鳥は飛ぶ』 『ペンギンは飛べない』 矛盾 第2次AIブーム 博士(情報科学)
  • 4. © Hitachi, Ltd. 2018, 2019. All rights reserved. 目次 3 1.自己紹介など 2.機械学習の概況 3.機械学習の特徴と品質に関する課題 4.機械学習の利活用における留意点 5.機械学習の品質に関する議論 6.社会的コンセンサス形成への動き 7.まとめ
  • 5. © Hitachi, Ltd. 2018, 2019. All rights reserved. 2.1 AIに関する概念の整理 4 人工知能(AI) 強いAI 弱いAI 人間と同等の知能の実現 人間のような知的処理の実現 ルールベース 機械学習 メタヒューリスティクス エキスパートシステム 深層学習 (Deep Learning, Deep Neural Network) 決定木学習 クラスタリング などなど 進化的アルゴリズム 群知能 (蟻コロニーなど) サポートベクターマシン BRMS
  • 6. © Hitachi, Ltd. 2018, 2019. All rights reserved. 2.2 AI市場の概況 5 世界市場 300兆円超へ拡大 (2025) 深層学習が 「過度な期待」のピーク期 会話型AIプラットフォームが 黎明期 など 10.3 95.1 317.9 0 50 100 150 200 250 300 350 2015年 2020年 2025年 人工知能市場の 世界需要額見通し JEITA, 調査統計ガイドブック2017-2018のデータを整形 [兆円] 先進テクノロジのハイプ・サイクル:2018年 ガートナー (2018.8) 関連するテクノロジの強調は小川が追記
  • 7. © Hitachi, Ltd. 2018, 2019. All rights reserved. 2.3 AI技術の概況 6 技術的には深層学習が主流 (特に画像処理) 0 100 200 300 400 500 600 700 800 900 2014 2015 2016 2017 DL DL以外 コンピュータビジョンに関する 国際会議CVPRの論文数推移 ソフトウェア工学でのアプローチも増加 0 2000 4000 6000 8000 10000 12000 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 "Software Engineering"とのアンド条件で ヒットするgoogle scholarの文献数 Artificial Intelligence Machine Learning Neural Network Deep Learning 深層学習 深層学習以外
  • 8. © Hitachi, Ltd. 2018, 2019. All rights reserved. 2.4 機械学習を使った製品・サービスの例 7 リソース 最適配置 製造物 検査 生産 最適化 認識 判断 制御
  • 9. © Hitachi, Ltd. 2018, 2019. All rights reserved. 2.5 (例)最適配置問題 8 どこに何台を配備しておけば 最適に業務を遂行できるか ⇒過去データに基づき到着時間を予測 ※実際のデータではありません 全体最適 ・平均到着時間を最短に ・コストを最低に 個別最適 ・どこでも 今までより早く安く 要件 制約準拠 ・必ず30分以内に ・ありえない経路がない 機械学習を用いることで、要件の満足に生じる課題はあるか?
  • 10. © Hitachi, Ltd. 2018, 2019. All rights reserved. 目次 9 1.自己紹介など 2.機械学習の概況 3.機械学習の特徴と品質に関する課題 4.機械学習の利活用における留意点 5.機械学習の品質に関する議論 6.社会的コンセンサス形成への動き 7.まとめ
  • 11. © Hitachi, Ltd. 2018, 2019. All rights reserved. 3.1 機械学習と品質に関する議論 10 SQiP ソフトウェア品質シンポジウム https://www.juse.jp/sqip/symposium/ CEATEC https://regist.ceatec.com/?act=ConferencesList&event_id=7 組込みシステム産業振興機構 WINK https://www.kansai-kumikomi.net/wink/seminar_registration/
  • 12. © Hitachi, Ltd. 2018, 2019. All rights reserved. 3.2 なぜ品質議論が盛んになっているのか 11 人工知能あるいは機械学習への 過剰な期待と不安感 ◎ 適切な理解に基づく、適正な利活用による 社会およびビジネスの発展 × 過剰な期待による、失望 不安感による、利活用の抑制
  • 13. © Hitachi, Ltd. 2018, 2019. All rights reserved. 3.3 AIプロダクト品質保証(QA4AI)コンソーシアム 12 機械学習をはじめとするAI技術は進化しながら普及の一途を辿り、様々な産業の 競争力の源泉となるだけでなく、既存の産業構造を破壊・変革し、新たな産業を創出 しています。それに伴い、AI技術を用いた製品やサービス(AIプロダクト)が生活や 社会、経済に及ぼす影響も大きくなってきています。 しかし、従来型のハードウェアやソフトウェア、サービスなどに比べ、品質の把握、評価、 説明、管理など品質保証技術の確立が進んでいません。特に、機械学習ではデータの 学習によりふるまいが帰納的に決定されるため、「従来型のソフトウェアに対する品質 保証手段が利用困難」「開発プロセスの管理による品質保証が困難」といった特質があ ります。 一方で、AI技術の進歩が社会に大きな価値をもたらすことが期待されています。 AI技術が安心して活用され進化できるようにするため、従来の発想にとらわれない、 ブレークスルーが求められています。 このため、AIプロダクトに対する品質保証技術の調査・体系化、適用支援・応用、 研究開発ともに、AIプロダクトの品質に対して、技術的特質を踏まえた適切な 理解を社会が持ちうる啓発活動を行うため、様々な技術と知恵を結集できる コンソーシアムを設立します。 プレスリリース(2018.3.26)より 2018.4.1設立 http://qa4ai.jp/
  • 14. © Hitachi, Ltd. 2018, 2019. All rights reserved. 3.4 機械学習に対する不安感(1) 13 https://www.tesla.com/jp/blog/tragic-loss ■事例1 2016年のTesla自動運転車の事故 • Autopilotの総計130 million milesの走行で初めて起きた死亡事故 • 全世界では、人運転で60 million milesに一度の事故発生頻度 • 全米では、94 million milesに一度 • 『Autopilotも運転手も、眩しい空に対してトレーラーの 白い側面を認識できず、ブレーキをかけなかった』 http://www.dailymail.co.uk/news/article-3677101/Tesla-toldregulators-fatal-Autopilot-crash-nine-days-happened.html
  • 15. © Hitachi, Ltd. 2018, 2019. All rights reserved. 3.5 機械学習に対する不安感 (2) 14 ■事例2 Google Photosの画像認識 Twitter @jackyalcine • ユーザの画像に対して、自動的にタグをつける機能 • 黒人に対して、「ゴリラ」とタグづけしたことが、Twitterで拡散し問題化 • 2年後、googleは、「ゴリラ」を禁止語とすることで対処した https://www.theguardian.com/technology/2018/jan/12/google-racism-ban-gorilla-black-people
  • 16. © Hitachi, Ltd. 2018, 2019. All rights reserved. 3.6 機械学習に対する不安感 (3) 15 ■事例3 Amazonが採用AI開発を停止 https://www.reuters.com/article/amazoncom-jobs-automation/insight-amazon -scraps-secret-ai-recruiting-tool-that-showed-bias-against-women-idUSL2N1VB1FQ • 応募用紙の記載によって 応募者を選考するAIを 2014年から開発 • 2015年に、男女差なく評価 できていないことに気づいた • 学習した実績が男性に偏り • 結果 “women’s”といった 文字列を含む応募を 低評価していた • 本件に関する修正はしたが 新たに同様の問題が起こる 可能性を否定できないため 開発を停止
  • 17. © Hitachi, Ltd. 2018, 2019. All rights reserved. 16 ■事例4 優れた識別器でも間違う研究事例 (Adversarial Examples) Eykholt, Kevin, et al. "Robust Physical-World Attacks on Deep Learning Visual Classification." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018. Ian Goodfellow, Jonathon Shlens, Christian Szegedy, “Explaining and Harnessing Adversarial Examples”, ICLR2015 3.7 AI/機械学習に対する不安感 (4) パンダ画像にノイズを乗せた画像をテナガザルと判別 停止標識を制限速度と判別 1ピクセルの影響で信号を誤判断 Wicker, Matthew, Xiaowei Huang, and Marta Kwiatkowska. "Feature-guided black-box safety testing of deep neural networks." Int. Conf. on Tools and Algorithms for the Construction and Analysis of Systems. Springer, Cham, 2018.
  • 18. © Hitachi, Ltd. 2018, 2019. All rights reserved. 3.8 パンダがテナガザルになると何が困るのか? 17 実用上の困りごと ビジネス上の困りごと (ベンダの立場) 品質保証上の困りごと (ベンダの立場) ・ 誤認識がシステム動作に悪影響を与えるかもしれない ・ 意図的な攻撃に使われるかもしれない ・ 何ができたら完成品として納品できるのだろう ・ これが原因で事故が起きたら、誰がどう責任を取るのだろう ・ どうすれば、こんな問題を事前に発見して品質を上げられるのだろう ・ お客様には何をしたから大丈夫と言えばよいのだろう
  • 19. © Hitachi, Ltd. 2018, 2019. All rights reserved. 3.9 統計的機械学習の基本的な仕組み 18 学習データ 学習器 モデル 判別器 学習時 利用時 教師あり判別問題の例 計測データ A群 B群 A群 B群 この計測データはA群
  • 20. © Hitachi, Ltd. 2018, 2019. All rights reserved. 3.10 機械学習の技術的な利点と課題 19 利点: 汎化 (内挿) 学習器 課題: ハイパーパラメタ 課題: 学習データの 外側 (外挿) 課題: 学習データの 偏り課題: コーナー ケース 課題: ランダム性 課題:説明性 利点: 境界を定義する 必要がない 課題:過学習
  • 21. © Hitachi, Ltd. 2018, 2019. All rights reserved. (補足)ディープニューラルネットワーク 20 多層、多次元入力、多次元出力 入力層 出力層隠れ層1 隠れ層2 隠れ層3 犬 猫 鳥 …
  • 22. © Hitachi, Ltd. 2018, 2019. All rights reserved. 3.11 文字認識の例 21 「1」 と 「7」 の境界 入力画像 「1」である確率 0.9 0.8 0.5 0.4 0.2 0.1 「7」である確率 0.1 0.2 0.4 0.5 0.8 0.9 機械学習の凄いところは、例示をもとに、この境界を作ってくれること この境界が『正しい』ということを、示せますか? 人が設計したアルゴリズムで認識するとき、どうやって品質保証していたのか? ・アルゴリズムの妥当性を評価 ⇒ アルゴリズムが正しく実装されていることを検証 ・それでも誤判別が起きたとしたら、「仕様の外」 機械学習でなくても難しいこと: 1と7の境界の正解はない 機械学習だから難しいこと: 1と7の境界をどこに定めたかわからない
  • 23. © Hitachi, Ltd. 2018, 2019. All rights reserved. 3.12 システム開発の観点から見た機械学習の特性 22 従来型ソフトウェア開発 機械学習開発 要件 設計 構築 運用 演繹 段階的詳細化と先行フェーズとの検証 データからの帰納的な知見発掘 データ 帰納 検証 検証 検証 学習要求 クロス バリデー ション 実世界 これまでのシステム開発の知見が通用しない危機感 前提:100%正解する機械学習はありえない 課題:「正解を定義できない」対象に対する検証・品質評価
  • 24. © Hitachi, Ltd. 2018, 2019. All rights reserved. 3.13 機械学習システムの品質課題 23 何が課題で、何を守るべきなのか整理されないまま、不安が先行(少なくとも半年前は) 機械学習システムの品質課題 システム開発での課題 Dev. issues 社会的課題 Social issues 実は今までも あった課題 機械学習 特有の課題 ビジネス課題 Biz. issues 経済的課題 倫理的課題対顧客の課題 反復プロセス での品質保証 入力空間が 想定できない状況 での品質保証 仕様に基づく テストができない 学習データの 品質とは? 機械学習の 経済性 品質の担保を どう説明するか 問題発生時の 責任範囲 法的課題 社会システム の課題
  • 25. © Hitachi, Ltd. 2018, 2019. All rights reserved. 目次 24 1.自己紹介など 2.機械学習の概況 3.機械学習の特徴と品質に関する課題 4.機械学習の利活用における留意点 5.機械学習の品質に関する議論 6.社会的コンセンサス形成への動き 7.まとめ
  • 26. © Hitachi, Ltd. 2018, 2019. All rights reserved. 4.1 機械学習を含むシステムのライフサイクル Shipment/Service-in Assessment Pilot / PoC / Development 訓練データ セット作成 MLアーキ テクチャ設計 学習結果 評価 学習 機械学習フレームワーク 出荷前 品質評価 顧客合意 Operation 運用時 データ モデル モデル 実行時 検証 実行 オンライン 学習 Maintenance データ 再構築 ビジネス KPI システム開発 履歴収集 それぞれで何をしておいたら、高い品質を提供できると言えるだろうか?
  • 27. © Hitachi, Ltd. 2018, 2019. All rights reserved. 4.2 留意点/疑問/課題 (訓練データセット) Assessment Pilot / PoC / Development 訓練データ セット作成 MLアーキ テクチャ設計 学習結果 評価 学習 機械学習フレームワーク 出荷前 品質評価 顧客 合意 Operation 運用時 データ モデル モデル 実行時 検証 実行 オンライン 学習 Maintenance データ 再構築 ビジネス KPI システム 開発 履歴 収集 Shipment/Service-in ポイント ・KPIに対する「よいデータ」を顧客とベンダで合意しよう ・合意した「よいデータ」を集めよう ・訓練データに起因する「限界」を理解しよう 疑問/課題 ・想定する全運用時をカバーするデータが集められる? ・データを生成することはできる? ・「よいデータ」が事前にわかるの? ・データのクレンジングは誰の仕事?
  • 28. © Hitachi, Ltd. 2018, 2019. All rights reserved. 4.3 留意点/疑問/課題 (MLアーキテクチャ設計) Assessment Pilot / PoC / Development 訓練データ セット作成 MLアーキ テクチャ設計 学習結果 評価 学習 機械学習フレームワーク 出荷前 品質評価 顧客 合意 Operation 運用時 データ モデル モデル 実行時 検証 実行 オンライン 学習 Maintenance データ 再構築 ビジネス KPI システム 開発 履歴 収集 Shipment/Service-in ポイント ・適当に選んでも結果は何か出てくるが 求めているものが出てくるとは限らない 疑問/課題 ・多様な選択肢をどう選ぶか (学習アルゴリズム、構造、ハイパーパラメータ…)
  • 29. © Hitachi, Ltd. 2018, 2019. All rights reserved. 4.4 留意点/疑問/課題 (学習) Assessment Pilot / PoC / Development 訓練データ セット作成 MLアーキ テクチャ設計 学習結果 評価 学習 機械学習フレームワーク 出荷前 品質評価 顧客 合意 Operation 運用時 データ モデル モデル 実行時 検証 実行 オンライン 学習 Maintenance データ 再構築 ビジネス KPI システム 開発 履歴 収集 Shipment/Service-in ポイント ・アジャイル(反復的)な取組みになる 疑問/課題 ・プロセスだけで品質を評価/保証できる? (機械学習だけでないアジャイル開発的な課題も混在) ・発見的活動になるため、管理が難しい
  • 30. © Hitachi, Ltd. 2018, 2019. All rights reserved. 4.5 留意点/疑問/課題 (学習結果の評価) Assessment Pilot / PoC / Development 訓練データ セット作成 MLアーキ テクチャ設計 学習結果 評価 学習 機械学習フレームワーク 出荷前 品質評価 顧客 合意 Operation 運用時 データ モデル モデル 実行時 検証 実行 オンライン 学習 Maintenance データ 再構築 ビジネス KPI システム 開発 履歴 収集 Shipment/Service-in ポイント ・学習結果でプロダクト品質が直接測れる 疑問/課題 ・従来のテストに当たるものと思ってよい? ・交差検証や混同行列などの品質保証的な解釈 ・機械学習特有のテスト技術とは? ・評価結果がよくないとき、どう修正する?
  • 31. © Hitachi, Ltd. 2018, 2019. All rights reserved. 4.6 留意点/疑問/課題 (システム開発) Assessment Pilot / PoC / Development 訓練データ セット作成 MLアーキ テクチャ設計 学習結果 評価 学習 機械学習フレームワーク 出荷前 品質評価 顧客 合意 Operation 運用時 データ モデル モデル 実行時 検証 実行 オンライン 学習 Maintenance データ 再構築 ビジネス KPI システム 開発 履歴 収集 Shipment/Service-inポイント ・システムでのフェールセーフや 運用によるカバーなど、 システム全体での品質確保を考えよう 疑問/課題 ・機械学習と従来型ソフトの責任分担 ・後付けで例外処理ルールが増えていく…
  • 32. © Hitachi, Ltd. 2018, 2019. All rights reserved. 4.7 留意点/疑問/課題 (Assessment) Assessment Pilot / PoC / Development 訓練データ セット作成 MLアーキ テクチャ設計 学習結果 評価 学習 機械学習フレームワーク 出荷前 品質評価 顧客 合意 Operation 運用時 データ モデル モデル 実行時 検証 実行 オンライン 学習 Maintenance データ 再構築 ビジネス KPI システム 開発 履歴 収集 Shipment/Service-in ポイント ・顧客/ユーザが得られる『ビジネス的価値』を KPIとして合意しよう ・精度をKPIとすることは現実的でない ・100%の精度はないことを前提とした 顧客/ユーザとの作業分担をしよう ・サービスの特性を考慮したKPIを決めよう 疑問/課題 ・ビジネスKPIを決められる?計測できる? ・何を約束する?何を約束しない?
  • 33. © Hitachi, Ltd. 2018, 2019. All rights reserved. 4.8 留意点/疑問/課題 (Shipment/Service-in) Assessment Pilot / PoC / Development 訓練データ セット作成 MLアーキ テクチャ設計 学習結果 評価 学習 機械学習フレームワーク 出荷前 品質評価 顧客 合意 Operation 運用時 データ モデル モデル 実行時 検証 実行 オンライン 学習 Maintenance データ 再構築 ビジネス KPI システム 開発 履歴 収集 Shipment/Service-in ポイント ・ユースケースを想定した評価をしよう 疑問/課題 ・第三者検証として何を評価できるか? ・品証独自のテストデータを持つべきか? ・プロセス品証って意味あるの? ポイント ・運用も含めた品質レベルを合意しよう (運用形態により守るべきものが異なる) 疑問 ・何をエビデンスに品質を説明するのか? ・ 「肌感覚」と違う結果をどう説明する?
  • 34. © Hitachi, Ltd. 2018, 2019. All rights reserved. 4.9 留意点/疑問/課題 (Operation) Assessment Pilot / PoC / Development 訓練データ セット作成 MLアーキ テクチャ設計 学習結果 評価 学習 機械学習フレームワーク 出荷前 品質評価 顧客 合意 Operation 運用時 データ モデル モデル 実行時 検証 実行 オンライン 学習 Maintenance データ 再構築 ビジネス KPI システム 開発 履歴 収集 Shipment/Service-in ポイント ・運用時に得られるデータと実行履歴を記録しておこう ・重大な異常を検出する仕組みと対処法を用意しておこう (必要に応じて) 疑問/課題 ・個々の事象にどこまで責任を持つ? (全体最適と個別事象の関係) ・勝手に成長するのも保証する必要がある?
  • 35. © Hitachi, Ltd. 2018, 2019. All rights reserved. 4.10 留意点/疑問/課題 (データ再構築) Assessment Pilot / PoC / Development 訓練データ セット作成 MLアーキ テクチャ設計 学習結果 評価 学習 機械学習フレームワーク 出荷前 品質評価 顧客 合意 Operation 運用時 データ モデル モデル 実行時 検証 実行 オンライン 学習 Maintenance データ 再構築 ビジネス KPI システム 開発 履歴 収集 Shipment/Service-in ポイント ・データの成長がシステムの成長です 疑問/課題 ・学習データを少し変えただけで 今までと全然違う結果になるんですが!? ・運用時に得られたデータで充分とは限らない
  • 36. © Hitachi, Ltd. 2018, 2019. All rights reserved. 目次 35 1.自己紹介など 2.機械学習の概況 3.機械学習の特徴と品質に関する課題 4.機械学習の利活用における留意点 5.機械学習の品質に関する議論 6.社会的コンセンサス形成への動き 7.まとめ
  • 37. © Hitachi, Ltd. 2018, 2019. All rights reserved. 5.1 機械学習に対する品質保証の考え方の提案 36 機械学習(ML)の品質保証とは、 • ML搭載したシステム全体のリスクが • 社会で許容可能なリスク以下であることを示すこと システム全体のリスク ≦ 社会が許容可能なリスク上限品質保証のゴール: AI活用により新たに 発生するリスク 従来のシステムのリスク 品質保証のゴールを達成するために、 「(i)AI活用により新たに発生するリスクの低減」 するとともに 「(ii)AI活用の追加利益によって拡大可能なリスク基準の策定と社会的な 合意形成」を実現 従来から許容しているリスク AI活用の追加利益により 新たに許容可能なリスク
  • 38. © Hitachi, Ltd. 2018, 2019. All rights reserved. 5.2 機械学習システム品質保証アプローチ 37 ①MLシステム検証技術 ②MLシステム品質アセスメント手法 MLテスト 十分性評価 ML品証 ガイド 確率的 品質評価 ③社会的コンセンサスの形成 ML品質 レベル ML品証標準 アクティビティ ML起因リスクの低減 ML活用の追加利益によって拡大可能な リスク基準の策定と社会的な合意形成 1.1 手順 1.2 評価基準 ・・・ ≦
  • 39. © Hitachi, Ltd. 2018, 2019. All rights reserved. 5.3 機械学習を含む『システム』 38 シ ス テ ム 入 力 シ ス テ ム 出 力 機械学習を用いて 開発したソフトウェア (DNN) 従来 ソフトウェア 従来 ソフトウェア 従来 ソフトウェア 従来 ソフトウェア 外部環境 External environment 社会 Social 機械学習適用システム どこで何を守るべきだろうか?
  • 40. © Hitachi, Ltd. 2018, 2019. All rights reserved. 5.4 リスクの低減策 39 シ ス テ ム 入 力 シ ス テ ム 出 力 機械学習を用いて 開発したソフトウェア (DNN) 従来 ソフトウェア 従来 ソフトウェア 従来 ソフトウェア 従来 ソフトウェア 外部環境 社会 機械学習適用システム リスクの低減には様々なアプローチが考えられる 機械学習モデル に対する事前検証 法律 標準規格保険 インフラ 実行時監視ゲートウェイ 追加学習・更新 安全 機構代替ソフト 安全 運用
  • 41. © Hitachi, Ltd. 2018, 2019. All rights reserved. 5.5 機械学習の結果を評価する基本的な手法 40 ホールドアウト (Holdout) 混同行列 (Confusion Matrix) 学習データ テストデータ クロスバリデーション (Cross Validation) 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 A Not A A True Positive False Positive Not A False Negative True Negative 正解 予想 Accuracy, Precision, Recall, False Positive Rate, f-measure… 学習曲線 (Learning Curve) 標準的な手法を用いることは、最低限の品質保証として必要 http://scikit-learn.org/stable/auto_examples/model_selection/plot_learning_curve.html
  • 42. © Hitachi, Ltd. 2018, 2019. All rights reserved. 5.6 全と個 41 全 個 統計的な評価についての 知見は蓄積されてきた 『エッジ・ケース (Edge-case)』 への対応が大きな課題に
  • 43. © Hitachi, Ltd. 2018, 2019. All rights reserved. 5.7 (技術例A)リファレンスモデル照合によるテスト自動化 42 リファレンスモデルと呼ぶ疑似オラクルを使用することでテスト自動化 ⇒テスト量を増加 【DNN】 【リファレンスモデルの例】 ■道路交通標識認識の例 【入力値】 標識画像 出 力 入 力 【出力値】 識別結果 入 力 従来の画像 処理技術で 標識の形状 を抽出 評価 OK/NG if (形状=='丸形'){ assert( 識別結果=='止まれ' or 識別結果=='進入禁止')} 画像引用元:J. Stallkamp, M. Schlipsing, J. Salmen, and C. Igel. The German Traffic Sign Recognition Benchmark: A multi-class classification competition. In Proceedings of the IEEE International Joint Conference on Neural Networks, pages 1453-1460. 2011. http://benchmark.ini.rub.de/?section=gtsrb&subsection=dataset 入 力 速度制限 進入禁止 止まれ 照合⇒評価OK/NG 【正解出力値】 人手で作成 ⇒テスト量増加 を阻害 出力 疑似オラクル として使用 Pseudo oracle 速度制限 進入禁止 止まれ 佐藤、來間、中川、小川 “DNN搭載システムの品質課題と既存技術の活用可能性”, MLSE2018
  • 44. © Hitachi, Ltd. 2018, 2019. All rights reserved. 5.8 (技術例B) 制約ソルバによる範囲網羅検証 43 DNNのネットワーク構造を論理式化し,論理式の真偽を制約ソルバで検査 ⇒指定した範囲内の全入力値について,要件を満たすことを網羅検証可 n_1 = (w_1 * x_1 + b_1) ∧ n_2 = (w_2 * n_1 + b_2) ∧ … 【入力値の範囲を定義する式】 𝜌, 𝜃, 𝜓, 𝜐 𝑜𝑤𝑛, 𝜐𝑖𝑛𝑡 【出力値】 水平方向の 回避指示 入 力 出 力 【DNN】 【入出力値の要件】 他機が右から接近して いる場合,左3.0度旋回 (Lower1 < x_1 < Upper1) ∧ (Lower2 < x_1 < Upper2) ∧ … ∧ ∧ (𝜃 > 270) => ((y_1 > y_2)∨ …) ■航空機制御指令装置の例(Stanford大) 自機 他機 𝜌 論理式化 論理式 化𝜃 𝜓 𝜐 𝑜𝑤𝑛 𝜐𝑖𝑛𝑡 【入力値】 範囲指定 Katz, G., Barrett, C., Dill, D.L., Julian, K., Kochenderfer, M.J.: Reluplex: An Efficient SMT Solver for Verifying Deep Neural Networks, Computer Aided Verification 2017, pp.97-117 (2017). 【要件の否定を表す式】【DNNのネットワーク構造を表す式】 論理式が真となる解あり ⇒要件を違反する場合あり
  • 45. © Hitachi, Ltd. 2018, 2019. All rights reserved. 5.9 (技術例C) ニューロンカバレッジ・テスティング 44 DNNを構成するニューロンの活性化状況に基づいてカバレッジ指標を定義 ⇒カバレッジを基準にテストの充足性を判定 テスト 入力値1 6 12 のニューロンが活性化 ⇒カバレッジ50% 入力 1枚 10枚 100枚 テストケースの追加 テストケースの追加 明神, “AIシステムの品質保証”, JaSST 18
  • 46. © Hitachi, Ltd. 2018, 2019. All rights reserved. 5.10 (技術例D) 機械学習の説明技術 45 機械学習によってなされた判断の理由を説明する解析技術 ⇒ 過不足している教師データの判断などができるようになる 下の画像は、Ribeiro, Marco Tulio, Sameer Singh, and Carlos Guestrin. "Why should i trust you?: Explaining the predictions of any classifier.“ Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. ACM, 2016.
  • 47. © Hitachi, Ltd. 2018, 2019. All rights reserved. 5.11 機械学習システムの何を評価するかという議論 46 Allowability: Behavior or result of ML product cannot be completely decided or predicted because of ML’s inductive nature. Since zero risk is actually impossible, arrowable risk must be defined. It may be defined on the basis of technical Limit and social consensus. Achievability: Actual risk must be achieved less than the allowable Risk fundamentally. Robustness: Possibility of failure in achievement of expected risk must be reduced as low as reasonably possible. Avoidability: Harm should be avoided according to its criticality. Critical harm must be avoided even if actual risk fails in achievement less than the allowable risk. Improvability: When actual risk is more than allowable risk, risk must be decreased as soon as possible less than the allowable risk by explaining and understanding of the cause, by controlling the cause and by unregressing the controlled cause. Improvability, hence, is composed of Explainability and Understandability, Controllability and Unregressibility. Y. Nishi, S. Masuda, H. Ogawa and K. Uetsuki, "A Test Architecture for Machine Learning Product," IEEE International Conference on Software Testing, Verification and Validation Workshops (ICSTW), Vasteras, 2018, pp. 273-278. 例:MLプロダクト評価の基本原理(A-ARAI)
  • 48. © Hitachi, Ltd. 2018, 2019. All rights reserved. 5.12 AI搭載システムの検証観点の検討 47 自動車向け機能安全規格ISO26262記載のテスト手法をヒントにして, AI搭載システムに必要な検証観点,検証アプローチを整理 # 検証観点 検証アプローチ 1 結果が同一となる入力のパターンを 満遍なくカバーして検査する 入力と出力の関係を表す性質を仕様から取得し,それらの性質ごとに入 力値を作成 2 入力のパターンの境界面に誤りがな いか検査する 入力と出力の関係を表す性質を仕様から取得し,それらの性質の境界 面となる入力値を作成 3 実行パターンを満遍なくカバーして 検査する 実行パターンを制御パスと捉え,異なる制御パスを通る入力を与える (カバレッジテスト) 4 入出力関係の規則性が崩れるなど, 特徴の異なるケースを検査する 特徴の異なる入出力を,仕様やプログラムロジックから逆算 5 異常値が出力されるケースを検査 する 異常出力を得る入力を,仕様やプログラムロジックから逆算 6 ユースケースの観点から想定外の 入力について検査する ユースケースの観点から想定外となり得る入力を任意に作成 7 ユースケースシナリオに従って検査 する ユースケースシナリオに従う入力を任意に作成 ・・・ 明神, “AIシステムの品質保証”, JaSST 18
  • 49. © Hitachi, Ltd. 2018, 2019. All rights reserved. 目次 48 1.自己紹介など 2.機械学習の概況 3.機械学習の特徴と品質に関する課題 4.機械学習の利活用における留意点 5.機械学習の品質に関する議論 6.社会的コンセンサス形成への動き 7.まとめ
  • 50. © Hitachi, Ltd. 2018, 2019. All rights reserved. 6.1 社会的コンセンサス形成に向けて 49 小川はロゴデザイナー兼副運営委員長です
  • 51. © Hitachi, Ltd. 2018, 2019. All rights reserved. 6.2 AIプロダクト品質保証(QA4AI)コンソーシアム 50 機械学習をはじめとするAI技術は進化しながら普及の一途を辿り、様々な産業の 競争力の源泉となるだけでなく、既存の産業構造を破壊・変革し、新たな産業を創出 しています。それに伴い、AI技術を用いた製品やサービス(AIプロダクト)が生活や 社会、経済に及ぼす影響も大きくなってきています。 しかし、従来型のハードウェアやソフトウェア、サービスなどに比べ、品質の把握、評価、 説明、管理など品質保証技術の確立が進んでいません。特に、機械学習ではデータの 学習によりふるまいが帰納的に決定されるため、「従来型のソフトウェアに対する品質 保証手段が利用困難」「開発プロセスの管理による品質保証が困難」といった特質があ ります。 一方で、AI技術の進歩が社会に大きな価値をもたらすことが期待されています。 AI技術が安心して活用され進化できるようにするため、従来の発想にとらわれない、 ブレークスルーが求められています。 このため、AIプロダクトに対する品質保証技術の調査・体系化、適用支援・応用、 研究開発ともに、AIプロダクトの品質に対して、技術的特質を踏まえた適切な 理解を社会が持ちうる啓発活動を行うため、様々な技術と知恵を結集できる コンソーシアムを設立します。 プレスリリース(2018.3.26)より 2018.4.1設立 http://qa4ai.jp/
  • 52. © Hitachi, Ltd. 2018, 2019. All rights reserved. 51 主な活動内容 1) AI プロダクトの品質保証技術の調査・体系化 2) AI プロダクトの品質保証技術の適用支援・応用例の収集 3) AI プロダクトの品質保証技術の研究開発の促進 4) AI プロダクトの品質保証レベルの策定と、各レベルに必要とされる技術の対応付け 5) AI プロダクトの開発・提供組織による4)の自己宣言の方法の策定 6) 社会への 4)、5)の提示と啓発 プレスリリース(2018.3.26)より 月例会での議論の様子 6.3 QA4AIコンソーシアムの現状
  • 53. © Hitachi, Ltd. 2018, 2019. All rights reserved. 6.4 QA4AI参加者 52 青木 利晃(北陸先端科学技術大学院大学)* 池田 裕則(東芝インフラシステムズ株式会社) 石川 冬樹(国立情報学研究所)* 伊藤 宏幸(LINE株式会社) 猪又 憲治(三菱電機株式会社)* 今井 健男(ぼのたけ)* 梅津 良昭(株式会社リコー)* 遠藤 征樹(株式会社日立産業制御ソリューションズ)* 大西 秀一(株式会社ヴィッツ) 小川 秀人(株式会社日立製作所)* 荻野 恒太郎(楽天株式会社)* 長田 健一(日立オートモティブシステムズ株式会社)* 柏 良輔(横河電機株式会社)* 岸 知二(早稲田大学)* 鬼頭 正広(アイシン・コムクルーズ株式会社) 窪田 邦夫(カルソニックカンセイ株式会社)* 黒田 園子(パナソニック株式会社)* 榊原 彰(日本マイクロソフト株式会社)* 佐藤 孝司(日本電気株式会社) 島田 さつき(富士通クォリティラボ株式会社) 鈴木 万治(DENSO International America Inc.)* 鈴木 里惇(LINE株式会社) 妹尾 義樹(国立産業技術総合研究所) 田口 研治(株式会社シーエーブイテクノロジーズ) 土屋 知典(富士通株式会社)* 徳 隆宏(オムロン株式会社)* 徳本 晋(株式会社富士通研究所) 西 康晴(電気通信大学)* 濱田 晃一(株式会社ディー・エヌ・エー)* 誉田 直美(日本電気株式会社)* 増田 聡(日本アイ・ビー・エム株式会社)* 町田 欣史(株式会社エヌ・ティ・ティ・データ)* 松谷 峰生(NPO法人ソフトウェアテスト技術振興協会)* 光本 直樹(株式会社デンソー)* 鷲崎 弘宜(早稲田大学)* 国立研究開発法人 宇宙航空研究開発機構 研究開発部門 第三研究ユニット* 特定非営利活動法人 ソフトウェアテスト技術振興協会* 一般財団法人 日本科学技術連盟* (以上五十音順・「*」は設立発起人・団体を示します)
  • 54. © Hitachi, Ltd. 2018, 2019. All rights reserved. 6.5 QA4AIコンソーシアムの現況 53 自動運転 (画像・映像系) 産業プロセスデータ (センサ・数値系) スマートスピーカー (音声・自然言語系) 音声・画像生成 (クリエイティブ・ユーザ感性系) 画像引用元:https://dena.com/jp/article/003622 4分野で具体的なプロダクト例を設定し、品質保証の課題と対策を検討
  • 55. © Hitachi, Ltd. 2018, 2019. All rights reserved. 6.6 日本政府のAI戦略強化 54 AI戦略の抜本的強化に向けた政府の検討状況, 人間中心のAI社会原則検討会議資料 https://www8.cao.go.jp/cstp/tyousakai/humanai/6kai/siryo1-1.pdf
  • 56. © Hitachi, Ltd. 2018, 2019. All rights reserved. 55 6.7 内閣府 『人間中心のAI社会原則検討会議』 日経新聞 11/27 (1)AIは人間の基本的人権を侵さない (2)AI教育の充実 (3)個人情報の慎重な管理 (4)AIのセキュリティー確保 (5)公正な競争環境の維持 (6)企業に決定過程の説明責任 (7)国境を越えたデータ利用の環境整備
  • 57. © Hitachi, Ltd. 2018, 2019. All rights reserved. 6.8 国内外でのAIに関する議論の概況 56 # 分類 コンセンサス形成のための議論・会議体 1 倫理 2 法律 3 技術 4 契約 IEEE Ethically Aligned Design WEF C4IR 経産省・産総研国プロ 「機械学習AIの品質保 証に関する研究開発」 経済産業省 「AI・データの利用に関する契約ガイドライン」 AIネットワーク 社会推進会議 「AI開発ガイドライン」 MLSE WAISE等の学術会義 ISO/IEC JTC1/ SC42 米科学 技術政 策局 「AIの未 来に備 えて」 QA4AI ア シ ロ マ 23 の 原 則 国内 海外 AI品質マネジメント 検討委員会 内閣府 「人間中心 のAI社会 原則検討 会議」 EU「Develop draft AI ethics guidelines」 OECD 「AIGO」 人工知能の未来のための シャルルボワ共通ビジョン UNESCO 「Roundtable on AI」 IEC SMB 163/8 欧米では倫理面の議論が先行、技術面の議論が進展中 IEEE P7000 シリーズ ITU-T
  • 58. © Hitachi, Ltd. 2018, 2019. All rights reserved. 6.9 ISO/IEC JTC1/SC42 Artificial intelligence 57 WG1 Foundational standards WG2 Big Data WG3 Trustworthiness WG4 Use cases and applications SG1 Computational approaches and characteristics of artificial intelligence systems ISO/IEC JTC1/SC42 - Artificial Intelligence Concepts and Terminology ISO/IEC AWI 22989 - Framework for Artificial Intelligence Systems Using Machine Learning ISO/IEC AWI 23053 - Approaches to establish trust in AI systems through transparency, verifiability, explainability, controllability, etc. - Engineering pitfalls and assess typical associated threats and risks to AI systems with their mitigation techniques and methods. - Approaches to achieve AI systems’ robustness, resiliency, reliability, accuracy, safety, security, privacy, etc. - Types of sources of bias in AI systems with a goal of minimization, including but not limited to statistical bias in AI systems and AI aided decision making. 情報処理学会 情報規格調査会 SC42専門委員会 杉村 領一氏 (産業技術総合研究所) SC 42/WG 1 小委員会 基礎標準 杉村 領一氏 (産業技術総合研究所) SC 42/WG 2 小委員会 ビッグデータ 榎本 義彦 (日本アイ・ビー・エム(株)) SC 42/WG 3 小委員会 信頼性 江川 尚志 (日本電気(株)) SC 42/WG 4 小委員会 ユースケースとアプリケー ション 丸山 文宏 ((株)富士通研究所)
  • 59. © Hitachi, Ltd. 2018, 2019. All rights reserved. 6.10 IEEE EAD と IEEE P7000シリーズ 58 Ethically Aligned Design (倫理的に調和したデザイン) 1. 一般原則 2. 自律知能システムへの価値観の組み込み 3. 倫理的研究と設計を導く方法論 4. 汎用人工知能(AGI)と人工超知能(ASI)の 安全性と恩恵 5. 個人情報と個別アクセス制御 6. 自律型兵器システムの再構築 7. 経済的/人道的問題 8. 法律 9. アフェクティブコンピューティング 10. 政策 11. ICT における伝統的倫理観 12. 複合現実 13. ウェルビーング IEEE P7000シリーズ システム設計時に倫理的問題に取り組むモデル プロセス(P7000) 自律システムの透明性(P7001) データプライバシーの処理(P7002) アルゴリズム上のバイアスに関する考察(P7003) 子供と学生のデータガバナンスに関する標準 (P7004) 透明性のある雇用者のデータガバナンスに関する 標準(P7005) パーソナルデータ人工知能エージェントに関する 標準(P7006) ロボット及び自動システムを倫理的に駆動するた めのオントロジー標準(P7007) ロボットや知的自動システムを倫理的に「ナッジ( そっと促す)」して駆動するための標準(P7008) 自律及び半自律システムのフェイルセーフ設計に 関する標準(P7009) 倫理的な人工知能と自律システムのウェルビーン グ測定基準に関する標準(P7010)
  • 60. © Hitachi, Ltd. 2018, 2019. All rights reserved. 6.11 産総研を中心とした品質標準化に向けた動き 59https://staff.aist.go.jp/y.oiwa/aiqa/index-ja.html 将来のJIS/ISO化を見据えた産業界と連携した研究開発の推進
  • 61. © Hitachi, Ltd. 2018, 2019. All rights reserved. 目次 60 1.自己紹介など 2.機械学習の概況 3.機械学習の特徴と品質に関する課題 4.機械学習の利活用における留意点 5.機械学習の品質に関する議論 6.社会的コンセンサス形成への動き 7.まとめ
  • 62. © Hitachi, Ltd. 2018, 2019. All rights reserved. 7.1 まとめ 61 ・人の支援 ・人の代替 ・人を超越 ・閉じた環境 ・開いた環境 ・プロダクトQA ・プロセスQA ・機械学習の精度 ・システムの品質 ・サービスの品質 機械学習 特に『QAと呼ばれる組織』
  • 63. © Hitachi, Ltd. 2018, 2019. All rights reserved. 7.2 まとめ 62 機械学習システムの 検証技術、品質評価技術 の研究開発 機械学習を含むシステムの 品質保証に関する 産学を超えた議論 機械学習システム の開発への技術導入 機械学習システムが 社会に受け入れられて 安全・安心・快適な世界を 創造するために