SlideShare uma empresa Scribd logo
1 de 42
© 2020 NTT DATA Corporation 1 © 2020 NTT DATA Corporation
NTTデータ テクノロジーカンファレンス 2020
データ活用を俊敏に進めるためのDataOps実践方法と
その高度化のためのナレッジグラフ活用の取り組み
2020年10月14日
株式会社NTTデータ デジタル技術部
八木香充 / 大山真実
© 2020 NTT DATA Corporation
DXからDataOpsへ
2
© 2020 NTT DATA Corporation 3
DX(デジタルトランスフォーメーション)とは?
現行
ビジネス
デジタル
ビジネス
DX
アプリケーション
モダナイズ
データ活用
© 2020 NTT DATA Corporation 4
DataOpsはシステム化フェーズで特に重要になる
MLOps MLOps MLOps
DataOps DataOps
実証実験(PoC)フェーズ システム化フェーズ 基幹系更改フェーズ
一部データでスピーディーに
低コストで繰り返しモデル開発
全量データをスピーディーにモデ
ルに供給するシステムを開発
データ構造を最適化するため
既存APをモダナイズ
データをいかに素早く分析側に
供給できるかが重要なポイント
データ活用基盤への素早いデータ供
給のために既存アプリケーションの
モダナイズが必要
データ活用 アプリケーションモダナイズ
アプリケーション
モダナイズ
© 2020 NTT DATA Corporation
DataOpsとは?
5
© 2020 NTT DATA Corporation 6
データを活用できている企業は少ない
データを全社的に利活用できている日本企業は 20% (※1)
利活用
できている
(※1)https://www.gartner.com/jp/newsroom/press-releases/pr-20190527
DataOps が有効な武器のひとつ
© 2020 NTT DATA Corporation 7
DataOpsの定義
組織全体のデータ管理者とデータ消費者の間のデータフローの
コミュニケーション、統合、自動化を改善することに
焦点を当てた協調的なデータ管理手法(※)
(※)https://www.gartner.com/en/information-technology/glossary/dataops
© 2020 NTT DATA Corporation 8
DataOpsは、情報系と何がちがうのか?
データ量
分析内容
定型
非定型
情報系
少 多
DataOps
双方向性
データ分析者が必要としているデータを供給す
るため、データ分析者からのフィードバックを重
要視する。
スピード
データ分析者の要望をこまめに取り入れるため、
すばやい構築を行う。
© 2020 NTT DATA Corporation 9
DataOpsの登場人物
データエンジニア データスチュワード データサイエンティスト
データ共有のパイプラインを構築し、メン
テナンスを行うエンジニア。
データエンジニアとデータサイエンティスト
をつなぐコミュニケーター。データガバナン
スに関する責任者でもある。
統計や機械学習を駆使して、データを
分析しビジネスに貢献する。
DataOpsで特に重要な役割
© 2020 NTT DATA Corporation
データスチュワードによる
DataOpsの実践
10
© 2020 NTT DATA Corporation 11
NTTデータが考えるDataOpsとは?
スピード 双方性
目的意識 Oneチーム
SE、データエンジニア、機械学習エ
ンジニア、データサイエンティストが
1つチームとなり、データスチュワー
ドを中心としてDataOpsを実現す
る必要がある。
データ供給者側も、データ分析者
の目的を意識しながら、データ供
給基盤を構築しないと、手段と目
的が入れ替わる危険がある。
© 2020 NTT DATA Corporation 12
DataOps実現へのロードマップ
レベル1
古いDWHが乱立して
おり、分析もアドホック
に実施されている。
レベル2 レベル3
データがサイロ化
手動で
データを整理・統合
自動で
データを整理・統合
データスチュワードが中
心となり、データ統合
を進めている。
自然言語処理やグラ
フテクノロジーを使って
データ統合を自動化。
DataOps オントロジー
NLP
PoC
データスチュワード
まずはここをめざす
© 2020 NTT DATA Corporation 13
よくあるデータ分析基盤
見えていない領域
データ加工 DWH1 DM1
システム A
DM2
システム B
データサイエンティスト A
データサイエンティスト B
分析基盤 B
分析基盤 A
© 2020 NTT DATA Corporation 14
【レベル1】 各所でサイロ化が進んでいる
見えていない領域
データ加工 DWH1 DM1
システム A
DM2
システム B
データサイエンティスト A
データサイエンティスト B
分析基盤 B
分析基盤 A
システム間のサイロ化
上流-下流のサイロ化
© 2020 NTT DATA Corporation 15
【レベル1】 サイロ化に起因してさまざまな課題が発生する
見えていない領域
データ加工 DWH1 DM1
システム A
DM2
システム B
データサイエンティスト A
データサイエンティスト B
システムの違い
ベンダの違い
セキュリティ要件の違い
データ活用への意識の違い
加工処理が属人化
分析基盤 B
DSとデータエンジニアの連携不足
コミュニケーション不足
コード体系の違い
更新頻度の違い
データ品質の違い
データに関する問い合わせ窓口なし
ベンダの違い
類似処理が放置
仕様が不明確
分析基盤 A
システムのデータ変更
紙媒体・Excel
類似データが大量
© 2020 NTT DATA Corporation 16
【レベル2】 データスチュワードがまず担当者をつなぐ
見えていない領域
データ加工 DWH1 DM1
システム A
DM2
システム B
データサイエンティスト A
データサイエンティスト B
システムの違い
ベンダの違い
セキュリティ要件の違い
データ活用への意識の違い
加工処理が属人化
分析基盤 B
DSとデータエンジニアの連携不足
コミュニケーション不足
コード体系の違い
更新頻度の違い
データ品質の違い
データに関する問い合わせ窓口なし
ベンダの違い
類似処理が放置
仕様が不明確
分析基盤 A
システムのデータ変更
紙媒体・Excel
データスチュワード
最適化
名寄せ
調査
ヒヤリング
類似データが大量
© 2020 NTT DATA Corporation 17
【レベル2】 担当者を起点にしてシステムを全方位的につなぐ
見えていない領域
データ加工 DWH1 DM1
システム A
DM2
システム B
データサイエンティスト A
データサイエンティスト B
システムの違い
ベンダの違い
セキュリティ要件の違い
データ活用への意識の違い
加工処理が属人化
分析基盤 B
DSとデータエンジニアの連携不足
コミュニケーション不足
コード体系の違い
更新頻度の違い
データ品質の違い
データに関する問い合わせ窓口なし
ベンダの違い
類似処理が放置
仕様が不明確
分析基盤 A
システムのデータ変更
紙媒体・Excel
データスチュワード
最適化
名寄せ
調査
ヒヤリング
類似データが大量
© 2020 NTT DATA Corporation 18
DataOps実践のために大事なこと
コミュニケーション
お客様業務・分析・システムを理
解することで、システムと経営をつ
なぎ、組織間のサイロを打破してい
く。自律的な働きが重要。
標準化→自動化
データスチュワードによって暗黙知
の形式知化をすすめ、さらに標準
化から自動化することで人的作業
を縮小していく。
品質の維持
データ品質・サービス品質を維持
するため、定量的監視を行う。
特に業務要件に近いものは、ド
キュメンテーションにより理解を促進
する取り組みも重要。
© 2020 NTT DATA Corporation 19
ここまでのまとめ
レベル1
古いDWHが乱立して
おり、分析もアドホック
に実施されている。
レベル2 レベル3
データがサイロ化
手動で
データを整理・統合
自動で
データを整理・統合
データスチュワードが中
心となり、データ統合
を進めている。
自然言語処理やグラ
フテクノロジーを使って
データ統合を自動化。
DataOps オントロジー
NLP
PoC
データスチュワード
ここまでのおはなし
© 2020 NTT DATA Corporation 20
ここまでのまとめ
ここからのおはなし
レベル1
古いDWHが乱立して
おり、分析もアドホック
に実施されている。
レベル2 レベル3
データがサイロ化
手動で
データを整理・統合
自動で
データを整理・統合
データスチュワードが中
心となり、データ統合
を進めている。
自然言語処理やグラ
フテクノロジーを使って
データ統合を自動化。
DataOps オントロジー
NLP
PoC
データスチュワード
© 2020 NTT DATA Corporation
ナレッジグラフによる
メタデータ活用の取り組み
21
© 2020 NTT DATA Corporation 22
© 2020 NTT DATA Corporation 22
データスチュワード業務の効率化・高度化を目指して
IT部門
DB, DWH, ETLなど IT部門エンジニア
事業部B
ビジネスユーザ
事業部A
ビジネスユーザ
・・・
データスチュワード
© 2020 NTT DATA Corporation 23
© 2020 NTT DATA Corporation 23
データスチュワード業務の効率化・高度化を目指して
IT部門
DB, DWH, ETLなど IT部門エンジニア
事業部B
ビジネスユーザ
事業部A
ビジネスユーザ
・・・
データスチュワード
現状の理解
 ヒヤリング
 ドキュメント調査
© 2020 NTT DATA Corporation 24
© 2020 NTT DATA Corporation 24
データスチュワード業務の効率化・高度化を目指して
IT部門
DB, DWH, ETLなど IT部門エンジニア
事業部B
ビジネスユーザ
事業部A
ビジネスユーザ
・・・
データスチュワード
現状の理解
 ヒヤリング
 ドキュメント調査
あるべき姿の提案とそのための作業
 新たなデータ活用の提案
 データの処理と配置の最適化
© 2020 NTT DATA Corporation 25
© 2020 NTT DATA Corporation 25
DB, DWH, ETLなど IT部門エンジニア
データスチュワード業務の効率化・高度化を目指して
IT部門 事業部B
ビジネスユーザ
事業部B
ビジネスユーザ
・・・
データスチュワー
ド
あるべき姿の提案とそのための作業
 新たなデータ活用の提案
 データの処理と配置の最適化
多くの企業ではシステムとデータの
現状を理解するためのコストが増大している
• 多種多様な大量のデータが存在
• ビジネス知識の共有の難しさ
現状の理解
 ヒヤリング
 ドキュメント調査
© 2020 NTT DATA Corporation 26
© 2020 NTT DATA Corporation 26
DB, DWH, ETLなど IT部門エンジニア
データスチュワード業務の効率化・高度化を目指して
IT部門 事業部B
ビジネスユーザ
事業部B
ビジネスユーザ
・・・
データスチュワー
ド
あるべき姿の提案とそのための作業
 新たなデータ活用の提案
 データの処理と配置の最適化
多くの企業ではシステムとデータの
現状を理解するためのコストが増大している
• 多種多様な大量のデータが存在
• ビジネス知識の共有の難しさ
現状の理解
 ヒヤリング
 ドキュメント調査
ナレッジグラフによるメタデータ活用!
これらの課題解決を技術の力で支援したい
© 2020 NTT DATA Corporation 27
© 2020 NTT DATA Corporation 27
ナレッジグラフとは?
現実世界の実体(Entity)同士の関係やそれを説明する情報を
グラフ構造で表現したもの
人間と機械が理解できる
RDF(Resource Description Framework)
• W3Cで標準化されている情報の関係をグラフ構
造で表現するための仕組み
機械的に推論することができる
OWL(Web ontology language)
• W3Cで標準化されているオントロジーを表現す
るための仕組み
• 階層化された分類や分類同士の関係、それら
のルールを機械が理解可能な形で表現する
ナレッジグラフの例
http://mowl-power.cs.man.ac.uk/protegeowltutorial/resources/ProtegeOWLTutorialP4_v1_3.pdf
© 2020 NTT DATA Corporation 28
© 2020 NTT DATA Corporation 28
NTTデータによるナレッジグラフを中心とした取り組み
© 2020 NTT DATA Corporation 29
© 2020 NTT DATA Corporation 29
メタデータとは?
データを説明するデータのこと
データはメタデータを付与されて始めて人間が理解できるようになる。
Business Metadata Social Metadata
Technical Metadata Operational Metadata
• 各部署ごとのビジネス知識
例:ビジネス用語集、業務プロセス文書、ドキュメント化さ
れていないビジネスノウハウなど
• データに関わるステークホルダー同士のコミュニケーション
例:データ分析者によるデータの使いやすさの評価
• 組織外部のデータと組織内部のデータの関係
例:3rdパーティデータに関する情報
• データベースやファイルサーバの設計書、設定ファイル
例:ER図、データベースのスキーマ設計図
• 実際にデータベースやファイルサーバに保存されているメタ
データ
• データの処理に関わる設計書
例:バッチ処理設計書、ETLフロー設計書
• データ処理の履歴・リソース情報
例:データの変更履歴、ジョブ実行時のパフォーマンス情報
© 2020 NTT DATA Corporation 30
© 2020 NTT DATA Corporation 30
メタデータをナレッジグラフとして統合する
どこにどのようなデータがあるのか明らかにする
 ビジネスの実体(Entity)と物理データを結びつける
(例:事業部門Aの「SS-001」のデータが「CSA01」テーブルにあることがわかる)
データの価値を明らかにする
 データの重要度、価値を理解できる(例:アクセス頻度、データの履歴・用途)
 不要/冗長なデータや処理を発見できる
© 2020 NTT DATA Corporation 31
© 2020 NTT DATA Corporation 31
ナレッジグラフでデータの流れと価値を可視化する
どこにどのようなデータがあるのか明らかにする
最もビジネスに価値をもたらすデータからデータ活用を進めることができる
データの処理と配置を最適化してデータ活用基盤のコスト最適化ができる
 ビジネスの実体(Entity)と物理データを結びつける
(例:事業部門Aの「SS-001」のデータが「CSA01」テーブルにあることがわかる)
データの価値を明らかにする
 データの重要度、価値を理解できる(例:アクセス頻度、データの用途)
 不要/冗長なデータや処理を発見できる
© 2020 NTT DATA Corporation 32
© 2020 NTT DATA Corporation 32
ナレッジグラフによるメタデータ活用実現に向けた取り組み
メタデータをどのように集めてナレッジグラフに統合するか?
課題
© 2020 NTT DATA Corporation 33
© 2020 NTT DATA Corporation 33
ナレッジグラフによるメタデータ活用実現に向けた取り組み
メタデータをどのように集めてナレッジグラフに統合するか?
課題
NTTデータによる「データカタログソリューション」
ビジネスメタデータをどのように集めるか?
© 2020 NTT DATA Corporation 34
© 2020 NTT DATA Corporation 34
NTTデータによる「データカタログソリューション」
NTTデータ流通サービス事業部の「Data-Driven Catalog」
© 2020 NTT DATA Corporation 35
© 2020 NTT DATA Corporation 35
NTTデータによる「データカタログ実践事例」
こちらの発表にぜひご注目ください!
© 2020 NTT DATA Corporation 36
© 2020 NTT DATA Corporation 36
ナレッジグラフによるメタデータ活用実現に向けた取り組み
メタデータをどのように集めてナレッジグラフに統合するか?
課題
NTTデータによる「データカタログソリューション」
NTT ソフトウェアイノベーションセンタによる「協働型機械学習技術」
ビジネスメタデータをどのように集めるか?
© 2020 NTT DATA Corporation 37
© 2020 NTT DATA Corporation 37
NTT ソフトウェアイノベーションセンタによる
「協働型機械学習技術」
こちらの発表にぜひご注目ください!
© 2020 NTT DATA Corporation 38
© 2020 NTT DATA Corporation 38
ナレッジグラフによるメタデータ活用実現に向けた取り組み
メタデータをどのように集めてナレッジグラフに統合するか?
課題
NTTデータによる「データカタログソリューション」
NTT ソフトウェアイノベーションセンタによる「協働型機械学習技術」
NTTデータによる「ドメイン特化BERT」
ビジネスメタデータをどのように集めるか?
自然文で記述されているメタデータをどのように集めるか?
© 2020 NTT DATA Corporation 39
© 2020 NTT DATA Corporation 39
NTTデータによる「ドメイン特化BERT」
こちらの発表にぜひご注目ください!
© 2020 NTT DATA Corporation 40
© 2020 NTT DATA Corporation 40
ナレッジグラフによるメタデータ活用実現に向けた取り組み
メタデータをどのように集めてナレッジグラフに統合するか?
課題
NTTデータによる「データカタログソリューション」
NTT ソフトウェアイノベーションセンタによる「協働型機械学習技術」
NTTデータによる「ドメイン特化BERT」
ABLERによる「ナレッジグラフ構築FW」
ビジネスメタデータをどのように集めるか?
自然文で記述されているメタデータをどのように集めるか?
ナレッジグラフの構築を如何に機械化・自動化するか?
© 2020 NTT DATA Corporation 41
© 2020 NTT DATA Corporation 41
データスチュワード業務の効率化・高度化を目指して
IT部門
DB, DWH, ETLなど IT部門エンジニア
事業部B
ビジネスユーザ
事業部A
ビジネスユーザ
・・・
データスチュワード
ナレッジグラフ
テクニカルメタデータ、オペレーショナ
ルメタデータをナレッジグラフに統合
ビジネスメタデータ、ソーシャルメ
タデータをナレッジグラフに統合
インターネット
Linked Open Data をナ
レッジグラフに統合
データカタログ
ビジネス文書
データカタログ
ビジネス文書
機械学習によるビジネス
メタデータ入力支援機能
自然言語処理技術による自
然文からの情報抽出機能
• 最もビジネスに価値をもたらすデータから
データ活用を進めることができる
• データの処理と配置を最適化して
データ活用基盤のコスト最適化ができる
© 2020 NTT DATA Corporation

Mais conteúdo relacionado

Mais procurados

データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門Satoru Ishikawa
 
データ分析基盤について
データ分析基盤についてデータ分析基盤について
データ分析基盤についてYuta Inamura
 
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)NTT DATA Technology & Innovation
 
AWSで作る分析基盤
AWSで作る分析基盤AWSで作る分析基盤
AWSで作る分析基盤Yu Otsubo
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例Tetsutaro Watanabe
 
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
異次元のグラフデータベースNeo4j
異次元のグラフデータベースNeo4j異次元のグラフデータベースNeo4j
異次元のグラフデータベースNeo4j昌桓 李
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...NTT DATA Technology & Innovation
 
なぜコンピュータを学ばなければならないのか 21世紀の君主論
なぜコンピュータを学ばなければならないのか 21世紀の君主論なぜコンピュータを学ばなければならないのか 21世紀の君主論
なぜコンピュータを学ばなければならないのか 21世紀の君主論Tokoroten Nakayama
 
リクルートのWebサービスを支える共通インフラ「RAFTEL」
リクルートのWebサービスを支える共通インフラ「RAFTEL」リクルートのWebサービスを支える共通インフラ「RAFTEL」
リクルートのWebサービスを支える共通インフラ「RAFTEL」Recruit Technologies
 
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版) データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版) Satoshi Nagayasu
 
事業のグロースを支えるDataOpsの現場 #DataOps #DevSumi #デブサミ
事業のグロースを支えるDataOpsの現場 #DataOps #DevSumi #デブサミ事業のグロースを支えるDataOpsの現場 #DataOps #DevSumi #デブサミ
事業のグロースを支えるDataOpsの現場 #DataOps #DevSumi #デブサミ@yuzutas0 Yokoyama
 
ChatGPTは思ったほど賢くない
ChatGPTは思ったほど賢くないChatGPTは思ったほど賢くない
ChatGPTは思ったほど賢くないCarnot Inc.
 
データファブリック実現のためのプロジェクトの進め方とは
データファブリック実現のためのプロジェクトの進め方とはデータファブリック実現のためのプロジェクトの進め方とは
データファブリック実現のためのプロジェクトの進め方とはDenodo
 
Databricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptxDatabricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptxotato
 
リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例Tetsutaro Watanabe
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)Yosuke Katsuki
 
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)NTT DATA Technology & Innovation
 
Snowflake Architecture and Performance
Snowflake Architecture and PerformanceSnowflake Architecture and Performance
Snowflake Architecture and PerformanceMineaki Motohashi
 

Mais procurados (20)

データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
 
データ分析基盤について
データ分析基盤についてデータ分析基盤について
データ分析基盤について
 
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
 
AWSで作る分析基盤
AWSで作る分析基盤AWSで作る分析基盤
AWSで作る分析基盤
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例
 
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
異次元のグラフデータベースNeo4j
異次元のグラフデータベースNeo4j異次元のグラフデータベースNeo4j
異次元のグラフデータベースNeo4j
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
 
なぜコンピュータを学ばなければならないのか 21世紀の君主論
なぜコンピュータを学ばなければならないのか 21世紀の君主論なぜコンピュータを学ばなければならないのか 21世紀の君主論
なぜコンピュータを学ばなければならないのか 21世紀の君主論
 
リクルートのWebサービスを支える共通インフラ「RAFTEL」
リクルートのWebサービスを支える共通インフラ「RAFTEL」リクルートのWebサービスを支える共通インフラ「RAFTEL」
リクルートのWebサービスを支える共通インフラ「RAFTEL」
 
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版) データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
 
事業のグロースを支えるDataOpsの現場 #DataOps #DevSumi #デブサミ
事業のグロースを支えるDataOpsの現場 #DataOps #DevSumi #デブサミ事業のグロースを支えるDataOpsの現場 #DataOps #DevSumi #デブサミ
事業のグロースを支えるDataOpsの現場 #DataOps #DevSumi #デブサミ
 
ChatGPTは思ったほど賢くない
ChatGPTは思ったほど賢くないChatGPTは思ったほど賢くない
ChatGPTは思ったほど賢くない
 
データファブリック実現のためのプロジェクトの進め方とは
データファブリック実現のためのプロジェクトの進め方とはデータファブリック実現のためのプロジェクトの進め方とは
データファブリック実現のためのプロジェクトの進め方とは
 
Databricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptxDatabricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptx
 
リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
 
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
入門 Kubeflow ~Kubernetesで機械学習をはじめるために~ (NTT Tech Conference #4 講演資料)
 
Snowflake Architecture and Performance
Snowflake Architecture and PerformanceSnowflake Architecture and Performance
Snowflake Architecture and Performance
 
Data-Centric AIの紹介
Data-Centric AIの紹介Data-Centric AIの紹介
Data-Centric AIの紹介
 

Semelhante a データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 発表資料)

NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Atsushi Tsuchiya
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Insight Technology, Inc.
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data PlatformNaoki (Neo) SATO
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Insight Technology, Inc.
 
Talend 2013年概要
Talend 2013年概要Talend 2013年概要
Talend 2013年概要Talend KK
 
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナーmtanaka0111
 
避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題kurikiyo
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」Cybozucommunity
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)日本マイクロソフト株式会社
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...Google Cloud Platform - Japan
 
データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供Denodo
 
データを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とはデータを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とはgriddb
 
【Webinar-Slide】Talend2012年の戦略
【Webinar-Slide】Talend2012年の戦略【Webinar-Slide】Talend2012年の戦略
【Webinar-Slide】Talend2012年の戦略Talend KK
 
社内外のデータを徹底的に活用する!
社内外のデータを徹底的に活用する!社内外のデータを徹底的に活用する!
社内外のデータを徹底的に活用する!Talend KK
 
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)Jun Kawahara
 
ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)伸夫 森本
 
IOT and Lean Manifacturing
IOT and Lean ManifacturingIOT and Lean Manifacturing
IOT and Lean ManifacturingOsaka University
 

Semelhante a データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 発表資料) (20)

NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
 
Talend 2013年概要
Talend 2013年概要Talend 2013年概要
Talend 2013年概要
 
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
DX実践!~ビジネスアジリティ向上とマイクロサービス技術GraphQLの活用~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナー
 
避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題避けては通れないビッグデータ周辺の重要課題
避けては通れないビッグデータ周辺の重要課題
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
 
データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供データファブリックによるトランザクションの速度でアナリティクスを提供
データファブリックによるトランザクションの速度でアナリティクスを提供
 
データを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とはデータを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とは
 
【Webinar-Slide】Talend2012年の戦略
【Webinar-Slide】Talend2012年の戦略【Webinar-Slide】Talend2012年の戦略
【Webinar-Slide】Talend2012年の戦略
 
社内外のデータを徹底的に活用する!
社内外のデータを徹底的に活用する!社内外のデータを徹底的に活用する!
社内外のデータを徹底的に活用する!
 
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
新時代のITインフラ -技術トレンドとユーザー企業の構え- (20100512)
 
Strata conference 2012
Strata conference 2012Strata conference 2012
Strata conference 2012
 
ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)
 
IOT and Lean Manifacturing
IOT and Lean ManifacturingIOT and Lean Manifacturing
IOT and Lean Manifacturing
 

Mais de NTT DATA Technology & Innovation

OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)NTT DATA Technology & Innovation
 
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)NTT DATA Technology & Innovation
 
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方NTT DATA Technology & Innovation
 
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...NTT DATA Technology & Innovation
 
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)NTT DATA Technology & Innovation
 
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)NTT DATA Technology & Innovation
 
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...NTT DATA Technology & Innovation
 
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
 
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
 
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
 
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)NTT DATA Technology & Innovation
 
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...NTT DATA Technology & Innovation
 
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)NTT DATA Technology & Innovation
 
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)NTT DATA Technology & Innovation
 
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)NTT DATA Technology & Innovation
 
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...NTT DATA Technology & Innovation
 
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)NTT DATA Technology & Innovation
 
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)NTT DATA Technology & Innovation
 
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)NTT DATA Technology & Innovation
 
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)NTT DATA Technology & Innovation
 

Mais de NTT DATA Technology & Innovation (20)

OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
OSSデータベースの開発コミュニティに参加しよう! (DEIM2024 発表資料)
 
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
COPY FROMで異常データをスキップできるようになった話(第45回 PostgreSQLアンカンファレンス@オンライン 発表資料)
 
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
Cloud Skills Challenge 2023 winter 〜Azureを頑張る理由と頑張り方
 
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
Unlocking Transformation: Implementing GitOps Practices in Conservative Organ...
 
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
Databricksチューニングあれこれ(JEDAI 2023 X‘mas/忘年会 Meetup! LT登壇資料)
 
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
詳説探究!Cloud Native Databaseの現在地点(CloudNative Days Tokyo 2023 発表資料)
 
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
 
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
 
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
pgvectorを使ってChatGPTとPostgreSQLを連携してみよう!(PostgreSQL Conference Japan 2023 発表資料)
 
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
マネージドPostgreSQLの実現に向けたPostgreSQL機能向上(PostgreSQL Conference Japan 2023 発表資料)
 
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
最新機能までを総ざらい!PostgreSQLの注目機能を振り返る(第32回 中国地方DB勉強会 in 岡山 発表資料)
 
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
PostgreSQLのバグとの付き合い方 ~バグの調査からコミュニティへの報告、修正パッチ投稿まで~(Open Source Conference 202...
 
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
骨抜きアジャイルの骨を生み出す 〜私(スクラムマスター)のXP学習記録〜(XP祭り2023 発表資料)
 
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
機械学習モデルを REST API としてサービングするシステム開発における上流プロセスの絞り込みと効果検証(PM学会2023年度秋季研究発表大会 発表資料)
 
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
ChatGPTのデータソースにPostgreSQLを使う[詳細版](オープンデベロッパーズカンファレンス2023 発表資料)
 
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
PostgreSQL on Kubernetes: Realizing High Availability with PGO (Postgres Ibiz...
 
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
オンプレミス回帰の動きに備えよ ~クラウドの手法をオンプレミスでも実現するには~(CloudNative Days Fukuoka 2023 発表資料)
 
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
Prometheus Operator 入門(Kubernetes Novice Tokyo #26 発表資料)
 
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
ChatGPTのデータソースにPostgreSQLを使う(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
 
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
PGCon 2023 参加報告(第42回PostgreSQLアンカンファレンス@オンライン 発表資料)
 

Último

スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 

Último (9)

スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 

データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 発表資料)

  • 1. © 2020 NTT DATA Corporation 1 © 2020 NTT DATA Corporation NTTデータ テクノロジーカンファレンス 2020 データ活用を俊敏に進めるためのDataOps実践方法と その高度化のためのナレッジグラフ活用の取り組み 2020年10月14日 株式会社NTTデータ デジタル技術部 八木香充 / 大山真実
  • 2. © 2020 NTT DATA Corporation DXからDataOpsへ 2
  • 3. © 2020 NTT DATA Corporation 3 DX(デジタルトランスフォーメーション)とは? 現行 ビジネス デジタル ビジネス DX アプリケーション モダナイズ データ活用
  • 4. © 2020 NTT DATA Corporation 4 DataOpsはシステム化フェーズで特に重要になる MLOps MLOps MLOps DataOps DataOps 実証実験(PoC)フェーズ システム化フェーズ 基幹系更改フェーズ 一部データでスピーディーに 低コストで繰り返しモデル開発 全量データをスピーディーにモデ ルに供給するシステムを開発 データ構造を最適化するため 既存APをモダナイズ データをいかに素早く分析側に 供給できるかが重要なポイント データ活用基盤への素早いデータ供 給のために既存アプリケーションの モダナイズが必要 データ活用 アプリケーションモダナイズ アプリケーション モダナイズ
  • 5. © 2020 NTT DATA Corporation DataOpsとは? 5
  • 6. © 2020 NTT DATA Corporation 6 データを活用できている企業は少ない データを全社的に利活用できている日本企業は 20% (※1) 利活用 できている (※1)https://www.gartner.com/jp/newsroom/press-releases/pr-20190527 DataOps が有効な武器のひとつ
  • 7. © 2020 NTT DATA Corporation 7 DataOpsの定義 組織全体のデータ管理者とデータ消費者の間のデータフローの コミュニケーション、統合、自動化を改善することに 焦点を当てた協調的なデータ管理手法(※) (※)https://www.gartner.com/en/information-technology/glossary/dataops
  • 8. © 2020 NTT DATA Corporation 8 DataOpsは、情報系と何がちがうのか? データ量 分析内容 定型 非定型 情報系 少 多 DataOps 双方向性 データ分析者が必要としているデータを供給す るため、データ分析者からのフィードバックを重 要視する。 スピード データ分析者の要望をこまめに取り入れるため、 すばやい構築を行う。
  • 9. © 2020 NTT DATA Corporation 9 DataOpsの登場人物 データエンジニア データスチュワード データサイエンティスト データ共有のパイプラインを構築し、メン テナンスを行うエンジニア。 データエンジニアとデータサイエンティスト をつなぐコミュニケーター。データガバナン スに関する責任者でもある。 統計や機械学習を駆使して、データを 分析しビジネスに貢献する。 DataOpsで特に重要な役割
  • 10. © 2020 NTT DATA Corporation データスチュワードによる DataOpsの実践 10
  • 11. © 2020 NTT DATA Corporation 11 NTTデータが考えるDataOpsとは? スピード 双方性 目的意識 Oneチーム SE、データエンジニア、機械学習エ ンジニア、データサイエンティストが 1つチームとなり、データスチュワー ドを中心としてDataOpsを実現す る必要がある。 データ供給者側も、データ分析者 の目的を意識しながら、データ供 給基盤を構築しないと、手段と目 的が入れ替わる危険がある。
  • 12. © 2020 NTT DATA Corporation 12 DataOps実現へのロードマップ レベル1 古いDWHが乱立して おり、分析もアドホック に実施されている。 レベル2 レベル3 データがサイロ化 手動で データを整理・統合 自動で データを整理・統合 データスチュワードが中 心となり、データ統合 を進めている。 自然言語処理やグラ フテクノロジーを使って データ統合を自動化。 DataOps オントロジー NLP PoC データスチュワード まずはここをめざす
  • 13. © 2020 NTT DATA Corporation 13 よくあるデータ分析基盤 見えていない領域 データ加工 DWH1 DM1 システム A DM2 システム B データサイエンティスト A データサイエンティスト B 分析基盤 B 分析基盤 A
  • 14. © 2020 NTT DATA Corporation 14 【レベル1】 各所でサイロ化が進んでいる 見えていない領域 データ加工 DWH1 DM1 システム A DM2 システム B データサイエンティスト A データサイエンティスト B 分析基盤 B 分析基盤 A システム間のサイロ化 上流-下流のサイロ化
  • 15. © 2020 NTT DATA Corporation 15 【レベル1】 サイロ化に起因してさまざまな課題が発生する 見えていない領域 データ加工 DWH1 DM1 システム A DM2 システム B データサイエンティスト A データサイエンティスト B システムの違い ベンダの違い セキュリティ要件の違い データ活用への意識の違い 加工処理が属人化 分析基盤 B DSとデータエンジニアの連携不足 コミュニケーション不足 コード体系の違い 更新頻度の違い データ品質の違い データに関する問い合わせ窓口なし ベンダの違い 類似処理が放置 仕様が不明確 分析基盤 A システムのデータ変更 紙媒体・Excel 類似データが大量
  • 16. © 2020 NTT DATA Corporation 16 【レベル2】 データスチュワードがまず担当者をつなぐ 見えていない領域 データ加工 DWH1 DM1 システム A DM2 システム B データサイエンティスト A データサイエンティスト B システムの違い ベンダの違い セキュリティ要件の違い データ活用への意識の違い 加工処理が属人化 分析基盤 B DSとデータエンジニアの連携不足 コミュニケーション不足 コード体系の違い 更新頻度の違い データ品質の違い データに関する問い合わせ窓口なし ベンダの違い 類似処理が放置 仕様が不明確 分析基盤 A システムのデータ変更 紙媒体・Excel データスチュワード 最適化 名寄せ 調査 ヒヤリング 類似データが大量
  • 17. © 2020 NTT DATA Corporation 17 【レベル2】 担当者を起点にしてシステムを全方位的につなぐ 見えていない領域 データ加工 DWH1 DM1 システム A DM2 システム B データサイエンティスト A データサイエンティスト B システムの違い ベンダの違い セキュリティ要件の違い データ活用への意識の違い 加工処理が属人化 分析基盤 B DSとデータエンジニアの連携不足 コミュニケーション不足 コード体系の違い 更新頻度の違い データ品質の違い データに関する問い合わせ窓口なし ベンダの違い 類似処理が放置 仕様が不明確 分析基盤 A システムのデータ変更 紙媒体・Excel データスチュワード 最適化 名寄せ 調査 ヒヤリング 類似データが大量
  • 18. © 2020 NTT DATA Corporation 18 DataOps実践のために大事なこと コミュニケーション お客様業務・分析・システムを理 解することで、システムと経営をつ なぎ、組織間のサイロを打破してい く。自律的な働きが重要。 標準化→自動化 データスチュワードによって暗黙知 の形式知化をすすめ、さらに標準 化から自動化することで人的作業 を縮小していく。 品質の維持 データ品質・サービス品質を維持 するため、定量的監視を行う。 特に業務要件に近いものは、ド キュメンテーションにより理解を促進 する取り組みも重要。
  • 19. © 2020 NTT DATA Corporation 19 ここまでのまとめ レベル1 古いDWHが乱立して おり、分析もアドホック に実施されている。 レベル2 レベル3 データがサイロ化 手動で データを整理・統合 自動で データを整理・統合 データスチュワードが中 心となり、データ統合 を進めている。 自然言語処理やグラ フテクノロジーを使って データ統合を自動化。 DataOps オントロジー NLP PoC データスチュワード ここまでのおはなし
  • 20. © 2020 NTT DATA Corporation 20 ここまでのまとめ ここからのおはなし レベル1 古いDWHが乱立して おり、分析もアドホック に実施されている。 レベル2 レベル3 データがサイロ化 手動で データを整理・統合 自動で データを整理・統合 データスチュワードが中 心となり、データ統合 を進めている。 自然言語処理やグラ フテクノロジーを使って データ統合を自動化。 DataOps オントロジー NLP PoC データスチュワード
  • 21. © 2020 NTT DATA Corporation ナレッジグラフによる メタデータ活用の取り組み 21
  • 22. © 2020 NTT DATA Corporation 22 © 2020 NTT DATA Corporation 22 データスチュワード業務の効率化・高度化を目指して IT部門 DB, DWH, ETLなど IT部門エンジニア 事業部B ビジネスユーザ 事業部A ビジネスユーザ ・・・ データスチュワード
  • 23. © 2020 NTT DATA Corporation 23 © 2020 NTT DATA Corporation 23 データスチュワード業務の効率化・高度化を目指して IT部門 DB, DWH, ETLなど IT部門エンジニア 事業部B ビジネスユーザ 事業部A ビジネスユーザ ・・・ データスチュワード 現状の理解  ヒヤリング  ドキュメント調査
  • 24. © 2020 NTT DATA Corporation 24 © 2020 NTT DATA Corporation 24 データスチュワード業務の効率化・高度化を目指して IT部門 DB, DWH, ETLなど IT部門エンジニア 事業部B ビジネスユーザ 事業部A ビジネスユーザ ・・・ データスチュワード 現状の理解  ヒヤリング  ドキュメント調査 あるべき姿の提案とそのための作業  新たなデータ活用の提案  データの処理と配置の最適化
  • 25. © 2020 NTT DATA Corporation 25 © 2020 NTT DATA Corporation 25 DB, DWH, ETLなど IT部門エンジニア データスチュワード業務の効率化・高度化を目指して IT部門 事業部B ビジネスユーザ 事業部B ビジネスユーザ ・・・ データスチュワー ド あるべき姿の提案とそのための作業  新たなデータ活用の提案  データの処理と配置の最適化 多くの企業ではシステムとデータの 現状を理解するためのコストが増大している • 多種多様な大量のデータが存在 • ビジネス知識の共有の難しさ 現状の理解  ヒヤリング  ドキュメント調査
  • 26. © 2020 NTT DATA Corporation 26 © 2020 NTT DATA Corporation 26 DB, DWH, ETLなど IT部門エンジニア データスチュワード業務の効率化・高度化を目指して IT部門 事業部B ビジネスユーザ 事業部B ビジネスユーザ ・・・ データスチュワー ド あるべき姿の提案とそのための作業  新たなデータ活用の提案  データの処理と配置の最適化 多くの企業ではシステムとデータの 現状を理解するためのコストが増大している • 多種多様な大量のデータが存在 • ビジネス知識の共有の難しさ 現状の理解  ヒヤリング  ドキュメント調査 ナレッジグラフによるメタデータ活用! これらの課題解決を技術の力で支援したい
  • 27. © 2020 NTT DATA Corporation 27 © 2020 NTT DATA Corporation 27 ナレッジグラフとは? 現実世界の実体(Entity)同士の関係やそれを説明する情報を グラフ構造で表現したもの 人間と機械が理解できる RDF(Resource Description Framework) • W3Cで標準化されている情報の関係をグラフ構 造で表現するための仕組み 機械的に推論することができる OWL(Web ontology language) • W3Cで標準化されているオントロジーを表現す るための仕組み • 階層化された分類や分類同士の関係、それら のルールを機械が理解可能な形で表現する ナレッジグラフの例 http://mowl-power.cs.man.ac.uk/protegeowltutorial/resources/ProtegeOWLTutorialP4_v1_3.pdf
  • 28. © 2020 NTT DATA Corporation 28 © 2020 NTT DATA Corporation 28 NTTデータによるナレッジグラフを中心とした取り組み
  • 29. © 2020 NTT DATA Corporation 29 © 2020 NTT DATA Corporation 29 メタデータとは? データを説明するデータのこと データはメタデータを付与されて始めて人間が理解できるようになる。 Business Metadata Social Metadata Technical Metadata Operational Metadata • 各部署ごとのビジネス知識 例:ビジネス用語集、業務プロセス文書、ドキュメント化さ れていないビジネスノウハウなど • データに関わるステークホルダー同士のコミュニケーション 例:データ分析者によるデータの使いやすさの評価 • 組織外部のデータと組織内部のデータの関係 例:3rdパーティデータに関する情報 • データベースやファイルサーバの設計書、設定ファイル 例:ER図、データベースのスキーマ設計図 • 実際にデータベースやファイルサーバに保存されているメタ データ • データの処理に関わる設計書 例:バッチ処理設計書、ETLフロー設計書 • データ処理の履歴・リソース情報 例:データの変更履歴、ジョブ実行時のパフォーマンス情報
  • 30. © 2020 NTT DATA Corporation 30 © 2020 NTT DATA Corporation 30 メタデータをナレッジグラフとして統合する どこにどのようなデータがあるのか明らかにする  ビジネスの実体(Entity)と物理データを結びつける (例:事業部門Aの「SS-001」のデータが「CSA01」テーブルにあることがわかる) データの価値を明らかにする  データの重要度、価値を理解できる(例:アクセス頻度、データの履歴・用途)  不要/冗長なデータや処理を発見できる
  • 31. © 2020 NTT DATA Corporation 31 © 2020 NTT DATA Corporation 31 ナレッジグラフでデータの流れと価値を可視化する どこにどのようなデータがあるのか明らかにする 最もビジネスに価値をもたらすデータからデータ活用を進めることができる データの処理と配置を最適化してデータ活用基盤のコスト最適化ができる  ビジネスの実体(Entity)と物理データを結びつける (例:事業部門Aの「SS-001」のデータが「CSA01」テーブルにあることがわかる) データの価値を明らかにする  データの重要度、価値を理解できる(例:アクセス頻度、データの用途)  不要/冗長なデータや処理を発見できる
  • 32. © 2020 NTT DATA Corporation 32 © 2020 NTT DATA Corporation 32 ナレッジグラフによるメタデータ活用実現に向けた取り組み メタデータをどのように集めてナレッジグラフに統合するか? 課題
  • 33. © 2020 NTT DATA Corporation 33 © 2020 NTT DATA Corporation 33 ナレッジグラフによるメタデータ活用実現に向けた取り組み メタデータをどのように集めてナレッジグラフに統合するか? 課題 NTTデータによる「データカタログソリューション」 ビジネスメタデータをどのように集めるか?
  • 34. © 2020 NTT DATA Corporation 34 © 2020 NTT DATA Corporation 34 NTTデータによる「データカタログソリューション」 NTTデータ流通サービス事業部の「Data-Driven Catalog」
  • 35. © 2020 NTT DATA Corporation 35 © 2020 NTT DATA Corporation 35 NTTデータによる「データカタログ実践事例」 こちらの発表にぜひご注目ください!
  • 36. © 2020 NTT DATA Corporation 36 © 2020 NTT DATA Corporation 36 ナレッジグラフによるメタデータ活用実現に向けた取り組み メタデータをどのように集めてナレッジグラフに統合するか? 課題 NTTデータによる「データカタログソリューション」 NTT ソフトウェアイノベーションセンタによる「協働型機械学習技術」 ビジネスメタデータをどのように集めるか?
  • 37. © 2020 NTT DATA Corporation 37 © 2020 NTT DATA Corporation 37 NTT ソフトウェアイノベーションセンタによる 「協働型機械学習技術」 こちらの発表にぜひご注目ください!
  • 38. © 2020 NTT DATA Corporation 38 © 2020 NTT DATA Corporation 38 ナレッジグラフによるメタデータ活用実現に向けた取り組み メタデータをどのように集めてナレッジグラフに統合するか? 課題 NTTデータによる「データカタログソリューション」 NTT ソフトウェアイノベーションセンタによる「協働型機械学習技術」 NTTデータによる「ドメイン特化BERT」 ビジネスメタデータをどのように集めるか? 自然文で記述されているメタデータをどのように集めるか?
  • 39. © 2020 NTT DATA Corporation 39 © 2020 NTT DATA Corporation 39 NTTデータによる「ドメイン特化BERT」 こちらの発表にぜひご注目ください!
  • 40. © 2020 NTT DATA Corporation 40 © 2020 NTT DATA Corporation 40 ナレッジグラフによるメタデータ活用実現に向けた取り組み メタデータをどのように集めてナレッジグラフに統合するか? 課題 NTTデータによる「データカタログソリューション」 NTT ソフトウェアイノベーションセンタによる「協働型機械学習技術」 NTTデータによる「ドメイン特化BERT」 ABLERによる「ナレッジグラフ構築FW」 ビジネスメタデータをどのように集めるか? 自然文で記述されているメタデータをどのように集めるか? ナレッジグラフの構築を如何に機械化・自動化するか?
  • 41. © 2020 NTT DATA Corporation 41 © 2020 NTT DATA Corporation 41 データスチュワード業務の効率化・高度化を目指して IT部門 DB, DWH, ETLなど IT部門エンジニア 事業部B ビジネスユーザ 事業部A ビジネスユーザ ・・・ データスチュワード ナレッジグラフ テクニカルメタデータ、オペレーショナ ルメタデータをナレッジグラフに統合 ビジネスメタデータ、ソーシャルメ タデータをナレッジグラフに統合 インターネット Linked Open Data をナ レッジグラフに統合 データカタログ ビジネス文書 データカタログ ビジネス文書 機械学習によるビジネス メタデータ入力支援機能 自然言語処理技術による自 然文からの情報抽出機能 • 最もビジネスに価値をもたらすデータから データ活用を進めることができる • データの処理と配置を最適化して データ活用基盤のコスト最適化ができる
  • 42. © 2020 NTT DATA Corporation

Notas do Editor

  1. ・デジタルトランスフォーメーションは、現行ビジネスをデジタル企業に変革するプロセスそのもの。 ・DXには一般的に、人や組織の改革も含まれますが、ここではシステム観点でDXを述べる。
  2. ・DXの2つの要素をさらに分解したのが、この図になります。 ・データ活用は実証実験(いわゆるPoC)フェーズとシステム化フェーズに分けられます。 ・PoCフェーズでは分析の実験を繰り返すことで、ビジネス価値の高い分析内容を見つけ出すことに注力し、効果ありとされたものについて次のシステム化フェーズに進みます。 ・ここで今回の話題の中心となるDataOpsが登場しますが、ここではデータをいかに素早く分析側に供給できるかが、重要なポイントになります。 ・さらに次のフェーズに進むと、データを作り出す源泉システムについて、データ活用基盤への素早いデータ供給のためにモダナイズが必要となります。 --- 取り回しをよくする、柔軟性を上げることを主眼に置くことが多いが、 データ活用をする側から見た、モダナイズの意識を モノリスの悪さ=データ活用ができないからだ。という人は少ない。 データ活用ができないから、モダナイズしたいというお客様は少ないので、そこを強調する必要がある。
  3. ・各社様々な定義がありますが、ここではガートナー社の定義を引用させていただきたいと思います。
  4. データサイエンティスト:統計や機械学習を駆使して、データを分析する人。 データスチュワード:データ利用者とデータ供給者をつなぐ橋渡し役。データのガバナンスに対する責任者。 データエンジニア:データ共有のパイプラインを構築し、メンテナンスするエンジニア。
  5. ・最終的な目的はデータを使ってビジネスに価値を生み出すことであり、データ供給基盤を構築することが目的ではありません。 ・データを供給する側もこの意識をもって取り組まなければ、手段と目的が入れ替わってしまう懸念がある。 ・データ分析においてはより高度な専門性が求められるため、一人の人材ですべての領域をカバーすることは難しくなっている。 ・したがって様々なロールが一つのチームとしてふるまうことで、DataOpsを実現することができる。
  6. ・我々はDataOps実現のロードマップとして3つのレベルを定義している。 ・レベル1はなにも取り組みがなされていない状況だが、我々はお客様に最低限レベル2を達成することを目標にしていただきたいと考えています。 ・ここからはレベル1のサイロ状態をどのようにして、レベル2に引き上げていくのかというお話をするつもりである。 ・なおレベル3については後半に大山よりお話があります。 ------ ・レベル2までは最低限しなくちゃいけないよ。 ・データスチュワードのみなさんが何をしなければならないか?DataOps ・情報活用基盤をDataOpsにしたいCIO向け  スチュワードが大事  レベル1レベル2が大事 スチュワードへの話なのか、CIOへの話なのかがわかりにくい。
  7. ・我々は様々なお客様を支援させていただいているが、多くのお客様のデータ分析基盤はこの図のようになっている。 ・分析基盤がゼロということはまれで、むしろ複数のシステムや分析基盤が乱立していることがおおい。
  8. だいたいエンタープライズのお客様のところに行くと、見えない壁が立っている状態。システム間、上流下流 ヒトの説得 関係者が大量にいて関係調整大変 システムと同時に担当者がサイロ化している。 また分析と源泉システムとの距離が遠いことが問題。
  9. 代表的な課題をマッピングするとこのようになる。 実はDataOpsを実現するにあたっての課題を洗い出すだけでも、かなりの労力を有する。 ある程度発生するであろう課題に目途をつけておかないと、どこから手を付けてよいか、将来どのような点で躓くのかが、わからなくなる。 ・NTTデータ流のDataOpsを実現をブロックしている理由にしたい。 ・データシチズンは用意されたDMを利用するので、DSだけがいる
  10. ・関係者の利害関係を調整しながら、暗黙知を形式知化していく。
  11. 最終的には上流~下流をつなぐ(これをデータリネージュと呼ぶ) また、サイロ化されたシステムをつなぐことで、データ仕様の統一やアーキテクチャの最適化を行う。 これらをデータガバナンスツールで記録・管理することでデータの透明性を高めていく。 現時点のアーキテクチャを明確にし、業務的に意味のある形で記録する作業がいまはほぼ人手になっている(※)大山くんへのつなぎ
  12. ・特定の担当者が仕様を把握している状態を解消して、担当者間の引継ぎやお客さまの内製化を進めやすくする必要がある。
  13. ここまでな人間系のお話を中心にしてきた。 ・レベル2までは最低限しなくちゃいけないよ。 ・データスチュワードのみなさんが何をしなければならないか?DataOps ・情報活用基盤をDataOpsにしたいCIO向け  スチュワードが大事  レベル1レベル2が大事 スチュワードへの話なのか、CIOへの話なのかがわかりにくい。