SlideShare a Scribd company logo
1 of 19
Download to read offline
1	©	Cloudera,	Inc.	All	rights	reserved.	
Amr Awadallah | Cloudera 共同創業者、CTO
Twitter: @awadallah
“パーペイシブ分析”を目指して
2	©	Cloudera,	Inc.	All	rights	reserved.	
ビッグデータ⾰命が今まさに起ころうとしています
産 業 ⾰ 命 デ ー タ ⾰ 命
3	©	Cloudera,	Inc.	All	rights	reserved.	
それはあらゆる産業で起っています
テ レ コ ム
ネットワークパフォーマンスの最適化
⾦ 融 サ ー ビ ス
マネーロンダリングの検知
公 共 機 関
サイバー攻撃の検知
⼩ 売
商品のレコメンデーション
ヘ ル ス ケ ア
パーソナライズ医療
4	©	Cloudera,	Inc.	All	rights	reserved.	
それはあらゆる事業分野で起っています
マ ー ケ テ ィ ン グ 部 ⾨
コンバージョンを 2% 増加
営 業 部 ⾨
リードの 5% を実績に
管 理 部 ⾨
不正⾏為を 3% 削減
顧 客 満 ⾜ 度
解約率を 1% 削減
製 品
ユーザーの採⽤が 10% 増加
5	©	Cloudera,	Inc.	All	rights	reserved.	
なぜ今ビッグデータなのでしょう?
インスツルメンテーション パーソナライゼーション アドバンスド・アナリシス
測定できるものは
すべて計測されるようになる
従業員とお客様は、費⽤をかけずに
よりパーソナライズされた
関わりが持てることを期待してる。
「ひとりを区別する」時代
⾰新的な企業は、実験的で
予測的な分析を活⽤して
迅速な対応を図ってる
6	©	Cloudera,	Inc.	All	rights	reserved.	
ビッグデータの要件は何によって決まるのでしょう?
©2014	Cloudera,	Inc.	All	rights	reserved.			
求められるのは:
1.  技術的にも経済的にも⼤規模な拡張が可能(1バイトあたりのコスト削減)
2.  異なるデータタイプを同時に処理(マルチイン)
Ø  構造化データ: リレーショナルデータベースからトランザクションシステムまで (RDBMS)
Ø  半構造データ: サーバログ、センサーログ、クリックストリームなど
Ø  ⾮構造化データ: Eメール、ツイート、画像、⾳声、動画など
3.  同じデータパイプラインで異なるデータタイプを処理(マルチアウト)
7	©	Cloudera,	Inc.	All	rights	reserved.	
Hadoop: スケーラブルでフレキシブルなストレージと処理機能
©2014	Cloudera,	Inc.	All	rights	reserved.			
Hadoop の⽅式従来の⽅式
1TB あたり $30,000 以上
⾼ 額 で 達 成 不 能
•  拡張が困難
•  必然的にネットワークがボトルネックに
•  構造化データ、リレーショナルデータのみに対応
•  新規フィールドやデータタイプの追加が困難
⾼価、特定⽬的、ベンダー製の「信頼性の⾼い」サーバー、
⾼価なソフトウェアライセンス
ネットワーク
データストレージ
(SAN, NAS)
処理
(RDBMS, EDW)
1TB あたり $300 ~ $1,000
⼿ 頃 な 価 格 で 達 成 可 能
•  無限に拡張可能
•  ボトルネックになるネットワークを排除
•  あらゆるデータタイプを容易に投⼊可能
•  ⾼速な「スキーマ・オン・リード」データアクセス
「普通の信頼性」をもったコモディティサーバー
ハイブリッド・オープンソース・ソフトウェア
処理
(CPU)
メモリ ストレージ
(ディスク)
z
z
8	©	Cloudera,	Inc.	All	rights	reserved.	
アジリティを提供する「スマートフォン」のようなビッグデータ
現状
アプリケーションにデータをコピー
あるべき姿
データにアプリケーションを提供
データ
情報中⼼型で
あらゆるデータを扱う
業務向け仕様:
さまざまなデータ構造の、
あらゆるタイプの
内部や外部データを、
360度のビューで統合
アプリ
アプリ
アプリ
処理中⼼型の
業務向け仕様:
•  構造化データが中⼼
•  内部データ限定
•  「⾼い価値密度」のみ
•  複数のデータコピー
アプリ
アプリ
アプリ
データ
データ
データ
データ
9	©	Cloudera,	Inc.	All	rights	reserved.	
データ
ソース
データ
システム
データ
アクセス
業務分析
カスタム
アプリケーション
既存データ
データベース
業務
アプリケーション
新 規 デ ー タ
限定的なデータ
新規データはもちろん既存のデータでさ
え、⼤規模な環境でパフォーマンスを維
持しながら管理するには、不適切
まずデータを構造化しなければならない
限定的なインサイト
アクセスの制約や貧弱なデータビュー
により、不⼗分な分析と限定的な
適⽤しかできない
インサイトを実践に移すことは困難
複雑なアーキテクチャ
複雑さを⽣む複数のデータやユーザー、
ツール群
総合的なセキュリティ対策の⽋如が、
犯罪者の付け⼊る隙を⽣む
なぜレガシーなデータアーキテクチャでは不⼗分なのでしょう?
従来のアプローチは構造化
のための設計になっている:
•  構造化 データ
•  構造化 分析
•  構造化 プロセス
10	©	Cloudera,	Inc.	All	rights	reserved.	
つまり、	
道のりはやさしくない、ということです
11	©	Cloudera,	Inc.	All	rights	reserved.	
1. 正しいチームを組むこと
2. 正しいアーキテクチャを採⽤すること
3. アジャイルなアプローチを採⽤すること
12	©	Cloudera,	Inc.	All	rights	reserved.	
正しいチームを組む
IT
運⽤、情報セキュリティ、DBA、ETL
データチーム
BI、分析、データサイエンス
「ビジネス」ユーザー
すべての⼈
•  SLA を守りながらコストをコントロール
•  セキュアな環境の維持
•  可能なら、セルフサービス機能を提供
•  データを精査し、新しい事を試してみる
•  多⾓的な分析テクニックを駆使
•  ⾼いパフォーマンスとアジリティが必要
•  適時、リアルタイムなインサイトが必要
•  ⾼度な分析を⾏なう時間やスキルはない
•  結果がすべて:ビジネス上の成果は?
成功するビッグデータプロジェクトには、常に次の各グループに属するメンバーが⼊っています:
13	©	Cloudera,	Inc.	All	rights	reserved.	
ビッグデータプラットフォーム⾰命
2006 2008 2009 2010 2011 2012 現在
Core Hadoop
(HDFS, MR)
HBase
ZooKeeper
Core Hadoop
Hive
Pig
Mahout
HBase
ZooKeeper
Core Hadoop
Sqoop
Whirr
Avro
Hive
Pig
Mahout
HBase
ZooKeeper
Core Hadoop
Flume
Bigtop
Oozie
MRUnit
HCatalog
Sqoop
Whirr
Avro
Hive
Pig
Mahout
HBase
ZooKeeper
Spark
Impala
Solr
Kafka
Flume
Bigtop
Oozie
MRUnit
HCatalog
Sqoop
Whirr
Avro
Hive
Pig
Mahout
HBase
ZooKeeper
Parquet
Sentry
Spark
Impala
Solr
Kafka
Flume
Bigtop
Oozie
MRUnit
HCatalog
Sqoop
Whirr
Avro
Hive
Pig
Mahout
HBase
ZooKeeper
Core Hadoop
+YARN
Core Hadoop
+YARN
Core Hadoop
+YARN
Hadoop は、単なる Hadoop 以上に多くの
ことを成し遂げています
14	©	Cloudera,	Inc.	All	rights	reserved.	
Cloudera Enterprise
Hadoopを⾼速化し、使いやすく、セキュアな環境に
OPERATIONS
DATA+
MANAGEMENT
STRUCTURED UNSTRUCTURED
PROCESS,+ANALYZE,+SERVE
UNIFIED+SERVICES
RESOURCE+MANAGEMENT SECURITY
FILESYSTEM RELATIONAL NoSQL
STORE
INTEGRATE
BATCH STREAM SQL SEARCH SDK
新しい種類の
データプラットフォーム
•  無制限のデータを1か所に
•  統⼀的なデータアクセス
Cloudera が実現:
•  業務スピードの向上
•  容易な管理
•  侵害のないセキュアな環境
15	©	Cloudera,	Inc.	All	rights	reserved.	
WEB/モバイル アプリケーション
オンライン
サービスシステム
エンタープライズ
データウェアハウス
業務報告書BI / 分析機械学習
⾼度な
アプリケーション
CLOUDERA
MANAGER
メタデータ /
ETL ツール
エンタープライズデータハブ
今⽇の情報アーキテクチャ
データアーキテクト システム運⽤担当 エンジニア データサイエンティスト アナリスト ビジネスユーザー
お客様およびエンドユーザー
SYS ログ WEB ログ ファイル RDBMS
16	©	Cloudera,	Inc.	All	rights	reserved.	
1つにまとめる: EDHのデータを活⽤する
収集、作成、管理
制約の無いデータ
データ検索、分析
さまざまな⼿段で
実践化
⾏動を促すインサイト
アジャイルな処理ステージ データ処理 ユーザーアクセス
IT
運⽤、情報セキュリティ、DBA、ETL
データチーム
BI、分析、データサイエンス
「ビジネス」ユーザー
すべての⼈
1.
2.
3.
Enterprise Data Hub
⽣データ
ロード、セキュア、統治、タグ
データの改善
ブレンド、クレンジング、構造化
信頼性の⾼いデータ
⼀般のアクセスを可能に
17	©	Cloudera,	Inc.	All	rights	reserved.	©2014	Cloudera,	Inc.	All	rights	reserved.			
スタートスモール、シンクビッグ (あるいは「⾛る前に歩きなさい」)
SQL
を超越する
アジャイルな
データソース
調査
ETL/Batch
の⾼速化
運⽤効率
(より⾼速に、⼤規模に、低予算で)
⾰新的なアプリケーション
(新しいビジネス価値)
安価な
ストレージ
ビジネス													IT	
EDW
の最適化
パーベイシブ
分析
18	©	Cloudera,	Inc.	All	rights	reserved.	
まとめ
1.  テクノロジーの変化であると同時に、⽂化の変化です
2. はじめはゆっくりと、歩いて、それから⾛りましょう
3. 時間がかかります。直ぐに始めましょう
4. コミュニティの専⾨家に学びましょう
19	©	Cloudera,	Inc.	All	rights	reserved.	
共同創業者/CTO、Cloudera, Inc.
Twitter: @awadallah
Amr	Awadallah

More Related Content

What's hot

JPC2017 [F2-2] オープンソースと検索可能暗号技術でSharePoint Onlineを秘匿化
JPC2017 [F2-2] オープンソースと検索可能暗号技術でSharePoint Onlineを秘匿化JPC2017 [F2-2] オープンソースと検索可能暗号技術でSharePoint Onlineを秘匿化
JPC2017 [F2-2] オープンソースと検索可能暗号技術でSharePoint Onlineを秘匿化MPN Japan
 
超基本! AWS 認定 SA アソシエイト 受験準備 (2020年3月10日)
超基本!  AWS 認定 SA アソシエイト 受験準備 (2020年3月10日)超基本!  AWS 認定 SA アソシエイト 受験準備 (2020年3月10日)
超基本! AWS 認定 SA アソシエイト 受験準備 (2020年3月10日)Masanori KAMAYAMA
 
HIPAA/HITECH Omnibus Rule by CSA Japan Chapter Health Information Management ...
HIPAA/HITECH Omnibus Rule by CSA Japan Chapter Health Information Management ...HIPAA/HITECH Omnibus Rule by CSA Japan Chapter Health Information Management ...
HIPAA/HITECH Omnibus Rule by CSA Japan Chapter Health Information Management ...Eiji Sasahara, Ph.D., MBA 笹原英司
 
DevSecOpsのユースケースとDevSecOpsがもたらす未来(20191126)
DevSecOpsのユースケースとDevSecOpsがもたらす未来(20191126)DevSecOpsのユースケースとDevSecOpsがもたらす未来(20191126)
DevSecOpsのユースケースとDevSecOpsがもたらす未来(20191126)Masanori KAMAYAMA
 
20131213 jawsugソフトウェアベンダーがAWSを活用して
急にSaaSをはじめた話
20131213 jawsugソフトウェアベンダーがAWSを活用して
急にSaaSをはじめた話20131213 jawsugソフトウェアベンダーがAWSを活用して
急にSaaSをはじめた話
20131213 jawsugソフトウェアベンダーがAWSを活用して
急にSaaSをはじめた話Kazuhiro Ogura
 
クラウドの汎用的な基礎知識に自信はありますか?
クラウドの汎用的な基礎知識に自信はありますか?クラウドの汎用的な基礎知識に自信はありますか?
クラウドの汎用的な基礎知識に自信はありますか?Masanori KAMAYAMA
 
ゼロトラスト、この1年でお客様の4つの気づき ~内部不正、ランサムウェアとの戦い方~ (Oracle Cloudウェビナーシリーズ: 2021年10月6日)
ゼロトラスト、この1年でお客様の4つの気づき ~内部不正、ランサムウェアとの戦い方~ (Oracle Cloudウェビナーシリーズ: 2021年10月6日)ゼロトラスト、この1年でお客様の4つの気づき ~内部不正、ランサムウェアとの戦い方~ (Oracle Cloudウェビナーシリーズ: 2021年10月6日)
ゼロトラスト、この1年でお客様の4つの気づき ~内部不正、ランサムウェアとの戦い方~ (Oracle Cloudウェビナーシリーズ: 2021年10月6日)オラクルエンジニア通信
 
【Cisco Data Center Forum 2015】 データ センター ネットワークの動向と Cisco ACI の戦略
【Cisco Data Center Forum 2015】 データ センター ネットワークの動向と Cisco ACI の戦略【Cisco Data Center Forum 2015】 データ センター ネットワークの動向と Cisco ACI の戦略
【Cisco Data Center Forum 2015】 データ センター ネットワークの動向と Cisco ACI の戦略シスコシステムズ合同会社
 
医療機器サイバーセキュリティにおけるOWASPとCSAの連携
医療機器サイバーセキュリティにおけるOWASPとCSAの連携医療機器サイバーセキュリティにおけるOWASPとCSAの連携
医療機器サイバーセキュリティにおけるOWASPとCSAの連携Eiji Sasahara, Ph.D., MBA 笹原英司
 
【Cisco Data Center Forum 2015】 シスコ データセンター ビジョンと戦略
【Cisco Data Center Forum 2015】 シスコ データセンター ビジョンと戦略【Cisco Data Center Forum 2015】 シスコ データセンター ビジョンと戦略
【Cisco Data Center Forum 2015】 シスコ データセンター ビジョンと戦略シスコシステムズ合同会社
 
クラウド時代のIT基盤構築 時代に合った正しいIT活用がセキュリティを容易にさせる_第2回全体ミーティング
クラウド時代のIT基盤構築 時代に合った正しいIT活用がセキュリティを容易にさせる_第2回全体ミーティングクラウド時代のIT基盤構築 時代に合った正しいIT活用がセキュリティを容易にさせる_第2回全体ミーティング
クラウド時代のIT基盤構築 時代に合った正しいIT活用がセキュリティを容易にさせる_第2回全体ミーティングID-Based Security イニシアティブ
 
awsで実現するミッションクリティカル業務のクラウド利用
awsで実現するミッションクリティカル業務のクラウド利用awsで実現するミッションクリティカル業務のクラウド利用
awsで実現するミッションクリティカル業務のクラウド利用Ken Sawada
 
米国立標準技術研究所(NIST) サイバーセキュリティフレームワークの製造業適用支援関連文書の概説
米国立標準技術研究所(NIST) サイバーセキュリティフレームワークの製造業適用支援関連文書の概説米国立標準技術研究所(NIST) サイバーセキュリティフレームワークの製造業適用支援関連文書の概説
米国立標準技術研究所(NIST) サイバーセキュリティフレームワークの製造業適用支援関連文書の概説Eiji Sasahara, Ph.D., MBA 笹原英司
 
[Preview] MySQL session at Open Source Conference 2014 .Enterprise Osaka
[Preview] MySQL session at Open Source Conference 2014 .Enterprise Osaka[Preview] MySQL session at Open Source Conference 2014 .Enterprise Osaka
[Preview] MySQL session at Open Source Conference 2014 .Enterprise OsakaRyusuke Kajiyama
 
Microsoft 365 で両立するセキュリティと働き方改革
Microsoft 365 で両立するセキュリティと働き方改革Microsoft 365 で両立するセキュリティと働き方改革
Microsoft 365 で両立するセキュリティと働き方改革Hiroyuki Komachi
 
Oracle Cloud Platform:IDCSを使ったアイデンティティ・ドメイン管理者ガイド
Oracle Cloud Platform:IDCSを使ったアイデンティティ・ドメイン管理者ガイドOracle Cloud Platform:IDCSを使ったアイデンティティ・ドメイン管理者ガイド
Oracle Cloud Platform:IDCSを使ったアイデンティティ・ドメイン管理者ガイドオラクルエンジニア通信
 

What's hot (19)

JPC2017 [F2-2] オープンソースと検索可能暗号技術でSharePoint Onlineを秘匿化
JPC2017 [F2-2] オープンソースと検索可能暗号技術でSharePoint Onlineを秘匿化JPC2017 [F2-2] オープンソースと検索可能暗号技術でSharePoint Onlineを秘匿化
JPC2017 [F2-2] オープンソースと検索可能暗号技術でSharePoint Onlineを秘匿化
 
超基本! AWS 認定 SA アソシエイト 受験準備 (2020年3月10日)
超基本!  AWS 認定 SA アソシエイト 受験準備 (2020年3月10日)超基本!  AWS 認定 SA アソシエイト 受験準備 (2020年3月10日)
超基本! AWS 認定 SA アソシエイト 受験準備 (2020年3月10日)
 
HIPAA/HITECH Omnibus Rule by CSA Japan Chapter Health Information Management ...
HIPAA/HITECH Omnibus Rule by CSA Japan Chapter Health Information Management ...HIPAA/HITECH Omnibus Rule by CSA Japan Chapter Health Information Management ...
HIPAA/HITECH Omnibus Rule by CSA Japan Chapter Health Information Management ...
 
DevSecOpsのユースケースとDevSecOpsがもたらす未来(20191126)
DevSecOpsのユースケースとDevSecOpsがもたらす未来(20191126)DevSecOpsのユースケースとDevSecOpsがもたらす未来(20191126)
DevSecOpsのユースケースとDevSecOpsがもたらす未来(20191126)
 
20131213 jawsugソフトウェアベンダーがAWSを活用して
急にSaaSをはじめた話
20131213 jawsugソフトウェアベンダーがAWSを活用して
急にSaaSをはじめた話20131213 jawsugソフトウェアベンダーがAWSを活用して
急にSaaSをはじめた話
20131213 jawsugソフトウェアベンダーがAWSを活用して
急にSaaSをはじめた話
 
Ccsk 160927
Ccsk 160927Ccsk 160927
Ccsk 160927
 
クラウドの汎用的な基礎知識に自信はありますか?
クラウドの汎用的な基礎知識に自信はありますか?クラウドの汎用的な基礎知識に自信はありますか?
クラウドの汎用的な基礎知識に自信はありますか?
 
ゼロトラスト、この1年でお客様の4つの気づき ~内部不正、ランサムウェアとの戦い方~ (Oracle Cloudウェビナーシリーズ: 2021年10月6日)
ゼロトラスト、この1年でお客様の4つの気づき ~内部不正、ランサムウェアとの戦い方~ (Oracle Cloudウェビナーシリーズ: 2021年10月6日)ゼロトラスト、この1年でお客様の4つの気づき ~内部不正、ランサムウェアとの戦い方~ (Oracle Cloudウェビナーシリーズ: 2021年10月6日)
ゼロトラスト、この1年でお客様の4つの気づき ~内部不正、ランサムウェアとの戦い方~ (Oracle Cloudウェビナーシリーズ: 2021年10月6日)
 
私がなぜZscalerに?
私がなぜZscalerに?私がなぜZscalerに?
私がなぜZscalerに?
 
【Cisco Data Center Forum 2015】 データ センター ネットワークの動向と Cisco ACI の戦略
【Cisco Data Center Forum 2015】 データ センター ネットワークの動向と Cisco ACI の戦略【Cisco Data Center Forum 2015】 データ センター ネットワークの動向と Cisco ACI の戦略
【Cisco Data Center Forum 2015】 データ センター ネットワークの動向と Cisco ACI の戦略
 
医療機器サイバーセキュリティにおけるOWASPとCSAの連携
医療機器サイバーセキュリティにおけるOWASPとCSAの連携医療機器サイバーセキュリティにおけるOWASPとCSAの連携
医療機器サイバーセキュリティにおけるOWASPとCSAの連携
 
【Cisco Data Center Forum 2015】 シスコ データセンター ビジョンと戦略
【Cisco Data Center Forum 2015】 シスコ データセンター ビジョンと戦略【Cisco Data Center Forum 2015】 シスコ データセンター ビジョンと戦略
【Cisco Data Center Forum 2015】 シスコ データセンター ビジョンと戦略
 
クラウド時代のIT基盤構築 時代に合った正しいIT活用がセキュリティを容易にさせる_第2回全体ミーティング
クラウド時代のIT基盤構築 時代に合った正しいIT活用がセキュリティを容易にさせる_第2回全体ミーティングクラウド時代のIT基盤構築 時代に合った正しいIT活用がセキュリティを容易にさせる_第2回全体ミーティング
クラウド時代のIT基盤構築 時代に合った正しいIT活用がセキュリティを容易にさせる_第2回全体ミーティング
 
【LTセッション】Brainwave 使ってみた_DEEP LEARNING LAB
【LTセッション】Brainwave 使ってみた_DEEP LEARNING LAB【LTセッション】Brainwave 使ってみた_DEEP LEARNING LAB
【LTセッション】Brainwave 使ってみた_DEEP LEARNING LAB
 
awsで実現するミッションクリティカル業務のクラウド利用
awsで実現するミッションクリティカル業務のクラウド利用awsで実現するミッションクリティカル業務のクラウド利用
awsで実現するミッションクリティカル業務のクラウド利用
 
米国立標準技術研究所(NIST) サイバーセキュリティフレームワークの製造業適用支援関連文書の概説
米国立標準技術研究所(NIST) サイバーセキュリティフレームワークの製造業適用支援関連文書の概説米国立標準技術研究所(NIST) サイバーセキュリティフレームワークの製造業適用支援関連文書の概説
米国立標準技術研究所(NIST) サイバーセキュリティフレームワークの製造業適用支援関連文書の概説
 
[Preview] MySQL session at Open Source Conference 2014 .Enterprise Osaka
[Preview] MySQL session at Open Source Conference 2014 .Enterprise Osaka[Preview] MySQL session at Open Source Conference 2014 .Enterprise Osaka
[Preview] MySQL session at Open Source Conference 2014 .Enterprise Osaka
 
Microsoft 365 で両立するセキュリティと働き方改革
Microsoft 365 で両立するセキュリティと働き方改革Microsoft 365 で両立するセキュリティと働き方改革
Microsoft 365 で両立するセキュリティと働き方改革
 
Oracle Cloud Platform:IDCSを使ったアイデンティティ・ドメイン管理者ガイド
Oracle Cloud Platform:IDCSを使ったアイデンティティ・ドメイン管理者ガイドOracle Cloud Platform:IDCSを使ったアイデンティティ・ドメイン管理者ガイド
Oracle Cloud Platform:IDCSを使ったアイデンティティ・ドメイン管理者ガイド
 

Viewers also liked

Impala概要 道玄坂LT祭り 20150312 #dogenzakalt
Impala概要 道玄坂LT祭り 20150312 #dogenzakaltImpala概要 道玄坂LT祭り 20150312 #dogenzakalt
Impala概要 道玄坂LT祭り 20150312 #dogenzakaltCloudera Japan
 
Troubleshooting Using Cloudera Manager #cwt2015
Troubleshooting Using Cloudera Manager #cwt2015Troubleshooting Using Cloudera Manager #cwt2015
Troubleshooting Using Cloudera Manager #cwt2015Cloudera Japan
 
Hadoopの標準GUI Hueの最新情報2
Hadoopの標準GUI Hueの最新情報2Hadoopの標準GUI Hueの最新情報2
Hadoopの標準GUI Hueの最新情報2Cloudera Japan
 
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015Cloudera Japan
 
基調講演: 「データエコシステムへの挑戦」 #cwt2015
基調講演: 「データエコシステムへの挑戦」 #cwt2015基調講演: 「データエコシステムへの挑戦」 #cwt2015
基調講演: 「データエコシステムへの挑戦」 #cwt2015Cloudera Japan
 
Evolution of Impala #hcj2014
Evolution of Impala #hcj2014Evolution of Impala #hcj2014
Evolution of Impala #hcj2014Cloudera Japan
 
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015Cloudera Japan
 
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015Cloudera Japan
 
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015Cloudera Japan
 
Cloudera Manager 5 (hadoop運用) #cwt2013
Cloudera Manager 5 (hadoop運用)  #cwt2013Cloudera Manager 5 (hadoop運用)  #cwt2013
Cloudera Manager 5 (hadoop運用) #cwt2013Cloudera Japan
 
#cwt2016 Apache Kudu 構成とテーブル設計
#cwt2016 Apache Kudu 構成とテーブル設計#cwt2016 Apache Kudu 構成とテーブル設計
#cwt2016 Apache Kudu 構成とテーブル設計Cloudera Japan
 
Spark徹底入門 #cwt2015
Spark徹底入門 #cwt2015Spark徹底入門 #cwt2015
Spark徹底入門 #cwt2015Cloudera Japan
 
Cloud Native Hadoop #cwt2016
Cloud Native Hadoop #cwt2016Cloud Native Hadoop #cwt2016
Cloud Native Hadoop #cwt2016Cloudera Japan
 
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDSIbis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDSCloudera Japan
 
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016Cloudera Japan
 
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakaltクラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakaltCloudera Japan
 
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング #cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング Cloudera Japan
 
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016Cloudera Japan
 

Viewers also liked (18)

Impala概要 道玄坂LT祭り 20150312 #dogenzakalt
Impala概要 道玄坂LT祭り 20150312 #dogenzakaltImpala概要 道玄坂LT祭り 20150312 #dogenzakalt
Impala概要 道玄坂LT祭り 20150312 #dogenzakalt
 
Troubleshooting Using Cloudera Manager #cwt2015
Troubleshooting Using Cloudera Manager #cwt2015Troubleshooting Using Cloudera Manager #cwt2015
Troubleshooting Using Cloudera Manager #cwt2015
 
Hadoopの標準GUI Hueの最新情報2
Hadoopの標準GUI Hueの最新情報2Hadoopの標準GUI Hueの最新情報2
Hadoopの標準GUI Hueの最新情報2
 
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
 
基調講演: 「データエコシステムへの挑戦」 #cwt2015
基調講演: 「データエコシステムへの挑戦」 #cwt2015基調講演: 「データエコシステムへの挑戦」 #cwt2015
基調講演: 「データエコシステムへの挑戦」 #cwt2015
 
Evolution of Impala #hcj2014
Evolution of Impala #hcj2014Evolution of Impala #hcj2014
Evolution of Impala #hcj2014
 
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
 
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
 
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
 
Cloudera Manager 5 (hadoop運用) #cwt2013
Cloudera Manager 5 (hadoop運用)  #cwt2013Cloudera Manager 5 (hadoop運用)  #cwt2013
Cloudera Manager 5 (hadoop運用) #cwt2013
 
#cwt2016 Apache Kudu 構成とテーブル設計
#cwt2016 Apache Kudu 構成とテーブル設計#cwt2016 Apache Kudu 構成とテーブル設計
#cwt2016 Apache Kudu 構成とテーブル設計
 
Spark徹底入門 #cwt2015
Spark徹底入門 #cwt2015Spark徹底入門 #cwt2015
Spark徹底入門 #cwt2015
 
Cloud Native Hadoop #cwt2016
Cloud Native Hadoop #cwt2016Cloud Native Hadoop #cwt2016
Cloud Native Hadoop #cwt2016
 
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDSIbis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
 
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016
 
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakaltクラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
 
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング #cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
 
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
 

Similar to 基調講演: 「パーペイシブ分析を目指して」#cwt2015

エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...Insight Technology, Inc.
 
先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方Cloudera Japan
 
マネーフォワードの考えるプラットフォーム
マネーフォワードの考えるプラットフォームマネーフォワードの考えるプラットフォーム
マネーフォワードの考えるプラットフォームKeisuke Izumiya
 
A3 sugar crm_on_softlayer_sakai&clint_v3
A3 sugar crm_on_softlayer_sakai&clint_v3A3 sugar crm_on_softlayer_sakai&clint_v3
A3 sugar crm_on_softlayer_sakai&clint_v3chenree3
 
A3 sugar crm_on_softlayer_sakai&clint_v3
A3 sugar crm_on_softlayer_sakai&clint_v3A3 sugar crm_on_softlayer_sakai&clint_v3
A3 sugar crm_on_softlayer_sakai&clint_v3softlayerjp
 
[data security showcase Sapporo 2015] D21:セキュリティ強化の為の仮想化 ~マイナンバー対策、インターネット端末保...
[data security showcase Sapporo 2015] D21:セキュリティ強化の為の仮想化 ~マイナンバー対策、インターネット端末保...[data security showcase Sapporo 2015] D21:セキュリティ強化の為の仮想化 ~マイナンバー対策、インターネット端末保...
[data security showcase Sapporo 2015] D21:セキュリティ強化の為の仮想化 ~マイナンバー対策、インターネット端末保...Insight Technology, Inc.
 
Salesforce crm over_view_2012_0301
Salesforce crm over_view_2012_0301Salesforce crm over_view_2012_0301
Salesforce crm over_view_2012_0301Kohei Nishikawa
 
Enterpriseでもモバイル開発
Enterpriseでもモバイル開発Enterpriseでもモバイル開発
Enterpriseでもモバイル開発Mitch Okamoto
 
クラウドセキュリティ 誤解と事実の壁
クラウドセキュリティ 誤解と事実の壁クラウドセキュリティ 誤解と事実の壁
クラウドセキュリティ 誤解と事実の壁KVH Co. Ltd.
 
New Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessNew Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessRie Yamanaka
 
プライベートクラウドへの準備はできていますか?[ホワイトペーパー]
プライベートクラウドへの準備はできていますか?[ホワイトペーパー]プライベートクラウドへの準備はできていますか?[ホワイトペーパー]
プライベートクラウドへの準備はできていますか?[ホワイトペーパー]KVH Co. Ltd.
 
SIerとクラウドの付き合い方
SIerとクラウドの付き合い方SIerとクラウドの付き合い方
SIerとクラウドの付き合い方Yusuke Suzuki
 
株式会社メディカルフォース 求職者むけ会社説明資料 What's medicalforce
株式会社メディカルフォース 求職者むけ会社説明資料 What's medicalforce株式会社メディカルフォース 求職者むけ会社説明資料 What's medicalforce
株式会社メディカルフォース 求職者むけ会社説明資料 What's medicalforcessuser2f1c3f
 
【Gmb口コミ対策】概算資料
【Gmb口コミ対策】概算資料【Gmb口コミ対策】概算資料
【Gmb口コミ対策】概算資料KazunaoHIGUCHI
 
Tealium+AWS Analytics サービスで実現する Customer Experience(CX)
Tealium+AWS Analytics サービスで実現する Customer Experience(CX)Tealium+AWS Analytics サービスで実現する Customer Experience(CX)
Tealium+AWS Analytics サービスで実現する Customer Experience(CX)Amazon Web Services Japan
 

Similar to 基調講演: 「パーペイシブ分析を目指して」#cwt2015 (20)

エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
 
先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方
 
マネーフォワードの考えるプラットフォーム
マネーフォワードの考えるプラットフォームマネーフォワードの考えるプラットフォーム
マネーフォワードの考えるプラットフォーム
 
A3 sugar crm_on_softlayer_sakai&clint_v3
A3 sugar crm_on_softlayer_sakai&clint_v3A3 sugar crm_on_softlayer_sakai&clint_v3
A3 sugar crm_on_softlayer_sakai&clint_v3
 
A3 sugar crm_on_softlayer_sakai&clint_v3
A3 sugar crm_on_softlayer_sakai&clint_v3A3 sugar crm_on_softlayer_sakai&clint_v3
A3 sugar crm_on_softlayer_sakai&clint_v3
 
アフターコロナでより重宝される アプリカテゴリとその成功法則
アフターコロナでより重宝される アプリカテゴリとその成功法則アフターコロナでより重宝される アプリカテゴリとその成功法則
アフターコロナでより重宝される アプリカテゴリとその成功法則
 
Extreme "Now" : 新生エクストリームが提供する価値
Extreme "Now" : 新生エクストリームが提供する価値Extreme "Now" : 新生エクストリームが提供する価値
Extreme "Now" : 新生エクストリームが提供する価値
 
[data security showcase Sapporo 2015] D21:セキュリティ強化の為の仮想化 ~マイナンバー対策、インターネット端末保...
[data security showcase Sapporo 2015] D21:セキュリティ強化の為の仮想化 ~マイナンバー対策、インターネット端末保...[data security showcase Sapporo 2015] D21:セキュリティ強化の為の仮想化 ~マイナンバー対策、インターネット端末保...
[data security showcase Sapporo 2015] D21:セキュリティ強化の為の仮想化 ~マイナンバー対策、インターネット端末保...
 
Salesforce crm over_view_2012_0301
Salesforce crm over_view_2012_0301Salesforce crm over_view_2012_0301
Salesforce crm over_view_2012_0301
 
Enterpriseでもモバイル開発
Enterpriseでもモバイル開発Enterpriseでもモバイル開発
Enterpriseでもモバイル開発
 
クラウドセキュリティ 誤解と事実の壁
クラウドセキュリティ 誤解と事実の壁クラウドセキュリティ 誤解と事実の壁
クラウドセキュリティ 誤解と事実の壁
 
New Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessNew Technology Trends and Effects on Business
New Technology Trends and Effects on Business
 
「ネットワークが遅い!」即診断: Extremeアナリティクスで何がわかる?
「ネットワークが遅い!」即診断: Extremeアナリティクスで何がわかる?「ネットワークが遅い!」即診断: Extremeアナリティクスで何がわかる?
「ネットワークが遅い!」即診断: Extremeアナリティクスで何がわかる?
 
プライベートクラウドへの準備はできていますか?[ホワイトペーパー]
プライベートクラウドへの準備はできていますか?[ホワイトペーパー]プライベートクラウドへの準備はできていますか?[ホワイトペーパー]
プライベートクラウドへの準備はできていますか?[ホワイトペーパー]
 
SIerとクラウドの付き合い方
SIerとクラウドの付き合い方SIerとクラウドの付き合い方
SIerとクラウドの付き合い方
 
株式会社メディカルフォース 求職者むけ会社説明資料 What's medicalforce
株式会社メディカルフォース 求職者むけ会社説明資料 What's medicalforce株式会社メディカルフォース 求職者むけ会社説明資料 What's medicalforce
株式会社メディカルフォース 求職者むけ会社説明資料 What's medicalforce
 
Ittrend
IttrendIttrend
Ittrend
 
Extreme Management Center を活用したネットワークの見える化
Extreme Management Center を活用したネットワークの見える化Extreme Management Center を活用したネットワークの見える化
Extreme Management Center を活用したネットワークの見える化
 
【Gmb口コミ対策】概算資料
【Gmb口コミ対策】概算資料【Gmb口コミ対策】概算資料
【Gmb口コミ対策】概算資料
 
Tealium+AWS Analytics サービスで実現する Customer Experience(CX)
Tealium+AWS Analytics サービスで実現する Customer Experience(CX)Tealium+AWS Analytics サービスで実現する Customer Experience(CX)
Tealium+AWS Analytics サービスで実現する Customer Experience(CX)
 

More from Cloudera Japan

Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)Cloudera Japan
 
機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介Cloudera Japan
 
HDFS Supportaiblity Improvements
HDFS Supportaiblity ImprovementsHDFS Supportaiblity Improvements
HDFS Supportaiblity ImprovementsCloudera Japan
 
分散DB Apache Kuduのアーキテクチャ DBの性能と一貫性を両立させる仕組み 「HybridTime」とは
分散DB Apache KuduのアーキテクチャDBの性能と一貫性を両立させる仕組み「HybridTime」とは分散DB Apache KuduのアーキテクチャDBの性能と一貫性を両立させる仕組み「HybridTime」とは
分散DB Apache Kuduのアーキテクチャ DBの性能と一貫性を両立させる仕組み 「HybridTime」とはCloudera Japan
 
Apache Impalaパフォーマンスチューニング #dbts2018
Apache Impalaパフォーマンスチューニング #dbts2018Apache Impalaパフォーマンスチューニング #dbts2018
Apache Impalaパフォーマンスチューニング #dbts2018Cloudera Japan
 
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理Cloudera Japan
 
HBase Across the World #LINE_DM
HBase Across the World #LINE_DMHBase Across the World #LINE_DM
HBase Across the World #LINE_DMCloudera Japan
 
Cloudera のサポートエンジニアリング #supennight
Cloudera のサポートエンジニアリング #supennightCloudera のサポートエンジニアリング #supennight
Cloudera のサポートエンジニアリング #supennightCloudera Japan
 
Train, predict, serve: How to go into production your machine learning model
Train, predict, serve: How to go into production your machine learning modelTrain, predict, serve: How to go into production your machine learning model
Train, predict, serve: How to go into production your machine learning modelCloudera Japan
 
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側Cloudera Japan
 
Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017Cloudera Japan
 
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017Cloudera Japan
 
How to go into production your machine learning models? #CWT2017
How to go into production your machine learning models? #CWT2017How to go into production your machine learning models? #CWT2017
How to go into production your machine learning models? #CWT2017Cloudera Japan
 
Apache Kudu - Updatable Analytical Storage #rakutentech
Apache Kudu - Updatable Analytical Storage #rakutentechApache Kudu - Updatable Analytical Storage #rakutentech
Apache Kudu - Updatable Analytical Storage #rakutentechCloudera Japan
 
Hue 4.0 / Hue Meetup Tokyo #huejp
Hue 4.0 / Hue Meetup Tokyo #huejpHue 4.0 / Hue Meetup Tokyo #huejp
Hue 4.0 / Hue Meetup Tokyo #huejpCloudera Japan
 
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017Cloudera Japan
 
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadedaCloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadedaCloudera Japan
 

More from Cloudera Japan (17)

Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
 
機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介
 
HDFS Supportaiblity Improvements
HDFS Supportaiblity ImprovementsHDFS Supportaiblity Improvements
HDFS Supportaiblity Improvements
 
分散DB Apache Kuduのアーキテクチャ DBの性能と一貫性を両立させる仕組み 「HybridTime」とは
分散DB Apache KuduのアーキテクチャDBの性能と一貫性を両立させる仕組み「HybridTime」とは分散DB Apache KuduのアーキテクチャDBの性能と一貫性を両立させる仕組み「HybridTime」とは
分散DB Apache Kuduのアーキテクチャ DBの性能と一貫性を両立させる仕組み 「HybridTime」とは
 
Apache Impalaパフォーマンスチューニング #dbts2018
Apache Impalaパフォーマンスチューニング #dbts2018Apache Impalaパフォーマンスチューニング #dbts2018
Apache Impalaパフォーマンスチューニング #dbts2018
 
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理
 
HBase Across the World #LINE_DM
HBase Across the World #LINE_DMHBase Across the World #LINE_DM
HBase Across the World #LINE_DM
 
Cloudera のサポートエンジニアリング #supennight
Cloudera のサポートエンジニアリング #supennightCloudera のサポートエンジニアリング #supennight
Cloudera のサポートエンジニアリング #supennight
 
Train, predict, serve: How to go into production your machine learning model
Train, predict, serve: How to go into production your machine learning modelTrain, predict, serve: How to go into production your machine learning model
Train, predict, serve: How to go into production your machine learning model
 
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
 
Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017
 
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
 
How to go into production your machine learning models? #CWT2017
How to go into production your machine learning models? #CWT2017How to go into production your machine learning models? #CWT2017
How to go into production your machine learning models? #CWT2017
 
Apache Kudu - Updatable Analytical Storage #rakutentech
Apache Kudu - Updatable Analytical Storage #rakutentechApache Kudu - Updatable Analytical Storage #rakutentech
Apache Kudu - Updatable Analytical Storage #rakutentech
 
Hue 4.0 / Hue Meetup Tokyo #huejp
Hue 4.0 / Hue Meetup Tokyo #huejpHue 4.0 / Hue Meetup Tokyo #huejp
Hue 4.0 / Hue Meetup Tokyo #huejp
 
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
 
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadedaCloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
 

Recently uploaded

Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 

Recently uploaded (9)

Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 

基調講演: 「パーペイシブ分析を目指して」#cwt2015

Editor's Notes

  1. If we can collectively execute as a group we will spark a data revolution. We have seen this happen before. The industrial revolution was sparked by new manufacturing technology that allowed organizations to more efficiently produce products, in turn, offering a better more affordable product to consumers. This had a profound impact on not only the producer but also the consumers. The same thing will happen with data. If we can leverage data in a way that makes people more efficient at building better products we can in turn provide a better service to end users have a similar impact on the world around us. Just like the industrial revolution started with the Textile industry the data revolution started with the technology sector. The Googles, Facebooks, Ubers of the world have already changed our lives, and in turn, have seen the data returns that we are all after.
  2. Key Takeaways: Industries are already beginning to transform. How can data help transform the way employees and customers interact with these industries.
  3. Key Takeaways: Employees are already asking the right questions, we just need to help them achieve their goals through the use of data.
  4. With maturity of the platform and  technology ecosystem, and with enterprises better understanding not only the promise of the technology but also how to implement it, we are seeing a fundamental shift in the market….. Hadoop and big data are no longer about technologies only, nor are they  simply about cost reduction. In fact, there have been shifts towards aligning data to business objectives in order to derive even greater value out of big data. The three areas of opportunities within businesses generally are: Customer 360 - How do I understand my customers and my channel better to improve my topline? Data-driven products - How do I create better and more products to satisfy the needs of my customers? Risk - How do I make sure that the company complies to rules and regulations, protects customer and enterprise information, and minimize the risk factors?
  5. Pricing Data: Cloudera: HW + SW per-year list prices for Basic thru EDH at various configs Old Way: Various sources. One of note: - Cowen / Goldmacher coverage initiation of Teradata, June 17, 2013 - List price of high-end appliance (which he thinks is more comparable to our solution) is $57K/TB + maintenance for an annual cost of $39K/TB - Prices have likely decreased, but we estimate they are still in excess of $30K/TB/year - List price of their low-end appliance is $12K/TB + maint or $8K per year
  6. Today we're in the middle of a shift in how businesses use information. In the past, you'd define a set of business processes, build applications around each of them, and then go about gathering, conforming, and merging the necessary data sets to support those applications. From an infrastructure perspective, you'd be bringing the data over to the compute, often in relational databases. But you'd be leaving quite a lot on the table. The modern realities of business demand a new approach. Today companies need, more than ever, to become information-driven, but given the amount and diversity of information available, and the rate of change in business, it's simply unsustainable to keep moving around and transforming huge volumes of data.
  7. We are in the middle of a shift in how businesses use information. We want to use not just more data, but more kinds of data. We need to combine old data with new, interact with data in multiple ways, and rapidly iterate on the results. Several challenges: A. Limited Data. Faced with the tremendous growth in volume and variety of data, most existing systems aren’t positioned to meet the demand and require you to store data offline where it is inaccessible to users. B. Limited Insights. Analysts and data scientists struggle with the tools available to them. SQL is only one way to interact with data, and often not the right tool for the job. Without access to all the original data, it can take weeks or months to deploy new views. If the tools your data team uses are limited to the expertise of that team then business user must rely on the stressed data teams. C. Complex Architecture. Managing multiple systems creates gaps in security, policy enforcement, and management capabilities. Not to mention inflated costs and a decrease of ROI In traditional architectures, it can be complex to secure all data for all users, so it’s often easier to simply leave data out of analysis, or lock users out of analytics
  8. The Journey is not easy It takes time We know, we have done this countless times before New technology can seem complex It can create operational complexity Requires new skills and ongoing training 3 parts to the solution: architecture, team, process
  9. Assemble the right team and make sure the right players are part of the conversation. Get the right architecture to provide your users the right framework and tools to do their jobs. Adopt an agile approach, and never stop experimenting. 
  10. Breakdown as more personas and not necessarily titles. And each think about different things. IT – provides plumbing and data to business users. Next we need to think about security. Deliver self service where you can! But don’t stop here! Build a data team The people that are tasked turning data into value. Try many things quickly and they need good tools. They also need high performance tools. Business Users One of the reasons big data projects fail is because business users are not brought into the conversation at the right time. Seek executive sponsors and internal champions : These users care about results.
  11. Enter Apache Hadoop, I imagine that is why you all are here today? Apache Hadoop is a community Continues to grow as Hadoop continues to expand out of just batch storage and processing. As more businesses adopt Hadoop, more use cases emerge. With Hadoop, you don’t just get the code your team built, you get the code the community built.
  12. Hadoop does not need a schema to load and land data.  You can land any data in full fidelity.  Secure it and tag it, then make it available to your data team. Leverage more types of data and future-proof your efforts as the business matures
  13. In Summary, In order to realize the dream of Pervasive Analytics It’s a cultural shift as much as a technology shift Start Small, and prepare for the next success It takes time, start today Lean on experts in the community, and never stop experimenting