Enviar pesquisa
Carregar
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
•
Transferir como PPTX, PDF
•
9 gostaram
•
2,115 visualizações
Cloudera Japan
Seguir
Global Knowledge Network社主催、「G-Tech 2015」でのHadoop/Sparkに関する講演資料です。
Leia menos
Leia mais
Tecnologia
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 58
Baixar agora
Recomendados
C5.2 (Cloudera Manager + CDH) アップデート #cwt2014
C5.2 (Cloudera Manager + CDH) アップデート #cwt2014
Cloudera Japan
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
Cloudera Japan
機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介
Cloudera Japan
CDHの歴史とCDH5新機能概要 #at_tokuben
CDHの歴史とCDH5新機能概要 #at_tokuben
Cloudera Japan
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Cloudera Japan
Troubleshooting Using Cloudera Manager #cwt2015
Troubleshooting Using Cloudera Manager #cwt2015
Cloudera Japan
HBase Meetup Tokyo Summer 2015 #hbasejp
HBase Meetup Tokyo Summer 2015 #hbasejp
Cloudera Japan
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
Cloudera Japan
Recomendados
C5.2 (Cloudera Manager + CDH) アップデート #cwt2014
C5.2 (Cloudera Manager + CDH) アップデート #cwt2014
Cloudera Japan
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
Cloudera Japan
機械学習の定番プラットフォームSparkの紹介
機械学習の定番プラットフォームSparkの紹介
Cloudera Japan
CDHの歴史とCDH5新機能概要 #at_tokuben
CDHの歴史とCDH5新機能概要 #at_tokuben
Cloudera Japan
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Cloudera Japan
Troubleshooting Using Cloudera Manager #cwt2015
Troubleshooting Using Cloudera Manager #cwt2015
Cloudera Japan
HBase Meetup Tokyo Summer 2015 #hbasejp
HBase Meetup Tokyo Summer 2015 #hbasejp
Cloudera Japan
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
Cloudera Japan
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Cloudera Japan
Cloud Native Hadoop #cwt2016
Cloud Native Hadoop #cwt2016
Cloudera Japan
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Japan
Hadoop Operations #cwt2013
Hadoop Operations #cwt2013
Cloudera Japan
基礎から学ぶ超並列SQLエンジンImpala #cwt2015
基礎から学ぶ超並列SQLエンジンImpala #cwt2015
Cloudera Japan
#cwt2016 Apache Kudu 構成とテーブル設計
#cwt2016 Apache Kudu 構成とテーブル設計
Cloudera Japan
HBase活用事例 #hbase_ca
HBase活用事例 #hbase_ca
Cloudera Japan
Apache Impalaパフォーマンスチューニング #dbts2018
Apache Impalaパフォーマンスチューニング #dbts2018
Cloudera Japan
エンタープライズデータハブ活用の落とし穴 2015 08-27
エンタープライズデータハブ活用の落とし穴 2015 08-27
Cloudera Japan
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
Cloudera Japan
Spark徹底入門 #cwt2015
Spark徹底入門 #cwt2015
Cloudera Japan
Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014
Cloudera Japan
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016
Cloudera Japan
認証/認可が実現する安全で高速分析可能な分析処理基盤
認証/認可が実現する安全で高速分析可能な分析処理基盤
Masahiro Kiura
基調講演: 「データエコシステムへの挑戦」 #cwt2015
基調講演: 「データエコシステムへの挑戦」 #cwt2015
Cloudera Japan
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013
Cloudera Japan
Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017
Cloudera Japan
データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例
Masahiro Kiura
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
Cloudera Japan
マルチテナント化に向けたHadoopの最新セキュリティ事情 #hcj2014
マルチテナント化に向けたHadoopの最新セキュリティ事情 #hcj2014
Cloudera Japan
OGH 2015 - Hadoop (Oracle BDA) and Oracle Technologies on BI Projects
OGH 2015 - Hadoop (Oracle BDA) and Oracle Technologies on BI Projects
Mark Rittman
Part 1 - Introduction to Hadoop and Big Data Technologies for Oracle BI & DW ...
Part 1 - Introduction to Hadoop and Big Data Technologies for Oracle BI & DW ...
Mark Rittman
Mais conteúdo relacionado
Mais procurados
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Cloudera Japan
Cloud Native Hadoop #cwt2016
Cloud Native Hadoop #cwt2016
Cloudera Japan
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Japan
Hadoop Operations #cwt2013
Hadoop Operations #cwt2013
Cloudera Japan
基礎から学ぶ超並列SQLエンジンImpala #cwt2015
基礎から学ぶ超並列SQLエンジンImpala #cwt2015
Cloudera Japan
#cwt2016 Apache Kudu 構成とテーブル設計
#cwt2016 Apache Kudu 構成とテーブル設計
Cloudera Japan
HBase活用事例 #hbase_ca
HBase活用事例 #hbase_ca
Cloudera Japan
Apache Impalaパフォーマンスチューニング #dbts2018
Apache Impalaパフォーマンスチューニング #dbts2018
Cloudera Japan
エンタープライズデータハブ活用の落とし穴 2015 08-27
エンタープライズデータハブ活用の落とし穴 2015 08-27
Cloudera Japan
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
Cloudera Japan
Spark徹底入門 #cwt2015
Spark徹底入門 #cwt2015
Cloudera Japan
Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014
Cloudera Japan
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016
Cloudera Japan
認証/認可が実現する安全で高速分析可能な分析処理基盤
認証/認可が実現する安全で高速分析可能な分析処理基盤
Masahiro Kiura
基調講演: 「データエコシステムへの挑戦」 #cwt2015
基調講演: 「データエコシステムへの挑戦」 #cwt2015
Cloudera Japan
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013
Cloudera Japan
Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017
Cloudera Japan
データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例
Masahiro Kiura
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
Cloudera Japan
マルチテナント化に向けたHadoopの最新セキュリティ事情 #hcj2014
マルチテナント化に向けたHadoopの最新セキュリティ事情 #hcj2014
Cloudera Japan
Mais procurados
(20)
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Cloud Native Hadoop #cwt2016
Cloud Native Hadoop #cwt2016
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Hadoop Operations #cwt2013
Hadoop Operations #cwt2013
基礎から学ぶ超並列SQLエンジンImpala #cwt2015
基礎から学ぶ超並列SQLエンジンImpala #cwt2015
#cwt2016 Apache Kudu 構成とテーブル設計
#cwt2016 Apache Kudu 構成とテーブル設計
HBase活用事例 #hbase_ca
HBase活用事例 #hbase_ca
Apache Impalaパフォーマンスチューニング #dbts2018
Apache Impalaパフォーマンスチューニング #dbts2018
エンタープライズデータハブ活用の落とし穴 2015 08-27
エンタープライズデータハブ活用の落とし穴 2015 08-27
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
MapReduceを置き換えるSpark 〜HadoopとSparkの統合〜 #cwt2015
Spark徹底入門 #cwt2015
Spark徹底入門 #cwt2015
Strata + Hadoop World 2014 レポート #cwt2014
Strata + Hadoop World 2014 レポート #cwt2014
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016
認証/認可が実現する安全で高速分析可能な分析処理基盤
認証/認可が実現する安全で高速分析可能な分析処理基盤
基調講演: 「データエコシステムへの挑戦」 #cwt2015
基調講演: 「データエコシステムへの挑戦」 #cwt2015
CDH5最新情報 #cwt2013
CDH5最新情報 #cwt2013
Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017
データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
「新製品 Kudu 及び RecordServiceの概要」 #cwt2015
マルチテナント化に向けたHadoopの最新セキュリティ事情 #hcj2014
マルチテナント化に向けたHadoopの最新セキュリティ事情 #hcj2014
Destaque
OGH 2015 - Hadoop (Oracle BDA) and Oracle Technologies on BI Projects
OGH 2015 - Hadoop (Oracle BDA) and Oracle Technologies on BI Projects
Mark Rittman
Part 1 - Introduction to Hadoop and Big Data Technologies for Oracle BI & DW ...
Part 1 - Introduction to Hadoop and Big Data Technologies for Oracle BI & DW ...
Mark Rittman
ゼロから始めるSparkSQL徹底活用!
ゼロから始めるSparkSQL徹底活用!
Nagato Kasaki
Apache Hadoop YARN - Enabling Next Generation Data Applications
Apache Hadoop YARN - Enabling Next Generation Data Applications
Hortonworks
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
hamaken
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
hamaken
為替と株の予測の話
為替と株の予測の話
Kentaro Imajo
Big data processing using Hadoop with Cloudera Quickstart
Big data processing using Hadoop with Cloudera Quickstart
IMC Institute
Destaque
(8)
OGH 2015 - Hadoop (Oracle BDA) and Oracle Technologies on BI Projects
OGH 2015 - Hadoop (Oracle BDA) and Oracle Technologies on BI Projects
Part 1 - Introduction to Hadoop and Big Data Technologies for Oracle BI & DW ...
Part 1 - Introduction to Hadoop and Big Data Technologies for Oracle BI & DW ...
ゼロから始めるSparkSQL徹底活用!
ゼロから始めるSparkSQL徹底活用!
Apache Hadoop YARN - Enabling Next Generation Data Applications
Apache Hadoop YARN - Enabling Next Generation Data Applications
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
為替と株の予測の話
為替と株の予測の話
Big data processing using Hadoop with Cloudera Quickstart
Big data processing using Hadoop with Cloudera Quickstart
Semelhante a G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介
Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介
オラクルエンジニア通信
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data Lake
Hideo Takagi
Oracle APEX概要
Oracle APEX概要
Nakakoshi Yuji
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
オラクルエンジニア通信
Spark on sql server?
Spark on sql server?
Oda Shinsuke
Oracle APEXユーザー会の紹介
Oracle APEXユーザー会の紹介
Nakakoshi Yuji
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
NTT DATA OSS Professional Services
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
NTT DATA Technology & Innovation
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
Hideo Takagi
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
NTT DATA Technology & Innovation
作らずに開発! エクセルから生成! さくっとはじめる情報共有と展開(Oracle Cloudウェビナーシリーズ: 2021年2月4日)
作らずに開発! エクセルから生成! さくっとはじめる情報共有と展開(Oracle Cloudウェビナーシリーズ: 2021年2月4日)
オラクルエンジニア通信
Start SQL Server with Docker
Start SQL Server with Docker
Oshitari_kochi
大量のデータ処理や分析に使えるOSS Apache Sparkのご紹介(Open Source Conference 2020 Online/Kyoto ...
大量のデータ処理や分析に使えるOSS Apache Sparkのご紹介(Open Source Conference 2020 Online/Kyoto ...
NTT DATA Technology & Innovation
201312 scalr[oss] installation_idcf
201312 scalr[oss] installation_idcf
IDC Frontier
SCALR OSS版のインストール手順のご紹介 20131204 01
SCALR OSS版のインストール手順のご紹介 20131204 01
Haruhiko KAJIKAWA
Azure Data Platform
Azure Data Platform
Daiyu Hatakeyama
MySQL Cluster7.3 GAリリース記念セミナー! MySQL & NoSQL 圧倒的な進化を続けるMySQLの最新機能!
MySQL Cluster7.3 GAリリース記念セミナー! MySQL & NoSQL 圧倒的な進化を続けるMySQLの最新機能!
yoyamasaki
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...
NTT DATA Technology & Innovation
GraphQLはどんな時に使うか
GraphQLはどんな時に使うか
Yutaka Tachibana
20150131 ChugokuDB-Shimane-MySQL
20150131 ChugokuDB-Shimane-MySQL
Ryusuke Kajiyama
Semelhante a G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
(20)
Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介
Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data Lake
Oracle APEX概要
Oracle APEX概要
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
Spark on sql server?
Spark on sql server?
Oracle APEXユーザー会の紹介
Oracle APEXユーザー会の紹介
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
【ウェブ セミナー】AI / アナリティクスを支えるビッグデータ基盤 Azure Data Lake [概要編]
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
作らずに開発! エクセルから生成! さくっとはじめる情報共有と展開(Oracle Cloudウェビナーシリーズ: 2021年2月4日)
作らずに開発! エクセルから生成! さくっとはじめる情報共有と展開(Oracle Cloudウェビナーシリーズ: 2021年2月4日)
Start SQL Server with Docker
Start SQL Server with Docker
大量のデータ処理や分析に使えるOSS Apache Sparkのご紹介(Open Source Conference 2020 Online/Kyoto ...
大量のデータ処理や分析に使えるOSS Apache Sparkのご紹介(Open Source Conference 2020 Online/Kyoto ...
201312 scalr[oss] installation_idcf
201312 scalr[oss] installation_idcf
SCALR OSS版のインストール手順のご紹介 20131204 01
SCALR OSS版のインストール手順のご紹介 20131204 01
Azure Data Platform
Azure Data Platform
MySQL Cluster7.3 GAリリース記念セミナー! MySQL & NoSQL 圧倒的な進化を続けるMySQLの最新機能!
MySQL Cluster7.3 GAリリース記念セミナー! MySQL & NoSQL 圧倒的な進化を続けるMySQLの最新機能!
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...
GraphQLはどんな時に使うか
GraphQLはどんな時に使うか
20150131 ChugokuDB-Shimane-MySQL
20150131 ChugokuDB-Shimane-MySQL
Mais de Cloudera Japan
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Cloudera Japan
HDFS Supportaiblity Improvements
HDFS Supportaiblity Improvements
Cloudera Japan
分散DB Apache KuduのアーキテクチャDBの性能と一貫性を両立させる仕組み「HybridTime」とは
分散DB Apache KuduのアーキテクチャDBの性能と一貫性を両立させる仕組み「HybridTime」とは
Cloudera Japan
HBase Across the World #LINE_DM
HBase Across the World #LINE_DM
Cloudera Japan
Cloudera のサポートエンジニアリング #supennight
Cloudera のサポートエンジニアリング #supennight
Cloudera Japan
Train, predict, serve: How to go into production your machine learning model
Train, predict, serve: How to go into production your machine learning model
Cloudera Japan
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
Cloudera Japan
先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方
Cloudera Japan
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Cloudera Japan
How to go into production your machine learning models? #CWT2017
How to go into production your machine learning models? #CWT2017
Cloudera Japan
Apache Kudu - Updatable Analytical Storage #rakutentech
Apache Kudu - Updatable Analytical Storage #rakutentech
Cloudera Japan
Hue 4.0 / Hue Meetup Tokyo #huejp
Hue 4.0 / Hue Meetup Tokyo #huejp
Cloudera Japan
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Cloudera Japan
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera Japan
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Cloudera Japan
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
Cloudera Japan
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
Cloudera Japan
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
Cloudera Japan
Mais de Cloudera Japan
(18)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
HDFS Supportaiblity Improvements
HDFS Supportaiblity Improvements
分散DB Apache KuduのアーキテクチャDBの性能と一貫性を両立させる仕組み「HybridTime」とは
分散DB Apache KuduのアーキテクチャDBの性能と一貫性を両立させる仕組み「HybridTime」とは
HBase Across the World #LINE_DM
HBase Across the World #LINE_DM
Cloudera のサポートエンジニアリング #supennight
Cloudera のサポートエンジニアリング #supennight
Train, predict, serve: How to go into production your machine learning model
Train, predict, serve: How to go into production your machine learning model
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
How to go into production your machine learning models? #CWT2017
How to go into production your machine learning models? #CWT2017
Apache Kudu - Updatable Analytical Storage #rakutentech
Apache Kudu - Updatable Analytical Storage #rakutentech
Hue 4.0 / Hue Meetup Tokyo #huejp
Hue 4.0 / Hue Meetup Tokyo #huejp
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
クラウド上でHadoopを構築できる Cloudera Director 2.0 の紹介 #dogenzakalt
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
PCIコンプライアンスに向けたビジネス指針〜MasterCardの事例〜 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
基調講演:「ビッグデータのセキュリティとガバナンス要件」 #cwt2015
Último
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
Último
(9)
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
1.
1© Cloudera, Inc.
All rights reserved. G-Tech 2015 Hadoop/Sparkを中核とした ビッグデータ基盤 エンジニアが知っておくべき最新動向 2015/10/16 Cloudera株式会社 川崎 達夫
2.
2© Cloudera, Inc.
All rights reserved. 自己紹介 • テクニカルディレクター / トレーニングマネージャー 兼 シニアインストラクター • email: kawasaki@cloudera.com • twitter: @kernel023
3.
3© Cloudera, Inc.
All rights reserved. 現代の世界では ますます計測されるように なっている
4.
4© Cloudera, Inc.
All rights reserved. データは どこにでもある
5.
5© Cloudera, Inc.
All rights reserved. データは私達の働き方を変える 測定できるものは測定される ようになる 従業員と顧客はより個別の関 係を期待するようになる一方、 プライバシーの保護を願う 最も革新的な企業は実験と迅 速性を重視する インストゥルメンテーション コンシューマライゼーション エクスペリメンテーション
6.
6© Cloudera, Inc.
All rights reserved. ビッグデータ ビガーデータ
7.
7© Cloudera, Inc.
All rights reserved. データはムーアの法則よりも早く成長する
8.
8© Cloudera, Inc.
All rights reserved. 後がない従来のアーキテクチャー データをコモディティとして扱えない専用システムに莫大な投資 データ ソース データ システム データ アクセス 業務分析 カスタム アプリケーショ ン 既存 データ データ ベース 定型業務 アプリケーション 新規データ 得られる知見は限定的 データに奮闘するパワーユーザー。 多くのユーザーには何のデータも 与えられない。 コンプライアンスとプライバ シー 大量なデータと多数のユーザー、乱立 したツールが複雑さを増長。 セキュリティやガバナンスとビジネス アジリティのバランスを取る必要。 限定的なデータ 新しいデータソースには対処するも、 既存テータの保守は非効率的。 既存システムのデータを分析用に変換 するために膨大な時間を要する。
9.
9© Cloudera, Inc.
All rights reserved. データを扱う エンジニアに 必要なスキルとは?
10.
10© Cloudera, Inc.
All rights reserved. Apache Hadoop スケーラブルなオープンソースの分散システム
11.
11© Cloudera, Inc.
All rights reserved. Apache Hadoop™ • Googleが公開した論文を参考に開発された 大量データのためのオープンソースソフトウェア Doug Cutting Chief Architect @Cloudera
12.
12© Cloudera, Inc.
All rights reserved. Hadoopのアーキテクチャ HDFS MapReduce
13.
13© Cloudera, Inc.
All rights reserved. HDFS:分散ファイルシステム • データファイルはロード時に128MBのブロックに分割されて分散され る • 各ブロックは複数のデータノードに複製される(デフォルトは3カ所) Name Node Block 1 Block 2 Block 3 Block 1 Block 3 Block 2 Block 3 Block 1 Block 3 Block 1Block 2 Block 2 メタデータ: ファイルとブ ロックについ ての情報 非常に大 きなデー タファイ ル Block 4 Block 4 Block 4 Block 4
14.
14© Cloudera, Inc.
All rights reserved. MapReduceの主な利点: • データの局所性: 自動的に計算処理を分けてMapperを適切に開始 • フォールトトレランス: 中間結果を書き出してMapperが再実行できることが、コモディティ ハードウェアで実行できる機能を意味している • 線形なスケーラビリティ:問題に対して一般的に拡張できる解決を記述するために、開発者に 局所性とプログラミングモデルの組み合わせ強要する MapReduce:分散処理 Ma p Ma p Ma p Ma p Ma p Ma p Ma p Ma p Ma p Ma p Ma p Ma p Reduce Reduc e Reduce Reduc e
15.
15© Cloudera, Inc.
All rights reserved. 現在: Hadoopを中心とした巨大なエコシステム Director Provision Automate Elastic API Navigator Secure Policy Lineage API Manager Deploy Configure Report Recover Manage Monitor Diagnose Integrate CDH (Cloudera Distribution for Apache Hadoop) Spark Hue Flume Sentry MLlib Hive Kafka Map Reduce Impala Sqoop Oozie Zookeeper Solr Pig Llama YARN Kudu Crunch Avro Record Service HBase Kite Parquet HDFS Training Partners Services Enterprise Availability GABetaFlex
16.
16© Cloudera, Inc.
All rights reserved. (余談)Hadoop活用の落とし穴 •Hadoopを安定して継続運用するためのヒン ト •「エンタープライズデータハブ活用の落とし穴」 http://www.slideshare.net/Cloudera_jp/2015-0827
17.
17© Cloudera, Inc.
All rights reserved. Hadoop/Sparkの最新動向
18.
18© Cloudera, Inc.
All rights reserved. (再)初期のHadoopのアーキテクチャ HDFS MapReduce
19.
19© Cloudera, Inc.
All rights reserved. バッチから リアルタイムへ
20.
20© Cloudera, Inc.
All rights reserved. Streaming、NRT処理との組み合わせ http://blog.cloudera.com/blog/2015/07/designing-fraud-detection-architecture- that-works-like-your-brain-does/
21.
21© Cloudera, Inc.
All rights reserved. Streaming、NRT処理との組み合わせ
22.
22© Cloudera, Inc.
All rights reserved. Apache Spark
23.
23© Cloudera, Inc.
All rights reserved. Apache Spark Hadoopのための柔軟性のあるインメモリデータ処理 容易な デプロイメント 柔軟、拡張性の あるAPI 高速なバッチと ストリーミング処理 • Scala、Java、Python によるリッチなAPI • 対話的なシェル • 異なる種類のワーク ロードのためのAPI: • バッチ • ストリーミング • 機械学習 • グラフ • インメモリ処理と キャッシュ
24.
24© Cloudera, Inc.
All rights reserved. 容易な開発 高い生産性を持つ言語をサポート • 同一のAPIで複数の言語をネ イティブにサポート • Scala, Java, Python • コードを最小化するために、 クロージャ、繰り返し、そ の他の言語の概念を使用 • MapReduceと比較して2- 5倍コードを削減 Python lines = sc.textFile(...) lines.filter(lambda s: “ERROR” in s).count() Scala val lines = sc.textFile(...) lines.filter(s => s.contains(“ERROR”)).count() Java JavaRDD<String> lines = sc.textFile(...); lines.filter(new Function<String, Boolean>() { Boolean call(String s) { return s.contains(“error”); } }).count();
25.
25© Cloudera, Inc.
All rights reserved. 容易な開発 対話的に使用できる • データサイエンティストの ためのインタラクティブな データ探索 • 「アプリケーション」を 開発する必要がない • 開発者は実際のシステムで アプリケーションのプロト タイピングができる percolateur:spark srowen$ ./bin/spark-shell --master local[*] ... Welcome to ____ __ / __/__ ___ _____/ /__ _ / _ / _ `/ __/ '_/ /___/ .__/_,_/_/ /_/_ version 1.5.0-SNAPSHOT /_/ Using Scala version 2.10.4 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_51) Type in expressions to have them evaluated. Type :help for more information. ... scala> val words = sc.textFile("file:/usr/share/dict/words") ... words: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[1] at textFile at <console>:21 scala> words.count ... res0: Long = 235886 scala>
26.
26© Cloudera, Inc.
All rights reserved. 優れたパフォーマンスのためのメモリ管理 トレンド: • 18ヶ月ごとに価格が半分になる • 3年ごとに帯域が倍になる 64-128GB RAM 16 cores 50 GB per second メモリは高性能なビッグデータアプリケーションを可能にする
27.
27© Cloudera, Inc.
All rights reserved. Sparkはメモリの利点を活かす 耐障害性分散データセット: Resilient Distributed Datasets (RDD) • 分散されたフォールトトレランスなキャッシュにデータを保存するメモリ キャッシング層 • データセットがメモリ領域より大きい場合はディスクに戻すことができる • 安定したストレージにあるデータに対する並列変換処理によって生成 • 「リネージ」のコンセプトを通してフォールトトレランスを提供
28.
28© Cloudera, Inc.
All rights reserved. 高速な処理 メモリ、グラフ演算を使用する インメモリキャッシュ • データのパーティションは ディスクの代わりにメモリか ら読み込む グラフ演算 • スケジューリングの最適化 • フォールトトレランス join filter groupBy B: B: C: D: E: F: Ç √ Ω map A: map take = cached partition= RDD
29.
29© Cloudera, Inc.
All rights reserved. ロジスティック回帰のパフォーマンス (データがメモリに乗っている) 0 1000 2000 3000 4000 1 5 10 20 30 実行時間(秒) 繰り返し回数 MapReduce Spark 110秒/繰り返し 最初の繰り返し=80秒 以降の繰り返しは キャッシュにより1秒
30.
30© Cloudera, Inc.
All rights reserved. Hadoopでの将来のデータ処理 特別な目的のエンジンによりSparkを補完する Sparkによる汎用データ処理 高速バッチ処理 機械学習 ストリーム処理 Impalaによる 分析データベース 低レイテンシ・超平行クエリ Solrによるテキスト検索 テキストデータに対するクエリ MapReduceによるディス クでのデータ処理 ディスクIOに強く依存したジョブの大規模ス ケールでの実行 共有: • データスト レージ • メタデータ • リソース管理 • 運用監視 • セキュリティ • ガバナンス
31.
31© Cloudera, Inc.
All rights reserved. Spark Streaming Spark Streamingとは? • SparkのコアAPIを用いてデータの「連続 した」処理を実行 • Sparkのコンセプトをフォールトトレラ ントで変換可能なストリームに拡張 • 「ローリングウィンドウ」操作を追加 • 例: 直近5分間のデータをローリングし ながら平均やカウントを計算 利点 • 両方のコンテキストの知見とコードを再利 用 • ストリーミングとバッチに対し同じプログ ラミングのパラダイムを適用 • 容易な開発 • 自動的なDAGの生成と高レベルなAPI • 優れたスループット • 簡単にスケールするので大量のデータ取込 みに対応可能 • MLlibとOryxのような要素をストリーミン グアプリケーションに組み合わせることが できる 一般的なユースケース • データがHadoop/HDFSに取り込まれた ときの「オンザフライ」のETL • 異常な振る舞いの検知と警告をトリガ • 入ってくるデータのメトリクスの概要を 連続してレポート
32.
32© Cloudera, Inc.
All rights reserved. Spark Streaming のアーキテクチャ データソース 取込み 取込み レイヤ • Flume • Kafka Spark Stream 処理 データ 準備 集約/ スコアリング HDFS Spark 長期間分析/ モデル構築 HBase リアルタイム 結果提供
33.
33© Cloudera, Inc.
All rights reserved. SparkSQL 機械学習アプリケーション • 目標 • Spark/Javaの開発者とデータサイ エンティストがSparkアプリにイン ラインでSQLを記述できる • 設計目的 • Spark開発者のための開発支援 • Sparkジョブはそれほど平行実行さ れない • 強み • SQLをJavaやScalaアプリケーショ ンに容易に組み込み可能になる • 開発フローの一般的な機能のための SQL (例. 集約、フィルタ、サンプ リング)
34.
34© Cloudera, Inc.
All rights reserved. Impalaは未だにインタラクティブなSQLのため のツールの選択肢 0 50 100 150 200 250 300 350 Impala Spark SQL Presto Hive-on-Tez Time(inseconds) Single User vs 10 User Response Time/Impala Times Faster (Lower bars = better)SingleUser,5 10Users,11 SingleUser,25 10Users,120 10Users,302 10Users,202 SingleUser,37 SingleUser,77 5.0 x 10.6x 7.4x 27.4x 15.4x 18.3x
35.
35© Cloudera, Inc.
All rights reserved. Spark エコシステムと Hadoop Spark Streaming MLlib SparkSQL GraphX Data- frames SparkR ストレージ HDFS, HBase リソース管理 YARN Spark Impala MR OthersSearch
36.
36© Cloudera, Inc.
All rights reserved. ClouderaはSparkの変化を導く 2013 2014 2015 2016 Sparkの初期の可 能性を認識 CDH4.4に Sparkを同 梱してサ ポート Spark on YARN 連携を追加 Sparkを標準実行エンジ ンにすることへの方向 性を発表 最初のSpark トレーニング を開始 セキュリティ 連携を追加 Clouderaのエンジニア がオライリーのSpark 書籍を執筆 より良いパフォー マンス、ユーザビ リティ、エンター プライズレディの ための努力を継続 していく
37.
42© Cloudera, Inc.
All rights reserved. Apache Kafka
38.
43© Cloudera, Inc.
All rights reserved. Apache Kafka 2009 2014
39.
44© Cloudera, Inc.
All rights reserved. Kafkaの導入で単純化 2014 2015+?
40.
45© Cloudera, Inc.
All rights reserved. ユーザーインタフェース
41.
46© Cloudera, Inc.
All rights reserved. Hue : Hadoop用の標準GUI
42.
47© Cloudera, Inc.
All rights reserved. Cloudera Manager: 運用管理ツール 管理 クラスタの構築、設定、最適化が簡単 1 監視 全てのアクティビティに対する集権的なビュー 2 診断 簡単に問題を特定し解決する 3 統合 既存のツールを使う 4
43.
48© Cloudera, Inc.
All rights reserved. Security
44.
49© Cloudera, Inc.
All rights reserved. 認証 システム、データ、 関連システムに対する アクセス管理 LDAP Kerberos RPC 監査 すべての処理に 対する改ざん不能な 記録を取得 Cloudera Navigator SIEM Tools 認可 誰がどのリソースや サービスにアクセス できるかを制御 POSIX Permissions Apache Sentry 保護 保存データや 実行データに対する、 暗号化とキー管理 Cloudera Navigator: Encrypt & Key Trustee エンタープライズ・グレードのセキュリティ あらゆる保存データと実行データに対するアクセスと管理を統制 ビッグデータの根幹を支える Cloudera Enterprise ネイティブな 機能 • Cloudera Manager および Navigator が Hadoop や関連する製品のプロテク ションを自動化 • 境界ベースのセキュリティ • ロールベースのアクセスコントロール • センシティブなデータに対して ポリシーベースの管理が唯一可能 • データ系統とディスカバリー
45.
50© Cloudera, Inc.
All rights reserved. 市場リスク Basel III: 市場ストレス、 ボラリティティ、金利変化に 対応できる自己資本規制 Apache Spark Impala 電子記録 WORM: 削除や変更する ことなくすべての レコードを保全 Apache HBase Cloudera Search 取引報告 OATS: すべての注文、見積、 取引に関する 取引記録報告 MapReduce, Spark, HBase, Impala データセキュリティ PCI DSS: クレジットカード 所有者の個人情報や 取引情報を保護 Cloudera Navigator: Encrypt & Key Trustee 完全な規制対応 データに忠実な集中管理とレポーティング エンタープライズハブが、リスク管 理、 不正検知、データの保全、取引に 対するセキュリティコンプライアン ス を可能に • ETL、リンケージ、分析機能、レポーティ ング機能、ストレージの統合 • セキュリティのための特定システムに 必要なコストを相殺 • 必要なデータを集中させ、利用度を向上 • スピードを向上しコンプライアンス報告 の手間を軽減
46.
51© Cloudera, Inc.
All rights reserved. ビッグデータがデータガバナンスを満たす Cloudera Navigator Apache Hadoop用のネイティブ なエンドツーエンドのデータガバ ナンスソリューションにより、 リスクを最小化しコンプライアン スを維持 ユニークな機能: • 監査 • 系統(リネージ) • メタデータのタグ付けと探索 • ライフサイクル管理
47.
52© Cloudera, Inc.
All rights reserved. エンタープライズ・グレードのセキュリティと規制 に対応 Cloudera Enterprise で PCI DSS 要件に対応 PCI 要件 詳細 Apache Sentry Kerberos Cloudera Navigator Cloudera Manager Cloudera CSE カスタマー 脆弱性を管理する プログラムの整備 カード会員データを保護するためにファイアウォールを導入し、最適な設 定を維持すること ✔ システムパスワードと他のセキュリティ・パラメータにベンダー提供のデ フォルトを使用しないこと ✔ カード会員データの保護 保存されたカード会員データを安全に保護すること ✔ 公衆ネットワーク上でカード会員データを送信する場合、暗号化すること ✔ 脆弱性を管理する プログラムの整備 アンチウィルス・ソフトウェアを利用し、定期的に更新すること ✔ 安全性の高いシステムとアプリケーションを開発し、保守すること ✔ 強固なアクセス制御手法の 導入 カード会員データへのアクセスを業務上の必要範囲内に制限すること ✔ コンピュータにアクセスする利用者毎に個別のID を割り当てること ✔ カード会員データへの物理的アクセスを制限すること ✔ 定期的なネットワークの監視 およびテスト ネットワーク資源およびカード会員データに対するすべてのアクセスを追 跡し、監視すること ✔ セキュリティ・システムおよび管理手順を定期的にテストすること ✔ 情報セキュリティ・ポリシー の整備 情報セキュリティに関するポリシーを整備すること ✔
48.
53© Cloudera, Inc.
All rights reserved. 最新のHadoopエコシステム 2015/9開催のStrata + Hadoop Worldより
49.
54© Cloudera, Inc.
All rights reserved. Kudu: Hadoopの新しいストレージオプション Structured Fixed Column Data SQL + Scan Use Cases Unstructured Data Deep Storage Scan Use Cases Structured Fixed Column Data SQL + Scan Use Cases Any Type of Column Schemas Gets / Puts / Micro Scans
50.
55© Cloudera, Inc.
All rights reserved. RecordService:横断的な新セキュリティ層
51.
56© Cloudera, Inc.
All rights reserved. トレーニング
52.
57© Cloudera, Inc.
All rights reserved. 業界をリードするClouderaのトレーニング #1 カリキュラム 開発者向け、管理者向け、アナ リスト向け、Spark、データサイエンティスト 向けコースなどを含む広範囲なトレーニング #1 経験 2009年から数えて45,000人の生徒が受 講し、5,000人のCloudera認定プロフェッショ ナルが誕生 #1 柔軟性 オンサイトあるいはパブリック、世界 主要各都市で実施
53.
58© Cloudera, Inc.
All rights reserved. ClouderaのSpark関連トレーニング • Cloudera Apache Spark 開発者向けトレーニング • Cloudera Spark & Hadoop 開発者向けトレーニング I (New) http://cloudera.co.jp/university
54.
66© Cloudera, Inc.
All rights reserved. まとめ
55.
67© Cloudera, Inc.
All rights reserved. ビッグデータに関わるエンジニアが知っておく べきこと 活用の前に正しい知識を習得する ・Hadoop/Sparkはデータに関わるエンジニアにとって必要なスキル ・トレーニングは短期間で正しい知識を得るために有効 新しいエコシステムへの対応、運用の効率化、セキュリティを考慮する ・Cloudera Managerなどの管理ツールが効果的 継続的な変化への対応と事業継続性を忘れずに ・システムは継続的に変化する ・非汎用的なツールは将来の変化に耐えられず、負担になる ・人に依存しすぎない体制
56.
68© Cloudera, Inc.
All rights reserved. Cloudera World Tokyo 2015 http://clouderaworld.tokyo
57.
69© Cloudera, Inc.
All rights reserved. Clouderaに入って人々を助け、 世界で最も大きな問題の解決に 乗り出しましょう! 日本チームでの募集職種 • 営業 • セールスエンジニア career-jp@cloudera.com We are Hiring!
58.
70© Cloudera, Inc.
All rights reserved. Thank you! kawasaki@cloudera.com
Baixar agora