Enviar pesquisa
Carregar
20111215_第1回EMR勉強会発表資料
•
Transferir como PPTX, PDF
•
5 gostaram
•
2,536 visualizações
Kotaro Tsukui
Seguir
2011/12/15にお台場にて行われた第1回EMR勉強会で発表した資料です。
Leia menos
Leia mais
Tecnologia
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 20
Baixar agora
Recomendados
ソーシャルゲームのEMR活用事例
ソーシャルゲームのEMR活用事例
知教 本間
AWS Elastic MapReduce詳細 -ほぼ週刊AWSマイスターシリーズ第10回-
AWS Elastic MapReduce詳細 -ほぼ週刊AWSマイスターシリーズ第10回-
SORACOM, INC
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips
yuichi_komatsu
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Shinpei Ohtani
AWS Black Belt Techシリーズ Amazon EMR
AWS Black Belt Techシリーズ Amazon EMR
Amazon Web Services Japan
AWS Black Belt Tech シリーズ 2015 - Amazon Elastic MapReduce
AWS Black Belt Tech シリーズ 2015 - Amazon Elastic MapReduce
Amazon Web Services Japan
Apache Hive 紹介
Apache Hive 紹介
あしたのオープンソース研究所
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Noritaka Sekiyama
Recomendados
ソーシャルゲームのEMR活用事例
ソーシャルゲームのEMR活用事例
知教 本間
AWS Elastic MapReduce詳細 -ほぼ週刊AWSマイスターシリーズ第10回-
AWS Elastic MapReduce詳細 -ほぼ週刊AWSマイスターシリーズ第10回-
SORACOM, INC
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips
yuichi_komatsu
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Shinpei Ohtani
AWS Black Belt Techシリーズ Amazon EMR
AWS Black Belt Techシリーズ Amazon EMR
Amazon Web Services Japan
AWS Black Belt Tech シリーズ 2015 - Amazon Elastic MapReduce
AWS Black Belt Tech シリーズ 2015 - Amazon Elastic MapReduce
Amazon Web Services Japan
Apache Hive 紹介
Apache Hive 紹介
あしたのオープンソース研究所
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Noritaka Sekiyama
Amazon Elastic MapReduce with Hive/Presto ハンズオン(講義)
Amazon Elastic MapReduce with Hive/Presto ハンズオン(講義)
Amazon Web Services Japan
Amazon Athena で実現する データ分析の広がり
Amazon Athena で実現する データ分析の広がり
Amazon Web Services Japan
20111130 10 aws-meister-emr_long-public
20111130 10 aws-meister-emr_long-public
Amazon Web Services Japan
Sparkストリーミング検証
Sparkストリーミング検証
BrainPad Inc.
Tez on EMRを試してみた
Tez on EMRを試してみた
Satoshi Noto
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
Hadoop / Spark Conference Japan
NetflixにおけるPresto/Spark活用事例
NetflixにおけるPresto/Spark活用事例
Amazon Web Services Japan
Run Spark on EMRってどんな仕組みになってるの?
Run Spark on EMRってどんな仕組みになってるの?
Satoshi Noto
NoSQL on AWSで作る最新ソーシャルゲームアーキテクチャ
NoSQL on AWSで作る最新ソーシャルゲームアーキテクチャ
Yasuhiro Matsuo
Sparkパフォーマンス検証
Sparkパフォーマンス検証
BrainPad Inc.
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
Future Of Data Japan
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
Akira Shimosako
[DI06] 並列分散処理の考え方とオープンソース分散処理系の動向
[DI06] 並列分散処理の考え方とオープンソース分散処理系の動向
de:code 2017
HiveとImpalaのおいしいとこ取り
HiveとImpalaのおいしいとこ取り
Yukinori Suda
Apache Sparkについて
Apache Sparkについて
BrainPad Inc.
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
Amazon Web Services Japan
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
YusukeKuramata
Aurora
Aurora
maruyama097
はじめてのAmazon RDS for PostgreSQL
はじめてのAmazon RDS for PostgreSQL
Junpei Nakada
2017年1月のAWSサービスアップデートまとめ
2017年1月のAWSサービスアップデートまとめ
Amazon Web Services Japan
クックパッドでのemr利用事例
クックパッドでのemr利用事例
Tatsuya Sasaki
JAWSDAYS 2014 ACEに聞け! EMR編
JAWSDAYS 2014 ACEに聞け! EMR編
陽平 山口
Mais conteúdo relacionado
Mais procurados
Amazon Elastic MapReduce with Hive/Presto ハンズオン(講義)
Amazon Elastic MapReduce with Hive/Presto ハンズオン(講義)
Amazon Web Services Japan
Amazon Athena で実現する データ分析の広がり
Amazon Athena で実現する データ分析の広がり
Amazon Web Services Japan
20111130 10 aws-meister-emr_long-public
20111130 10 aws-meister-emr_long-public
Amazon Web Services Japan
Sparkストリーミング検証
Sparkストリーミング検証
BrainPad Inc.
Tez on EMRを試してみた
Tez on EMRを試してみた
Satoshi Noto
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
Hadoop / Spark Conference Japan
NetflixにおけるPresto/Spark活用事例
NetflixにおけるPresto/Spark活用事例
Amazon Web Services Japan
Run Spark on EMRってどんな仕組みになってるの?
Run Spark on EMRってどんな仕組みになってるの?
Satoshi Noto
NoSQL on AWSで作る最新ソーシャルゲームアーキテクチャ
NoSQL on AWSで作る最新ソーシャルゲームアーキテクチャ
Yasuhiro Matsuo
Sparkパフォーマンス検証
Sparkパフォーマンス検証
BrainPad Inc.
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
Future Of Data Japan
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
Akira Shimosako
[DI06] 並列分散処理の考え方とオープンソース分散処理系の動向
[DI06] 並列分散処理の考え方とオープンソース分散処理系の動向
de:code 2017
HiveとImpalaのおいしいとこ取り
HiveとImpalaのおいしいとこ取り
Yukinori Suda
Apache Sparkについて
Apache Sparkについて
BrainPad Inc.
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
Amazon Web Services Japan
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
YusukeKuramata
Aurora
Aurora
maruyama097
はじめてのAmazon RDS for PostgreSQL
はじめてのAmazon RDS for PostgreSQL
Junpei Nakada
2017年1月のAWSサービスアップデートまとめ
2017年1月のAWSサービスアップデートまとめ
Amazon Web Services Japan
Mais procurados
(20)
Amazon Elastic MapReduce with Hive/Presto ハンズオン(講義)
Amazon Elastic MapReduce with Hive/Presto ハンズオン(講義)
Amazon Athena で実現する データ分析の広がり
Amazon Athena で実現する データ分析の広がり
20111130 10 aws-meister-emr_long-public
20111130 10 aws-meister-emr_long-public
Sparkストリーミング検証
Sparkストリーミング検証
Tez on EMRを試してみた
Tez on EMRを試してみた
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
MapReduce/Spark/Tezのフェアな性能比較に向けて (Cloudera World Tokyo 2014 LT講演)
NetflixにおけるPresto/Spark活用事例
NetflixにおけるPresto/Spark活用事例
Run Spark on EMRってどんな仕組みになってるの?
Run Spark on EMRってどんな仕組みになってるの?
NoSQL on AWSで作る最新ソーシャルゲームアーキテクチャ
NoSQL on AWSで作る最新ソーシャルゲームアーキテクチャ
Sparkパフォーマンス検証
Sparkパフォーマンス検証
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
Spark Streamingを活用したシステムの検証結果と設計時のノウハウ
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
[DI06] 並列分散処理の考え方とオープンソース分散処理系の動向
[DI06] 並列分散処理の考え方とオープンソース分散処理系の動向
HiveとImpalaのおいしいとこ取り
HiveとImpalaのおいしいとこ取り
Apache Sparkについて
Apache Sparkについて
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
Aurora
Aurora
はじめてのAmazon RDS for PostgreSQL
はじめてのAmazon RDS for PostgreSQL
2017年1月のAWSサービスアップデートまとめ
2017年1月のAWSサービスアップデートまとめ
Destaque
クックパッドでのemr利用事例
クックパッドでのemr利用事例
Tatsuya Sasaki
JAWSDAYS 2014 ACEに聞け! EMR編
JAWSDAYS 2014 ACEに聞け! EMR編
陽平 山口
Tasques escoles 25 febrer (2)
Tasques escoles 25 febrer (2)
epsasocial1
Groongaでのタグ検索と表記揺れとの戦い
Groongaでのタグ検索と表記揺れとの戦い
Naoya Murakami
MySQLユーザ視点での小さく始めるElasticsearch
MySQLユーザ視点での小さく始めるElasticsearch
Kentaro Yoshida
ソーシャルアプリにおけるRedisの活用事例とトラブル事例
ソーシャルアプリにおけるRedisの活用事例とトラブル事例
leverages_event
[AWSマイスターシリーズ] Amazon Elastic MapReduce (EMR)
[AWSマイスターシリーズ] Amazon Elastic MapReduce (EMR)
Amazon Web Services Japan
Redis勉強会資料(2015/06 update)
Redis勉強会資料(2015/06 update)
Yuji Otani
MapReduce入門
MapReduce入門
Satoshi Noto
SparkやBigQueryなどを用いたモバイルゲーム分析環境
SparkやBigQueryなどを用いたモバイルゲーム分析環境
yuichi_komatsu
Going Serverless, Building Applications with No Servers
Going Serverless, Building Applications with No Servers
Keisuke Nishitani
Awsで作るビッグデータ解析今とこれから
Awsで作るビッグデータ解析今とこれから
Shohei Kobayashi
Business Innovation cases driven by AI and BigData technologies
Business Innovation cases driven by AI and BigData technologies
DataWorks Summit/Hadoop Summit
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
Yahoo!デベロッパーネットワーク
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16
Yifeng Jiang
Case Study: OLAP usability on Spark and Hadoop
Case Study: OLAP usability on Spark and Hadoop
DataWorks Summit/Hadoop Summit
SEGA : Growth hacking by Spark ML for Mobile games
SEGA : Growth hacking by Spark ML for Mobile games
DataWorks Summit/Hadoop Summit
AWS Black Belt Techシリーズ AWS Data Pipeline
AWS Black Belt Techシリーズ AWS Data Pipeline
Amazon Web Services Japan
Hadoop’s Impact on Recruit Company
Hadoop’s Impact on Recruit Company
Recruit Technologies
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
cyberagent
Destaque
(20)
クックパッドでのemr利用事例
クックパッドでのemr利用事例
JAWSDAYS 2014 ACEに聞け! EMR編
JAWSDAYS 2014 ACEに聞け! EMR編
Tasques escoles 25 febrer (2)
Tasques escoles 25 febrer (2)
Groongaでのタグ検索と表記揺れとの戦い
Groongaでのタグ検索と表記揺れとの戦い
MySQLユーザ視点での小さく始めるElasticsearch
MySQLユーザ視点での小さく始めるElasticsearch
ソーシャルアプリにおけるRedisの活用事例とトラブル事例
ソーシャルアプリにおけるRedisの活用事例とトラブル事例
[AWSマイスターシリーズ] Amazon Elastic MapReduce (EMR)
[AWSマイスターシリーズ] Amazon Elastic MapReduce (EMR)
Redis勉強会資料(2015/06 update)
Redis勉強会資料(2015/06 update)
MapReduce入門
MapReduce入門
SparkやBigQueryなどを用いたモバイルゲーム分析環境
SparkやBigQueryなどを用いたモバイルゲーム分析環境
Going Serverless, Building Applications with No Servers
Going Serverless, Building Applications with No Servers
Awsで作るビッグデータ解析今とこれから
Awsで作るビッグデータ解析今とこれから
Business Innovation cases driven by AI and BigData technologies
Business Innovation cases driven by AI and BigData technologies
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16
Case Study: OLAP usability on Spark and Hadoop
Case Study: OLAP usability on Spark and Hadoop
SEGA : Growth hacking by Spark ML for Mobile games
SEGA : Growth hacking by Spark ML for Mobile games
AWS Black Belt Techシリーズ AWS Data Pipeline
AWS Black Belt Techシリーズ AWS Data Pipeline
Hadoop’s Impact on Recruit Company
Hadoop’s Impact on Recruit Company
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
Semelhante a 20111215_第1回EMR勉強会発表資料
[JAWSBigData#11]Cloudera on AWSと Amazon EMRを両方本番運用し 3つの観点から比較してみる
[JAWSBigData#11]Cloudera on AWSと Amazon EMRを両方本番運用し 3つの観点から比較してみる
Takahiro Moteki
PHP on Cloud
PHP on Cloud
Akio Katayama
20120303 _JAWS-UG_SUMMIT2012_エキスパートセッションEMR編
20120303 _JAWS-UG_SUMMIT2012_エキスパートセッションEMR編
Kotaro Tsukui
AWSを用いた耐障害性の高いアプリケーションの設計
AWSを用いた耐障害性の高いアプリケーションの設計
SORACOM, INC
OpsWorks aws-cli#11
OpsWorks aws-cli#11
Yuta Shimada
Eight meets AWS
Eight meets AWS
Tetsuya Mase
20120123 aws meister-reloaded-ec2&ebs-public
20120123 aws meister-reloaded-ec2&ebs-public
Amazon Web Services Japan
20130309 windows on aws handson
20130309 windows on aws handson
Genta Watanabe
Jenkinsとhadoopを利用した継続的データ解析環境の構築
Jenkinsとhadoopを利用した継続的データ解析環境の構築
VOYAGE GROUP
Splunkと各種ツールによるAWSの管理
Splunkと各種ツールによるAWSの管理
kinunori
Aws elastic beanstalk-handson-summit2012
Aws elastic beanstalk-handson-summit2012
Akio Katayama
AWSマイスターシリーズReloaded(AWS Beanstalk)
AWSマイスターシリーズReloaded(AWS Beanstalk)
Akio Katayama
20120416 aws meister-reloaded-aws-elasticbeanstalk-public
20120416 aws meister-reloaded-aws-elasticbeanstalk-public
Amazon Web Services Japan
クラウドサービスAmazon EC2を活用した「SKIPaaS」構築事例
クラウドサービスAmazon EC2を活用した「SKIPaaS」構築事例
Yuuki Namikawa
[A31]AWS上でOracleを利用するためのはじめの一歩!by Masatoshi Yoshida
[A31]AWS上でOracleを利用するためのはじめの一歩!by Masatoshi Yoshida
Insight Technology, Inc.
Jenkinsとhadoopを利用した継続的データ解析環境の構築
Jenkinsとhadoopを利用した継続的データ解析環境の構築
Kenta Suzuki
[AWSマイスターシリーズ] AWS Elastic Beanstalk -Python編-
[AWSマイスターシリーズ] AWS Elastic Beanstalk -Python編-
Amazon Web Services Japan
AWSを用いたWebホスティング
AWSを用いたWebホスティング
SORACOM, INC
sbc_rc_200_RealtimeCompute_handson_ver1.0
sbc_rc_200_RealtimeCompute_handson_ver1.0
洋 謝
Elastic beanstalk
Elastic beanstalk
Akio Katayama
Semelhante a 20111215_第1回EMR勉強会発表資料
(20)
[JAWSBigData#11]Cloudera on AWSと Amazon EMRを両方本番運用し 3つの観点から比較してみる
[JAWSBigData#11]Cloudera on AWSと Amazon EMRを両方本番運用し 3つの観点から比較してみる
PHP on Cloud
PHP on Cloud
20120303 _JAWS-UG_SUMMIT2012_エキスパートセッションEMR編
20120303 _JAWS-UG_SUMMIT2012_エキスパートセッションEMR編
AWSを用いた耐障害性の高いアプリケーションの設計
AWSを用いた耐障害性の高いアプリケーションの設計
OpsWorks aws-cli#11
OpsWorks aws-cli#11
Eight meets AWS
Eight meets AWS
20120123 aws meister-reloaded-ec2&ebs-public
20120123 aws meister-reloaded-ec2&ebs-public
20130309 windows on aws handson
20130309 windows on aws handson
Jenkinsとhadoopを利用した継続的データ解析環境の構築
Jenkinsとhadoopを利用した継続的データ解析環境の構築
Splunkと各種ツールによるAWSの管理
Splunkと各種ツールによるAWSの管理
Aws elastic beanstalk-handson-summit2012
Aws elastic beanstalk-handson-summit2012
AWSマイスターシリーズReloaded(AWS Beanstalk)
AWSマイスターシリーズReloaded(AWS Beanstalk)
20120416 aws meister-reloaded-aws-elasticbeanstalk-public
20120416 aws meister-reloaded-aws-elasticbeanstalk-public
クラウドサービスAmazon EC2を活用した「SKIPaaS」構築事例
クラウドサービスAmazon EC2を活用した「SKIPaaS」構築事例
[A31]AWS上でOracleを利用するためのはじめの一歩!by Masatoshi Yoshida
[A31]AWS上でOracleを利用するためのはじめの一歩!by Masatoshi Yoshida
Jenkinsとhadoopを利用した継続的データ解析環境の構築
Jenkinsとhadoopを利用した継続的データ解析環境の構築
[AWSマイスターシリーズ] AWS Elastic Beanstalk -Python編-
[AWSマイスターシリーズ] AWS Elastic Beanstalk -Python編-
AWSを用いたWebホスティング
AWSを用いたWebホスティング
sbc_rc_200_RealtimeCompute_handson_ver1.0
sbc_rc_200_RealtimeCompute_handson_ver1.0
Elastic beanstalk
Elastic beanstalk
Último
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
Último
(8)
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
20111215_第1回EMR勉強会発表資料
1.
EMR勉強会発表資料
アクセスログ解析システム構築事例 インフラ設計編/アプリ設計編 2011/12/15 ヴェルク株式会社 津久井 浩太郎 石田 智志 Copyright ©2011 by Velc, Inc. Japan
2.
Agenda インフラ設計編
(by 津久井) • EMRを利用したシステム構成例 • Hadoop/EMRのインフラ設計のポイント アプリ設計編 (by 石田) • Hiveについて • アプリケーション実装事例 Copyright ©2011 by Velc, Inc. Japan
3.
インフラ設計編 Copyright ©2011 by
Velc, Inc. Japan
4.
自己紹介
津久井浩太郎 (@quarterkota) •ITコンサル(4年半) → ITベンチャー(2年) → 起業(昨年末) •もともとは基幹系を中心としたインフラ畑出身 •現在はPMや営業や事業企画等の何でも屋状態 •好きなAWSのサービスはRDS •最近はまってるサービスはVPC •スキーとダイビングが好き Copyright ©2011 by Velc, Inc. Japan
5.
EMRを利用したシステム構成例
ログ計測 集計管理(UI・EMR制御) ELB/EC2 ELB/EC2/EBS/RDS EBS/AutoScale アクセスログデータの生成 起動/制御 Hadoop Job EMR ログ 集計条件に従った集計処理 取り込み ログ 集計結果 取り込み 取り込み データストア(アクセスログ、集計結果CSVの保存) S3 Copyright ©2011 by Velc, Inc. Japan
6.
EMRを利用したシステム構成例
ログ計測 集計管理(UI・EMR制御) ELB/EC2 ELB/EC2/EBS/RDS EBS/AutoScale アクセスログデータの生成 起動/制御 Hadoop Job EMR ログ 集計条件に従った集計処理 取り込み ログ 集計結果 取り込み 取り込み データストア(アクセスログ、集計結果CSVの保存) S3 Copyright ©2011 by Velc, Inc. Japan
7.
EMRを利用したシステム構成例
1.利用時のみ起動するインスタンス群 → 運用コストを安価に Hadoop Job EMR 集計条件に従った集計処理 Copyright ©2011 by Velc, Inc. Japan
8.
EMRを利用したシステム構成例
ログ計測 集計管理(UI・EMR制御) ELB/EC2 ELB/EC2/EBS/RDS EBS/AutoScale アクセスログデータの生成 起動/制御 Hadoop Job EMR ログ 集計条件に従った集計処理 取り込み ログ 集計結果 取り込み 取り込み データストア(アクセスログ、集計結果CSVの保存) S3 Copyright ©2011 by Velc, Inc. Japan
9.
EMRを利用したシステム構成例
集計管理(UI・EMR制御) ELB/EC2/EBS/RDS 起動/制御 2.EMRインスタンス群の起動状況の監視/管理 →EMRの安定運用 Copyright ©2011 by Velc, Inc. Japan
10.
EMR選定時に気をつけること
大量データ バッチ集計 スモールスタート Copyright ©2011 by Velc, Inc. Japan
11.
アプリ設計編 Copyright ©2011 by
Velc, Inc. Japan
12.
自己紹介 • 石田 智志(@o918) •
広告系システム会社(4年程) → VELC(9ヶ月目) • B to Bのシステムの開発 → AWS周りの検証and開発 • 好きなAWSサービス → EC2 Copyright ©2011 by Velc, Inc. Japan
13.
Hiveについて • MapReduceのラッパー • SQL(HiveQL)で操作ができる
http://www.atmarkit.co.jp/fdb/single/s_hive/hive_01.html http://hive.apache.org/ Copyright ©2011 by Velc, Inc. Japan
14.
アプリ実装事例 ~データ蓄積~ • RDBのようにTableを作成しINSERTでデータ挿入可
hive> CREAET TABLE ... > INSERT INTO ... • Hadoop(EMR)が常時起動していない • S3上にデータをアップロード Copyright ©2011 by Velc, Inc. Japan
15.
アプリ実装事例 ~データ蓄積~ •
データ格納イメージ Hive TABLE 構成 S3 構成 バケット ACCESS_LOG ACCESS_LOG※テーブル ACCESS_YM=201111※パーテーション • ACCESS_DATETIME ACCESS_YM=201112※パーテーション • REMOTE_IP ログ1 • USER_AGENT ログ2 • URL 2011-12-14 19:00:00,xxx.xxx.xxx.xxx,iPhone,http://velc.biz/,http://velc.jp/ • REFERER 2011-12-14 19:00:10,xxx.xxx.xxx.xxx,IE,http://velc.com/,http://velc.jp/ • ACCESS_YM 2011-12-14 19:10:00,xxx.xxx.xxx.xxx,firefox,http://velc.co.jp/, (パーテーション) 2011-12-14 19:12:30,xxx.xxx.xxx.xxx,chorme,http://velc.ne.jp/, ... Copyright ©2011 by Velc, Inc. Japan
16.
アプリ実装事例 ~データ抽出~ • RDBのように操作できるのでSELECTでデータ抽出
hive> SELECT * FROM ... • Hadoop(EMR)が常時起動していない • API経由でEMRを起動(Ruby Client) $ elastic-mapreduce --create --name *** --num-instances * --instance-type m1.small --hive-interactive Copyright ©2011 by Velc, Inc. Japan
17.
アプリ実装事例 ~データ抽出~ • Hadoop
Hive環境が立ち上がったのでデータ抽出 hive> SELECT * FROM ... • Hive上にTableとデータが存在しない • CREATE文でTableの作成とS3上のデータをロード hive> CREATE EXTERNAL ACCESS_LOG (ACCESS_DATETIME STRING,...) PARTITIONED BY (ACCESS_YM STRING) ... LOCATION 's3://バケット/ACCESS_LOG/'; > ALTER TABLE ACCESS_LOG RECOVER PARTITIONS; Copyright ©2011 by Velc, Inc. Japan
18.
アプリ実装事例 ~データ抽出~ • Hadoop
Hive環境 + S3 DATA hive> SELECT * FROM ... • SELECTの出力先をS3に指定 hive> INSERT OVERWRITE DIRECTORY „s3://バケット/***' SELECT ACCESS_DATETIME FROM ACCESS_LOG WHERE ...; • EMR起動時にHiveQLを指定 $ elastic-mapreduce --create --name *** --num-instances * --instance-type m1.small --hive-interactive --args ¥"s3://us-west-1.elasticmapreduce/libs/hive/hive-script¥” ,¥"--base-path¥",¥"s3://us-west-1.elasticmapreduce/libs/hive/¥” ,¥“--run-hive-script¥”,¥“--args¥”,¥“-f¥”,¥“s3://バケット/HiveQLFile¥” Copyright ©2011 by Velc, Inc. Japan
19.
アプリ実装事例 ~その他~ • EMRエラーハンドリング •
EMR完了確認 • EMR起動制限 Copyright ©2011 by Velc, Inc. Japan
20.
ご清聴ありがとうございました
enjoy life and creation Copyright ©2011 by Velc, Inc. Japan
Baixar agora