Enviar pesquisa
Carregar
Cm re growth-devio-mtup11-sapporo-004
•
4 gostaram
•
2,263 visualizações
S
Satoru Ishikawa
Seguir
AWS Service As Bigdata.
Leia menos
Leia mais
Software
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 24
Baixar agora
Baixar para ler offline
Recomendados
Amazon Redshiftを使ったデータ分析
Amazon Redshiftを使ったデータ分析
Tomohiro Yamaguchi
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
Amazon Web Services Japan
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
Amazon Web Services Japan
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
Recruit Technologies
DX認定制度システム開発裏話:技術編
DX認定制度システム開発裏話:技術編
Arichika TANIGUCHI
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
Recruit Technologies
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
Recruit Lifestyle Co., Ltd.
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
Recruit Technologies
Recomendados
Amazon Redshiftを使ったデータ分析
Amazon Redshiftを使ったデータ分析
Tomohiro Yamaguchi
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
Amazon Web Services Japan
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
[よくわかるクラウドデータベース] Amazon RDS for SQL Server導入事例
Amazon Web Services Japan
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
Recruit Technologies
DX認定制度システム開発裏話:技術編
DX認定制度システム開発裏話:技術編
Arichika TANIGUCHI
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
Recruit Technologies
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
Recruit Lifestyle Co., Ltd.
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
Recruit Technologies
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
Recruit Lifestyle Co., Ltd.
ビッグデータ
ビッグデータ
Shigeru Kishikawa
For Power BI Beginners
For Power BI Beginners
Tomoyuki Oota
Power BI をシステムやアプリ開発と一緒に使うなら…~リアルタイムストリーミングの使い方~
Power BI をシステムやアプリ開発と一緒に使うなら…~リアルタイムストリーミングの使い方~
Yugo Shimizu
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
CData Software Japan
Power BI 概要と最近のこと 2018/12
Power BI 概要と最近のこと 2018/12
Takeshi Kagata
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡
Recruit Lifestyle Co., Ltd.
ビッグデータ処理データベースの全体像と使い分け 2018年version
ビッグデータ処理データベースの全体像と使い分け 2018年version
Tetsutaro Watanabe
Power BI とは - 2020
Power BI とは - 2020
Takeshi Kagata
複数のデータベースを統合・連携したい!こんなときにおすすめ「Stambia」
複数のデータベースを統合・連携したい!こんなときにおすすめ「Stambia」
株式会社クライム
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Insight Technology, Inc.
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
Hortonworks Japan
Gtfsデータリポジトリ紹介 iodd発表資料
Gtfsデータリポジトリ紹介 iodd発表資料
Shimpei Matsuura
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
Techon Organization
マイクロソフトの AI プラットフォーム & Cognitive Services 概要 ~ Ignite 2020 Recap
マイクロソフトの AI プラットフォーム & Cognitive Services 概要 ~ Ignite 2020 Recap
Ayako Omori
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
Insight Technology, Inc.
そのデータ、活かせていますか?
そのデータ、活かせていますか?
Miho Yamamoto
変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤
Recruit Technologies
20200928 aibid (rtb app install) sales deck (jp) v shared
20200928 aibid (rtb app install) sales deck (jp) v shared
Masayuki Tsuchikawa
トレジャーデータとtableau実現する自動レポーティング
トレジャーデータとtableau実現する自動レポーティング
Takahiro Inoue
Accelerate Migration to the Cloud using Data Virtualization
Accelerate Migration to the Cloud using Data Virtualization
Denodo
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
Naoki (Neo) SATO
Mais conteúdo relacionado
Mais procurados
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
Recruit Lifestyle Co., Ltd.
ビッグデータ
ビッグデータ
Shigeru Kishikawa
For Power BI Beginners
For Power BI Beginners
Tomoyuki Oota
Power BI をシステムやアプリ開発と一緒に使うなら…~リアルタイムストリーミングの使い方~
Power BI をシステムやアプリ開発と一緒に使うなら…~リアルタイムストリーミングの使い方~
Yugo Shimizu
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
CData Software Japan
Power BI 概要と最近のこと 2018/12
Power BI 概要と最近のこと 2018/12
Takeshi Kagata
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡
Recruit Lifestyle Co., Ltd.
ビッグデータ処理データベースの全体像と使い分け 2018年version
ビッグデータ処理データベースの全体像と使い分け 2018年version
Tetsutaro Watanabe
Power BI とは - 2020
Power BI とは - 2020
Takeshi Kagata
複数のデータベースを統合・連携したい!こんなときにおすすめ「Stambia」
複数のデータベースを統合・連携したい!こんなときにおすすめ「Stambia」
株式会社クライム
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Insight Technology, Inc.
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
Hortonworks Japan
Gtfsデータリポジトリ紹介 iodd発表資料
Gtfsデータリポジトリ紹介 iodd発表資料
Shimpei Matsuura
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
Techon Organization
マイクロソフトの AI プラットフォーム & Cognitive Services 概要 ~ Ignite 2020 Recap
マイクロソフトの AI プラットフォーム & Cognitive Services 概要 ~ Ignite 2020 Recap
Ayako Omori
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
Insight Technology, Inc.
そのデータ、活かせていますか?
そのデータ、活かせていますか?
Miho Yamamoto
変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤
Recruit Technologies
20200928 aibid (rtb app install) sales deck (jp) v shared
20200928 aibid (rtb app install) sales deck (jp) v shared
Masayuki Tsuchikawa
トレジャーデータとtableau実現する自動レポーティング
トレジャーデータとtableau実現する自動レポーティング
Takahiro Inoue
Mais procurados
(20)
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
ビッグデータ
ビッグデータ
For Power BI Beginners
For Power BI Beginners
Power BI をシステムやアプリ開発と一緒に使うなら…~リアルタイムストリーミングの使い方~
Power BI をシステムやアプリ開発と一緒に使うなら…~リアルタイムストリーミングの使い方~
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
Power BI 概要と最近のこと 2018/12
Power BI 概要と最近のこと 2018/12
ビックデータ分析基盤の成⻑の軌跡
ビックデータ分析基盤の成⻑の軌跡
ビッグデータ処理データベースの全体像と使い分け 2018年version
ビッグデータ処理データベースの全体像と使い分け 2018年version
Power BI とは - 2020
Power BI とは - 2020
複数のデータベースを統合・連携したい!こんなときにおすすめ「Stambia」
複数のデータベースを統合・連携したい!こんなときにおすすめ「Stambia」
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
Gtfsデータリポジトリ紹介 iodd発表資料
Gtfsデータリポジトリ紹介 iodd発表資料
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
マイクロソフトの AI プラットフォーム & Cognitive Services 概要 ~ Ignite 2020 Recap
マイクロソフトの AI プラットフォーム & Cognitive Services 概要 ~ Ignite 2020 Recap
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
そのデータ、活かせていますか?
そのデータ、活かせていますか?
変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤
20200928 aibid (rtb app install) sales deck (jp) v shared
20200928 aibid (rtb app install) sales deck (jp) v shared
トレジャーデータとtableau実現する自動レポーティング
トレジャーデータとtableau実現する自動レポーティング
Semelhante a Cm re growth-devio-mtup11-sapporo-004
Accelerate Migration to the Cloud using Data Virtualization
Accelerate Migration to the Cloud using Data Virtualization
Denodo
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
Naoki (Neo) SATO
Amazon Game Tech Night #22 AWSで実現するデータレイクとアナリティクス
Amazon Game Tech Night #22 AWSで実現するデータレイクとアナリティクス
Amazon Web Services Japan
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
日本マイクロソフト株式会社
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
de:code 2017
Developers Summit 2018: ストリームとバッチを融合したBigData Analytics ~事例とデモから見えてくる、これからのデー...
Developers Summit 2018: ストリームとバッチを融合したBigData Analytics ~事例とデモから見えてくる、これからのデー...
オラクルエンジニア通信
Azure Data Platform
Azure Data Platform
Daiyu Hatakeyama
データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門
Satoru Ishikawa
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
Kensuke SAEKI
Microsoft Ignite 2019 最新アップデート - Azure Big Data Services を俯瞰的に眺める
Microsoft Ignite 2019 最新アップデート - Azure Big Data Services を俯瞰的に眺める
Daiyu Hatakeyama
クラウドの破壊力
クラウドの破壊力
Osaka University
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
Amazon Web Services Japan
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
Insight Technology, Inc.
DLLAB Ignite Update Data Platform
DLLAB Ignite Update Data Platform
Deep Learning Lab(ディープラーニング・ラボ)
Big Data Visual Analytics Realized By Hadoop and Tableau
Big Data Visual Analytics Realized By Hadoop and Tableau
DataWorks Summit
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
Amazon Web Services Japan
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
Ryoma Nagata
ビジネスインテリジェンス入門~OSSでBIを始めよう~
ビジネスインテリジェンス入門~OSSでBIを始めよう~
Kensuke SAEKI
JAWS-UG初心者支部 - 2020-01-29 - マルチアカウント運用のはじめかた
JAWS-UG初心者支部 - 2020-01-29 - マルチアカウント運用のはじめかた
Yutaro Ono
Smart data integration to hybrid data analysis infrastructure
Smart data integration to hybrid data analysis infrastructure
DataWorks Summit
Semelhante a Cm re growth-devio-mtup11-sapporo-004
(20)
Accelerate Migration to the Cloud using Data Virtualization
Accelerate Migration to the Cloud using Data Virtualization
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
Amazon Game Tech Night #22 AWSで実現するデータレイクとアナリティクス
Amazon Game Tech Night #22 AWSで実現するデータレイクとアナリティクス
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
Developers Summit 2018: ストリームとバッチを融合したBigData Analytics ~事例とデモから見えてくる、これからのデー...
Developers Summit 2018: ストリームとバッチを融合したBigData Analytics ~事例とデモから見えてくる、これからのデー...
Azure Data Platform
Azure Data Platform
データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
Microsoft Ignite 2019 最新アップデート - Azure Big Data Services を俯瞰的に眺める
Microsoft Ignite 2019 最新アップデート - Azure Big Data Services を俯瞰的に眺める
クラウドの破壊力
クラウドの破壊力
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
AWS Lambdaによるデータ処理理の⾃自動化とコモディティ化
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
DLLAB Ignite Update Data Platform
DLLAB Ignite Update Data Platform
Big Data Visual Analytics Realized By Hadoop and Tableau
Big Data Visual Analytics Realized By Hadoop and Tableau
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
ビジネスインテリジェンス入門~OSSでBIを始めよう~
ビジネスインテリジェンス入門~OSSでBIを始めよう~
JAWS-UG初心者支部 - 2020-01-29 - マルチアカウント運用のはじめかた
JAWS-UG初心者支部 - 2020-01-29 - マルチアカウント運用のはじめかた
Smart data integration to hybrid data analysis infrastructure
Smart data integration to hybrid data analysis infrastructure
Mais de Satoru Ishikawa
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
Satoru Ishikawa
BigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House Architecture
Satoru Ishikawa
re:Growth2019 Analytics Updates
re:Growth2019 Analytics Updates
Satoru Ishikawa
Developers.IO 2019 Effective Datalake
Developers.IO 2019 Effective Datalake
Satoru Ishikawa
re:invent 2018 analytics関連アップデート
re:invent 2018 analytics関連アップデート
Satoru Ishikawa
Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!
Satoru Ishikawa
20161214 re growth-sapporo
20161214 re growth-sapporo
Satoru Ishikawa
Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114
Satoru Ishikawa
re:Growth ビッグデータ観点で見た AWS re:Invent 2015
re:Growth ビッグデータ観点で見た AWS re:Invent 2015
Satoru Ishikawa
db-tech-showcase-sapporo-b24-20150911p
db-tech-showcase-sapporo-b24-20150911p
Satoru Ishikawa
Cmdevio2015 devday-g-3
Cmdevio2015 devday-g-3
Satoru Ishikawa
Running Amazon S3 Encryption
Running Amazon S3 Encryption
Satoru Ishikawa
Cloud Programing for beginner
Cloud Programing for beginner
Satoru Ishikawa
Mais de Satoru Ishikawa
(13)
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
BigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House Architecture
re:Growth2019 Analytics Updates
re:Growth2019 Analytics Updates
Developers.IO 2019 Effective Datalake
Developers.IO 2019 Effective Datalake
re:invent 2018 analytics関連アップデート
re:invent 2018 analytics関連アップデート
Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!
20161214 re growth-sapporo
20161214 re growth-sapporo
Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114
re:Growth ビッグデータ観点で見た AWS re:Invent 2015
re:Growth ビッグデータ観点で見た AWS re:Invent 2015
db-tech-showcase-sapporo-b24-20150911p
db-tech-showcase-sapporo-b24-20150911p
Cmdevio2015 devday-g-3
Cmdevio2015 devday-g-3
Running Amazon S3 Encryption
Running Amazon S3 Encryption
Cloud Programing for beginner
Cloud Programing for beginner
Cm re growth-devio-mtup11-sapporo-004
1.
ビックデータ解析基盤としてのAWS 「カスタマーストーリー」を支える技術 Ⓒ
Classmethod, Inc. 1 DEVIO-MTUP11-SAPPORO-004 石川 覚 ソリューションアーキテクト クラスメソッド 2014年12月12日
2.
自己紹介 • メーカー系SE、VoIP関連ベンチャー企業を経て
• CMに2014/06 join • 札幌出身、東京に8年 • Linux, Java, MySQL, Redshift • 自称 何でも屋 • 当然 AWS好き ! ! クラスメソッド株式会社 ソリューションアーキテクト Ⓒ Classmethod, Inc. 2
3.
カスタマーストーリー • 販売データ(POS)やモバイルログなど、企業に存在する様々なデー
タを集約し、様々な角度から顧客理解を深める、ビックデータ分析基盤 を提供します。 Ⓒ Classmethod, Inc. カスタマーストーリーで 「データ分析の民主化」をお手伝い 3
4.
アジェンダ • AWSのビックデータ関連サービス
• 高性能・大容量なAmazon Redshift • データ解析基盤の導入パターン • データ分析の課題 • ETLプロセスの見直し • まとめ Ⓒ Classmethod, Inc. 4
5.
AWSのビックデータ関連サービス 5
6.
AWSサービスの全体像 AWSサービスの全体像 ‒
40以上のサービス 更にビックデータ関連の新サービスとして、AWS Lambda、 S3 Event Notification、RDS for Auroraが追加 Ⓒ Classmethod, Inc. 6
7.
注目の新サービス AWS Lambda
AWS上のイベントをトリガーに、独自のコードを実行させるこ とができるComputeサービス S3へのPUT、Kinesisのストリーム入力、CLI呼び出しなどの トリガ LambdaはAWSサービスをより簡潔に連携させる手段を提供 フルマネージメントならDataPipeline、セルフマネジメントな らAWS SDK Ⓒ Classmethod, Inc. Data Pipeline AWS SDK > > 7
8.
注目の新サービス S3 Event
Notification S3でイベントが発生した際に、SNS/SQS/Lambdaへ通知呼 び出しする EC2/Linux(inotify)やS3のポーリングが不要になる Producer-Customerパターン適用して、他サービスと疎結合 でElasticな拡張が期待 バケット毎に設定可能 Ⓒ Classmethod, Inc. 8
9.
注目の新サービス Amazon RDS
for Aurora クラウドのために再発明したRDB.. (まだ本物を見ていないのでわかりません…) Readはかなり速そうだが、DWH用途ではRedshiftの方が”Cost Effective”だろう RedshiftはPrimaryKeyは名ばかり、インデックスキーは sortkeyのみ、非冗長化のシングルAZなので、要件によっては Auroraがマッチする可能性がある 一般的にビックデータ関連は結果データの永続化よりも Ⓒ Classmethod, Inc. スケールアウトに重点が置かれています。 9
10.
高速で大容量なAmazon Redshift 10
11.
Amazon Redshift 大容量:160GB~1.6PB
高速:カラムナ型+列圧縮、超並列演算(MPP) インスタンスの従量課金(ライセンス不要) Ⓒ Classmethod, Inc. 11
12.
Amazon Redshift インタフェースはPostgreSQL互換
S3からの高速ロード・アンロードが可能 BIツールやETLツールとの連携 AWSサービスBIツール Ⓒ Classmethod, Inc. 12 EC2 SQL COPY /UNLOAD S3 Redshift SQL Alteryx Tableau SQL
13.
データ解析基盤の導入パターン 13
14.
例.収集した売上データの活用 - BI
Ⓒ Classmethod, Inc. 14 DB データ (オリジナル) ETL S3 EC2/EMR データ 店舗(ETL済み) Redshift EC2 データ (ETL済み) S3 分析 Tableau マート Redshift 会計データ 販売データ 生産管理データ 在庫管理データ 購買管理データ eコマース・SNS等
15.
例.収集したデータの活用 - DMP
Ⓒ Classmethod, Inc. EMR 15 ログ コレクタ データ (オリジナル) S3 IoT 検索ワード SNSログ 投票データ ウェブコング 株式データ 医療情報 ETL Redshift データ (ETL済み) データ (ETL済み) S3 データ (オリジナル) ETL EMR データ (ETL済み) S3 データ (ETL済み) DynamoDB 分析データ 販売ビジネス レポート データ取得 WebAPI
16.
データ分析の課題 16
17.
例.収集した売上データの活用 - BI
Ⓒ Classmethod, Inc. 17 DB データ (オリジナル) ETL S3 EC2/EMR データ 店舗(ETL済み) Redshift EC2 データ (ETL済み) S3 分析 Tableau マート Redshift 会計データ 販売データ 生産管理データ 在庫管理データ 購買管理データ eコマース・SNS等 ETLが全体の作業7割を 占めると言われている
18.
データ分析の課題 ETL(データクレンジング、連結、一次集計、データマー ト)は手間と時間を要する
エンジニアがこれらの作業を代行すると事前に分析内容 を定めなければならない 分析内容の固定化・分析経過のフィードバックが容易で ない 結果として、データ分析に基づいた仮設・検証サイクルを 迅速に回せなくなる 分析内容の固定化は経験的な分析を数値化する価値があるが、 新たな課題や施策に必要なデータの発見には至れない Ⓒ Classmethod, Inc. 18
19.
ETLプロセスの見直し 19
20.
Data Pipeline データ統合・処理をスケジュールベースで自動化
Ⓒ Classmethod, Inc. 20
21.
ETLツール - Alteryx
データの入出力にS3やRedshiftが指定可能 予測分析やバスケット分析といった高度な分析が可能 分析結果を直接BIツール(Tableau)のファイルに出力できる Ⓒ Classmethod, Inc. 21
22.
まとめ 22
23.
まとめ • オリジナル・中間データはS3に保存する
• オリジナルデータのクレンジングはEC2やEMR • 処理されたデータはRedshiftに格納・利用すること でBIツールやETLツールと連携 • Redshiftはデータ連結、一次集計、マート作成を高 速に生成 • ETLのオーケストレーションはData Pipeline、デー タサイエンティストに求められる高度な分析は Alteryxを始めとするETLツールを活用 Ⓒ Classmethod, Inc. 23
24.
Ⓒ Classmethod, Inc.
#cmdevio ご静聴ありがとうございました。 スライドは後日ブログで公開します。 24 DEVIO-MTUP11-SAPPORO-004
Baixar agora