SlideShare uma empresa Scribd logo
1 de 57
Baixar para ler offline
データ分析を⽀える技術 DWH再⼊⾨
データアナリティクス事業本部
2020/06/19
⽯川 覚
2⾃⼰紹介
• ⽒名
- ⽯川 覚 (いしかわ さとる)
• 所属
- データアナリティクス事業本部 (DA事業本部)
- インテグレーション部
- 札幌オフィス勤務
• 略歴
- メーカー系SIer、ITベンチャー企業、現在に⾄る
• 担当業務
- データ分析基盤の設計・開発、コンサルティング
• 好きなサービス
- Amazon Redshift/Athena、Snowflake 、Google BigQuery
2020 APN AWS Top Engineers 選出
3アジェンダ
• DWH再⼊⾨
• DWHの特性
• ディメンジョナルデータモデル
• 分析データの利⽤
• ⼀般的なDBとDWHの相違点
• DWHのアーキテクチャ
4
DWH再⼊⾨
5DWHとは
DWHはデータウェアハウスの略(データの倉庫)
分析しやすく検索できるように蓄積したデータベース
6DWHとは
DWHはデータウェアハウスの略(データの倉庫)
分析しやすく検索できるように蓄積したデータベース
• 部⾨のデータをDWHに集め
• そのデータを分析しやすく変換
• 分析の⽬的ごとにデータを作成・蓄積
7DWH導⼊の背景
⼀つの企業の中でさまざまな部⾨のDBに、データが分散して
いることをサイロ化と呼びます。
eコマース 店舗
8DWH導⼊の背景
⼀つの企業の中でさまざまな部⾨のDBに、データが分散して
いることをサイロ化と呼びます。
eコマース 店舗
もう〜サイロ化した貴重なデータを
企業の意思決定⽀援に活かすには、
データを集めて、分析しやすく検索
できるように蓄積したDBが必要〜
9DWH導⼊の背景
部⾨のDBは、トランザクションの実⾏に最適化されており、
分析クエリの実⾏には不向きです。
DWH(データの倉庫)
そこで登場したのが、データ分析に
最適化されたDBであるDWHです
10
DWHの特性
11DWHの特性
ビル・インモンさんが提唱するDWHの4つ特性
1. 統合化(integrated)
2. サブジェクト指向(subject oriented)
3. 時系列(time variant)
4. 恒常性(nonvolatile)
12DWHの特性
ビル・インモンさんが提唱するDWHの6つ特性
1. 統合化(integrated)
2. サブジェクト指向(subject oriented)
• 詳細データ(detail data)
• 要約データ(summary data)
3. 時系列(time variant)
4. 恒常性(nonvolatile)
13DWHの特性
まずは部⾨のデータをDWHに集める
部⾨のデータを⼀箇所に集めるには、部⾨のDBからエクス
ポートしたファイルをDWHにインポートするのが⼀般的で
す。
• 部⾨のDBからエクスポートしたファイルはオブジェクトス
トレージにアップロードする
• 補⾜︓Amazon Redshiftの場合、S3(オブジェクトスト
レージ)に集めたデータファイルは、データファイルに対し
て直接クエリを実⾏できる「データレイク」のストレージと
しても活⽤できる
14DWHの特性
1. 統合化(integrated)
各部⾨のデータの表記揺れや意味を統⼀します。データを利⽤
するアナリストが個々のデータの違いを意識せずに利⽤できる
ように整理する。
例.
• ⽇付︓和暦から⻄暦変換、JSTからUTC変換
• ⽂字列︓⼤⽂字⼩⽂字、整数・少数、表記揺れ
• 値︓Nullや空⽂字、コード体系の取り扱い
15DWHの特性
1. 統合化(integrated)
補⾜︓データの変換⽅法
• ETL(Extract Transform Load)
• ETLツールでデータを変換してロードする⽅式
• ELT(Extract Load Transform)
• ステージングエリアにデータをロードした後、SQLでデータを変
換する⽅式
16DWHの特性
2. サブジェクト指向(subject oriented)
• 「商品」や「顧客」のように分析の軸(次元)ごとに集計し
て蓄積したデータである「データマート」を作成する
• 複数ディメンジョンのデータマート︓データ探索⽤途
• 単⼀ディメンジョンのデータマート︓パフォーマンス重
視のためダッシュボード⽤途
※グラニュラリティ(要約の粒度)は要件やデータの規模に
よって調整する
17DWHの特性
2. サブジェクト指向(subject oriented)
• 詳細データ(detail data)︓分析しやすく変換したデータ
をそのまま保存
• 要約データ(summary data)︓複数の詳細データを結合
したり、集計した結果を保存
18DWHの特性
3. 時系列(time variant)
⽇々⽣成されるデータ、その時点のデータ状態を保存します。
過去に遡ってデータ分析ができることが⽬的です。
19DWHの特性
4. 恒常性(nonvolatile)
蓄積されたデータは、変更せずに参照可能な状態で保存します。
いつでもデータ発⽣時の値を参照出来ることが⽬的です。
クラウドのオブジェクトストレージは堅牢かつイミュータブル
でありDWHのデータの保存に適しています。
20DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
21DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
部⾨のDBからデータをエクスポートする
22DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
エクスポートしたファイルをS3にアップロード
23DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
S3のデータをDWHのステージング層にロードする
24DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
ステージング層のデータを統合化(integrated)してDWH層インポートする
25DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
DWH層のデータを⽤いてデータマートを作成する
26DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
データマートを⽤いて分析する
27DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
28
ディメンジョナルデータモデル
29ディメンジョナルデータモデル
ディメンジョナルデータモデルとは
• ラルフ・キンボールさんが提唱するディメンジョナルモデル
とは、スタースキーマでDWHを構築すること
• 分析したい値を持つファクトテーブルと、分析の軸(次元)
となる値を持つディメンジョンテーブルから構成される
• ERモデル(第3正規形)は分析データのモデリングに最適
ではない
30ディメンジョナルデータモデル
スタースキーマとは
テーブル同⼠の関係性を可視化
すると、ファクトテーブルを中
⼼にその周りをディメンション
テーブルが取り囲む形になる。
売上
時間ID
店舗ID
商品ID
顧客ID
担当者ID
売上⾦額
時間
時間ID
年⽉⽇
時間
休⽇
店舗
店舗ID
店舗名
地域
顧客
顧客ID
顧客名
顧客分類
商品
商品ID
商品名
カテゴリ
担当者
担当者ID
担当者名
部⾨
31ディメンジョナルデータモデル
売上
時間ID
店舗ID
商品ID
顧客ID
担当者ID
売上⾦額
時間
時間ID
年⽉⽇
時間
休⽇
店舗
店舗ID
店舗名
地域
顧客
顧客ID
顧客名
顧客分類
商品
商品ID
商品名
カテゴリ
担当者
担当者ID
担当者名
部⾨名
スタースキーマとは
テーブル同⼠の関係性を可視化
すると、ファクトテーブルを中
⼼にその周りをディメンション
テーブルが取り囲む形になる。
32ディメンジョナルデータモデル
売上
時間ID
店舗ID
商品ID
顧客ID
担当者ID
売上⾦額
時間
時間ID
年⽉⽇
時間
休⽇
店舗
店舗ID
店舗名
地域
顧客
顧客ID
顧客名
顧客分類
商品
商品ID
商品名
カテゴリ
担当者
担当者ID
担当者名
部⾨
ファクト
ファクトテーブル
ファクトテーブルは、分析した
い値の列と、その周りのテーブ
ル(ディメンジョンテーブル)
を参照する外部キーの列がある
33ディメンジョナルデータモデル
売上
時間ID
店舗ID
商品ID
顧客ID
担当者ID
売上⾦額
時間
時間ID
年⽉⽇
時間
休⽇
店舗
店舗ID
店舗名
地域
顧客
顧客ID
顧客名
顧客分類
商品
商品ID
商品名
カテゴリ
担当者
担当者ID
担当者名
部⾨
ディメンジョン
ディメンジョンテーブル
ディメンジョンテーブルは分析
の軸(次元)を持つテーブル
34ディメンジョナルデータモデル
ファクトとディメンジョンの関係
• ディメンジョンテーブルに対し
てファクトテーブルは圧倒的に
レコード数が多い傾向がある
• あえて第3正規形まで正規化せ
ず、第2正規形で留めておくこ
とでテーブルの結合するコスト
を抑える
売上
時間ID
店舗ID
商品ID
顧客ID
担当者ID
売上⾦額
時間
時間ID
年⽉⽇
時間
休⽇
店舗
店舗ID
店舗名
地域
顧客
顧客ID
顧客名
顧客分類
商品
商品ID
商品名
カテゴリ
担当者
担当者ID
担当者名
部⾨
35
分析データの利⽤
36分析データの利⽤
代表的なデータ分析の⼿法
• ダイス
• スライス
• ドリルアップ・ドリルダウン
BIツールを使い始める前に
理解することをおすすめします。
37分析データの利⽤
ダイス(ダイシング)
データ分析の軸(次元)を変更して、分析の視点を変える。
• 例.商品ごとに分析していたものを、店舗ごとに切り替えて
別の視点で分析する
• ダイスするには、統合化したそのままのデータか、複数ディ
メンジョンのデータマートを事前に作成する
38分析データの利⽤
スライス(スライシング)
多次元の表を2次元の表に切り取る操作。
• 例.商品別年⽉⽇別売上表などを切り出し、季節による商品
の売り上げ推移を分析する
• 統合化(integrated)後のデータからデータマートを作成す
る過程でも実施する
39分析データの利⽤
ドリルアップ・ドリルダウン
分析の深さを詳細にしたり、まとめたりして変更する操作。
• 例1.年⽉ごとに⾏っていた分析を、粒度をあげて年単位に
することをドリルアップという
• 例2.逆に粒度を下げて⽇単位にすることをドリルダウンと
いう
• 年⽉⽇のドリルアップ・ドリルダウンはBIツールを⽤いる
と簡単にできる
40分析データの利⽤
BIツールによる可視化
• ダイス、スライス、ドリルダウン・アップの操作が容易
• データを2次元的なクロス集計表だけでなく、様々な表⽰形
式(グラフなど)でデータを表現できる
• 定型分析
• ダッシューボードなど、常に表⽰する情報は、パフォー
マンス重視の単⼀ディメンジョンデータマートを⽤いる
• データ探索(データディスカバリ)
• 統合化(integrated)後のデータや既存の複合ディメン
ジョンデータマートを⽤いて、新たな洞察を得る
41
⼀般的なDBとDWHの相違点
42相違点は…
トランザクション処理と分析処理では、
データに対するアクセスパターンが異なる
43相違点
アクセスパターン
• オンライントランザクション処理(OLTP)︓⼀般的なDB
• インデックスのキーから少数のレコードを取得・更新
• インタラクティブであり、素早く応答が必要
• オンライン分析処理(OLAP)︓DWH
• ⼤量のレコード中の少数の列だけを読み出しが多い
• 要約統計 (レコード数、合計、平均など)を計算した結果
をユーザーに返したり、テーブルに保存する
44相違点
データアクセスの⽐較
特性 オンライントランザクション処理
(OLTP: OnLine Transaction Processing)
オンライン分析処理
(OLAP: OnLine Analytic Processing)
データの規模 数GBから数TB 数百GBから数PB
読み込みの
パターン
インデックスのキーを⽤いた少数
のレコードの低レイテンシ読み込
み
⼤量のレコード中の少数の列だ
けを読み込み
書き込みの
パターン
ランダムアクセスと低レイテンシ
書き込み
レコード中の更新した列の追加
書き込み、もしくは⼤量データ
の⼀括インポート
45
DWHのアーキテクチャ
46列指向ストレージ
分析クエリを効率よく実⾏できる「列指向ストレージ」
分析クエリが⼀度にアクセスするのは、そのうちの4ないし5
列程度という特徴があります。
DWHではテーブルのデータを⾏ごとではなく、列ごとに保存
します。
• ⾏指向︓データを⾏ごとに保存する⽅式
• 列指向︓列ごとにデータを保存する⽅式
47列指向ストレージ
データスキャンの削減
分析対象となる列のデー
タだけにしかアクセスし
ないため、データスキャ
ンが最⼩化できる
引⽤︓https://www.slideshare.net/AmazonWebServicesJapan/20181205-aws-black-belt-online-seminar-amazon-athena-20190510update/26
48列指向ストレージ
I/O効率や圧縮率の向上
• 列ごとにデータを格納
して連続的にデータを
読み出すことでI/O効
率が向上する
• 同じ列に含まれるデー
タは類似性が⾼く、圧
縮率が⾼くなる
引⽤︓https://www.slideshare.net/AmazonWebServicesJapan/20181205-aws-black-belt-online-seminar-amazon-athena-20190510update/26
49DWHのシステム構成
複数のノードを⽤いた並列分散処理
⼤量のデータの分析を想定した並列分散アーキテクチャを採⽤
している。
• シェアードナッシング
• ストレージをノードごとに割り当て、複数ノードで並列
分散処理する
• シェアードストレージ
• データを共有ストレージに保存し、複数ノードで並列分
散処理する
• ストレージとコンピューティングを分離
50DWHのシステム構成
DWHの例
• シェアードナッシングを採⽤しているDWH
• Amazon Redshift(RA3はハイブリッド)
• Teradata
• Vertica
• シェアードストレージを採⽤しているDWH
• Google BigQuery
• Snowflake
51DWHのアーキテクチャ
例. Amazon Redshift(RA3)
ホットデータはシェアー
ドナッシング、コールド
データは、シェアードス
トレージ
双⽅の⻑所を活かし、ス
トレージとコンピュー
ティングを分離したアー
キテクチャを採⽤してい
る
52
まとめ
53まとめ
DWHのデータ設計
• アナリストが個々のデータの違いを意識せずに利⽤できるよ
うにデータを統合化(integrated)する
• 分析⽤途応じて、結合・集計されたデータマートが時系列か
つ永続的に保存する
• 分析⽤途のテーブルはディメンジョナルデータモデル(ス
タースキーマ)を採⽤し、第2正規化までとする
54まとめ
DWHのデータ活⽤
• データの可視化にはデータマートとBIツールが有効
• 複数ディメンジョンのデータマート︓データ探索⽤途
• 単⼀ディメンジョンのデータマート︓パフォーマンス重
視のダッシュボードなど
55まとめ
DWHのアーキテクチャ
• ⼤量レコード中の少数の列の読み込みを想定して列指向スト
レージを採⽤している
• ⼤量のデータを処理できるように伸縮⾃在で並列分散処理が
可能なシステム構成を採⽤する
• 特に「ビッグデータの分析」であれば上記は必須です
56
わかるようでわからないDWH
違いをご理解いただけたら幸いです。
データ分析を支える技術 DWH再入門

Mais conteúdo relacionado

Mais procurados

ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けRecruit Technologies
 
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのかTechon Organization
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例Tetsutaro Watanabe
 
Snowflake Architecture and Performance
Snowflake Architecture and PerformanceSnowflake Architecture and Performance
Snowflake Architecture and PerformanceMineaki Motohashi
 
RDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけ
RDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけRDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけ
RDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけRecruit Technologies
 
Azure Synapse Analytics 専用SQL Poolベストプラクティス
Azure Synapse Analytics 専用SQL PoolベストプラクティスAzure Synapse Analytics 専用SQL Poolベストプラクティス
Azure Synapse Analytics 専用SQL PoolベストプラクティスMicrosoft
 
リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方Recruit Lifestyle Co., Ltd.
 
DeNAの分析を支える分析基盤
DeNAの分析を支える分析基盤DeNAの分析を支える分析基盤
DeNAの分析を支える分析基盤Kenshin Yamada
 
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonightAmazon Web Services Japan
 
Data Factoryの勘所・大事なところ
Data Factoryの勘所・大事なところData Factoryの勘所・大事なところ
Data Factoryの勘所・大事なところTsubasa Yoshino
 
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)NTT DATA Technology & Innovation
 
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤Amazon Web Services Japan
 
マイクロサービス 4つの分割アプローチ
マイクロサービス 4つの分割アプローチマイクロサービス 4つの分割アプローチ
マイクロサービス 4つの分割アプローチ増田 亨
 
マルチテナント化で知っておきたいデータベースのこと
マルチテナント化で知っておきたいデータベースのことマルチテナント化で知っておきたいデータベースのこと
マルチテナント化で知っておきたいデータベースのことAmazon Web Services Japan
 
ストリーム処理を支えるキューイングシステムの選び方
ストリーム処理を支えるキューイングシステムの選び方ストリーム処理を支えるキューイングシステムの選び方
ストリーム処理を支えるキューイングシステムの選び方Yoshiyasu SAEKI
 
爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話Kentaro Yoshida
 
Effective Data Lakes - ユースケースとデザインパターン
Effective Data Lakes - ユースケースとデザインパターンEffective Data Lakes - ユースケースとデザインパターン
Effective Data Lakes - ユースケースとデザインパターンNoritaka Sekiyama
 
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #1320210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13Amazon Web Services Japan
 
Amazon Athena 初心者向けハンズオン
Amazon Athena 初心者向けハンズオンAmazon Athena 初心者向けハンズオン
Amazon Athena 初心者向けハンズオンAmazon Web Services Japan
 

Mais procurados (20)

ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
 
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例
 
Snowflake Architecture and Performance
Snowflake Architecture and PerformanceSnowflake Architecture and Performance
Snowflake Architecture and Performance
 
RDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけ
RDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけRDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけ
RDB技術者のためのNoSQLガイド NoSQLの必要性と位置づけ
 
Azure Synapse Analytics 専用SQL Poolベストプラクティス
Azure Synapse Analytics 専用SQL PoolベストプラクティスAzure Synapse Analytics 専用SQL Poolベストプラクティス
Azure Synapse Analytics 専用SQL Poolベストプラクティス
 
AWS Black Belt - AWS Glue
AWS Black Belt - AWS GlueAWS Black Belt - AWS Glue
AWS Black Belt - AWS Glue
 
リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方
 
DeNAの分析を支える分析基盤
DeNAの分析を支える分析基盤DeNAの分析を支える分析基盤
DeNAの分析を支える分析基盤
 
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
 
Data Factoryの勘所・大事なところ
Data Factoryの勘所・大事なところData Factoryの勘所・大事なところ
Data Factoryの勘所・大事なところ
 
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
Apache Airflow 概要(Airflowの基礎を学ぶハンズオンワークショップ 発表資料)
 
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
 
マイクロサービス 4つの分割アプローチ
マイクロサービス 4つの分割アプローチマイクロサービス 4つの分割アプローチ
マイクロサービス 4つの分割アプローチ
 
マルチテナント化で知っておきたいデータベースのこと
マルチテナント化で知っておきたいデータベースのことマルチテナント化で知っておきたいデータベースのこと
マルチテナント化で知っておきたいデータベースのこと
 
ストリーム処理を支えるキューイングシステムの選び方
ストリーム処理を支えるキューイングシステムの選び方ストリーム処理を支えるキューイングシステムの選び方
ストリーム処理を支えるキューイングシステムの選び方
 
爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話爆速クエリエンジン”Presto”を使いたくなる話
爆速クエリエンジン”Presto”を使いたくなる話
 
Effective Data Lakes - ユースケースとデザインパターン
Effective Data Lakes - ユースケースとデザインパターンEffective Data Lakes - ユースケースとデザインパターン
Effective Data Lakes - ユースケースとデザインパターン
 
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #1320210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
 
Amazon Athena 初心者向けハンズオン
Amazon Athena 初心者向けハンズオンAmazon Athena 初心者向けハンズオン
Amazon Athena 初心者向けハンズオン
 

Semelhante a データ分析を支える技術 DWH再入門

BigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House ArchitectureBigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House ArchitectureSatoru Ishikawa
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - Tetsutaro Watanabe
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data PlatformNaoki (Neo) SATO
 
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Mineaki Motohashi
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...Insight Technology, Inc.
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューションDell TechCenter Japan
 
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)Kensuke SAEKI
 
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみたAWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみたtatsuya 264
 
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Atsushi Tsuchiya
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)日本マイクロソフト株式会社
 
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeAzure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeHideo Takagi
 
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現Ryoma Nagata
 
トレジャーデータ新サービス発表 2013/12/9
トレジャーデータ新サービス発表 2013/12/9トレジャーデータ新サービス発表 2013/12/9
トレジャーデータ新サービス発表 2013/12/9Treasure Data, Inc.
 
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装de:code 2017
 
Cm re growth-devio-mtup11-sapporo-004
Cm re growth-devio-mtup11-sapporo-004Cm re growth-devio-mtup11-sapporo-004
Cm re growth-devio-mtup11-sapporo-004Satoru Ishikawa
 
20181206 Jazug DataScience TeamBuilding and DevOps
20181206 Jazug DataScience TeamBuilding and DevOps20181206 Jazug DataScience TeamBuilding and DevOps
20181206 Jazug DataScience TeamBuilding and DevOpsYukako Shimizu
 
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例オラクルエンジニア通信
 

Semelhante a データ分析を支える技術 DWH再入門 (20)

S01 t3 data_engineer
S01 t3 data_engineerS01 t3 data_engineer
S01 t3 data_engineer
 
BigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House ArchitectureBigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House Architecture
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
 
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
 
Strata conference 2012
Strata conference 2012Strata conference 2012
Strata conference 2012
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
 
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
 
「Data Infrastructure at Scale 」#yjdsw4
「Data Infrastructure at Scale 」#yjdsw4「Data Infrastructure at Scale 」#yjdsw4
「Data Infrastructure at Scale 」#yjdsw4
 
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみたAWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
 
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
 
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeAzure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data Lake
 
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
 
トレジャーデータ新サービス発表 2013/12/9
トレジャーデータ新サービス発表 2013/12/9トレジャーデータ新サービス発表 2013/12/9
トレジャーデータ新サービス発表 2013/12/9
 
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
 
Cm re growth-devio-mtup11-sapporo-004
Cm re growth-devio-mtup11-sapporo-004Cm re growth-devio-mtup11-sapporo-004
Cm re growth-devio-mtup11-sapporo-004
 
20181206 Jazug DataScience TeamBuilding and DevOps
20181206 Jazug DataScience TeamBuilding and DevOps20181206 Jazug DataScience TeamBuilding and DevOps
20181206 Jazug DataScience TeamBuilding and DevOps
 
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
 

Mais de Satoru Ishikawa

re:Growth2019 Analytics Updates
re:Growth2019 Analytics Updatesre:Growth2019 Analytics Updates
re:Growth2019 Analytics UpdatesSatoru Ishikawa
 
Developers.IO 2019 Effective Datalake
Developers.IO 2019 Effective DatalakeDevelopers.IO 2019 Effective Datalake
Developers.IO 2019 Effective DatalakeSatoru Ishikawa
 
re:invent 2018 analytics関連アップデート
re:invent 2018 analytics関連アップデートre:invent 2018 analytics関連アップデート
re:invent 2018 analytics関連アップデートSatoru Ishikawa
 
Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!Satoru Ishikawa
 
20161214 re growth-sapporo
20161214 re growth-sapporo20161214 re growth-sapporo
20161214 re growth-sapporoSatoru Ishikawa
 
Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114Satoru Ishikawa
 
re:Growth ビッグデータ観点で見た AWS re:Invent 2015
re:Growth ビッグデータ観点で見た AWS re:Invent 2015re:Growth ビッグデータ観点で見た AWS re:Invent 2015
re:Growth ビッグデータ観点で見た AWS re:Invent 2015Satoru Ishikawa
 
db-tech-showcase-sapporo-b24-20150911p
db-tech-showcase-sapporo-b24-20150911pdb-tech-showcase-sapporo-b24-20150911p
db-tech-showcase-sapporo-b24-20150911pSatoru Ishikawa
 
Running Amazon S3 Encryption
Running Amazon S3 EncryptionRunning Amazon S3 Encryption
Running Amazon S3 EncryptionSatoru Ishikawa
 
Cloud Programing for beginner
Cloud Programing for beginnerCloud Programing for beginner
Cloud Programing for beginnerSatoru Ishikawa
 

Mais de Satoru Ishikawa (11)

re:Growth2019 Analytics Updates
re:Growth2019 Analytics Updatesre:Growth2019 Analytics Updates
re:Growth2019 Analytics Updates
 
Developers.IO 2019 Effective Datalake
Developers.IO 2019 Effective DatalakeDevelopers.IO 2019 Effective Datalake
Developers.IO 2019 Effective Datalake
 
re:invent 2018 analytics関連アップデート
re:invent 2018 analytics関連アップデートre:invent 2018 analytics関連アップデート
re:invent 2018 analytics関連アップデート
 
Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!
 
20161214 re growth-sapporo
20161214 re growth-sapporo20161214 re growth-sapporo
20161214 re growth-sapporo
 
Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114
 
re:Growth ビッグデータ観点で見た AWS re:Invent 2015
re:Growth ビッグデータ観点で見た AWS re:Invent 2015re:Growth ビッグデータ観点で見た AWS re:Invent 2015
re:Growth ビッグデータ観点で見た AWS re:Invent 2015
 
db-tech-showcase-sapporo-b24-20150911p
db-tech-showcase-sapporo-b24-20150911pdb-tech-showcase-sapporo-b24-20150911p
db-tech-showcase-sapporo-b24-20150911p
 
Cmdevio2015 devday-g-3
Cmdevio2015 devday-g-3Cmdevio2015 devday-g-3
Cmdevio2015 devday-g-3
 
Running Amazon S3 Encryption
Running Amazon S3 EncryptionRunning Amazon S3 Encryption
Running Amazon S3 Encryption
 
Cloud Programing for beginner
Cloud Programing for beginnerCloud Programing for beginner
Cloud Programing for beginner
 

データ分析を支える技術 DWH再入門