SlideShare a Scribd company logo
1 of 41
Download to read offline
Cloud Onr
Cloud OnAir
Cloud OnAir
BigQuery へデータを読み込む
2019 年 3 月 14 日 放送
Cloud OnAir
本日は、
BigQuery へ「データを読み込む」という言葉で統一してご説明します
言葉の整理
Data
読み込む
Cloud OnAir
1. BigQuery とは?
2. データ読み込みの基本
3. GCP からの読み込み
4. Google サービスからの読み込み
5. BigQuery へ読み込まない選択肢
6. サードパーティ ツールとの連携
Agenda
Cloud OnAir
Cloud OnAir
BigQuery とは?
Cloud OnAir
サーバレスで自動的にスケールするデータウェアハウス (DWH)
BigQuery とは?
フルマネージドでサーバレス
暗号化、高耐久性、高可用性
ペタバイトスケールで便利で高速な SQL
分析のためのエンタープライズ向け DWH
Cloud OnAir
例えば……
● Web サイト、ソーシャルメディアの行動データ
● Web 広告の実績レポート
● IoT / センサー データ
● 売上データ / POS データ
● サーバログ / インフラ モニタログ
● ゲームやモバイルアプリの操作ログ ……など
BigQuery で扱われるデータ
Cloud OnAir
BigQuery にデータを集める理由
Data
なぜ?
Cloud OnAir
BigQuery にデータを集める理由
Data
集めたあとに
利用しやすいから
Cloud OnAir
BigQuery エコシステム
可視化
分析 ● BigQuery
● Google スプレッドシート
● JDBC / ODBC コネクター
● Google データポータル
● Tableau
● Qlik
● looker
… etc
Cloud OnAir
Google Cloud エコシステム
再処理
機械学習
Cloud Dataproc Cloud Dataflow
Cloud
ML Engine
Cloud Datalab
Cloud OnAir
Cloud OnAir
データ読み込みの基本
Cloud OnAir
データ読み込みの単位
● バッチロード
● ストリーミングインサート
データ読み込みの経路
● ローカルファイルから
● Google Cloud Storage から
● その他サービスから
ファイルフォーマット
● CSV, JSON, Avro, Parquet, ORC
基本的な分類
Cloud OnAir
バッチロード (ストリーミングインサート以外のもの )
特徴
料金
制限
ストリーミングインサート
特徴
料金
制限
データ読み込みの単位
● ジョブを実行してデータを読み込む方法
● DML ステートメント (いわゆる INSERT 文など) もこちら
無料
1 日あたり 1,000 ジョブ / テーブル and 50,000 ジョブ / プロジェクト
● 1 度に 1 行ずつ読み込む方法
● データが読み込まれてから数秒以内でリアルタイムに分析が可能
読み込みに成功した行あたりで若干の料金がかかる
行とリクエストのサイズ、 1 秒あたりの行数とバイト数、リクエストあたりの行数に制限
DMLの場合 50,000 ジョブ / プロジェクトの制限はなし
Cloud OnAir
データ読み込みの経路
Cloud Storage 上の
ファイルから
● バケットを BigQuery の
データセットと同じ
リージョンに配置すること
ローカルファイルから
● ウェブ UI の場合は
ファイルサイズなどに
注意すること
その他サービスから
?
Cloud OnAir
CSV
JSON
読み込みに対応しているファイルフォーマット
Avro
Parquet
ORC
プレーンテキスト
行指向
列指向
編集が容易
読み込みが高速
読み込みが高速
Cloud OnAir
● エンコード UTF-8 (推奨)
● DATE 列 YYYY-MM-DD
● TIMESTAMP 列 YYYY-MM-DD hh:mm:ss
● 改行区切り
● マップや辞書は使えない
CSV と JSON の両方
JSON のみ
CSV or JSON を読み込む場合の注意点
https://cloud.google.com/bigquery/docs/loading-data-cloud-storage?hl=ja#limitations
Cloud OnAir
CSV か JSON を読み込む際の機能 (外部テーブルとして読み込む場合も)
● 最大 100 行をサンプルとして
各フィールドを検証
● スキーマの他にも自動検出
○ 圧縮 / 非圧縮
○ 日付
○ タイムスタンプ
○ 区切り文字 (CSV の場合)
○ 引用付き改行 (CSV の場合)
スキーマの自動検出機能
https://cloud.google.com/bigquery/docs/schema-detect?hl=ja
Cloud OnAir
Cloud OnAir
GCP からの読み込み
Cloud OnAir
● Cloud Storage
○ データファイル
○ Cloud Datastore
○ Cloud Firestore
○ Firebase Realtime Database
● Cloud Dataflow
● Stackdriver Logging
● アプリケーションなどから直接読み込む
● ウェブ UI
GCP サービスを通す
Cloud OnAir
● 各種データファイル
● Cloud Datastore エクスポート
● Cloud Firestore エクスポート
● (Firebase Realtime Database エクスポート)
● Data Transfer Service による
定期読み込みが可能(ベータ)
Cloud Storage を通す
Cloud
Storage
Cloud OnAir
● Dataflow がデータを加工し
BigQuery にデータを読み込む
Cloud Dataflow を通す
Cloud
Dataflow
Cloud OnAir
● あらゆる所から集まる
Stackdriver Logging のログを、
BigQuery に読み込む
● エクスポート機能を利用すれば
直接 BigQuery に読み込むことも
Cloud Storage に出力してから
読み込むことも可能
Stackdriver Logging を通す
Stackdriver
Logging
https://cloud.google.com/logging/docs/export/configure_export_v2?hl=ja
Cloud OnAir
GCP 内外のサーバで稼働している
アプリケーションから直接データを読み込む
● API
● bq コマンド
● クライアント ライブラリ
● (サードパーティツール)
アプリケーションなどから直接読み込む
● API
● bq コマンド
● クライアントライブラリ
● サードパーティツール
Cloud OnAir
Cloud Console を使って読み込む
● 「テーブルを作成」 から
新規読み込みと
追加読み込みができる
● Cloud Storage や
外部データソースも
データ元として選択できる
● ファイルサイズ < 10 MB
行数 < 16,000
ウェブ UI を通す
Cloud OnAir
Cloud OnAir
Google サービスからの読み込み
Cloud OnAir
● BigQuery Data Transfer Service
○ キャンペーン マネージャー
○ Google アド マネージャー
○ Google 広告
○ Google Play (ベータ)
○ YouTube チャンネル レポート
○ YouTube コンテンツ所有者レポート
○ Cloud Storage (定期実行)
● Google アナリティクス 360
● Firebase
BigQuery へデータを読み込める Google のサービス
Cloud OnAir
BigQuery Data Transfer Service のラインナップ
キャンペーン
マネージャー
Google
アド マネージャー
Google
Play
(ベータ)
Youtube
チャンネル レポート
Google
広告
Youtube
コンテンツ所有者
レポート
+
Cloud
Storage
Cloud OnAir
BigQuery Data Transfer Service を利用すると
一貫したウェブ UI, コマンド, API を通じて
右のような操作を実行できます
BigQuery Data Transfer Service の特徴
● 転送構成に関する情報の取得
● 転送構成の一覧表示
● 転送の実行履歴の表示
● ログメッセージなどの転送実行の詳細の表示
● 転送の更新
● バックフィルの設定
● 認証情報の更新
● 転送の無効化
● 転送の削除
● 実行通知 (アルファ)
Cloud OnAir
サービスごとの基本的な動作
サービス スケジュール リフレッシュウィンドウ 最大バックフィル期間
キャンペーンマネージャー
設定の作成時刻に基づき8 時間ごと
設定変更不可
過去 2 日間
設定変更不可
過去 60 日間
Google アド マネージャー
設定の作成時刻に基づき8 時間ごと
設定変更不可
過去 2 日間
設定変更不可
過去 60 日間
Google 広告
毎日、設定を作成した時刻
設定変更可能
過去 7 日間
設定変更可能(最大 30 日)
制限なし
1 回のリクエスト上限180 日間
Google Play (ベータ)
毎日、設定を作成した時刻
設定変更可能
過去 7 日間
設定変更不可
制限なし
1 回のリクエスト上限180 日間
YouTube チャンネルレポート
毎日、14:10 頃 (UTC)
設定変更可能
過去 1 日
設定変更不可
過去 180 日間
YouTube コンテンツ所有者レポート
毎日、14:45 頃 (UTC)
設定変更可能
過去 1 日
設定変更不可
過去 180 日間
Cloud OnAir
Cloud Storage (ベータ)
● Cloud Storage から BigQuery への繰り返しのデータ読み込みを自動化できます
● Cloud Storage のパスと宛先テーブルはパラメータ化が可能
○ 特定の日付に一致するファイルを取得する
■ 例: gs://bucket/events-{run_time|"%Y%m%d"}/*.csv 
 → gs://bucket/events-20190314/*.csv 
○ 宛先テーブルをどのように分割するかを指定する
■ 例: mytable_{run_time|"%Y%m%d"} → mytable_20190314 
注意点
● ファイルのスキーマは宛先テーブルで定義されているものと同じである必要があります
● 作成後 1 時間以上経過しているファイルが転送の対象となります
BigQuery Data Transfer Service for Cloud Storage
https://cloud.google.com/bigquery/docs/cloud-storage-transfer-overview?hl=ja
Cloud OnAir
Data Transfer Service を設定するために必要な条件
● 該当のサービスに対するアカウントを持っていること
● それぞれのサービス側と BigQuery 側で適切な権限を持っていること
サポート窓口
● サポート利用のための窓口が分かれています
○ レポートやアクセス許可に関する内容はデータ元のサポートチームへ
○ 請求またはデータ取得に関する内容は Google Cloud サポートチームへ
● 公式サイトのトラブルシューティングのページ やよくある質問のページ が
充実しているのでご活用ください
BigQuery Data Transfer Service の注意事項
Cloud OnAir
特徴
● データ読み込みのタイミングをバッチ処理とストリーミング処理の 2 パターンから選べる
注意点
● BigQuery Data Transfer Service の枠組みではないので転送通知などの機能を利用できない
○ アナリティクス 360 側の BigQuery Export という機能を利用している
● ストリーミング処理の場合、 BigQuery 側でストリーミングインサートの料金が発生する
Google アナリティクス 360
サービス スケジュール リフレッシュウィンドウ 最大バックフィル期間
Google アナリティクス360
バッチ:毎日、8 時間毎
ストリーミング:約15 分毎
バッチ:
前日のデータ1 ファイルと、
その日のデータ3 ファイル
13 か月分または100 億件の
ヒットのいずれか少ない方
Cloud OnAir
BigQuery へ読み込めるデータ
● Firebase 向け Google アナリティクス
● Crashlytics
● Cloud Messaging
● Predictions
注意点
● アナリティクスは有料プランのみ
● バックフィルはサポートしていません
Firebase
サービス スケジュール リフレッシュウィンドウ 最大バックフィル期間
Firebase ストリーミング:20 分以内 - なし
Cloud OnAir
Cloud OnAir
BigQuery へ読み込まない選択肢
Cloud OnAir
これらの機能を利用すると「 BigQuery へデータを読み込む」という手順をスキップして、
直接データにクエリを発行することができます
● 公開データセット
● 外部データソース (フェデレーション データソース)
読み込まない
Cloud OnAir
特徴
● Google やサードパーティでホストされているパブリックなデータセット
○ 有償の商用データセットもあります
● 自分のデータセットの共有設定を変更して、公開データセットとしてパブリックに共有すること
もできます
注意点
● 一般公開データセットは US マルチリージョン ロケーションに格納されています
公開データセット
https://cloud.google.com/bigquery/public-data/?hl=ja
Cloud OnAir
データが BigQuery に格納されていない場合でも直接クエリを発行できるデータソース
データの読み込む代わりに、外部データソースを参照するテーブルを作成します
対象となるデータソース
● Google Cloud Bigtable(ベータ)
● Google Cloud Storage
○ CSV, JSON, Avro, Cloud Datastore エクスポート, Cloud Firestore エクスポート
● Google ドライブ
○ CSV, JSON, Avro, Google スプレッドシート(最初のタブのみ)
注意点
● 外部データソースに対するクエリのパフォーマンスは BigQuery 内のデータに対するクエリよりも低くなる
可能性があります
外部データソース(フェデレーション データソース)
https://cloud.google.com/bigquery/external-data-sources?hl=ja
Cloud OnAir
Cloud OnAir
サードパーティツールとの連携
Cloud OnAir
データの抽出、変換、読み込みを効率化したり、データ処理のワークフローを管理したりするのに
役立つツールやソリューションがパートナー各社から提供されています。
その他サードパーティツールとの連携
alooma
BLEND
Simba
Fivetran
Lutics
Informatica
Keen IO
snapLogic
SAP
MATILLION
striim
SKYVIA
talend
Segment
fluentd
Pluto7
Stitch
TREASURE DATA
xplenty
SWITCHBOARDSOFTWARE
etc
Cloud OnAir
Cloud OnAir
まとめ
Cloud OnAir
BigQuery へデータを読み込む方法は豊富!
BigQuery
Compute
Engine
Stackdriver
Logging
Cloud
Storage
Cloud
Firestore
Cloud
Datastore BigQuery Data
Transfer Services
サードパーティ
ツール
Cloud
Bigtable
Firebase
RTDB

More Related Content

What's hot

[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送Google Cloud Platform - Japan
 
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみた
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみたSQLおじさん(自称)がBigQueryのStandard SQLを使ってみた
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみたKumano Ryo
 
Azure Kubernetes Service Overview
Azure Kubernetes Service OverviewAzure Kubernetes Service Overview
Azure Kubernetes Service OverviewTakeshi Fukuhara
 
FastAPIのテンプレートプロジェクトがいい感じだった話
FastAPIのテンプレートプロジェクトがいい感じだった話FastAPIのテンプレートプロジェクトがいい感じだった話
FastAPIのテンプレートプロジェクトがいい感じだった話NipponAlgorithm
 
ここまできた! Google Cloud Platform Virtual Private Cloud 徹底解説
ここまできた! Google Cloud Platform Virtual Private Cloud 徹底解説ここまできた! Google Cloud Platform Virtual Private Cloud 徹底解説
ここまできた! Google Cloud Platform Virtual Private Cloud 徹底解説Yuta Hono
 
これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本Tomohiro Shinden
 
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演Preferred Networks
 
協調フィルタリング入門
協調フィルタリング入門協調フィルタリング入門
協調フィルタリング入門hoxo_m
 
Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)
Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)
Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)Keisuke Takahashi
 
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)Preferred Networks
 
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みリクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みRecruit Technologies
 
[Cloud OnAir] Cloud Data Fusion で GCP にデータを集約して素早く分析を開始しよう 2019年10月31日 放送
[Cloud OnAir] Cloud Data Fusion で GCP にデータを集約して素早く分析を開始しよう  2019年10月31日 放送[Cloud OnAir] Cloud Data Fusion で GCP にデータを集約して素早く分析を開始しよう  2019年10月31日 放送
[Cloud OnAir] Cloud Data Fusion で GCP にデータを集約して素早く分析を開始しよう 2019年10月31日 放送Google Cloud Platform - Japan
 
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...NTT DATA Technology & Innovation
 
BigQueryの課金、節約しませんか
BigQueryの課金、節約しませんかBigQueryの課金、節約しませんか
BigQueryの課金、節約しませんかRyuji Tamagawa
 
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
BigQuery Query Optimization クエリ高速化編
BigQuery Query Optimization クエリ高速化編BigQuery Query Optimization クエリ高速化編
BigQuery Query Optimization クエリ高速化編sutepoi
 
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)Hadoop / Spark Conference Japan
 

What's hot (20)

[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
[Cloud OnAir] BigQuery で実現する Smart Analytics Platform 2019年10月24日 放送
 
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
 
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみた
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみたSQLおじさん(自称)がBigQueryのStandard SQLを使ってみた
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみた
 
Azure Kubernetes Service Overview
Azure Kubernetes Service OverviewAzure Kubernetes Service Overview
Azure Kubernetes Service Overview
 
FastAPIのテンプレートプロジェクトがいい感じだった話
FastAPIのテンプレートプロジェクトがいい感じだった話FastAPIのテンプレートプロジェクトがいい感じだった話
FastAPIのテンプレートプロジェクトがいい感じだった話
 
ここまできた! Google Cloud Platform Virtual Private Cloud 徹底解説
ここまできた! Google Cloud Platform Virtual Private Cloud 徹底解説ここまできた! Google Cloud Platform Virtual Private Cloud 徹底解説
ここまできた! Google Cloud Platform Virtual Private Cloud 徹底解説
 
これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本これでBigQueryをドヤ顔で語れる!BigQueryの基本
これでBigQueryをドヤ顔で語れる!BigQueryの基本
 
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
スタートアップが提案する2030年の材料開発 - 2022/11/11 QPARC講演
 
Azure Search 大全
Azure Search 大全Azure Search 大全
Azure Search 大全
 
協調フィルタリング入門
協調フィルタリング入門協調フィルタリング入門
協調フィルタリング入門
 
Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)
Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)
Azure Database for PostgreSQL 入門 (PostgreSQL Conference Japan 2021)
 
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
 
MLOps入門
MLOps入門MLOps入門
MLOps入門
 
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組みリクルートのビッグデータ活用基盤とデータ活用に向けた取組み
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
 
[Cloud OnAir] Cloud Data Fusion で GCP にデータを集約して素早く分析を開始しよう 2019年10月31日 放送
[Cloud OnAir] Cloud Data Fusion で GCP にデータを集約して素早く分析を開始しよう  2019年10月31日 放送[Cloud OnAir] Cloud Data Fusion で GCP にデータを集約して素早く分析を開始しよう  2019年10月31日 放送
[Cloud OnAir] Cloud Data Fusion で GCP にデータを集約して素早く分析を開始しよう 2019年10月31日 放送
 
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
 
BigQueryの課金、節約しませんか
BigQueryの課金、節約しませんかBigQueryの課金、節約しませんか
BigQueryの課金、節約しませんか
 
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
BigQuery Query Optimization クエリ高速化編
BigQuery Query Optimization クエリ高速化編BigQuery Query Optimization クエリ高速化編
BigQuery Query Optimization クエリ高速化編
 
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
 

Similar to [Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送

[Cloud OnAir] お客様事例紹介 -リクルートライフスタイルにおける デジタルトランスフォーメーションとクラウド活用- 2018年7月12日 放送
[Cloud OnAir] お客様事例紹介 -リクルートライフスタイルにおける デジタルトランスフォーメーションとクラウド活用- 2018年7月12日 放送[Cloud OnAir] お客様事例紹介 -リクルートライフスタイルにおける デジタルトランスフォーメーションとクラウド活用- 2018年7月12日 放送
[Cloud OnAir] お客様事例紹介 -リクルートライフスタイルにおける デジタルトランスフォーメーションとクラウド活用- 2018年7月12日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送Google Cloud Platform - Japan
 
Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出
Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出
Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出Google Cloud Platform - Japan
 
[Cloud OnAir] Google Cloud Next '18 in London 最新情報 2018年10月18日 放送
[Cloud OnAir] Google Cloud Next '18 in London 最新情報 2018年10月18日 放送[Cloud OnAir] Google Cloud Next '18 in London 最新情報 2018年10月18日 放送
[Cloud OnAir] Google Cloud Next '18 in London 最新情報 2018年10月18日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送
[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送
[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送Google Cloud Platform - Japan
 
Google Cloud ベストプラクティス:Google BigQuery 編 - 03 : パフォーマンスとコストの最適化
Google Cloud ベストプラクティス:Google BigQuery 編 - 03 : パフォーマンスとコストの最適化Google Cloud ベストプラクティス:Google BigQuery 編 - 03 : パフォーマンスとコストの最適化
Google Cloud ベストプラクティス:Google BigQuery 編 - 03 : パフォーマンスとコストの最適化Google Cloud Platform - Japan
 
30%のMAU増加と78%のコスト削減を両立する方法.pptx
30%のMAU増加と78%のコスト削減を両立する方法.pptx30%のMAU増加と78%のコスト削減を両立する方法.pptx
30%のMAU増加と78%のコスト削減を両立する方法.pptxiRidge, Inc.
 
[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送
[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送
[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Google Compute Engine に Deep Dive! 基本から運用時のベストプラクティスまで 2018年7月1...
[Cloud OnAir] Google Compute Engine に Deep Dive! 基本から運用時のベストプラクティスまで 2018年7月1...[Cloud OnAir] Google Compute Engine に Deep Dive! 基本から運用時のベストプラクティスまで 2018年7月1...
[Cloud OnAir] Google Compute Engine に Deep Dive! 基本から運用時のベストプラクティスまで 2018年7月1...Google Cloud Platform - Japan
 
[Cloud OnAir] GCP でできる Lift & Shift 〜 移行支援ツールも各種ご紹介 〜 2019年1月17日 放送
[Cloud OnAir] GCP でできる Lift & Shift 〜 移行支援ツールも各種ご紹介 〜 2019年1月17日 放送[Cloud OnAir] GCP でできる Lift & Shift 〜 移行支援ツールも各種ご紹介 〜 2019年1月17日 放送
[Cloud OnAir] GCP でできる Lift & Shift 〜 移行支援ツールも各種ご紹介 〜 2019年1月17日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Cloud Run & Firestore で、実践アジャイル開発 2020年6月25日 放送
[Cloud OnAir] Cloud Run & Firestore で、実践アジャイル開発 2020年6月25日 放送[Cloud OnAir] Cloud Run & Firestore で、実践アジャイル開発 2020年6月25日 放送
[Cloud OnAir] Cloud Run & Firestore で、実践アジャイル開発 2020年6月25日 放送Google Cloud Platform - Japan
 
Airflowを広告データのワークフローエンジンとして運用してみた話
Airflowを広告データのワークフローエンジンとして運用してみた話Airflowを広告データのワークフローエンジンとして運用してみた話
Airflowを広告データのワークフローエンジンとして運用してみた話Katsunori Kanda
 
Developer summit 2015 GCP
Developer summit 2015  GCPDeveloper summit 2015  GCP
Developer summit 2015 GCPKiyoshi Fukuda
 
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送Google Cloud Platform - Japan
 
GCP でも Serverless!!
GCP でも Serverless!!GCP でも Serverless!!
GCP でも Serverless!!Igarashi Toru
 
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送Google Cloud Platform - Japan
 
[Aws]database migration seminar_20191008
[Aws]database migration seminar_20191008[Aws]database migration seminar_20191008
[Aws]database migration seminar_20191008Toru Kimura
 
[Cloud OnAir] Dive to Google Kubernetes Engine 2018年8月2日 放送
[Cloud OnAir] Dive to Google Kubernetes Engine 2018年8月2日 放送[Cloud OnAir] Dive to Google Kubernetes Engine 2018年8月2日 放送
[Cloud OnAir] Dive to Google Kubernetes Engine 2018年8月2日 放送Google Cloud Platform - Japan
 

Similar to [Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送 (20)

[Cloud OnAir] お客様事例紹介 -リクルートライフスタイルにおける デジタルトランスフォーメーションとクラウド活用- 2018年7月12日 放送
[Cloud OnAir] お客様事例紹介 -リクルートライフスタイルにおける デジタルトランスフォーメーションとクラウド活用- 2018年7月12日 放送[Cloud OnAir] お客様事例紹介 -リクルートライフスタイルにおける デジタルトランスフォーメーションとクラウド活用- 2018年7月12日 放送
[Cloud OnAir] お客様事例紹介 -リクルートライフスタイルにおける デジタルトランスフォーメーションとクラウド活用- 2018年7月12日 放送
 
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
 
Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出
Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出
Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出
 
[Cloud OnAir] Google Cloud Next '18 in London 最新情報 2018年10月18日 放送
[Cloud OnAir] Google Cloud Next '18 in London 最新情報 2018年10月18日 放送[Cloud OnAir] Google Cloud Next '18 in London 最新情報 2018年10月18日 放送
[Cloud OnAir] Google Cloud Next '18 in London 最新情報 2018年10月18日 放送
 
[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送
[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送
[Cloud OnAir] Google Cloud へのマイグレーション ツールの紹介 2020年11月26日 放送
 
Google Cloud ベストプラクティス:Google BigQuery 編 - 03 : パフォーマンスとコストの最適化
Google Cloud ベストプラクティス:Google BigQuery 編 - 03 : パフォーマンスとコストの最適化Google Cloud ベストプラクティス:Google BigQuery 編 - 03 : パフォーマンスとコストの最適化
Google Cloud ベストプラクティス:Google BigQuery 編 - 03 : パフォーマンスとコストの最適化
 
30%のMAU増加と78%のコスト削減を両立する方法.pptx
30%のMAU増加と78%のコスト削減を両立する方法.pptx30%のMAU増加と78%のコスト削減を両立する方法.pptx
30%のMAU増加と78%のコスト削減を両立する方法.pptx
 
[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送
[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送
[Cloud OnAir] Google Workspace でできる データ分析と業務自動化のご紹介 2020年12月3日 放送
 
[Cloud OnAir] Google Compute Engine に Deep Dive! 基本から運用時のベストプラクティスまで 2018年7月1...
[Cloud OnAir] Google Compute Engine に Deep Dive! 基本から運用時のベストプラクティスまで 2018年7月1...[Cloud OnAir] Google Compute Engine に Deep Dive! 基本から運用時のベストプラクティスまで 2018年7月1...
[Cloud OnAir] Google Compute Engine に Deep Dive! 基本から運用時のベストプラクティスまで 2018年7月1...
 
[Cloud OnAir] GCP でできる Lift & Shift 〜 移行支援ツールも各種ご紹介 〜 2019年1月17日 放送
[Cloud OnAir] GCP でできる Lift & Shift 〜 移行支援ツールも各種ご紹介 〜 2019年1月17日 放送[Cloud OnAir] GCP でできる Lift & Shift 〜 移行支援ツールも各種ご紹介 〜 2019年1月17日 放送
[Cloud OnAir] GCP でできる Lift & Shift 〜 移行支援ツールも各種ご紹介 〜 2019年1月17日 放送
 
[Cloud OnAir] Cloud Run & Firestore で、実践アジャイル開発 2020年6月25日 放送
[Cloud OnAir] Cloud Run & Firestore で、実践アジャイル開発 2020年6月25日 放送[Cloud OnAir] Cloud Run & Firestore で、実践アジャイル開発 2020年6月25日 放送
[Cloud OnAir] Cloud Run & Firestore で、実践アジャイル開発 2020年6月25日 放送
 
Airflowを広告データのワークフローエンジンとして運用してみた話
Airflowを広告データのワークフローエンジンとして運用してみた話Airflowを広告データのワークフローエンジンとして運用してみた話
Airflowを広告データのワークフローエンジンとして運用してみた話
 
FirebaseAnalytics_BigQuery_Datastudio
FirebaseAnalytics_BigQuery_DatastudioFirebaseAnalytics_BigQuery_Datastudio
FirebaseAnalytics_BigQuery_Datastudio
 
Developer summit 2015 gcp
Developer summit 2015   gcpDeveloper summit 2015   gcp
Developer summit 2015 gcp
 
Developer summit 2015 GCP
Developer summit 2015  GCPDeveloper summit 2015  GCP
Developer summit 2015 GCP
 
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
[Cloud OnAir] 【Google Kubernetes Engine 演習】解説を聞きながら GKE を体験しよう 2020年10月29日 放送
 
GCP でも Serverless!!
GCP でも Serverless!!GCP でも Serverless!!
GCP でも Serverless!!
 
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
[Cloud OnAir] Google Cloud における RDBMS の運用パターン 2020年11月19日 放送
 
[Aws]database migration seminar_20191008
[Aws]database migration seminar_20191008[Aws]database migration seminar_20191008
[Aws]database migration seminar_20191008
 
[Cloud OnAir] Dive to Google Kubernetes Engine 2018年8月2日 放送
[Cloud OnAir] Dive to Google Kubernetes Engine 2018年8月2日 放送[Cloud OnAir] Dive to Google Kubernetes Engine 2018年8月2日 放送
[Cloud OnAir] Dive to Google Kubernetes Engine 2018年8月2日 放送
 

More from Google Cloud Platform - Japan

Google Cloud でアプリケーションを動かす.pdf
Google Cloud でアプリケーションを動かす.pdfGoogle Cloud でアプリケーションを動かす.pdf
Google Cloud でアプリケーションを動かす.pdfGoogle Cloud Platform - Japan
 
[External] 2021.12.15 コンテナ移行の前に知っておきたいこと @ gcpug 湘南
[External] 2021.12.15 コンテナ移行の前に知っておきたいこと  @ gcpug 湘南[External] 2021.12.15 コンテナ移行の前に知っておきたいこと  @ gcpug 湘南
[External] 2021.12.15 コンテナ移行の前に知っておきたいこと @ gcpug 湘南Google Cloud Platform - Japan
 
【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編
【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編
【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編Google Cloud Platform - Japan
 
[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ 〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送
[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ  〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ  〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送
[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ 〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...
[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...
[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...Google Cloud Platform - Japan
 
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...Google Cloud Platform - Japan
 
[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送
[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送
[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送
[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送
[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送
[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送
[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送Google Cloud Platform - Japan
 
明日から役立つ BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
明日から役立つ  BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online明日から役立つ  BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
明日から役立つ BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: OnlineGoogle Cloud Platform - Japan
 
『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online
『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online
『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: OnlineGoogle Cloud Platform - Japan
 
[Cloud OnAir] Talks by DevRel Vol.4 データ管理とデータ ベース 2020年8月27日 放送
[Cloud OnAir] Talks by DevRel Vol.4 データ管理とデータ ベース 2020年8月27日 放送[Cloud OnAir] Talks by DevRel Vol.4 データ管理とデータ ベース 2020年8月27日 放送
[Cloud OnAir] Talks by DevRel Vol.4 データ管理とデータ ベース 2020年8月27日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Talks by DevRel Vol.2 セキュリティ 2020年8月6日 放送
[Cloud OnAir] Talks by DevRel Vol.2 セキュリティ 2020年8月6日 放送[Cloud OnAir] Talks by DevRel Vol.2 セキュリティ 2020年8月6日 放送
[Cloud OnAir] Talks by DevRel Vol.2 セキュリティ 2020年8月6日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] Talks by DevRel Vol. 1 インフラストラクチャ 2020年7月30日 放送
[Cloud OnAir] Talks by DevRel Vol. 1 インフラストラクチャ 2020年7月30日 放送[Cloud OnAir] Talks by DevRel Vol. 1 インフラストラクチャ 2020年7月30日 放送
[Cloud OnAir] Talks by DevRel Vol. 1 インフラストラクチャ 2020年7月30日 放送Google Cloud Platform - Japan
 
[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...
[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...
[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...Google Cloud Platform - Japan
 

More from Google Cloud Platform - Japan (20)

ServerlessDays Tokyo 2022 Virtual.pdf
ServerlessDays Tokyo 2022 Virtual.pdfServerlessDays Tokyo 2022 Virtual.pdf
ServerlessDays Tokyo 2022 Virtual.pdf
 
20221105_GCPUG 女子会 Kubernets 編.pdf
20221105_GCPUG 女子会 Kubernets 編.pdf20221105_GCPUG 女子会 Kubernets 編.pdf
20221105_GCPUG 女子会 Kubernets 編.pdf
 
Google Cloud でアプリケーションを動かす.pdf
Google Cloud でアプリケーションを動かす.pdfGoogle Cloud でアプリケーションを動かす.pdf
Google Cloud でアプリケーションを動かす.pdf
 
[External] 2021.12.15 コンテナ移行の前に知っておきたいこと @ gcpug 湘南
[External] 2021.12.15 コンテナ移行の前に知っておきたいこと  @ gcpug 湘南[External] 2021.12.15 コンテナ移行の前に知っておきたいこと  @ gcpug 湘南
[External] 2021.12.15 コンテナ移行の前に知っておきたいこと @ gcpug 湘南
 
What’s new in cloud run 2021 後期
What’s new in cloud run 2021 後期What’s new in cloud run 2021 後期
What’s new in cloud run 2021 後期
 
【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編
【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編
【Dialogflow cx】はじめてみよう google cloud dialogflow cx 編
 
Google Cloud で実践する SRE
Google Cloud で実践する SRE  Google Cloud で実践する SRE
Google Cloud で実践する SRE
 
[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ 〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送
[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ  〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ  〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送
[Cloud OnAir] 事例紹介 : 株式会社マーケティングアプリケーションズ 〜クラウドへのマイグレーションとその後〜 2020年12月17日 放送
 
[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...
[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...
[Cloud OnAir] 【実演】Google Cloud VMware Engine と VMware ソリューションを組み合わせたハイブリッド環境の...
 
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
 
[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送
[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送
[Cloud OnAir] 【Anthos 演習】 解説を聞きながら Anthos を体験しよう 2020年11月5日 放送
 
[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送
[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送
[Cloud OnAir] Google Cloud の AI / IoT 最新事例紹介 2020年10月22日 放送
 
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
[Cloud OnAir] Google Cloud Next '20: OnAir 特別編 〜世界で人気のあったセッション特集〜 2020年9月24日 放送
 
[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送
[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送
[Cloud OnAir] Talks by DevRel Vol.5 アプリケーションのモダナイゼーション 2020年9月3日 放送
 
明日から役立つ BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
明日から役立つ  BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online明日から役立つ  BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
明日から役立つ BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
 
『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online
『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online
『MAGELLAN BLOCKS』を使って BigQuery を使い倒す!| Google Cloud INSIDE Games & Apps: Online
 
[Cloud OnAir] Talks by DevRel Vol.4 データ管理とデータ ベース 2020年8月27日 放送
[Cloud OnAir] Talks by DevRel Vol.4 データ管理とデータ ベース 2020年8月27日 放送[Cloud OnAir] Talks by DevRel Vol.4 データ管理とデータ ベース 2020年8月27日 放送
[Cloud OnAir] Talks by DevRel Vol.4 データ管理とデータ ベース 2020年8月27日 放送
 
[Cloud OnAir] Talks by DevRel Vol.2 セキュリティ 2020年8月6日 放送
[Cloud OnAir] Talks by DevRel Vol.2 セキュリティ 2020年8月6日 放送[Cloud OnAir] Talks by DevRel Vol.2 セキュリティ 2020年8月6日 放送
[Cloud OnAir] Talks by DevRel Vol.2 セキュリティ 2020年8月6日 放送
 
[Cloud OnAir] Talks by DevRel Vol. 1 インフラストラクチャ 2020年7月30日 放送
[Cloud OnAir] Talks by DevRel Vol. 1 インフラストラクチャ 2020年7月30日 放送[Cloud OnAir] Talks by DevRel Vol. 1 インフラストラクチャ 2020年7月30日 放送
[Cloud OnAir] Talks by DevRel Vol. 1 インフラストラクチャ 2020年7月30日 放送
 
[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...
[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...
[Cloud OnAir] [Cloud OnAir] 最新版 GCP ではじめる、サーバーレスアプリケーションの開発。 2020年5月28日 放送 20...
 

[Cloud OnAir] BigQuery へデータを読み込む 2019年3月14日 放送

  • 1. Cloud Onr Cloud OnAir Cloud OnAir BigQuery へデータを読み込む 2019 年 3 月 14 日 放送
  • 3. Cloud OnAir 1. BigQuery とは? 2. データ読み込みの基本 3. GCP からの読み込み 4. Google サービスからの読み込み 5. BigQuery へ読み込まない選択肢 6. サードパーティ ツールとの連携 Agenda
  • 5. Cloud OnAir サーバレスで自動的にスケールするデータウェアハウス (DWH) BigQuery とは? フルマネージドでサーバレス 暗号化、高耐久性、高可用性 ペタバイトスケールで便利で高速な SQL 分析のためのエンタープライズ向け DWH
  • 6. Cloud OnAir 例えば…… ● Web サイト、ソーシャルメディアの行動データ ● Web 広告の実績レポート ● IoT / センサー データ ● 売上データ / POS データ ● サーバログ / インフラ モニタログ ● ゲームやモバイルアプリの操作ログ ……など BigQuery で扱われるデータ
  • 9. Cloud OnAir BigQuery エコシステム 可視化 分析 ● BigQuery ● Google スプレッドシート ● JDBC / ODBC コネクター ● Google データポータル ● Tableau ● Qlik ● looker … etc
  • 10. Cloud OnAir Google Cloud エコシステム 再処理 機械学習 Cloud Dataproc Cloud Dataflow Cloud ML Engine Cloud Datalab
  • 12. Cloud OnAir データ読み込みの単位 ● バッチロード ● ストリーミングインサート データ読み込みの経路 ● ローカルファイルから ● Google Cloud Storage から ● その他サービスから ファイルフォーマット ● CSV, JSON, Avro, Parquet, ORC 基本的な分類
  • 13. Cloud OnAir バッチロード (ストリーミングインサート以外のもの ) 特徴 料金 制限 ストリーミングインサート 特徴 料金 制限 データ読み込みの単位 ● ジョブを実行してデータを読み込む方法 ● DML ステートメント (いわゆる INSERT 文など) もこちら 無料 1 日あたり 1,000 ジョブ / テーブル and 50,000 ジョブ / プロジェクト ● 1 度に 1 行ずつ読み込む方法 ● データが読み込まれてから数秒以内でリアルタイムに分析が可能 読み込みに成功した行あたりで若干の料金がかかる 行とリクエストのサイズ、 1 秒あたりの行数とバイト数、リクエストあたりの行数に制限 DMLの場合 50,000 ジョブ / プロジェクトの制限はなし
  • 14. Cloud OnAir データ読み込みの経路 Cloud Storage 上の ファイルから ● バケットを BigQuery の データセットと同じ リージョンに配置すること ローカルファイルから ● ウェブ UI の場合は ファイルサイズなどに 注意すること その他サービスから ?
  • 16. Cloud OnAir ● エンコード UTF-8 (推奨) ● DATE 列 YYYY-MM-DD ● TIMESTAMP 列 YYYY-MM-DD hh:mm:ss ● 改行区切り ● マップや辞書は使えない CSV と JSON の両方 JSON のみ CSV or JSON を読み込む場合の注意点 https://cloud.google.com/bigquery/docs/loading-data-cloud-storage?hl=ja#limitations
  • 17. Cloud OnAir CSV か JSON を読み込む際の機能 (外部テーブルとして読み込む場合も) ● 最大 100 行をサンプルとして 各フィールドを検証 ● スキーマの他にも自動検出 ○ 圧縮 / 非圧縮 ○ 日付 ○ タイムスタンプ ○ 区切り文字 (CSV の場合) ○ 引用付き改行 (CSV の場合) スキーマの自動検出機能 https://cloud.google.com/bigquery/docs/schema-detect?hl=ja
  • 18. Cloud OnAir Cloud OnAir GCP からの読み込み
  • 19. Cloud OnAir ● Cloud Storage ○ データファイル ○ Cloud Datastore ○ Cloud Firestore ○ Firebase Realtime Database ● Cloud Dataflow ● Stackdriver Logging ● アプリケーションなどから直接読み込む ● ウェブ UI GCP サービスを通す
  • 20. Cloud OnAir ● 各種データファイル ● Cloud Datastore エクスポート ● Cloud Firestore エクスポート ● (Firebase Realtime Database エクスポート) ● Data Transfer Service による 定期読み込みが可能(ベータ) Cloud Storage を通す Cloud Storage
  • 21. Cloud OnAir ● Dataflow がデータを加工し BigQuery にデータを読み込む Cloud Dataflow を通す Cloud Dataflow
  • 22. Cloud OnAir ● あらゆる所から集まる Stackdriver Logging のログを、 BigQuery に読み込む ● エクスポート機能を利用すれば 直接 BigQuery に読み込むことも Cloud Storage に出力してから 読み込むことも可能 Stackdriver Logging を通す Stackdriver Logging https://cloud.google.com/logging/docs/export/configure_export_v2?hl=ja
  • 23. Cloud OnAir GCP 内外のサーバで稼働している アプリケーションから直接データを読み込む ● API ● bq コマンド ● クライアント ライブラリ ● (サードパーティツール) アプリケーションなどから直接読み込む ● API ● bq コマンド ● クライアントライブラリ ● サードパーティツール
  • 24. Cloud OnAir Cloud Console を使って読み込む ● 「テーブルを作成」 から 新規読み込みと 追加読み込みができる ● Cloud Storage や 外部データソースも データ元として選択できる ● ファイルサイズ < 10 MB 行数 < 16,000 ウェブ UI を通す
  • 25. Cloud OnAir Cloud OnAir Google サービスからの読み込み
  • 26. Cloud OnAir ● BigQuery Data Transfer Service ○ キャンペーン マネージャー ○ Google アド マネージャー ○ Google 広告 ○ Google Play (ベータ) ○ YouTube チャンネル レポート ○ YouTube コンテンツ所有者レポート ○ Cloud Storage (定期実行) ● Google アナリティクス 360 ● Firebase BigQuery へデータを読み込める Google のサービス
  • 27. Cloud OnAir BigQuery Data Transfer Service のラインナップ キャンペーン マネージャー Google アド マネージャー Google Play (ベータ) Youtube チャンネル レポート Google 広告 Youtube コンテンツ所有者 レポート + Cloud Storage
  • 28. Cloud OnAir BigQuery Data Transfer Service を利用すると 一貫したウェブ UI, コマンド, API を通じて 右のような操作を実行できます BigQuery Data Transfer Service の特徴 ● 転送構成に関する情報の取得 ● 転送構成の一覧表示 ● 転送の実行履歴の表示 ● ログメッセージなどの転送実行の詳細の表示 ● 転送の更新 ● バックフィルの設定 ● 認証情報の更新 ● 転送の無効化 ● 転送の削除 ● 実行通知 (アルファ)
  • 29. Cloud OnAir サービスごとの基本的な動作 サービス スケジュール リフレッシュウィンドウ 最大バックフィル期間 キャンペーンマネージャー 設定の作成時刻に基づき8 時間ごと 設定変更不可 過去 2 日間 設定変更不可 過去 60 日間 Google アド マネージャー 設定の作成時刻に基づき8 時間ごと 設定変更不可 過去 2 日間 設定変更不可 過去 60 日間 Google 広告 毎日、設定を作成した時刻 設定変更可能 過去 7 日間 設定変更可能(最大 30 日) 制限なし 1 回のリクエスト上限180 日間 Google Play (ベータ) 毎日、設定を作成した時刻 設定変更可能 過去 7 日間 設定変更不可 制限なし 1 回のリクエスト上限180 日間 YouTube チャンネルレポート 毎日、14:10 頃 (UTC) 設定変更可能 過去 1 日 設定変更不可 過去 180 日間 YouTube コンテンツ所有者レポート 毎日、14:45 頃 (UTC) 設定変更可能 過去 1 日 設定変更不可 過去 180 日間
  • 30. Cloud OnAir Cloud Storage (ベータ) ● Cloud Storage から BigQuery への繰り返しのデータ読み込みを自動化できます ● Cloud Storage のパスと宛先テーブルはパラメータ化が可能 ○ 特定の日付に一致するファイルを取得する ■ 例: gs://bucket/events-{run_time|"%Y%m%d"}/*.csv   → gs://bucket/events-20190314/*.csv  ○ 宛先テーブルをどのように分割するかを指定する ■ 例: mytable_{run_time|"%Y%m%d"} → mytable_20190314  注意点 ● ファイルのスキーマは宛先テーブルで定義されているものと同じである必要があります ● 作成後 1 時間以上経過しているファイルが転送の対象となります BigQuery Data Transfer Service for Cloud Storage https://cloud.google.com/bigquery/docs/cloud-storage-transfer-overview?hl=ja
  • 31. Cloud OnAir Data Transfer Service を設定するために必要な条件 ● 該当のサービスに対するアカウントを持っていること ● それぞれのサービス側と BigQuery 側で適切な権限を持っていること サポート窓口 ● サポート利用のための窓口が分かれています ○ レポートやアクセス許可に関する内容はデータ元のサポートチームへ ○ 請求またはデータ取得に関する内容は Google Cloud サポートチームへ ● 公式サイトのトラブルシューティングのページ やよくある質問のページ が 充実しているのでご活用ください BigQuery Data Transfer Service の注意事項
  • 32. Cloud OnAir 特徴 ● データ読み込みのタイミングをバッチ処理とストリーミング処理の 2 パターンから選べる 注意点 ● BigQuery Data Transfer Service の枠組みではないので転送通知などの機能を利用できない ○ アナリティクス 360 側の BigQuery Export という機能を利用している ● ストリーミング処理の場合、 BigQuery 側でストリーミングインサートの料金が発生する Google アナリティクス 360 サービス スケジュール リフレッシュウィンドウ 最大バックフィル期間 Google アナリティクス360 バッチ:毎日、8 時間毎 ストリーミング:約15 分毎 バッチ: 前日のデータ1 ファイルと、 その日のデータ3 ファイル 13 か月分または100 億件の ヒットのいずれか少ない方
  • 33. Cloud OnAir BigQuery へ読み込めるデータ ● Firebase 向け Google アナリティクス ● Crashlytics ● Cloud Messaging ● Predictions 注意点 ● アナリティクスは有料プランのみ ● バックフィルはサポートしていません Firebase サービス スケジュール リフレッシュウィンドウ 最大バックフィル期間 Firebase ストリーミング:20 分以内 - なし
  • 34. Cloud OnAir Cloud OnAir BigQuery へ読み込まない選択肢
  • 35. Cloud OnAir これらの機能を利用すると「 BigQuery へデータを読み込む」という手順をスキップして、 直接データにクエリを発行することができます ● 公開データセット ● 外部データソース (フェデレーション データソース) 読み込まない
  • 36. Cloud OnAir 特徴 ● Google やサードパーティでホストされているパブリックなデータセット ○ 有償の商用データセットもあります ● 自分のデータセットの共有設定を変更して、公開データセットとしてパブリックに共有すること もできます 注意点 ● 一般公開データセットは US マルチリージョン ロケーションに格納されています 公開データセット https://cloud.google.com/bigquery/public-data/?hl=ja
  • 37. Cloud OnAir データが BigQuery に格納されていない場合でも直接クエリを発行できるデータソース データの読み込む代わりに、外部データソースを参照するテーブルを作成します 対象となるデータソース ● Google Cloud Bigtable(ベータ) ● Google Cloud Storage ○ CSV, JSON, Avro, Cloud Datastore エクスポート, Cloud Firestore エクスポート ● Google ドライブ ○ CSV, JSON, Avro, Google スプレッドシート(最初のタブのみ) 注意点 ● 外部データソースに対するクエリのパフォーマンスは BigQuery 内のデータに対するクエリよりも低くなる 可能性があります 外部データソース(フェデレーション データソース) https://cloud.google.com/bigquery/external-data-sources?hl=ja