アプリ開発者、DB 管理者視点での Cloud Spanner 活用方法 | 第 10 回 Google Cloud INSIDE Games & Apps Online

#gc_inside
佐藤貴彦
アプリ開発者、DB管理者視点での
Cloud Spanner 活用方法
Data Management Specialist

自己紹介
佐藤貴彦 / Sato, Takahiko
Data Management Specialist
これまで複数の製品ベンダーにて、ネットワークやデータベースを中心としたインフラ周りの支援
に従事。Google Cloud では、お客様が GCP 上のデータベース系サービスをうまく活用できるよ
う、お客様の話を聞き一緒に議論していくことが仕事。
専門分野
データベース及びデータ処理全般（ RDBMS、NoSQL、DWH、Hadoop ）
ネットワーク
趣味
クライミング、ボルダリング

● Cloud Spanner 超概要
● Cloud Spanner 新機能紹介
● Cloud Spanner ツール紹介
● 新機能 & ツールデモ
● RDBMS の延長で考える Cloud Spanner
○ テーブルのしくみ
○ インデックスのしくみ
○ 外部キー制約のしくみ
○ 自動シャーディングのしくみ
本日のアジェンダ
RDBMS

GCP のデータベース / データストア関連サービス
Cloud
Storage
Cloud
Memorystore
BigQuery
リレーショナル非リレーショナルオブジェクト
データ
ウェアハウス
オブジェク
ストア
マネージド
Redis & memcached
Cloud Datastore /
Cloud Firestore
サーバーレスで
スケーラブルな
ドキュメントストア
Cloud
Bigtable
低レイテンシで
ワイドカラムストア
Cloud
SQL
マネージド
MySQL &
PostgreSQL &
SQL Server
Cloud
Spanner
スケーラブルで
可用性の高い
ミッションクリティカ
ル
RDBMS
サーバーレスで
エンタープライズ
DWH
インメモリ
今回のテーマ

Cloud Spanner とは、リレーショナルデータベースの
構造の利点と、非リレーショナルのスケーラビリティを
組み合わせた、新しいデータベース
● スキーマ、ACID トランザクション、
SQL をサポート
● スケールアウト / インが任意に実施可能
● フルマネージドなデータベース
● 非常に高い可用性を提供
○ SLA 99.99 % 〜 99.999 % を提供
○ メンテナンスダウンタイム無し
Cloud Spanner の特徴
性能
スケーラビリティ
SQL
運用管理

Cloud Spanner のインスタンスはリージョン単位で配置
Cloud Spanner
インスタンス
1 ノード
Cloud Spanner インスタンスを立てる際は、
どこのリージョンに配置するかを選ぶだけ。
東京リージョン (asia-northeast1)

Cloud Spanner の裏は 1 ノードをゾーンごとに配置 1
ゾーン a ゾーン b ゾーン c
node1 node1 node1
Cloud Spanner
インスタンス
1 ノード
1 ノード立てるとゾーンごとに 1 つずつ起動しており、
1 ノード構成であっても可用性を保つ設計になっている。

Cloud Spanner
インスタンス
1 ノード
node1 node1 node1
分散ストレージ
(Colossus)
(Colossus)
(Colossus)
実際のデータは分散ストレージである Colossus に保存されるため、
仮にノードで障害が起こっても、データへ影響は無し。

Cloud Spanner
インスタンス
1 ノード
node1 node1 node1
(Colossus)
(Colossus)
(Colossus)
コンピュート
ストレージ
コンピュートノードとストレージは切り離されており、
それぞれ独立して性能と可能性を担保。

ノード追加はコンピュートノードが起動するだけ
node1
node2 node1 node2 node1 node2
2 ノード目追加
数秒で起動完了
Cloud Spanner
インスタンス
2 ノード
(Colossus)
(Colossus)
(Colossus)
データは分散ストレージ経由で共有されているため、ノードの
追加と削除は速やかに完了する。
コンピュート
ストレージ

ユーザーはインスタンスの内側を意識することなく利用
Cloud Spanner API
の Front End
ユーザー
アプリケーション
ユーザー
アプリケーション
オンプレミスのデータセンタ
ユーザー
アプリケーションVPN
Cloud Spanner への接続は、Cloud Spanner API 用の Front End へ接続するだけ。
DNS の設定や接続先ゾーン、接続先ノードを意識する必要は一切なし。
クライアント
node1 node2

● Cloud Spanner は、RDBMS が提供しているように、 SQL によるクエリ
及びトランザクション処理が可能
● Cloud Spanner の提供するトランザクション分離レベルと整合性
○ Serializable（シリアライザブル） + External Consistency (外部整合性)
○ ユーザーが明示的にロック取らなくてもアノマリーは発生しないし、トランザク
ション間の時間の順序は入れ替わらない
● Cloud Spanner はロックの粒度を可能な限り最小限にしている
○ InnoDB が取得するロックを例にすると、Cloud Spanner ではギャップロック
相当は行うが、ネクストキーロック相当のものは取得しない
○ 行ロックではなくてセル単位でのロック
Cloud Spanner が提供するトランザクションとロック概要

Cloud Spanner 新機能紹介
14

外部キー制約（Foreign Keys）が追加
特徴
● 外部キー制約が DDL で定義できるようになった
● 非キー列や複数テーブル間で外部キー制約を実現
○ 補足：これまでは Cloud Spanner のインターリーブ機能（後述）
を利用して、外部キー制約に似たことを実現していた
player_items
PK player_id STRING(32)
PK, FK item_id INT64
quantity INT64
items
PK item_id INT64
name STRING(255)
price INT64

マネージドバックアップリストア
特徴
● インスタンス内の DB 単位でバックアップ取得
可能
● バックアップは、インスタンスに紐付いた専用領
域に保管され、最大 1 年間保持可能
● 同一インスタンス及び、同一リージョンの別の
インスタンスに対してリストア可能
● リストア時間は非常に高速

Cloud Spanner エミュレーターベータ
がリリース
特徴
● 任意の環境で動作可能なエミュレータを、バイナリ及びコンテナで提供
● 開発者のローカル環境はもちろん、CI / CD に組み込んでの利用も可能
● 開発コストの削減、開発効率の向上

注意点
● 現在まだベータ版
○ 現時点でサポートされるクライアントライブラリは Java、Go、C++
○ 外部キー制約やパーティション DML など一部の機能は未対応
● エミュレータと実機との動作の違い
○ Cloud Spanner エミュレーターでは内部的なロックの取り方が異なるため、
トランザクションの競合をテストするような用途には向かない
○ エラーメッセージの出方が異なる場合がある
の注意点

その他新機能（2019年中盤以降〜現在）
クエリオプティマイザの挙動をバージョン指定で選択可能に
C++ クライアントライブラリのリリース
1 ノード構成でも本番利用可能に（1 ノードで SLA を満たす）
WITH 句に対応
Hibernate ORM のリリース
JDBC ドライバーのリリース

● 対話形式で Cloud Spanner に対して SQL を実
行できるツール
○ https://github.com/cloudspannerecosy
stem/spanner-cli
● MySQLの mysql コマンド、PostgreSQL の
psql コマンドに似たもの
● Cloud Spanner が直接提供しているツールで
はなく、Cloud Spanner Ecosystem という
Cloud Spanner のユーザーコミュニティで公開
されている
各種検証に便利な spanner-cli

Cloud Spanner のユーザーコミュニティに
よってメンテナンスされている、Cloud
Spanner 用の各種ツール。
Cloud Spanner 用のインタラクティブな
CLI ツールである spanner-cli も、ここで
公開されている。
Cloud Spanner のエコシステム
https://cloudspannerecosystem.dev/

マネージドバックアップリストアのデモ
デ
モ

のデモ
デ
モ

RDBMS の延長で考える
Cloud Spanner
RDBMS

ゲームの DB を想定し 3 つのテーブルを用意
players: ゲームのプレイヤー情報
player_items: 各プレイヤーが保持するアイテム
items: 各アイテムのマスター情報
本資料で利用するサンプルスキーマ
players
name STRING(256)
level INT64
money INT64
player_items
quantity INT64
items
PK item_id INT64
name STRING(255)
price INT64last_used TIMESTAMP

テーブルのしくみ RDBMS

データベースにおいて、テーブル（表）は様々なデータ構
造で保存されている。
どのような形で保存されているかは、RDBMS によっても
異なる。また Cloud Spanner （以降 Spanner と省略）は
典型的な RDBMS とは異なる手法で保存している。
データベースは様々な構造を使ってデータを保持する
player_id name level money
1 bob 1 100
2 alice 2 0
5 carol 1 50
10 steve 2 10000
15 oscar 2 1000
20 dave 3 700
players
CREATE TABLE players (
player_id STRING(36) NOT NULL,
name STRING(256) NOT NULL,
level INT64 NOT NULL,
money INT64 NOT NULL
) PRIMARY KEY (player_id);
players テーブルの DDL の例
テーブルに入っているデータのイメージ実際にはどのように保存されてる？
RDBMS

● PK 列（主キー列）を1 つ持つテーブル
● RDBMS であれば PK 列は B+Tree のデータ構造になっ
ている
● B+Tree では PK 列でソートされた構造
● 例えば Write 時は B+Tree をたどった先のブロックを読み
出して該当レコードを修正し書き戻す
RDBMS のテーブルは B+Tree 構造
PK PK PK PK
record
record
record
record
1
2
10
5
一般的な RDBMS における
PK と各行のつながり
物理的な配置は分断している
可能性ありランダム I/O
1 bob 1 100
2 alice 2 0
5 carol 1 50
10 steve 2 10000
15 oscar 2 1000
20 dave 3 700
players
15
PK
record
1 2 5 10 15
リーフをたどると
PK がソートされている
RDBMS

● レコードを PK の B+Tree と物理的に同じ場所に配置している構造もある
○ クラスタ化インデックス- Clustered Index
○ InnoDB はこの仕組みでPK と行を格納している
○ RDBMS によってはこの構造での保存を指定するオプションもある
● クラスタ化（Clustered）とは、まとめて配置すること
補足：RDBMS も実装によって異なるテーブル構造
クラスタ化インデックス
な PK とレコード
record
record
record
record
PK PK PK PKPK PK PK PK
record
record
record
record
PK
record
PK とレコード
MySQL
(InnoDB)
PostgreSQL

Spanner のテーブルは LSM Tree と Sorted-String 構造
record
PK record
PK record
PK record
PK record
ソートされているため、どのブ
ロックにデータが入ってるか容
易に特定できる
1 record
2 record
5 record
10 record
15 record
20 record
30 record
35 record
PK
・・・
物理的にPK 順に
ソートして保存過去に更新されたデータほど
下の階層にマージされていく
merge
merge
record
PK record
50 record
PK
write
flushmemory
disk
player_id = 5 はどこ？
● Spanner のテーブルは PK 列で物理的にソートされた状態で格納される
○ 一般的には Sorted-String Table (SSTable) と呼ばれる種類のデータ構造
● Log Structured Merge Tree (LSM Tree) という階層構造と組み合わせて保持
○ Write 時は元のデータ（を含むブロック）を直接変更せず、一旦別で書き出したあとバッ
クグラウンドでマージしていく

● 典型的な RDBMS は、PK 列で論理的にソートされた状態で保存している
● Spanner では、PK 列で「物理的にソート」された状態で保存している
○ テーブル全体を B+Tree ではなく LSM Tree という構造で保持
Spanner のテーブルは常に PK で物理的にソート
1 bob 1 100
2 alice 2 0
5 carol 1 50
10 steve 2 10000
15 oscar 2 1000
20 dave 3 700
players
Spanner では
一定のレンジスキャンは
比較的得意
Spanner では書き込みの
スループットを稼ぎやすい
💡メモ
上位○○件や下位○○件
といった、必要な処理も対
応しやすい

インデックスのしくみ RDBMS

● 一般に RDBMS では、非キー列（PK 列以外の列）はバラバラに格納されているので、非キー
列の値で検索する場合、全件取り出して調べることになる
● 検索対象の列からPK 列を逆引きできるようにするのがセカンダリインデックス
● 単にインデックスと呼ばれることも多い（以下インデックスと略）
データベースにおける（セカンダリ）インデックスとは
1 bob 1 100
2 alice 2 0
5 carol 1 50
10 steve 2 10000
15 oscar 2 1000
20 dave 3 700
players
player_idname
1bob
2alice
5carol
10steve
15oscar
20dave
idx_players_name インデックスが無い場
合、全ての行を調べる
必要がある
対象列 PK を逆引きする
インデックス
例）name が ‘steve’ の人
の money を調べたい
インデックスをたどれば簡
単に探せる

実はインデックスもテーブルも同じ構造。
RDBMS ではどちらも B+Tree ベースの構造。
Spanner ではどちらも物理的にソートされた構造。
RDBMS と Spanner におけるインデックスの構造
1
2
5
10 10000
15
alice
bob
carol
oscar
steve
2
1
5
15
10
Spanner のインデックス Spanner のテーブル
1 2 5 10
10000
15
alice bob carol oscar steve
2 1 5 15 10
RDBMS のインデックス
RDBMS のテーブル
idx_players_name
players
playersidx_players_name
RDBMS

● Spanner のインデックスは Spanner のテーブルと同じ構造
○ RDBMS でイメージしがちな B+Tree の構造ではない
● Spanner でインデックスを 1 つ作ると、1 行の書き込みで 2 テーブルへの同時書
き込みが発生するのと同義
● 更新負荷が増えるという観点は RDBMS のインデックスも同じ
セカンダリインデックスとテーブルは同じ構造
1
2
5
10
15
alice
bob
carol
oscar
steve
2
1
5
15
10
playersidx_players_name
20 dave, ..dave 20
INSERT INTO players …
values (20, dave, ...);
💡メモ

外部キー制約のしくみ RDBMS

● 外部キーによる参照整合性制約を実現するためには、更新処理を行う際に、
テーブルを相互に参照して確認する必要がある
● これを実現するために、RDBMS でも Spanner でもインデックスを使う
last_useditem_id
外部キーと参照整合性制約
player_id quantity
1 1 10
1 2 2
1 3 1
player_items
name price
1 薬草 50
2 すごい薬草 500
3 最高の薬草 1000
items
1 4 1INSERT
item_id
外部キーによる参照
参照先に item_id = 4
がないから挿入失敗
参照先に
item_id = 3 がまだ
あるから削除失敗 DELETE

● Spanner で外部キー制約を作成すると、暗黙のインデックスが作成される
● 参照先のテーブルは PK 経由でチェックができるため、通常は参照先から参照元
を逆向きにたどるためのインデックスが 1 つ作られる
Spanner で外部キー制約を利用した際のデータ構造
record
record
record
1
2
3
1 record
1 record
1 record
1 record
1
2
3
Spanner の外部キー用の
セカンダリインデックス
player_items
外部キーによる参照
INSERT時のチェック
1
2
3
4
1
1
1
1
2
3
4
items
DELETE 時のチェック
暗黙idx

● Spanner で外部キー制約を作ると暗黙のインデックスが作成される
● 外部キー制約の参照元のテーブルを更新すると、1 行の書き込みで 2 テーブル
への同時書き込みが発生することになる
● 暗黙のインデックスが作成されるのは RDBMS も Spanner も同じ
外部キー制約にはインデックスが生成される💡メモ
Spanner の Information Schema で確認できる暗黙のインデックス

自動シャーディング
のしくみ
RDBMS

RDBMS でのスケールアウトには手動シャーディング
シャード1 シャード2 シャード3
RDBMS RDBMS RDBMS
典型的な RDBMS でスケールアウトをするためには、ユーザー管理に
よって DB を手動で分割。各シャードは物理的に分割されているため、
アプリ側で意識して扱う必要有り。
分断分断
手動分割
テーブル

Spanner のスケールアウトは自動シャーディング 1
スプリット1 スプリット2 スプリット3
Spanner はテーブルのサイズや負荷量をみて、Spanner 自身が自動で
テーブルを分割する。この分割単位をスプリットと呼ぶ。
自動で水平分割
テーブル

スプリット（シャード）は、現在の Spanner インスタンスを構成するノード
で分担される。
node1
テーブル

ノード数の増減に応じて、自動で担当ノードが変わる。スプリットの実態
は分散ストレージ側に入っているため、切り替えは参照先の切り替えだ
け。
node1 node2
テーブル

自動シャーディングには PK 列のレンジで分散
１
2
5
スプリット1
10
20
25
スプリット2
30
35
40
スプリット3
Spanner の PK 列は物理的にソートされており、そのレンジでスプリット
は分割される。
PK < 10 10 ≦ PK < 30 30 ≦ PK
node1 node2
１
2
5
10
20
25
30
35
40
players

自動シャーディングの利便性とトレードオフ - 処理の偏り
１
2
5
スプリット1
10
20
25
スプリット2
30
35
40
42
スプリット3
RDBMS でシャーディングした際と同様に、偏ったアクセスが発生する
と、特定のノードばかり高負荷になってしまうことがある。高負荷になり
やすい例として、PK のアクセスが偏っている場合。
node1 node2
１
2
5
10
20
25
30
35
40
players
PK < 10 10 ≦ PK < 30 30 ≦ PK
43
45
42
43
45
INSERT
INSERT
INSERT
連番やタイムスタン
プのように単調増
加するものが PK だ
と処理が偏りやす
い。
ここだけ忙しい
INSERT
INSERT
INSERT

自動シャーディングを効果的に活用する PK 例
先頭列を UUIDv4 にする
先頭列を他のキーから計算可能なシャード ID にする
秒
連番 / タイムスタンプを先頭列にしない
秒
💡メモ

分散 DB の利便性とトレードオフ - ノードをまたがる処理
１
2
5
スプリットA1
10
20
25
スプリットA2
30
35
40
スプリットA3
Spanner は分散データベースであり、異なるノード間でテーブルの
JOIN やアトミックな更新が可能だが、ある程度のオーバーヘッドが発生
してしまう。JOIN したいテーブルなどでも、そのままではあちこちに散ら
ばってしまう可能性がある。
node1 node2
１
2
5
10
20
25
30
35
40
42
43
45
１ 1
1 2
1 3
2 1
2 2
2 3
5 1
5 2
5 3
10 1
10 2
10 3
１ 1
1 2
1 3
2 1
2 2
2 3
5 1
5 2
スプリットB1 スプリットB2
players
player_items
player_id = 2 のデータが
散らばっている様子

● Spanner では関連するテーブルのデータを
物理的に連続した同じ位置に配置することがで
き、この仕組みをインターリーブと呼ぶ
● インターリーブとは、RDBMS で言うところの同じ
シャードにデータを一緒に入れる指示のこと
関連するデータを同じ場所に配置するしくみ
players
name STRING(256)
level INT64
money INT64
player_items
quantity INT64
親テーブル
子テーブル
INTERLEAVE
last_used TIMESTAMP

● Spanner のインターリーブとは、異なるテーブルを、正規化を保ったまま物理的
に同じ場所に配置する仕組み
● インターリーブ（Interleave）は英語で「綴じ込む」という意味
Spanner のインターリーブとデータ構造
1 bob 1 100
2 alice 2 0
5 carol 1 50
players
player_id item_id quantity
1 1 10
1 2 2
1 3 1
2 1 8
2 2 2
2 3 3
INTERLEAVE
INTERLEAVE
JOIN して利用するテーブル同士
でインターリーブが使えると、必ず
物理的に連続しているので、IO効
率が良い
１
2
１ 1
1 2
1 3
2 1
2 2
2 3
last_used
player_items

Spanner のインターリーブを活用するメリット
インターリーブにより、PK の先頭列を共有するデータは、
同じスプリットに収められるように自動シャーディングされる。
node1 node2
１
2
5
10
20
25
30
35
40
42
43
45
１ 1
1 2
1 3
2 1
2 2
2 3
5 1
5 2
5 3
10 1
10 2
10 3
players
player_items
１
2
１ 1
1 2
1 3
2 1
2 2
2 3 10
5
10
5 1
5 2
5 3
10 1
10 2
3 25
20
25
20 1
20 2
20 3
25 1
25 2
3
・・・
25
30
25
20 1
20 2
20 3
25 1
25 2
3
💡メモ

INTERLEAVE
インデックスもテーブルなのでインターリーブ可能
idx_players_name
PK name STRING(256)
(name) 列に対するインデックスは
インターリーブ不可
players
name STRING(256)
level INT64
money INT64
player_items
quantity INT64
親テーブル
子テーブル
last_used TIMESTAMP
idx_player_items_last_used
PK last_used TIMESTAMP
(player_id, last_used) 列に対するインデックスは
インターリーブ可能
特定の要素（例えば特定の player_id ）内でイン
デックスを作成するのであれば、インターリーブ
すれば IO コストの削減可能
この例の名前検索の様に、テーブルの全要素から
探すようなインデックスはインターリーブできない
（一緒に配置できる対象が無い）
PK item_id INT64
💡メモ
INTERLEAVE
index 作成
複合 index 作成

● RDBMS と Cloud Spanner は、テーブル構造に違いがあるだけで、考え方は
シャーディングしている RDBMS に通ずるところが多い
● Cloud Spanner は自動シャーディングが可能な分散 DB であり、スケールアウト
とスケールインが簡単にできるメリットがある
● Cloud Spanner のデータ構造を簡単にまとめると
○ テーブルの PK が自動シャーディングのシャードキーを兼ねている
○ テーブルの PK 列は物理的にソートされて保存されている
○ インデックスはテーブルと同じ構造
● 一緒に使うデータは同じシャードに入れるのと同じように、インターリーブで配置
をうまく指定してあげれば、性能向上が見込める
RDBMS と Cloud Spanner は共通する考え方も多い

今すぐ参加登録 ↑
ビジネスをサポートするGoogle Cloud ソリューションを学ぶ。
年月日火日木ライブ配信
年月日火日火開催

Google Cloud トレーニング無料提供キャンペーンのご案内
Qwiklabs、Pluralsight（英語のみ）、対象のCoursera のコースを1 か月間無料でご提供
お申込み期限は、5 月 20 日まで
（Pluralsight のみ 4 月 30 日まで）
goo.gle/TrainingOffer
詳細・お申込みはこちら ↑

アプリ開発者、DB 管理者視点での Cloud Spanner 活用方法 | 第 10 回 Google Cloud INSIDE Games & Apps Online

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a アプリ開発者、DB 管理者視点での Cloud Spanner 活用方法 | 第 10 回 Google Cloud INSIDE Games & Apps Online

Semelhante a アプリ開発者、DB 管理者視点での Cloud Spanner 活用方法 | 第 10 回 Google Cloud INSIDE Games & Apps Online (20)

Mais de Google Cloud Platform - Japan

Mais de Google Cloud Platform - Japan (20)

Último

Último (12)

アプリ開発者、DB 管理者視点での Cloud Spanner 活用方法 | 第 10 回 Google Cloud INSIDE Games & Apps Online