TiDB as an HTAP Database

TiDB as an HTAP
Database
Shen Li | PingCAP

About me
● Shen Li (申砾)
● Tech Lead of TiDB, VP of Engineering
● Netease / 360 / PingCAP
● Infrastructure software engineer

Brief History
● Standalone RDBMS
● NoSQL
● Middleware & Proxy
● NewSQL

NewSQL Database
● Horizontal Scalability
● ACID Transaction
● High Availability
● SQL at Scale

OLTP & OLAP
8am 2pm 6pm 2am
ETL
Database
ERP
File
CRM
OLTP OLAP
Data Warehouse
Where is my data?
Is the data out-of-date?

Why two separate systems
● Huge data size
● Complex query logic
● Latency VS Throughput
● Point query VS Full range scan
● Transaction & Isolation level

OLAP + OLTP = HTAP
Hybrid Transactional / Analytical Processing
● ACID Transaction
● Real-time analysis
● SQL
HTAP

How do we build the new database

What is TiDB
• Scalability as the first class feature
• SQL is necessary
• Compatible with MySQL, in most cases
• OLTP + OLAP = HTAP (Hybrid Transactional/Analytical
Processing)
• 24/7 availability, even in case of datacenter outages
• Open source, of course

Architecture
TiKV TiKV TiKV TiKV
Raft Raft Raft
TiDB TiDB TiDB... ...
Placement
Driver
(PD)
Control flow:
Balance / Failover
Metadata / Timestamp request
Stateless SQL Layer
Distributed Storage Layer
...

TiKV - Overview
● Region: a set of continuous key-value pairs
● Data is organized/stored/replicated by Regions
● Highly layered
TiKV Key Space
[ start_key,
end_key)
(-∞, +∞)
Sorted Map
RPC (gRPC)
Transaction
MVCC
Raft
RocksDB
Node B Node C
Node A
Raft Raft
Raft
256MB

TiKV - Multi-Raft
Multiple raft groups in the cluster, one group for each region.
Client
Store 1
Region 1
Region 3
Region 5
Region 4
Store 3
Region 3
Region 5
Region 2
Store 2
Region 1
Region 3
Region 2
Region 4
Store 4
Region 1
Region 5
Region 2
Region 4
RPC RPC RPC RPC
TiKV node 1 TiKV node 2 TiKV node 3 TiKV node 4
Raft
Group

TiKV - Horizontal Scale
Region 1
Region 3
Region 1^
Region 2
Region 1*
Region 2 Region 2
Region 3
Region 3
Node A
Node B
Node E
Node C
Node D
Add Replica
Three steps to move a leader replica
● Transfer Leader
● Add Replica
● Remove Replica

PD - Overview
TiKV TiKV TiKV TiKV… ...
TiKV
Cluster
PD
Node/Region
Info
Management
Command
TiKV Client
Route Info
● Meta data management
● Load balance management

PD - TiKV Cluster Managment
Region A
Region B
Node 1
Node 2
PD
Scheduling
Stratege
Cluster
Info
Admin
HeartBeat
Scheduling
Command
Region C
Config
Movement

TiDB - Overview
SQL AST Logical Plan
Optimized
Logical Plan
Cost Model
Selected
Physical Plan
TiKV TiKV TiKV
TiDB SQL Layer
Statistics
● The stateless SQL layer

TiDB - Distributed SQL
SELECT COUNT(c1) FROM t WHERE c1 > 10 AND c2 =
‘shanghai’;
Partial Aggregate
COUNT(c1)
Filter
c2 = “shanghai”
Read Index
idx1: (10, +∞)
Physical Plan on TiKV (index scan)
Read Row Data
by RowID
RowID
Row
Row
Final Aggregate
SUM(COUNT(c1))
DistSQL Scan
Physical Plan on TiDB
COUNT(c1)
COUNT(c1)
TiKV
TiKV
TiKV
COUNT(c1)
COUNT(c1)

TiDB - Cost Based Optimizer
● Predicate Pushdown
● Column Pruning
● Eager Aggregate
● Convert Subquery to Join
● Statistics framework
● CBO Framework
○ Index Selection
○ Join Operator Selection
■ Hash join
■ Index lookup join
■ Sort-merge join
○ Stream Operators VS Hash Operators

Cost estimation
Network cost Memory cost CPU cost
In TiDB, default memory factor is 5 and cpu factor is 0.8.
For example: Operator Sort(r), its cost would be:
DP (Dynamic Programming) on tree based on statistic infomation

Parallel Operators
TiKV Cluster: Coprocessor Workers
Scan Workers Scan Workers
Join Worker
TableScan: t IndexScan: t1 idx1
Join Worker
Join Worker
Data Reader
Join Operator
SELECT t.c2, t1.c2 FROM t JOIN t1 on t.c = t1.c WHERE t1.c1 > 10;
Projection
Join
DataSource
t
DataSource
t1
Filter
t1.c1 > 10

OLTP + OLAP
TiDB
TiDB
TiDB
TiDB
TiDB
OLTP
Query
OLAP
Query
TiKV
TiKV
TiKV
TiKV
.
.
.
.
Job
Queue
Worker
Scheduler
Worker
Worker
Worker Pool
Jobs
Jobs
Low
Priority
High
Priority

Spark on TiDB
TiDB
TiDB
Worker
Spark
Driver
TiKV Cluster (Storage)
Meta data
TiKV TiKV
TiKV
Application
Syncer
Data location
Job
TiSpark
DistSQL API
TiKV
TiDB
TSO/Data location
Worker
Worker
Spark Cluster
TiDB Cluster
TiDB
... ...
...
DistSQL API
PD PD
PD
PD Cluster
TiKV TiKV
TiDB

Spark on TiDB
● Spark ecosystem
● TiKV Connector is better than JDBC connector
● Index support
● Complex Calculation Pushdown
● CBO
○ Pick up right Access Path
○ Join Reorder
● Priority & Isolation Level

Future plan
● Code Generation
● MPP Engine
● Mixed storage engine (Columnar / Row-based)
● ...

Thanks!
Contact me:
shenli@pingcap.com
www.pingcap.com
Wechat: shenli3514

TiDB as an HTAP Database

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a TiDB as an HTAP Database

Semelhante a TiDB as an HTAP Database (20)

Mais de PingCAP

Mais de PingCAP (20)

Último

Último (20)

TiDB as an HTAP Database