SlideShare uma empresa Scribd logo
1 de 38
Baixar para ler offline
BigTable学习分享
李楠
论文的主要内容
   摘要
   简介
   数据模型
   客户端API
   BigTable的底层数据结构
   实现原理
   改进策略
   性能试验
   设计结论
   bigTable的支持
   相关工作
   结论
本次重点讲的几个部分
 数据模型
 底层数据结构
 实现原理
 改进策略
摘要
简介
数据模型
 BigTable的数据模型
 一个例子
 Row
 Column Family
 Timestamps
数据模型
例子
例子
Row
Column Family
TimeStamps
客户端API(read的例子)
   Scanner scanner(T);
   Scanner * stream;
   stream = scanner.FetchColumnFamily("anchor");
   stream->SetReturnAllVersions();
   scanner.Lookup("com.cnn.www");
   for(; !stream->Done(); stream->next()){
       printf("%s %s %lld %sn",
       scanner.RowName(),
       stream->ColumnName(),
       stream->MicorTimestamp(),
       stream->Value()
       );
   }
客户端API(write的例子)
 //Open the table
 Table * T =
  OpenOrDie("/bigtable/web/webtable");

   //Write a new anchor and delete an old
    anchor
   RowMutation r1(T, "com.cnn.www");
   r1.Set("anchor:www.c-span.org", "CNN");
   r1.Delete("anchor:www.abc.com");
   Operation op;
   Apply(&op, &r1);
底层数据结构
 上层用MapReduce进行计算
 下层用GFS分布式文件系统存储日志和
  文件
 通常和其他分布式程序部署在同一套集
  群环境中
 用SSTable文件格式来存储Bigtable数
  据
 依赖于高可用的分布式锁服务Chubby
用SSTable文件格式来存储
Bigtable数据
依赖于高可用的分布式锁服务
Chubby
来看一个Hbase的大的框架
Hbase上的map reduce
Hbase的详细架构图
对比定义
 MapReduce => Hadoop
 GFS => HDFS
 BigTable => Hbase
 Chubby => ZooKeeper
 SSTable => Hfile
 Row ColumnFamily Timestamp的概念一
  样
实现原理
 系统的三个部分
 Master的功能
 Tablet server的功能
 Client与big table的交互问题
 Tablet location
 Tablet assignment
 Tablet serving
 compactions
系统的三个部分
   client library

   master server

   many tablet servers(可以动态增加)
master的功能
   assign tablets to table servers(负载均衡)

 detecting the addition and expiration of table
  server
(table server的动态增减)

   balancing the tablet-server load

 garbage collection of files in GFS
(不知道具体指什么)

   handle schema changes such as table and column
    faimily creations
tablet server的功能
   管理一系列tablet, 10~1000个

   handle read and write requst to
    the tablets

   splits tablets that have grown too
    large
client 与 Bitable的交互问题
   数据读写,并不经过master(定位是在
    chubby做的)

   master更多承担维持Bigtable均衡负载
    的角色

   master系统资源消耗一般都很少
tablet location
Tablet location
   用一个类似于B+树的三层结构,来存储tablet定位信息

   chubby file => root tablet => meta tablet => user tablet

   root tablet 不分裂,因此保持三层结构不会变成四层、五层、六层……

   metadata table 存储的也是key/value对
    ◦   key 是 一个tablet 的table 标石和talet的尾部标记


    ◦   value是tablet的位置信息


    ◦   一个meta 行大概1kb内存数据


   128MB metadata tablets, is sufficient to address 2^34 tablets

   客户端会cache tablet location信息,但具体没看懂
看一个Hbase的location
 Tablet =》Region
 Tablet Server => Region Server
tablet assignment
table serving
table serving
对一下Hbase的log部分
compactions
Hbase的分裂和收缩
改进策略
其他
 BigTable网上有很多中文翻译,可以适
  当的参见一下:
 http://zhiyuzhe.blog.163.com/blog/
  static/1100540742010811105951381/
Q&A
   ?

Mais conteúdo relacionado

Destaque

Destaque (8)

Acha v2 fiebre-lassa
Acha v2 fiebre-lassaAcha v2 fiebre-lassa
Acha v2 fiebre-lassa
 
Logo Design Proposal
Logo Design ProposalLogo Design Proposal
Logo Design Proposal
 
Percolator
Percolator Percolator
Percolator
 
Colombia, our country presentation
Colombia, our country presentationColombia, our country presentation
Colombia, our country presentation
 
Craftsman sector in colombia
Craftsman sector in colombiaCraftsman sector in colombia
Craftsman sector in colombia
 
Biologia A, Profª Lara, 1ª Série - EM | Reino monera
Biologia A, Profª Lara, 1ª Série - EM | Reino moneraBiologia A, Profª Lara, 1ª Série - EM | Reino monera
Biologia A, Profª Lara, 1ª Série - EM | Reino monera
 
Vírus - Tipos e Doenças Virais - Biologia A - Profª Lara
Vírus  - Tipos e Doenças Virais -  Biologia A - Profª LaraVírus  - Tipos e Doenças Virais -  Biologia A - Profª Lara
Vírus - Tipos e Doenças Virais - Biologia A - Profª Lara
 
Biologia A, Profª Lara, 1ª Série - EM | Infecções bacterianas
Biologia A, Profª Lara, 1ª Série - EM | Infecções bacterianasBiologia A, Profª Lara, 1ª Série - EM | Infecções bacterianas
Biologia A, Profª Lara, 1ª Série - EM | Infecções bacterianas
 

Semelhante a Big Table简介

Delta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Delta Lake Architecture: Delta Lake + Apache Spark Structured StreamingDelta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Delta Lake Architecture: Delta Lake + Apache Spark Structured StreamingXiao Li
 
網站設計100步
網站設計100步網站設計100步
網站設計100步evercislide
 
Build 1 trillion warehouse based on carbon data
Build 1 trillion warehouse based on carbon dataBuild 1 trillion warehouse based on carbon data
Build 1 trillion warehouse based on carbon databoxu42
 
Cassandra简介.ppt
Cassandra简介.pptCassandra简介.ppt
Cassandra简介.pptjames tong
 
Google big table 中文版
Google big table 中文版Google big table 中文版
Google big table 中文版lovingprince58
 
淘宝网架构变迁和挑战(Oracle架构师日)
淘宝网架构变迁和挑战(Oracle架构师日)淘宝网架构变迁和挑战(Oracle架构师日)
淘宝网架构变迁和挑战(Oracle架构师日)vanadies10
 
mysql总结
mysql总结mysql总结
mysql总结haiwang
 
Terracotta And Continuent Based Clustering Architecture
Terracotta And Continuent Based Clustering ArchitectureTerracotta And Continuent Based Clustering Architecture
Terracotta And Continuent Based Clustering ArchitectureTarget Source
 
Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照Shaoning Pan
 
大数据时代feed架构 (ArchSummit Beijing 2014)
大数据时代feed架构 (ArchSummit Beijing 2014)大数据时代feed架构 (ArchSummit Beijing 2014)
大数据时代feed架构 (ArchSummit Beijing 2014)Tim Y
 
Static server介绍
Static server介绍Static server介绍
Static server介绍sun jamie
 
Cassandra架构与应用
Cassandra架构与应用Cassandra架构与应用
Cassandra架构与应用lsdyg
 
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林corlin chen
 
Ria的强力后盾:rest+海量存储
Ria的强力后盾:rest+海量存储 Ria的强力后盾:rest+海量存储
Ria的强力后盾:rest+海量存储 zhen chen
 
Oracle数据库体系结构简介.ppt
Oracle数据库体系结构简介.pptOracle数据库体系结构简介.ppt
Oracle数据库体系结构简介.pptjames tong
 
Ocean base海量结构化数据存储系统 hadoop in china
Ocean base海量结构化数据存储系统 hadoop in chinaOcean base海量结构化数据存储系统 hadoop in china
Ocean base海量结构化数据存储系统 hadoop in chinaknuthocean
 
数据库性能诊断的七种武器
数据库性能诊断的七种武器数据库性能诊断的七种武器
数据库性能诊断的七种武器Leyi (Kamus) Zhang
 

Semelhante a Big Table简介 (20)

Java@taobao
Java@taobaoJava@taobao
Java@taobao
 
Delta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Delta Lake Architecture: Delta Lake + Apache Spark Structured StreamingDelta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Delta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
 
網站設計100步
網站設計100步網站設計100步
網站設計100步
 
Build 1 trillion warehouse based on carbon data
Build 1 trillion warehouse based on carbon dataBuild 1 trillion warehouse based on carbon data
Build 1 trillion warehouse based on carbon data
 
Cassandra简介.ppt
Cassandra简介.pptCassandra简介.ppt
Cassandra简介.ppt
 
Google big table 中文版
Google big table 中文版Google big table 中文版
Google big table 中文版
 
淘宝网架构变迁和挑战(Oracle架构师日)
淘宝网架构变迁和挑战(Oracle架构师日)淘宝网架构变迁和挑战(Oracle架构师日)
淘宝网架构变迁和挑战(Oracle架构师日)
 
Hbase
HbaseHbase
Hbase
 
mysql总结
mysql总结mysql总结
mysql总结
 
Terracotta And Continuent Based Clustering Architecture
Terracotta And Continuent Based Clustering ArchitectureTerracotta And Continuent Based Clustering Architecture
Terracotta And Continuent Based Clustering Architecture
 
Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照
 
Optimzing mysql
Optimzing mysqlOptimzing mysql
Optimzing mysql
 
大数据时代feed架构 (ArchSummit Beijing 2014)
大数据时代feed架构 (ArchSummit Beijing 2014)大数据时代feed架构 (ArchSummit Beijing 2014)
大数据时代feed架构 (ArchSummit Beijing 2014)
 
Static server介绍
Static server介绍Static server介绍
Static server介绍
 
Cassandra架构与应用
Cassandra架构与应用Cassandra架构与应用
Cassandra架构与应用
 
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
 
Ria的强力后盾:rest+海量存储
Ria的强力后盾:rest+海量存储 Ria的强力后盾:rest+海量存储
Ria的强力后盾:rest+海量存储
 
Oracle数据库体系结构简介.ppt
Oracle数据库体系结构简介.pptOracle数据库体系结构简介.ppt
Oracle数据库体系结构简介.ppt
 
Ocean base海量结构化数据存储系统 hadoop in china
Ocean base海量结构化数据存储系统 hadoop in chinaOcean base海量结构化数据存储系统 hadoop in china
Ocean base海量结构化数据存储系统 hadoop in china
 
数据库性能诊断的七种武器
数据库性能诊断的七种武器数据库性能诊断的七种武器
数据库性能诊断的七种武器
 

Big Table简介