Enviar pesquisa
Carregar
05 杨志丰
•
Transferir como PPTX, PDF
•
0 gostou
•
1,353 visualizações
锐
锐 张
Seguir
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 39
Baixar agora
Recomendados
Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照
Shaoning Pan
Ocean base --千亿级海量数据库-lamper_日照
Ocean base --千亿级海量数据库-lamper_日照
knuthocean
海量统计数据的分布式MySQL集群——MyFOX
海量统计数据的分布式MySQL集群——MyFOX
aleafs
淘宝分布式数据处理实践
淘宝分布式数据处理实践
isnull
Ocean base海量结构化数据存储系统 hadoop in china
Ocean base海量结构化数据存储系统 hadoop in china
knuthocean
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
Jazz Yao-Tsung Wang
#Lamp人#淘宝数据魔方的系统架构 -长林
#Lamp人#淘宝数据魔方的系统架构 -长林
drewz lin
罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群
hdhappy001
Recomendados
Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照
Shaoning Pan
Ocean base --千亿级海量数据库-lamper_日照
Ocean base --千亿级海量数据库-lamper_日照
knuthocean
海量统计数据的分布式MySQL集群——MyFOX
海量统计数据的分布式MySQL集群——MyFOX
aleafs
淘宝分布式数据处理实践
淘宝分布式数据处理实践
isnull
Ocean base海量结构化数据存储系统 hadoop in china
Ocean base海量结构化数据存储系统 hadoop in china
knuthocean
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
Jazz Yao-Tsung Wang
#Lamp人#淘宝数据魔方的系统架构 -长林
#Lamp人#淘宝数据魔方的系统架构 -长林
drewz lin
罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群
hdhappy001
2006-11-16 RFID and OSS for Agriculture
2006-11-16 RFID and OSS for Agriculture
Jazz Yao-Tsung Wang
Hadoop大数据实践经验
Hadoop大数据实践经验
Schubert Zhang
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践
hdhappy001
Life of Big Data Technologies
Life of Big Data Technologies
Jazz Yao-Tsung Wang
列式存储、位图技术研究及应用
列式存储、位图技术研究及应用
3908282
淺談台灣巨量資料產業發展現況
淺談台灣巨量資料產業發展現況
Jazz Yao-Tsung Wang
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
Jazz Yao-Tsung Wang
Distributed Data Analytics at Taobao
Distributed Data Analytics at Taobao
Min Zhou
Selling sybase hds solution for banking
Selling sybase hds solution for banking
focusbi
Enterprise Data Lake in Action
Enterprise Data Lake in Action
Jazz Yao-Tsung Wang
Hadoop 介紹 20141024
Hadoop 介紹 20141024
Jay Chu, PMP/OCM
淘宝Hadoop数据分析实践
淘宝Hadoop数据分析实践
Min Zhou
Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來
Wei-Yu Chen
110412 kningsoft-mongo db-intro-usage-in-mercury
110412 kningsoft-mongo db-intro-usage-in-mercury
Zoom Quiet
淘宝数据魔方的系统架构 -长林
淘宝数据魔方的系统架构 -长林
Shaoning Pan
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TW
Jazz Yao-Tsung Wang
基于Hbase的实时计算分享
基于Hbase的实时计算分享
yiihsia
准实时海量数据分析系统架构探究
准实时海量数据分析系统架构探究
Min Zhou
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Ching-Lin Tao
大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術
Wei-Yu Chen
Hridoyer katha
Hridoyer katha
Drpartha Pratim
数据成就互联网的可能 用技术撬动Roi-好耶
数据成就互联网的可能 用技术撬动Roi-好耶
锐 张
Mais conteúdo relacionado
Mais procurados
2006-11-16 RFID and OSS for Agriculture
2006-11-16 RFID and OSS for Agriculture
Jazz Yao-Tsung Wang
Hadoop大数据实践经验
Hadoop大数据实践经验
Schubert Zhang
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践
hdhappy001
Life of Big Data Technologies
Life of Big Data Technologies
Jazz Yao-Tsung Wang
列式存储、位图技术研究及应用
列式存储、位图技术研究及应用
3908282
淺談台灣巨量資料產業發展現況
淺談台灣巨量資料產業發展現況
Jazz Yao-Tsung Wang
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
Jazz Yao-Tsung Wang
Distributed Data Analytics at Taobao
Distributed Data Analytics at Taobao
Min Zhou
Selling sybase hds solution for banking
Selling sybase hds solution for banking
focusbi
Enterprise Data Lake in Action
Enterprise Data Lake in Action
Jazz Yao-Tsung Wang
Hadoop 介紹 20141024
Hadoop 介紹 20141024
Jay Chu, PMP/OCM
淘宝Hadoop数据分析实践
淘宝Hadoop数据分析实践
Min Zhou
Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來
Wei-Yu Chen
110412 kningsoft-mongo db-intro-usage-in-mercury
110412 kningsoft-mongo db-intro-usage-in-mercury
Zoom Quiet
淘宝数据魔方的系统架构 -长林
淘宝数据魔方的系统架构 -长林
Shaoning Pan
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TW
Jazz Yao-Tsung Wang
基于Hbase的实时计算分享
基于Hbase的实时计算分享
yiihsia
准实时海量数据分析系统架构探究
准实时海量数据分析系统架构探究
Min Zhou
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Ching-Lin Tao
大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術
Wei-Yu Chen
Mais procurados
(20)
2006-11-16 RFID and OSS for Agriculture
2006-11-16 RFID and OSS for Agriculture
Hadoop大数据实践经验
Hadoop大数据实践经验
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践
Life of Big Data Technologies
Life of Big Data Technologies
列式存储、位图技术研究及应用
列式存储、位图技术研究及应用
淺談台灣巨量資料產業發展現況
淺談台灣巨量資料產業發展現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
Distributed Data Analytics at Taobao
Distributed Data Analytics at Taobao
Selling sybase hds solution for banking
Selling sybase hds solution for banking
Enterprise Data Lake in Action
Enterprise Data Lake in Action
Hadoop 介紹 20141024
Hadoop 介紹 20141024
淘宝Hadoop数据分析实践
淘宝Hadoop数据分析实践
Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來
110412 kningsoft-mongo db-intro-usage-in-mercury
110412 kningsoft-mongo db-intro-usage-in-mercury
淘宝数据魔方的系统架构 -长林
淘宝数据魔方的系统架构 -长林
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TW
基于Hbase的实时计算分享
基于Hbase的实时计算分享
准实时海量数据分析系统架构探究
准实时海量数据分析系统架构探究
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術
Destaque
Hridoyer katha
Hridoyer katha
Drpartha Pratim
数据成就互联网的可能 用技术撬动Roi-好耶
数据成就互联网的可能 用技术撬动Roi-好耶
锐 张
Lamp高性能设计
Lamp高性能设计
锐 张
Makalahe toga
Makalahe toga
Jesen Preparm
长尾理论(The longtail)版
长尾理论(The longtail)版
锐 张
Our heroes
Our heroes
Garima Sharma
Redis内存存储结构分析
Redis内存存储结构分析
锐 张
Redis深入浅出
Redis深入浅出
锐 张
Destaque
(8)
Hridoyer katha
Hridoyer katha
数据成就互联网的可能 用技术撬动Roi-好耶
数据成就互联网的可能 用技术撬动Roi-好耶
Lamp高性能设计
Lamp高性能设计
Makalahe toga
Makalahe toga
长尾理论(The longtail)版
长尾理论(The longtail)版
Our heroes
Our heroes
Redis内存存储结构分析
Redis内存存储结构分析
Redis深入浅出
Redis深入浅出
Semelhante a 05 杨志丰
Delta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Delta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Xiao Li
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践
Wensong Zhang
《数据库发展研究报告-解读(2023年)》.pdf
《数据库发展研究报告-解读(2023年)》.pdf
markmind
Ocean base内部探秘
Ocean base内部探秘
gettyying
Streaming architecture zx_dec2015
Streaming architecture zx_dec2015
Zhenzhong Xu
ClickHouse北京Meetup ClickHouse Best Practice @Sina
ClickHouse北京Meetup ClickHouse Best Practice @Sina
Jack Gao
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
Wensong Zhang
Taobao base
Taobao base
mysqlops
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
lovingprince58
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
drewz lin
F1 07 淘宝软件基础设施构建实践_章文嵩_淘宝
F1 07 淘宝软件基础设施构建实践_章文嵩_淘宝
drewz lin
Build 1 trillion warehouse based on carbon data
Build 1 trillion warehouse based on carbon data
boxu42
淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务
drewz lin
Taobao图片存储与cdn系统到服务
Taobao图片存储与cdn系统到服务
Wensong Zhang
浅析分布式存储架构—设计自己的存储- 58同城徐振华
浅析分布式存储架构—设计自己的存储- 58同城徐振华
zhuozhe
大规模数据库存储方案
大规模数据库存储方案
XiaoJun Hong
基于Hbase的实时计算分享
基于Hbase的实时计算分享
yiihsia
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
li luo
20140326联动优势数据访问层DAL架构和实践7(刘胜)工行交流
20140326联动优势数据访问层DAL架构和实践7(刘胜)工行交流
liu sheng
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouse
Jack Gao
Semelhante a 05 杨志丰
(20)
Delta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
Delta Lake Architecture: Delta Lake + Apache Spark Structured Streaming
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践
《数据库发展研究报告-解读(2023年)》.pdf
《数据库发展研究报告-解读(2023年)》.pdf
Ocean base内部探秘
Ocean base内部探秘
Streaming architecture zx_dec2015
Streaming architecture zx_dec2015
ClickHouse北京Meetup ClickHouse Best Practice @Sina
ClickHouse北京Meetup ClickHouse Best Practice @Sina
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
Taobao base
Taobao base
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
F1 07 淘宝软件基础设施构建实践_章文嵩_淘宝
F1 07 淘宝软件基础设施构建实践_章文嵩_淘宝
Build 1 trillion warehouse based on carbon data
Build 1 trillion warehouse based on carbon data
淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务
Taobao图片存储与cdn系统到服务
Taobao图片存储与cdn系统到服务
浅析分布式存储架构—设计自己的存储- 58同城徐振华
浅析分布式存储架构—设计自己的存储- 58同城徐振华
大规模数据库存储方案
大规模数据库存储方案
基于Hbase的实时计算分享
基于Hbase的实时计算分享
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
20140326联动优势数据访问层DAL架构和实践7(刘胜)工行交流
20140326联动优势数据访问层DAL架构和实践7(刘胜)工行交流
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouse
Mais de 锐 张
Openstack starter-guide-diablo
Openstack starter-guide-diablo
锐 张
基于My sql的分布式数据库实践
基于My sql的分布式数据库实践
锐 张
Redis中文入门手册
Redis中文入门手册
锐 张
Redis学习笔记
Redis学习笔记
锐 张
淘宝前端优化
淘宝前端优化
锐 张
Sun jdk 1.6内存管理 -实现篇 -毕玄
Sun jdk 1.6内存管理 -实现篇 -毕玄
锐 张
Sun jdk 1.6内存管理 -调优篇-毕玄
Sun jdk 1.6内存管理 -调优篇-毕玄
锐 张
Sun jdk 1.6内存管理 -使用篇-毕玄
Sun jdk 1.6内存管理 -使用篇-毕玄
锐 张
Sun jdk-1.6-gc
Sun jdk-1.6-gc
锐 张
Redis介绍
Redis介绍
锐 张
Green plum培训材料
Green plum培训材料
锐 张
Greenplum技术
Greenplum技术
锐 张
新时代的分析型云数据库 Greenplum
新时代的分析型云数据库 Greenplum
锐 张
服务器端性能优化 提升Qps、rt
服务器端性能优化 提升Qps、rt
锐 张
新浪云计算公开课第二期:Sae平台的灵活应用(吕毅、魏世江)
新浪云计算公开课第二期:Sae平台的灵活应用(吕毅、魏世江)
锐 张
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
锐 张
亚马逊云计算Aws
亚马逊云计算Aws
锐 张
20110625.【打造高效能的cdn系统】.易统
20110625.【打造高效能的cdn系统】.易统
锐 张
网易海量数据存储平台的构建和运维
网易海量数据存储平台的构建和运维
锐 张
09 赵昆
09 赵昆
锐 张
Mais de 锐 张
(20)
Openstack starter-guide-diablo
Openstack starter-guide-diablo
基于My sql的分布式数据库实践
基于My sql的分布式数据库实践
Redis中文入门手册
Redis中文入门手册
Redis学习笔记
Redis学习笔记
淘宝前端优化
淘宝前端优化
Sun jdk 1.6内存管理 -实现篇 -毕玄
Sun jdk 1.6内存管理 -实现篇 -毕玄
Sun jdk 1.6内存管理 -调优篇-毕玄
Sun jdk 1.6内存管理 -调优篇-毕玄
Sun jdk 1.6内存管理 -使用篇-毕玄
Sun jdk 1.6内存管理 -使用篇-毕玄
Sun jdk-1.6-gc
Sun jdk-1.6-gc
Redis介绍
Redis介绍
Green plum培训材料
Green plum培训材料
Greenplum技术
Greenplum技术
新时代的分析型云数据库 Greenplum
新时代的分析型云数据库 Greenplum
服务器端性能优化 提升Qps、rt
服务器端性能优化 提升Qps、rt
新浪云计算公开课第二期:Sae平台的灵活应用(吕毅、魏世江)
新浪云计算公开课第二期:Sae平台的灵活应用(吕毅、魏世江)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
亚马逊云计算Aws
亚马逊云计算Aws
20110625.【打造高效能的cdn系统】.易统
20110625.【打造高效能的cdn系统】.易统
网易海量数据存储平台的构建和运维
网易海量数据存储平台的构建和运维
09 赵昆
09 赵昆
05 杨志丰
1.
淘宝网 大数据解决之道 淘宝OceanBase开发组
杨志丰 zhuweng.yzf@taobao.com
2.
Agenda 淘宝数据
背景与需求 解决之道 淘宝数据库解决方案 未来展望 下一步工作
3.
淘宝年度交易额 亿元人民币 4500 4000
6000万用户登录/天 3500 3000 2500 2083 20亿PV/天 2000 1500 999.6 1000 443 500 80.2149.96 0 2003 2004 2005 2006 2007 2008 2009 2010 数据来自公开媒体
4.
淘宝网站流量 一次页面展示要访问后台数据几十次! 一个报表需要分析几TB乃至百TB数据! 数据来源:www.alexa.com
5.
淘宝数据(1) 离线数据:39PB+, 2000+台Hadoop机
群, 40000+个MapReduce作业/天 手机价格区间百分比 2010年淘宝上最畅销手机价格区间? 2010年什么年货最畅销? 14 16 30 1千以下 1千~2千 什么地方人最爱大闸蟹? 2千~3千 糖果、蜜饯、炒货、冲饮品、饼干 40 3千以上 广东、上海、浙江、江苏、北京
6.
淘宝数据(2) 在线非结构化数据(图片):2700+TB 商品图片,商品描述图片 淘宝分布式文件系统TFS 实时响应,同城热备+异地灾备
7.
淘宝数据(3) 在线结构化数据:数据库 商品库、评价库、交易库、用户库、店铺 库… 商品库:14亿/8亿(下线/在线)商品 QPS/TPS:78K/2.7K(峰值) Read/Write IOPS:46K/7K(峰值)
8.
淘宝收藏夹 存储买家收藏的宝贝: 收藏信息表,65亿条记录 宝贝信息表,4亿条记录
9.
淘宝收藏夹 业务需求: 每个买家可有千条收藏 热门宝贝可能被十几万人收藏 宝贝的价格、收藏人气等属性随时变化 按宝贝属性(如价格)排序展示买家的收藏 挑战:每天1.2亿次访问
响应时间<100ms
10.
收藏夹数据库 100ms内完成1千次读? 收藏信息表
收藏宝贝表
11.
收藏夹数据库挑战 热门商品的价格/人气变化? 淘宝OceanBase海量数据库 收藏信息表
收藏宝贝表
12.
Agenda 淘宝数据
背景与需求…… 解决之道 淘宝数据库解决方案 下一步工作 未来展望
13.
淘宝数据库特点 非常重要:几乎所有淘宝业务都依赖 数量多:以千计的数据库服务器 数据量大:单表几亿~几百亿条记录 访问量大:每天几亿~几百亿次访问
14.
解决方案
从前 • Oracle • 小型机 • 高端存储 现在 • MySQL,OceanBase, Hbase,Oracle,MongoDB 等 • 普通PC服务器
15.
DBMS:分库与分表 缓解了数据量大与访问量大的挑战 业务逻辑支持 扩展性、容错及故障恢复 分表后事务 固态盘(SSD)
16.
典型解决方案对比
Bigtable Percolato 数 r 万亿记录 据 (十PB) 规 模 OceanBas HBase 千亿记录 Dynamo e (百TB) Oracle/DB2 Cassandr … a 千万记录 事务与数据一致性 (百GB) 最终一致 单行事务 跨行跨表事务 DBMS:事务 + 一致性,但扩展性欠缺 NoSQL:扩展性好,但事务、一致性欠缺 16
17.
OceanBase设计目标 可扩展:数千亿条记录、数百TB数据、 数十万QPS、数万TPS 事务(ACID) 范围查询、联表… 实时容错、自动故障恢复 99.999%可用性 普通PC服务器存储数据
18.
设计思想 数据总量大,但更新比例小 数据100TB数据,1%更新 1TB
= 基准数据 + 增量数据 基准数据:静态B+树、分布式存储(磁 盘或SSD) 增量数据:动态B树,内存 + SSD
19.
系统架构
RootServer/ RootServer/ 元数据 UpdateServe UpdateServ r er 增量数据 (主) (备) Clien t 基准数据 ChunkServer ChunkServe /MergeServer r/MergeServ er 数据融合
20.
数据结构 基准数据:B+树,ChunkServer(s)
root tablet tablet tablet 增量数据:B树 & Copy-on-write, UpdateServer
21.
读写事务 写事务:UpdateServer 读事务:MergeServer(s),基准数据 + 增量数据
22.
基准数据更新 新的基准数据 = 旧的基准数据
+ 增量数 据快照,ChunkServer(s) 低优先级 + 低负载时段 基准数据多副本不必要同步 基准数据多副本必须一致
23.
写性能&扩展性 UpdateServer:B树 + Copy-on-write, 10万TPS
+ 100万QPS(内存) Group commit + 带电池/电容RAID卡 万兆网卡 主备机 + 主备机群 一主多备,主写备读 内存 + SSD
24.
容错&故障恢复 单机群:3数据副本 同城热备(实时日志同步):2+2数据副本 远程灾备(准实时日志同步):2+2+2数 据副本 数据记录自校验(磁盘&网络) 在线切换、在线升级(不停服务)
25.
数据丢失几率分析 n台设备,年度故障率 ,则单机t小时内 故障概率为 =
×t/(365*24) 恰好0台故障:(1- )n 恰好1台故障:n× ×(1- )n-1 恰好2台故障:n×(n-1)/2!× 2×(1- )n-2 恰好3台故障: n×(n-1)×(n-2)/3!× 3×(1- )n-3 ……
26.
数据丢失概率 年故 设备 处理
单台故 2台故 3台故 4台故 障率 数量 时长 障率 障率 障率 障率 5% 10 0.5 2.9E-05 3.8E-08 2.9E-12 4.0E-16 5% 10 1 5.8E-05 1.5E-07 2.3E-11 2.8E-15 5% 10 2 1.2E-04 6.0E-07 1.9E-10 3.8E-14 5% 50 0.5 1.4E-04 2.6E-05 5.9E-08 1.0E-10 5% 50 1 2.9E-04 1.0E-04 4.7E-07 1.6E-09 5% 50 2 5.8E-04 4.0E-04 3.7E-06 2.5E-08 5% 100 0.5 2.9E-04 4.1E-04 3.8E-06 2.7E-08 5% 100 1 5.8E-04 1.6E-03 3.0E-05 4.2E-07 5% 100 2 1.2E-03 6.2E-03 2.3E-04 6.4E-06
27.
收藏夹应用 半年前上线 单表超过65亿条记录 1.2亿次/天访问 服务器数量:16*2 14*2
6*2 平均查询响应时间:~80ms
28.
收藏夹线上运行图 一周写事务曲线 一周查询曲线 平均查询响应时间
29.
双11网购狂欢节 350000 300000 250000 200000 150000
交易额(万元) 100000 50000 0 99年 10年 11年
30.
双11收藏夹数据 总库量: 170亿条记录 更新操作: 1.85亿次 查询:
2.3亿+2.9亿次(scan/get) 峰值QPS: 9000+5000(scan/get)
31.
Agenda 淘宝数据
背景与需求 淘宝数据库解决方案 解决之道 下一步工作 未来展望
32.
SSD ChunkServer:大量随机读、批量顺序读 和写,没有随机写 5000次写入,写入量100%/天 10年寿 命 单机:5万QPS 线上试运行中,机器数量:14
6
33.
OLAP UpdateServer:增量修改,OLTP、 OLAP写事务性能没有明显差异 OLAP查询 多机并发 开发中,Q4上线
34.
MapReduce 离线数据分析:避免大量数据导出 完成开发,应用开发中
35.
SQL 部分支持 SELECT ipv, count(iuv)
AS ci, ipv * ci FROM lz_rpt_auction_info_d WHERE unit_id=3 AND day=D'2011-10-31' GROUP BY ipv HAVING ci>5 ORDER BY ci DESC;
36.
不足 只实现部分join 尚未实现view,临时表 尚未支持辅助索引…
37.
源码开放 淘蝌蚪:数十个开源项目/工具 http://code.taobao.org/ OceanBase:淘宝海量数据库 http://oceanbase.taobao.org/ TFS:淘宝分布式文件系统 TAIR:淘宝分布式CACHE服务 ……
38.
Agenda 淘宝数据
背景与需求 解决之道 淘宝数据库解决方案 下一步工作 未来展望
39.
Q&A
Thanks 邮件: yangzhifeng83@gmail.com 主页: http://net.pku.edu.cn/~yzf/ 微博: http://weibo.com/yangzhifeng83
Baixar agora