SlideShare uma empresa Scribd logo
1 de 26
Baixar para ler offline
阿⾥里搜索流计算技术

⺩王峰

1
个⼈人背景简介
• 真名:⺩王峰	
  	
  
• 淘宝花名:莫问	
  	
  	
  	
  	
  
• 微博:淘莫问	
  
• 2006年毕业后加⼊入阿⾥里巴巴集团	
  
• ⼀一淘及搜索事业部(⾼高级技术专家)	
  
• 技术⽅方向:搜索离线系统,Hadoop	
  Ecosystem

2
提纲
• iStream业务背景	
  
• iStream	
  On	
  YARN	
  
• iStream计算模型	
  
• iStream服务调度	
  
• iStream⽣生产应⽤用

3
iStream业务背景
• ⼀一淘全⺴⽹网商品搜索	
  &	
  淘宝站内商品搜索	
  
• 商品搜索的时效性⾮非常⾼高	
  
• 淘宝卖家更新商品后需要实时处理并推送到搜索引擎	
  
• 全⺴⽹网商品抓取后需要实时处理并推送到搜索引擎	
  
• 全⺴⽹网商品降价后需要实时通知给订阅⽤用户	
  
• 全⺴⽹网商品出现优惠打折需要实时在⾸首⻚页推荐

4
⼀一淘全⺴⽹网商品搜索系统架构

互联⺴⽹网

⺴⽹网⻚页抓取

⺴⽹网⻚页选取

淘宝商品库

⺴⽹网⻚页抽取

搜索应⽤用

同步⼊入库

搜索引擎

全⺴⽹网电商⺴⽹网⻚页库(HBase)

业务处理服务

5
⼀一淘全⺴⽹网商品离线处理流程
商品⼊入库

全⺴⽹网商品库

触发器

商品更新队列
类⺫⽬目预测

运费处理
产品匹配
促销信息处理

业务处理服务

相关性计算

返利计算
商品过滤
商家信息处理
优惠挖掘服务

商品输出队列

搜索引擎

降价提醒服务

6
Hadoop-­‐1.0	
  to	
  2.0

7
iStream	
  On	
  YARN
iStream

8
iStream计算模型
• 基本概念	
  
• 拓扑结构	
  
• 消息管理	
  
• 进度管理	
  
• 编程接⼝口

9
基本概念
• Stream	
  Service:完成⼀一套业务功能的流计算服务	
  
• Stream	
  Role:具备相同计算逻辑的计算单元组合	
  
• Stream	
  Worker:Stream	
  Role中的计算单元	
  
• Stream	
  Source:Stream	
  Worker的数据输⼊入源	
  
• Stream	
  Sink:Stream	
  Worker的数据输出终端	
  
• Stream	
  Master:负责调度管理Stream	
  Workers
10
拓扑结构
Stream	
  Service
Stream	
  Source

数据源

Stream	
  Source

Stream	
  Role

Stream	
  Role
Stream	
  Sink/Source

Stream	
  Sink/Source
分布式消息队列

Stream	
  Role

Stream	
  Role

Stream	
  Sink

最终⺫⽬目的地
11
消息管理
• iStream设计理念	
  
– 计算和存储分层,计算之间解耦	
  
• 计算层之间采⽤用持久化分布式消息队列进⾏行消息传递	
  
– 消息不会丢失	
  
– 消息队列可插件化⾃自由选择	
  
– HQueue(基于HBase的分布式消息队列)	
  
• 优势	
  
– 消息管理机制简单,系统吞吐量⼤大	
  
– 上下游计算解耦,不相互阻塞进度,⽅方便新业务接⼊入	
  
– 持久化的消息流,⽅方便多业务共享数据以及问题追查

12
进度管理
• 如何衡量流进度的快慢?	
  
– 消息⽣生成时间	
  vs	
  消息处理时间	
  
• Master管理Workers进度	
  
– Master	
  WebUI展⽰示Workers进度	
  
– Master发现Worker进度慢进⾏行报警	
  
• Worker进度持久化和恢复	
  
– Worker定期将进度CheckPoint到Zookeeper	
  
– Worker重启从Zookeeper上的CheckPoint进⾏行恢复

13
编程接⼝口
• InputFormat:对Stream	
  Source的
操作封装	
  
– getSplits(Source):为Stream	
  
Source进⾏行数据分⽚片拆分	
  
– createReader(Split):为Data	
  
Split创建Reader	
  
– reader.next():流式读取消息

Stream	
  Source
Split

Split

Split

Split

reader reader reader reader

message message message message

14
编程接⼝口
• Worker:定制消息业务处理逻辑	
  
– setUp():消息处理前的初始化⼯工作	
  
– cleanUp():消息处理结束后的清理⼯工作	
  
– process(message):处理输⼊入消息	
  
– context.write(message):输出新消息

15
编程接⼝口
• StreamRouter:消息的路由
策略	
  
– getSinks(message):获
取消息的输出sink列
表,决定消息向那⾥里路
由发送

Stream	
  Worker

Message
Router
Stream	
  Sink

Stream	
  Sink
Stream	
  Sink

16
编程接⼝口
• OutputFormat:对Stream	
  Sink的操作封
装	
  
– getPartitionNum(Sink):获取sink的
partition数量	
  

Stream	
  Sink	
  Writer

– createWriter(Sink):为Stream	
  Sink创
建Writer	
  

Message

– writer.write(partitionID,	
  message):
partitionID
根据groupID向Stream	
  Sink分发消息	
  
• StreamPartitioner:消息的分发策略	
  
– getPartitionID(message,partitionNum) partition partition partition partition
:获取消息的partitionID,
OutputFormat根据此partitionID决定
Stream	
  Sink
如何分发消息
17
iStream服务调度
• 调度流程	
  
• 调度策略	
  
• Failover处理

18
调度流程
4.	
  start,	
  register	
  to	
  master

Resource	
  Manager

Stream	
  Worker

! Stream	
  Worker
!
3.	
  allocate	
  resource,launch	
  worker
!
5.	
  	
  heartbeat	
  request	
  (metrics)	
   !
! Stream	
  Worker
Stream	
  Master
!
6.	
  heartbeat	
  response(ok)	
  
! Stream	
  Worker
8.	
  heartbeat	
  response(stop)	
  
!

2.	
  launch	
  master
1.	
  start	
  service

7.	
  stop	
  service

10.	
  	
  stop

……
Client

9.	
  	
  unregister	
  to	
  master,stop	
  

19
调度策略
• Locality调度	
  
– 让计算单元更加靠近数据,减少⺴⽹网络传输,类似MR的
Locality调度策略	
  
• 弹性调度	
  
– 根据流处理进度动态调整worker数量,保证进度的同时
不浪费资源	
  
• 动态负载均衡	
  
– 动态调整Worker的位置,使分布更加均匀,Locality更
加合理

20
Locality调度
Switch1

!
!
!
!
!
!
!

Switch2

Node1	
  

Node2	
  

Node3	
  

Data  Split1

Data  Split2

Data  Split3

Stream  Worker1

Stream  Worker2

Stream  Worker3

!
!
!

!
!
!

!
!
!

!
!
!
!
!
!
!
!
!
!

Switch3

Node4	
  

Node5	
  

Node6	
  

Data  Split4

Data  Split5

Data  Split6

Stream  Worker4

Stream  Worker5

Stream  Worker6

!
!
!

!
!
!

!
!
!

21
弹性调度	
  -­‐	
  动态扩容

Stream	
  Source

Data	
  Split

Stream	
  Role

Data	
  Split

Stream	
  Worker

1.	
  进度太慢 2.	
  分裂

Stream  Worker

Data	
  Split

Stream  Worker

…

	
  …

3.	
  并发能⼒力增加,进度追上

22
弹性调度	
  -­‐	
  动态收缩

Stream	
  Source

Stream	
  Role

Data	
  Split

Data	
  Split

Stream	
  Worker

3.	
  资源被合理回收 2.合并

Data	
  Split

Stream  Worker

Stream  Worker

…

	
  …

1.Worker清闲,浪费资源

23
Failover处理
checkpoint

!
!
!
!
!
!
!
!

Zookeeper

RM	
  HA
Resource	
  Manager	
  
(active)

heartbeat

heartbeat
Stream  Master

Resource	
  Manager	
  
(standby)

!
!
!
!
!
!
!
!

Stream	
  Worker

Stream	
  Worker

…

serialize/replay

HDFS

24
iStream⽣生产应⽤用
增量更新10分钟级别

秒级

⼀一淘⺴⽹网⻚页抓取

B2B实时搜索

淘宝问答搜索

⼀一淘商品搜索

⼀一淘优惠挖掘

淘宝知识搜索

⼀一淘降价提醒

⼀一淘点评搜索

天猫商品搜索

阿⾥里搜索Hadoop/HBase集群(近千台规模)
25
Q&A
微博:淘莫问

26

Mais conteúdo relacionado

Mais procurados

Bloggers Survival 제안서 불로고수
Bloggers Survival 제안서 불로고수Bloggers Survival 제안서 불로고수
Bloggers Survival 제안서 불로고수JIAQI NIE
 
PMT-005-生產作業管理 製程選擇與設施佈置
PMT-005-生產作業管理 製程選擇與設施佈置PMT-005-生產作業管理 製程選擇與設施佈置
PMT-005-生產作業管理 製程選擇與設施佈置handbook
 
OSS International Case Study
OSS International Case StudyOSS International Case Study
OSS International Case StudyRyan Chung
 
慣れない言語で 車輪の再発明をしよう〜JavaScriptでツリーソート編〜
慣れない言語で車輪の再発明をしよう〜JavaScriptでツリーソート編〜慣れない言語で車輪の再発明をしよう〜JavaScriptでツリーソート編〜
慣れない言語で 車輪の再発明をしよう〜JavaScriptでツリーソート編〜Hiromu Shioya
 
詼諧的哲理
詼諧的哲理詼諧的哲理
詼諧的哲理twtony
 
Opportunity Magazine 2008-12-01 Vol.6
Opportunity Magazine 2008-12-01 Vol.6Opportunity Magazine 2008-12-01 Vol.6
Opportunity Magazine 2008-12-01 Vol.6opportunity service
 
創業家研習營-Web 2.0社群經營,愛情公寓/創辦人 林志銘
創業家研習營-Web 2.0社群經營,愛情公寓/創辦人 林志銘創業家研習營-Web 2.0社群經營,愛情公寓/創辦人 林志銘
創業家研習營-Web 2.0社群經營,愛情公寓/創辦人 林志銘taiwanweb20
 
CRE-013-個人知識管理達人
CRE-013-個人知識管理達人CRE-013-個人知識管理達人
CRE-013-個人知識管理達人handbook
 
詼諧的哲理
詼諧的哲理詼諧的哲理
詼諧的哲理twtony
 
新生說明會_slide
新生說明會_slide新生說明會_slide
新生說明會_slideMu Chun Wang
 
Ds 036 標準與專利檢索
Ds 036 標準與專利檢索Ds 036 標準與專利檢索
Ds 036 標準與專利檢索handbook
 
Information package exploration_basics barca
Information package exploration_basics barcaInformation package exploration_basics barca
Information package exploration_basics barcaCTR Barcelona
 
Opportunity Magazine 2008-10-06 Vol.3
Opportunity Magazine 2008-10-06 Vol.3Opportunity Magazine 2008-10-06 Vol.3
Opportunity Magazine 2008-10-06 Vol.3opportunity service
 
Ncert class-11-chemistry-part-1
Ncert class-11-chemistry-part-1Ncert class-11-chemistry-part-1
Ncert class-11-chemistry-part-1Kvs Phani
 
資料庫可以為你做那些事(二)
資料庫可以為你做那些事(二)資料庫可以為你做那些事(二)
資料庫可以為你做那些事(二)Frontier Foundation
 
Opportunity Magazine 2008-10-01 Vol.2
Opportunity Magazine 2008-10-01 Vol.2Opportunity Magazine 2008-10-01 Vol.2
Opportunity Magazine 2008-10-01 Vol.2opportunity service
 
大规模SOA系统中的分布事务处理 (DTP By Alipay Cheng Li)
大规模SOA系统中的分布事务处理 (DTP By Alipay Cheng Li)大规模SOA系统中的分布事务处理 (DTP By Alipay Cheng Li)
大规模SOA系统中的分布事务处理 (DTP By Alipay Cheng Li)Dahui Feng
 

Mais procurados (20)

Bloggers Survival 제안서 불로고수
Bloggers Survival 제안서 불로고수Bloggers Survival 제안서 불로고수
Bloggers Survival 제안서 불로고수
 
PMT-005-生產作業管理 製程選擇與設施佈置
PMT-005-生產作業管理 製程選擇與設施佈置PMT-005-生產作業管理 製程選擇與設施佈置
PMT-005-生產作業管理 製程選擇與設施佈置
 
OSS International Case Study
OSS International Case StudyOSS International Case Study
OSS International Case Study
 
慣れない言語で 車輪の再発明をしよう〜JavaScriptでツリーソート編〜
慣れない言語で車輪の再発明をしよう〜JavaScriptでツリーソート編〜慣れない言語で車輪の再発明をしよう〜JavaScriptでツリーソート編〜
慣れない言語で 車輪の再発明をしよう〜JavaScriptでツリーソート編〜
 
詼諧的哲理
詼諧的哲理詼諧的哲理
詼諧的哲理
 
Opportunity Magazine 2008-12-01 Vol.6
Opportunity Magazine 2008-12-01 Vol.6Opportunity Magazine 2008-12-01 Vol.6
Opportunity Magazine 2008-12-01 Vol.6
 
創業家研習營-Web 2.0社群經營,愛情公寓/創辦人 林志銘
創業家研習營-Web 2.0社群經營,愛情公寓/創辦人 林志銘創業家研習營-Web 2.0社群經營,愛情公寓/創辦人 林志銘
創業家研習營-Web 2.0社群經營,愛情公寓/創辦人 林志銘
 
CRE-013-個人知識管理達人
CRE-013-個人知識管理達人CRE-013-個人知識管理達人
CRE-013-個人知識管理達人
 
詼諧的哲理
詼諧的哲理詼諧的哲理
詼諧的哲理
 
Eenadu Promoters Pledging Mar 19, 2009
Eenadu Promoters Pledging   Mar 19,  2009Eenadu Promoters Pledging   Mar 19,  2009
Eenadu Promoters Pledging Mar 19, 2009
 
論文
論文論文
論文
 
新生說明會_slide
新生說明會_slide新生說明會_slide
新生說明會_slide
 
Ds 036 標準與專利檢索
Ds 036 標準與專利檢索Ds 036 標準與專利檢索
Ds 036 標準與專利檢索
 
Okayama_1
Okayama_1Okayama_1
Okayama_1
 
Information package exploration_basics barca
Information package exploration_basics barcaInformation package exploration_basics barca
Information package exploration_basics barca
 
Opportunity Magazine 2008-10-06 Vol.3
Opportunity Magazine 2008-10-06 Vol.3Opportunity Magazine 2008-10-06 Vol.3
Opportunity Magazine 2008-10-06 Vol.3
 
Ncert class-11-chemistry-part-1
Ncert class-11-chemistry-part-1Ncert class-11-chemistry-part-1
Ncert class-11-chemistry-part-1
 
資料庫可以為你做那些事(二)
資料庫可以為你做那些事(二)資料庫可以為你做那些事(二)
資料庫可以為你做那些事(二)
 
Opportunity Magazine 2008-10-01 Vol.2
Opportunity Magazine 2008-10-01 Vol.2Opportunity Magazine 2008-10-01 Vol.2
Opportunity Magazine 2008-10-01 Vol.2
 
大规模SOA系统中的分布事务处理 (DTP By Alipay Cheng Li)
大规模SOA系统中的分布事务处理 (DTP By Alipay Cheng Li)大规模SOA系统中的分布事务处理 (DTP By Alipay Cheng Li)
大规模SOA系统中的分布事务处理 (DTP By Alipay Cheng Li)
 

Destaque

BDTC2015 阿里巴巴-鄢志杰(智捷)-deep learning助力客服小二:数据技术及机器学习在客服中心的应用
BDTC2015 阿里巴巴-鄢志杰(智捷)-deep learning助力客服小二:数据技术及机器学习在客服中心的应用BDTC2015 阿里巴巴-鄢志杰(智捷)-deep learning助力客服小二:数据技术及机器学习在客服中心的应用
BDTC2015 阿里巴巴-鄢志杰(智捷)-deep learning助力客服小二:数据技术及机器学习在客服中心的应用Jerry Wen
 
阿里巴巴运维团队的无状态运维思路
阿里巴巴运维团队的无状态运维思路阿里巴巴运维团队的无状态运维思路
阿里巴巴运维团队的无状态运维思路mysqlops
 
Ab test -互联网渐进式解决方案
Ab test -互联网渐进式解决方案Ab test -互联网渐进式解决方案
Ab test -互联网渐进式解决方案文波 张
 
20151020 阿里巴巴十大網商台南區初選
20151020 阿里巴巴十大網商台南區初選20151020 阿里巴巴十大網商台南區初選
20151020 阿里巴巴十大網商台南區初選Chiaen Li
 
China top 10 B2B website in 2016
China top 10 B2B website in 2016China top 10 B2B website in 2016
China top 10 B2B website in 2016Walter Shen
 
BDTC2015 阿里巴巴-郑斌-大数据下的数据安全
BDTC2015 阿里巴巴-郑斌-大数据下的数据安全BDTC2015 阿里巴巴-郑斌-大数据下的数据安全
BDTC2015 阿里巴巴-郑斌-大数据下的数据安全Jerry Wen
 
Nginx深度開發與客制化
Nginx深度開發與客制化Nginx深度開發與客制化
Nginx深度開發與客制化Joshua Zhu
 
44e Journées Annuelles de l'IFM 2017 : digital retail and now?
44e Journées Annuelles de l'IFM 2017 : digital retail and now? 44e Journées Annuelles de l'IFM 2017 : digital retail and now?
44e Journées Annuelles de l'IFM 2017 : digital retail and now? ALTAVIA
 
Nginx+lua在阿里巴巴的使用
Nginx+lua在阿里巴巴的使用Nginx+lua在阿里巴巴的使用
Nginx+lua在阿里巴巴的使用OpenRestyCon
 
Data, Chinese Ants and how Alibaba Became the World’s Largest Retailer
Data, Chinese Ants and how Alibaba Became the World’s Largest RetailerData, Chinese Ants and how Alibaba Became the World’s Largest Retailer
Data, Chinese Ants and how Alibaba Became the World’s Largest RetailerNick Smith
 
Group M Interaction 2017 Preview
Group M Interaction 2017 PreviewGroup M Interaction 2017 Preview
Group M Interaction 2017 Previewdigitalinasia
 
Alibaba Vision and Mission
Alibaba Vision and MissionAlibaba Vision and Mission
Alibaba Vision and MissionSook Yen Wong
 
76【績效管理】阿里巴巴的績效管理是怎麼做的?績效管理流程|績效考核組成|管理層與員工考核 |績效結果運用
76【績效管理】阿里巴巴的績效管理是怎麼做的?績效管理流程|績效考核組成|管理層與員工考核 |績效結果運用76【績效管理】阿里巴巴的績效管理是怎麼做的?績效管理流程|績效考核組成|管理層與員工考核 |績效結果運用
76【績效管理】阿里巴巴的績效管理是怎麼做的?績效管理流程|績效考核組成|管理層與員工考核 |績效結果運用周建良 Zhou Jian Liang
 
Alibaba Group - Strategic Analysis - Overview
Alibaba Group - Strategic Analysis - OverviewAlibaba Group - Strategic Analysis - Overview
Alibaba Group - Strategic Analysis - OverviewSelf Employed
 

Destaque (20)

BDTC2015 阿里巴巴-鄢志杰(智捷)-deep learning助力客服小二:数据技术及机器学习在客服中心的应用
BDTC2015 阿里巴巴-鄢志杰(智捷)-deep learning助力客服小二:数据技术及机器学习在客服中心的应用BDTC2015 阿里巴巴-鄢志杰(智捷)-deep learning助力客服小二:数据技术及机器学习在客服中心的应用
BDTC2015 阿里巴巴-鄢志杰(智捷)-deep learning助力客服小二:数据技术及机器学习在客服中心的应用
 
LA STRATEGIA ENIT SUL MERCATO CINESE
LA STRATEGIA ENIT SUL MERCATO CINESELA STRATEGIA ENIT SUL MERCATO CINESE
LA STRATEGIA ENIT SUL MERCATO CINESE
 
阿里巴巴运维团队的无状态运维思路
阿里巴巴运维团队的无状态运维思路阿里巴巴运维团队的无状态运维思路
阿里巴巴运维团队的无状态运维思路
 
Ab test -互联网渐进式解决方案
Ab test -互联网渐进式解决方案Ab test -互联网渐进式解决方案
Ab test -互联网渐进式解决方案
 
20151020 阿里巴巴十大網商台南區初選
20151020 阿里巴巴十大網商台南區初選20151020 阿里巴巴十大網商台南區初選
20151020 阿里巴巴十大網商台南區初選
 
China top 10 B2B website in 2016
China top 10 B2B website in 2016China top 10 B2B website in 2016
China top 10 B2B website in 2016
 
BDTC2015 阿里巴巴-郑斌-大数据下的数据安全
BDTC2015 阿里巴巴-郑斌-大数据下的数据安全BDTC2015 阿里巴巴-郑斌-大数据下的数据安全
BDTC2015 阿里巴巴-郑斌-大数据下的数据安全
 
Nginx深度開發與客制化
Nginx深度開發與客制化Nginx深度開發與客制化
Nginx深度開發與客制化
 
44e Journées Annuelles de l'IFM 2017 : digital retail and now?
44e Journées Annuelles de l'IFM 2017 : digital retail and now? 44e Journées Annuelles de l'IFM 2017 : digital retail and now?
44e Journées Annuelles de l'IFM 2017 : digital retail and now?
 
Alibaba 市場趨勢和推廣-亞太區
Alibaba 市場趨勢和推廣-亞太區Alibaba 市場趨勢和推廣-亞太區
Alibaba 市場趨勢和推廣-亞太區
 
Alibaba meetup
Alibaba meetupAlibaba meetup
Alibaba meetup
 
Nginx+lua在阿里巴巴的使用
Nginx+lua在阿里巴巴的使用Nginx+lua在阿里巴巴的使用
Nginx+lua在阿里巴巴的使用
 
Alibaba
AlibabaAlibaba
Alibaba
 
case study of alibaba group
case study of alibaba groupcase study of alibaba group
case study of alibaba group
 
Data, Chinese Ants and how Alibaba Became the World’s Largest Retailer
Data, Chinese Ants and how Alibaba Became the World’s Largest RetailerData, Chinese Ants and how Alibaba Became the World’s Largest Retailer
Data, Chinese Ants and how Alibaba Became the World’s Largest Retailer
 
Group M Interaction 2017 Preview
Group M Interaction 2017 PreviewGroup M Interaction 2017 Preview
Group M Interaction 2017 Preview
 
Alibaba group
Alibaba groupAlibaba group
Alibaba group
 
Alibaba Vision and Mission
Alibaba Vision and MissionAlibaba Vision and Mission
Alibaba Vision and Mission
 
76【績效管理】阿里巴巴的績效管理是怎麼做的?績效管理流程|績效考核組成|管理層與員工考核 |績效結果運用
76【績效管理】阿里巴巴的績效管理是怎麼做的?績效管理流程|績效考核組成|管理層與員工考核 |績效結果運用76【績效管理】阿里巴巴的績效管理是怎麼做的?績效管理流程|績效考核組成|管理層與員工考核 |績效結果運用
76【績效管理】阿里巴巴的績效管理是怎麼做的?績效管理流程|績效考核組成|管理層與員工考核 |績效結果運用
 
Alibaba Group - Strategic Analysis - Overview
Alibaba Group - Strategic Analysis - OverviewAlibaba Group - Strategic Analysis - Overview
Alibaba Group - Strategic Analysis - Overview
 

Mais de hdhappy001

詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systems詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systemshdhappy001
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践hdhappy001
 
袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战hdhappy001
 
俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkaban俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkabanhdhappy001
 
杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务hdhappy001
 
薛伟:腾讯广点通——大数据之上的实时精准推荐
薛伟:腾讯广点通——大数据之上的实时精准推荐薛伟:腾讯广点通——大数据之上的实时精准推荐
薛伟:腾讯广点通——大数据之上的实时精准推荐hdhappy001
 
徐萌:中国移动大数据应用实践
徐萌:中国移动大数据应用实践徐萌:中国移动大数据应用实践
徐萌:中国移动大数据应用实践hdhappy001
 
肖永红:科研数据应用和共享方面的实践
肖永红:科研数据应用和共享方面的实践肖永红:科研数据应用和共享方面的实践
肖永红:科研数据应用和共享方面的实践hdhappy001
 
肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进hdhappy001
 
夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架hdhappy001
 
魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题hdhappy001
 
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎hdhappy001
 
钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探hdhappy001
 
穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scale穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scalehdhappy001
 
罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群hdhappy001
 
刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术hdhappy001
 
刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sql刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sqlhdhappy001
 
刘昌钰:阿里大数据应用平台
刘昌钰:阿里大数据应用平台刘昌钰:阿里大数据应用平台
刘昌钰:阿里大数据应用平台hdhappy001
 
李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略hdhappy001
 
冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展hdhappy001
 

Mais de hdhappy001 (20)

詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systems詹剑锋:Big databench—benchmarking big data systems
詹剑锋:Big databench—benchmarking big data systems
 
翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践翟艳堂:腾讯大规模Hadoop集群实践
翟艳堂:腾讯大规模Hadoop集群实践
 
袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战袁晓如:大数据时代可视化和可视分析的机遇与挑战
袁晓如:大数据时代可视化和可视分析的机遇与挑战
 
俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkaban俞晨杰:Linked in大数据应用和azkaban
俞晨杰:Linked in大数据应用和azkaban
 
杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务杨少华:阿里开放数据处理服务
杨少华:阿里开放数据处理服务
 
薛伟:腾讯广点通——大数据之上的实时精准推荐
薛伟:腾讯广点通——大数据之上的实时精准推荐薛伟:腾讯广点通——大数据之上的实时精准推荐
薛伟:腾讯广点通——大数据之上的实时精准推荐
 
徐萌:中国移动大数据应用实践
徐萌:中国移动大数据应用实践徐萌:中国移动大数据应用实践
徐萌:中国移动大数据应用实践
 
肖永红:科研数据应用和共享方面的实践
肖永红:科研数据应用和共享方面的实践肖永红:科研数据应用和共享方面的实践
肖永红:科研数据应用和共享方面的实践
 
肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进肖康:Storm在实时网络攻击检测和分析的应用与改进
肖康:Storm在实时网络攻击检测和分析的应用与改进
 
夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架夏俊鸾:Spark——基于内存的下一代大数据分析框架
夏俊鸾:Spark——基于内存的下一代大数据分析框架
 
魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题魏凯:大数据商业利用的政策管制问题
魏凯:大数据商业利用的政策管制问题
 
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎王涛:基于Cloudera impala的非关系型数据库sql执行引擎
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
 
钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探钱卫宁:在线社交媒体分析型查询基准评测初探
钱卫宁:在线社交媒体分析型查询基准评测初探
 
穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scale穆黎森:Interactive batch query at scale
穆黎森:Interactive batch query at scale
 
罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群罗李:构建一个跨机房的Hadoop集群
罗李:构建一个跨机房的Hadoop集群
 
刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术刘书良:基于大数据公共云平台的Dsp技术
刘书良:基于大数据公共云平台的Dsp技术
 
刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sql刘诚忠:Running cloudera impala on postgre sql
刘诚忠:Running cloudera impala on postgre sql
 
刘昌钰:阿里大数据应用平台
刘昌钰:阿里大数据应用平台刘昌钰:阿里大数据应用平台
刘昌钰:阿里大数据应用平台
 
李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略李战怀:大数据背景下分布式系统的数据一致性策略
李战怀:大数据背景下分布式系统的数据一致性策略
 
冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展冯宏华:H base在小米的应用与扩展
冯宏华:H base在小米的应用与扩展
 

王峰:阿里搜索实时流计算技术