SlideShare uma empresa Scribd logo
1 de 10
Baixar para ler offline
Infoc的演变
Infoc的演变
金山网络 云安全 彭仁诚
什么是infoc?
什么是infoc
   infoc?

     • 哪个功能用户最喜欢?
     • 每个功能给用户带来的作
       用如何?
     • 用户是如何选择的?
系统需求
基本设计1.0
基本设计
  设计1.0
详细架构1.0
详细架构1.0
Infoc1.0的优缺点
               Infoc1.0的优缺点
•   优点
    – 通用方案,适于快速搭建
    – 所有统计基于原始数据,适用于各种变化的统计需求
•   缺点
    –   上报数据使用字符串,通过base64加密�明文、上报流量大
    –   对需求没有分级处理
    –   采用nginx日志方式,客户端并不能知道数据是否真正上报成功
    –   日志从外网拉到内网,下拉数据量过大,加上互联互通问题会导致数据下拉难以
        保证
    –   Hadoop集群中导入数据比较慢
    –   每增加一个埋点,就需要新写解析程序
    –   依赖hadoop+hive,需要对其了解比较深
    –   系统对数据埋点操作不可控,任何人都可能在客户端增加埋点,然后让服务端进
        行解析
    –   埋点信息修改时,需要修改解析脚本来向前兼容
详细架构2.0
详细架构2.0
Infoc2.0的优缺点
               Infoc2.0的优缺点
•   缺点
    – 编码量相对大
•   优点
    – 埋点接入使用字符串,上报使用二进制数据�保密性好、上报流量小
    – 对需求进行分优先级处理,重要数据埋点从物理机器上分离,而系统不需要变化
    – 数据格式在infoc系统内部实现流转,外部不需要了解细节
    – 每个机房先对各自的数据进行统计,然后下拉到内网进行合并处理,下拉数据量
      变小,系统更加稳定,而且数据统计更快速
    – 解析引擎和统计引擎根据格式文件和配置文件对上报的数据进行解析和统计,新
      增加一个埋点时,只需要进行简单的界面配置即可,不需要其他任何修改
    – 增加埋点时需要进行配置和审核,从流程上解决埋点失控状态
    – Infoc系统内对上报数据量进行百分比控制,避免了大量数据上报导致产品和系统
      不稳定的状况


                                               8
一些原则
•   不同业务时期,不同架构
•   尽量少依赖不够了解的系统
•   应用离数据更近
•   服务分级
•   让整个系统运行时变化最少
•   将机房、网络等实际限制作为现实条件
感谢观赏!
感谢观赏!
简单、简单、再简单

Mais conteúdo relacionado

Semelhante a 产品信息收集系统Infoc的演变

腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验guiyingshenxia
 
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验colderboy17
 
了解应用服务器
了解应用服务器了解应用服务器
了解应用服务器Feng Yu
 
从林书豪到全明星 - 虎扑网技术架构如何化解流量高峰
从林书豪到全明星 - 虎扑网技术架构如何化解流量高峰从林书豪到全明星 - 虎扑网技术架构如何化解流量高峰
从林书豪到全明星 - 虎扑网技术架构如何化解流量高峰Scourgen Hong
 
产品演示:Denodo平台如何加速您获取洞察的时间
产品演示:Denodo平台如何加速您获取洞察的时间产品演示:Denodo平台如何加速您获取洞察的时间
产品演示:Denodo平台如何加速您获取洞察的时间Denodo
 
众行业公司系统架构案例介绍
众行业公司系统架构案例介绍众行业公司系统架构案例介绍
众行业公司系统架构案例介绍mysqlops
 
Chap12 嵌入式系统开发模式
Chap12 嵌入式系统开发模式Chap12 嵌入式系统开发模式
Chap12 嵌入式系统开发模式Allen Galler
 
腾讯技术讲座:1.4亿在线背后的故事
腾讯技术讲座:1.4亿在线背后的故事腾讯技术讲座:1.4亿在线背后的故事
腾讯技术讲座:1.4亿在线背后的故事Tian Wang
 
資策會網工班第八十期資安競賽第三組簡報
資策會網工班第八十期資安競賽第三組簡報資策會網工班第八十期資安競賽第三組簡報
資策會網工班第八十期資安競賽第三組簡報d12hd12h
 
Network security reesjohnson
Network security reesjohnsonNetwork security reesjohnson
Network security reesjohnsonITband
 
Nodejs & NAE
Nodejs & NAENodejs & NAE
Nodejs & NAEq3boy
 
新时代的分析型云数据库 Greenplum
新时代的分析型云数据库 Greenplum新时代的分析型云数据库 Greenplum
新时代的分析型云数据库 Greenplum锐 张
 
Greenplum技术
Greenplum技术Greenplum技术
Greenplum技术锐 张
 
大型电商的数据服务的要点和难点
大型电商的数据服务的要点和难点 大型电商的数据服务的要点和难点
大型电商的数据服务的要点和难点 Chao Zhu
 
数据中心网络架构与全球化服务-Qcon2011
数据中心网络架构与全球化服务-Qcon2011数据中心网络架构与全球化服务-Qcon2011
数据中心网络架构与全球化服务-Qcon2011Yiwei Ma
 
唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pubChao Zhu
 
Monitouch Express Vol26
Monitouch Express Vol26Monitouch Express Vol26
Monitouch Express Vol26monitouch
 
Alibaba server-zhangxuseng-qcon
Alibaba server-zhangxuseng-qconAlibaba server-zhangxuseng-qcon
Alibaba server-zhangxuseng-qconYiwei Ma
 

Semelhante a 产品信息收集系统Infoc的演变 (20)

腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
 
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
 
了解应用服务器
了解应用服务器了解应用服务器
了解应用服务器
 
从林书豪到全明星 - 虎扑网技术架构如何化解流量高峰
从林书豪到全明星 - 虎扑网技术架构如何化解流量高峰从林书豪到全明星 - 虎扑网技术架构如何化解流量高峰
从林书豪到全明星 - 虎扑网技术架构如何化解流量高峰
 
产品演示:Denodo平台如何加速您获取洞察的时间
产品演示:Denodo平台如何加速您获取洞察的时间产品演示:Denodo平台如何加速您获取洞察的时间
产品演示:Denodo平台如何加速您获取洞察的时间
 
众行业公司系统架构案例介绍
众行业公司系统架构案例介绍众行业公司系统架构案例介绍
众行业公司系统架构案例介绍
 
Chap12 嵌入式系统开发模式
Chap12 嵌入式系统开发模式Chap12 嵌入式系统开发模式
Chap12 嵌入式系统开发模式
 
Mocha Bsm
Mocha BsmMocha Bsm
Mocha Bsm
 
腾讯技术讲座:1.4亿在线背后的故事
腾讯技术讲座:1.4亿在线背后的故事腾讯技术讲座:1.4亿在线背后的故事
腾讯技术讲座:1.4亿在线背后的故事
 
資策會網工班第八十期資安競賽第三組簡報
資策會網工班第八十期資安競賽第三組簡報資策會網工班第八十期資安競賽第三組簡報
資策會網工班第八十期資安競賽第三組簡報
 
Network security reesjohnson
Network security reesjohnsonNetwork security reesjohnson
Network security reesjohnson
 
Nodejs & NAE
Nodejs & NAENodejs & NAE
Nodejs & NAE
 
Java@taobao
Java@taobaoJava@taobao
Java@taobao
 
新时代的分析型云数据库 Greenplum
新时代的分析型云数据库 Greenplum新时代的分析型云数据库 Greenplum
新时代的分析型云数据库 Greenplum
 
Greenplum技术
Greenplum技术Greenplum技术
Greenplum技术
 
大型电商的数据服务的要点和难点
大型电商的数据服务的要点和难点 大型电商的数据服务的要点和难点
大型电商的数据服务的要点和难点
 
数据中心网络架构与全球化服务-Qcon2011
数据中心网络架构与全球化服务-Qcon2011数据中心网络架构与全球化服务-Qcon2011
数据中心网络架构与全球化服务-Qcon2011
 
唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub唯品会大数据实践 Sacc pub
唯品会大数据实践 Sacc pub
 
Monitouch Express Vol26
Monitouch Express Vol26Monitouch Express Vol26
Monitouch Express Vol26
 
Alibaba server-zhangxuseng-qcon
Alibaba server-zhangxuseng-qconAlibaba server-zhangxuseng-qcon
Alibaba server-zhangxuseng-qcon
 

Mais de Zoom Quiet

01s0401 go,互联网时代的c语言 许式伟
01s0401 go,互联网时代的c语言   许式伟01s0401 go,互联网时代的c语言   许式伟
01s0401 go,互联网时代的c语言 许式伟Zoom Quiet
 
Zoz pwned-by-the-owner-表惹程序猿
Zoz pwned-by-the-owner-表惹程序猿Zoz pwned-by-the-owner-表惹程序猿
Zoz pwned-by-the-owner-表惹程序猿Zoom Quiet
 
金山云查询系统改进之路1
金山云查询系统改进之路1金山云查询系统改进之路1
金山云查询系统改进之路1Zoom Quiet
 
Zh120226techparty zd-story
Zh120226techparty zd-storyZh120226techparty zd-story
Zh120226techparty zd-storyZoom Quiet
 
Zh120226techparty velocity2011-review
Zh120226techparty velocity2011-reviewZh120226techparty velocity2011-review
Zh120226techparty velocity2011-reviewZoom Quiet
 
Zh120226techparty jeff kit-ios-toolbox
Zh120226techparty jeff kit-ios-toolboxZh120226techparty jeff kit-ios-toolbox
Zh120226techparty jeff kit-ios-toolboxZoom Quiet
 
Velocity2011分享
Velocity2011分享Velocity2011分享
Velocity2011分享Zoom Quiet
 
陈正 Introduction to-sae_python
陈正   Introduction to-sae_python陈正   Introduction to-sae_python
陈正 Introduction to-sae_pythonZoom Quiet
 
111218 zhtechparty-移动互联网产品需求分析
111218 zhtechparty-移动互联网产品需求分析111218 zhtechparty-移动互联网产品需求分析
111218 zhtechparty-移动互联网产品需求分析Zoom Quiet
 
111218 zhtechparty-zd-浅谈symbian开发
111218 zhtechparty-zd-浅谈symbian开发111218 zhtechparty-zd-浅谈symbian开发
111218 zhtechparty-zd-浅谈symbian开发Zoom Quiet
 
金山卫士界面框架
金山卫士界面框架金山卫士界面框架
金山卫士界面框架Zoom Quiet
 
111030 gztechparty-小路-云时代的mysql
111030 gztechparty-小路-云时代的mysql111030 gztechparty-小路-云时代的mysql
111030 gztechparty-小路-云时代的mysqlZoom Quiet
 
111030 gztechparty-小路-sophia
111030 gztechparty-小路-sophia111030 gztechparty-小路-sophia
111030 gztechparty-小路-sophiaZoom Quiet
 
080328 linux2 bsd
080328 linux2 bsd080328 linux2 bsd
080328 linux2 bsdZoom Quiet
 
110929 kn-手机软件测试
110929 kn-手机软件测试110929 kn-手机软件测试
110929 kn-手机软件测试Zoom Quiet
 
Socialmediaaroundtheworld2011
Socialmediaaroundtheworld2011Socialmediaaroundtheworld2011
Socialmediaaroundtheworld2011Zoom Quiet
 
110925 zdparty-正点闹钟产品分享
110925 zdparty-正点闹钟产品分享110925 zdparty-正点闹钟产品分享
110925 zdparty-正点闹钟产品分享Zoom Quiet
 

Mais de Zoom Quiet (20)

Go courseday3
Go courseday3Go courseday3
Go courseday3
 
Go courseday2
Go courseday2Go courseday2
Go courseday2
 
Go courseday1
Go courseday1Go courseday1
Go courseday1
 
01s0401 go,互联网时代的c语言 许式伟
01s0401 go,互联网时代的c语言   许式伟01s0401 go,互联网时代的c语言   许式伟
01s0401 go,互联网时代的c语言 许式伟
 
Zoz pwned-by-the-owner-表惹程序猿
Zoz pwned-by-the-owner-表惹程序猿Zoz pwned-by-the-owner-表惹程序猿
Zoz pwned-by-the-owner-表惹程序猿
 
金山云查询系统改进之路1
金山云查询系统改进之路1金山云查询系统改进之路1
金山云查询系统改进之路1
 
Zh120226techparty zd-story
Zh120226techparty zd-storyZh120226techparty zd-story
Zh120226techparty zd-story
 
Zh120226techparty velocity2011-review
Zh120226techparty velocity2011-reviewZh120226techparty velocity2011-review
Zh120226techparty velocity2011-review
 
Zh120226techparty jeff kit-ios-toolbox
Zh120226techparty jeff kit-ios-toolboxZh120226techparty jeff kit-ios-toolbox
Zh120226techparty jeff kit-ios-toolbox
 
Velocity2011分享
Velocity2011分享Velocity2011分享
Velocity2011分享
 
陈正 Introduction to-sae_python
陈正   Introduction to-sae_python陈正   Introduction to-sae_python
陈正 Introduction to-sae_python
 
111218 zhtechparty-移动互联网产品需求分析
111218 zhtechparty-移动互联网产品需求分析111218 zhtechparty-移动互联网产品需求分析
111218 zhtechparty-移动互联网产品需求分析
 
111218 zhtechparty-zd-浅谈symbian开发
111218 zhtechparty-zd-浅谈symbian开发111218 zhtechparty-zd-浅谈symbian开发
111218 zhtechparty-zd-浅谈symbian开发
 
金山卫士界面框架
金山卫士界面框架金山卫士界面框架
金山卫士界面框架
 
111030 gztechparty-小路-云时代的mysql
111030 gztechparty-小路-云时代的mysql111030 gztechparty-小路-云时代的mysql
111030 gztechparty-小路-云时代的mysql
 
111030 gztechparty-小路-sophia
111030 gztechparty-小路-sophia111030 gztechparty-小路-sophia
111030 gztechparty-小路-sophia
 
080328 linux2 bsd
080328 linux2 bsd080328 linux2 bsd
080328 linux2 bsd
 
110929 kn-手机软件测试
110929 kn-手机软件测试110929 kn-手机软件测试
110929 kn-手机软件测试
 
Socialmediaaroundtheworld2011
Socialmediaaroundtheworld2011Socialmediaaroundtheworld2011
Socialmediaaroundtheworld2011
 
110925 zdparty-正点闹钟产品分享
110925 zdparty-正点闹钟产品分享110925 zdparty-正点闹钟产品分享
110925 zdparty-正点闹钟产品分享
 

产品信息收集系统Infoc的演变

  • 2. 什么是infoc? 什么是infoc infoc? • 哪个功能用户最喜欢? • 每个功能给用户带来的作 用如何? • 用户是如何选择的?
  • 6. Infoc1.0的优缺点 Infoc1.0的优缺点 • 优点 – 通用方案,适于快速搭建 – 所有统计基于原始数据,适用于各种变化的统计需求 • 缺点 – 上报数据使用字符串,通过base64加密�明文、上报流量大 – 对需求没有分级处理 – 采用nginx日志方式,客户端并不能知道数据是否真正上报成功 – 日志从外网拉到内网,下拉数据量过大,加上互联互通问题会导致数据下拉难以 保证 – Hadoop集群中导入数据比较慢 – 每增加一个埋点,就需要新写解析程序 – 依赖hadoop+hive,需要对其了解比较深 – 系统对数据埋点操作不可控,任何人都可能在客户端增加埋点,然后让服务端进 行解析 – 埋点信息修改时,需要修改解析脚本来向前兼容
  • 8. Infoc2.0的优缺点 Infoc2.0的优缺点 • 缺点 – 编码量相对大 • 优点 – 埋点接入使用字符串,上报使用二进制数据�保密性好、上报流量小 – 对需求进行分优先级处理,重要数据埋点从物理机器上分离,而系统不需要变化 – 数据格式在infoc系统内部实现流转,外部不需要了解细节 – 每个机房先对各自的数据进行统计,然后下拉到内网进行合并处理,下拉数据量 变小,系统更加稳定,而且数据统计更快速 – 解析引擎和统计引擎根据格式文件和配置文件对上报的数据进行解析和统计,新 增加一个埋点时,只需要进行简单的界面配置即可,不需要其他任何修改 – 增加埋点时需要进行配置和审核,从流程上解决埋点失控状态 – Infoc系统内对上报数据量进行百分比控制,避免了大量数据上报导致产品和系统 不稳定的状况 8
  • 9. 一些原则 • 不同业务时期,不同架构 • 尽量少依赖不够了解的系统 • 应用离数据更近 • 服务分级 • 让整个系统运行时变化最少 • 将机房、网络等实际限制作为现实条件