Hadoop Big Data 成功案例分享

Etu Solution
Etu SolutionEtu Solution
Hadoop 
Big 
Data 
成功案例分享 
陳育杰 Eric Chen 
Senior AVP. , Etu Business Development 
eric_chen@etusolution.com 
Oct. 8, 2014
2 
Big Data 新應用架構 
RDB 
Business 
Intelligence 
ETL 
Business 
Analy9cs 
Voice file 
Video file 
Image file 
Doc file 
Txt file 
XML file 
Web Logs 
Click event 
Social 
network 
Associated 
map News 
Feeds 
Sensor 
Embedded 
RFID Tags 
Geographic 
GPS 
Event 
Others 
HIVE 
HBase 
MapReduce 
HDFS 
Impala 
Mahout 
Pig
3 
Big Data 新應用架構 
Hadoop as a “Data Store” 
RDB 
Business 
Intelligence 
ETL 
Business 
Analy9cs 
Voice file 
Video file 
Image file 
Doc file 
Txt file 
XML file 
Web Logs 
Click event 
Social 
network 
Associated 
map News 
Feeds 
Sensor 
Embedded 
RFID Tags 
Geographic 
GPS 
Event 
Others 
HIVE 
HBase 
MapReduce 
HDFS 
Impala 
Mahout 
Pig
4 
Big Data 新應用架構 
Hadoop as a “Data Pre-processing 
Platform” 
RDB 
Business 
Intelligence 
ETL 
Business 
Analy9cs 
Voice file 
Video file 
Image file 
Doc file 
Txt file 
XML file 
Web Logs 
Click event 
Social 
network 
Associated 
map News 
Feeds 
Sensor 
Embedded 
RFID Tags 
Geographic 
GPS 
Event 
Others 
HIVE 
QL Pig 
Join, 
Aggrega,on, 
Filter, 
Sor,ng, 
HIVE 
HBase 
Correla,on 
…….. 
HDFS 
Impala 
Mahout 
MapReduce
5 
Big Data 新應用架構 
Hadoop as a “DB” 
RDB 
BI 
ETL 
Business 
Analy9cs 
Voice file 
Video file 
Image file 
Doc file 
Txt file 
XML file 
Web Logs 
Click event 
Social 
network 
Associated 
map News 
Feeds 
Sensor 
Embedded 
RFID Tags 
Geographic 
GPS 
Event 
Others 
HIVE 
HBase 
MapReduce 
HDFS 
Impala 
Mahout 
Pig 
API 
ODBC
Big Data 新應用架構 
Hadoop as a “Data Analytics 
Engine” 
ETL 
RDB 
Business 
Analy9cs 
Business 
Intelligence 
Voice file 
Video file 
Image file 
Doc file 
Txt file 
XML file 
Web Logs 
Click event 
Social 
network 
Associated 
map News 
Feeds 
Sensor 
Embedded 
RFID Tags 
Geographic 
GPS 
Event 
Others 
Mahout 
HIVE 
HBase 
MapReduce 
HDFS 
Pig 
Impala 
6 6
7 
應用案例 
l 精準推薦與消費者洞察 
l DW Offload – 資料載入與查詢 
l 生產良率即時告警
8 
精準推薦與消費者洞察
9 
精準推薦與消費者洞察 
Etu Recommender 
Application 
轉化率分析 
推薦演算法 
客戶相似 
度分析 
資料 
擷 
取 
商品關聯 
性分析 
推薦清 
單 
推薦引擎 
歷史交易資料 
• 訂單資料 
• 購買紀錄 
Web 互動資料 
• 瀏覽 
• 點擊 
• 搜尋 
• 購物車 
• 結帳 
• 跨網域用戶行為 
Mobile Web 
互動資料 
• 瀏覽 
• 點擊 
• 搜尋 
• 購物車 
• 結帳 
• 跨網域用戶行為 
Etu Insight 
User-­‐defined 
Recommenda/on 
Result 
Filter 
廣告關聯 
性分析 
內容關聯 
性分析 
Product 
Recommendation 
商品推薦 
Content 
Recommendation 
內容推薦 
Ad 
Recommendation 
站內廣告推薦
10 
精準推薦與消費者洞察 
Clicks 每一個點擊代表一個動作和意圖 
是訂單資料和會員系統無法告訴你的 
• 瀏覽商品 
• 看廣告 
• 看新聞 
• 看網友評論 
• 按讚 
• 分享 
• 下載表單 
• 兌換優惠券…..
11 
精準推薦與消費者洞察 
場景#2 
哪些人只 
看不買? 
場景#3 
誰愛小米? 
iPhone? 
Etu Recommender 
Application 
轉化率分析 
推薦演算法 
客戶相似 
度分析 
資料 
擷 
取 
商品關聯 
性分析 
推薦清 
單 
推薦引擎 
歷史交易資料 
• 訂單資料 
• 購買紀錄 
場景#1 
誰是我的 
忠實粉絲 
Web 互動資料 
• 瀏覽 
• 點擊 
• 搜尋 
• 購物車 
• 結帳 
• 跨網域用戶行為 
Mobile Web 
互動資料 
• 瀏覽 
• 點擊 
• 搜尋 
• 購物車 
• 結帳 
• 跨網域用戶行為 
User-­‐defined 
Recommenda/on 
Result 
Filter 
廣告關聯 
性分析 
內容關聯 
性分析 
場景#4 
廣告費都 
丟到水裡 
Product 
場景#5 
網站的使 
用者體驗 
如何? 
Recommendation 
商品推薦 
Content 
了? 
Recommendation 
內容推薦 
Ad 
Recommendation 
站內廣告推薦 
Etu Insight 
(Customer Behavior Data Warehouse) 
流量分析 
新客戶 
vs. 
回頭客 
漏斗分析 
每天多少流 
量能轉化為 
訂單 
品牌偏好度 
各商品分類 
最受歡迎品 
牌 
來源網站和 
訂單效益 
關聯性分析 
不同版位效 
益分析,評 
估網站使用 
者體驗
12 
精準推薦與消費者洞察 
Customer 
Behavior 
Recommenda/on 
Etu Recommender 
商品 
內容 
廣告 
Consumer Connect 
List 
Customer 
Behavior 
Recommenda/on 
Etu Recommender 
商品 
內容 
廣告 
Consumer Connect 
List 
DW 
CRM 
Consumer Discovery 
Analytics core 
推薦運算叢集 
3600 
Customer 
View 
Customer Profile Discovery 
Data 
Converter 
Customer Behavior 
Data Warehouse 
HIVE JDBC 
/ODBCDriver 
Analytics core 
推薦運算叢集 
客戶行為分析叢集 
Event 
Collector 
Customer Behavior 
Data Store 
Event 
Collector 
Customer Behavior 
Data Store
13 
消費者洞察,資料策略的第一步
14 
DW Offload – 資料載入與查詢
15 
DW Offload – 資料載入與查詢 
l 客戶 : 某大醫院 
l 需求 : HIS 系統與院際其他系統資料整合 
l 困難與挑戰 : 
ü 原 HIS 系統資料庫支援度差,需先將資料匯出處理 
ü 來源資料量非常龐大, ETL 載入效率非常差 
ü 原資料庫對大量資料的查詢效率不佳,無法應付大量且即時的查詢 
需求 
SSIS 
SQL 
SQL 
Server 
查詢結果 
資料入庫 
時間過長 
資料查詢 
時間過長 
Oracle 
Informix 
SQL 
Server
16 
DW Offload – 資料載入與查詢 
Sqoop 
SQL 
查詢結果 
Impala 
HDFS 
第一期方案 
Informix 
1. 以 Etu Software Appliance 搭配 Sqoop 做資料入檔,解決資料載入 
時間過長問題。 
2. 使用 Impala 查詢 Hadoop 中的資料,解決資料查詢時間過長問題。
17 
DW Offload – 資料載入與查詢 
最終方案 
Sqoop 
ETL 
Impala 
HDFS 
Oracle 
Informix 
SQL 
Server 
EDW 
/ 
DM 
API 
Web 
Service 
1. Hadoop 成為組織內部的 data pool (ODS),所有資料先進行格式統一, 
錯誤資料清洗等轉置工作,並儲存在 HDFS 中。 
3. EDW / DM 或應用系統所有資料需求,皆統一由 Hadoop 提供,解決跨 
來源資料整合問題。
18 
從 RDB 邁向 Big Data BI
19 
生產良率即時告警
20 
生產良率即時告警 
製程資料 
組裝包產線 
SMT產線 
統計分析改善 
統計分析 
製作圖表 
良率低 
主因素 
組裝包產線 
現有技術架構 
RDB 資料儲存、運算與彙整 
RDB 
不及時 
算得慢 
擴充成本高 
N 
hours 
SPC 
SMT 
SFCS 
SMT 
Data 
Files 
SMT產線 
SMT產線 
註: 
SFCS: 
Shop 
Floor 
control 
system; 
SPC: 
Solder 
Paste 
Control 
SPI: 
Solder 
Paste 
Inspec/on 
資料探勘 
特徵規則(傳統運算) 
SPC 
SFCS 
SMT 
SFCS 
SPI 
1. 生產問題無法及時發現: 資料處理與計算時間過長導致生產問題無法及時發現 
2. 運算效能不彰: 採用資料庫進行運算時,產生過多Temp Files與資料轉換,系統資源浪費且效率差 
3. 容量擴充成本高: 因應產線擴充,機台測試資料增加與保存時間延長所需成本過高(Scale Up)
21 
生產良率即時告警 
製程資料 
組裝包產線 
組裝包產線 
SMT產線 
SMT產線 
SMT產線 
SPC 
SFCS 
SMT 
SFCS 
SPI 
新一代 Big Data 技術架構 
統計分析加以確認 
統計分析 
製作圖表 
及時 
算得快 
擴充成本低 
良率低 
資料探勘 
RDB 主因素 
N 
mins 
MPP 
DB 
特徵規則 (平行運算) 
SMT 
No 
SQL 
SMT 
Data 
Files 
HDFS 
SPC 
SFCS 
1. 生產問題及時發現: 資料處理與計算時間大幅縮短,可以提升品質判斷速度,減少產線損失 
2. 運算效能佳: 採用平行運算與分散式檔案系統,減少過多Temp Files與資料轉換,生成統計表提供查詢 
3. 容量擴充成本低: 因應產線擴充,機台測試資料增加與保存時間延長可線性擴充 (Scale out)
22 
生產良率即時告警 
Real-time Big Data 
Data 
Stream 
Spark-­‐ 
Streaming 
Spark 
Impala 
DN 
RS 
Spark-­‐ 
Streaming 
Spark 
Impala 
DN 
RS 
Spark-­‐ 
Streaming 
Spark 
DN 
RS 
Impala 
… 
Data 
Stream 
Data 
Stream 
生產機台資料 
SPI Data 
On-the-fly Pattern 
Matching  Alert 
Real-time Analytics 
- Machine Learning (Rec. Cluster..) 
- Iterative Algorithms 
Near Real-time Query 
- Ad-hoc query 
- Reporting 
Long term data store 
- Batch process 
- Offline analytics 
- Historical Mining Spark  Impala work together
23 
Real-time Big Data
24 
Workshop
Thank 
you 
318, 
Rueiguang 
Rd., 
Taipei 
114, 
Taiwan 
T: 
+886 
2 
7720 
1888 
F: 
+886 
2 
8798 
6069 
www.etusolu/on.com
1 de 25

Mais conteúdo relacionado

Mais procurados

DSP 資料科學計畫簡介DSP 資料科學計畫簡介
DSP 資料科學計畫簡介codefortomorrow
3.2K visualizações41 slides
何謂大數據何謂大數據
何謂大數據kngchn
1.9K visualizações36 slides

Mais procurados(20)

DSP 資料科學計畫簡介DSP 資料科學計畫簡介
DSP 資料科學計畫簡介
codefortomorrow3.2K visualizações
轉兌數據的價值 — 從導購到策購轉兌數據的價值 — 從導購到策購
轉兌數據的價值 — 從導購到策購
Fred Chiang65.2K visualizações
啟程:Data Technology 的待客之道啟程:Data Technology 的待客之道
啟程:Data Technology 的待客之道
Etu Solution31.8K visualizações
何謂大數據何謂大數據
何謂大數據
kngchn1.9K visualizações
2014 年十大商业智能趋势2014 年十大商业智能趋势
2014 年十大商业智能趋势
Tableau Software3.9K visualizações
Trinity BDM - 橋接傳統與未來Trinity BDM - 橋接傳統與未來
Trinity BDM - 橋接傳統與未來
Etu Solution1.3K visualizações
数据的价值和灵魂数据的价值和灵魂
数据的价值和灵魂
学峰 司1.3K visualizações
大數據的基本概念(上)大數據的基本概念(上)
大數據的基本概念(上)
Turning Point Studio6.5K visualizações
浅谈数据科学浅谈数据科学
浅谈数据科学
学峰 司560 visualizações
大數據的獲利模式大數據的獲利模式
大數據的獲利模式
Chang Chiao Hui6.6K visualizações

Similar a Hadoop Big Data 成功案例分享

Emc keynote 1130 1200Emc keynote 1130 1200
Emc keynote 1130 1200Chiou-Nan Chen
579 visualizações12 slides
民间秘方民间秘方
民间秘方dynasty
867 visualizações43 slides

Similar a Hadoop Big Data 成功案例分享(20)

Emc keynote 1130 1200Emc keynote 1130 1200
Emc keynote 1130 1200
Chiou-Nan Chen579 visualizações
Big Data Projet Management the Body of Knowledge (BDPMBOK)Big Data Projet Management the Body of Knowledge (BDPMBOK)
Big Data Projet Management the Body of Knowledge (BDPMBOK)
Jazz Yao-Tsung Wang8.3K visualizações
阿里巴巴数据中台实践分享.pdf阿里巴巴数据中台实践分享.pdf
阿里巴巴数据中台实践分享.pdf
markmind9 visualizações
民间秘方民间秘方
民间秘方
dynasty867 visualizações
Sybase Analytic ApplianceSybase Analytic Appliance
Sybase Analytic Appliance
focusbi733 visualizações
Actuate presentation   2011Actuate presentation   2011
Actuate presentation 2011
Luke Han1.2K visualizações
Etu DW Offload 解放資料倉儲的運算效能Etu DW Offload 解放資料倉儲的運算效能
Etu DW Offload 解放資料倉儲的運算效能
Etu Solution1.3K visualizações
企业系统商务智能设计企业系统商务智能设计
企业系统商务智能设计
George Ang304 visualizações
Greenplum技术Greenplum技术
Greenplum技术
锐 张1.2K visualizações
Easy to recap AWS reinvent 2017Easy to recap AWS reinvent 2017
Easy to recap AWS reinvent 2017
Win Yu817 visualizações
如何快速实现数据编织架构如何快速实现数据编织架构
如何快速实现数据编织架构
Denodo 396 visualizações
Etu Data LakeEtu Data Lake
Etu Data Lake
Judy Wu363 visualizações
Dtcc ibm big data platform 2012-final_cnDtcc ibm big data platform 2012-final_cn
Dtcc ibm big data platform 2012-final_cn
yp_fangdong1.3K visualizações

Mais de Etu Solution(20)

終歸:分群消費者x多元商機的實現終歸:分群消費者x多元商機的實現
終歸:分群消費者x多元商機的實現
Etu Solution3K visualizações
猜你喜歡:虛實並進,贏在全通路猜你喜歡:虛實並進,贏在全通路
猜你喜歡:虛實並進,贏在全通路
Etu Solution3.1K visualizações
Track B-1 建構新世代的智慧數據平台Track B-1 建構新世代的智慧數據平台
Track B-1 建構新世代的智慧數據平台
Etu Solution1.5K visualizações
Track A-2 基於 Spark 的數據分析Track A-2 基於 Spark 的數據分析
Track A-2 基於 Spark 的數據分析
Etu Solution5.8K visualizações
Cloudera 助力台灣大數據產業的發展Cloudera 助力台灣大數據產業的發展
Cloudera 助力台灣大數據產業的發展
Etu Solution3.2K visualizações
Opening: Big Data+Opening: Big Data+
Opening: Big Data+
Etu Solution1.4K visualizações
數位媒體的客戶洞察行銷術數位媒體的客戶洞察行銷術
數位媒體的客戶洞察行銷術
Etu Solution1.2K visualizações

Hadoop Big Data 成功案例分享

  • 1. Hadoop Big Data 成功案例分享 陳育杰 Eric Chen Senior AVP. , Etu Business Development eric_chen@etusolution.com Oct. 8, 2014
  • 2. 2 Big Data 新應用架構 RDB Business Intelligence ETL Business Analy9cs Voice file Video file Image file Doc file Txt file XML file Web Logs Click event Social network Associated map News Feeds Sensor Embedded RFID Tags Geographic GPS Event Others HIVE HBase MapReduce HDFS Impala Mahout Pig
  • 3. 3 Big Data 新應用架構 Hadoop as a “Data Store” RDB Business Intelligence ETL Business Analy9cs Voice file Video file Image file Doc file Txt file XML file Web Logs Click event Social network Associated map News Feeds Sensor Embedded RFID Tags Geographic GPS Event Others HIVE HBase MapReduce HDFS Impala Mahout Pig
  • 4. 4 Big Data 新應用架構 Hadoop as a “Data Pre-processing Platform” RDB Business Intelligence ETL Business Analy9cs Voice file Video file Image file Doc file Txt file XML file Web Logs Click event Social network Associated map News Feeds Sensor Embedded RFID Tags Geographic GPS Event Others HIVE QL Pig Join, Aggrega,on, Filter, Sor,ng, HIVE HBase Correla,on …….. HDFS Impala Mahout MapReduce
  • 5. 5 Big Data 新應用架構 Hadoop as a “DB” RDB BI ETL Business Analy9cs Voice file Video file Image file Doc file Txt file XML file Web Logs Click event Social network Associated map News Feeds Sensor Embedded RFID Tags Geographic GPS Event Others HIVE HBase MapReduce HDFS Impala Mahout Pig API ODBC
  • 6. Big Data 新應用架構 Hadoop as a “Data Analytics Engine” ETL RDB Business Analy9cs Business Intelligence Voice file Video file Image file Doc file Txt file XML file Web Logs Click event Social network Associated map News Feeds Sensor Embedded RFID Tags Geographic GPS Event Others Mahout HIVE HBase MapReduce HDFS Pig Impala 6 6
  • 7. 7 應用案例 l 精準推薦與消費者洞察 l DW Offload – 資料載入與查詢 l 生產良率即時告警
  • 9. 9 精準推薦與消費者洞察 Etu Recommender Application 轉化率分析 推薦演算法 客戶相似 度分析 資料 擷 取 商品關聯 性分析 推薦清 單 推薦引擎 歷史交易資料 • 訂單資料 • 購買紀錄 Web 互動資料 • 瀏覽 • 點擊 • 搜尋 • 購物車 • 結帳 • 跨網域用戶行為 Mobile Web 互動資料 • 瀏覽 • 點擊 • 搜尋 • 購物車 • 結帳 • 跨網域用戶行為 Etu Insight User-­‐defined Recommenda/on Result Filter 廣告關聯 性分析 內容關聯 性分析 Product Recommendation 商品推薦 Content Recommendation 內容推薦 Ad Recommendation 站內廣告推薦
  • 10. 10 精準推薦與消費者洞察 Clicks 每一個點擊代表一個動作和意圖 是訂單資料和會員系統無法告訴你的 • 瀏覽商品 • 看廣告 • 看新聞 • 看網友評論 • 按讚 • 分享 • 下載表單 • 兌換優惠券…..
  • 11. 11 精準推薦與消費者洞察 場景#2 哪些人只 看不買? 場景#3 誰愛小米? iPhone? Etu Recommender Application 轉化率分析 推薦演算法 客戶相似 度分析 資料 擷 取 商品關聯 性分析 推薦清 單 推薦引擎 歷史交易資料 • 訂單資料 • 購買紀錄 場景#1 誰是我的 忠實粉絲 Web 互動資料 • 瀏覽 • 點擊 • 搜尋 • 購物車 • 結帳 • 跨網域用戶行為 Mobile Web 互動資料 • 瀏覽 • 點擊 • 搜尋 • 購物車 • 結帳 • 跨網域用戶行為 User-­‐defined Recommenda/on Result Filter 廣告關聯 性分析 內容關聯 性分析 場景#4 廣告費都 丟到水裡 Product 場景#5 網站的使 用者體驗 如何? Recommendation 商品推薦 Content 了? Recommendation 內容推薦 Ad Recommendation 站內廣告推薦 Etu Insight (Customer Behavior Data Warehouse) 流量分析 新客戶 vs. 回頭客 漏斗分析 每天多少流 量能轉化為 訂單 品牌偏好度 各商品分類 最受歡迎品 牌 來源網站和 訂單效益 關聯性分析 不同版位效 益分析,評 估網站使用 者體驗
  • 12. 12 精準推薦與消費者洞察 Customer Behavior Recommenda/on Etu Recommender 商品 內容 廣告 Consumer Connect List Customer Behavior Recommenda/on Etu Recommender 商品 內容 廣告 Consumer Connect List DW CRM Consumer Discovery Analytics core 推薦運算叢集 3600 Customer View Customer Profile Discovery Data Converter Customer Behavior Data Warehouse HIVE JDBC /ODBCDriver Analytics core 推薦運算叢集 客戶行為分析叢集 Event Collector Customer Behavior Data Store Event Collector Customer Behavior Data Store
  • 14. 14 DW Offload – 資料載入與查詢
  • 15. 15 DW Offload – 資料載入與查詢 l 客戶 : 某大醫院 l 需求 : HIS 系統與院際其他系統資料整合 l 困難與挑戰 : ü 原 HIS 系統資料庫支援度差,需先將資料匯出處理 ü 來源資料量非常龐大, ETL 載入效率非常差 ü 原資料庫對大量資料的查詢效率不佳,無法應付大量且即時的查詢 需求 SSIS SQL SQL Server 查詢結果 資料入庫 時間過長 資料查詢 時間過長 Oracle Informix SQL Server
  • 16. 16 DW Offload – 資料載入與查詢 Sqoop SQL 查詢結果 Impala HDFS 第一期方案 Informix 1. 以 Etu Software Appliance 搭配 Sqoop 做資料入檔,解決資料載入 時間過長問題。 2. 使用 Impala 查詢 Hadoop 中的資料,解決資料查詢時間過長問題。
  • 17. 17 DW Offload – 資料載入與查詢 最終方案 Sqoop ETL Impala HDFS Oracle Informix SQL Server EDW / DM API Web Service 1. Hadoop 成為組織內部的 data pool (ODS),所有資料先進行格式統一, 錯誤資料清洗等轉置工作,並儲存在 HDFS 中。 3. EDW / DM 或應用系統所有資料需求,皆統一由 Hadoop 提供,解決跨 來源資料整合問題。
  • 18. 18 從 RDB 邁向 Big Data BI
  • 20. 20 生產良率即時告警 製程資料 組裝包產線 SMT產線 統計分析改善 統計分析 製作圖表 良率低 主因素 組裝包產線 現有技術架構 RDB 資料儲存、運算與彙整 RDB 不及時 算得慢 擴充成本高 N hours SPC SMT SFCS SMT Data Files SMT產線 SMT產線 註: SFCS: Shop Floor control system; SPC: Solder Paste Control SPI: Solder Paste Inspec/on 資料探勘 特徵規則(傳統運算) SPC SFCS SMT SFCS SPI 1. 生產問題無法及時發現: 資料處理與計算時間過長導致生產問題無法及時發現 2. 運算效能不彰: 採用資料庫進行運算時,產生過多Temp Files與資料轉換,系統資源浪費且效率差 3. 容量擴充成本高: 因應產線擴充,機台測試資料增加與保存時間延長所需成本過高(Scale Up)
  • 21. 21 生產良率即時告警 製程資料 組裝包產線 組裝包產線 SMT產線 SMT產線 SMT產線 SPC SFCS SMT SFCS SPI 新一代 Big Data 技術架構 統計分析加以確認 統計分析 製作圖表 及時 算得快 擴充成本低 良率低 資料探勘 RDB 主因素 N mins MPP DB 特徵規則 (平行運算) SMT No SQL SMT Data Files HDFS SPC SFCS 1. 生產問題及時發現: 資料處理與計算時間大幅縮短,可以提升品質判斷速度,減少產線損失 2. 運算效能佳: 採用平行運算與分散式檔案系統,減少過多Temp Files與資料轉換,生成統計表提供查詢 3. 容量擴充成本低: 因應產線擴充,機台測試資料增加與保存時間延長可線性擴充 (Scale out)
  • 22. 22 生產良率即時告警 Real-time Big Data Data Stream Spark-­‐ Streaming Spark Impala DN RS Spark-­‐ Streaming Spark Impala DN RS Spark-­‐ Streaming Spark DN RS Impala … Data Stream Data Stream 生產機台資料 SPI Data On-the-fly Pattern Matching Alert Real-time Analytics - Machine Learning (Rec. Cluster..) - Iterative Algorithms Near Real-time Query - Ad-hoc query - Reporting Long term data store - Batch process - Offline analytics - Historical Mining Spark Impala work together
  • 25. Thank you 318, Rueiguang Rd., Taipei 114, Taiwan T: +886 2 7720 1888 F: +886 2 8798 6069 www.etusolu/on.com