SlideShare uma empresa Scribd logo
1 de 93
Baixar para ler offline
Data Empowerment for All
DSP
Contact
Tim Hong
+44 750 872 6463
+886 953506808
timhong@dsp.im
R1223. 12F-6, No.155, Keelung Rd. Sec. 1 Taipei 106, Taiwan
⼤大數據驅動⼒力力
『資料分析101』
• DSP智庫驅動 應⽤用顧問
• 台北市政府 公參參會 OpenData 召集⼈人
• 企業應⽤用顧問
• 中華科技⼤大學 業界講師
• 波意設計、深圳波意科技
• 上擎科技
• 華碩電腦 設計中⼼心
Tim Hong洪培仁
應⽤用程式、資料⼯工程
2 Startup、1 NPO、2 Apps 1st
E-mail:  timhong@dsp.im 
https://tw.linkedin.com/in/hongtim
⼤大數據驅動⼒力力
⼤大數據驅動⼒力力
WHAT IS DATA?
WHAT IS DATA?
WHAT IS DATA?
Digital footprints
常⾒見見的樣⼦子
表格
資料交換語⾔言
http://upload.lsforum.net/users/public/q41674nba2k13%208-07p190.jpg
Geneva
http://youtu.be/ZSt9tm3RoUU
以管窺天
開放資料
巨量量資料
真實世界
所有可記錄資料
資料的品管影響深遠
資料被不同形式紀錄
舉例例『照片』
紀錄
1. 騎機⾞車車
2. 三貼
3. ⾞車車⼦子50CC
4. 冬天沒穿外套
資料被不同形式紀錄
舉例例『照片』
沒紀錄
1. 為何騎機⾞車車?
2. 要去哪?
3. 為何三貼?
4. 為何冬天沒穿外套?
資料記錄、數據化的過程
“都會”遺漏部分訊息
THERE IS NO EASY WAY
• 機器可讀資料
• 資料標準化
• 增減欄欄位
PNG、CSV、XML、PDF、XLS
1051005、105/10/5、10510
“ ”、NA、null
1051005
年年、⽉月、⽇日
資料呈現:
在現實的基礎上闡述故事
故事的核⼼心
?
都對
為什什麼?
為什什麼?
為什什麼?
為什什麼?
為
什什
麼
?為
什什
麼
?
為
什什
麼
?
HOW
以分析結果回答問題
建立模型、分析資料
蒐集資料、整理理資料
定義問題、規劃藍藍圖
資料科學
以分析結果回答問題
建立模型、分析資料
蒐集資料、整理理資料
定義問題、規劃藍藍圖
資料科學
以分析結果回答問題
建立模型、分析資料
蒐集資料、整理理資料
定義問題、規劃藍藍圖
資料科學
以分析結果回答問題
建立模型、分析資料
蒐集資料、整理理資料
定義問題、規劃藍藍圖
資料科學
80%
資料的品管影響深遠
資料科學的流程
Why
Why
Why
Why
Why
What
What
What
What
Where
How
What
Answer
⼤大數據驅動⼒力力
『公共政策、商業物聯聯、未來來智能』
DATA / URBAN DATA
從資料的⾓角度看城市構⾯面
⼈人>⼈人>城>....world
⼈人>⼈人>城....world
透過城市的真實資料所勾勒勒出的圖型

Through the actual city data mapping urban graphic
 Population
⾥里里lining
數量量amount
顏⾊色分區
⼈人>⼈人>城>⼈人....world
透過城市的真實資料所勾勒勒出的圖型

Through the actual city data mapping urban graphic
 Population
⾥里里lining
數量量amount
顏⾊色分區
透過城市的真實資料所勾勒勒出的圖型

Through the actual city data mapping urban graphic

Medical
(main hospital)
hospital
透過城市的真實資料所勾勒勒出的圖型

Through the actual city data mapping urban graphic

Education
(kindergarten ~ University)
透過城市的真實資料所勾勒勒出的圖型

Through the actual city data mapping urban graphic

Security
(Police, fire stations, monitors, accident)
竊盜點位資料
http://www.playpcesor.com/2014/04/app.html
https://goo.gl/6vGw8l
美國紐奧良
火災預防
另⼀一個例例⼦子
Age	of	structure	map	
Poverty	map	
Map	of	fires	Overall	smoke	alarm	risk	map	
Fire	fatality	risk	map	
統計模型
鎖定⽬目標:
Action
⼤大數據驅動⼒力力
『公共政策、商業物聯聯、未來來智能』
與公共體系 共⽣生
• http://data.gov.tw/
⾃自⼰己沒資料,資料哪裡來來?
⾃自⼰己沒資料,資料哪裡來來?
乾淨的資料
光棍節(11⽉月11⽇日)雙⼗十⼀一節
⼤大數據驅動⼒力力
『公共政策、商業物聯聯、未來來智能』
預測 節約
觀察
⼤大量量運⽤用資料視覺化
資料視覺化
資料分析的好夥伴
輿情分析、⽂文字探勘
除了了地圖之外
1691 他們 531 父親
1108 他的 528 凱特
963 爵士 521 斯特
853 瓊恩 493 凱特琳
844 我們 480 史塔克
795 自己 473 的人
787 奈德 460 丹妮
780 大人 456 艾莉亞
739 什麽 452 蘭尼
670 國王 450 蘭尼斯
642 提利 443 蘭尼斯特
613 利昂 431 告訴
610 提利昂 425 不是
603 布蘭 424 珊莎
588 一個 414 起來
568 她的 413 羅柏
567 知道 405 勞勃
543 沒有 399 已經
537 尼斯 373 孩子
532 莉亞 366 我的
2971 他們 899 戰鬥
2811 一個 860 已經
2646 他的 822 在他
2560 阿納金 815 到了
1954 我們 814 然後
1834 了一 813 飛船
1809 盧克 803 的一
1706 歐比旺 797 們的
1597 這個 778 開始
1514 絕地武士 777 是一
1505 什麼 728 不是
1503 沒有 694 看到
1400 自己 685 一下
1372 機器 654 在這
1276 器人 636 大的
1275 機器人 629 她的
1022 知道 618 可能
998 起來 604 的人
984 現在 596 奎剛
909 帕德梅 595 著他
1691 他們 531 父親
1108 他的 528 凱特
963 爵士 521 斯特
853 瓊恩 493 凱特琳
844 我們 480 史塔克
795 自己 473 的人
787 奈德 460 丹妮
780 大人 456 艾莉亞
739 什麽 452 蘭尼
670 國王 450 蘭尼斯
642 提利 443 蘭尼斯特
613 利昂 431 告訴
610 提利昂 425 不是
603 布蘭 424 珊莎
588 一個 414 起來
568 她的 413 羅柏
567 知道 405 勞勃
543 沒有 399 已經
537 尼斯 373 孩子
532 莉亞 366 我的
2971 他們 899 戰鬥
2811 一個 860 已經
2646 他的 822 在他
2560 阿納金 815 到了
1954 我們 814 然後
1834 了一 813 飛船
1809 盧克 803 的一
1706 歐比旺 797 們的
1597 這個 778 開始
1514 絕地武士 777 是一
1505 什麼 728 不是
1503 沒有 694 看到
1400 自己 685 一下
1372 機器 654 在這
1276 器人 636 大的
1275 機器人 629 她的
1022 知道 618 可能
998 起來 604 的人
984 現在 596 奎剛
909 帕德梅 595 著他
很多主⾓角
階級制度
主⾓角幾位
有科技
302 石宇 43 列車長
200 秀安 41 乘客
156 車廂 41 廁所
135 尚華 40 號車廂
110 喪屍 39 的電
91 列車 38 一個
90 白天 38 自己
83 常務 37 信號
82 盛京 36 他們
80 金常務 36 過去
69 什麼 34 怎麼
69 英國 34 時候
61 火車 33 微信號
61 珍熙 33 露宿
56 釜山 32 OS
55 看著 32 媽媽
51 看到 32 我們
49 乘務 32 露宿者
47 過來 31 到了
44 電話 30 乘務長
關鍵字眼:『殺』
第⼀一批⽂文件:662 (六之⼀一)
第⼆二批⽂文件:745 (全六集)
第三⼈人稱、第⼀一⼈人稱
vs
姓名、代名詞、名詞
廠房節約、效能提昇
數億筆店家點位
Google 告訴你熱⾨門時段
https://goo.gl/w2IbBy
⼤大數據驅動⼒力力
『公共政策、商業物聯聯、未來來智能』
變聰明:學習能⼒力力、辨識能⼒力力
後摩爾定律律,量量⼦子電腦的未來來?
https://goo.gl/qHsRdR
2017 年年 對話機器⼈人 ⼤大發利利市
Big Data
Data is growing faster and bigger because of more
sensors
10B+ Rows (5TB)
Fast Data
Data streamed from sensors requires fast ingestion 1M+ rows per sec
Edge Analytics
IoT data is mostly generated at the ‘Edges’ of the
network
100+. Locations
Real-Time Insights
Use cases require near Real Time Analytics
<1 sec query response
⼤大數據
Statistics are like bikinis.
What they reveal is suggestive,
but what they conceal is vital.
-Aaron Levenstein, Business Professor at Baruch Colleg
統計就像比基尼
露出來來的引⼈人遐想
沒露出來來的才是重點

Mais conteúdo relacionado

Destaque

Mobile Programmatic Trends: Q3 2015
Mobile Programmatic Trends: Q3 2015Mobile Programmatic Trends: Q3 2015
Mobile Programmatic Trends: Q3 2015MoPub
 
Programmatic Advertising: How To Join In On the Fun
Programmatic Advertising: How To Join In On the FunProgrammatic Advertising: How To Join In On the Fun
Programmatic Advertising: How To Join In On the FunHanapin Marketing
 
Programmatic vs Adwords
Programmatic vs AdwordsProgrammatic vs Adwords
Programmatic vs AdwordsNeeraj Mishra
 
Programmatic Media Scenario
Programmatic Media ScenarioProgrammatic Media Scenario
Programmatic Media ScenarioMediaMath
 
All about Programmatic buying(RTB), DSP,SSP, DMP & DCT - A complete digital ...
All about Programmatic buying(RTB), DSP,SSP, DMP & DCT -  A complete digital ...All about Programmatic buying(RTB), DSP,SSP, DMP & DCT -  A complete digital ...
All about Programmatic buying(RTB), DSP,SSP, DMP & DCT - A complete digital ...Karunakar Ravirala
 
Achieving High Load in Advertising Technology
Achieving High Load in Advertising TechnologyAchieving High Load in Advertising Technology
Achieving High Load in Advertising TechnologyPeter Milne
 

Destaque (7)

Mobile Programmatic Trends: Q3 2015
Mobile Programmatic Trends: Q3 2015Mobile Programmatic Trends: Q3 2015
Mobile Programmatic Trends: Q3 2015
 
Programmatic Advertising: How To Join In On the Fun
Programmatic Advertising: How To Join In On the FunProgrammatic Advertising: How To Join In On the Fun
Programmatic Advertising: How To Join In On the Fun
 
Programmatic vs Adwords
Programmatic vs AdwordsProgrammatic vs Adwords
Programmatic vs Adwords
 
Programmatic Media Scenario
Programmatic Media ScenarioProgrammatic Media Scenario
Programmatic Media Scenario
 
Demand side management
Demand side managementDemand side management
Demand side management
 
All about Programmatic buying(RTB), DSP,SSP, DMP & DCT - A complete digital ...
All about Programmatic buying(RTB), DSP,SSP, DMP & DCT -  A complete digital ...All about Programmatic buying(RTB), DSP,SSP, DMP & DCT -  A complete digital ...
All about Programmatic buying(RTB), DSP,SSP, DMP & DCT - A complete digital ...
 
Achieving High Load in Advertising Technology
Achieving High Load in Advertising TechnologyAchieving High Load in Advertising Technology
Achieving High Load in Advertising Technology
 

Mais de Tim Hong

網頁爬蟲入門 Python web crawler at 淡江大學 20170930
網頁爬蟲入門 Python web crawler at 淡江大學 20170930網頁爬蟲入門 Python web crawler at 淡江大學 20170930
網頁爬蟲入門 Python web crawler at 淡江大學 20170930Tim Hong
 
Pandas+postgre sql 實作 with code
Pandas+postgre sql 實作 with codePandas+postgre sql 實作 with code
Pandas+postgre sql 實作 with codeTim Hong
 
建築與都市的黏著劑:開放資料 (淡江建築 2016.10.9)
建築與都市的黏著劑:開放資料 (淡江建築 2016.10.9)建築與都市的黏著劑:開放資料 (淡江建築 2016.10.9)
建築與都市的黏著劑:開放資料 (淡江建築 2016.10.9)Tim Hong
 
AIC x IBM 機器人開發工作營 機構報告
AIC x IBM 機器人開發工作營 機構報告AIC x IBM 機器人開發工作營 機構報告
AIC x IBM 機器人開發工作營 機構報告Tim Hong
 
AIC x IBM 機器人開發工作營 概念簡報
AIC x IBM 機器人開發工作營 概念簡報AIC x IBM 機器人開發工作營 概念簡報
AIC x IBM 機器人開發工作營 概念簡報Tim Hong
 
DSP Company Profile
DSP Company ProfileDSP Company Profile
DSP Company ProfileTim Hong
 
2015 東海 概念工作坊
2015 東海 概念工作坊2015 東海 概念工作坊
2015 東海 概念工作坊Tim Hong
 
Hacker X Maker 2015
Hacker X Maker 2015Hacker X Maker 2015
Hacker X Maker 2015Tim Hong
 
APP 概念工作坊
APP 概念工作坊APP 概念工作坊
APP 概念工作坊Tim Hong
 
Spark !! 人人可上流 支持開放公共空間
Spark !! 人人可上流 支持開放公共空間Spark !! 人人可上流 支持開放公共空間
Spark !! 人人可上流 支持開放公共空間Tim Hong
 
城市x程式0.80
城市x程式0.80城市x程式0.80
城市x程式0.80Tim Hong
 
Smart gov conference
Smart gov conferenceSmart gov conference
Smart gov conferenceTim Hong
 
DSP Wellcome
DSP WellcomeDSP Wellcome
DSP WellcomeTim Hong
 
Cft data weekend #3
Cft data weekend #3Cft data weekend #3
Cft data weekend #3Tim Hong
 
City dashboard
City dashboardCity dashboard
City dashboardTim Hong
 
2012 twdw app_04
2012 twdw app_042012 twdw app_04
2012 twdw app_04Tim Hong
 

Mais de Tim Hong (16)

網頁爬蟲入門 Python web crawler at 淡江大學 20170930
網頁爬蟲入門 Python web crawler at 淡江大學 20170930網頁爬蟲入門 Python web crawler at 淡江大學 20170930
網頁爬蟲入門 Python web crawler at 淡江大學 20170930
 
Pandas+postgre sql 實作 with code
Pandas+postgre sql 實作 with codePandas+postgre sql 實作 with code
Pandas+postgre sql 實作 with code
 
建築與都市的黏著劑:開放資料 (淡江建築 2016.10.9)
建築與都市的黏著劑:開放資料 (淡江建築 2016.10.9)建築與都市的黏著劑:開放資料 (淡江建築 2016.10.9)
建築與都市的黏著劑:開放資料 (淡江建築 2016.10.9)
 
AIC x IBM 機器人開發工作營 機構報告
AIC x IBM 機器人開發工作營 機構報告AIC x IBM 機器人開發工作營 機構報告
AIC x IBM 機器人開發工作營 機構報告
 
AIC x IBM 機器人開發工作營 概念簡報
AIC x IBM 機器人開發工作營 概念簡報AIC x IBM 機器人開發工作營 概念簡報
AIC x IBM 機器人開發工作營 概念簡報
 
DSP Company Profile
DSP Company ProfileDSP Company Profile
DSP Company Profile
 
2015 東海 概念工作坊
2015 東海 概念工作坊2015 東海 概念工作坊
2015 東海 概念工作坊
 
Hacker X Maker 2015
Hacker X Maker 2015Hacker X Maker 2015
Hacker X Maker 2015
 
APP 概念工作坊
APP 概念工作坊APP 概念工作坊
APP 概念工作坊
 
Spark !! 人人可上流 支持開放公共空間
Spark !! 人人可上流 支持開放公共空間Spark !! 人人可上流 支持開放公共空間
Spark !! 人人可上流 支持開放公共空間
 
城市x程式0.80
城市x程式0.80城市x程式0.80
城市x程式0.80
 
Smart gov conference
Smart gov conferenceSmart gov conference
Smart gov conference
 
DSP Wellcome
DSP WellcomeDSP Wellcome
DSP Wellcome
 
Cft data weekend #3
Cft data weekend #3Cft data weekend #3
Cft data weekend #3
 
City dashboard
City dashboardCity dashboard
City dashboard
 
2012 twdw app_04
2012 twdw app_042012 twdw app_04
2012 twdw app_04
 

資料分析101