O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.

精準預測分享

554 visualizações

Publicada em

精準預測讀書心得分享

Publicada em: Ciências
  • Seja o primeiro a comentar

精準預測分享

  1. 1. 精準預測 如何從巨量雜訊中, 看出重要的訊號?
  2. 2. 如果沒空看 – 看書的背面 • 預設立場或過度自信, 是非常可怕的事 • 預測不在追求是與非, 而是估算機率. 有精確的機率, 才能做出有利的決策. • 預測時不能忽略誤差, 並要勇於承認有不確定性. 不然你會過度解釋, 變成不 精準的預測. • 做預測時, 最怕一看見有相關就解釋成因果關係. • 根據預測的機率, 做了最有利的選擇, 即使結果不好, 仍是好預測. • 不是一定要追求完美的預測, 只要預測比對手好, 你就贏了. • 當大家不免被雜訊迷惑時, 問問自己, 你有什麼法寶, 能讓自己更接近真相? 跟 著法寶走, 不要跟著群眾走. • 保持客觀, 隨時根據訊息而更新的預測, 才有可能是精準的預測.
  3. 3. 從書名開始談起 The Signal and the Noise Why So Many Predictions Fail – but Some Don’t
  4. 4. THE AUTHOR: NATE SILVER • Wikipedia: http://en.wikipedia.org/wiki/ Nate_Silver • FiveThirtyEight (2008 - ): http://fivethirtyeight.com/
  5. 5. 慘烈的預測失誤 – 金融預測 (CHAPTER 1) • 2008 年金融海嘯 • “沒有人想到事情會發生” • “… 他們是不想讓音樂停 下來” • 金融機構大到不會倒 (低估 了危機) • 樣本之外, 思考之外 -> 預 測失誤的公式 • 精確預測 vs. 正確預測
  6. 6. 你比電視名嘴還聰明嗎 – 政治預測 (CHAPTER 2) • “狐狸知道許多小事, 但刺蝟只知道一件大事”
  7. 7. 狐狸一樣的思考原則 1. 用機率思考 2. 今天的預測就是你餘生的第一個預測 3. 尋求共識 (集體或團體的預測比單獨的預測更準確) 要注意: • 萬靈丹式的預測 (偏頗) • 過於重視量化資料未評估質化資料 • 要客觀並不容易
  8. 8. 台灣也有人在做選舉數據分析 • MLDM Monday 數據分析在選舉策略上的應用 • 影片 (1h05m20s): http://youtu.be/1XEb2hMDFMs • 投影片: http://files.meetup.com/5150202/TaiwanR_20150309_Data_Analysis_and_El ection.pptx
  9. 9. 我在乎的只有輸贏 – 棒球預測 (CHAPTER 3) • 偏見 • 資訊才是王道 • [延伸閱讀] 魔球 (Moneyball) • [延伸閱讀] Sabermetrics http://en.wikipedia.org/wiki/Sabermetrics, http://sabr.org/sabermetrics
  10. 10. 推薦 是 MLB 球迷 是 BRAD PITT 影迷
  11. 11. 讓魔球理論紅的 用魔球理論成功的 善用數據但是沒$$ 善用數據而且有$$
  12. 12. 多年來你一直告訴我們雨是綠的 – 氣象預測 (CHAPTER 4) • 卡崔娜颶風 • 混沌理論 • 系統是動態的 • 系統是非線性的 • 愈接近時預測會愈準 • 預報最重要的檢驗標準 – 校準 (calibration)
  13. 13. 拼命找訊號 – 地震預測 (CHAPTER 5) • 地震是無法預測但是可以預報 • 過度配適 (Overfitting): 用特定的方法來解決普遍性的問題; 把雜訊當 成訊號 • 例如: 日本 311 大地震
  14. 14. 要怎麼淹死在一公尺深的水裡 – 經濟預測 (CHAPTER 6) More statistics jokes: http://math.bnu.edu.cn/~chj/Statjokes.htm
  15. 15. 模型的角色 – 醫療預測 (CHAPTER 7) • 外推法的危險 – 假設目前的趨勢會無限延伸下去, 直到未來. • 自我實現與自我取消對於預測準確與否的影響 • 自我實現預測: 西瓜靠大邊 • 自我取消預測: GPS 即時路況 • 精密的單純 -> 正確的模型 • 複雜未必正確 -> 反而容易造成誤導預測
  16. 16. 錯誤愈來、愈來愈少 - 博奕預測 (CHAPTER 8) 從這章開始不斷推祟 貝式定理 [預告] 語意分析使用 Naïve Bayes Classification
  17. 17. 對機器大發脾氣 (CHAPTER 9) • 西洋棋王和 IBM 深藍的對戰,大部分人可能都只知對戰的結果 - 一開 始棋王打敗電腦,但後來電腦進步然後打敗棋王。但原來棋王其實可 是說是被自己打敗,因為錯誤解讀了電腦的 bug,誤以為電腦下了一 步高深莫測的棋步,這就是書中一再提到的:把雜訊誤當做訊息。 • 嘗試錯誤法有時候是有用的
  18. 18. 撲克泡沫 (CHAPTER 10) • 超越以結果為導向的思考 • 否則有可能會為糟糕的預測找藉口 • 成功是雜訊和訊號的某種結合 • 資料雜訊非常多的時候 - … 唯一的解決之道 - 就是更專注於過程, 而不是結果。
  19. 19. 要是你贏不了他們 – 股市預測 (CHAPTER 11) 團體預測的好處與限制: 1. 歸結後的預測基本上會比一般的個人預測好 vs. 歸結後的預測太粗糙 2. 要先進行獨立的預測再歸結 vs. 大家對於其他人的行為會有所反應 3. 歸結的預測比一般個人的預測結果好, 但未必比最好的個人預測好 -> 那就用最好的個人預測就好了
  20. 20. 有著健康懷疑態度的氣氛 (CHAPTER 12) • 勿把相關當成因果, 把雜訊當成訊號 • 健康懷疑態度 “必須依照理論的整體效力,來權衡新證據的效力, 而不 是在事實和理論裡亂翻一通, 找尋立論和意識型態上的方便之處”
  21. 21. 你不知道的東西可能傷害你 – 恐怖攻擊預 測 (CHAPTER 13) • 珍珠港事變 • 人們傾向把不熟悉的東西誤以為不可能的 • 101 有沒有可能被恐怖攻擊?
  22. 22. 結論就在最後一章 如果讀不下去、又想要知道結論的話,可以直接跳轉到最後一章 “結 論“ (僅 9 頁就總結完畢) • 用機率思考 • 知道你從何而來 (先驗信念) • 嘗試、犯錯 (做很多預測, 尤其是在一開始的時候) • 平靜接受我們不能預測的事, 勇敢預測我們能預測的事, 睿智看出差異 何在
  23. 23. 如果篇幅還是太長 – 看書的背面 (DON’T) • 預設立場 • 過度自信 • 否認不確定性 • 錯誤解讀相關性和因果關係(兩者不同) • 誤把雜訊當事實 • 未保持客觀 • 在有新訊息或訊息改變時,未時時更新預測 • 認為預測是要證明對錯 • 道聽途說

×