O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.
網路數據
於新媒體之應用
Gene(黑貘)/2015-07-17
甚麼是新媒體
網路 (技術) or 多媒體
使用者 (非中立, 非客觀) or 設備
互動 (雙向, 可追蹤) or 社群
新媒體 in Wiki
數位化(Digital)
互動性(Interactive)
超文字(Hypertexual)
虛擬性(Virtual)
網路化(Networked)
模擬性(Simulated)
新媒體 in 百度百科?
1. 價值
2. 原創性
3. 效應
4. 生命力
Gene Hong/食夢黑貘
個人版 BBS (Blog 0.1?)
部落格觀察
林克傳說
新文易數
My Specialist
高有效性 High Availability
預測 (模型) Prediction (Modeling)
社群/行為 分析 Social/Behavior Analysis
……
SEO
新媒體的數據
Google Analytics (Web Log)
Custom Relation Management
Social (外部) Analysis
SNS Signal
網路數據的獲取
Log/JS
API
Crawler
網路數據的價值
1. 全樣本
2. 即時
3. 客觀 (非侵入式)
4. 時間覆蓋率
系統設計的不同處
1. 不能要求使用者行為
2. 量級相當大
3. 穩定度相當低
4. 錯誤率相當高
5. 要能夠修正
6. 無法決定數據來源
網路行為層級
1. 閱讀
2. 按讚
3. 搜尋
4. 留言
5. 分享
6. 發表
7. 行動
次級資料
1. 我們有時只能從已抓的資料下手, 而不是最實際的資料
2. 這種指數的計算是簡化其複雜度, 一定會失去一些意義
3. 我們可以視其須要及適用度, 去調整演算法或資料搜集
4. 對於資料的可能性與適用性, 我們還須要一段路來學習
tag.analysis.tw (新文易數)
記者的採訪與下 Tag
所有記者的聚焦
使用者社群的熱度
轉計算到 Tag 的熱門話題
=> 知道 PGC (OGC) 與 UGC 的差異
新文易數的系統流程 (I)
1. 抓取媒體的文章列表
2. 每篇文章的 Tags
3. 計算 Tags 總數
4. 計算分數 (Normalization)
5. 從趨勢計算爆發力
6. 計算 Tag 關聯與距離等基本數值
新文易數的系統流程 (II)
7. 計算等價標籤
8. 把 Tag 組成事件
9. 計算出主要標籤
10. 做成事件簿與新聞牆
新文易數的系統流程 (III)
11. 計算有意義的標籤
12. 套用在沒有 Tag 的新聞網站
13. 計算連結文章的社群數值
14. 回算出每個 Tag 的社群數值
新文易數的可能性
1. 關鍵字/標籤
2. 聲量/趨勢
3. 正負評
Próximos SlideShares
Carregando em…5
×

網路數據於新媒體之應用 Gene

866 visualizações

Publicada em

關鍵字/標籤
聲量/趨勢
正負評

Publicada em: Internet
  • Seja o primeiro a comentar

網路數據於新媒體之應用 Gene

  1. 1. 網路數據 於新媒體之應用 Gene(黑貘)/2015-07-17
  2. 2. 甚麼是新媒體 網路 (技術) or 多媒體 使用者 (非中立, 非客觀) or 設備 互動 (雙向, 可追蹤) or 社群
  3. 3. 新媒體 in Wiki 數位化(Digital) 互動性(Interactive) 超文字(Hypertexual) 虛擬性(Virtual) 網路化(Networked) 模擬性(Simulated)
  4. 4. 新媒體 in 百度百科? 1. 價值 2. 原創性 3. 效應 4. 生命力
  5. 5. Gene Hong/食夢黑貘 個人版 BBS (Blog 0.1?) 部落格觀察 林克傳說 新文易數
  6. 6. My Specialist 高有效性 High Availability 預測 (模型) Prediction (Modeling) 社群/行為 分析 Social/Behavior Analysis …… SEO
  7. 7. 新媒體的數據 Google Analytics (Web Log) Custom Relation Management Social (外部) Analysis SNS Signal
  8. 8. 網路數據的獲取 Log/JS API Crawler
  9. 9. 網路數據的價值 1. 全樣本 2. 即時 3. 客觀 (非侵入式) 4. 時間覆蓋率
  10. 10. 系統設計的不同處 1. 不能要求使用者行為 2. 量級相當大 3. 穩定度相當低 4. 錯誤率相當高 5. 要能夠修正 6. 無法決定數據來源
  11. 11. 網路行為層級 1. 閱讀 2. 按讚 3. 搜尋 4. 留言 5. 分享 6. 發表 7. 行動
  12. 12. 次級資料 1. 我們有時只能從已抓的資料下手, 而不是最實際的資料 2. 這種指數的計算是簡化其複雜度, 一定會失去一些意義 3. 我們可以視其須要及適用度, 去調整演算法或資料搜集 4. 對於資料的可能性與適用性, 我們還須要一段路來學習
  13. 13. tag.analysis.tw (新文易數) 記者的採訪與下 Tag 所有記者的聚焦 使用者社群的熱度 轉計算到 Tag 的熱門話題 => 知道 PGC (OGC) 與 UGC 的差異
  14. 14. 新文易數的系統流程 (I) 1. 抓取媒體的文章列表 2. 每篇文章的 Tags 3. 計算 Tags 總數 4. 計算分數 (Normalization) 5. 從趨勢計算爆發力 6. 計算 Tag 關聯與距離等基本數值
  15. 15. 新文易數的系統流程 (II) 7. 計算等價標籤 8. 把 Tag 組成事件 9. 計算出主要標籤 10. 做成事件簿與新聞牆
  16. 16. 新文易數的系統流程 (III) 11. 計算有意義的標籤 12. 套用在沒有 Tag 的新聞網站 13. 計算連結文章的社群數值 14. 回算出每個 Tag 的社群數值
  17. 17. 新文易數的可能性 1. 關鍵字/標籤 2. 聲量/趨勢 3. 正負評

×