Mais conteúdo relacionado
Semelhante a Ir作業991015 (20)
Ir作業991015
- 1. 圖書資訊學研究 報告日期: 99 年 10 月 16 日 資訊檢索 Information Retrieval 指導教授:卜小蝶 報告組員 : 盧谷砳樂 簡至臻
- 9. 資料 需求 分析內容 選擇關鍵詞 轉譯 系統關鍵詞 分析需求 選擇關鍵詞 轉譯 系統關鍵詞 索引典 資料庫 關鍵詞比對 檢索結果 索引作業 檢索作業 邱子恆 ( 民 97) 資訊檢索策略與技巧 .
- 46. 求全檢索 4/4 相關詞 自然語言 控制語言之狹義詞 控制語言 Recall Search 之檢索層次 黃慕萱 ( 民 85) 資訊檢索 .
- 56. 一、傳統資訊檢索 3/3 卜小蝶 ( 民 85) 圖書資訊檢索技術 . 缺點 :1. 缺乏概念層次 2. 以文字資料為處理對象
- 61. 搜尋引擎歷史發展 1/2 1989 全球第一個檢索式的搜尋服務 Archie Query Form 1991 全球資訊網 (WWW) 正式上線 1993 全球第一個搜尋引擎 Aliweb 1994 雅虎 ,Lycos 等第一代搜尋引擎 1995 Excite, Altavista 搜尋引擎 / 「蕃薯藤台灣網際網路資源索引」 1996 Ask Jeeves 1998 Google 1998 MSN Search/ GOTO.com/Openfind 中文搜尋引擎 數位時代 (2010)no.197
- 63. 三大搜尋引擎 PK 註1:搜尋量比較,係以 10 月 11 日在 google 、 Yahoo 、和 Bing 三個英文網站搜尋關鍵字「 Information Retrieval 」作為比較基準 註 2: 精確度比較 , 係以係以 10 月 11 日在 google 、 Yahoo 、和 Bing 三個英文網站搜尋關鍵字「錦榮」作為比較 ( 錦榮為目前蔡依琳緋聞男友 ) 勝 勝 單頁設計 , 頁面為搜尋結果 , 結果第一筆是贊助廣告 二欄式設計 , 中間欄為搜尋結果 , 右欄為贙助廣告 三欄式設計 , 左欄列出搜尋目的署性和時間 , 中間為搜尋結果 , 右欄為贙助廣告 介面 設計 第一頁列出的資料中 , 只有中間一筆是新聞相關 第一頁第一筆即搜到正確新聞資訊 , 但其中有包含其他非相關資料 . 例 : 「錦榮機器廠」 第一頁準確搜尋到蔡依琳緋聞男友 , 還有影片圖片新聞等相關度 100% 精確度 ( 註2 ) 21,500,000 63,800,000 9,640,000 搜尋量 ( 註1 ) Bing Yahoo Google
- 64. 五、搜尋引擎技術 搜尋引擎 - 以網頁 (web) 搜尋為基礎的技術架構 1. 資源自動搜集 (robot) 2. 建立索引 (indexing) 3. 檢索軟體 (search software) 數位時代 (2010)no.197
- 68. Google 簡介 2/2 5. 任務 : 組織全世界的資訊,讓全球都能使用並 有所裨益 6. 特色 : (1) 公認為世界上規模最大的搜尋引擎 (2) 可以使用各種不同的語言來尋找資訊 (3) 擁有 10 億篇以上的文章,發佈時間 可追溯到 1981 年。 http://www.google.com/intl/zh-TW/corporate/
- 71. Google 檢索技術特色 1. 「隨機運算」 (Randomized Algorithms) - 時間愈長,資料愈多,所得到的結果將會更 加準確 2. 演算法 (PageRank) - 搜尋結果的排序 - 索引中找出符合的網頁之後,給每一網頁打 分數,然後按分數高低排列 3. 超文字符合分析 - 分析網頁內容 - 傳回的結果能與使用者的查詢最為相關 http://www.google.com/intl/zh-TW/corporate/
- 72. Pagerank 原則 1. 網頁品質愈高,代表透過其他網頁連結的數目愈多,也代表權重愈大。 2. 從高權重的網頁過來的連結,多過於低權重網頁過來的連結 3. 對外連結越多的網頁,代表連結所給於的權重將會降低。 4. 其他因素,如網站的歷史、網站的知名度、進出連結的新舊。 5. 運算細節,請洽 Google 。
- 73. Pagerank 計算公式 PageRank (A) = (1-d) + d(PageRank (T1)/C(T1) + ... + PageRank (Tn)/C(Tn)) 其中 PageRank (A) 表示給定頁面 A 的 PageRank 得分; D 為阻尼因數,一般設為 0.85 ; PageRank (T1) 表示一個指向 A 頁的網站其本身的 PageRank 得分; C(T1) 表示該頁面所擁有的導出鏈結數量; PageRank (Tn)/C(Tn) 表示為每一個指向 A 頁的頁面 重複相同的操作步驟。
- 76. 七、圖書館資訊檢索服務及應用 卜小蝶 ( 民 85) 圖書資訊檢索技術 . 1. 一般性應用 : 採訪編目系統、 網路參考服務、館際合作加強 2. 重點應用 : 線上公用目錄檢索系統 (OPAC)
- 77. 線上公用目錄檢索系統簡介 卜小蝶 ( 民 85) 圖書資訊檢索技術 . 1. 基本用途 : 提供館藏目錄及狀況查詢 2. 進階用途 : 進行預約、續借、推介…… 3. 已做到功能 : (1) 書目資料與原件結合檢索 (2) 提供全球圖書資訊服務需求 4. 面對問題 : (1)MARC 格式是否與時俱進 . 例欄位 856 (2) 要能符合 Z39.50 網路資源存取協定