摘要:在歷史網頁檢索系統中,存在著按時間順序來對檢索結果進行排序的特殊需求,在客觀上要求系統能夠比較準確地判斷文檔與查詢詞是否相關。針對這一特殊需求,引入領域的概念,將領域用于用戶檢索的表示,在領域的基礎上設計了一種帶衰減因子的BM25檢索相關性計算算法。實驗結果顯示該檢索算法是有效的,引入領域后檢索結果的F值平均提高了56.68%。
關鍵詞:歷史網頁;領域;檢索算法;BM25;衰減因子
中圖分類號:TP393文獻標志碼:A
文章編號:1001-3695(2010)01-0056-04
doi:10.3969/j.issn.10013695.2010.01.016