霍 華 馮博琴 趙深深
摘要:為提高信息檢索系統(tǒng)的性能,提出了一種多查詢數(shù)據(jù)融合與正相關(guān)反饋相結(jié)合的檢索算法.算法的核心思想是:利用基于向量表示的余弦相似度測度計(jì)算查詢與文檔之間的相似度,采用多查詢數(shù)據(jù)融合技術(shù)將多個(gè)檢索結(jié)果融合,以及從上一次檢索結(jié)果中取出前M個(gè)相關(guān)文檔和初始查詢一起構(gòu)成新的查詢,將新查詢提交給系統(tǒng)并繼續(xù)下一次的檢索,如此反復(fù),直到獲得滿意的結(jié)果.實(shí)驗(yàn)結(jié)果表明,該算法相對于僅使用了多查詢數(shù)據(jù)融合技術(shù)的算法和僅使用了正相關(guān)反饋技術(shù)的算法,其平均準(zhǔn)確率分別提高42.6%和23.17%.
關(guān)鍵詞:信息檢索;多查詢數(shù)據(jù)融合;正相關(guān)反饋
中圖分類號:TP366.8文獻(xiàn)標(biāo)識碼:A文章編號:0253—987X(2005)08—0820—04