赫楓齡 左萬利 張雪松
摘要:高性能網頁索引器JU_Indexer用倒排索引表存儲網頁索引數據,以多線程并行的方式對網頁建立索引數據,采用經過優化的檢索算法實現用戶的查詢。首先給出了JU_Indexer的系統框架,然后描述了索引數據在JU_Indexer中的存儲結構、建立網頁索引的算法、以及實現用戶查詢的檢索算法。實驗結果表明,JU_Indexer能在毫秒級的時間內完成用戶的查詢,它采用的經過優化的詞組檢索算法縮短了詞組的檢索時間。
關鍵詞:Web網頁;網絡搜索引擎;網頁索引器
中圖分類號:TP393.09
文獻標識碼:A
文章編號:1671-5489(2006)01-0050-07