摘要:傳統(tǒng)的頁(yè)面排序算法偏重于舊網(wǎng)頁(yè),使得一些舊的頁(yè)面經(jīng)常出現(xiàn)在檢索結(jié)果的前面。為了改進(jìn)此類(lèi)算法,引入時(shí)間鏈接分析,使用爬蟲(chóng)抓起頁(yè)面時(shí)HTTP協(xié)議反饋回來(lái)的修改時(shí)間作為頁(yè)面和鏈接的時(shí)間,并綜合考慮頁(yè)面的出入鏈接個(gè)數(shù)和時(shí)間來(lái)計(jì)算頁(yè)面的權(quán)重值。開(kāi)發(fā)出的WTPR算法能使新網(wǎng)頁(yè)集在排序中上升,高質(zhì)量的舊網(wǎng)頁(yè)比普通的舊網(wǎng)頁(yè)能獲得較高的排序值。
關(guān)鍵詞:頁(yè)面排序算法;網(wǎng)頁(yè);網(wǎng)絡(luò)挖掘
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2009)07-2438-04