摘 要:研究并實現了一個基于主題的智能信息采集系統IFWC,該系統以全信息理論為支撐,吸收傳統向量空間模型的思想,采用基于概念的向量空間模型,從詞的語義層次對文本進行主題相關性分析;使用擴展元數據的語義相關性判定算法,對頁面內的URL進行主題相關性預測。實驗證明,該系統采集速度快,采集下來的頁面精度高。
關鍵詞:基于主題的信息采集;全信息;擴展元數據;概念向量空間模型
中圖法分類號:TP391.3
文獻標識碼:A
文章編號:1001—3695(2006)02—0163—04
計算機應用研究2006年2期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現代工業經濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業管理與科技》2024年6期
9《現代食品》2024年4期
10《衛生職業教育》2024年10期
關于參考網