摘要:提出一種基于頁面空間特征、視覺特征和內容特征的主題相關性判別方法,通過主題相關度大小量化描述不同內容的重要性,并采用混合加權方法從主題相關節點中提取網頁的主題特征。分類實驗結果表明,相比傳統的FullDoc全文分類,基于此方法提取的主題特征具有更好的分類效果。
關鍵詞:網頁分類;主題特征;主題相關性
中圖分類號:TP301 文獻標志碼:A 文章編號:1001-3695(2010)09-3399-04
計算機應用研究2010年9期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現代工業經濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業管理與科技》2024年6期
9《現代食品》2024年4期
10《衛生職業教育》2024年10期
關于參考網