摘 要:以向量空間模型作為Web文本的表示方法,結合Wcb文本的結構特征對向量空間模型中的特征選擇算法進行了分析并加以改進。在改進的算法中,體現出了特征詞在Web丈檔結構中的位置信息;引入了信息論中熵的概念,用詞的熵函數對權值進行調整,從而更加準確地選取有效的特征詞。實驗驗證了改進算法的可行性和有效性。
關鍵詞:文本表示;向量空間模型;特征選擇;熵
中圖法分類號:TP393
文獻標識碼:A
文章編號:1001—3695(2005)07—0036—03
計算機應用研究2005年7期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現代工業經濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業管理與科技》2024年6期
9《現代食品》2024年4期
10《衛生職業教育》2024年10期
關于參考網