鄧丹君 姚莉



摘要:針對微博短文本特征難以提取的特點,結合微博文本的3種專屬特殊符號:“@”、“//”和“#”分析微博文本的特點,從而對TF-IDF算法進行改進,并且考慮用戶興趣時間的長短來進行微博短文本特征詞的選取。實驗結果表明,相對于原有算法,該算法能夠有效提高微博短文本特征詞提取的準確度。
關鍵詞:TF-IDF;微博短文本;特征詞提取
DOIDOI:10.11907/rjdk.161165
中圖分類號:TP312文獻標識碼:A文章編號:1672-7800(2016)006-0048-02
參考文獻:
[1]楊福強.基于微博擴展的用戶興趣主題挖掘算法[J].計算機工程與設計,2015,36(5):1214-1217.
[2]何天翔,張暉,李波,等.一種基于情感分析的網絡輿情演化分析方法[J].軟件導刊,2015,14(5):131-134.
[3]周磊,覃俊,劉晶. 基于微博交互信息的社交網絡推薦算法[J].軟件導刊,2015,14 (4):63-66.
[4]陶永才.基于加權動態興趣度的微博個性化推薦[J].計算機應用,2014,34(12):3491-3496.
[5]秦雨.基于特征映射的微博用戶標簽興趣聚類算法[J].Journal of Data Acquisition and Processing,2015,30(6): 1246-1252.
[6]趙華.基于話題相關空間的微博用戶興趣識別及可視化方法[J].計算機科學,2015,42(6A): 500-502.
[7]曾東紅.一種基于指數遺忘函數的協同過濾推薦算法[J].科技廣場,2013(7):10-15.