999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TFIDF和梯度提升決策樹的短文本分類研究

2019-10-21 21:07:26劉春磊梁瑞斯邸元浩
科技風 2019年24期
關鍵詞:機器學習

劉春磊 梁瑞斯 邸元浩

摘 要:自然語言處理是人工智能領域中的一個熱門方向,而文本分類作為自然語言處理中的關鍵技術受到專家學者的廣泛關注。隨著機器學習技術的發展,決策樹算法已經在文本分類中取得了較好的分類效果。本文針對短文本分類問題,利用TFIDF提取文本特征后,結合梯度提升決策樹算法進行文本分類,并與樸素貝葉斯、邏輯回歸和支持向量機的分類效果進行對比分析,驗證了梯度提升決策樹用于短文本分類的可行性。

關鍵詞:自然語言處理;文本分類;機器學習;決策樹

短文本分類是信息檢索和文本數據挖掘的基礎,也是當前自然語言處理領域中一個重要的研究方向,在情感分析、垃圾郵件過濾、新聞分類等領域有著廣泛的應用價值。

機器學習方法的應用將文本分類任務拆分為特征工程和分類器,完成數據到信息和信息到知識的過程。[1]文本特征選擇方法較多,其中TFIDF可以有效評估特定字詞對于一個文本集或一個語料庫中的重要程度。[2]文本分類常用的分類器有樸素貝葉斯、邏輯回歸、支持向量機、決策樹等算法。[3]樸素貝葉斯和邏輯回歸在屬性個數比較多或者屬性之間相關性較大時,分類效果較差。當需要分類的樣本較多時支持向量機將耗費大量的機器內存和運算時間。決策樹算法中的GBDT(Gradient Boosting Decision Tree),是一種迭代的回歸決策樹算法,該算法由多棵決策樹組成,將所有樹的結論融合求解,是泛化能力較強的算法。

基于此,本文提出一種基于TFIDF和GBDT的短文本分類算法,用以解決現有短文本分類算法準確率較低、分類時間長、計算量較大等問題。

1 文本特征提取

文本數據屬于非結構化數據,一般要轉換成結構化的數據,將文本數據特征進行向量化。[4]詞袋模型是一種常用的用于文本向量化的模型,通過權重表示詞在一段文本中的重要程度,并進一步利用TFIDF提取文本的特征。TFIDF的主要內容是:如果某個詞在一段文本中出現的頻率高,并且在其他文本中出現的次數較少,則認為該詞具有較強的類別區分能力,即TF和IDF的乘積,適合作為文本分類的特征。

綜合上表中的F1值和訓練時間可以看出,梯度提升決策樹模型有較高的F1值。同時,相比與其他模型,在訓練時間有著更優的表現。

4 結論

本文在現有短文本分類方法的基礎上,使用梯度提升決策樹模型作為分類器,進行了文本分類的實驗。通過基于TFIDF的特征提取,十折交叉驗證后取平均值,F1值達0.81,驗證了梯度提升決策樹分類器在短文本分類上的適用性。

參考文獻:

[1]盧健,馬成賢,楊騰飛,周嫣然.Text-CRNN+Attention架構下的多類別文本信息分類[J/OL].計算機應用研究.

[2]牛永潔,田成龍.融合多因素的TFIDF關鍵詞提取算法研究[J/OL].計算機技術與發展,2019(07).

[3]丁月,汪學明.一種基于改進特征加權的樸素貝葉斯分類算法[J/OL].計算機應用研究.

[4]孟濤,王誠.基于擴展短文本詞特征向量的分類研究[J/OL].計算機技術與發展,2019(04).

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 国产精品视频白浆免费视频| 啪啪啪亚洲无码| 久久亚洲中文字幕精品一区 | 欧美一区二区人人喊爽| 91免费观看视频| 在线观看91香蕉国产免费| 波多野结衣第一页| 国产成人禁片在线观看| 九九这里只有精品视频| 三上悠亚精品二区在线观看| 亚洲第一黄色网址| 欧美成人在线免费| 免费在线国产一区二区三区精品| 亚洲成AV人手机在线观看网站| 欧美综合一区二区三区| 国产91丝袜在线播放动漫 | 国产一区自拍视频| av大片在线无码免费| 国产91高清视频| 欧美成人手机在线观看网址| 黄色网站不卡无码| 毛片在线区| 亚洲欧美成aⅴ人在线观看| 国产精品九九视频| 国产精品9| 精品人妻AV区| 超碰色了色| 国产欧美精品一区二区| 欧美成人综合在线| 婷婷伊人五月| 青青青亚洲精品国产| 久久夜夜视频| 日韩天堂视频| 精品国产网站| 在线国产欧美| 日韩精品久久久久久久电影蜜臀| 久久精品国产精品国产一区| 日韩欧美国产成人| 国产精品香蕉在线观看不卡| 国产网友愉拍精品| 久久精品国产电影| 另类重口100页在线播放| 一级毛片在线免费看| 国产精品999在线| 青青极品在线| 国产在线自乱拍播放| 亚洲欧美一区二区三区蜜芽| 亚洲人成成无码网WWW| jizz在线观看| 亚洲欧美在线看片AI| 99久久人妻精品免费二区| 视频二区亚洲精品| 久久semm亚洲国产| 国产麻豆va精品视频| 日韩毛片在线视频| 亚洲国产在一区二区三区| 天天视频在线91频| 精品夜恋影院亚洲欧洲| 国产精品福利在线观看无码卡| 国产最新无码专区在线| 精品久久高清| 国产靠逼视频| 国产成本人片免费a∨短片| 国产成+人+综合+亚洲欧美| 亚洲 日韩 激情 无码 中出| 无码精油按摩潮喷在线播放| a亚洲视频| 精品视频在线观看你懂的一区| 久久久久无码精品国产免费| 国产免费人成视频网| 亚洲国产成人精品无码区性色 | 香蕉在线视频网站| 99在线观看国产| 狠狠亚洲五月天| 欧美在线精品怡红院| 久久6免费视频| 欧美在线网| 国产av剧情无码精品色午夜| 欧美成人精品在线| 永久免费精品视频| 亚洲熟妇AV日韩熟妇在线| 国产精品白浆无码流出在线看|