999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TFIDF和梯度提升決策樹的短文本分類研究

2019-10-21 21:07:26劉春磊梁瑞斯邸元浩
科技風 2019年24期
關鍵詞:機器學習

劉春磊 梁瑞斯 邸元浩

摘 要:自然語言處理是人工智能領域中的一個熱門方向,而文本分類作為自然語言處理中的關鍵技術受到專家學者的廣泛關注。隨著機器學習技術的發展,決策樹算法已經在文本分類中取得了較好的分類效果。本文針對短文本分類問題,利用TFIDF提取文本特征后,結合梯度提升決策樹算法進行文本分類,并與樸素貝葉斯、邏輯回歸和支持向量機的分類效果進行對比分析,驗證了梯度提升決策樹用于短文本分類的可行性。

關鍵詞:自然語言處理;文本分類;機器學習;決策樹

短文本分類是信息檢索和文本數據挖掘的基礎,也是當前自然語言處理領域中一個重要的研究方向,在情感分析、垃圾郵件過濾、新聞分類等領域有著廣泛的應用價值。

機器學習方法的應用將文本分類任務拆分為特征工程和分類器,完成數據到信息和信息到知識的過程。[1]文本特征選擇方法較多,其中TFIDF可以有效評估特定字詞對于一個文本集或一個語料庫中的重要程度。[2]文本分類常用的分類器有樸素貝葉斯、邏輯回歸、支持向量機、決策樹等算法。[3]樸素貝葉斯和邏輯回歸在屬性個數比較多或者屬性之間相關性較大時,分類效果較差。當需要分類的樣本較多時支持向量機將耗費大量的機器內存和運算時間。決策樹算法中的GBDT(Gradient Boosting Decision Tree),是一種迭代的回歸決策樹算法,該算法由多棵決策樹組成,將所有樹的結論融合求解,是泛化能力較強的算法。

基于此,本文提出一種基于TFIDF和GBDT的短文本分類算法,用以解決現有短文本分類算法準確率較低、分類時間長、計算量較大等問題。

1 文本特征提取

文本數據屬于非結構化數據,一般要轉換成結構化的數據,將文本數據特征進行向量化。[4]詞袋模型是一種常用的用于文本向量化的模型,通過權重表示詞在一段文本中的重要程度,并進一步利用TFIDF提取文本的特征。TFIDF的主要內容是:如果某個詞在一段文本中出現的頻率高,并且在其他文本中出現的次數較少,則認為該詞具有較強的類別區分能力,即TF和IDF的乘積,適合作為文本分類的特征。

綜合上表中的F1值和訓練時間可以看出,梯度提升決策樹模型有較高的F1值。同時,相比與其他模型,在訓練時間有著更優的表現。

4 結論

本文在現有短文本分類方法的基礎上,使用梯度提升決策樹模型作為分類器,進行了文本分類的實驗。通過基于TFIDF的特征提取,十折交叉驗證后取平均值,F1值達0.81,驗證了梯度提升決策樹分類器在短文本分類上的適用性。

參考文獻:

[1]盧健,馬成賢,楊騰飛,周嫣然.Text-CRNN+Attention架構下的多類別文本信息分類[J/OL].計算機應用研究.

[2]牛永潔,田成龍.融合多因素的TFIDF關鍵詞提取算法研究[J/OL].計算機技術與發展,2019(07).

[3]丁月,汪學明.一種基于改進特征加權的樸素貝葉斯分類算法[J/OL].計算機應用研究.

[4]孟濤,王誠.基于擴展短文本詞特征向量的分類研究[J/OL].計算機技術與發展,2019(04).

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 亚洲国产91人成在线| 亚洲欧美日韩中文字幕在线| 日韩成人在线一区二区| 亚洲美女一区二区三区| 国产簧片免费在线播放| 六月婷婷精品视频在线观看| 久久国语对白| 国产丝袜啪啪| www.日韩三级| 老司机aⅴ在线精品导航| 国产精品国产三级国产专业不| 欧美不卡视频在线| 亚洲精品无码不卡在线播放| 成年av福利永久免费观看| 国产精品人莉莉成在线播放| 亚洲资源站av无码网址| 麻豆精品久久久久久久99蜜桃| 999国内精品视频免费| 最近最新中文字幕在线第一页 | 蜜臀AVWWW国产天堂| 午夜国产理论| 性激烈欧美三级在线播放| 色综合热无码热国产| 又爽又大又黄a级毛片在线视频| 99在线视频精品| 国产69精品久久久久妇女| 成人免费视频一区二区三区| 尤物成AV人片在线观看| 亚洲av成人无码网站在线观看| 日韩无码真实干出血视频| 国产一区二区精品福利| 免费无遮挡AV| 91小视频在线观看免费版高清| 亚洲色欲色欲www网| 免费看久久精品99| 伊人狠狠丁香婷婷综合色| 午夜少妇精品视频小电影| 手机成人午夜在线视频| 亚洲人成在线精品| 亚洲天堂在线视频| 亚洲欧洲日韩综合| 久久亚洲天堂| 2020国产在线视精品在| 欧美日韩一区二区三区四区在线观看| 欧美一级在线看| 2048国产精品原创综合在线| 久久夜色精品国产嚕嚕亚洲av| 91综合色区亚洲熟妇p| 毛片大全免费观看| 四虎永久在线| a级毛片在线免费观看| 国产精品手机视频| 亚洲欧美一区二区三区蜜芽| 青青操视频在线| 国产欧美成人不卡视频| 丁香五月亚洲综合在线| 无码免费试看| 亚洲成人网在线播放| 国产无码在线调教| 亚洲综合极品香蕉久久网| 日本91视频| 精品人妻一区无码视频| 伦精品一区二区三区视频| 性视频久久| 久久综合一个色综合网| 亚洲另类色| 亚洲成人动漫在线| 在线播放真实国产乱子伦| 国产精品网拍在线| 亚洲无码高清视频在线观看 | 区国产精品搜索视频| 中文字幕在线播放不卡| 欧美人人干| 97人妻精品专区久久久久| 国产欧美在线观看一区| 久久这里只精品国产99热8| 青青热久免费精品视频6| 在线五月婷婷| 亚洲国产成人麻豆精品| 亚洲日韩久久综合中文字幕| 精品一区二区三区自慰喷水| 毛片卡一卡二|