999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機(jī)器學(xué)習(xí)的線上評論情感分類研究

2021-09-15 08:52:08任正甜李興東
科學(xué)技術(shù)創(chuàng)新 2021年26期
關(guān)鍵詞:分類文本評價(jià)

任正甜 李興東

(蘭州交通大學(xué),甘肅 蘭州 730070)

1 概述

在現(xiàn)代社會中,網(wǎng)絡(luò)購物是非常重要的一種購物方式,在購物市場中占據(jù)了非常重要的分量。網(wǎng)絡(luò)購物用戶也可以通過在線評論表達(dá)自己使用產(chǎn)品后的感受,而客戶的在線評價(jià)也成為了影響消費(fèi)者決策的重要因素,對賣家服務(wù)能力的提高也有重要的指導(dǎo)作用。單純依靠人工去收集和分類線上評論是不切實(shí)際的,故需利用機(jī)器學(xué)習(xí)的途徑對線上評論文本進(jìn)行分類處理,通過對分析對商戶和顧客提供有效的信息。

在國內(nèi)外,也已經(jīng)有很多相關(guān)方面的研究,學(xué)者TimurSokhin在針對主題模型的基礎(chǔ)上,提出一種半監(jiān)督情感分析方法[1];E.D'Andrea構(gòu)建了包括SVM在內(nèi)的三種模型,并且達(dá)到很好的實(shí)驗(yàn)結(jié)果[2];楊宇婷等在的特征表達(dá)法上進(jìn)行了創(chuàng)新,結(jié)合利用了SVM算法[3];陳子昕采用SVM分類器對新聞評論文本進(jìn)行分類,并且評價(jià)指標(biāo)準(zhǔn)確率也較高[4]。

2 研究方法介紹

利用機(jī)器學(xué)習(xí)進(jìn)行情感分類已經(jīng)有了很多的研究成果,但是利用adaboost等多種分類器進(jìn)行建模分析的研究較少。本文將獲取的評論文本進(jìn)行分詞、去除停用詞等預(yù)處理,特征提取利用TF-IDF算法,再采用NB、SVM、adaboost三種分類器,建立情感分類模型并加以應(yīng)用,最后通過特定評價(jià)指標(biāo)對三種方法的性能進(jìn)行比較,對商戶和顧客提供參考。

2.1 特征提取

TF-IDF(Term Frequency-Inverse Document Frequency)翻譯為中文即為“詞頻-逆向文本頻率”。它由TF(詞頻)和IDF(逆向文本頻率)兩部分組成。TF(詞頻)表示在評論文本中某一給定詞 出現(xiàn)的頻率[5]。計(jì)算過程見公式:

IDF實(shí)際意義:IDF值小,說明評論文本中有該給定詞w的數(shù)量多,反之則IDF的值大。在這里,我們?nèi)菀椎玫揭粋€極端的情況:如果在所有的評論文本中一個給定詞w均出現(xiàn)過,那么詞w的IDF值即為0,由下面的計(jì)算公式看也十分顯然。

TF-IDF算法判斷詞w區(qū)分能力的過程可概括為:若給定詞w只在文本c中常出現(xiàn),而在其他文本中不常出現(xiàn),則認(rèn)為該詞w的區(qū)分能力很好。TF-IDF算法優(yōu)點(diǎn)是計(jì)算快速,結(jié)果也比較符合實(shí)際情況。

2.2 樸素貝葉斯(NB)分類器

以貝葉斯公式為架構(gòu)的基礎(chǔ)上,計(jì)算后驗(yàn)概率P(c|x)是及其困難的,因?yàn)橛伞耙颉钡健肮钡母怕嗜ネ扑阌伞肮钡健耙颉钡母怕适遣蝗菀椎摹榱私鉀Q此類困難,樸素貝葉斯分類器(Naive Bayes classifier)的基礎(chǔ)條件中多了一個假設(shè)條件:假設(shè)每個能對最后分類的結(jié)果產(chǎn)生影響的屬性都是相互獨(dú)立的。

2.3 支持向量機(jī)(SVM)分類器

支持向量機(jī)(英文全稱Support Vector Machine,簡稱SVM):找出一個特定的劃分超平面:該平面在能將訓(xùn)練數(shù)據(jù)集正確劃分的基礎(chǔ)上、能夠使幾何間隔盡量最大化。使

2.4 Ada-boost分類器

Ada-boost(Adaptive Boosting)方法是改進(jìn)了的boosting算法。

在一開始,訓(xùn)練數(shù)據(jù)各自均具有相同的權(quán)重值,第一個基分類器是通過直接將學(xué)習(xí)算法用在初始數(shù)據(jù)分布上得到的。但在循環(huán)下一輪回時,將利用不同樣本分布不同權(quán)重值得到:加大對錯分樣本的“重視度”-加大權(quán)重這樣,難以分類正確的樣本就成了下一輪循環(huán)時候的“重點(diǎn)分類對象”,這樣在新一輪訓(xùn)練時,可得到一個新的分類器。就這樣多次分配權(quán)重,多次重復(fù)循環(huán),將得到 個不同的弱分類器,將這 個弱分類器進(jìn)行“融合”,就可以得到一個強(qiáng)分類器。其中,在進(jìn)行弱分類器組合時,使分類準(zhǔn)確度低的分類器權(quán)值小一些,相反,分類準(zhǔn)確度高的分類器權(quán)值大。

3 結(jié)果與分析

3.1 數(shù)據(jù)來源

本文選取購物平臺京東為評論數(shù)據(jù)來源,使用八爪魚軟件,采集顧客在小米旗艦店中購買小米10S的所有評論情況,共獲得1428條評論,其中正面評價(jià)數(shù)據(jù)1000條,負(fù)面評價(jià)數(shù)據(jù)428條。并對數(shù)據(jù)進(jìn)行預(yù)處理,正面評價(jià)標(biāo)簽為0,負(fù)面標(biāo)簽為1。

3.2 結(jié)果對比與分析

通過對三種分類器模型的訓(xùn)練和應(yīng)用,利用性能評價(jià)指標(biāo),對三個不同結(jié)果進(jìn)行對比,結(jié)果對比如圖1。

圖1 結(jié)果對比圖

通過三個評價(jià)指標(biāo):準(zhǔn)確度、召回率以及F1值可以看出,各個模型中SVM分類器效果極佳,在精度方面略遜色于樸素貝葉斯分類器,而ada-boost分類器在各項(xiàng)指標(biāo)中表現(xiàn)都不突出,在這三種分類器模型中,SVM有其本身非常強(qiáng)勢的優(yōu)勢。

3.3 負(fù)面文本分析

為了對商戶針對產(chǎn)品提供一定的建議,本文對負(fù)面評論進(jìn)行了分析。通過ROST CM6軟件建立了社會和語義網(wǎng)絡(luò),得到結(jié)果圖2。

圖2 社會與語義網(wǎng)絡(luò)示意圖

在網(wǎng)絡(luò)中,詞匯連線越多,則說明各個詞匯之間的聯(lián)系越密切。由結(jié)果可看出:反映手機(jī)發(fā)熱問題的評論較多,手機(jī)發(fā)熱從而導(dǎo)致的信號不良和使用手感等問題,使得顧客感到不滿;耗電快以及靈敏度的問題,使得客戶使用感受較差;外圍的性價(jià)比評論,表達(dá)了顧客對該款手機(jī)性價(jià)比的不滿,使顧客更傾向于高配置的手機(jī)。

通過負(fù)面評價(jià)分析,商戶可以考慮重點(diǎn)解決手機(jī)發(fā)熱的問題,提高客戶使用手機(jī)時的舒適度;對手機(jī)電池質(zhì)量的提升以及屏幕手寫的靈敏度也需要重視;同時,商戶可以提高手機(jī)的性價(jià)比,給予更好的配置或者更實(shí)惠的價(jià)格來吸引顧客前來購買。

結(jié)束語

本文利用機(jī)器學(xué)習(xí)理論,基于京東中手機(jī)產(chǎn)品的在線評論數(shù)據(jù),在常用的SVM分類器的基礎(chǔ)上,添加了樸素貝葉斯以及adaboost分類器模型,再根據(jù)不同模型進(jìn)行情感分類,對分類結(jié)果也進(jìn)行了對比以及評價(jià)。更加突出了SVM分類器的優(yōu)良性質(zhì)。同時,對負(fù)面文本分析建立了社會和語義網(wǎng)絡(luò),分析顧客對產(chǎn)品提出的建議,對產(chǎn)品后續(xù)開發(fā)作出參考。

猜你喜歡
分類文本評價(jià)
SBR改性瀝青的穩(wěn)定性評價(jià)
石油瀝青(2021年4期)2021-10-14 08:50:44
分類算一算
在808DA上文本顯示的改善
分類討論求坐標(biāo)
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
基于Moodle的學(xué)習(xí)評價(jià)
如何快速走進(jìn)文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 欧美成人看片一区二区三区 | 香蕉久人久人青草青草| 久久6免费视频| 亚洲国产91人成在线| 久久青草免费91观看| 国产成人高清精品免费| 91免费片| 看国产一级毛片| 色欲国产一区二区日韩欧美| 国产精品女主播| 亚洲日本一本dvd高清| 婷婷色在线视频| 99视频在线免费观看| 永久免费无码日韩视频| 亚洲欧美日韩另类在线一| 免费毛片全部不收费的| 日本久久网站| 91精品啪在线观看国产| 欧美日韩午夜| 99热这里只有精品在线播放| 精品少妇人妻无码久久| 国产亚洲精品资源在线26u| 天天视频在线91频| 欧美午夜在线播放| 国产91九色在线播放| 日韩av电影一区二区三区四区| 国产97色在线| 国产成人艳妇AA视频在线| 欧美激情网址| 中文字幕在线看| 久久免费看片| 中文字幕亚洲第一| 天堂网亚洲综合在线| 国产精品亚洲一区二区三区z| 国产在线视频自拍| 福利在线不卡一区| 中文字幕久久精品波多野结| 国产精品无码AV中文| 狠狠亚洲五月天| 特黄日韩免费一区二区三区| 欧美a在线视频| 国产精彩视频在线观看| 久久黄色一级视频| 亚洲黄色成人| 亚洲大尺度在线| 999精品视频在线| 高清视频一区| 久久亚洲精少妇毛片午夜无码| 国产中文一区二区苍井空| 欧美一级视频免费| 亚洲高清在线天堂精品| 啦啦啦网站在线观看a毛片| 亚洲综合激情另类专区| av一区二区人妻无码| 无码一区中文字幕| 亚洲AV无码久久天堂| 国产不卡在线看| 亚洲午夜18| 久久人搡人人玩人妻精品| 亚洲女同欧美在线| 夜精品a一区二区三区| 一级毛片在线免费视频| 国产成人91精品| 香蕉久久永久视频| 亚洲精品波多野结衣| 亚洲日韩精品欧美中文字幕| 久久中文字幕2021精品| 亚洲人精品亚洲人成在线| 亚洲国产精品美女| 欧美日韩国产精品综合| 久久综合激情网| 一区二区三区四区在线| 无码 在线 在线| 97视频精品全国在线观看| 欧美视频在线不卡| 香蕉eeww99国产在线观看| 2020精品极品国产色在线观看| 欧美精品xx| 亚洲,国产,日韩,综合一区 | 91青青草视频| 欧美成在线视频| 免费无码一区二区|