楊成偉,李希茹,祝翠玲
(1.山東財經大學 管理科學與工程學院;2.山東財經大學 大數據與人工智能研究院;3.山東省智慧養老與大數據工程實驗室;4.山東省應急管理與社會治理大數據發展創新實驗室,山東 濟南 250014;5.中國聯合網絡通信有限公司濟南軟件研究院,山東 濟南 250100)
隨著Web2.0 的應用和普及,企業在線口碑對企業的運營管理產生了巨大影響,用戶可以方便地將包含大量對企業服務主觀感受的評論信息以非結構化文本形式發表到微博、論壇、貼吧等網絡媒體上。這些用戶在線評論數據中蘊含著巨大價值:一方面,這些數據能幫助企業了解用戶的真實感受和期望,及時掌握其產品或服務質量情況,有利于改進自身服務;另一方面,評論中所持的觀點和態度對進一步調整企業營銷策略、優化產品性能,建立完善的顧客滿意度評價體系有著十分重要的作用。然而,由于網絡環境的復雜性與不確性使得在線評論信息質量良莠不齊。如何從這些在線評論數據中得到對企業運營管理優化有價值的信息變得至關重要。文本情感分析技術能夠對文本數據中所蘊涵的情感傾向進行挖掘,并提取出其中所持的態度、觀點和感情,已經成為自然語言處理中的一個重要研究分支。文本情感分析為企業運營管理決策提供了一種行之有效的大數據技術支撐。
目前,用戶在線評論數據的情感分類問題受到國內外學者們的高度重視,已涌現出大量有價值的研究成果。基于情感詞典的情感分類方法按照情感詞典中情感詞的極性劃分情感粒度,并將不同類型和程度的詞語放入模型中進行訓練,再根據情感判別規則輸出情感類型。這種方法依賴于情感詞典構建,典型的情感詞典如SentiWordNet[1]、How Net[2]、情感詞匯本體庫[3]等。這些情感詞典大都通過人工構造,需要閱讀大量的相關資料和現有的詞典總結概括情感傾向詞,還要對這些詞語的情感極性和強度進行標注,代價極大。例如,Cai 等[4]通過Apriori 算法構造情感歧義詞詞典實現細粒度的情感分類。Wu 等[5]利用網絡資源建立了第一個俚語情感詞典,獲得了社交媒體中俚語內容的情感極性。為獲得更好的分類效果,還有些學者嘗試在情感詞典上構建新的情感詞典。姬思陽等[6]提出了基于句子的情感分類方法。Asghar 等[7]在原詞典基礎上又集成了領域術語、表情符號、否定詞和修飾語等規則,提升了情感分類準確性。Xu 等[8]構造了一個包含基本情感詞、領域情感詞和多義情感詞的擴展情感詞典,利用擴展情感詞典和情感評分規則進行情感分類。
近幾年,基于機器學習的文本情感分類開始流行起來。該方法將已標注類別的情感詞作為訓練數據集,然后進行特征提取和特征選擇,再用機器學習分類模型進行訓練,最后用訓練好的分類模型進行情感分類。不同的文本表示方法、特征選擇方法和分類器的選擇等都對情感分類結果影響極大。例如,唐慧豐等[9]使用SVM、KNN 等機器學習模型對中文文本進行情感分類,發現采用BiGrams 方法進行特征表示,再利用SVM 模型在足夠大訓練集上進行的情感分類效果最優。在短文本和多級情感分類問題中,學者們發現有監督機器學習方法表現良好。楊爽等[10]研究基于SVM 的多級情感分類,提出詞性、語義等特征上情感的五級分類,將情感分類準確率提升到82.4%。Xue等[11]用LDA 主題模型對與COVID-19 相關的2 200 萬條Twitter 信息中的主題情感進行識別,并通過實驗驗證了該方法的有效性。近年來,深度學習方法被應用于情感分類。王繼東等[12]采用情感深度遷移識別算法對情感數據進行分類,提升了分類準確率;嚴鵬等[13]提出一種新的基于自注意深度學習的商品評論情感分類算法;盧昱波等[14]將cw2vec 與CNN-BiLSTM 注意力模型用于中文微博情感分類;陳景霞等[15]提出基于混合神經網絡的腦電時空特征學習與情感分類方法;張合橋等[16]提出基于圖神經網絡的方面級情感分析方法。其他相關研究將半監督、弱監督等方法引入情感分類,如盧紹帥[17]提出基于弱監督對比學習的小樣本情感分類方法,李衛疆[18]提出基于多通道特征和自注意力的情感分類方法。
綜上,本文利用數據科學、設計科學的方法,研究基于企業數字化運營管理的用戶在線評論情感分類,主要貢獻有:①探索文本特征表示、特征選擇方法和機器學習模型對情感分類效果的影響,提出了一種新的混合詞情感特征表示(UBG)的在線評論數據情感分類方法方法;②對酒店用戶評論數據集進行分類預測,比較了多種特征表示方法、特征選擇方法和分類算法,其分類指標值達到了0.88以上,優于多數已有情感分類方法;③研發了基于在線評論數據驅動的酒店競爭力運營管理原型系統,為企業運營管理決策提供了一種新方法和思路。
通過對企業運營過程中顧客發布的在線評論數據進行情感分析,可獲得顧客對企業運營過程中所提供的各類服務態度,并根據顧客的積極和消極傾向,抓住顧客的關注點,從而建立用戶體驗模型,形成客戶對企業運營中所提供的各項服務的管理決策權重。
如圖1 所示,基于在線評論情感分類的企業數字化運營優化過程如下:
(1)文本情感特征提取。對獲取的有關企業運營的在線評論樣本數據分別利用單詞特征表示(Unigram)方法、雙詞特征表示(Bigram)方法和混合詞特征表示(UBG)方法進行文本情感特征提取,統計出詞頻,形成統一的情感特征集合。
(2)情感特征預處理。由于在線評論數據中有些評論數據不規范,經常存在一些網絡詞及表情符號等。因此,需要對情感特征集合進行預處理。如刪除情感特征集合中的標點符號數據和網絡詞,利用停用詞表刪除情感特征集合中的停用詞以及情感特征集合中無意義的高頻詞,如“的”“地”等。

Fig.1 Enterprise digital operation optimization method based on online comment sentiment classification圖1 基于在線評論情感分類的企業數字化運營優化方法
(3)閾值設定。人工設定情感特征選擇過程中對情感詞的閾值,該閾值設定情感特征數量或特征選擇方法計算出的特征信息量所需要的范圍值。
(4)情感特征選擇。根據情感特征選擇方法,如卡方檢驗(CHI)、Jaccard 相似系數、互信息(MI)、似然比(Likelihood Ratio)等方法,計算情感特征集合中每個情感特征所攜帶的信息量,再根據設定的閾值及應用向量空間模型對在線評論進行情感特征選擇。
(5)數據集劃分。將所有有關企業運營的顧客評論樣本按照某指定比例(如5∶2∶3)劃分得到訓練集、驗證集和測試集。
(6)情感分類模型訓練。利用樣本訓練集對邏輯回歸(LR)、支持向量機(SVM)、樸素貝葉斯(NB)等情感分類模型進行訓練,得到訓練好的情感分類模型。
(7)情感分類模型評估及參數尋優。利用訓練好的情感分類模型對驗證集中的樣本進行情感分類,并利用準確率(Accuracy)、精確率(Precision)、召回率(Recall)和F1值等評價指標對分類器進行評估,根據評估結果進行參數尋優,調整閾值,以獲取更好的分類結果。
(8)文本評論情感分類。根據情感分類性能指標數據從情感分類器中選擇綜合性能最好的對測試集中的在線評論進行情感分類。
(9)將情感分類結果用于企業運營管理決策。利用大數據可視化技術將情感分類內容可視化,提供給企業運營管理者作為決策依據。
本文以酒店運營管理競爭力提升為例,借助數據科學、設計科學的方法,對酒店評論情感數據進行分析挖掘,為酒店市場定位、營銷管理提供科學決策方法及依據。原始數據集來自譚松波中文文本分類語料庫酒店評論內容數據集(https://download.csdn.net),該數據集從攜程網爬取并經過整理而成,積極、消極評論數據的數量之比為1:1。為了提升分類準確性,首先對原始數據集進行規范化處理,通過刪除停用詞、jieba 分詞、清除文本中無關字符(如“,、:”等),得到實驗數據集,并按照5∶2∶3 比例將實驗數據集劃分為訓練集、驗證集和測試集3部分。
不同的情感特征表示方法和分類算法會對分類器的性能產生影響,分別使用Unigram、Bigram 和UBG 3 種特征選擇方法提取單個詞、雙詞以及混合詞作為特征,對3 種特征表示方法在不同分類算法中的分類效果進行比較實驗,分類算法采用scikit-learn 學習庫中情感分析研究人員常用的線性和非線性分類模型,包括最廣泛采用的邏輯回歸(Logistic_Reg)分類器、機器學習領域較為成熟的支持向量機(SVM[19])分類器以及具有較強可操作性的樸素貝葉斯(NB)分類器[20],主要包括伯努利樸素貝葉斯(Bemoulli_NB)和多項式樸素貝葉斯(Polynomia_NB),分類算法的超參數均為默認,所用Accuracy、Precision、Recall、F1值作為情感分類的評估指標,計算公式如式(1)—式(4),默認使用卡方統計(CHI)特征選擇方法,情感分類結果如表1所示。
其中,Accuracy 為預測正確的樣本與總樣本的比例;Precision 為預測為正向樣本中預測正確的比例;Recall 為預測正確的正樣本與原本總正樣本的比例;F1為Precision和Recall 的調和平均指標;TP 為正確預測的正例,TN 為正確預測的負例,FP 為錯誤預測的負例,FN 為正確預測的負例。
分別采用Unigram、Bigram、UBG 方法進行特征表示的情感分類效果如圖2所示。

Table 1 Sentiment classification results of three feature representation methods表1 3種特征表示方法的情感分類結果

Fig.2 Results of three feature representation methods for sentiment classification圖2 3種特征表示方法的情感分類結果
實驗結果顯示,采用Unigram 方法進行特征表示,NB分類器的Accuracy 明顯優于其他分類器。其中,Polynomia_NB 和Bemoulli_NB 分類器的Accuracy 差別不大,分別是0.815 和0.81。而Polynomia_NB 和Logistic_Reg 分類器的Precision 上優于其他分類器,分別是0.888 和0.867,且非常接近。SVM 和Bemoulli_NB 分類器的Recall 達到0.9以上,但Polynomia_NB 和Logistic_Reg 分類器也都接近0.9。Polynomia_NB 和Logistic_Reg 分類器的F1值分別是0.882 和0.873,兩種分類器預測性能都較好。然而,采用Bigram 方法進行特征表示,使用Polynomia_NB 分類器的綜合性能較好,其Accuracy 達到0.858,F1值達到0.861,而SVM 分類器的綜合性能指標較差。采用UBG 方法進行特征表示,在4 種分類器上的情感分類對比實驗中,Accuracy均較高,其中Polynomia_NB 分類器的綜合性能(F1值)達到0.886,在3種特征表示方法測試中最好。
進一步比較Polynomia_NB 分類器對UBG 特征選擇方法進行情感分類的效果,性能指標比較結果如圖3 所示。可以看出,UBG 特征選擇方法在Accuracy、Precision、Recall和F1值的性能指標上有穩定的性能表現,指標值均高于0.88,明顯優于其他兩種特征表示方法。

Fig.3 Results of polynomial naive Bayes classifier for sentiment classification圖3 多項式樸素貝葉斯分類器的情感分類結果
情感分類不僅受到文本情感特征表示方法的影響,情感特征選擇方法也是影響情感分類的重要因素,但目前對特征選擇方法的情感分類效果影響的研究仍很少見。為了得到不同特征選擇方法對情感分類的影響,分別選擇MI、Jaccard、CHI 和Likelihood_Ratio 4 種特征選擇方法。情感分類模型仍然采用有代表性的線性和非線性模型LR、SVM、NB(Bemoulli_NB 和Polynomia_NB)分類器進行實驗,并使用Accuracy、Precision、Recall 和F1作為分類評估指標,實驗結果如表2所示。
可以看出,在任何一種特征選擇方法下,Polynomia_NB 分類算法都有較穩定且相對優越的分類性能,且特征選擇方法為Likelihood_Ratio 時,4 個性能指標值最高,都大于0.86。同時,利用UBG 方法進行特征表示時,不同特征選擇方法對其分類結果的影響都不大。

Table 2 Sentiment classification results of four feature selection methods表2 4種特征選擇方法的情感分類結果
參數的選擇對情感分類的準確度也可能產生一定影響。在前面實驗中,Polynomia_NB分類器的表現較好,因此,本實驗采用UBG特征選擇方法,并仍采用Polynomia_NB分類器、和MI、CHI、Jaccard和Likelihood_Ratio 4種特征選擇方法,測試不同特征數量參數對情感分類結果造成的影響,實驗結果如表3所示。當特征數量為500時,Polynomia_NB分類效果整體較好,雖然當t=1 000或1 500時,分類效果有一定提升,但是提升幅度不大,而特征數量的增大,使得情感分類的復雜度和所用時間都大幅度增加。采用Likelihood_Ratio特征選擇方法時,當選擇的特征數量為100,Polynomia_NB的分類效果已經非常好,Accuracy、Precision、Recall和F1值都在0.8以上,當選擇的特征數量太多時,分類器的分類指標Precision略有降低,說明特征數量參數對情感分類產生一些影響,但影響不大。

Table 3 Result of different reference value for sentiment classification表3 不同特征參數值的情感分類結果
實驗中情感分類性能值隨特征數量參數變化情況如圖4所示。

Fig.4 Result of different reference value for sentiment classification圖4 不同特征參數值的情感分類結果
從實驗結果可見,利用UBG 特征提取方法的情感分類降低了情感分類的復雜性,提高了情感分類效率,實驗中獲得了較好的分類結果。
為使企業運營管理工作人員更敏捷地感知情感分類的分析結果,可以利用數據可視化技術進行更加直觀的展現。對酒店評論進行情感分類后,將分類后的評論用詞云形式展示,詞云圖中按照消極評論、積極評論分解詞語的詞頻確定在途中的重要度,便于管理人員洞察消極、積極評論中蘊藏的問題以便作出正確決策,效果如圖5、圖6所示。
從詞云圖中可以清晰感知到用戶對R 酒店的在線評論情感分類結果進行詞云展示的結果。積極評論分解成詞云后可見,R 酒店能以客人為中心,客戶對酒店的客房服務、環境、設施、價格等都較為滿意;而從消極評論分解成詞云后可見,酒店的前臺服務員服務質量較差,服務員的素質有待提升等。部分詞在積極、消極評論句子有重復,因而也會在積極、消極的詞云圖統計中出現。因此,通過在線評論數據的情感分類為酒店科學管理和競爭力提高提供了更智能的手段。

Fig.5 Word cloud of positive reviews圖5 積極評論的詞云

Fig.6 Word cloud of negative reviews圖6 消極評論的詞云
為了將文本情感分類的特征表示方法、特征選擇方法與多種情感分類模型更好地與企業智能運營管理優化結合,利用數據驅動的分析方法幫助企業管理者洞察商機并實施科學決策。課題組研發了基于情感分析的酒店競爭力智能運營優化虛擬仿真系統。該系統采用微服務架構,各模塊之間實現了功能上的高內聚與模塊間的低耦合。系統主要包括:環境部署、數據準備、數據預處理、數據探索、數據建模、決策報告生成6 個模塊。系統環境部署模塊提供了云虛擬化環境創建以及工具在線部署;數據準備模塊提供了網絡數據采集方式和本地上傳數據文件功能;數據預處理模塊提供了空值、重復值的查詢處理以及添加派生數據等多種預處理方法;數據探索模塊通過可視化插件以箱圖、折線圖、詞云圖等形式對對預處理后的數據進行可視化分析;數據建模模塊提供了包括CART 回歸分析、一元線性回歸分析、情感分析等多種模型和方法;本文在線評論數據的情感分類方法也被封裝成一個案例,以方便運營管理人員在決策過程中使用。
基于UBG 混合詞特征表示的在線評論情感分類方法,通過提取在線商品和服務的在線評論數據,通過數據預處理、數據探索、情感建模與可視化過程幫助管理者洞察自身存在的問題,制定相應的解決方案。以酒店運營管理決策為例,收集R 酒店評論數據實施所提方法,比較了不同特征表示、特征選擇和特征數量參數對情感分類模型的影響,建立了基于UBG 的多項式樸素貝葉斯情感分類器,完成了在線評論數據的最優分類。為了更好地將提出的方法與企業管理相結合,研發了相應的原型系統,目前已投入運行。本文研究對于克服傳統“拍腦袋”決策的武斷性,以及加速企業運營數字化轉型提供了一種新思路和方法。