孔 茸,那日薩
(大連理工大學 經濟管理學院,遼寧 大連 116024)
線上下單、線下消費模式(Online To Offline,O2O)已成為人們消費中不可或缺的組成部分,這一方面是由于平臺加大了優惠力度,另一方面則是平臺提供了更為豐富的可選擇商家。此外,平臺的消費者在線評論可以提供更為真實、全面的評價信息。2021年2月第47次《中國互聯網絡發展狀況統計報告》鼓勵互聯網加速推動本地生活服務生態進一步形成,帶動產業上游企業加速數字化轉型[1]。這表明,O2O 消費快速發展,其中服務消費勢頭最為明顯。
消費者在線選擇商家時,通常會閱讀在線評論來輔助決策[2],在線評論、評分、評論數量等都會影響潛在消費者的消費意愿,尤其是在線評論中的情感態度[3]最為關鍵。但是,海量在線評論的人工提取、對比往往事倍功半,而且不同消費者在不同情境下有著個性化的消費需求。因此,如何準確提取海量在線評論中的情感信息,并根據消費者需求偏好對商家排序,為其提供有效的決策參考,這是一個值得關注的問題。
通常,基于在線評論的排序方法主要分為兩個過程:首先挖掘在線評論中的目標屬性及情感信息,然后基于獲取的信息對候選產品或商家排序。在情感信息分析中,已有研究大多采用基于詞典和規則的無監督方法[4-8]來識別評論情感態度,也有學者采用有監督的機器學習方法[9]。候選排序過程中,一些學者將情感信息表示為模糊值或區間型直覺模糊值,進而使用多屬性群決策方法排序[4,9-10]。
基于詞典和規則的情感分析方法無須數據標注,但結果受規則影響大,當文本復雜時準確率較低。基于機器學習的方法雖然準確率有所提升,但仍然需要人工構建特征。近年來,深度學習在情感分析中被廣泛應用,它可以從數據中自動學習隱層特征,分類準確率有較大提升。
考慮消費者偏好的排序方法需要獲取評論中針對特定屬性的情感態度,方面級情感分析可以實現該功能。基于情感詞典[11]的方法,以及傳統機器學習模型如邏輯回歸(Logistic Regression,LR)[12-13]、支持向量機(Support Vector Machine,SVM)[14,20]等在情感分析領域有著廣泛應用,但難以較好地識別方面級情感[15-16]。隨著深度模型特別是注意力機制的研究推進,方面級情感分析技術取得了較大進步[15-16]。此類模型在學習上下文依賴信息的同時,也能關注到對不同屬性的評價詞,從而識別消費者對不同方面的情感態度[16]。
直覺模糊集(Intuitionistic Fuzzy Sets,IFS)是表示模糊、不確定信息的有力工具,可以表示對事物并存的肯定、否定和猶豫態度[17],由x=(μ,γ)的形式表示[18],該表示也稱為直覺模糊值(Intuitionistic Fuzzy Values,IFV),其中,μ、γ分別表示隸屬度和非隸屬度。根據IFV 在決策問題中的含義解釋[18],μ、γ分別表示對決策的支持和反對程度,猶豫度π=1-μ-γs表示中立、不確定的程度。已有研究表明,在線評論中的積極、消極和中性情感表達了對消費決策的支持、反對以及中立態度[4,9]。基于直覺模糊值的多屬性決策方法可以根據在線評論情感對候選商家排序,并且加入不同消費者的屬性權重差異影響。此外,在線評分、評論數量也會對潛在消費者的決策產生影響,當商家評分越高、評論越多、評論產生的時間間隔越短時,消費行為越容易發生[3]。
為了將在線評論中的情感信息應用于商家排序,本文構建了雙注意力BILSTM 方面級情感分類模型來識別在線評論對商家各屬性的情感。其中:方面詞自注意力計算能夠學習多個方面詞中的重要信息,從而獲得全面的方面詞表示;方面詞與上下文注意力計算能夠學習評論對各方面的情感態度,從而獲得評論中的方面情感信息。此外,本文將IFV應用于情感信息表示,將積極、消極和中性情感轉換為IFV 的過程中,既能保留中性情感的猶豫性,也能在計算中考慮到模型有限準確率帶來的不確定性。將在線評論、評分和評論數量3類信息融合,并在考慮消費者屬性偏好的情況下提供商家排序參考,能夠提升消費者的商家選擇和決策效率。
本文的實驗結果表明,提出的雙注意力BILSTM 方面級情感分類模型優于LR、SVM 等傳統模型以及BILSTM 和單注意力BILSTM 模型。在實例分析中,對大眾點評商家的排序結果與平臺提供的好評排序平均重疊分數較高,并且加入的消費者屬性偏好、評論數量等信息均能對排序結果產生有效影響。綜上所述,本文提出的基于在線口碑和消費者偏好的排序方法能夠融合多類信息,為消費者在線商家選擇提供個性化決策參考。
本文研究內容主要包括在線評論的方面級情感分類方法,以及基于在線口碑和消費者偏好的排序方法,相關研究綜述根據這兩部分展開。
在考慮消費者屬性偏好的商家排序問題中,需要識別在線評論中對商家各屬性的情感傾向,如餐廳評論中對“環境”“口味”和“價格”等屬性的情感態度,這需要方面級情感分析技術(Aspect-Based Sentiment Analysis,ABSA)。早期研究中,方面級情感分析采用支持向量機(Support Vector Machine,SVM)結合情感詞典、語義詞性等特征來建立模型[19-20],但是,這類方法依賴人工規則和特征工程,且性能提升有限。近年來,深度學習在自然語言處理問題中應用廣泛,而且融合注意力機制的模型在方面級情感分析中表現更好。
眾多學者已將注意力機制應用于深度學習模型,用于處理自然語言處理領域各個任務,各模型的主要內容如表1所示。

表1 應用注意力機制的深度學習模型
Bahdanau等[21]首次將注意力機制引入自然語言處理領域,用以改進機器翻譯中序列到序列的架構。之后,注意力機制被用于改進循環神經網絡及卷積神經網絡,并被用于情感分析問題。Vaswani等[22]拋棄了循環和卷積結構,使用純注意力機制構建編碼器-譯碼器結構,所得的Transformer模型在WMT 2014英語翻譯德語與英語翻譯法語兩項任務上均取得了最好成績。Yin等[23-24]將不同的注意力引入卷積神經網絡,并結合孿生網絡架構,在釋義識別、句子蘊含等句子對建模任務上取得了當時最好成績。Devlin 等[25]將Transformer編碼器堆疊多層得到BERT 模型,在大規模語料庫上預訓練以得到文本的通用表示,經過微調之后在幾乎所有自然語言處理任務中都得到了最好結果。Radford等[26]通過堆疊Transformer解碼器塊構造GPT 模型,在文本蘊含、問答、語義相似性評估等多項任務上實現了顯著性能提升。
在方面級情感分析領域,研究者也通過引入注意力機制來改良模型。Wang 等[27]構建了ATLSTM 和ATAE-LSTM 模型,AT-LSTM 通過LSTM 結構捕捉上下文信息,之后上下文的隱層輸出與方面詞嵌入經過注意力計算,經分類器得到方面級的情感傾向;ATAE-LSTM 則進一步在上下文詞嵌入中附加了方面詞嵌入。Tang等[28]提出TDLSTM 和TC-LSTM 兩種LSTM 擴展模型,TDLSTM 將目標詞左、右側的上下文信息分別建模,以更好地在序列中發揮目標詞的語義作用;TCLSTM 則在此基礎上進一步考慮了目標詞和上下文的語義交互。Zhu 等[29]提出了AARCNN 方面級情感分類模型,該模型使用BILSTM 構建句子的長期記憶,然后使用CNN 從隱層表示中提取注意力向量來獲得句子的注意力表示,最后通過方面詞嵌入來分析序列中的目標信息。曾峰等[30]通過構建單詞注意力層和句子注意力層,使用雙層注意力循環神經網絡實現了方面級情感分析,相比于單注意力模型,其分類準確率有所提升。孫小婉等[31]分別計算方面注意力層和上下文自注意力層,將兩部分拼接實現模型分類,但是該模型沒有考慮文本的序列關系。
本文提出雙注意力BILSTM 方面級情感分類模型,使用BILSTM 網絡學習上下文間的依賴關系,使用自注意力計算學習方面詞中的重要信息,使用方面詞和上下文間的注意力計算學習上下文中與方面詞相關的重要信息。這種模型結構在學習上下文序列關系的基礎上,進一步學習上下文與方面詞之間的依賴關系,獲得針對特定方面的情感傾向。
目前基于在線口碑的排序方法大多應用于電子產品、汽車等商品,已有研究采用了多種類型的在線口碑,例如文本評論、數值評分以及對比投票等,并基于多屬性決策、圖模型等方法展開研究。Liu等[4]使用詞典和規則的方法確定評論中屬性相關的情感傾向,根據積極、消極和中性評論的數量確定直覺模糊值,通過直覺模糊加權平均算子和多準則偏好方法排序。Liu等[10]進一步使用有監督機器學習方法識別在線評論情感傾向,基于評論數量和情感信息確定區間直覺模糊數,使用TOPSIS方法確定商品排序。BI等[9]考慮了有監督情感分類模型的有限準確率,使用情感傾向的統計值和模型準確率來確定二型區間直覺模糊數。Dahooie等[32]提出一種直覺模糊數據驅動的產品排序模型,通過HAC算法從在線評論中抽取產品屬性,通過維德詞典識別評論對各屬性的情感傾向,基于IFS構建直覺模糊決策矩陣,通過IF-IDOCRIW 方法確定屬性權重,最后應用IF-MULTIMOORA 確定排序。Awajan等[33]將中性集理論與情感分析、多屬性決策相結合,通過SNNWA 運算聚合評論情感,通過余弦相似度確定產品排序。
Zhang等[7]通過語法規則識別出各屬性相關的評論和評論中的主觀句、比較句,通過詞典確定評論中的積極、消極情感,使用PageRank算法確定商品排序。Zhang等[8]進一步考慮了在線評論的支持度和發布時間對排序的影響,認為支持度更高和發布時間更晚的評論應被賦予更大的權值。楊弦等[34]使用第三方論壇提供的產品投票信息建立對比關系圖,并計算產品的相對口碑評分,根據口碑評分進行排序。陶玲玲等[35]考慮評價信息可信度及消費者類型,將在線評價信息轉換為區間中智數,通過INLNPA 集成算子和VIKOR 方法得到酒店排序結果。李宛哲等[36]基于文本型、數值型和極性評論數據將個體評價標準差異納入排序方法設計中,通過情感詞典、概率語言集和DS-PLWA 算子融合得到排序結果,經過汽車產品實例分析表明,個體評價標準差異會對產品排序產生影響。Eshkevari等[37]結合語義挖掘技術與多準則決策方法,通過方面級情感分析及最好最壞方法實現了端到端的多維度酒店排序。Qin等[38]針對在線評論中存在的迷惑性,應用多種機器學習方法并結合證據推理理論和隨機優勢準則等決策模型,通過隨機多準則可接受性分析得到最終排序結果,在京東商城計算機產品實證研究中證明了方法的有效性。
尤天慧等[39]使用汽車論壇提供的汽車屬性和數值評分,計算各屬性評價值相對于消費者期望的損益值,運用PROMETHEE-II 方法確定排序。Zhang等[40]提出一種結合前景理論和改進VIKOR方法的基于在線評論產品排序方法,結合前景理論和熵權計算,通過改進的VIKOR 方法對候選產品排序。Song等[41]提出一種基于前景理論、通過整合在線產品評分和客觀數據對產品排序的方法,收集產品各屬性的在線評分和客觀數據,通過計算加權前景值,得到融合主客觀數據的產品多屬性排序。Najmi等[5]首次考慮了不同消費者的決策偏好,通過情感分析、產品屬性分析、品牌排序和評論有用性實現了一種更為全面的排序方法。Abulaish 等[6]使用電商平臺提供的星評、用戶狀態和評論有用性3種數值信息以及評論標題和評論內容2種文本信息,使用層次分析法確定5類信息的相對重要性,使用情感詞典確定評論情感傾向,使用TOPSIS方法確定商品排序。
綜上所述,基于圖模型的方法需要獲取對比關系,對數據結構要求較高;基于多屬性決策的方法需要挖掘在線評論中的情感態度,但對數據結構要求較低,可使用的數據范圍更大。此外,已有研究中的在線評論情感分析方法較為傳統,分析的自動化程度和準確性均有待提高。因此,本文提出基于雙注意力BILSTM 的方面級情感分析方法,在考慮消費者屬性偏好的情況下,應用直覺模糊TOPSIS 方法,融合在線評論、評分、評論數量等多類信息進行商家排序,為潛在消費者在線商家選擇提供參考。
消費者作出在線消費決策之前,通常會參考已有的在線評論、評分、評論數量等信息進行商家對比選擇,眾多研究也證明了評分數據的有用性[6,41],Zhang等[3]的研究表明,商家的在線評論數量與其消費量有一定關系。因此,在排序中融合消費者在線評論、評分和評論數量3類信息具有一定的理論基礎。
本文要解決的問題是基于在線評論、評分以及評論數量,在考慮消費者屬性偏好的情況下,為消費者提供商家排序作為決策參考,從而提高消費者的信息獲取和決策效率。以下為該問題中各集合、變量的表示及具體含義:
A={A1,A2,…,An}——消費者意向進行消費的商家集合,其中,Ai表示第i個商家,i=1,2,…,n
F={f1,f2,…,fm}——商家的m個方面屬性集合,其中,fj表示第j個屬性,j=1,2,…,m
Q={q1,q2,…,qn}——由消費者對商家的在線評論數量構成的向量,其中,qi為消費者對商家Ai的在線評論數量,i=1,2,…,n
問題解決過程主要分為兩個部分:一是通過構建雙注意力BILSTM 方面級情感分類模型識別在線評論對商家各屬性的情感傾向,然后基于消費者提供的屬性權重,通過直覺模糊TOPSIS方法計算商家的貼近度Di;二是獲取商家各屬性的消費者評分,考慮屬性權重得到商家綜合評分Si,并加入對商家評論數量的度量,融合3類信息得到對候選商家較為全面的評價。問題的解決框架如圖1所示。

圖1 基于在線口碑和消費者偏好的排序問題解決框架
為了識別在線評論中與方面屬性相關的情感傾向,本文構建雙注意力BILSTM 情感分類模型。該模型由屬性方面詞和評論句的詞嵌入層、LSTM 層、BILSTM 層、兩個注意力層和最后的全連接層構成,如圖2所示。其中:a1,a2,…,am表示方面詞向量;w1,w2,…,wn表示評論句詞向量;HA表示方面詞經LSTM 的輸出;Hs表示評論句經BILSTM 的輸出;表示HA經自注意力計算后的輸出;self attention表示自注意力計算;scaled dot attention表示方面詞與評論句上下文注意力計算;dropout表示隨機失活。下文將對各網絡層進行詳細介紹。

圖2 雙注意力BILSTM 模型結構
(1) 方面詞和評論句的詞嵌入層。圖2 中,[a1,a2,…,am]表示方面詞詞嵌入,由方面詞向量構成;[w1,w2,…,wn]表示評論句詞嵌入,由句中詞語的詞向量構成,即詞向量拼接構成詞嵌入層。詞向量是一種將文本轉換為數值向量的方法,每個詞語均由一個d維向量表示,向量間距離能夠表示詞語間的語義相似度[28]。將方面詞和評論句分別轉換為詞向量從而構成詞嵌入層,詞嵌入層中的參數值在模型訓練中動態調整,使其更適用于特定數據集。
(2) 雙向長短時記憶層。長短時記憶網絡(LSTM)常用于處理序列數據,它通過記憶細胞學習序列傳遞中的長依賴關系,LSTM 僅包含單向序列信息,雙向長短時記憶層(BILSTM)同時包含前后向序列信息。記憶細胞包含輸入門it、輸出門ot和遺忘門ft的控制單元,分別為:
式中:dt-1為t-1階段的隱層輸出;ˉct為t階段的輸入信息;σ是sigmoid激活函數;it、ot和ft分別控制t階段記憶細胞的輸入信息、輸出信息和t-1階段的丟棄信息;Wi、bi、Wo、bo、Wf和bf分別為各控制門的權值和偏置向量。
每條評論可視為一個序列,it、ot和ft中的控制參數在訓練中根據語料動態調整。門控機制使序列信息有選擇地傳遞,保留重要信息,丟棄噪聲信息,能夠挖掘評論中的遠依賴關系。
(3) 雙注意力層。注意力機制可以解釋為通過權值控制,丟棄、弱化與目標不相關的隱層,保留、增強相關的隱層。注意力計算公式為
式中:Q為查詢向量;K為鍵向量;V為值向量;dk為鍵向量的維度;softmax是歸一化函數,該式輸出可理解為值向量的加權和;QKT運算可表示查詢向量和鍵向量的契合程度[22]。
雙注意力層包含方面詞自注意力層、方面詞與上下文注意力層,方面詞自注意力層將方面詞LSTM 輸出做自注意力計算,得到權值調整后的方面詞表示,如下式所示:
式中:HA表示方面詞的LSTM 輸出;為HA的維度。
方面詞與上下文注意力層將評論句BILSTM輸出與方面詞自注意力輸出做注意力計算,如下式所示:
式中:Hs表示評論句BILSTM 輸出是Hs的維度。
方面詞自注意力層可以得到方面詞加權表示,根據語料動態學習權重,獲得方面詞中的重要信息,如當“位置、交通、距離、商圈、城市核心、商區、周邊商業、交通樞紐、周邊交通、城市中心”等作為方面詞時,自注意力計算使“位置”語義突出的方面詞權重增大。方面詞與上下文注意力層則將方面詞表示和評論句表示做注意力計算,可以提升評論中特定方面詞語的重要程度,有利于模型識別方面信息,如某餐廳評論“首先說地理位置,在北大街往東一點,交通很便利。所以人流量大,來吃飯的人很多,往往需要等位。”與“位置”方面做注意力計算時,評論中“地理位置”“交通”等詞語的權重提升,從而得到位置權重調整后的評論表示。
(4) 全連接層。全連接層作為模型的輸出層,輸出維度包含“不相關”“消極”“中性”和“積極”,具體含義分別為:評論與該方面不相關、在該方面上的情感傾向為消極、中性和積極。全連接層的dropout參數可以控制輸出層中隨機失活的神經元比例,可以增加輸出的隨機性,緩解過擬合問題。softmax函數表達式為
式中,k為輸出維度,本模型中k=4,與輸出維度一致,各維度值表示可能性大小。該概率型輸出將作為商家直覺模糊值的計算基礎。
本文模型對方面級情感分析中注意力計算的應用方式進行了創新,在已有注意力計算方式的基礎上,增加了方面詞的自注意力計算,將方面詞LSTM 輸出進行自注意力計算,可以對方面詞隱層加權,增強模型對輸入方面詞的學習、表示能力。方面詞與上下文注意力計算中,采用上下文的BILSTM 輸出與方面詞的自注意力表示做注意力計算,模型可以根據語料自適應地調整注意力權值,從而突出評論中的特定方面信息,識別與各屬性方面相關的情感。
上文構建的情感分類模型可以自動識別評論中的方面級情感傾向,本文將評論情感用直覺模糊值表示,應用直覺模糊TOPSIS 方法計算商家貼近度,將消費者對商家各方面評分加權求和。此外,計算消費者一定時間內對商家評論數量的度量,綜合三者確定商家排序。
通過下式得到表示商家Ai在方面屬性fj上表現的直覺模糊值xij=(μij,γij):
式中:ηj為情感分類模型在屬性fj上的加權F1值;α為考慮模型準確性的程度,α∈[0,0.5]。α取值過大時,xij中包含的情感信息過少,失去了區分度和評價意義。
式(14)~(16)為情感類別k的查準率、查全率和F1值的計算公式,其中TPk、FPk和FNk的定義基于目標類別k的混淆矩陣。如表2所示:TPk表示預測標簽和真實標簽均為k的評論數量;FPk表示預測標簽為k、真實標簽不為k的評論數量;FNk表示預測標簽不為k、真實標簽為k的評論數量;TNk表示預測和真實標簽都不為k的評論數量。

表2 目標類別k 的混淆矩陣
查準率、查全率能夠表示模型識別情感類別k的準確性和全面性,F1是兩者的綜合值。則有公式:
式(18)~(20)為加權查準率、加權查全率和加權F1 值,是各類別評價指標的加權平均值,其中pk的計算公式為式(17),表示類別k在數據集中的評論數量占比。加權查準率、加權查全率和加權F1值降低了標簽數量不均衡的影響,更能準確地反映模型性能。
直覺模糊值xij=(μij,γij)既包含消費者評論對在線商家選擇的支持、反對和中立猶豫態度,也包含模型有限準確率帶來的信息不確定性,可以簡潔有效地表示消費者態度,同時減少信息轉換中的丟失與曲解。
(2) 直覺模糊TOPSIS方法計算貼近度。根據已有研究[42-43],直覺模糊值x=(μ,γ)的得分函數有多種計算方式,分別為:
式中:μ、γ和π分別為隸屬度、非隸屬度和猶豫度;α為控制參數。當Si(x1)>Si(x2)時,x1?x2;當Si(x1)=Si(x2)時,x1=x2;當Si(x1) 參考已有研究[44-46],將直覺模糊TOPSIS方法計算過程概括如下: ①構建決策矩陣X=[xij]n×m,i=1,2,…,n;j=1,2,…,m。其中:n為候選商家數量;m為商家方面屬性數量;xij=(μij,γij)表示商家Ai在屬性fj上的直覺模糊值;μij、γij分別表示對選擇該商家的支持和反對程度;πij=1-μij-γij表示中立棄權程度。 ② 規范化決策矩陣,將決策矩陣中xij通過歸一化轉換為單位向量,得到規范化決策矩陣 ③根據消費者提供的屬性偏好權重w=[w1,w2,…,wm]T,得到加權規范化決策矩陣C=[cij]n×m,其中 ⑤ 計算候選商家與正理想解C+、負理想解C-之間的歐式距離,商家Ai到C+的距離為 ⑥ 計算商家Ai的相對距離Di,也稱為貼近度,如下式所示: Di值越大,表明Ai與C-距離越遠,與C+距離越近,Ai的評價越好。 通過上述過程可以獲得各商家的貼近度Di(i=1,2,…,n),貼近度反映了屬性偏好權重下,消費者在線評論對選擇商家的支持程度。 (3) 方面評分與評論數量。消費者在平臺編輯評論時,也會提供對商家各方面屬性的星評,通過獲取每條評論下的各方面評分,可計算方面加權評分。根據已有研究,消費者對商家近期的評論數量對當前決策更具參考作用,從側面反映了商家的受歡迎程度,評論越多,商家越受歡迎,潛在消費者的消費意愿越高[3]。本文構建了人氣值來度量一定時間段內的評論數量,如下式所示: 式中:n為最近n條評論;Intervaln為產生這些評論的時間間隔。參考已有研究[3],取n=200。 將在線評論信息的貼近度Di、商家加權評分Si和商家人氣值populari分別經最大-最小值歸一化處理,使其在同一量綱下可比較。然后,根據消費者對不同數據的信任、偏好程度,對3類得分加權求和,得到候選商家的最終評分evali(i=1,2,…,n),如下式所示: 式中,wD、wS、wpopular分別為Di、Si、populari評分的權值。 (1) 數據獲取。為了確定情感分類模型的參數,需要有標簽數據作為訓練集。由美團點評等公司聯合主辦的“全球AI挑戰賽”公布了用于細粒度情感分析的中文在線評論數據集,該數據集由餐飲領域在線評論構成,在6大類下的20個細分類上均有標簽,類別含義如表3 所示,標簽的取值范圍為{-2,-1,0,1},其中-2、-1、0、1分別表示與該類別不相關,在該類別上情感為消極、中性和積極。 表3 數據集類別 若考慮所有細分類,則方面屬性過多,這會使消費者難以分辨屬性重要性,并且類別增多時,模型情感分類的準確性會下降[9]。若使用某個細分類作為大類代表,又會丟失其他細分類的標簽信息。因此,采用含義明確的前5個大類,將“位置”“服務”“價格”“環境”和“菜品”中的細分類標簽合并處理,處理規則如表4所示,處理后的數據分布如表5所示。 表4 合并處理規則 表5 數據分布 消費者通常先確定餐廳的地理位置和類型,再進一步通過在線評論獲取餐廳各方面的信息。訓練數據集提供了位置、服務、價格、環境和菜品5個方面,實例研究根據這5個方面展開。因此,實驗獲取數據的過程為:在大眾點評大連高新區萬達廣場商圈搜索“重慶火鍋”,有8家候選餐廳,通過Python編寫爬蟲程序獲得餐廳的消費者在線評論,以及口味、食材、環境和服務評分,由于缺少價格方面評分,故獲取餐廳的平均消費價格,并將平均消費價格經f(x)=1-x處理轉換為值,且越大越好,將其作為餐廳價格方面評分度量。 (2) 數據預處理。為了將評論轉換為可計算的數值,首先對評論分詞,使用Jieba分詞工具,并通過補充用戶自定義詞典提升分詞效果。開源預訓練詞向量可以作為詞嵌入層的初始值,加速模型訓練。使用騰訊AI Lab公開的中文詞向量[47-48]作為預訓練詞向量,該詞向量包含800余萬中文詞匯,每個詞對應一個200維的向量,在覆蓋率、新鮮度和準確性等方面均有較大提升。 情感分類模型需要屬性方面詞作為輸入,將數據集提供的類別描述信息分詞后作為種子詞,使用詞向量模型選出與種子詞語義相似度接近的詞語。方面詞根據自身語義分為一般語義方面詞和帶有情感的方面詞,如“交通、服務、價格”和“交通便利、服務貼心、價格優惠”。從相似詞中人工篩選去掉一些抽象詞語,并按相似度排序選出20個一般語義方面詞和帶有情感的方面詞,分別如表6、7所示。 表6 一般語義方面詞 表7 帶有情感的方面詞 模型訓練需要設定的超參數有:評論句長度maxlen,方面詞數量n;詞向量維度d;長短時記憶層隱層單元數量h;全連接層隨機丟棄的神經元比例dropout。本文實驗中,maxlen=200,n=20,d=200,h=100,dropout=0.3。具體原因如下: (1) 評論句長度設置過短,一些句子被截斷,后部信息丟失,設置過長則浪費計算資源。數據集平均句長為98,實驗中句長分別設置為100和200,句長為200時模型效果更佳。 (2) 方面詞數量是在方面詞選擇過程中確定的,實驗中各方面屬性下均選擇了20個方面詞,所以n=20。也可以選擇更多的方面詞作為信息輸入,從而提供更多的外部信息,此時代表方面詞數量的超參數也隨之增加。模型中的詞向量維度需要與使用的預訓練詞向量維度保持一致,即d=200。 (3) 方面詞LSTM 層和評論句BILSTM 層隱層單元數量h均設置為100,兩個隱層輸出維度一致有助于后續注意力計算。該超參數可適當增大或減小,隨機失活的神經元比例dropout可以在0~1的范圍內動態調整。這兩個超參數會在一定范圍內影響模型效果,但浮動不會太大。通過調參獲得最優超參數不是本文的主要目的,出于訓練成本的考慮,并未進行細致的超參數調節實驗。 使用加權查準率avgP、加權查全率avgR和加權F1值avgF1作為評價指標,在訓練集上訓練模型,在驗證集上評估模型效果。使用10個一般語義方面詞和10個帶有情感方面詞作為方面詞輸入,模型在5個屬性上的評價指標如表8所示。其中,模型在“位置”屬性上表現最好,在“菜品”屬性上表現較差,造成該結果的原因為各屬性標簽分布的差異和方面詞選擇差異,總體來看,加權F1值的均值可達0.7597。 表8 模型評價 因為方面詞選擇對模型表現有一定影響,所以需要進一步探究使用不同類型方面詞時的模型效果。使用20個一般語義方面詞(見表6)、20個帶有情感方面詞(見表7)分別進行實驗,與使用10個一般語義方面詞、10個帶有情感方面詞時的實驗結果對比,如表9所示。由表9可得不同類型方面詞對模型影響有限,使用一般語義方面詞時模型效果最好。 表9 不同類型方面詞對比實驗 為了進一步證明情感分類模型的優越性,使用基于機器學習的LR 模型、SVM 模型、隨機森林模型(Random Forest,RF)以及多層感知機模型(Multi-layer Perceptron,MLP)、BILSTM 和單注意力BILSTM 模型進行對比實驗。LR、SVM、RF 和MLP模型在參數調節后確定的最優超參數分別為:LR 模型中,正則化強度C=50.0/訓練樣本數量,訓練停止閾值tol=0.1;SVM 模型中,正則化強度C=1.0,核函數kernel=‘rbf’,核系數gamma=‘scale’,類別權重class_weight=‘balanced’,多分類模式decision_function_shape=‘ovr’;RF 模型中,樹的數量n_estimator=5 000,最大深度max_depth=50,內部節點分割最小樣本數min_samples_split=50,葉節點最小樣本數min_samples_leaf=1;MLP 模型中,隱層神經元數量hidden_layer_sizes=32,L2懲罰系數alpha=0.001,訓練停止閾值tol=0.01。BILSTM 模型和單注意力BILSTM模型中的參數與本文模型參數一致。單注意力和雙注意力BILSTM 模型分別采用3類方面詞對比,實驗結果如表10所示,表中結果為5個屬性上評價指標的平均值。 表10 不同模型對比實驗 由表10可以看出,本研究提出的模型優于LR、SVM 等傳統機器學習模型,說明當句子較長、包含的信息較復雜時,傳統模型和單一特征難以準確識別方面級情感傾向。深度學習模型中,單注意力BILSTM 模型avgF1值均高于BILSTM 模型。這說明,注意力計算有助于模型識別方面級情感。由表9、10可以看出,本研究提出的雙注意力BILSTM模型avgF1值略高于單注意力BILSTM 模型。這說明,方面詞的自注意力計算能夠在一定程度上提升模型識別方面級情感的能力。此外,由表10還可以看出,使用不同類型的方面詞對單注意力BILSTM 模型影響有限,使用一般語義方面詞時模型效果最好,這與表9的結論一致。 按照2.3節中的排序過程對候選餐廳排序,主要分為基于在線評論的貼近度計算和基于方面評分的綜合評分計算兩個過程。首先使用訓練好的模型對在線評論進行方面級情感分類,根據式(8)~(10)計算各屬性下積極、消極和中性情感的平均水平,根據式(11)~(13)計算直覺模糊值。 需要消費者提供5個屬性的偏好權重,即位置、服務、價格、環境和口味,首先在屬性權重w={位置:0.2,服務:0.2,價格:0.2,環境:0.2,口味:0.2}情況下對候選餐廳排序,分別應用式(21)~(24)的得分函數,S4中取α=0.5,排序結果均為:res1?res2?res3?res4?res5?res6?res7?res8,說明模型在使用不同的得分函數時也具有穩健性。 進一步研究3類信息融合對排序結果的影響。式(31)中,當wD=0.5,wS=0.5,wpopular=0時,排序結果為Rank;當wD=0.4,wS=0.4,wpopular=0.2時,排序結果為Rankpop。兩種排序結果分別與大眾點評提供的好評排序 RankDZ-good、人氣排序RankDZ-pop以及美團網提供的好評排序RankMT-good進行對比,使用集合交集法[49]對排序結果進行驗證,該方法通過計算不同深度的排序重疊率,比較兩個排序列表的平均重疊分數。具體而言,以平臺提供的餐廳排序結果(好評排序結果或人氣排序結果)為基準,計算本文餐廳排序結果與其平均重疊分數,該值越大,說明與平臺既有排序結果更為一致,如圖3所示。 由圖3可以看出,不考慮屬性差異時,本文排序結果與平臺好評排序(RankDZ-good和RankMT-good)的平均重疊分數較高(均在0.9左右);當加入人氣值時,與平臺人氣排序(RankDZ-pop)的平均重疊分數有所上升(0.65~0.69)。這說明,本文排序能有效地反映消費者評價信息,人氣值也能反映餐廳近期受歡迎程度。此外,當本文模型加入人氣值時,其結果與平臺好評排序結果的平均重疊分數略有下降(即0.88~0.76、0.9~0.86)。這說明,考慮人氣值后的排序結果會與平臺提供的餐廳排序結果有較大不同,同時表明了考慮人氣值的必要性。 若消費者在工作日午餐、朋友聚會情境下,提供的屬性權重分別為:w1={位置:0,服務:0,價格:0.6,環境:0,口味:0.4},w2={位置:0,服務:0.4,價格:0,環境:0.3,口味:0.3},即在工作日午餐時最看重價格和口味,在朋友聚會時更看重服務和環境。不同權重下排序結果如表11所示。由表11可以看出,排序結果與不考慮屬性差異時相比(w={位置:0.2,服務:0.2,價格:0.2,環境:0.2,口味:0.2})體現出多樣性和差異性,說明排序方法能夠根據消費者的屬性偏好提供不同的選擇。 表11 不同屬性權重下的餐廳排序 本文提出了一種應用多種口碑信息、考慮消費者屬性偏好的商家排序方法。基于所提出模型以及實例研究中的分析結果,可以從中提煉出如下現實層面的管理啟示: (1) 在消費者層面,本文構建的商家排序方法考慮了不同消費者的個人偏好,排序結果能夠很好地反映這種偏好差異性,進而輔助消費者提高決策效率。例如,在餐廳排序實例中,3.4節設置了“工作日午餐”和“朋友聚會”兩種不同的消費者偏好情境,表11的結果反映了不同偏好情境下的商家排序結果。 (2) 對于平臺而言,雖然很多在線平臺均提供了產品的排序功能(例如美團、大眾點評),但主要是單因素的排序(例如位置或價格)。而在現實中,消費者往往習慣于綜合考慮多個因素進行評估。就此而言,平臺可以將本文所提出的方法集成于在線平臺,為消費者提供多因素的排序功能,以全面滿足消費者需求,進而提升消費者滿意度。 (3) 本研究對于商家也具有一定的現實意義。具體而言,研究方法和結果也可以幫助商家了解其在市場中的競爭位置,以及其他具有相似消費群體的競爭商家。通過對排名更高的競爭商家進行分析,商家可以了解自身短板并及時采取改進措施,最終增強其市場競爭力。 盡管本文的研究數據來自美團和大眾點評平臺,但本文所提出的排序方法也適用于其他類似在線平臺,例如淘寶、京東等平臺商家在線數據的分析。 在O2O 消費模式快速發展的環境下,為了提升消費者在線商家選擇的體驗和決策效率,本文提出一種應用多種在線口碑、同時考慮消費者屬性偏好的商家排序方法。首先,通過雙注意力BILSTM 方面級情感分類模型識別在線評論對各商家屬性的情感態度。然后,基于評論情感值和模型有限準確率確定直覺模糊值,從而獲得對消費決策呈支持、反對和中立態度的度量。根據消費者在不同情境下的屬性偏好,應用直覺模糊TOPSIS方法計算各商家貼近度,并計算各方面加權評分和近期人氣值。最后,綜合三者確定商家排序。 雙注意力BILSTM 模型能夠通過BILSTM 學習評論的上下文依賴關系,通過自注意力層學習方面詞中的重要信息,通過方面詞與上下文注意力層學習評論在商家屬性上的情感態度。對比實驗中,本文模型在識別長文本的方面級情感中體現出優越性。根據評論情感確定商家直覺模糊值時,既考慮了對消費決策的支持、反對和中立態度,也考慮了模型有限準確率帶來的不確定性,從而減少信息轉換中的丟失與曲解。在實例分析中,應用本文排序方法對大眾點評8家商家排序,排序結果與平臺提供的好評排序平均重疊分數較高,并且能夠根據消費者屬性偏好提供不同的排序參考,體現出方法的可靠性與個性化排序能力。 本文提出的方面級情感分類模型具有較好的結構和學習能力,提出的排序方法為解決基于在線口碑的商家排序問題提供了新的方法和思路。本文研究方法和結果改進了在線評論挖掘方法,對提升O2O 模式下消費者的體驗和決策效率也具有重要意義。此外,本文方法對在線商家的系統管理具有一定實際意義,可以幫助商家從消費者評論中發現商家經營的優勢與不足,有助于量化服務質量并進一步提升商家競爭力。 附錄 直覺模糊值性質證明 正文2.3節中式(11)~(13)得到的直覺模糊值xij=(μij,γij)具有如下性質。 性質1xij=(μij,γij)滿足隸屬度、非隸屬度和猶豫度的基本條件,即μij,γij∈[0,1]且μij+γij∈[0,1]。 性質3當代表模型加權F1值的ηj增大時,即模型效果更好時,代表決策不確定程度的πij減小;當α增大時,即考慮模型準確性的程度更大時,其對決策過程帶來的不確定性影響增大,代表決策不確定程度的πij增大。3 實例分析
3.1 數據準備





3.2 情感分類模型參數設置
3.3 情感分類模型效果評價



3.4 排序結果分析

4 管理啟示
5 結語