劉 巖 張艷榮 趙志杰 閆曉彤 張佳琳
(哈爾濱商業大學計算機與信息工程學院 黑龍江 哈爾濱 150028) (哈爾濱商業大學黑龍江省電子商務與信息處理重點實驗室 黑龍江 哈爾濱 150028)
哈爾濱作為我國冬季旅游熱門城市,擁有豐富的冰雪旅游資源。據哈爾濱市文廣旅游局統計自2019年1月1日開始的冰上冰雪嘉年華活動,歷時48天,累計接待游客210余萬人次,哈市旅游市場增長態勢穩定,酒店住宿業蓬勃發展。伴隨消費升級和購買行為習慣的改變,越來越多的用戶在網上發表評論表達自己對于酒店的觀點看法。2018年4月11日發布的《2018年中國住宿業市場網絡口碑報告》指出,2017年國內外主流點評網站共產生評論超3 600萬條,日均接近10萬條,分析觀點多達1.3億個[1]。這些由網絡消費者產生的酒店評論很大程度上反映實際需求或希望被滿足的程度,可能包含對硬件或服務性能,以及酒店硬件設施或服務本身的評價,也是其他顧客獲取入住酒店信息的主要參考意見來源。顧客對酒店的滿意程度會影響到其他潛在顧客對酒店的整體認知,進而影響酒店在市場中的競爭力。由此可見,研究消費者的滿意度對如今酒店業的經濟環境而言意義深遠。
本文以“2019哈爾濱冰上冰雪嘉年華”期間產生的酒店評論數據為例,運用情感分析技術結合文本挖掘、機器學習算法對酒店評論文本信息進行分析處理。通過對酒店顧客滿意度影響因素的提取以及情感得分的計算,構建基于情感分析的酒店顧客滿意度評估模型。全面探知顧客特征關注偏好和特征情感對酒店顧客滿意度的影響,有助于哈爾濱市酒店經營者了解顧客在冰上冰雪嘉年華期間的消費行為、感知價值,有針對性地提升自身服務水平、改進和創新經營模式,提高顧客的滿意度和忠誠度,提升酒店品牌形象,保持強勁的市場競爭力。
顧客滿意(Customer Satisfaction,CS)的早期研究可追溯到20世紀30年代在社會和實驗心理學領域對滿意理論的研究探索。1985年,美國消費心理學家首次提出顧客滿意度理論,其后在發達國家得到迅速廣泛的傳播和運用。1994年,Fornell等提出構建美國顧客滿意度指數(the American Customer Satisfaction Index,ACSI)模型,該體系在綜合產品消費預期、產品質量感知績效、產品的實際價值和價格等多種因素的基礎上將感知價值作為潛變量,將價格信息引入,使得不同行業、企業、部門的顧客滿意度可比。歐洲的顧客滿意指數模型延續了ACSI基本架構,不同之處在于將質量感知細分為產品質量感知與服務質量感知,增加了形象變量,并剔除了抱怨變量。
相較于歐美國家成熟的研究體系,我國在顧客滿意研究方面具有起步晚、發展快的特點。隨著市場化改革的深入及行業競爭的加劇,我國企業也逐漸意識到保持顧客、留住顧客的重要性。清華大學趙平教授于1995年將顧客滿意度的概念引進,2000年國家質量監督檢驗檢疫總局提出中國顧客滿意指數模型。2015年正式實施國家級的顧客滿意度指數(China Customer Satisfaction Index,CCSI),并每年向全社會發布最新調查結果。我國各行業都在努力構建適合自身的滿意度指數模型,在對移動互聯網背景下經濟型酒店顧客滿意度進行探究測評時,文獻[2]從影響經濟型酒店客戶滿意度的相關因素出發,在概括的問卷中設置了經濟型酒店的品牌形象、產品的預期質量、事先感知到的質量、感知到的具體價值、顧客的滿意程度及顧客的忠誠等6個主要評價指標。
酒店顧客滿意度研究長期以來都是酒店研究領域的重要議題。對于酒店顧客滿意度的研究,多數學者都是通過調查問卷獲得其研究數據,對于數據的處理大多采用統計分析的方法。傳統的酒店顧客滿意度研究方法主要包括雙因素理論、美國顧客滿意指標(ACSI)、多元回歸分析等。文獻[3]以歐洲47個首都城市的6 768家酒店為樣本,采用線性混合模型技術分析發現酒店星級是影響顧客體驗的最重要因素。文獻[4]通過因子分析認為影響高星級酒店顧客滿意度的因素主要體現在酒店軟硬環境、酒店員工素質及表現、酒店服務種類等方面。文獻[5]通過分析酒店線上預訂系統顧客滿意度的影響因素,用問卷調查的方式進行實證研究,發現酒店預訂系統網站設計、網站信息質量、網絡支付、網站營銷活動以及網站服務質量對顧客滿意度有顯著的正向影響。
除傳統統計方法,大數據環境下顧客通過自身感受寫下正面/負面情緒的評論文字分享給其他消費者,對其他消費者的消費傾向造成影響。這一現象的出現推動了基于文本挖掘的研究。文獻[6]通過對33家在社交網站Yelp上注冊的拉斯維加斯酒店的47 172條評論進行實證分析,構造幫助酒店管理者了解客人滿意度的模型,并在員工經驗、專業度等方面提出改善酒店服務的建議。文獻[7]收集全球80個主要urbar旅游目的地13 410家酒店160多萬份客戶評論,通過多層次分析發現商務入住顧客對酒店服務的總體滿意度明顯低于休閑入住顧客。文獻[8]以tripadvisor網站上的127 629條酒店評論為樣本,利用在線文本評論的技術屬性和顧客在評論社區的參與度預測總體客戶滿意度。研究發現較高的主觀性和可讀性以及較長的文本評論時間會導致較低的總體客戶滿意度,顧客評論參與度對他們的整體滿意度有正向影響。
文本情感分析是近年來NLP研究領域中十分重要的課題,是對人們表達的帶有情感傾向的評論、觀點以及情緒等文本進行分析和處理,并對整理后的信息進行進一步歸納和推理的過程,也被稱作意見挖掘。國外文本情感分析的研究起步比較早,并且取得了一定研究成果。文獻[9]通過對網絡數據進行情感分析,幫助商家識別購物者每個階段的痛點和消費情緒。文獻[10]通過對Airbnb用戶的評論進行文本挖掘和情緒分析,發現影響用戶體驗的三個關鍵因子包括“位置”、“設施”和“房主”,而負面情緒主要由“噪音”引起。此外,國內學者也豐富了情感分析領域的研究[11]。文獻[12]對景點評論從旅游形象和情感分析等角度入手挖掘有價值信息,分析結果能直觀顯示游客關注點和總體情感傾向,為景點其他潛在游客節省大量選擇旅游目的地的決策時間。文獻[13]針對美團外賣平臺,通過進行情緒值分類和檢驗評論數據的情感傾向和打分評價的相關性,具體分析評價消極情緒在不同等級城市中差異性以及部分門店消極情緒較高的原因,對商家消費者和平臺提出合理建議。文獻[14]利用LDA模型和文本情感分析相結合進行模糊綜合評價的方法研究用戶滿意度,以幫助企業低成本和高效地獲取目標消費群體反饋信息。
據第三方移動互聯網大數據監測平臺Trustdata所發布的《2018年Q2中國在線酒店預訂行業發展分析報告》顯示,美團酒店、攜程、去哪兒、同程藝龍、飛豬五大酒店預訂平臺在線酒店預訂市場份額(訂單量)合計占2018年第二季度中國在線酒店預訂行業的96.4%。平臺月活躍用戶相比2018年一季度增長了約20%,行業主導地位越來越明顯,因此本文就這五大平臺進行調研,將本文的評價體系與之對比,發現目前幾大主流酒店預訂平臺評價體系雖然較為完善但仍存在一定缺陷。(1) 評價指標方面。幾大主流預訂平臺關注點略有不同,但都主要從位置、設施、服務、衛生、性價比五個具體方面進行評分。而本文在顧客滿意度理論的基礎上結合機器學習、自然語言處理技術將評價指標分成兩個等級,除了對價格、交通區位、服務、衛生、設備設施、餐飲等一級指標進行評分外,還對每個一級指標下的二級指標進行細化打分,指標設置更加全面、細致。(2) 評估方法上。幾大主流預訂平臺的評分展示主要依據用戶的星級評分進行處理計算獲得,為數值型定量打分,不能全面體現用戶評論文本所包含的特征維度及情感傾向,而本文的評分主要依據用戶的實際評論內容,對其進行文本挖掘及情感傾向性分析處理,評分結果更具科學性。
綜上所述,目前國內對于酒店的文本評論處理方法還有待精進,大多數學者只關注用戶的詞頻數據并沒有從用戶生成的文本內容挖掘其情感。少數學者利用了情感分析技術,但結果更多的是對酒店整體滿意度的衡量,并未給出直觀的衡量酒店滿意度結果,也未給出就某一特征的酒店滿意度的情感傾向。本文將文本挖掘技術結合情感分析技術對酒店滿意度的影響因素進行量化打分,構建基于情感分析的酒店顧客滿意度評估模型,客觀得出用戶滿意度評分。該評估體系較目前主流酒店預訂平臺僅在綜合評分處展示用戶評價星級評分,或僅在細分領域展示含有某一關鍵詞評論的個數,考慮到顧客在評論中所表現出的情感偏好,并對具體細分特征給出滿意度評分,極大地完善了原有評價體系,增強了客觀性和可讀性。
本文的研究包括文本數據的采集及預處理、TF-IDF、Word2Vec、K-means、基于監督學習的特征分類算法、情感分析及多元線性回歸,最后,結合顧客滿意度相關理論構建基于情感分析的酒店顧客滿意度評估模型,得到酒店顧客滿意度的整體得分和各影響因素的個體得分。通過得分能夠清晰地分析出顧客對酒店的特征關注偏好及其特征情感對酒店滿意度的影響,從而幫助酒店經營者調整其酒店的經營模式,為顧客提供更好的服務。本文的研究框架如圖1所示。

圖1 基于情感分析的酒店顧客滿意度評估
本文以酒店評論為研究對象,在模型構建時主要利用中科院譚松波教授公布的10 000篇酒店評論語料作為數據集,整理語料庫,將其中8 000條評論作為訓練集、2 000條評論作為測試集。為保證數據的有效性,首先對數據進行清洗工作,去除文本中的無效評論;然后對清洗后的數據利用jieba分詞工具進行分詞,在分詞的過程中加載停用詞表,停用詞表選用的是哈工大的停用詞表,并在停用詞表中加入如“酒店”、“賓館”、“萬達”、“香格里拉”等詞匯進行停用詞的過濾;最后加載過濾函數,過濾評論中的英文單詞、數字及字數少于2的詞匯獲得初步數據處理結果。
1) 利用TF-IDF算法結合酒店顧客滿意度相關理論獲得酒店顧客滿意度二級影響因素。TF-IDF是一種基于統計的計算方法,常用來評估在一個文檔中一個詞對某份文檔的重要程度,這種作用顯然很符合關鍵詞提取的需求,一個詞對文檔越重要,那就越可能是文檔的關鍵詞。TF-IDF算法的計算公式如下:
(1)
式中:nij表示詞i在文檔j中的出現頻次;|D|為文檔集中文檔總數;|Di|為文檔集中出現詞i的文檔數量,分母加1是采用了拉普拉斯平滑,避免有部分新的詞沒有在語料庫中出現過而導致分母為零的情況出現,增強算法的健壯性。
根據2.1節的處理,已經獲得了文本預處理后的結果,為獲取每一個詞的TF-IDF值,首先需要對已有的語料數據進行訓練,本文選用的是中科院譚松波教授公布的10 000篇酒店評論語料,然后加載TF-IDF算法對本文的語料數據進行訓練。在訓練的過程中采用詞性過濾的方法僅保留名詞作為關鍵詞,結合酒店顧客滿意度相關理論和研究,提取TF-IDF值靠前的50個名詞作為酒店顧客滿意度的二級影響因素,實驗結果以前10個結果為例,如表1所示。

表1 TF-IDF算法提取關鍵詞結果
2) 利用Word2Vec工具對二級顧客滿意度影響因素詞匯進行向量化處理。Word2Vec模型可以很好地利用詞上下文信息和句子的內部結構信息,基于神經網絡模型將詞映射成一個低維、稠密的實數向量。因此為得到某一領域的某個詞的詞向量,首先要對該領域的語料庫進行預處理,然后利用gensim模塊的API接口加載Word2Vec訓練詞向量模型,得到每一個詞的詞向量,最后從中抽取上一步得到的50個特征詞匯的向量化表示。
3) 計算詞向量之間的歐幾里得距離,采用K-means聚類算法獲取詞向量的聚類結果,并采用輪廓系數(Silhouette Coefficient)考察簇的分離情況及簇的緊湊情況以評估聚類質量。不斷調整K值進行重復實驗,發現K=7時,其輪廓系數達到最大值0.722,表明此時的K值最優。繪制聚類結果如圖2所示,其中,質心已用序號進行了標識,分配到同一質心附近的點簇歸為同一類一級影響因素,橫縱坐標的值表示由二級影響因素詞向量值所確定的邊界范圍,是無量綱的。

圖2 K-means聚類結果圖
通過文本聚類分析結果,并結合顧客滿意度相關理論及研究,將酒店顧客滿意度影響因素分為7類,分別是價格、交通區位、服務、衛生、設備設施、餐飲以及總體感受,一級影響因素下又分為50個二級影響因素,具體結果如表2所示。

表2 酒店顧客滿意度影響因素
1) 由于數據集中的每條評論可能包含不止一個影響因素,可能既包含服務又包含衛生,因此需要先把每條評論分成多個短句的形式方便后續處理。本文采用武漢大學開發的ROST ContentMining軟件中的文本一般性處理進行文本短句的劃分,然后去除一些不包含特征詞匯的短句。
例如劃分前評論:位置不錯,距離索菲亞教堂很近,離中央大街有一小段距離,步行即可到達,可以行李寄存,客房面積小了點。不配備香皂和面巾,香皂需要向樓層服務員索要,而且洗澡水不熱,放了很長一段時間也只是溫的,房間隔音效果很差。酒店的早餐很一般,不值15元一位,不過中晚餐還不錯,量大味道也還好,而且可以送餐。
拆分后:位置不錯/距離索菲亞教堂很近/離中央大街有一小段距離/步行即可到達/可以行李寄存/客房面積小了點/不配備香皂和面巾/香皂需要向樓層服務員索要/而且洗澡水不熱/放了很長一段時間也只是溫的/房間隔音效果很差/酒店的早餐很一般/不值15元一位/不過中晚餐還不錯/量大味道也還好/而且可以送餐。
2) 目前常用的分類方法包括邏輯回歸、SVM以及樸素貝葉斯算法。為進一步驗證本文適合哪種分類器,故對常用的三種分類器進行驗證測試。首先將訓練集和測試集按照2.2節得到的二級影響因素進行人工標記分類,以.txt的文本形式分別存到對應的類別特征文件夾下。然后分別對訓練集和測試集進行文本的預處理操作(同2.1節),預處理后的數據也存到對應的文件夾中。引入Scikit-Learn庫中的Bunch數據結構訓練并存儲訓練集和測試集的詞向量空間。使用TF-IDF發現特征詞,分別構建訓練集和測試集的詞袋模型來反映文檔主題的特征。然后利用三種算法對生成的詞袋模型進行訓練,實驗結果如表3所示。由于樸素貝葉斯算法對本文實驗而言精度較高,因此,采用樸素貝葉斯分類器對本文的數據集進行分類。

表3 文本分類結果
3) 利用百度AI開放平臺的自然語言處理模塊進行情感得分的計算。該平臺的情感傾向性分析是基于大數據和深度學習訓練,自動學習深層次的語義及語序特征,具備較強的泛化能力,情感傾向性分析精度高,在相對長的句子上仍然能夠保持較好的效果并且在多個垂類上(汽車、餐飲、酒店等)情感傾向性分析準確率達到95%以上,已應用于實際產品中。因此本文調用平臺的情感傾向性分析API,進行情感極性值的計算,上文評論示例計算處理結果如表4所示。

表4 情感傾向性分析示例
其中:positive_prob表示屬于積極類別的概率;negative_prob表示屬于消極類別的概率;confidence表示分類的置信度;sentiment表示情感極性分類結果,有負向-0、中性-1、正向-2三種取值。
綜合以上結果并結合顧客滿意度相關理論及研究,確定評價指標體系后,對指標進行整理分析。二級影響因素的得分以情感極性值為基礎確定,兩級影響因素的權重采用預處理中TF-IDF算法得到的結果作為基礎進行計算。
1) 情感得分按照5分制的評價標準,sj為第j個二級影響因素的情感得分,如下所示:
(2)

2)ωij為第i個一級影響因素下第j個二級影響因素測評指標的權重,如下所示。
(3)

3)ωi為一級顧客滿意度影響因素中第i個測評指標的權重,如下所示:
(4)

最終,構建基于情感分析的酒店滿意度評估模型,用于計算酒店整體的滿意度得分,如下所示:
(5)
本文利用八爪魚網絡爬蟲工具爬取攜程網上“2019哈爾濱冰上冰雪嘉年華”(2018年12月1日-2019年2月1日)期間哈爾濱中央大街步行街/松花江畔區域754家酒店的評論數據共8 124條,作為研究文本,評論格式如圖3所示。

圖3 攜程網評論示例
根據第2節構建的基于情感分析的酒店顧客滿意度評估模型,得到酒店顧客滿意度的整體得分和各影響因素的個體得分,如表5所示。

表5 各影響因素權值及情感得分

續表5
分析實驗結果可得,顧客該段時間入住酒店的整體滿意度分值為4.774分,表明顧客對哈爾濱市酒店服務質量滿意度較高,但仍存在很大提升空間,酒店管理者應提供良好的硬件設施并改善服務質量以減少顧客不滿。對各級影響因素進行具體維度的分析,權重的大小代表了顧客對該影響因素的特征偏好程度,即酒店經營者應該給予關注度的大小。一級影響因素顧客特征偏好程度由大到小依次為總體感受、交通區位、價格、設施設備、服務、餐飲及衛生狀況。具體得分如圖4所示。

圖4 一級影響因素滿意度得分
就二級影響因素某一細分特征的滿意度得分顯示,噪音、異味、被子、早餐品種、隔音以及服務問題帶來的顧客體驗較差。有針對性地改善酒店存在的問題能幫助經營者以較小投入獲得更高的顧客滿意度,具體得分如圖5所示。

圖5 二級影響因素滿意度得分
本文對實驗結果進一步分析并針對具體應用提出合理化建議:酒店除了要注重顧客總體感受、改善員工服務、提升酒店軟硬實力外,應格外注意衛生及噪音問題。做好改善隔音、無線網不穩定問題、檢查更換客房通風換氣系統、建立標準嚴格的清潔流程、對室內空調 等設備進行定期維護等工作。
本文采用文本挖掘技術結合情感分析技術對提取的酒店滿意度的影響因素進行量化打分,構建基于情感分析的酒店顧客滿意度評估模型,客觀得出用戶滿意度評分,彌補大多數酒店預訂平臺和其他學者進行酒店顧客滿意度研究時未能準確反映消費者真實體驗的不足。研究結果表明:酒店商家及個人都可以根據本文構建的滿意度模型對想要了解的酒店進行綜合性和細致化評估,從而有效分析出顧客的滿意度和不同維度的情感傾向,幫助商家有針對性改進服務改善設施,提升酒店競爭力,幫助消費者更客觀地了解酒店的產品及服務,做出合理決策。在今后研究中會考慮對酒店檔次進行分類,有文獻表明入住不同檔次酒店消費者最為關注的特征不盡相同。改進后可以更好地細分市場,幫助酒店經營者調整其酒店的經營模式,為不同需求顧客提供好的服務,提升顧客滿意度。