郭億琦,張星海,趙志杰,趙全盛
(哈爾濱商業大學a.計算機與信息工程學院;b.黑龍江省電子商務與信息處理重點實驗室,哈爾濱 150028)
目前酒店行業競爭非常激烈,要想在其中脫穎而出,則需要重視顧客滿意度。顧客滿意度是評估酒店績效的重要“晴雨表”,因此深入了解顧客在住宿過程中的感受對酒店管理至關重要。隨著信息技術的快速發展,在線預訂和評論越來越受顧客的歡迎。許多顧客在網上預訂酒店,在入住后以圖片、文本和評級的形式發布評論,向商家做出此次體驗滿意程度的反饋。挖掘在線評論中蘊含的信息,從而為顧客提供個性化的服務會對酒店總體評價和形象造成的重要影響。先前的研究已經發現在線評論文本的情感和顧客滿意度評級高度相關。然而,在線評論的其他表達形式,如圖片的數量、評論文本長度、圖片和文本之間的相似度與顧客滿意度評級之間的關系尚不明確。本研究通過分析在線評論內容的文本長度、上傳的圖片數量以及圖片和文本間的相似性三個維度與顧客滿意度評級的關系,來了解顧客對酒店住宿體驗的總體評價,幫助酒店商家和在線預定平臺從在線評論中獲得顧客體驗的描述和其他信息,以此更好設計評論系統,激勵顧客撰寫高質量的評論,使商家根據顧客的在線評論內容和滿意度評級來改進產品和服務。
在線評論是發生在消費行為之后的體驗反饋,以文本或圖片的形式存在并對企業口碑產生影響,是潛在消費者消費決策的重要參考信息,也是企業對未來發展的考量信息。徐虹(2016)通過研究攜程網中的游客對真實體驗的在線評論,來剖析什么是卓越的顧客體驗這一概念。該學者在第二年提出游客體驗質量可以正向影響游客的行為意志。該研究有助于旅游地管理者改善服務滿足不同游客群體的體驗需求。
顧客滿意的早期研究可追溯到20 世紀30 年代在社會和實驗心理學領域對滿意理論的研究探索。1985年,美國消費心理學家首次提出顧客滿意度理論,其后在發達國家得到迅速廣泛的傳播和運用。相較于歐美國家成熟的研究體系,我國在顧客滿意研究方面具有起步晚、發展快的特點。隨著市場化改革的深入及行業競爭的加劇,我國企業也逐漸意識到保持顧客、留住顧客的重要性。根據Oliver(1980)的研究認為,顧客滿意指的是一種態度,是客戶根據他們對產品或服務的期望以及他們對實際收到的產品或服務的感覺而形成的評價。
許多關鍵因素導致顧客滿意。Gu and Ryan(2008)發現了對顧客整體滿意度有積極影響的七個因素:床的舒適度、浴室設施的清潔度、房間的大小和設施的狀況、位置和可及性、食物和飲料的質量、輔助服務和員工表現。同樣的,Ren et al.(2016)將顧客滿意度的來源歸納為四個維度:有形及感官體驗、員工績效、美感和位置。除了酒店提供的核心屬性和服務之外,一些附帶的行為也可能導致客戶滿意,包括企業社會責任實踐和可持續實踐。
與文字評論相比,發布帶有圖片的評論需要顧客的操作步驟更加復雜,顧客需要付出更多的時間和精力。憑借在線評論中上傳的圖片內容,使潛在消費者對酒店設施有更真實的了解,提高評論信息的傳遞效果。同時,顧客發布的圖片評論內容是利用移動設備及時拍攝的,反映的商品或服務較真實。上傳較多圖片的顧客有更多的經驗,對酒店實際情況有更強的客觀性。因此,提出以下假設:
H1:在線評論中上傳圖片數量對顧客滿意度有正向影響。
與對酒店產品和服務的積極方面的描述相比,顧客傾向于發表較長的文本,對其消極方面進行更詳細的描述。評論文本越長,表明顧客在評論產品和服務時投入的精力越多。這通常發生在他們經歷負面消費情緒時。當消費者遇到產品和服務的缺點時,他們會使用更多的詞語來表達他們的沮喪、憤怒和沮喪。因此,提出以下假設:
H2:在線評論中評論文本長度對顧客滿意度有負面影響。
圖片作為酒店產品和服務的模擬物,真實呈現了酒店產品和服務的情況,說明顧客對圖片的感知分析與真實產品的感知分析相似。文本能夠準確描述酒店產品和服務的真實體驗,表達對酒店入住的總體感受,當二者在內容上呈現相似時,會使二者的積極情感作用都得到增強。因此,提出以下假設:
H3:在線評論中圖片和文本相似度對顧客滿意度有正面影響。
旅行電子商務發展至今,可提供網絡評論數據的專業網站數不勝數。從競爭格局來看,在線旅游市場呈現“一超多強”格局。2020 年攜程在線旅游(OTA)市場份額達40.7%,排名榜首,遙遙領先主要競爭對手。攜程作為全球三大在線旅游平臺之一,業務恢復率也顯著快于Booking 及Expedia。此外,去哪兒旅行、美團及同程旅行穩居第二梯隊,競爭力較強。從在線旅游(OTA)整體來看,攜程旅行占據主導地位。對于五星級和四星級這類高端酒店的客戶群體來說,他們對酒店的基礎設施有一定的信任度,因此對評論中有關夸贊酒店的評論對消費者的價值不會很大。相反,對于三星級以下中低端酒店的客戶群體,由于希望通過瀏覽在線評論來更多地了解該酒店體驗,因此會對評論內容更加敏感。基于此,本文選取攜程網上北京地區的三星級酒店為例,酒店的價格處在150—200 元之間,屬于中間水平。在確定研究樣本后,本研究使用Python 工具爬取酒店在線評論數據,包括在線評論文本、圖片以及每個顧客的滿意度評分。通過刪除重復值等預處理操作,共得到樣本數據4 086 條。
本文利用機器學習算法編寫程序對在線評論上傳圖片顏色、紋理和形狀視覺特征進行提取。單一的圖片基礎特征有時候并不能反映圖片的真實面貌,因為關注一種圖片信息的同時有可能會忽略其他信息,所以,從顏色、紋理和形狀三個維度出發,通過信息的互補效應,可以全面充分展示在下評論圖片中的酒店產品和服務信息。最終提取的圖片特征包括:顏色直方圖1×256維,HOG 1×144 維,LBP 1×256 維,融合得到 656 維的特征矩陣。
潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)由 Blei,David M.、Ng,Andrew Y.、Jordan(2003)提出,用來推測文本的主題分布。它可以將每條在線評論文本的主題以概率分布的形式給出,從而通過算法抽取出它們的主題分布,之后便可以根據主題分布進行主題聚類或分類。LDA 通過詞匯的概率分布來反映主題。對于在線評論文本語料庫按照LDA 模型原理提取文字主題特征。
基于圖片和文本對酒店產品和服務的特征矩陣,本文通過計算兩個特征矩陣之間的歐式距離來度量圖片和文本的相似度。歐式距離是最常見的距離度量,衡量的是多維空間中兩個點之間的絕對距離。即m 維空間中兩個點之間的真實距離,或者該點到原點的距離。在二維和三維空間中的歐式距離就是兩點之間的實際距離。具體如公式1 所示。

本文以在線評論的上傳圖片數量、評論文本長度、圖片和文本相似度作為自變量,以顧客滿意度評分(1—5 分)作為因變量,構建多元線性回歸模型。回歸分析是對變量間的線性關系進行分析。本文將使用SPSS23 軟件對各變量進行回歸分析,檢驗假設H1,假設H2,假設H3,以探究在線評論內容維度與顧客滿意度之間的關系。多元線性回歸分析結果如表1 所示。

表1 回歸分析
分析結果顯示,在線評論圖片和文本相似度的顯著性為0.03,上傳圖片數量的顯著性為0.00,評論文本長度的顯著性為0.00,表明3 個自變量均與顧客滿意度存在顯著相關性。其中評論文本長度的系數為負值,說明評論文本長度與顧客滿意度呈負相關,假設H1、假設H2、假設H3 均得到支持。VIF 均小于10,說明3 個自變量之間不存在多重共線性問題。因此,可以得出3 個自變量對顧客滿意度的回歸方程為:
總體滿意度=0.048×圖文相似度-0.02×評論文本長度+0.045×圖片數量
1.酒店和在線預定平臺對顧客發布在線評論時上傳圖片采取激勵措施。根據研究結果,在線評論的上傳圖片數量對顧客滿意度存在正向影響。這啟示商家應該充分重視圖片評論的重要性,為激勵顧客多上傳圖片而采取強有力的措施;并優化顧客發布帶有圖片的評論機制,簡化步驟,為顧客便捷地發布圖片評論創造條件,如在酒店網站或在線平臺上開辟專門用于顧客發布圖片評論的網絡空間、簡化在線評論的圖片編輯上傳界面、對上傳多張真實的酒店圖片給予發放優惠券等獎勵。
2.對顧客發布圖文結合的在線評論內容進行合理排版,鼓勵顧客發布圖文結合的在線評論內容,爭取在有限的評論空間內充分展示酒店產品和服務,從而更好為消費者了解產品信息提供參考。