劉鑫玥 邱燦華
(同濟大學(xué)經(jīng)濟與管理學(xué)院,上海 200092)
“互聯(lián)網(wǎng)+”推動傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級,掀起數(shù)字化浪潮,大量在線旅游平臺也應(yīng)運而生。越來越多的游客會撰寫評論記錄旅行體驗,表達真實想法與直觀感受。隨著在線評論影響力的增加與文本分析技術(shù)的發(fā)展,很多學(xué)者開始研究評論文本。然而,在旅游領(lǐng)域,通過文本評論追蹤游客滿意度的研究較少,并且影響游客滿意度的因素是不同的,每個方面都需要單獨考慮。已有研究大多只關(guān)注了促使游客滿意的相關(guān)因素,很少關(guān)注造成游客不滿意的因素。針對這些局限,本研究旨在利用用戶生成內(nèi)容發(fā)現(xiàn)促使游客滿意和造成游客不滿意的關(guān)鍵因素,為景區(qū)發(fā)展提供明確方向。
已有眾多研究關(guān)注影響游客滿意度的因素,亞伯拉罕·皮扎姆(Abraham Pizam)首先將顧客滿意概念應(yīng)用到旅游領(lǐng)域研究中,提出游客滿意度是游客對旅游目的地的預(yù)期和真實體驗進行比較后而產(chǎn)生的綜合評價[1]。大衛(wèi)·鮑文(David Bowen)將期望、績效、特征、情緒、公平、不一致6 個方面作為影響因素納入游客滿意度的研究[2]。索文·哈恩(Sowon Hahn)等采取實地調(diào)查方法對游客滿意度進行研究,結(jié)果表明,在旅游項目開始之前提供額外的信息可以提高游客滿意度[3]。
已有研究大多通過設(shè)置滿意度綜合評價指數(shù)檢測游客滿意度,將低得分視為不滿意,而忽略了不滿意因素,這就使得研究將導(dǎo)致游客滿意度低的因素視為不滿意影響因素。根據(jù)弗雷德里克·赫茲伯格(Fredrick Herzberg)的雙因素激勵理論[4],滿意和不滿意是兩個獨立的因素,可能同時存在于顧客體驗中。由于造成顧客滿意和不滿意的因素并不相同,分別研究造成游客滿意與不滿意的因素十分必要。目前,只有少數(shù)旅游領(lǐng)域研究分別討論滿意與不滿意因素,這一領(lǐng)域還存在很大的局限性,需要進一步研究[1]。
本文以上海市為例,根據(jù)《上海旅游資源圖志》對上海旅游資源的分類標(biāo)準(zhǔn)[5],結(jié)合景區(qū)的實際特征,將上海市景區(qū)分為5 類,并從5 個類別中選擇熱門景區(qū)進行研究(見表1)。

表1 上海市景區(qū)分類信息
本文選擇在攜程旅行網(wǎng)獲得景區(qū)評論。在2022年4 月通過八爪魚采集器,選取表1 中的25 個景區(qū)為研究對象,對其在攜程旅行網(wǎng)上的評論內(nèi)容進行爬取,最終收集24 788 條評論。使用Python 進行數(shù)據(jù)預(yù)處理。首先,過濾掉所有非中文評論,去除重復(fù)的評論文本;其次,過濾文本中出現(xiàn)的數(shù)字、標(biāo)點符號、停用詞等;最后,使用jieba 庫對文本數(shù)據(jù)進行分詞處理。
情感分析是自然語言處理領(lǐng)域的一項重要任務(wù),利用計算機程序自動分析文本內(nèi)容的情感極性,包含積極、消極與中性。情感極性可以反映顧客滿意度,本文認(rèn)為積極評論表示游客滿意,而消極評論則代表游客不滿意。使用Python 的SnowNLP 情感分析工具包對評論文本進行情感分析。在進行情感分析時,輸出的情感極性值范圍為0 ~1,取值在0.5 及以上的為積極評論,0.5 以下的為消極評論,且數(shù)值越接近1 表示評論越積極,越接近0 則越消極。為確保樣本均衡,應(yīng)使積極與消極評論數(shù)量相等。由于積極評論數(shù)量遠遠大于消極評論數(shù)量,應(yīng)先確定每個景區(qū)中的消極評論數(shù)量,之后隨機選擇該景區(qū)同等數(shù)量的積極評論。
使用LDA 主題模型進行分析時,需要確定最優(yōu)主題數(shù)量。本文選擇困惑度和一致性作為評價指標(biāo)。困惑度指標(biāo)量化了文本所屬主題的不確定程度,困惑度越低則主題數(shù)量越優(yōu)[6]。一致性指標(biāo)衡量了模型生成的每個主題所對應(yīng)的高頻率詞語在語義上的一致性,數(shù)值越高則模型效果越好[7]。使用Python的Gensim 庫得到不同主題數(shù)量的模型評價結(jié)果(見圖1)。綜合比較兩個指標(biāo),最終選擇積極評論的主題數(shù)量為15,消極評論的主題數(shù)量為12。

圖1 LDA 主題數(shù)量
使用Python 的Gensim 庫分別對積極評論與消極評論構(gòu)建主題模型,得到積極評論的15 個主題和消極評論的12 個主題分布。根據(jù)各主題的高頻率關(guān)鍵詞,以及各主題最具代表性的前15 條評論文本,采用人工方式總結(jié)各主題名稱,結(jié)果如表2 所示。

表2 主題分析結(jié)果
參照國內(nèi)外游客滿意度評價指標(biāo)研究,將得到的主題進一步分為4 類,包括旅游吸引物、景區(qū)服務(wù)與設(shè)施、景區(qū)管理和旅游體驗,具體如表3 所示。

表3 主題分類
積極評論中,游客更多評論旅游吸引物,即旅游吸引物可以帶來滿意的旅游經(jīng)歷。消極評論中游客更多提及景區(qū)服務(wù)與設(shè)施,即景區(qū)服務(wù)與設(shè)施是造成游客不滿意的主要因素。
旅游吸引物方面,上海有眾多具有人文內(nèi)涵的歷史文化景區(qū),游客能體會到傳統(tǒng)文化的魅力。此外,觀賞自然風(fēng)光也是游客主要的旅游動機。上海商業(yè)氛圍濃厚,可以滿足游客吃喝玩樂的需求。游客還提到建筑樓群。例如,上海外灘上佇立著眾多古典復(fù)興大樓,給游客帶來了獨特體驗。消極評論中,一些網(wǎng)紅景區(qū)的過度營銷造成實景與照片不符,密集的人流會導(dǎo)致游客抱怨。游客還評論到一些景區(qū)缺乏特色亮點,千篇一律的項目會造成游客不滿。
景區(qū)服務(wù)與設(shè)施方面,積極和消極評論中都包含服務(wù)態(tài)度。積極評論中,游客強調(diào)了工作人員熱情好客的服務(wù)態(tài)度;相反,消極評論中,游客抱怨工作人員服務(wù)質(zhì)量低下。此外,游客表明景區(qū)內(nèi)明顯的引導(dǎo)標(biāo)志可以減少時間浪費,增加游覽觀光的舒適度。設(shè)施方面,消極評論中尤其提到設(shè)施老舊問題,嚴(yán)重影響了參觀體驗。換票方面,游客認(rèn)為在換票時需要長時間排隊很麻煩。餐飲方面,游客抱怨景區(qū)內(nèi)餐廳味道一般而價格很高。
對于5 個不同的景區(qū)類型,本文構(gòu)建了積極評論和消極評論主題分布特征圖(見圖2 和圖3),據(jù)此得出促進游客滿意和導(dǎo)致游客不滿意影響的評論側(cè)重點有何不同。

圖2 積極評論主題分布特征
積極評論中,參觀名勝古跡的游客更多評論了歷史文化和交通便利,而較少評論價格水平與親子同樂。游覽城市觀光類景區(qū)的游客更多寫到交通便利和景區(qū)的商業(yè)化水平。在主題樂園游玩的游客更加在意體驗感和價格水平,很少關(guān)注建筑樓群。在動植物園游玩的游客更多評論了自然風(fēng)光和服務(wù)態(tài)度,很少評論歷史文化和體驗感。參觀展館展覽的游客明顯寫到了親子同樂和環(huán)境衛(wèi)生帶來的滿意經(jīng)歷。
消極評論中,參觀名勝古跡的游客較少提到設(shè)施老舊問題,更多在意景區(qū)餐飲問題。游覽城市觀光類景區(qū)的游客更多抱怨了項目排隊和網(wǎng)紅地打卡的不愉快經(jīng)歷,而很少評論景區(qū)餐飲問題。在主題樂園游玩的游客更多抱怨了工作人員的服務(wù)態(tài)度和項目關(guān)閉問題,很少關(guān)注樂園的特色亮點。在動植物園游玩的游客更多評論了意外天氣狀況帶來的遺憾經(jīng)歷,較少寫到景區(qū)氛圍相關(guān)內(nèi)容。參觀展館展覽的游客更多評論了設(shè)施老舊問題,對價格水平和景區(qū)氛圍不滿意,而很少提到項目關(guān)閉與天氣狀況。
本文基于游客評論,根據(jù)情感得分將評論劃分為積極評論與消極評論,之后運用LDA 模型挖掘游客評論中的關(guān)鍵信息,得到了積極評論的15 個主題和消極評論的12 個主題,再通過分析5 個不同類型景區(qū)的評論主題分布特征,得到了不同類型游客的側(cè)重點,為游客滿意度研究提供更全面的見解。
從文本挖掘的結(jié)果可以看出,積極評論的主題更多集中在旅游吸引物,證明旅游吸引物可以帶來滿意的旅游經(jīng)歷。消極評論的主題主要集中在景區(qū)服務(wù)與設(shè)施,可見景區(qū)服務(wù)與設(shè)施是造成游客不滿意的主要因素。因此,景區(qū)應(yīng)重視旅游吸引物建設(shè),利用景區(qū)的歷史文化內(nèi)涵、優(yōu)美的自然風(fēng)光等提升游客滿意度。同時,景區(qū)應(yīng)加強工作人員培訓(xùn),提高服務(wù)質(zhì)量,注重景區(qū)內(nèi)設(shè)施的更新維護工作,以減少造成游客不滿意的因素。