中圖分類號]F592.7 [文獻標識碼]A [文章編號]1674-3784(2025)02-0017-12
隨著自主旅游市場的不斷發展,游客逐漸成為市場的主導者。游客自的地感知形象是影響游客出行的關鍵決策變量,直接影響游客滿意度。同時,積極的游客感知形象有助于將潛在出行者轉化為現實游客,通過提供多樣化服務以滿足游客個性化需求,對于樹立目的地品牌價值,吸引游客重游或向好友推薦具有重要意義[2]。以往,旅游目的地、景區主要通過大眾媒體廣告等營銷手段塑造旅游形象,進而影響游客決策過程,如今社交網絡平臺逐漸取代了傳統營銷手段,成為游客獲取旅游信息的主要途徑[3]。越來越多的游客選擇通過在線評論表達自身看法,旅游信息不再完全由旅游景區所掌握,這給旅游營銷工作帶來了極大的挑戰。
隨著互聯網的發展,網絡信息逐漸成為游客目的地感知形象研究的重要數據來源。早期,旅游者網絡日志被應用于目的地形象研究中,Huang等通過對網絡日志的研究,認為積極的游客感知形象對游客的購買行為具有正面影響[4]。伴隨著移動端的普及和社交網絡平臺的興起,用戶劇增,產生了大量的旅游者在線評論數據[5]。與網絡日志相比,在線評論數據具有多樣性、龐雜性和時效性等特點,已成為研究者研究游客感知形象的新渠道,如孫曉東等使用攜程網在線評論數據研究中國郵輪品牌形象感知問題,驗證了使用游客在線評論數據的有效性和可靠性[。
情感分析能感知在線評論信息背后隱含的旅游者情緒,揭示游客情緒變化的影響誘因,已成為研究游客情緒的主要手段之一[7]。Li等運用雙向長短期記憶模型對酒店評論情感開展分析,研究發現酒店環境是旅客情感的主要影響因素[8;Tao等運用百度情感詞典發現攜程網和微博旅游評論情感存在平臺差異[9]。在方法上,算法的適用性與準確性是研究者關注的焦點。Liu等構建了包含旅游特定術語的英漢情感詞典以提高情感識別精準度[10];Alaei等認為增大訓練數據集規模有助于提高機器學習準確性,但會受到算法類型、語種等因素干擾[11]。在視角上,目前研究主要集中在從整體層面提取每條評論情感傾向,無法區分游客對景區不同屬性的特定情感傾向,如門票、餐飲、環境和服務等[12]。在現實場景下,整體情感傾向可能與特定屬性情感傾向不一致[13]。因此,通過識別評論中多目標情感傾向的細粒度情感分析,可以更準確地表征游客對目的地多維度情感極性,發現用戶情感誘因。
綜上,在線評論數據已被廣泛用于游客目的地感知形象研究中,情感分析是其主要研究手段。已有研究聚焦于整體情感視角,情感詞典和機器學習是其主要算法模型,前者構建具有域適應性詞典以提高情感識別準確性,后者借助大規模語料訓練以提升情感模型性能?,F實場景中,整體情感分析忽略了游客表達的多維度情感極性,而細粒度情感分析能實現游客在線評論多維度情感提取,能更精確地表征游客情感。結合在線評論數據特性,細粒度情感分析能做到更全面、更細致和更深入的情感挖掘與分析。因此,本文采用此方法,以攜程網在線旅行社游客評論作為數據來源,從游客評論行為的角度切人,通過游客在線評論實現對游客目的地感知形象的細粒度情感分析。
1數據采集與研究思路
1.1 研究對象
在線評論數據來源于社交媒體平臺、網站、論壇等允許用戶發布信息的網絡平臺,表現為用戶發表的文本、視頻、圖片、音頻等,而文本信息為其主要載體[14]。旅游網站評論數據大多是游客親身體驗后發表的看法,與其他平臺相比,具有更高的可信度。攜程網是國內最具影響力的旅游網絡平臺之一,可供游客隨時隨地獲取、分享、傳播信息,反映游客最新想法和實時動態,具有用戶群體廣、評論數量多、內容時效性高等特性,為旅游景點形象感知研究提供了良好數據基礎。上海迪士尼度假區(以下簡稱上海迪士尼)位于上海浦東新區,是中國內地第一個迪士尼度假區。根據《2021年全球主題公園及景點游客量報告》,上海迪士尼2020年接待游客量848萬人次,同比增長 54% ,位列全球第六,也升至亞太第一位。根據攜程發布的《2023年五一出游數據報告》和《2023年國慶出游數據報告》,上海迪士尼均屬于熱門旅游景點。因此,本文選取上海迪士尼作為研究對象,以攜程網站游客在線評論作為研究數據來源。
1.2 數據采集與處理
本文擬采用后羿采集器從攜程網站采集旅游評論數據,采集的數據內容包括用戶昵稱、評論內容、評論IP地址、評論時間、點贊數等字段。為減輕非結構化文本數據的復雜性,需對初步采集的數據進行數據預處理,主要包括無效數據剔除和穴余字段刪除,然后借助Jieba分詞工具進行文本分詞、停用詞刪除及詞頻統計。
1.3 研究思路
主題模型和情感分析是在線評論數據分析的主要方法,前者提取主題特征,后者識別主題情感。在主題模型中,LDA(latentDirichletallocation,潛在狄利克雷分布)模型的使用率最高,借助其實現主題特征提取是較為常用和有效的方法[15]。情感分析可分為情感詞典、機器學習和深度學習等3類方法[16],深度學習在其中占據主導地位,其預測精度整體上高于其他兩類算法「7]。因此,本文以上海迪士尼的在線評論作為研究樣本,基于預處理后的數據,借助LDA模型實現主題特征提取,構建游客對上海迪士尼的感知形象。運用深度學習LCF-ATEPC(lo-cal context focused aspect term extractionandpolarityclassification,局部上下文聚焦的方面術語提取與極性分類)模型實現細粒度情感分析,通過人工標注情感,建立情感數據庫,訓練LCF-ATEPC細粒度情感模型,同時訓練SnowNLP粗粒度情感模型作為對照,對各形象維度下的游客評論實現情感分析,統計各維度情感極性占比,探究兩類情感模型情感分析差異。最后,基于細粒度情感分析結果,利用詞云圖挖掘游客情感傾向關鍵詞,實現游客情感誘因探究。
2數據特征提取方法
2.1基于LDA模型的感知形象構建
游客感知形象的識別依賴于主題模型的挖掘結果,LDA模型是主題挖掘中最受歡迎的無監督主題模型,相較于其他無監督模型,它具有更好的操作性和語義解釋性[18]。本文擬采用LDA模型實現主題挖掘,并利用pyLDAvis實現模型結果可視化分析。作為無監督模型,LDA需要預先指定主題參數k ,參數 k 偏小會導致模型無法準確挖掘文本深層信息,偏大則可能會產生冗余主題。
“困惑度”與“一致性”是LDA模型中常用的確定主題數量的指標[19],“困惑度”代指文檔隸屬主題的不確定性,而“一致性”則代指主題可解釋度[20],但“困惑度”不關注語義信息,即無法判斷信息質量。因此本研究擬采用一致性確定主題參數k,并再次代入LDA模型測試。為確保挖掘主題質量,本研究調用pyLDAvis中的gensim包實現LDA結果可視化分析,依據可視化分析結果,建立LDA主題模型,并確立主題和主題特征詞,構建感知形象維度。
2.2 基于LCF-ATEPC細粒度情感分析
情感分析對研究游客感知形象具有重要意義[21]。現有應用于游客感知形象的情感分析主要停留在粗粒度層面,即從整體層面分析用戶情感。而細粒度情感分析能識別用戶表達的多維度情感極性,能更深人準確地挖掘用戶情感態勢。本文采用LCF-ATEPC情感模型,通過人工構建情感數據庫訓練模型,并與其他幾類情感模型進行對比,確定模型性能,在LDA模型結果基礎上,進一步分析各維度情感態勢。
LCF-ATEPC模型是一種基于多頭自注意力(multi-head self-attention,MHSA)和局部上下文焦點機制(localcontextfocus,LCF)的多任務學習模型,并集成了預訓練的BERT(bidirectional encoder representationsfromtransformers,基于變換器的雙向編碼器表示)模型。該模型結合了方面術語提取(aspecttermextraction,ATE)和方面情感極性分類(aspectpolarityclassification,APC)任務,采用兩個獨立的BERT層分別對全局上下文和局部上下文進行建模。通過特征交互學習層,實現局部上下文特征和全局上下文特征之間的交互學習,進而利用全局上下文特征提取方向詞,并預測其情感極性。借助人工構建的情感數據庫訓練,LCF-ATEPC模型能自動實現在線評論文本中方面詞提取和情感極性分類任務。
3 研究結果分析
3.1 數據預處理
3.1.1 數據采集和文本分詞
本文選擇2023年5月至2024年5月為評論采集時間,借助后羿采集器從攜程網站上采集游客評論,并通過軟件自帶數據去重功能對數據進行去重,初步采集22455條游客評論,評論內容包括評論ID、評論時間、評論文本和評論鏈接。隨后對數據進行清洗,剔除文本中的無效數據,如網絡鏈接、網絡符號等,最終保留有效數據13510條。
為進一步降低數據的非結構化特征,需對數據進行分詞和去除停用詞。Jieba分詞器是中文分詞過程常用的分詞工具,并且可加載自定義詞典對文本進行分詞和去詞。本文首先使用Jieba分詞器對采集到的文本數據進行初始分詞,并根據分詞結果,構建“不分詞”詞典,再對初始文本進行分詞,實現對初始分詞結果中的不應分詞內容進行修正。中文停用詞庫、哈工大停用詞庫、百度停用詞庫是常見的中文停用詞表,本文將上述詞庫合并構建自定義停用詞庫,借助Jieba分詞器實現停用詞去除,并構建旅游文本數據庫。
3.1.2 文本標注
從旅游文本數據庫中隨機不重復抽取2000條數據進行人工情感標注,構建旅游情感數據庫。情感標注主要是對評論文本中的方面詞標注情感極性,本文主要分為積極、消極和中性等3種極性,部分標注數據見表1。為驗證情感標注結果的可靠性,對標注結果進行一致性檢驗。隨機從已標注文本中抽取200條評論文本,邀請2位旅游領域專家參加情感標注培訓,使其在不參考原始標注結果的情況下進行獨立標注。情感標注規則和原始標注一致。最后通過計算Cohen'sKappa值來評估標注結果可靠性,計算結果中,專家A標注結果與原始標注結果的Kap-pa值為0.78,專家B標注結果與原始標注結果的Kappa值為0.80,專家A標注結果與專家B標注結果的Kappa值為0.82。檢驗結果表明標注結果具有較高的可重復性和可靠性。最后對已標注的情感數據集按照7:3的比例拆分成訓練集和測試集。

3.2 LDA主題挖掘結果
3.2.1 最佳主題參數確定
在建立LDA模型之前,需要確定最佳主題數量參數 k 。因LDA模型一次只能確定一個主題參數,故將主題數量區間設為[2,10」,并計算對應主題下一致性指標得分,然后利用Python的數據可視化包Matplotlib繪制主題數量一致性折線圖,如圖1所示。

在圖1中,一致性得分峰值對應主題數為6。因此,將 k=6 代人LDA模型運算,借助pyLDAvis中的gensim包對LDA模型進行可視化分析,見圖2。
當 k=6 時,可視化結果中各主題邊界清晰,沒有重疊,具有良好的獨立性。因此確定最佳主題參數 k=6 ,并構建LDA模型,根據模型輸出結果,確定主題特征詞,構建感知形象維度。

3.2.2 感知形象構建
從表2可知,LDA模型共確定6個主題。topicl占比 27.54% ,根據主題特征詞“排隊”“人太多”“時間”“小時”可知,景區存在排隊問題,該主題在6個主題中占比排第一,說明排隊問題受到游客的主要關注。topic2占比 17.22% ,主題特征詞“攜程”“購買”“方便”反映了游客對游覽景點配套設施服務的關注,包括購票、出票和住宿環節;其中,“方便”和“優惠”等詞說明了與其他途徑購票相比,攜程網提供更加完善的購票服務和更優惠的票價。topic3占比 18.59% ,主題特征詞“開心”“好看”“好玩”反映了盡管存在長時間排隊問題,但在游玩項目環節游客體驗很棒,NPC角色外形好看;從“小孩”“孩子\"看出,游客群體存在部分家庭游、親子游群體。topic 4 占比 9.96% ,從“漂流”“雷鳴山”“礦山”等詞可以看出,該主題主要圍繞景點項目,反映的是游客群體比較關注的重點項目。topic 5占比 12.22% ,“再次”“下次”“還會”等詞表達了游客重復游覽的愿望,側面反映游客對整個景點的認可;“童話”“氛圍”則是對整個景點的象征。topic6占比 14.47% ,根據主題特征詞“導游”“服務\"“安排”,該維度表達了游客對于園區導游或其他工作人員服務質量的關注;“熱情”“合理”等情感詞表達了游客對園區導游服務的認可。

LDA模型確定的6個主題分別從不同方面表征了游客感知形象,依據主題特征詞的描述,將主題結果具象化,依次確定“排隊時間”“門票價格”“游玩過程”“熱門項目”“游玩評價”“導游服務”等6個主題指標,其中:“排隊時間”“門票價格”涉及時間和價格屬性,納人“感知成本”維度;“游玩過程”“熱門項目”“游玩評價”涉及體驗屬性,將其歸屬“感知體驗”維度;而“導游服務”涉及服務屬性,將其劃為“感知服務”維度,如表3所示。

3.3 情感模型訓練比較
3.3.1 粗粒度和細粒度情感模型訓練比較
基于上文構建的人工標注情感數據集,訓練LCF-ATEPC模型,實驗超參數的設置參考Yang等的研究結果[22],并根據實驗結果對超參數進行微調。表4列出了微調后的超參數。同時為確保模型性能和實現粗細情感對比,選用粗粒度SnowNLP模型作為對照模型。通過模型的不斷訓練與驗證,測試結果如表5所示。實驗結果表明,LCF-ATEPC模型在情感分析任務中具有優秀的情感分析性能。


SnowNLP模型是適用于中文文本處理的情感模型,該模型采用樸素貝葉斯分類器,從標注的訓練數據中預測情感并生成情感評分[23]。由于細粒度情感模型訓練數據不適用于粗粒度模型訓練,因此本研究通過人工標注篩選了2000條正面和負面的情感數據作為SnowNLP模型訓練數據。同時參考Qu 等的研究結果[24],劃分為消極、中立和積極等3個情感區間,分別是[0,0.4)、[0.4,0.6]、(0.6,1.0],訓練結果如表5所示。
3.3.2 粗粒度與細粒度情感分析
基于訓練好的情感模型,對各維度下的游客評論進行情感分析。該模型的輸出結果包含“原文內容”“方面詞”“情感極性”“情感信度”等,如表6所示。其中“方面詞”是情感的載體,情感極性是“方面詞”的具體情感,“情感信度”則是模型對該“情感極性”計算出的可信程度。情感信度超過0.5的被認為是可信的。

在一條評論文本中,模型往往會識別多個方面詞,并預測其情感極性,這些方面詞涉及多個維度,因此,為了更加準確地分析各主題情感極性,研究通過對主題詞與方面詞進行語義匹配,匹配成功后進一步統計其情感極性和情感信度。LCF-ATEPC模型統計結果如圖3所示。圖3中,除“排隊時間”外,其余主題積極情感占比均高于 75% ,表明游客對上海迪士尼形象總體持正面態度,與前文主題特征詞結果一致。SnowNLP預測結果如圖4所示。


比較圖3與圖4可以發現,粗細兩類模型在6個主題情感預測中,各主題情感傾向一致。但在“排隊時間”主題中,兩類模型差距超過 10% ,而在剩余5個主題中,差異均在 5% 以下,表明兩類模型在情感較為統一的主題中,預測結果差距不大,而在情感沖突較為明顯的主題中,差異較為顯著。兩類模型均預測出少量的中立情感,因為中立情感占比較少,大部分情感集中在積極和消極兩端,所以表明該景點評論數據中情感偏向兩極。
兩類模型訓練的是同一份情感數據集,但在情感標注時采用不同方法,細粒度情感標注出評論中的每一個方面詞及其情感傾向,而粗粒度情感標注只標注整個評論的情感傾向。在情感統一維度,單一情感占比較高,兩類模型結果差距不大,而在情感沖突維度,尤其是單一評論中表達積極和消極兩種情感的這類評論占比較高時,細粒度情感能識別不同方面詞的情感傾向,而粗粒度情感對情感的判斷一方面與訓練數據集有關,另一方面也受非主題方面詞情感傾向影響,因此其預測結果與細粒度模型存在較大差異。
3.4 主題情感誘因分析
3.4.1 感知成本分析
在“排隊時間”主題指標中,負面情感評論占比高達 47.41% ,表明有近一半的游客因排隊問題而產生負面情緒。結合圖5的詞云圖分析,由于長時間的站立和等待會導致身體疲勞,這種生理上的不適加劇了負面情感的出現。此外,外部環境因素高頻出現在負面評論中,如雨天、高溫和寒冷天氣對游客的影響。雨天往往會導致戶外游玩設施關閉,進而使游客產生遺憾情緒,尤其是未能體驗到預期的游玩項目。而高溫和寒冷天氣降低了游客的身體舒適度,進一步加劇排隊期間的負面情緒,導致游客產生疲憊、焦躁和沮喪等情感。這些情感使游客的游玩焦點集中在排隊過程中,降低了對游玩活動的期待和體驗,并引發明顯的負面情感反饋。分析評論發現,游客對上海迪士尼推出早鳥票、早享卡和尊享卡等差異化門票服務表示認可。這類門票在一定程度上縮短排隊等候時間,提升游玩體驗。此外,錯峰出行是許多游客在評論中推薦的出行策略,該方法能有效減少排隊等待時間,提高游玩愉悅感。

在“門票價格”這一主題指標中,積極情感評論占比
,說明大部分游客能接受門票的定價。結合詞云圖分析,游客普遍認為通過攜程購買門票性價比更高。然而,深人分析負面評論后發現,不可改簽和不可退票政策是游客抱怨的主要原因。此外,園區內的高消費水平也進一步激化了游客的負面情緒,尤其是園區內的餐飲定價過高,且味道一般,使得部分游客對消費感到不滿,成為游客吐槽的重點。與此同時,長時間的排隊等待也加重了游客的負擔,進一步導致所支付的票價與所得到的體驗不成正比,產生了性價比不足的負面情感。
3.4.2 感知體驗分析
由圖3可知,“游玩過程”“熱門項目”和“游玩評價”等3個感知體驗的主題占比依次為 87.44%.79.18% 和 88.08% ,表明在整個游玩體驗維度中,游客普遍持有正面積極態度。如圖6所示,“游玩過程”出現頻率較高的詞有“開心”“好玩”“喜歡”,表明絕大部分游客在景區游玩過程中感到愉悅和滿意;此外,“孩子”和“小朋友”等詞的出現,暗示上海迪士尼獲得了家長們的認可。在“熱門項目”中,“地平線\"“煙花\"\"動物”等詞的高頻出現,揭示了這些項目是游客在游玩過程中產生正面情感的主要來源,景區可通過加強熱門項目體驗,進一步提升游客滿意度和忠誠度。而在“游玩評價”中,“下次”“值得”“喜歡”“不錯\"的出現,暗示了游客對整個游玩體驗感到滿意,并且具有較強的再次游玩意愿。
在對3個感知體驗主題的負面評論分析中,頻繁出現的關鍵詞有“排隊”“人多”“天氣”。特別是帶孩子游玩的游客中,“排隊”和“天氣”對其影響尤為突出。通過進一步分析,“高溫”和“寒冷天氣”主要通過加劇排隊問題進而影響游客情緒,而“雨天”則通過影響“煙花”和“花車”等戶外類項目,致使游客情緒下降。通過以上分析,在游玩體驗中,“熱門項目”是影響游客滿意度的關鍵因素,而“天氣\"和“排隊”是帶來負面情緒的主要因素。

3.4.3 感知服務分析
如圖3所示,在“導游服務”中,積極情感占比 90% ,表明多數游客對景區服務質量持有積極評價。在圖6(d)中,高頻詞有“導游”“服務”“態度”“安排”,而對應的積極情感詞匯主要有“熱情”“開心”“周到”“不錯”。這反映出上海迪士尼工作人員在服務方面的高水平。例如評論“導游全程陪伴陪玩,安排合理,項目全部輕松刷完,很好的迪土尼之旅”,這種高質量的導游服務顯著提升了游玩體驗,使得許多游客在評論中主動推薦導游服務。盡管該主題負面評論占比較少,僅為 7.55% ,但通過深入解讀后,“態度”是負面評論中出現頻率最高的關鍵詞,而對應的情感詞為“太差”。綜合圖3和圖6可以發現,合理的路線規劃和熱情的服務態度是影響游客情感變化的關鍵因素,這表明導游在服務過程中,既要保證行程安排的合理性,也需要注重態度和情感互動,以進一步提升游客滿意度。
4 結論與討論
4.1 結論
本研究以攜程網在線游客評論為數據來源,采用主題模型與細粒度情感分析相結合的方式,深人挖掘游客對上海迪士尼的感知形象與情感偏好。通過LDA主題模型對游客的感知偏好進行識別,構建了多個游客感知主題,并進一步運用LCF-ATEPC細粒度情感模型解析游客的情感傾向,形成了與傳統粗粒度情感分析模型(如SnowNLP)的對比,為情感分析提供了新的研究思路和方法。研究發現:
(1)游客對上海迪士尼樂園的整體情感偏向積極,整體情感評分較高。然而,粗粒度情感模型與細粒度情感模型在情感沖突維度上展現出顯著差異,特別是在包含多重情感表達的評論中,細粒度情感分析能夠更精確地識別不同方面術語及其情感極性,提供更細致的情感分析視角,揭示了細粒度情感分析在處理復雜情感表達中的優勢。
(2)排隊時間是游客產生負面情緒的主要原因之一,尤其在高溫、寒冷或雨天等不利天氣條件下,游客的負面情感更為顯著。長時間排隊不僅導致游客情緒不滿,還降低了他們對游玩體驗的期待,進而影響他們對門票性價比的認知和整體滿意度。天氣因素對游客的情感影響尤為突出,雨天使得一些戶外游樂設施無法開放,導致游客的遺憾情緒增加,而極端天氣(如高溫和寒冷天氣)則通過降低游客的身體舒適度,進一步加劇了排隊過程中的不愉快體驗。
(3)在游玩服務方面,導游服務游客滿意度最高。游客普遍對導游的服務態度和專業水平表示認可,認為其有效提升了游玩體驗。而門票價格、游玩過程中的服務質量以及熱門項目的體驗,則是游客情感中積極情緒的主要來源。特別是熱門項目對游客的滿意度有著決定性的影響,能夠有效提升游客的整體情感體驗。
4.2 討論
游客對旅游目的地的形象感知在旅游管理和營銷中具有重要意義,尤其是感知維度的科學性和準確性直接影響到目的地形象的建立與優化。首先,本文通過LDA主題模型對游客感知維度進行建模,相較于傳統的高頻詞分析方法,LDA模型提供了一種更為精細化的度量方式,能夠從多個層面提煉游客感知的多維信息,為目的地形象的構建提供了更加系統化的理論基礎。其次,通過對游客情感的深度分析,本文進一步優化了旅游目的地感知的情感度量方法。通過引人LCF-ATEPC細粒度情感分析模型,將情感分析從傳統的句子級別延伸至方面級別,精準捕捉了游客在不同場景下的多維情感表達。這不僅豐富了情感分析的測量方法,也為旅游管理者提供了更為細致和真實的游客情感數據,進而優化了游客目的地感知的整體框架。最后,選取熱門旅游景點上海迪士尼作為本研究實證對象,運用LCF-ATEPC細粒度情感模型與SnowNLP粗粒度情感模型進行對比研究,揭示了情感沖突維度中兩種模型的顯著差異?,F實場景下,游客評論常常涉及多個評價維度,非自標對象的情感會對目標對象的情感評估產生干擾。傳統的粗粒度情感分析方法未能有效解決這一問題,而本文采用的細粒度情感分析則通過甄別主題方面詞,有效減輕了其他維度情感的干擾,提供了更加細致且準確的情感視角。
參考文獻
[1]楊發鵬,白銀霞.新疆屯墾旅游形象對旅游忠誠度的影響研究:以石河子地區為例[J],石河子大學學報(哲學社會科學版),2018(3):50-56.
[2]譚紅日,劉沛林,李伯華.基于網絡文本分析的大連市旅游目的地形象感知[J].經濟地理,2021(3):231-239.
[3] DEY B, SARMA M K. Information source usageamong motive-based segments of travelers to newlyemerging tourist destinations[J]. Tourism manage-ment,2009 (3):341-344.
[4] HUANG C Y, CHOU C J, LIN P C. Involvementtheory in constructing bloggers' intention to purchasetravel products[J]. Tourism management, 2010(4):513-526.
[5]王承云,戴添樂,蔣世敏,等.基于網絡大數據的上海紅色旅游形象感知與情感評價研究[J],旅游科學,2022 (2):138-150.
[6]孫曉東,倪榮鑫.中國郵輪游客的產品認知、情感表達與品牌形象感知:基于在線點評的內容分析[J].地理研究,2018(6):1159-1180.
[7]和澤海,陶玉國,張紅霞.基于多源異構評論的旅游目的地形象及其影響因素:情感分析視角[J].世界地理研究,2024(10):168-179.
[8]LI R, LI Y Q, RUAN W Q, et al. Sentiment miningof online reviews of peer-to-peer accommodations:customer emotional heterogeneity and its influencingfactors[J/OL]. Tourism management, 2023,96:104704[2024-08-21].https://doi. org/10.1016/j.tourman.2022.104704.
[9]TAO YG,LIU WJ,HUANG ZF,et al. Thematicanalysis of reviews on the air quality of tourist destina-tions from a sentiment analysis perspective[J/OL].Tourism management perspectives, 2022,42: 100969[2024-08-23]. https://doi. org/10.1016/j. tmp.
[10] LIU Y,HUANG K X,BAO J G, et al. Listen tothe voices from home: an analysis of chinese tour-ists' sentiments regarding australian destinations[J].Tourism management, 2019,71:337-347.
[11] ALAEI A R, BECKEN S, STANTIC B. Sentimentanalysis in tourism: capitalizing on big data J].Journal of travel research, 2019 (2): 175-191.
[12]BIAN Y W,YE R S, ZHANG J,et al. Customerpreference identification from hotel online reviews: aneural network based fine-grained sentiment analysis[J/OL]. Computers amp; industrial engineering,2022,172:108648[2024-08-15].https://doi. org/10.1016/j.cie.2022.108648.
[13]DRAGONI M, KESSLER F B. A three-phase ap-proach for exploiting opinion mining in computationaladvertising[J]. IEEE intelligent systems, 2017(3):21-27.
[14]TOIVONEN T,HEIKINHEIMO V,FINK C,etal. Social media data for conservation science: amethodological overview[J]. Biological conservation,2019,233:298-315.
[15] SANCHEZ-FRANCO M J,REY-MORENO M. Dotravelers' reviews depend on the destination? Ananalysis in coastal and urban peer-to-peer lodgings[J].Psychology amp; marketing,2021 (2):441-459.
[16]王才雪,陳堅,傅志妍,等.基于社交網絡數據的城市軌道交通服務質量評價模型[J],鐵道科學與工程學報,2023(5):1871-1879.
[17] DASHTIPOUR K, GOGATE M, LI J P, et al. Ahybrid Persian sentiment analysis framework: in-tegrating dependency grammar based rules and deepneural networks[J]. Neurocomputing,2020, 380:1-10.
[18]ABUZAYED A,AL-KHALIFA H. BERT for Ara-bic topic modeling: an experimental study on BERT-opic technique[J]. Procedia computer science,2021,189:191-194.
[19]張東鑫,張敏.圖情領域LDA主題模型應用研究進展述評[J].圖書情報知識,2022(6):143-157.
[20]楊楊,錢易鑫,吳明佳.國際海洋生態補償研究綜述:基于LDA主題模型的潛在語義分析[J/OL].海洋湖沼通報,2024:1-10[2024-06-18].https://link.cnki.net/urlid/37.1141.p.20240125.0826.002.
[21] 馬小賓,章錦河.國外游客對世界文化遺產蘇州園林的形象認知研究:基于自然語言處理的不同粒度分析[J].中國生態旅游,2022(4):550-565.
[22] YANGH,ZENGBQ,YANGJH,et al.A multi-task learning model for Chinese-oriented aspect po-larity classification and aspect term extraction[J].Neurocomputing,2021,419:344-356.
[23] YE T,ZHAO S Y,LAU C K M,et al. Socialmedia sentiment of hydrogen fuel cell vehicles in Chi-
na:evidencefrom artificial intelligence algorithmsJ/ OL].Energy economics,2024,133:107564[2024- 10-19].https://doi.org/10.1016/j.eneco. 2024. 107564. [24]QU H M,TEH B T,NORDIN N A,et al. Analysis of Guangzhou city image perception based on weibo text data(2019-2023)[J/OL].Heliyon,2024 (17):e36577[2024-10-19].https://doi.org/10. 1016/j.heliyon.2024.e36577.
Research on Tourists’ Perception of Destination Images Based on Fine-Grained Sentiment Analysis
—Taking Shanghai Disneyland as an Example
Jian Hongbo, Chen Jian, Wu Xiaotong (College of Traffic amp; Transportation, Chongqing Jiaotong University, Chongqing 400074, China)
Abstract: Sentiment analysis is an important tool to study tourists' perception of destination images. The scientific natureof the analysis processand the accuracy of the results significantly impact on the formation of these perceived images.This paper takes online reviews of Shanghai Disneyland as the data source,employs the LDA (latent dirichlet allocation) model to construct the dimensions of tourists' perceived images. It integrates the LCF-ATEPC (local context focused aspect term extraction and polarity classification) fine-grained sentiment model to conduct an in-depth analysis of tourists' sentiments. The SnowNLP (snow natural language processing) coarse-grained sentiment model is selected as a benchmark to explore the differences between the two types of sentiment analysis approaches. Based on the results of finegrained sentiment analysis, word cloud diagrams are used to identify emotional triggers. The results show that: tourist reviews contain multi-dimensional sentiment polarities. Significant differences are observed between the fine-grained and coarse-grained model results, especiall in the dimension of sentiment conflict. Positive emotional triggers include fun,convenience,rationality and enthusiasm,while negative emotional triggers involve frequent and long queues,and external environmental factors,such as high temperature, cold weather, and holidays, exacerbate negative emotional reactions to a certain extent.
Keywords: tourism travel; perceived image; fine-grained sentiment; theme mining; LDA