□楊春梅 趙 原 徐西帥 李威
在旅游者體驗過程中,游客滿意度是一個非常重要的問題,直接影響到旅游者旅游行為。Pizam A(1978)首先提出游客滿意度概念,他認為游客滿意度是游客對旅游目的地的期望和實際體驗比較后的綜合評價。Churchill和Surprenant(1982)認為游客滿意度不一定是與期望進行差異比較,屬性績效也會產生顯著影響。Dunn Ross和Iso Ahola S(1991)則指出,態度是情感(例如愉悅),滿意度則是對情感的評價。隨后,如何提升旅游者滿意度,成為眾多學者關注的焦點。
對于游客滿意度測量,眾多學者采用的方法不盡相同,最早采用的是市場調查問卷,考慮到測量的科學性和合理性,研究方法逐漸深化。Yoon和Uysal(2005)運用結構方程模型分析旅游動機、顧客滿意和顧客忠誠之間的因果關系。Brejla(2014)以Cruise Critic網站上的網絡評論為基礎,對游客評論及滿意度進行分析。朱曉柯等(2018)等采用問卷調查、運用因子分析法、模糊綜合評價法、IPA分析法等方法評價游客滿意度。周坤(2020)對ECSI進行修正并構建歷史街區游客滿意度模型HBTSI。劉建國和晉孟雨(2018)、李志剛和孫瑜(2020)等學者采用案例分析方法和IPA方法研究游客滿意度。張春暉和白凱(2018)運用Tetra-class模型,對游客滿意度屬性要素進行分類。隨著網絡的普及,部分學者開始進行網絡數據挖掘方法,成永坤(2020)等采用詞頻分析、語義網絡分析、情感分析方法對游客滿意度進行分析。孫曉東和倪榮鑫(2018)、趙春艷和陳美愛(2019)等利用文本內容分析法從高頻詞特征、語義網絡等進行游客情感等進行滿意度分析。敖長林等(2020)采用詞頻-逆文檔率(TF-IDF)和LDA文檔主題生成模型兩種典型的文本分析方法。
綜上,網絡文本分析方法大多集中在旅游形象感知、游客網絡行為方面,而游客滿意度研究大多集中于旅游城鎮和旅游景區等方面,對冰雪旅游游客滿意度研究相對較少。因此,本文選擇網絡文本數據分析方法,運用Python大數據挖掘技術,以哈爾濱為研究區域,選取冰雪大世界、太陽島、圣索菲亞大教堂、冰燈藝術游園會、中央大街、亞布力滑雪場、伏爾加莊園、哈爾濱融創雪世界8個冰雪旅游項目,研究游客滿意度問題。
哈爾濱冰雪旅游產業的效益日益顯著,知名度和美譽度越來越高,冰雪旅游市場逐漸擴大,對社會文化和旅游產業的發展起到了重要作用。哈爾濱依靠傳統項目,推進冰雪旅游創新項目,打造精品旅游線路,注重把冰雪旅游產業與其他產業相融合,能夠把體育、教育、文化及冰雪制造設備業、商貿等融合,不斷挖掘冰雪旅游資源優勢,打造核心競爭力。例如,在教育融合方面,推出研學精品線路,打造學習基地;在文化融合方面,推出文化演出和傳統節目相結合;在體育融合方面,推出森林穿越、摩托車、體育賽事、山地自行車等體育項目。除此之外,在交通、養生等方面,也不斷拓展發展空間,推出不同的精品項目。
經過幾十年的發展,哈爾濱塑造出一批知名的冰雪旅游品牌。哈爾濱被譽為“冰雪之冠上的明珠”,入選“2018年十佳冰雪旅游城”“2017-2018冰雪季滑雪旅游區十強”名單中,其中:亞布力滑雪場位居第四、亞布力陽光度假村位居第十名、拉布里滑雪場被評為國家優選旅游項目。“2017-2018冰雪季冰雪旅游節事十強”中,中國·哈爾濱國際冰雪節位居榜首。在眾多冰雪旅游目的地中,哈爾濱依靠冰雪旅游資源優勢及創新模式,深受游客喜愛,據統計,2018—2019年冬季,哈爾濱市旅游熱度在全國省會城市中位列前十名,成為全國最熱門的冰雪旅游城市之一。
網絡文本數據分析方法屬于內容分析方法,是利用網絡消費者留下的數據痕跡進行信息檢索、數據挖掘,從文本中抽取的特征詞進行量化來表示文本信息的方法。網絡文本分析一般包括三個步驟:首先明確數據來源,其次建立分析類目,最后量化分析數據。
旅游評論是旅游者實施旅游行為之后,對整個旅游過程的評價,包括吃、住、行、游、購、娛六個方面,通過旅游評論能夠直觀反映出游客的滿意程度。本文選擇比較有代表性的旅游網站作為數據來源,對旅游評論進行本文數據抓取,采用ROST CM6進行量化分析,從而分析出旅游者對冰雪旅游滿意度問題。
本文選擇實力比較強的5家旅游網站進行數據搜集,包括攜程網、去哪兒網、貓途鷹旅游網、馬蜂窩、途牛網,時間截至2020年10月31日。選擇用Python數據挖掘技術,抓取5家網站帶時間的游客評論信息,其中,攜程網評論數量14621條,去哪兒網評論數量10507條,貓途鷹旅游網評論數量1350條,馬蜂窩評論數量527條,途牛網評論數量10757條,共計37762條評論。在抓取數據過程中發現,除了攜程網、去哪兒網、途牛網的冰燈游園會評論為0,其余的評論數量比較合理,哈爾濱融創雪世界2017年12月末開始運營,相對于其他冰雪項目,評論數量不是很多,但是發展趨勢好,受到旅游者的歡迎,除了貓途鷹旅游網缺少評論,其他的評論都是逐年增多。因此,抓取的評論具有代表性,可以進行本文分析。
1.文本去重
為了更為清晰分析抓取的評論,本文逐條進行檢查,發現評論中出現商業宣傳、企業概況介紹、游客重復粘貼評論、@用戶名等沒有意義的情況,進行去除。有的只是為了單純的評論湊字數,因此把多余的字數去掉,例如“哈哈哈”“呃呃呃”。還有的評論完全相同,進行剔除,只保留一條。
2.手工壓縮去詞
采取文本去重后,還有部分評論重復,因此需要進行調整,例如“很厚很厚很厚”改為“很厚”,“不錯不錯不錯”改為“不錯”“冷冷冷”改為“冷”“特別特別特別好”改為“特別好”。
3.軟件分詞
中文分詞是文本挖掘的基礎,對中文準確分詞,可以使電腦自動識別語句含義的效果。本文采用ROST CM6軟件進行中文分詞,ROST CM6分詞的精度較高,效率快。例如:“值得一去人間仙境”,ROST CM6分詞的結果是“值得/一去/人間/仙境”。“很好玩,多穿衣服,冰雪大世界,值得一去”,ROST CM6分詞的結果是“很/好玩/多穿/衣服/冰雪/大世界/值得/一去”。
4.去停用詞
評論中出現次數較多,且對評論意義不大的字詞,例如“的”“我”“哦”等詞對評論作用不大,進行刪除。評論中出現的“還行吧”改為“還行”,去掉“吧”,“好好玩”改為“好玩”,“感覺棒棒噠”改為“感覺很棒”。經過數據處理之后,最終獲得24萬余字評論,將數據改為.txt格式,方便用于ROST CM6進行分析。
數據進行預處理之后,把數據導入到ROST CM6軟件中,利用“詞頻分析”功能統計排名前120的詞頻,并進行人工排除與研究主題相關性不高,或者意義不大的詞匯,共篩選出90個高頻詞,高頻詞見表1所示。通過高頻詞來確定影響冰雪旅游游客滿意度的維度,作為游客滿意度判斷及優化策略的基礎。
成永坤等(2020)對滑雪旅游進行文本分析,把高頻詞分類為目的地類、配套服務類、游客感受類三種。敖長林等(2020)對冰雪旅游形象進行網絡文本挖掘,把高頻詞分為相關地標、旅游活動、景點建筑或風景特色、特色飲食及住宿、游玩價格五個方面。朱曉柯(2018)研究冰雪旅游游客滿意度,提出冰雪旅游資源、旅游食宿、景區設施、景區服務與形象、門票價格五個方面。本文綜合相關學者的研究和90個高頻詞的特征,對表1進行歸納整理,具體統計見表2所示。

表1 冰雪旅游游客評論高頻詞統計

表2 各類目高頻詞數量統計
1.冰雪旅游資源及景區類高頻詞
篩選出詞匯包括“冰雪大世界”“中央大街”“太陽島”“松花江”“教堂”“建筑”“步行街”“滑雪場”“游客”“亞布力”“伏爾加”“小鎮”“莊園”“街道”“紀念塔”“異域”“城堡”“景點”“廣場”“公園”。相關評論有“白天逛一下中央大街,吃個馬迭爾冰棍,晚上去看冰燈”,可以看出哈爾濱冰雪旅游資源豐富,旅游者對冰雪旅游景區的喜愛,對冰雪旅游項目的關注度較高。
2.冰雪旅游形象類高頻詞
“特色”“風情”“風格”“歐式”“歷史”“壯觀”“藝術”“夜景”“東北”“超級”“環境”“童話”“夜晚”“文化”“著名”。相關評論有“得天獨厚地理環境,它是中國北方最具特色旅游景點”“真激動壞了,冰雕太壯觀了,太美太漂亮了”,從歸納高頻詞可以看出旅游者對冰雪旅游感知形象具有多維性。
3.配套設施服務類高頻詞
“冰雕”“門票”“滑梯”“冰棍”“項目”“各種”“冰燈”“燈光”“表演”“服務”“票價”“免費”“設施”“交通”“教練”“室內”“美食”“網上”“人員”“導游”“松鼠”。相關評論有“園區服務超級贊,每個人都會對你熱情周到,看到小孩子排隊還會照顧他讓他優先些”,可以看出冰雪旅游景區提供的配套設施和服務比較齊全,旅游者對提供的配套設施和服務比較認可,也可以看出游客的需求情況。
4.游客感受類高頻詞
“值得”“漂亮”“方便”“寒冷”“好玩”“時間”“好看”“適合”“開心”“美麗”“感受”“便宜”“最好”“好吃”“震撼”“刺激”“天氣”“冬季”。相關評論有“感受零下23℃寒冷,還很開心”“值得推薦,有趣好玩,體驗很好,景色不錯,大世界真是童話世界,很美好,玩很開心”,可以看出旅游者進行冰雪旅游之后的體會較多,有不同的感受。
5.游客行為類高頻詞
“滑雪”“建議”“排隊”“拍照”“體驗”“旅游”“游玩”“欣賞”“娛樂”“參觀”“保暖”“選擇”“注意”“入園”“提前”。相關評論有“體驗很好,景色不錯,值得推薦”,“做好保暖,要貼多點暖寶寶,足底也要,還有熱水,里面比外面冷太多了”,可以看出冰雪旅游與其他旅游方式特性不同,旅游者的行為也不同。“滑雪”“保暖”“體驗”等行為是游客必需,但也提出系列建議,如“白天晚上景色不一樣,建議下午提前三點多就去,四點半左右就天黑了,拍出照片很漂亮”。
為了直觀反映出游客評論中具有代表性的特征詞的關聯程度,本文抽取高頻特征詞,利用ROST CM6軟件中語音網絡分析功能,通過提取高頻詞表、去掉無意義詞匯、提取行特征詞表和共現矩陣詞表,最后形成語義網絡圖,如下圖所示。

圖 語義網絡圖
從語義網絡圖中可以看出,該圖共分為5個部分,第一層為核心層,表示哈爾濱冰雪旅游景區和項目,代表游客最關心的部分,從共變關系看,“中央大街”“冰雪大世界”“索菲亞教堂”出現次數最多,是旅游者認為哈爾濱最典型的冰雪旅游項目。第二層為次核心層,與“中央大街”“冰雪大世界”“索菲亞教堂”等詞聯系比較緊密的詞有“俄式”“歷史”“歐式”“特色”“正教”“俄羅斯”“風情”“異域”等詞,表現了游客在游玩過程中,對冰雪旅游景區的形象認可,也體現了哈爾濱冰雪旅游塑造的形象定位。第三層為中間層,“滑梯”“冰雕”“門票”“冰雕”“鴿子”“冰棍”等詞與次核心層產生共變關系,體現了冰雪旅游景區提供的配套服務設施,游客關注的服務重心。第四層為次外圍層,“排隊”“玩的”“冬天”“夏天”“進去”等詞與中間層產生共變關系,體現了游客在旅游項目中產生的行為,從“排隊”和“小時”可以看出,旅游人數眾多,游客旅游中需要排隊,所需時間較多。第五層為外圍層,“開心”“方便”“漂亮”表現了游客的感受程度。外圍層具有這樣的特點:此層詞匯之間沒有共變關系,“方便”與其他層之間沒有共變關系,說明旅游景區在一定程度上感知到旅游的方便性,但是還有待加強。“漂亮”一詞與核心詞緊密聯系,說明游客在旅游中深刻感知到冰雪魅力,冰雪旅游在美觀設計方面讓游客滿意度增加。
游客情感分析是旅游者對冰雪旅游項目及服務等是否滿意的直接表達,對評論分析能夠直接反映旅游者在旅游過程中的情緒變化,是冰雪旅游體驗之后的贊賞或者意見的情感及滿意程度,具體游客情感分析見表3所示。

表3 游客情感分析
從表3游客情感分析可以看出,旅游者對冰雪旅游總體滿意度較高。其中,積極情緒的游客占大多數,數量為1263條,所占比例為82.07%,從中可以充分看出旅游者對冰雪旅游認可度較高,滿意度較強。從積極情緒分段統計可以看出,“一般”“中度”和“高度”的比例相差不多,高度情緒比例為35.09%,中度情緒比例為22.16%,一般情緒數量為382條,所占比例為24.82%,比例較高,稍有不慎就會轉化為中性情緒或者消極情緒,這里對冰雪旅游景區及哈爾濱冰雪旅游產業的發展、旅游者滿意度的提升具有警示作用。
另外,中性情緒數量為93條,所占比例為6.04%,冰雪旅游景區也需要多進行關注,盡可能讓旅游者的中性情緒轉化為積極情緒,否則,中性情緒也可能向消極情緒轉化,對哈爾濱冰雪旅游發展不利。
消極情緒數量為183條,所占比例為11.89%。從消極情緒分段統計來看,“一般”數量為138條,所占比例為8.97%;“中度”數量為31條,比例為2.01%;“高度”數量為8條所占比例為0.52%,可以看出0.52%的游客持高度不滿意情緒,2.01%的游客持中度不滿意情緒,8.97%的游客持低度不滿意情緒。因此,提高哈爾濱冰雪旅游游客滿意度是非常有必要的。總之,旅游者參與冰雪旅游體驗是愉快的,滿意度較高,但是從網絡文本數據分析看出,部分游客的滿意度還需要提升。
本文通過攜程網、去哪兒網、貓途鷹旅游網、馬蜂窩、途牛網5個網站抓取游客評論,運用ROST CM6軟件進行高頻詞分析,利用“詞頻分析”功能統計篩選出90個高頻詞,并把高頻詞分成冰雪旅游資源及景區、配套設施服務、游客感受、游客行為和冰雪旅游形象5個類目;通過對評論數據進行社會網絡與語義網絡相結合的分析得出高頻詞之間的相關性,并對游客滿意度作出傾向性分析;再通過對評論數據進行游客情感分析,積極情緒所占比例為82.07%,中性情緒所占比例為6.04%,消極情緒所占比例為11.89%。研究得出旅游者參與冰雪旅游體驗是愉快的,滿意度較高,但是從網絡文本數據分析看出,游客的滿意度還需要提升。
從對網絡文本數據分析的結果可以看出,哈爾濱冰雪旅游游客滿意度還存在不足:(1)游客冰雪旅游的便利性不足,評論中提到“排隊”的頻次為1627,“時間”的頻次為1841,導致游客在旅游中產生消極情緒。(2)游客在冰雪旅游的門票價格稍高,評論中提到“門票”的頻次為2609,同時也多次出現“宰客”現象,例如“景區門口的出租車司機和賣雪具的人話一句也別信,他們就是來宰客的”。(3)冰雪旅游的劣勢是溫度問題,評論中提及“寒冷”的頻次為2480,“保暖”的頻次為643,“天氣”的頻次為626,例如“做好保暖,要貼多點暖寶寶,足底也要,還有熱水,里面比外面冷太多了”“哈爾濱是真冷,南方人難以承受冷,但是,冰與雪國度,真是另一番美妙”。(4)哈爾濱冰雪旅游的形象偏向于異域性,“俄羅斯”“歐式”“異域”等詞出現頻次較高,沒有體現出中國特色文化。
1.提高服務質量,提升游客體驗滿意度
第一,做好保暖服務。哈爾濱的冬天最冷的時候達到-35℃左右,寒冷的天氣也會讓部分旅游者望而卻步。因此,建議旅游景區提供充足的保暖設備,包括租賃羽絨服、帽子、手套、圍巾、保暖襪子、棉鞋等服務,手機在寒冷的天氣容易關機,也可以提供暖貼和暖寶寶等服務。同時,多設置游客參與項目,提升游客運動量,增強抵御嚴寒能力。第二,維持排隊秩序,提升效率。設置多種購票方式,采用微信、二維碼、門票預訂、窗口、旅游網站等購票方式,盡量減少游客在室外購票及排隊時間。同時,多設置進站口,憑借身份證等相關證件掃碼即可進入,安排專門的服務人員維持秩序和管理工作。第三,加強管理,提升小商小販誠信經營。對游客的餐飲、住宿、交通、購物環境加強管理,杜絕“宰客”“欺騙顧客”“銷售假貨”等現象,提升游客體驗滿意度。
2.改變定價策略,提升游客購票滿意度
哈爾濱冰雪旅游項目的門票價格,只有在旅游網站購票時有些優惠,但是力度不大。例如,冰雪大世界門票大致為280-330元,網絡購票優惠10元左右。因此,部分游客表示門票“小貴”,為了提升游客購票滿意度,建議實行差別定價策略,除了景區規定的學生票、老人票、本地票以外,還可以實行折扣定價策略,例如,購買一次的游客8折,購買二次的游客7折,旅游次數越多,折扣就越多,以此來刺激旅游者重游意愿。也可以購買數量采取折扣定價,家庭旅游采取折扣定價,以此刺激旅游者人數的增加。
3.挖掘文化內涵,打造冰雪旅游文化新形象
從網絡文本數據中分析,旅游者對冰雪旅游文化認知多集中在“異域風情”“歐式”“俄羅斯”等方面,可見冰雪旅游忽視本土文化塑造,缺乏本地文化底蘊和藝術創新。為了提升游客滿意度,要結合本地文化和中國文化打造冰雪旅游文化新形象。除此之外,還需要將影視、明星、動漫、音樂創作、文化節慶活動等融入冰雪旅游中,給旅游者不一樣的感受。
本文通過旅游網站進行網絡文本數據挖掘,利用ROST CM6軟件,采用大數據收集及定量與定性方法相結合的分析方法,最終研究出旅游者對冰雪旅游滿意度問題,具有一定的科學性與實用性。但是,本文研究也存在一定的不足:第一,在網絡本文數據處理過程中,采用人工處理方式,不可避免存在人工處理誤差;第二,本文研究的群體是在網站上評論的旅游者,忽略沒有在網站上評論人的感受,導致研究的群體覆蓋面不全;第三,本文搜集的數據以網絡評論為主,沒有涉及游客游記和攻略方面。在未來的繼續研究中,要擴大研究范圍和研究群體,尤其是旅游者不同特征、不同偏好,進行更深入的探討和分析。