陳煜 楊明春 張曼
摘 要:隨著互聯網技術的發展,電子產品的普及,人們更傾向于借助網絡平臺來表達自己的觀點,由此數據量急劇增加,在這些數據中隱藏著人們在現實世界中的行為軌跡、情感傾向等,如何挖掘隱藏在數據中的有效信息服務于現實世界是當下的研究熱點。目前,人們對游客情感分析大多是從總體出發,對情感與產業規劃之間的關系未進行深入的研究。本文以青巖古鎮為例,深入挖掘游客旅游評論極性,通過分析數據的特點為景區規劃、優化產業布局提供相關的建議。
關鍵詞:情感分析;產業規劃;青巖古鎮
中圖分類號:F592.7;TP391.1 文獻標識碼:A
隨著經濟的發展,人們更加注重精神方面的追求,旅游業開始迅速崛起,旅游業的發展除了會受相關產業的制約和影響之外,也會帶動和影響其他產業的發展,因此,合理開發和規劃旅游資源是旅游業發展的重中之重。截至2020年6月,中國有9.4億網民,約占全球網民的1/5,其中有99.2%是使用手機上網[1]。互聯網的發展突破了傳統媒體時間和空間的局限性,使得網絡評論信息的傳播速度遠勝于報紙等傳統媒體,在虛擬世界中,相較于物理空間的面對面交流,更有意愿展示自己內心最真實的想法,從而加大被評價景點信息傳播的廣度和深度。其類似于電子商務網站上的評論對企業造成的影響,基于此,重視游客評價是景區得以良性發展的重要基礎,是整個旅游產業鏈的生命主線[2-6]。因此,如何科學、合理地設計出景區的規劃與建設方案極其重要[7]。目前,國內外學者從不同空間尺度對旅游目的地進行評價和比較.數據主要來源于權威機構公開發布以及問卷調查,而公開數據雖然較易獲得,但統計口徑和質量的差異使數據往往缺乏可比性,問卷調查數據又存在樣本量、信度、效度等問題。在大數據時代背景下,旅游網絡信息分享已成趨勢,與傳統的公開數據和調研數據相比,游客根據自身體驗得出的感受其數據真實性可靠性較強,用于景區開發和發展研究具有一定的參考價值[8]。方夢靜等利用微博數據進行研究和分析游客在杭州西溪濕地旅游時情感時空變化規律[9]。近年來,隨著旅游業的發展,行業中也發生許多負面事件,這些事件經過傳播發酵,容易降低公眾的出行意愿,甚至引起公眾對當地旅游市場的集體抵制與抗議[10]。由此可見,旅游目的地對游客情感進行分析,重視游客的情感體驗,及時優化景區產業、服務和管理十分重要。
(一)數據采集與處理
考慮到數據的專業性、豐富性及廣泛性,本文選取“攜程網”作為數據源,采用網絡爬蟲技術抓取了目標網站有關青巖古鎮的所有評論,共2 977條,所獲取的每條數據均包括用戶名、評論詳情、評論時間、評分、點贊數等信息,數據結構詳情如表1所示。
(二)樣本處理及情感分析
由于元數據存在大量噪音,數據篩選工作必不可少,文本中出現的多余的標點符號、空格、亂碼字符等會降低數據價值,噪點附加在任何詞句上都會造成與其他詞句的分離,進而影響到語義信息。本文主要利用Python正則表達式和NLTK庫進行匹配,其可以以相同模式輸入模型,而不用因數據具有差異而重復修改模型,這樣數據處理工作就會簡便許多。

本文采用NLP技術根據文本詞意進行情感值計算,系統規定情感值大于0.5分為積極情緒,小于0.5分為消極情緒,結果如表2所示,通過可視化分析可以看出積極評論2 510條,消極評論467條,積極情感總值約是消極情感總值的4.3倍,由此可知,游客對青巖古鎮的整體形象感知是正向的,說明青巖古鎮總體產業規劃布局是合理的,故其更不能忽視持消極情緒的游客感受,對于引發游客不滿的原因需要進行深入挖掘。
(三)詞頻分析
筆者對467條消極評論再一次進行人工去噪留下有效評論455條,然后利用SnowNLP模塊進行主題詞提取。首先需要將455條評論輸入系統中,將評論進行分詞清洗得到新分割后的數據,然后統計各詞出現的詞頻,在此筆者節選排名前60的高頻詞對其進行歸類總結,用以初步展示游客對青巖古鎮消極情緒出現的集中領域(表3),在此基礎上制作詞云圖用以佐證總結分類是否合理(圖1)。


(一)景觀方面
游客認為青巖古鎮商業化嚴重,缺乏古鎮特色,景點單一,文化底蘊單薄,古建筑修葺痕跡明顯,景區結構不合理,原始古建筑在背街方有機會看到,筆者經過多次實地考察,發現確實存在此現象,過度商業化會造成游客流失,在消極評價中,有部分游客表示不會再去第二次,甚至勸誡其他游客不要去。
(二)交通方面
游客認為停車場設置不合理,節假日車況較差,貴陽公交信息更速緩慢,公交實際停靠點與網絡信息不匹配且存在亂收費現象。筆者經實地調查發現,從市區乘公交去青巖耗時約2小時,乘車疲憊感使游客的旅游體驗值大打折扣。
(三)服務體驗方面
門票定價不規范,性價比較低,景區客流量較大,基礎設施不完善,產品同質化嚴重且物價較高,有些產品雖然具有當地特色,但是存在種類少、包裝服務不完善的問題。飲食衛生得不到保障,美食攤位大多設在主路上,灰塵較多,游客反映食用后有嘔吐、腹瀉癥狀,除此之外景區工作人員服務態度較差。
(四)管理方面
古鎮管理混亂,工作人員專業素養不夠,缺乏人性化管理。信息更新不及時,筆者結合實地訪談發現,有些游客買了景區套票,結果因部分小景點在修繕,游客不得入內,有的只買了街景票卻因檢票人員的疏忽進入了套票包含的小景區。景區指示牌設置有待完善,筆者在實地考察時,從南門入街至定廣門,古長城的入口在定廣門里面販賣機處,過于隱蔽,而門外也有小道,看著像古長城入口,實則不是,存在安全隱患。
人們需要客觀地評價古鎮商業化問題。從游客視角出發,其既想體驗古鎮的韻味,又想擁有舒適的環境;從居民視角出發,他們想保留古鎮的原生態,更想擁有美好幸福的生活。如何將兩者統一,需要當地政府和居民達成共識。在進行景區商業規劃時,應著眼整體,適度開發,突出當地特色,深挖文化內涵。
(一)交通
從宏觀方面來看,政府要加強管理,完善監督機制,加大力度打擊私自設立停車場,亂收費的現象;從微觀方面來看,對景區進行統一規劃時,對占地面積要求較高的場所將景區邊緣地區開發為停車場,在進入景區時實行人車分離,開發新路線,增加旅游專線,居民入股,按比例分紅。做好人流監控和節假日景區分流工作。
(二)景區
景區在各大旅游網絡平臺及時更新套票所含景點信息,并在景區購票窗口醒目位置設置游客購票提醒欄。另外,對于旅游產品同質化問題,建議結合當地特色開發一些文創活動,完善服務鏈。要重視衛生安全問題,不定時進行檢查。政府在可控范圍內允許自由競爭,維護游客利益的同時也有利于景區的良性發展,提高游客滿意度和重游率,間接提高居民收入。
(三)服務管理
要完善服務管理制度,定期對景區工作人員進行培訓。在基礎設施方面可以與信息技術相結合,增加游客的滿意度。對于重要景點,指示牌設置合理化,如在定廣門外可以增設長城入口的指示牌,對于當地居民生活小道設置提醒牌,防止游客走錯。南門主街入口石板路兩側增設防護欄和安全警示牌,避免旅游旺季時發生安全事故。
本文通過攜程網獲取青巖古鎮旅游評論數據,通過數據去噪、分詞,提取關鍵詞、建模、情感分析、分類等過程,挖掘游客對青巖古鎮的總體感知,深入分析消極評論數據查找問題的原因,提出針對性建議,希望能夠為景區產業規劃、優化、可持續發展提供一定的參考。
[1] 人民網.中國網民規模達9.4億 手機上網比例達99.2%[EB/OL].(2020-09-30)[2021-03-02].http://media. people.com.cn/n1/2020/0930/c40606-31880397.html.
[2] ANDERSON M, MAGRUDER J. Learning from the Crowd: Regression Discontinuity Estimates of the Effects of an Online Review Database[J]. Economic Journal,2012(563):957-989.
[3] 孟美任,丁晟春.虛假商品評論信息發布者行為動機分析[J].情報科學,2013(10):100-104.
[4] 楊敏.在線商品虛假評論對交易雙方的影響研究[J].現代經濟信息,2016(1):159.
[5] 李璐旸,秦兵,劉挺.虛假評論檢測研究綜述[J].計算機學報,2018(4):946-968.
[6] 龔箭,楊舒悅.基于網絡評論的旅游目的地評價研究:以我國31個省市自治區為例[J].華中師范大學學報(自然科學版),2018(2):279-286.
[7] 唐明虎.旅游評論極性分析對景區服務品質影響研究[J].電腦知識與技術,2020(20):23-27.
[8] AKEHURST G.User generated content:the use of blogs for tourism organizations and tourism consumers[J].Service Business,2009(1):51-61.
[9] 方夢靜,鄭鈺旦,夏兆煊,等.基于微博大數據的游客情感時空變化特征:以杭州西溪國家濕地公園為例[J].西南大學學報(自然科學版),2020(3):156-164.
[10] 李勇,蔣冠文,毛太田,等.基于情感挖掘和話題分析的旅游輿情危機演化特征:以“麗江女游客被打”事件為例[J].旅游學刊,2019(9):101-113.