王 賀 張穎瑩
昆明市作為傳統旅游城市,自然人文旅游資源豐富,占全省比例較高(表1)[1],但是據旅游部門統計分析,昆明正在由傳統的重要旅游目的地逐步淪為旅游中轉站和過境地,來昆旅游人數有1/3屬于過客,在昆停留時間平均不超過兩天[2]。一方面,主城區(五華區、官渡區、盤龍區、西山區)范圍內積聚了眾多旅游景區,以短期旅游為主的游客時空選擇距離縮短,因此主城區會成為更加重要的旅游場所;另一方面,昆明作為老牌旅游城市,相對于全國其他城市旅游收入較低。同作為西南地區的成都、重慶旅游總收入超過昆明市的一倍,貴陽旅游總收入也趕超昆明(圖1)。昆明市正面臨旅游收入較低、游客滿意度偏低、游客滯留時間較短、旅游項目同質化、旅游項目定位不突出等問題[3]。相對于這些問題,在游客的社會評價中清晰直觀的體現出來,那么從旅游者的視角出發,通過旅游景區進行客觀科學的社會服務評價研究,挖掘景區旅游景觀形象、游客情感印象、景觀傾向等,有助于昆明市旅游規劃研究和景區服務管理層面的提升。
然而主城區內旅游景區眾多,同時區位環境、發展模式、景區類型存在明顯的差異,用傳統的調研方法進行研究,面臨樣本少、采集面小、時間人力成本高等困難。然而,大數據分析技術近年來發展迅速,人們行為軌跡研究、網絡輿情文本分析等大數據分析方法逐漸被運用到了規劃研究領域[4]。國務院大數據宏觀課題組、中國城市規劃設計研究院、北京城市實驗室等大數據研究實驗室與設計院進行展開合作,眾多相關課題對城鎮總規修規、城市設計、交通規劃、旅游規劃、歷史街區的保護規劃研究等提供規劃依據與數據支持。

圖1 2017年主要城市旅游總收入排名圖
因此,從大數據的角度出發,以海量數據作為分析源,對昆明主城旅游景區社會服務評價可以得到更加直觀科學的分析結論。
由圖2可知,昆明市主城景區核心分布在市中心、東北、西南片區,同時根據網絡熱度,選取三個片區的重點景區作為主要研究對象,具有研究典型性與代表性。翠湖公園、云南大學、金馬碧雞坊、大觀公園、海埂公園、西山森林公園(國家4A級旅游景區)、云南民族村(4A級)、金殿風景區(4A級)、昆明世博園(5A級)、官渡古鎮(4A級)。
以馬蜂窩旅游網和高德地圖作為數據源,對其游客網絡社會評論、POIs (point of interest)興趣點,利用node.js運行環境編寫代碼進行數據爬取,最后利用,詞頻分析軟件——微圖數據處理平臺和Arcgis軟件進行POIs空間密度分析,文本情感分析、詞頻(TF-IDF)分析數據分析以及圖像可視化。游客社會評論數可以代表該景區的旅游吸引力,而文本情感傾向分析可以表現旅游目的的情感形象、游客滿意度等,而詞頻分析可以直觀的表現出旅游目的地的認知形象。
在高德地圖上采集昆明主城五區2848條公交車、224條景點POIs,再將POI的坐標信息導入Arcgis軟件進行空間核密度分析,最后將計算結果形成數據可視化圖像。
將景點POI的地理坐標信進行可視化可以發現,昆明主城區旅游景區分布重心偏西,主要分布于市中心、西南滇池片區、東北片區,形成三點一線“東北-西南”格局(圖2)。

圖2 昆明主城景區景點POI分布圖
公交站點密集的程度可以表現該區域的公共交通的便捷程度。將研究景區與公交站點核密度圖進行地理疊加,發現市中心旅游片區公交站點最為密集,西南滇池風景區一帶和西北金殿風景區一帶公交站點較為稀疏(圖3)。由于昆明南部和北部客運站承載了主要的陸運交通,西部客運站由于面積過窄,承載力有限。地鐵1、2號線貫通南北,而東西走向的地鐵3號線于2017年8月開通,歷史載客數量有限。從數據分析可以看出,昆明的主要交通重心偏東,貫通南北走向(圖4)。由此可知,公共交通對于景區交通來說便捷度較低,旅游交通需求與實際交通存在明顯的結構缺陷,不相匹配。

表1 昆明市旅游資源類型結構及比重[3]表

圖3 昆明主城公交站點POI核密度圖

圖4 交通與研究景區地理位置關系圖
文本情感分析(text sentiment analysis),又稱為傾向性分析、意見挖掘等,主要是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程[5]。情感傾向值是基于以NPL自然語言處理系統,基于海量的數據人工智能運算,算出每一條評價的正負面性以及情感傾向:0.5分為中性評價,分數越高,情感傾向越為積極,反之,情感傾向越為負面。
評論數最多的為市中心片區,其次為西南滇池片區,西北片區較為落后,整體綜合分和好評率最高的是市中心片區,其次為西北區(表2)。造成片區之間的游客到訪度、好感度、旅游吸引力差異極大的原因主要是由旅游景觀元素、交通因素、服務設施、旅游者旅游行為和情感偏好因素多方面影響的,由交通大數據分析對比可知,交通便捷度與景區游客到訪量呈正相關性。
從單個的旅游景觀元素來分析(表3),翠湖公園評論數最多,游客到訪度最高、人氣最高,其次是海埂公園,云南大學位居第三。但是從世博園往后,評論人數明顯大幅減少,金殿風景區評論數據與翠湖公園相差13倍,表明昆明主城區域內旅游景點旅游者分布空間極為不均衡,游客行為空間活動主要分布在市中心和西山滇池一帶。國家的景區級別評價標準并未對旅游者對其的社會服務評價產生影響,兩者無正相關性。
以人文景觀著稱的云南大學好評率最高,雖然不是傳統意義上的旅游景區,但是卻具有較大的旅游吸引力和較高的社會評價。作為市民公園的翠湖公園,游客到訪量在主城景區中最高,好評率也居上,不僅吸引了外地旅游者,大批本地游客也是到訪主力軍。除去交通因素影響,通過翠湖和云南大學的旅游景觀社會評價可以發現游客更加注重旅游體驗、景觀環境,偏愛人文景觀、市民休閑文化景觀。西山森林公園評論數較低,吸引力不足,但是評價滿意度較高,超過同區位的海埂公園游客好評率,與大觀公園持平。金殿風景區具有同樣的森林公園性質,雖然評論數較低,游客到訪數較少,可達性較弱,但是好評率居于第三,這表明自然森林景觀對游客體驗感較好。
但是在傳統旅游景區中,社會評價卻不太理想。民族村作為具有濃郁的民族特色旅游景區,評論數1500多條,說明雖然民族特色文化景觀對于游客吸引力較大,但是游覽觀光后,游客對于民族村社會評價較低。世博園作為5A級景區,2000年初,帶動了昆明旅游業發展,發揮了巨大的景觀與社會效益,但是如今社會評價排名倒數第二。金馬碧雞坊作為昆明地標性建筑,游客滿意度最低。

表2 旅游片區評論與情感傾向表

表3 景區評論與情感傾向表
由此可見昆明市主城區傳統景區缺乏核心吸引力,自然森林景觀由于交通因素,游客可達性較弱,但是游客好感度較高,同時,人文景觀和休閑文化成為了當今旅游景區不可或缺的旅游景觀內涵。
詞頻(TF-IDF)分析是一種用于情報檢索與文本挖掘的常用加權技術[6]。對研究景區相關的13839條評論,進行查重和擬合,例如“紅嘴鷗”擬合成“海鷗”,“云大”擬合成“云南大學”等,然后進行詞頻分析和圖像可視化(圖5)。詞頻分析主要有兩個分析指標——詞頻(TF)和權重(Score),①②最后得出詞頻較高的且權重大的核心關鍵詞。

圖5 景區綜合詞頻權重圖
對文本進行綜合詞頻分析,可知旅游景區整體形象、景區核心競爭力等。
綜合所有景區的社會評價(圖5),核心關鍵詞為:海鷗、滇池、門票、建筑、特色、少數民族、西山、景色、漂亮、冬天、校園等。“海鷗”共被提到了3876次,接近總評論數的1/4,其次是門票,1239次。建筑和特色緊隨其后1177次,再次是滇池。關于氣候的詞匯——冬天出現頻率較高。由此發現,昆明四季氣候宜人,雖然7-8月是傳統云南旅游旺季,但是昆明冬季景觀元素突出,游客景觀評價較高,旅游特色鮮明,具有不小的旅游吸引力。
翠湖公園的綜合關鍵詞為“海鷗”“荷花”“陸軍”“大學”“冬天”“滇池”“西伯利亞”“陸軍講武堂”“面包”“市區”“休閑”等。翠湖公園是位于市中心的市民公園,每年11月至次年3月,都是來自西伯利亞紅嘴鷗到昆明度冬。陸軍講武堂和云南大學緊鄰公園,所以這三者景區不僅從空間上聯系密切,在游客印象中也緊密不分。從海鷗和荷花可以看出翠湖公園呈現出季節差異化的旅游景觀,反應出翠湖公園最受游客喜愛的行為活動是“冬季觀鷗、夏季觀荷”。
云南大學的綜合關鍵詞為“翠湖”“銀杏”“建筑”“歷史”“漂亮”“松鼠”“氣息”“文化”“民國”“古樸”等。銀杏最佳觀賞季節為秋冬季節,正好與翠湖觀鷗季節重合。云南大學與翠湖公園在游客感知中呈現出的是一種密不可分的內聚性。
金馬碧雞坊的綜合關鍵詞為,“市中心”、“地標”、“步行街”、“商業街”、“廣場”、“繁華”、“標志性”、“特色”、“逛逛”等。金馬碧雞坊位于市中心的金碧廣場上,對面就是南屏繁華熱鬧的步行街,是屬于昆明地標性建筑。分析結果直觀的表明了金馬碧雞坊在昆明旅游中處于重要地位,但是根據上述游客評價分數,游客情感傾向較差。
海埂公園的綜合關鍵詞為“海鷗”、“西山”“門票”“民族村”“纜車”“污染”“纜車”“湖水”“冬天”等。海埂公園與西山隔湖相望,與民族村相鄰,做索道纜車可以到達西山。海埂公園與翠湖公園具有相似游客行為——冬季觀鷗,這兩者之間存在潛在的競爭關系。對“污染”一詞,進行評論查閱后發現,主要是從16年之前的出現較多,而17年之后的游客評論對“污染”提到的相對較少,大多數游客在感嘆滇池壯觀的同時,對于“滇池污染”保持的是惋惜態度,說明游客對于滇池水質有較高的容忍度。
大觀公園的綜合關鍵詞為“大觀樓”“游樂園”“海鷗”“對聯”“荷花”位于昆明市以西的滇池湖畔,始建于明朝洪武元年(公元1368年)。清康熙三十五年(公元1696年)建大觀樓,公園也因此而得名。大觀樓最有名的是“大觀樓長聯”為清朝名士孫髯翁所著,共180字,把滇池風光和云南數千年歷史生動地展示在世人面前,被譽為“海內第一聯”。“海鷗”和“荷花”表明了大觀公園在景觀元素與翠湖公園具有相似性,然而大觀公園內包含一個游樂園,又與翠湖公園有著直接的差異性。
金殿風景區社會評價的綜合關鍵詞為“吳三桂”“陳圓圓” “歷史”“世博園“美不勝收”“銅殿”“茶花”“杜鵑花”“門票”等。金殿名勝區位于昆明北郊,因大殿用黃銅鑄成,陽光照耀下,光芒四射,映得翠谷幽林金光燦爛,故而得名金殿。金殿屬于道教太和宮的一部分,創建于明萬歷三十年(1602年),康熙十年(公元1671年)平西王吳三桂重新修葺,也成為了吳三桂故居,歷史十分悠久。吳三桂和陳圓圓的故事是游客的社會評價中提到最多的詞匯,旅游者對景區歷史故事表現出了濃厚的興趣。銅殿和茶花是金殿風景區比較突出的人文景觀元素和自然景觀元素。
將文本數據進行劃分詞性分析,對形容詞進行詞頻分析,可知游客在景區旅游的空間感受,以及對景區的情感認知形象等。對動詞進行詞頻分析,可知游客在景區的旅游空間行為,對名詞進行詞頻分析,可知游客對于景區最直觀的旅游認知物質形象,以及景區核心景觀元素等。
4.2.1 形容詞詞頻權重分析
對權重詞頻率靠前的形容詞(表4)進行差異化對比分析。翠湖公園壯觀、熱鬧、悠閑、愜意和可愛,給游客營造出一種熱鬧、愜意的景觀氛圍。對于海埂公園游客感知到的是“壯觀”“失望”“不干凈”和“最大”,滇池雖然具有波瀾壯闊的景觀,但是水質污染依然是帶給游客不好的旅游體驗核心的要素之一。云南大學更為突出的是一種古樸、安靜、悠久、幽靜的景觀特質。民族村較為突出的詞匯并不多,其中包括“不同”“不便宜”“熱鬧”等,說明民族村給游客留下的印象比較平庸,也留下了旅游消費不便宜的負面影響。相比,西山森林公園的結果就較為積極,除了一般性正面評價,帶給游客的感受有“壯觀”“非常好”“有意思”“秀麗”等,游客感知度較為新穎。官渡古鎮同樣給游客來了差異化的體驗,“熱鬧”“悠久”“著名”“好吃”“便宜”“豐富”“深厚”等,給游客的印象是官渡古鎮是一座歷史悠久、熱鬧豐富、底蘊深厚的旅游景區,但是游客評分較低,存在一定的印象偏差,過度商業化是帶給游客負面評價主要的問題之一。

表4 景區前15個形容詞關鍵詞表

表5 景區前15個動詞關鍵詞表
4.2.2 動詞詞頻權重分析
翠湖公園比較突出的詞匯是“散步”“跳舞”“唱歌”“喂食”等,游客旅游行為是喂食、散步、跳舞、唱歌等,表明翠湖游客行為豐富多元。云南大學為“綠化”“綠樹成蔭”“漫步”,表現出云南大學生態友好,綠化環境豐富,其景觀氣質,最具特點的詞匯是“漫步”。翠湖公園和海埂大壩給出的關鍵詞是“散步”,同樣都是行走行為,游客卻明顯給出不同的語言詞匯。“漫步”是指悠閑地散漫的隨意走,“散步”是指為了鍛煉或娛樂而隨便走動徘徊,漫步偏向于閑適的心境,散步偏向于放松的狀態[7]。所以云南大學比起其他景點更能給游客一種散漫、閑適的情感認知體驗。
民族村更多的是“表演”“展示”“體驗”等詞匯,游客來這里的大部分活動是觀看民族表演,體驗民族生活等,游客行為較其他景區具有獨一性。世博園主要是跟展覽相關的詞匯,“博覽”“舉辦”和“展覽”,雖然這些游客行為跟民族村同樣具有獨一性,但是也表明游客行為也相對單調。西山森林公園的游客行為主要是登山、遠眺,講解一詞也高頻率出現的原因是公園會提供游客景點講解器,會精準的定位游客所處景點位置并同時進行錄音講解。金馬碧雞坊的游客行為主要是“購物”,但是“路過”表明游客到訪驅動力較弱。西山森林公園和金殿風景區游客行為相似,都是“爬山”和“遠眺”,也都為道教圣地,二者呈現出相似的競爭關系。西山森林公園的評價數量卻為金殿的三倍,這是由于整體西北片區的旅游吸引力偏弱造成的。
4.2.3 名詞詞頻權重分析
名詞關鍵詞清晰而又直觀展現了景區的突出特色的景觀元素和旅游目的地認知形象(表6)。翠湖的名詞關鍵詞:海鷗、荷花、老人、季節、城市、市民,這些元素共同組成了翠湖公園的和旅游景觀氣質,海鷗便成了翠湖的旅游認知形象。云南大學有校園、建筑、歷史、翠湖、銀杏、氣息、文化、學生、民國,建筑作為云南大學的最主要的旅游載體,這些詞組成了云南大學的旅游景觀氣質。官渡古鎮的旅游形象更為貼切是它的特色小吃——官渡粑粑。園藝和植物成了世博園的典型代表詞,金殿的歷史故事和茶花是核心的景觀元素。

表6 景區前15個名詞關鍵詞表
對于POI興趣點的空間核密度分析,可以清晰而直觀的反應出影響昆明主城旅游景區的社會服務評價的外部因素和交通區位條件。而影響社會評價的內部核心因素,主要是旅游者對于景區本身的景觀元素、服務設施、旅游內在需求等。同時,又從社會服務評價中直觀的體現出來。
昆明公共交通結構與旅游交通存在空間上不相吻合的情況,從而影響了游客的可達性,應當加強“東北—市中心—西南”走向的公共交通粘合度。
在針對整個昆明主城區的來說,昆明主城區的旅游景觀形象主要的是由“海鷗”“滇池”和“翠湖”構成,同時重視冬季的旅游景觀元素,發展冬季度假休閑旅游,形成冬夏兩季旅游差異化。
游客情感偏好主要是充滿生活氣息的人文景觀和風景秀麗的自然景觀,西山森林公園和金殿風景區屬于自然景觀旅游“價值洼地”,將會更大發展空間。游客對于旅游產品的豐富程度要求較高,景區旅游產品單一化是游客最不能接受的問題,其次是過度商業化。根據游客評論的詞頻分析,發現也存在在不同類型的景區之間存在同質化問題,旅游產品重合度較高。對于傳統封閉式旅游景區,游客好感度較低,應當豐富旅游產品,優化游客消費結構,同時避免過度商業化,改善服務和提升旅游景觀品質。
注釋:
①TF指標,是指一個詞在文章中出現次數,出現的次數越多,一般越重要。
②Score權重指標,是指一個詞在文章中重要性,主要由TF詞頻,IDF倒轉文檔頻率,和Other三個指標決定。IDF——“倒轉文檔頻率”,表示詞的區分能力,區分能力越差的詞其主題代表性越弱,比如各種常用詞如“如果”,“我”“因為”等;Other,詞在文章中與其他詞的語義聚合程度等。