楊 佟,孟 斌
(北京聯合大學 應用文理學院,北京 100101)
情緒地理學是基于傳統人文地理學分支學科對情緒與空間關系關注的基礎上[1],逐漸發展而來的一門新興的跨學科研究領域。國外對于情感地理問題的研究主要在以下方面:人類心理和生理健康[2]、地方感知[3]、地方依戀[4]、游客情感的時空特征及規律[5]、情感背景下的城市規劃[6]等。情感計算是針對具體的文本內容進行處理、分析,將其分為正面、負面、中性等情感類型的過程[7]。進入21世紀之后,游客情感研究在方法論和機制探索上日漸成熟,而文本內容挖掘是情感分析的主要研究方向。早期的情感分析主要是基于文本數據,對詞語語義的情感傾向進行計算和分析。之后有學者在情感詞典的基礎上,通過設計情感計算規則計算游客情感[8]。
近年來,越來越多的旅游者利用網絡媒介獲取旅游信息。同時,用戶將自己的原創內容通過網絡平臺發布,“由用戶產生的內容(user-generated content,UGC)”的概念逐漸興起[9],一般指旅游者在社交媒體平臺上通過發布旅游文字和照片、撰寫攻略、分享旅游視頻等方式留下的游覽足跡。社交媒體數據因其獲取省時省力、真實可靠,逐漸被應用于科學研究中。學者可以通過分析用戶原創內容,從游客自身的角度研究游客的行為和情感特征,這為旅游研究拓展了新的方法和視角。在此背景下,許多國內外學者借助社交媒體數據率先開展了大數據時代下的旅游研究:利用地理標記照片分析中國入境旅游流時空分布特征[10,11];以旅游門戶網站爬取的游記、評論為研究數據,分析游客對旅游目的地形象的感知[12,13];利用游客簽到數據對文保單位的關聯度進行定量測度[14];以UGC圖片元數據研究旅游目的形象[15];融合氣象數據和UGC文本數據分析游客情感與氣候之間的相關關系[16];利用機器學習方法對文化資源密集區進行感知研究[17]。
綜上,本文以北京市的16個市轄區作為案例地,借助新浪微博文本數據,研究北京游客的正負面情感特點和時空特征,以豐富地理學在情感研究的視角和方法,并為提升城市旅游服務和改善基礎設施建設提供理論依據,并進一步拓寬社交媒體數據的應用領域。
北京是我國政治中心、文化中心、國際交流中心、科技創新中心。此外,北京擁有豐富旅游資源,其中對外開放的旅游景點達200多處,擁有文物古跡7309項,國家重點文物保護單位99處,市級文物保護單位326處。2019年,北京市接待游客總人數3.22億人次,比2018年增長3.6%。其中,接待國內游客3.18億人次,增長3.7%。這座城市作為中國形象和象征,一直受到國內外的高度關注。
新浪微博平臺是當下中國最熱門的社交媒體平臺之一,依據新浪微博官方發布2020年微博用戶發展報告顯示,截至2020年9月份微博月活躍用戶達5.11億個,日活躍用戶達到2.24億個。利用新浪微博官方API,抓取時間為2019年的全北京市域內的微博數據,其中每條數據均包含文本內容、用戶編號、經緯度、發布時間等字段,獲取北京市2019年微博用戶數據1175余萬條,數據結構如表1所示。

表1 微博數據結構示例
BERT(Bidirectional Encoder Representation from Transformers)是由Google公司在自然語言處理(NLP)中的一項重大突破[18],該模型能夠大幅提升文本識別的準確度。本文采用BERT模型,利用Python語言進行編譯,對微博文本內容進行機器學習,提取與旅游相關微博文本。本研究中具體文本處理方法如下:首先,篩選出北京非本地用戶微博數據共4206915條,隨機選擇20000條數據作為訓練樣本。針對每條文本,如果它與旅游活動有關,則手動標記為1,反之,則標記為0。第二,利用機器學習和BERT模型對20000條訓練數據進行預處理,并驗證分類精度,通過多次調整相應參數和迭代次數,得到訓練好的文本分類模型,精度達到93%。第三,基于該分類模型,將所有的微博數據進行分類,最終識別出2019年北京游客旅游活動數據共247469條。最后,從旅游活動數據中隨機挑選5000條進行了人工驗證,平均準確率達到98.3%,驗證了該模型具有良好的分類效果。
ROST Content Mining軟件是武漢大學沈陽教授發明,用于挖掘文本內容的系統軟件,該方法主要專門針對網絡媒體上的信息內容,對文本資料進行分詞處理、高頻詞統計,以及聚類、相關性、情感趨向、時序等分析,構建出社會網絡、語義網絡等[19]。本文主要利用ROST CM6軟件,針對文本內容首先進行分詞處理和高頻詞統計,并計算游客情感值,同時針對正負面情感的高頻詞構建語義網絡。
Getis-Ord Gi*統計是一個熱點分析模型,通過z得分和p值可以看出高值或低值要素在空間上發生聚類的位置[20]。熱點分析工具的目標就是識別出具有統計顯著性的聚類區域。基本的邏輯是,按照一定鄰域,重新抽樣數據,根據本地數據均值相對于總體均值的偏離度,來判斷空間分布的隨機性是否成立。假設條件就是要素在空間分布上是隨機獨立分布的,那按照空間加權計算后的結果勢必呈現出正態分布[21]。
詞頻統計結果如表2所示,“打卡”一詞的頻率最高,反映出打卡行為是游客的主要旅游行為之一。“故宮”“故宮博物院”“頤和園”“天安門廣場”和“圓明園”等高頻詞反映出游客在北京旅游的主要目的地,多位于具有豐富文化和歷史的5A景區。“吃”“走”“拍”和“逛”等高頻動詞說明游客旅游的主要旅游活動。“天氣”“好熱”等高頻詞可以看出游客對于天氣的關注以及游客對天氣炎熱的抱怨。“烤鴨”“吃”等高頻詞可以看出游客對北京特色美食的關注。

表2 旅游行為相關微博高頻詞
本文對北京游客發送的網絡文本進行情感分析,得到積極、中性、消極3種情感類型,并對積極情緒和消極情緒按程度劃分為一般、中度、高度,結果如表3所示。積極情感微博數量為118035條,占比47.70%;中性情感微博數量為91371條,占比36.92%;消極情感微博數量38063條,占比15.38%。總體上看,積極情感的微博數量多,占比最高,消極情感的微博數量少,占比最低。在積極情感中,一般積極的情感占比最高,可見游客對北京的積極情感主要以輕度的積極情緒為主,高度積極的情感占比相對較少;在消極情感中,一般消極的情感占比最高,高度消極的情感占比最低,極少有極端的負面情緒。這表明絕大部分游客在北京旅游體驗的滿意度較高,大多為正面體驗。

表3 游客情感分布情況
通過ROST CM6軟件分別對積極情緒和消極情緒的高頻詞進行語義網絡分析,不同節點之間用直線和箭頭表示連接關系。從積極情感語義網絡結構圖(圖1)可以看出,“故宮”“博物院”“天安門”“風景”是圖的核心節點,表明游客來京旅游的主要目的地。“歷史”“文化”“街區”“天氣”等節點屬于次核心節點,表明游客在意旅游景區的歷史文化,同時天氣也是影響游客旅游體驗好壞的因素之一。最外圍的節點中“地鐵”節點相對獨立,可知游客對于交通設施配置的關注。此外,從“好看”“開心”“快樂”“美麗”“好吃”等節點反映了多數游客對于景點及地方美食的滿意。由此可以得出游客的積極情感多表現為贊美、良好體驗、文化豐富等。

圖1 積極情感語義網絡結構
從消極情感語義網絡結構圖(圖2)可以看出,“小吃”“步行街”“地方”“公園”是圖的核心節點,表面景區的屬性和優勢。“遺憾”“可惜”“下次”“再見”等節點反映出了游客消極情緒。從次核心節點“排隊”“時間”

圖2 消極情感語義網絡結構
“小時”反映出游客對于景區排隊時長問題的關注。然而,通過分析原始評論發現,人流量大、景區服務質量欠佳、較差的天氣狀況會讓游客產生負面情感,例如:“人多的漫天遍野,火車站更是個大雜貨鋪令人窒息”“今天的景點總結,又貴又不好玩”“首站長城,鳥巢水立方,實在是太冷了”,由此可以得出游客的消極情感多表現為遺憾、疲憊、失望等。
本文利用在上述情感值計算結果的基礎上,利用Getis-Ord Gi*方法對游客情感值進行時空熱點分析,得到游客情感冷、熱點空間分布,如表4所示。情感熱點區域主要分布在主城區,在五環內以及六環邊緣均有分布,情感冷點區域主要分布六環以外以及郊區。這表明游客在北京旅游主要選擇在主城區游覽,少部分人選擇到郊區旅游。造成這一現象的原因可能與旅游資源分布有關,因為北京大部分知名景區主要分布于主城區。

表4 情感時空熱點分布區域
本文以北京市的16個市轄區作為案例地,借助新浪微博數據,通過文本分析和空間分析等方法,分析北京游客旅游活動中情感變化的特點和時空規律,體現出以下特點:
高頻詞反映出游客在北京旅游的主要目的地,具有文化和歷史的5A級景區成為游客來京的首選。“打卡”“吃”“走”“拍”和“逛”等高頻詞體現游客旅游的主要旅游活動。“天氣”“好熱”等高頻詞可以看出游客對于天氣的關注以及游客對炎熱天氣的抱怨。“烤鴨”“好吃”等高頻詞可以看出游客對北京特色美食的關注。游客情感表達中存在明顯的正面傾向,正面情感微博數量比負面情感微博數量多。游客的積極情感多表現為贊美、良好體驗、文化豐富等。消極情感主要與人流量大、景區服務質量欠佳、較差的天氣狀況等因素有關。在游客情感值空間分布上,情感熱點區域主要分布在主城區,在五環內以及六環邊緣均有分布,情感冷點區域主要分布六環以外以及郊區。
5.2.1 完善景區規劃與管理
為進一步促進北京游客的積極情緒,在景區開發與管理中應當加強客流管理,以減少游客排隊等候時間,以確保游客旅游體驗質量。加強市場監管,嚴厲打擊宰客行為,及時處理游客投訴。此外,加大景區基礎設施建設,提高景區從業人員素質,為游客提供優質旅游服務。
5.2.2 強化景區特色優勢
從語義網絡分析中可以看出,游客對于北京許多景區展現的歷史、文化內涵的滿意。北京擁有大量傳統文化,應該以文旅融合為突破口,充分挖掘北京中軸線文化、長城文化、紅色文化等資源優勢,豐富游客體驗。此外,培育具有北京特色的旅游產品、旅游線路,打造北京城市旅游名片,不斷豐富旅游產品和服務內容。
5.2.3 引入創新技術應用
景區可以利用數字化智慧平臺、票務系統等,通過智能監控、分流管控、人員疏導等措施,實行限時限量、分流入園接待服務。新技術對可能出現的大客流能夠采取遠端分流限流、近端疏導等防聚舉措,為游客提供放心舒適的游覽環境。將大數據技術應用于旅游投訴的受理、處理,提高服務效率和服務水平,推動旅游景區高質量發展。