王韓亮 王冰雪 高鑫月 劉文寶
(山東科技大學 測繪與空間信息學院, 山東 青島 266590)
旅游流屬于旅游學和地理學的交叉研究,其概念有廣義與狹義之分,廣義的旅游流是旅游客流、信息流、資金流、物質流、能量流和文化流的集合,狹義的旅游流單指旅游客流[1]。本文所研究的就是狹義上的旅游流。
國外對旅游流的研究最早始于20世紀60年代,研究內容主要集中于旅游流影響[2]、流量統計與預測[3]、空間結構[4]等方面。國內對旅游流的研究從20世紀90年代才逐漸興起,從研究對象上看,主要分為兩部分:一是針對入境旅游流研究,主要包括入境旅游流時空演化[5-6]、擴散特征[7]、空間結構[8-9]、影響因素[10-11]等方面;二是針對國內旅游流的研究,集中在旅游流網絡結構特征[12]、空間結構[13-15]、時空分布[16-17]等方面。從研究尺度上看,在國家和區域層面做出的研究較多,對市域旅游流的研究相對匱乏,主要原因就是長時段細粒度化的旅游流數據難以獲取。
大數據背景下,網絡上產生的大量帶有游客活動時間、位置等信息的“數字足跡”,可真實還原游客實地旅游的時空軌跡。因此,本文基于“數字足跡”,采集“去哪兒網”平臺提供的游客公開發布的游記數據,試圖使用高峰指數、核密度分析法總結北京市旅游流的時空特征,使用社會網絡分析法分析其網絡結構特征,從實踐上為旅游目的地的開發與管理、旅游線路的設計及營銷、不同景區之間的合作等方面提供理論參考。
本研究選取北京市為案例地。北京作為聞名遐邇的東方古都和當代中國的首都,長期以來一直是中國最重要的旅游目的地城市之一,境內文化燦爛,風景秀麗,全市文物古跡多達7 300多項,旅游景點200余處,在旅游資源上有著得天獨厚的條件優勢。2008年北京奧運會的舉辦,促使北京的旅游市場進一步升溫,游客數量和旅游收入屢創新高。以2019年為例,北京市國內游客接待量達31 833萬人次,國內旅游總收入為5 866.2億元,占當年北京市生產總值的17%(資料來源:北京旅游局)。因此,本文選取北京市作為案例地,將北京市內的旅游景區、景點作為旅游節點,探究北京市旅游流的時空特征以及網絡結構特征。
在數據源網站的選擇上,考慮到網絡平臺的權威性,選取目前全球最大的中文在線旅游網站“去哪兒網”(https:∥www.qunar.com/),該網站成立15年來,用戶量已累積至6億人,擁有120萬余條度假線路。本文使用網絡爬蟲技術采集“去哪兒網”公開發布的游記數據,總計6 335篇,時間跨度從2013—2021年,數據結構包括用戶id、出游時間、逗留時長、行程節點等游客信息。
由于數據量較大且研究對象為北京市城市旅游流,為進一步甄別有效的數字足跡,在分析之前需要對數據進行必要的清洗。清洗步驟為:(1)部分游客只是將北京作為整個旅游行程中的一站,故將行程中北京市以外的節點剔除;(2)剔除行程中只包含一個景點或者僅重復游覽一個景點的數據(例如,一些游客在不同的季節去游玩故宮,旨在體驗故宮四季的不同);(3)根據景點的地理位置、知名度等特征,對規模較小、從屬于上一級的景點進行歸并處理;(4)確定景點數量,剔除游客到達次數小于15的旅游景點,最終保留旅游節點50個;(5)2020年(疫情原因)和2021年數據量少且不完整,將這兩年的數據剔除,最終剩余1 680條數據,作為本研究的數據基礎。
本研究以北京市旅游流的時空分布特征和網絡結構特征為研究對象。以“月”為時間單位,采用流量占比指數、高峰指數兩個指標衡量北京市旅游流的時間特征,其中,流量占比等于某一時間段內的流量比上當年的總流量;采用ArcGIS空間分析方法中的核密度分析法揭示北京市“熱點區”和“冷點區”的空間分布特征;采用社會網絡分析法研究北京市旅游流的網絡結構特征。
1.3.1 時間特征分析
本文在分析北京市客流量的月變化趨勢的同時,在此基礎使用高峰指數進一步探討北京市旅游客流量的時間變化規律。高峰指數表示某一時期相對于其他時期利用旅游設施的程度,其計算公式為
式中,Mn為峰值指數;u1為所有研究時段中最繁忙時段的客流量;n為將各個時段按照客流量進行排序之后某個時段的排名,1為旅游流規模最大、最繁忙的時段;un為旅游流量第n位的對應時段的客流量。
1.3.2 空間特征分析
使用地理信息系統(geographic information system,GIS)空間分析法中的核密度分析法可以獲知旅游流在整個研究區域的集聚情況。其原理是對輸入的離散點數據或線數據使用內插的方法,將輸入數據的測量分布在整個表面上,以生成一個可以反映區域內集聚情況的連續表面。
本文所研究的50個景點中,有47個位于主城區,據此,借助ArcGIS 10.2軟件,采用核密度分析方法,重點研究北京市主城區的流量密度分布特征。采用詹克斯(Jenks)自然間斷點分級法,將分析結果分為1至5五個等級,級別越高表示集聚程度越高,將4以上的區域定義為旅游熱點區域。
1.3.3 網絡特征分析
對城市旅游流網絡結構的評價指標體系由旅游節點結構和旅游網絡結構兩個方面組成[12]。本文根據研究需要,選取節點結構中的節點中心性、網絡結構中的網絡規模和網絡密度三個評價指標,建立評價指標體系。
根據北京市2013—2019年的客流量數據,統計各個月份的客流量與相應月份的平均客流量,如圖1所示,以此分析北京市旅游流年內整體變化的特征和規律。
從圖1可以看出,北京市旅游流的年內變化總體上比較平緩,除3月、11月和12月之外,其余月份的客流量基本上都占全年客流量的10%左右;在上半年,北京市的旅游流變化呈“雙峰山嶺”分布特征,兩個較為突出的主峰分別是2月和4月。2月份的流量水平較高,究其原因,是2月份賦予了人們更加充足的旅游時間:從1月底開始,中小學及各高校陸續進入寒假時間,學生的出游量會有所增加,另外,2013—2019年的春節假期(14年除外),都處于2月份中;4月和5月,天氣漸暖,氣溫溫和,是旅游的較佳時期,而且分別經歷了清明節和勞動節兩個法定節假日,總體客流量較大;6月的氣溫較為炎熱,并不是旅游的最佳時期,但是6月經歷了高考和中考,廣大的學生群體再次獲得了旅行時間,在一定程度上促進了旅游流量的增加,所以相比5月,6月份的客流量不但沒有因為氣溫的原因下降,反而呈上升趨勢。在下半年,流量變化呈“階梯”下降趨勢。7月、8月正值暑期,游客有外出的時間,整體流量較大,但8月底至九月初學校開學,客流量有所緩降;10月份北京的氣溫驟降,尤其在10月下旬,但是有國慶黃金周加持,流量降幅并不大;11、12兩個月份的氣溫,已經不適合出游,流量出現斷崖式下跌。

圖1 北京市客流量月份圖
為進一步探討北京旅游流在哪些時間段形成了客流高峰,研究引入飽和曲線和高峰指數(圖2)。曲線下降的幅度越大,表明客流量在該時間段增長迅速,形成了突出的客流高峰。由圖可知,7月、8月、2月和9月,是北京市的客流高峰時段。

圖2 北京市旅游流飽和曲線及峰值指數曲線
由于以上分析結果僅基于一種數據源(網絡游記數據),故分析結果的有效性和準確性有待驗證。研究從北京市文化和旅游局收集北京市2015—2019年各月份的游客接待量數據和旅游收入數據(數據地址:http:∥whlyj.beijing.gov.cn/zwgk/zxgs/tjxx/history/),見圖3、圖4。

圖3 各月份接待人數

圖4 各月份旅游收入
將圖1與圖3、圖4進行對比分析,可以很直觀地發現它們的總體變化趨勢具有很強的同步性。為進一步說明三組數據具有較強的相關性,研究使用埃菲沃斯(EViews)軟件,對北京市每個月的平均客流量占比(圖1)、平均接待人數(圖3)、平均旅游收入(圖4)數據進行相關性檢驗,結果顯示:(1)平均接待人數與平均旅游收入的相關系數為0.916 319 496,旅游接待人數與旅游收入呈顯著正相關;(2)平均客流量占比與平均接待人數、平均旅游收入的相關系數分別為0.744 490 811和0.644 317 281,具有較強的相關性。以上結果表明,網絡游記數據與北京市文化和旅游局發布的官方數據具有很強的相關性,說明研究所使用的游記數據具有較強的代表性,能夠反映北京市旅游流的真實情況。
基于各個景點的游客流量統計數據,利用ArcGIS中的核密度分析法對北京市旅游流的集聚情況進行表征。從圖5可以看出,北京市的旅游流空間分布具有明顯的等級分異特征,旅游流的密度分布具有顯著的不均衡性。具體來看:北京市旅游流整體上呈“小聚集、大分散”的分布特征,在中心城區主要集中于東城區的北半部分,在非中心城區則以“小型化、斑塊化”的狀態分布。旅游流呈現如此鮮明的等級分異特征,旅游吸引物是首要影響因素,其次為各城區的交通便捷度。

圖5 北京市主城區旅游熱點集聚分布[審圖號為京S(2021)023號]
從旅游吸引物來看,東城區的景點數量最多,約占據整個主城區景點的30%,它們大多盤踞在東城區的北部。在這些景點中,不乏像故宮、天壇、北海公園這樣的5A級、4A級景區,這些景區作為城市的品牌象征,對外來游客和本地居民有較強的吸引力。西城區、豐臺區和石景山區內的旅游吸引物較少(景點數:石景山區0,豐臺區1,西城區3),且景點對游客吸引力不強,因此沒有熱點區域。海淀區的頤和園,作為保存最為完整的一座皇家行宮御苑,是中國近代史的重要見證,歷史背景頗為雄厚,朝陽區的鳥巢、水立方,作為北京奧運會的標志性建筑,自2008年奧運會舉辦以來,知名度大增,對游客的吸引力較大,因此,海淀區和朝陽區的熱點區域以這些景點為中心,呈斑點狀分布。
從北京市各城區的交通便捷度來看,王德利等人采用問卷調查的方式,選取公共設施滿意度、道路通達滿意度、通勤滿意度、日常生活滿意度及到達市中心的便捷度五項反映區域出行便捷性的指標,統計北京市主城區內居民出行滿意度的空間分異特征[18]。結果顯示,東城區、西城區、朝陽區西部以及海淀區的東南部,各個指標都處于很高的水平,所以旅游熱點區域大多散布在這些區域;而豐臺區、石景山區、海淀區和朝陽區的絕大部分區域,由于城市建設與城市交通基礎設施發展不協調、道路網絡規劃不盡合理等原因,各項指標值均偏低,故在這些區域鮮有旅游熱點區,整體客流量水平較低。
此部分的研究,首先使用格菲(Gephi)軟件繪制北京市旅游流網絡結構圖,接著使用烏西內特(Ucinet)軟件的網絡模塊,分別計算北京市旅游流網絡的網絡規模、密度和節點中心性三方面的指標數值,據此分析北京市的網絡結構特征。
2.3.1 網絡規模及密度
根據1 680條游客路徑數據,建立賦值矩陣,在賦值矩陣的基礎上建立二分矩陣,此時需要選擇合適的斷點值,經過反復測試,選擇8為斷點值,此時在44個旅游節點之間存在旅游空間聯系。基于二分矩陣,使用Gephi軟件構建北京市旅游流網絡結構圖(圖6),在網絡圖的繪制過程中,分別使用程度中心性和流量渲染節點的大小和連線的粗細。

圖6 北京市旅游流網絡結構圖
在北京市總體旅游節點中,44個旅游節點實際僅存在308個聯結數量,網絡密度低至0.162 8,說明北京市各旅游節點之間的聯動性較差,網絡結構十分松散。
2.3.2 中心性
將北京市旅游流網絡中各節點的程度中心性、親近性和中介性數值整理成表1。從各指標的均值來看,內外向的程度中心性的均值均為7,表明在北京市旅游流網絡中,所選取的44個旅游節點平均每個節點與7個其他節點存在旅游流集聚與輻射聯系;內外向親近性的均值不高,且方差較小,說明各旅游節點之間的聯系普遍不太緊密;中介性的均值為49.205,表明平均每個節點在網絡中充當旅游流中介者的次數為49.205,但其過高的方差,表明相當一部分節點之間并無直接聯系,是核心節點間接使它們發生了聯結。
結合分析表1和圖6,可以發現南鑼鼓巷、八達嶺長城、故宮、天安門廣場等節點的程度中心性很高,說明這些節點的集聚和輻射能力很強,在網絡中居于核心地位,可以在這些節點設置游客服務中心或次級游客服務中心,提供旅游信息咨詢和旅游特色商品。為了更直觀地對比各個節點中介性的差異,將節點的中介性用圖7進行展示,可以看出,天安門廣場、南鑼鼓巷、八達嶺長城、天壇的中介性指標很高,其他旅游節點對它們具有較強的依賴性。對于各項中心性指標都比較低的節點,如北京自然博物館、大觀園、香山公園等,這些節點與主要旅游節點有很少的聯結,加大旅游項目的開發力度,做大做強旅游品牌,提升交通的通達性,加強與核心節點組合旅游線路最為重要。

表1 北京市旅游節點結構指標

圖7 北京市旅游節點中介中心性指標比較
本研究基于“去哪兒網”的游記數據,對北京市旅游流的時空及網絡特征進行研究,得出以下結論:
(1)受氣溫舒適度和休閑時間的影響,北京市旅游流在2月、7月至9月形成客流高峰。在上半年,北京市旅游客流量的變化呈“雙峰山嶺”型分布特征,兩個主峰分別是二月和四月;在下半年,除11月、12月份因氣溫較冷影響了外出活動的便利性,其余月份在全年都處于較高水平。
(2)北京市旅游流的空間分布具有顯著的等級分異特征,總體上呈現“小聚集、大分散”的特征,在中心城區高度集中于東城區的北部,在非中心城區則以“小型化、斑塊化”的特征分布。對流量較高的節點進行分析,發現它們大都屬于歷史文化遺跡。北京市旅游流的空間分布特征表明:旅游吸引物是游客空間集聚的主導因素,景點的文化底蘊是特色要素。
(3)在北京市旅游流網絡中,所選取的44個旅游節點平均每個節點與7個其他節點存在著旅游流集聚與輻射聯系;平均每個節點充當旅游流中介者的次數為49.205。但旅游網絡中各旅游節點之間分布十分不均衡,網絡密度也很低(0.162 8),只在幾個比較受歡迎的節點之間存在較強的聯動性。
同傳統方法相比,“旅游數字足跡”具有獲取成本低、時空結合性強、處理方便等優點,但是,每一種數據都有其自己的優缺點和適用空間尺度,沒有哪一種數據可以完整記錄所有游客的流動軌跡,這在一定程度上會影響研究結果的準確性和科學性。使用多源數據進行交互驗證和融合,就可以有效解決上述問題,但本文的數據源只有一種,而且在數字足跡提取的規范性和科學性等問題上,也需要進一步探討。應融合不同類型、不同平臺的旅游數據,將有助于更好地揭示旅游流發展特征,以期為城市旅游提供智能化支持。