陳 宇 卞書娣 張曉涵
(山東科技大學 測繪與空間信息學院, 山東 青島 266590)
旅游流即游客在旅行過程中,產生于旅游空間場內的空間流動,是旅游系統中的神經中樞和紐帶。游客根據自己的主觀意愿從某地出發到一個或多個旅游目的地之間的空間移動可概述為狹義的旅游流[1],狹義旅游流是本文所研究的主要內容。
傳統的旅游流研究大多基于統計年鑒和調查問卷[2]的數據,這類研究通常會由于數據細粒度不足而阻礙旅游流的研究發展。Girardin等將游客在旅行期間或旅行結束后通過互聯網共享平臺和社交媒體等信息系統發布的信息(如文本、圖片、通話記錄等)稱為“數字足跡”[3]。數字足跡可以獲得游客的群體時空流動信息,為游客行為信息的采集和研究視角提供了新的思路[4]。國外旅游流的研究早于國內,于20世紀60年代就有國外學者對旅游流展開了研究。研究內容聚焦于空間流動模式和個體行為特征[5-6]、游客群體的移動模式[7]、影響因素[8-9]等方面;國內對旅游流的研究起步較晚但發展迅速,并取得了豐碩的研究成果。研究內容主要聚集在旅游流的時空分布特征[10-11]、空間模式[12-13]、影響因素[14-16]等方面。
近年來,隨著網絡的發展,越來越多的游客會在社交媒體平臺分享自己的旅游信息,從而產生大量帶有地理位置信息、旅游時間和旅游偏好等信息的“旅游數字足跡”數據,這些信息為研究旅游者的時空行為特征提供了豐富的數據源。內蒙古自治區地廣人稀,自然風光旅游資源豐富與民族文化底蘊深厚,更以獨特的草原文化、中蒙與中俄邊界國門景區,每年吸引眾多游客來此旅游。因此,本文以中國內蒙古自治區為例,利用去哪兒網的網絡游記數據對赴內蒙古游客進行時空特征分析,研究結果為旅游目的地的旅游資源分配、景區開發與管理以及旅游路線營銷等方面提供理論依據。
內蒙古自治區地處我國北部邊疆,是我國跨經度最大的省份,自然和人文旅游資源豐富,內蒙古草原、古跡、沙、琥珀、森林、民宿等“六大奇觀”構成獨特的旅游勝景,有著悠久的歷史和深厚的民族文化底蘊,在旅游資源上擁有著得天獨厚的自然資源條件優勢。2019年內蒙古游客接待量19 512.48萬人次,同比增長10.05%,實現旅游業綜合收入4 651.49億元,同比增長12.01%。
去哪兒網(https://www.qunar.com/)是目前全球最大的中文在線旅游網站,是中國領先的旅游搜索引擎,該網站成立17年來,累計用戶量近6億,全球范圍內應用程序(application,APP)累積下載量超過60億。本文使用網絡爬蟲技術采集“去哪兒網”公開發布的網絡游記數據,獲取到時間跨度從2009—2021年的網絡游記3289篇,數據主要包括用戶身份標識號(identity document,Id)、游記Id、出游日期以及旅游景點的興趣點(point of interest,POI)序列等游客旅游信息,如表1所示。

表1 網絡游記示例數據
由于網絡游記數據量較大又受游客主觀因素影響等特性,經常出現信息錯誤或者邏輯表達不準確等問題。因此,本文采用以下規則對數據進行清洗從而甄別有效的數字足跡:①區域裁剪,因為在部分網絡游記中,內蒙古僅是游客途徑的一站,從而需要清理除內蒙古以外的景點POI記錄。②時間節點挑選,2014年前的網絡游記數據稀少,2020年和2021年因為疫情原因導致數據量少且不太完整,故只保留2014年到2019年底之間的數據。③景點合并,對隸屬于大型景點的小型景點POI進行合并。④景點去重,剔除網絡游記中連續出現的相同的POI編號,則將其歸為該游客沒有進行景點移動,需要將多余的POI從游玩景點POI序列中刪除。⑤剔除孤點數據,刪除游客行程中只包含了一個景點,即網絡游記的游玩景點POI序列只有一個,則將其刪除。⑥確定研究景點數量,剔除掉游客到達次數少于35的旅游景點,最終保留49個旅游節點。進行數據清理后共保留游客在1 114篇網絡游記中關于49個景點的瀏覽記錄。
1.4.1 統計分析
統計分析法指通過對研究對象的數量關系的分析,以發現和揭示事物間的相互關系、變化特征以及發展趨勢的一種解釋和預測某事物的方法。時間特征的分析是研究旅游流的基本內容,本文以網絡游記中反映游客旅行的出游時間、停留時間進行統計,以圖表可視化的形式直觀地反映出旅游流的時間特征。
1.4.2空間分析
核密度估計實質是計算點或線在某一鄰域內的空間格局密度,能直觀地反映出離散值在整個研究區域內的離散情況。核密度估計計算公式如下:
(1)
式中,f為所設的概率密度函數;x1,x2…xn為獨立樣本點;K(.)為核函數;h>0表示為一個平滑函數稱為帶寬;x-xi表示為x到某一樣本點xi的距離。
本文使用ArcGIS 10.2軟件,采用密度分析中的核密度分析法,以網絡游記數據中所研究的49個景點為案例,研究內蒙古的旅游流客流量密度分布特征。
1.4.3旅游流網絡分析
旅游流網絡分析根據網絡游記數據,構建旅游流網絡結構,從而揭示出游客到各景點之間的空間聯系規律[17]。本文使用社會網絡分析法,選取中心性分析、結構洞測量與社區探測3個指標數值來分析內蒙古旅游流網絡的結構特征。
統計網絡游記2014—2019年的旅游流時間數據,聚焦游客旅游頻率,并繪制游客月際旅游頻率占比圖(圖1),橫軸表示月份,縱軸表示各月內蒙古游客到訪頻率占比。
從圖1的全年數據分布可以看出,旅游流月際數據呈“山峰”型分布,表現出明顯的季度分布特征,游客赴內蒙古旅游時間主要集中在第三季度,第三季度游客旅游頻率占比約為61.46%,超過了總體年份頻率占比的五分之三。具體分析來看,6月至9月期間游客到訪頻率較高,可解釋為正處于學生暑假期間,又草原草場肥沃,景色宜人,且內蒙古位于我國高緯度地區,夏天氣候涼爽適宜避暑;5月和10月出現兩個小高峰,恰逢五一勞動節和十一國慶節兩個小長假,分別處于內蒙古氣溫回升和氣溫急劇下降的兩個節點月份,所以到訪游客數量略低于6月到9月;而11月至來年4月,盡管在此期間恰逢我國的農歷春節,但此時內蒙古氣候極為寒冷,達到全年最低溫,又3月至4月期間各單位工作開始步入正軌,且沒有較長的假期,因此在這6個月客流量大幅減少。

圖1 游客到訪景點月際頻率占比圖
為進一步分析內蒙古各景點對游客的吸引力強弱程度,將2014年到2019年的網絡游記中游客在內蒙古景點停留時間進行統計,并進行數據圖表可視化(圖2)。在圖表中可以清晰地發現游客在內蒙古停留時間基本分布在1~20 d,停留時間在1~3 d的數據高達62.01%,其中停留時間為1 d占整體的29.72%,停留時間在4~9 d的數據占總樣本數據的28.72%,而停留時間超過10 d的數據之和僅為9.27%。聚焦停留時間占比以上分析得出,游客在內蒙古旅游大多數為短期出游,多為1~4 d,這主要與內蒙古的旅游資源分布有關,例如滿洲里國門景區、滿洲里套娃景區、呼倫湖、呼倫貝爾大草原、白樺林景區等分布集中,大多都是草原自然風光等風景區,晝夜溫差大,受交通不便利居住不方便等因素的影響,適合短期出游。

圖2 各景點游客停留時間占比圖
通過對網絡游記數據的處理,體現出數字足跡景點到訪頻率的占比即該景點客流量的大小,對內蒙古49個景點的游客到訪頻率進行統計,結合式(1)進行核密度計算,并使用ArcGIS 10.2的核密度分析法對內蒙古旅游流的離散集聚情況進行可視化表達(圖3),圖例由上至下代表旅游流熱度空間從高到低分布。

【審圖號為GS(2019)3333號】
從圖中來看,內蒙古旅游流空間分布密度具有明顯的層級分布特征,旅游流的密度分布極具不均衡性。具體分析,內蒙古在“蒙東”的景點成為旅游熱點區域,且分布聚集,這和滿洲里與呼倫貝爾等“蒙東”地區的旅游資源、景區知名度、景點交通可達性等因素有著密不可分的聯系;而“蒙西”的景點分布較為分散,并且旅游流分布的密度較低,這與“蒙西”地區多為荒漠、氣候環境較差、人煙稀疏等因素緊密相關;其余密度分布為空的地區多因旅游資源匱乏、交通可達性差、基礎設施配套薄弱等原因,導致對游客吸引力較低,從而成為內蒙古旅游發展的劣勢區域。
游客會在不同景點之間進行空間移動,從而產生的旅游流如同“網格”一樣緊密相連,由此形成旅游數字足跡旅游流的網絡化結構。本文對網絡結構的研究使用中心性、結構洞、社區探測3個指標,對內蒙古49個旅游節點進行網絡特征分析。
對游客在景點之間的移動數據進行矩陣化,使用Ucient軟件的網絡模塊進行中心性和結構洞的分析;將景區節點之間的旅游流向和流量數據整理成矩陣表格,并導入Gephi軟件中,然后使用模塊化進行社區探測分析,并依據社區探測的分析結果進行網絡結構的可視化。
2.3.1中心性分析
本文根據內蒙古旅游流網絡中各節點之間的流向數據,計算其度數中心度、接近中心度以及中介中心度,并將所得結果的值進行表格輸出(表2)。

表2 內蒙古旅游節點中心度指標
依據表1中的旅游節點中心度的計算結果可知,程度中心度的均值為5.776,則表示該旅游流網絡中的49個節點,平均每個節點與5.776個節點之間存在聚散關系,從表中可以發現呼倫貝爾大草原、額爾古納濕地、莫爾道嘎國家森林公園等旅游節點的外向和內向度數中心度都較高,說明這些節點的聚散能力都很強,在網絡中處于核心位置;外向接近中心度的均值低于內向接近中心度的均值,說明這些景點的接納性要高于外出性,大部分節點的內外向接近中心度的值處于平均水平,且相互間的差異較小,表明這些節點之間具有良好的聯動效應,但可以發現一些節點的接近中心性值明顯低于平均水平,故可以推斷出這些節點的接納性與外出性都很低,在網絡結構中屬于被孤立的節點;從表中發現中介中心度的均值為58.367,但其方差高達到13 651.920,這說明網絡中各節點的中介中心度指標值相差巨大,而且部分節點的中介中心度值為0,這表明在網絡中這些節點不扮演中轉的角色,被游客作為起始目標或最后一站,在這些旅游景點應加大旅游開發力度,提升交通可達性,加強與核心景點的連通性,而例如呼倫貝爾大草原、呼倫湖、額爾古納濕地等中介中心度指標值較高,在旅游流中起到較大的中轉作用。
2.3.2結構洞分析
本文使用效能性和約束性對結構洞測量進行分析。效能性是指旅游流網絡中某一節點的有效規模與實際規模之比,衡量了目標旅游流節點與所有其他旅游流節點連接的非冗余性部分,節點的效能性越高,該節點在旅游流網絡中的競爭優勢就越明顯;約束性是指計算網絡中的某一節點直接或者間接依賴其他節點的程度,反映了目標旅游流節點直接和間接依賴其他旅游流節點的程度,約束性越小,表示旅游流節點在區域內具有核心地位且具有競爭優勢,反之約束性越大則表示該節點受其他旅游流節點的輻射性大且在競爭處于劣勢。
部分旅游流網絡節點的計算結果如表3所示,并根據結構洞的效能性和約束性指標對旅游流網絡進行可視化,結果如圖3所示。圖中節點的大小代表結構洞效能性和約束性指標的大小,網絡節點間的連線粗細程度表示旅游流中各節點之間旅游流客流量的大小,保留結構洞指標數值前15位的旅游節點的標注。

表3 結構洞測量計算指標
結合表2和圖4,同時對比圖4(a)和圖4(b),從結構洞的指標分析結果可以看出,內蒙古旅游流節點在網絡中的分布具有明顯的規律性,呼倫貝爾大草原、滿洲里國門景區、滿洲里套娃景區、呼倫湖、白樺林景區以及阿爾山森林公園等多個景點具有較高的效能性和較低的約束性,表明這些景點在旅游流網絡中通常是優勢景點,相比其他景點更具有競爭優勢,并受周邊景點的影響較小;相比于響沙灣、庫布齊沙漠、將軍泡子以及杜鵑湖等節點表現出的低效能性、高約束的特征產生鮮明的對比,說明這些景點在旅游流網絡中處于劣勢,并受周邊景點的影響較大;而像策克口岸這類景點,效能性和約束性指標值都不低,在旅游流網絡中受周邊景區影響較大,但通過有效的運營此類景點在旅游流網絡中也可成為優勢景點。

(a)效能性分布
2.3.3社區探測
本文對內蒙古旅游流網絡進行社區探測,為避免分辨率受限等問題,設置以0為起始分辨率,按照0.1頻率遞增,通過每次運行的分辨率以及模塊化的數量,確定以0.8為分辨率進行社區探測,并進行網絡結構圖的可視化,節點的顏色以模塊化的結果進行分布,邊的粗細代表旅游流流量的大小,見圖5。
通過對內蒙古景點的社區探測結果進行總結,可知游客赴內蒙古旅游社區大致可分為六個層級,以呼倫貝爾大草原為核心組成的第一層級;以莫爾道嘎國家森林公園核心組成的第二層級;以滿洲里套娃景區為核心組成的第三層級;以內蒙古博物館為核心組成的第四層級;以阿爾山森林公園組成的第五層級;以達里諾爾湖為核心組成的第六層級。而通過對以上六個層級的景點在網絡中的地理位置分布并結合圖3分析,得出游客在內蒙古旅游社區主要分為三個社區,以呼倫貝爾市為核心組成的“蒙東”第一社區,以阿爾山市為核心組成的“蒙東”第二社區,以呼和浩特市為核心的“呼包鄂蒙西”第三社區,見圖6。

【審圖號GS(2019)3266號】
本文以“去哪兒網”網絡游記數據為數據源,以內蒙古自治區為研究區域,運用統計分析、地理信息系統(geographic information system,GIS)核密度分析、社會網絡分析等研究方法對內蒙古旅游流時空特征及網絡特征進行研究。得出以下結論:
(1)游客赴內蒙古旅游流在時間特征上淡旺季明顯且表現出較為顯著的季節性特征。旺季主要分布在7、8、9月,淡季則主要分布在11、12、1、2、3、4、5月,呈現“山峰”型分布特征。游客在內蒙古旅游停留時間主要集中在1~3 d,說明氣候與交通便利性等客觀條件對游客赴內蒙古旅游有著較為顯著的影響。
(2)內蒙古旅游流的節點具有不均衡性。在蒙東地區的旅游流資源分布集聚,旅游流的熱門區域主要聚焦在以呼倫貝爾大草原、滿洲里國門景區、滿洲里套娃景區等節點為核心的知名草原景區,且中俄蒙邊境地區呈現出獨特的異域風情,而蒙西景點較為分散且知名度低,交通便利性差,表現出的旅游流分布特征較為離散。
(3)內蒙古旅游流以選取的49個節點為例形成網絡圖,表現出網絡內部整體關聯性較差,具有明顯的層級分化,旅游節點在網絡中的中心度指標值差異明顯,以呼倫貝爾等蒙東盟市為核心的景點是旅游流網絡的核心區域。
綜上所述,本文對內蒙古旅游流時空特征及網絡結構進行分析,對當地旅游業的發展提供參考依據。由于內蒙古地域遼闊,我們通常認為游客赴內蒙古旅游多為長期旅游,然而依據本文研究所得結果,大多數游客選擇在第三季度1~3 d的短期旅游,這主要由于內蒙古知名旅游景點集聚,旅游資源多分布在以呼倫貝爾為核心的蒙東地區,蒙西旅游資源匱乏,且交通便利性差等因素也是限制游客出游的主要原因。