濮 蓉,陶卓民,濮元生,榮慧芳,劉培學
(1.南京師范大學 地理科學學院,南京 210023;2.江蘇省地理信息資源開發與利用協同創新中心,南京 210023;3.江蘇聯合職業技術學院南京工程分院,南京 211135;4.南京大學地理與海洋科學學院,南京 210093)
隨著互聯網的規范化和價值化,網民們線上活動越發積極,據中國互聯網絡信息中心調查公示,截至2016年末我國網民接近7.4億,互聯網普及率超過50%,人均每周上網時長達26 h。其中線上旅行預訂用戶規模達到3.34億,接近網民總量的一半。旅游者線上旅游行為已經成為各大旅游企業關注的重點。隨著數據對社會各領域的影響逐漸突出,作為三大運營商之一的中國電信也積極挖掘其億級用戶數據在旅游行業中的應用價值,助力中國旅游產業發展,并逐步成為我國旅游產業中舉足輕重的一環。電信用戶線上數據受商務、研學等外部客觀因素造成的“順便旅游行為”影響較小,可以客觀反映出潛在游客對旅游目的地的到訪意愿,即網站線上搜索量可以間接映射出旅游者的旅游傾向,進一步構建潛在旅游流網絡結構,可以突破傳統實際旅游活動下的旅游流研究,豐富旅游地理學研究內容,為區域發展提供參考。
一直以來關于旅游流空間結構的研討不斷,國內外學者以中心地理論、核心—邊緣理論、增長極理論等為基礎,提出大量旅游流空間結構模型,如 Campbell[1]的旅游流流動模型,Lundgren[2]的旅游流空間分層模型,Dainne[3]提出的多目的地旅游流空間結構模型,具備了初步的旅游流網絡思想,吳必虎[4]基于圈層理論提出環城游憩帶理論。在旅游流空間結構特征和演化機制方面,國外學者最早運用社會網絡分析法對旅游流空間特征進行實證研究[5-6],主要體現在2個層面上:一是對區域內的旅游流進行分析,通過結構研究對旅游流進行相應解釋;二是以“關系”為研究基點,探討各種關系所構成網絡的形成與演化[7-8]。國內學者的研究主要應用于前者,如楊興柱等[9]利用社會網絡分析法研究城市旅游流網絡的結構特征,深入探討城市旅游流網絡結構的評價指標體系;劉宏盈等[10]從旅游線路視角剖析泛北部灣區域的網絡結構特征;馬麗君等[11]利用社會網絡分析揭示典型城市居民國內旅游流網絡結構特征;文彤等[12]以馬蜂窩網作為研究對象,運用社會網絡分析軟件建立旅游虛擬社區成員互動關系網絡,發現社區網絡呈現出明顯的分散狀態。在旅游流影響因素研究方面,不少學者分別將客源地及目的地自身屬性作為解釋變量來研究各因素如何影響旅游流空間結構[13-17],其中尤以“推拉阻”理論為代表,李山等[18]基于威爾遜形式,從“推拉阻”3個方面選擇影響變量來構建基礎的旅游引力模型。此外,劉法建等[19]從旅游地供給屬性出發研究入境旅游者空間移動的動力機制,發現自然資源因素、經濟發展水平、對外聯系度、空間距離等與之有強相關性。徐敏等[20-21]基于在線預訂數據,結合社會網絡分析技術,對長江三角洲地區旅游流影響因素進行了分析。
國內外學者對旅游流網絡結構特征和影響機制都做出了大量的工作,為旅游地理學的發展奠定了良好的基礎。然而研究大多基于傳統旅游統計資料,從對象屬性數據的視角出發,基于關系視角的研究并不多見。且在互聯網技術高速發展下,人們生活方式已有所改變,在旅游動機驅使下,用戶在旅游網站上的行為也會促成旅游流的形成,對于潛在游客及潛在旅游流的研究可以補充和豐富傳統旅游流網絡研究,為旅游市場的定位及區域發展提供參考。
本文數據主要來源于中國電信江蘇公司大數據智觀中心發布的2016年江蘇省各市電信用戶在OTA網站中對省內232個景區的搜索情況。根據搜索情況,將各景區搜索量匯總分類到所屬城市(圖1)。同時,據《江蘇旅游客情監測與分析2016年年度分析報告》顯示,2016年江蘇省實際接待的游客中省內跨城市游客共46 263萬人次,主要來自南京、蘇州、無錫、常州4地。且經濟情況較好的蘇南區域接待游客量遠遠高于蘇北區域。過夜的省內游客中,大部分游客選擇留宿在蘇州、無錫和南京;超過60%的游客把目的地選擇在蘇錫常都市圈內,其次為南京和揚州。由此可見,游客實際到訪旅游目的地情況與用戶搜索行為所反映出的旅游目的地傾向大致相同,可以驗證出旅游者線上線下行為具有共通性,實驗數據更具有科學性。
圖1 電信用戶跨城市搜索情況
由此,為探究江蘇省潛在旅游流結構特征,本文運用社會網絡分析法,嘗試利用電信數據構建江蘇省潛在旅游流網絡,步驟如下:首先,將江蘇省看作一個網絡,13個地級市為網絡中的節點;然后,將用戶搜索行為看作旅游者的空間移動,將用戶所搜索的景區歸屬到所在城市即目的地,而用戶所屬城市為客源地,二者皆是網絡中存在的節點,將數據處理后得到一個13×13的關系矩陣M;最后,對江蘇省潛在旅游流關系矩陣進行二值化處理,用截斷值來評判節點之間是否有聯系,有直接聯系的賦值為“1”,否則為“0”。針對不同的截斷值 C分別取 1、687、1 288、1 711、5 000(其中C=687和C=1 288分別為矩陣每列、行平均值經排序后選取的中間數;C=1 711為矩陣中169個數據的平均值),利用UCINET 6.186中可視化軟件NetDraw繪制出不同截斷值下的江蘇省潛在旅游流網絡示意圖(圖2),直觀地展現出江蘇省潛在旅游流網絡關系,在不同截斷值下,蘇南地區都能形成一個閉合圖形,網絡聯系密切,南京、無錫、蘇州、常州、鎮江等地有多條線路連接,旅游流動頻繁;蘇中地區情況一般,其中揚州和泰州情況略好;不同截斷值下蘇北地區常有孤立節點存在,網絡聯系較弱。其中當C=1時,旅游流網絡最完整,但整體網絡顯得復雜繁瑣;當C=5 000時,估計量偏大,網絡中有諸多節點獨立,對研究結果可能造成較大誤差。經過反復實驗最終選擇C=1 288作為截斷值,處理后得到二分矩陣Mb,在二分矩陣的基礎上進行后續網絡整體密度、核心—邊緣、節點中心性等研究。
圖2 不同截斷值下江蘇省潛在旅游流網絡
從空間關聯性來看,目的地流入量的變化不完全取決于目的地的自身屬性;同理,客源地流出量變化也不完全取決于客源地屬性,而是游客對客源地及目的地綜合考量的結果。因而客源地與目的地之間屬性差異,即解釋變量的差異也是影響旅游流空間結構的重要因素。本文基于研究區域的客觀實際,借鑒前人研究成果,將江蘇省潛在旅游流的影響變量概括為客源地與目的地之間的經濟發展水平差異、人口規模差異、可自由支配收入差異、旅游資源稟賦差異、旅游接待設施差異、人均私人汽車擁有量差異、網絡營銷水平、旅游交通條件等。其中旅游資源稟賦用4A、5A及新增景點數量來替代;旅游接待設施在本文中以星級酒店數量來衡量;考慮潛在旅游流的特殊性,本文將網絡營銷水平納入考慮因素,使用網站中旅游產品數量來替代;由于區域面積較小,本文將旅游交通條件分為2部分(公路距離和列車開行數量)。上述數據主要從《江蘇統計年鑒—2017》中獲取;兩地之間公路距離通過ArcGis軟件測得;旅游產品數量于2017年12月5日在同程途牛2個網站上獲得。列車開行數量于同一天在12306鐵路網站上獲取。由于本文研究的是關系的影響因素,無法用常規的統計檢驗方法來驗證數據之間是否存在顯著關系,本文選用社會網絡分析方法中的QAP(quadratic assignment procedure)分析方法來進行影響因素的研究[22]。基于此,構建如下模型:
式中:ELD為經濟發展水平差異;PSD為人口規模差異;ID為可自由支配收入差異;TRD為旅游資源稟賦差異;HD為旅游接待設施差異;PCD為人均私人汽車擁有量差異;NML為網絡營銷水平;RD為公路距離;TN為列車開行數量。式中除NML、RD、TN可直接列出關系矩陣外其余變量均建立差值矩陣,考慮到不同矩陣量化標準不同,使用極值標準化方法對上述矩陣進行處理[23],公式為
利用UCINET 6.186軟件對網絡整體結構進行評價,網絡密度值介于0和1之間,值越接近1則關系間越親密,越接近0則關系越疏遠[24]。結果顯示,江蘇省潛在旅游流整體網絡密度為0.25,密度值相對較低,聯結能力較弱,表明江蘇省13地市之間的旅游聯系相對稀疏。借助UCINET里的corr算法來實現核心—邊緣分析,處理后得到擬合指數為0.822,擬合較好,核心—邊緣假設成立。其中,網絡核心成員分別為南京、蘇州、無錫、常州,其余9個城市為邊緣成員。表1中顯示核心層密度達到0.917,邊緣層僅為0.194,說明江蘇省潛在旅游流網絡存在明顯的結構分層,核心成員聯系緊密,而邊緣成員之間的關系相對破碎,省內旅游發展處于不平衡階段。
表1 核心—邊緣密度分析結果
本文選擇節點的程度中心度、親近中心度及中間中心度來研究江蘇省潛在旅游流網絡節點的中心性,利用UCINET里的網絡中心度計算得到表2。表中顯示外向程度中心度最高的是南京,而內向程度中心度最高的是常州,說明這2個城市分別充當著網絡的發散和集聚中心,是省內最為重要的旅游客源地與目的地,而南京作為省會城市,其內向程度中心度表現一般,考慮到用戶線上行為的特殊性,南京作為省內政治經濟中心及文化名城,旅游線路及景點被大眾熟知,可能在一定程度上減少了用戶的搜索量;內向程度中心度大于外向程度中心度,表明旅游目的地屬性強于旅游客源地屬性,揚州、常州、泰州等地由于近幾年旅游基礎設施的提升,吸引了一大批省內潛在游客;蘇通大橋的通行,使得南通來往蘇錫常等地更加方便,但其內外向程度中心度差異較大,易于受到外界因素影響。整體而言,旅游發展較好的蘇南地區內外向程度中心度都位居前列,對省內大部分潛在游客有良好的吸引力,且蘇南地區的潛在游客也有較大的出行意愿。親近中心度與程度中心度的結果一般比較相近,故作為對程度中心度的補充判斷。南京、蘇州、常州、無錫的中間中心度值遠遠高于其他地區,在整個旅游流網絡中對省內其他地區的控制能力顯著,處于網絡的中心。通過節點中心性與核心—邊緣分析的結果可以大致推斷出旅游地的角色(表2)。
表2 旅游流網絡中心性及角色定位
將旅游流影響指標數據導入軟件計算,得到相關性分析結果(表3),旅游接待設施差異、列車開行數量、網絡營銷水平均在1%水平上顯著;人口規模及公路距離在5%水平上顯著,表明這些變量對潛在旅游流流動影響顯著,其中,公路距離系數為負值,說明公路距離越遠,潛在游客對自駕或乘車前往該地的意愿越小;經濟發展水平及旅游資源稟賦均在10%水平上顯著,表明這2個變量對潛在旅游流影響較為顯著;而其余變量未通過顯著性檢驗,研究意義不大。從相關系數上來看,列車開行數量系數最大,網絡營銷水平次之,表明鐵路交通的便捷程度及網絡宣傳營銷對潛在游客的旅游選擇有較大的影響,蘇州—南京—無錫—常州處于長三角高鐵一小時圈內,交通優勢明顯,而蘇北鐵路覆蓋率遠遠低于蘇南水平,大部分地區至今沒有開通高鐵,且距離本省政治經濟中心較遠,可達性較差,易限制潛在游客出游動機;潛在游客在選擇目的地時對網絡宣傳較好、產品豐富的旅游區更為關注。
表3 江蘇省潛在旅游流動因相關性及回歸分析結果
將選取的所有變量與江蘇省潛在旅游流流動矩陣進行回歸分析,回歸結果如表3所示。由于結果中存在很多未通過顯著性檢驗的變量,影響模型的擬合優度。進一步采取逐步回歸法,剔除不具有統計意義的變量,結果表明5個被保留的變量對因變量的解釋都達到了顯著性水平。調整后的判定系數R2并沒有因為因變量的減少而有大幅度的變化,反而從0.481提升到了0.486,在可接受范圍內,說明旅游接待設施差異、人均私人汽車擁有量差異、可自由支配收入差異、公路距離、列車開行數量這5個因素對自變量的解釋力為48.6%。旅游者的可自由支配收入及私家車擁有情況可以反映出居民生活水平,而旅游接待設施、居民生活水平及交通便捷度可以在一定程度上反映出地區社會經濟發展水平,除列車開行數量和旅游接待設施外其余自變量都與因變量呈負相關關系,表明地區之間居民生活水平差異越大,空間關聯越小,反之則關聯越緊密;公路距離越遠越容易限制游客的出行;游客都傾向于前往旅游接待設施建設較好、社會經濟發展較好的地區,蘇南地區在基礎設施、經濟、社會、民生方面都優于蘇北地區,且蘇南地區鐵路網更加發達,因而蘇南地區旅游流動更加頻繁,反映到潛在的旅游流亦是如此。由此可得,私人汽車擁有量差異、可自由支配收入差異、公路距離是構成制約地區間潛在旅游流流動的主要因素,而旅游接待設施與列車開行數量是潛在游客選擇旅游地所考慮的重要因素。可以得出,擁有較高的居民生活水平、高品質的旅游接待設施及交通便利的目的地是潛在游客群體的首選,這也是蘇南地區在旅游流網絡中發揮較大作用的原因。
1)整體來看,江蘇省潛在旅游流整體網絡密度值較低,存在明顯的核心—邊緣結構,核心成員間聯系緊密,潛在游客在蘇錫常寧等地區線上旅游活動頻繁。根據已有研究,江蘇省實際的旅游流網絡結構也呈現出蘇南地區網絡聯系緊密,蘇北地區分布稀疏的情況。由此可見,旅游者線上線下的行為具有共通性,線上行為會對線下行為產生正向影響。從潛在旅游流網絡節點特征來看,蘇南地區中蘇錫寧各項中心度指標都優于其他地區,是網絡中的核心區,同時也是省內重要的旅游客源地及目的地;而蘇北的徐淮連鹽地區在各項指標中表現不足,旅游流輸入與輸出能力不佳,處于網絡中的邊緣區,充當著邊緣旅游目的地角色。其余地區依據中心性及角色定位分析,旅游流的輸入與輸出能力均表現較好,判定為網絡中的次級核心區域,是省內主要的旅游客源地及目的地。
2)借鑒前人的研究,考慮關系數據的特殊性,使用QAP分析法研究江蘇省潛在旅游流流動矩陣與各因素矩陣的相關性并進行回歸分析,研究結果表明,經濟發展水平、旅游資源、人口規模及網絡營銷水平對江蘇省潛在旅游流存在一定的影響。而私人汽車擁有量差異、可自由支配收入差異、公路距離是構成制約地區間旅游流流動的主要因素,旅游接待設施與列車開行數量則是潛在游客選擇旅游地所考慮的重要因素。擁有較高的居民生活水平、高品質的旅游接待設施及交通便利的目的地是潛在游客群體的首選,這也是蘇南地區在潛在旅游流網絡中發揮較大作用的原因。
3)蘇北地區面積大,發展潛力更大,據了解,隨著蘇北高鐵的全線通車,省內交通將日益完善,加上核心旅游地的輻射,蘇北的客流量將會有所提升;同時,蘇北地區旅游資源同質化程度低,如淮安紅色旅游,連云港濱海旅游,徐州漢文化旅游等,基本為一市一主題,應當借鑒蘇南地區的發展經驗,從旅游規劃做起,做細做精旅游資源,把握城市內涵及資源主題,促進文旅融合,大力發展全域旅游與智慧旅游,完善服務體系,致力提升旅游服務品質,擴大旅游宣傳,建設一批有影響力的旅游綜合性示范區來吸引本省的核心旅游地帶人群。同時蘇南地區應繼續做好創新發展,保持協同競爭力,增加省內輻射能力,從而做到省內旅游的平衡發展。
4)本文使用社會網絡分析法,首次使用電信數據分析江蘇省潛在旅游流網絡結構特征及影響因素,在研究結論上有一定的新意,但相關研究仍存在局限性。首先,用戶搜索量是一個間接數據,并不能完全代表實際旅游流,本文假設凡是搜索該景區的用戶,就是準備到實際景區去的旅游者,但實踐中會有一部分用戶僅僅是一般性瀏覽。如何剔除這一部分,是今后研究的一個內容。其次,電信數據具有一定的局限性,若利用多數據源進行綜合分析,可能會得到更具有創新價值的結論。此外,省內潛在游客在對傳統旅游景點已經熟知,新增景點層出不窮的情況下,是否會對搜索行為產生影響,并且不同年齡、職業、家庭等背景下的潛在游客所構成的旅游流的深層內涵有待挖掘。