陳 倩,鄧 敏,2※
(1.桂林理工大學 旅游與風景園林學院,廣西 桂林 541004;2.中南民族大學 經濟學院,湖北 武漢 430074)
根據中國互聯網信息中心發布的第45次《中國互聯網絡發展狀況統計報告》顯示,截止2020年3月,中國互聯網用戶規模高達9.04億,普及率為64.5%[1]。互聯網的不斷發展與壯大使得人們的生活越來越依賴于網絡環境。在當前旅游業發展中,通過網絡搜索引擎對旅游目的地進行信息檢索已經成為了一種普遍性行為。游客通過信息檢索輔助自己形成旅游決策,因此,從一定程度上來說,網絡關注度能夠較為真實地反映出游客的出游意愿,進而反映出景區未來的客流量。
國外將網絡關注度運用到了各學科的研究領域中,其最常用的為谷歌趨勢。谷歌趨勢被用于分析通信、醫藥、健康、商業和經濟等多個領域的各種變量,主要為描述和診斷性研究[2]。J. Ginsberg[3]等人利用Google搜索記錄對網絡用戶密集區域的流感進行了預測。T. Dergiades[4]等人采用搜索引擎查詢數據對旅游產品的消費進行了預測,并認為根據不同搜索語言和不同搜索平臺對指數進行調整,有利于預測國際訪問量。
國內網絡關注度在旅游領域中的應用較廣,主要包括百度指數、微博、馬蜂窩等。網絡關注度在旅游研究領域中常被用于研究旅游時空分布、旅游流等問題。馬麗君[5]等人利用百度指數和客量數據提出了網絡關注度的時空模型,并認為網絡關注度和客流量之間存在較強的相關性。鄒永廣[6]等人用百度指數分析了旅游安全網絡關注度的時空差異特征,認為地區經濟發展水平、突發事件量等差異形成了網絡關注度的差異。靜恩明[7]等人以新浪博客游記為數據源分析了河北省A級景區網絡關注度空間格局,發現各區域在旅游資源稟賦基礎上,外源動力作用明顯。生延超[8]等采用百度指數分析了網絡關注度的時間差異和區域差異,認為收入、科學技術水平與游客滿意度網絡關注度之間呈正相關關系。
綜上所述,網絡關注度的研究主要集中在時空分布、旅游需求、空間差異等方面,對于客流量的研究相對較少。景區的客流量對于網絡關注度存在時間上的滯后性,但目前的研究并未對滯后的周期形成統一結論[9]。具有不同特征的景區的滯后周期有所不同,部分學者在研究中直接引用前人的時間滯后周期,使得滯后性時間產生誤差,進而導致研究結果產生偏差。因此,在探索景區客流量與網絡關注度間的關系時,針對不同景區進行滯后期的確認十分必要。此外,多數學者所選取的關鍵詞均是根據主觀思維選取的,并沒有準確把握景區旅游網絡關注的熱門關鍵詞。
四姑娘山位于四川省小金縣,距成都約203公里,地處東經102°42′30″~102°58′40″、北緯30°54′16″~31°16′21″之間,屬亞熱帶季風性氣候。由于區內地形高差懸殊,隨海拔高度的變化,山地氣候變化明顯,從保護區西南角的沃日河谷到主峰頂,形成復雜的氣候垂直帶譜。四姑娘山山形峻峭,是省內第二高峰,由于海拔高,山峰常年積雪,有現代山岳冰川,是四川大熊貓棲息地,為世界自然遺產,被劃為國家級自然保護區。
四姑娘山早在1994年便被評定為國家重點風景名勝區,2000被評為國家首批4A級景區,2006年被聯合國評定為中國大熊貓棲息地世界自然遺產的組成部分。每逢節假日,四姑娘山都會迎來大量的游客,根據《國家旅游局公告》(2015年第19號)的規定,四姑娘山風景名勝區游客最大承載量為1.8萬人次/天①。從圖1中可看出,在2015—2018年,四姑娘山的游客量呈現快速增長趨勢,且上升的速率較高,2015年的最高日客流量為6 579人次,到2018年增長為17 071人次,其年平均增長率高達38.41%。雖在2019年有所下降,但根據近年來的發展趨勢預測,未來國慶假期間其最高日客流量將超出它的最大承載力1.8萬人次/天的范圍。我國公民的假期具有較強的集中性,導致各大景區均出現階段性、突發性游客暴漲現象,當客流量超出景區承載力范圍時,將嚴重影響游客體驗,并造成極大的安全隱患。為對景區的爆滿現象加以適當的調控,對景區客流量的合理預測勢在必行。本文采用線性回歸的方式,利用網絡關注度對四姑娘山景區的客流量進行初步預測,以便景區在客流量超出其最大承載力之前,采取恰當的措施,做到對人力、物力、財力資源的充分合理利用,保證游客的參觀質量以及人身安全,并提高游客的旅游體驗,避免景區游客爆棚而造成損失。

圖1 四姑娘山2015—2019年國慶期間最大日客流量
百度是全球最大的中文網絡搜索引擎,據相關研究表明,游客出行前使用的搜索引擎主要為百度,在各大搜索引擎中占比高達65.7%[10]。百度指數是基于百度大量用戶的搜索行為形成的,表示一段時間中網民對某一內容的檢閱數,是大數據時代衡量網絡關注度的一大指標。為保證選取關鍵詞的準確度,本文采用了站長工具的SEO關鍵詞挖掘功能對四姑娘山進行關鍵詞挖掘。從站長工具中獲得其百度指數最高的搜索關鍵詞主要為:“四姑娘山”“四姑娘山天氣”“四姑娘山旅游攻略”和“四姑娘山門票”。本文選取了這四個關鍵詞在2018年、2019年國慶節前后的百度指數作為原始數據。同時,從四姑娘山相關部門官網選取了其2015—2019年公布的日客流量為研究的數據源,并從中選取法定節假日作為研究時間段。
本文利用SPSS軟件,以百度指數和客流量建立了回歸模型,以確定網絡關注度與客流量間的相關性,從而達到對客流量進行初步預測的目的。
李山[11]等人認為景區客流量相對于網絡關注度存在一定的滯后性,其滯后周期為1~2周。為確定四姑娘山滯后周期的準確值,本文擴大了網絡關注度數據的收集范圍,劃定2018年、2019年兩年中9月24日—10月7日為時間區間,詳見圖2。

圖2 2018—2019年關鍵詞百度指數
從圖2中可看出,關鍵詞“四姑娘山”的百度指數變化幅度較大,且與客流量呈現出較接近的變化趨勢,而“四姑娘山天氣”“四姑娘山旅游攻略”“四姑娘山門票”的變化幅度則相對較小。利用軟件對四個關鍵詞的百度指數,即因變量進行了相關性分析,發現五個指數間存在較大的相關性,故選取“四姑娘山”百度指數為代表。
國家法定節假日的規定使得目前國內旅游出現了節假日旅游高峰的現象。在對四姑娘山官方公布數據進行統計分析之后發現,2018—2019年四姑娘山在我國的7個法定節假日期間(包含調休及連接的周末)的日均客流量如圖3所示。從圖中可看出,在這兩年中,四姑娘山在國慶節的日均客流量為最大值。由此可知,國慶節為四姑娘山最有可能出現日客流量爆棚現象的時間段。因此,本文選取了國慶節日客流量作為四姑娘山客流量的研究數據,如圖4所示。

圖3 2018—2019年四姑娘山法定節假日平均日客流量(單位:人/天)

圖4 2015—2019年四姑娘山國慶節日客流量(單位:人/天)
從圖4中可看出,2015—2019年四姑娘山國慶期間客流量走勢相似,客流量從國慶假第一天就已達到一個較高的水平,隨后開始呈現出不斷增長的趨勢,到第三天時,達到了國慶期間日客流量的最大值,且在2018年已經接近于其景區日客流量的最大承載量1.8萬人次/天。從圖4可看出,其國慶假期的客流量除2017年受氣候影響走勢略有不同外,其余均呈現出倒U型的增長趨勢。
由于客流量與網絡關注度之間在時間上存在滯后性,為確定其滯后期,本文選取2015—2019年的數據,利用SPSS軟件對不同滯后期的“四姑娘山”百度指數與客流量數據分別進行皮爾遜相關系數檢驗,結果如表1所示。當顯著性水平小于0.05,視為拒絕原假設,表明兩個變量之間顯著相關,值越接近于0表示相關性越強。由此可知,2015—2018年滯后期為2天時的網絡關注度變化趨勢與四姑娘山日客流量變化趨勢相關性最強,2019年則在滯后期為1天時相關性最強。從以上分析可知,四姑娘山客流量與其網絡關注度之間存在1~2天的滯后期。

表1 四姑娘山不同滯后期百度指數與客流量相關性強度(顯著性水平值)
根據上述結果,假設客流量與網絡關注度之間存在相關關系,且兩者間的滯后期為1~2天。選取2015—2018年每年的9月29日至10月5日和2019年9月30日至10月6日的“四姑娘山”百度指數作為自變量,選取2015—2019年10月1日至10月7日的日客流量作為因變量建立線性回歸方程。
本文借助SPSS分析工具,在對數據進行共線性檢驗之后,得出散點圖發現兩組數據存在很強的共線性,因而對其進行正態分布檢驗,詳見表2。本次檢測樣本數僅為35組數據,因而以Shapiro-Wilk檢測結果為準。由表2可知,四姑娘山與客流量的顯著性水平分別為0.179、0.137,均大于0.05,不拒絕原假設,服從正態分布。為進一步驗證其是否服從正態分布,對四姑娘山百度指數和客流量輸出結果的標準Q-Q圖進行分析,發現兩組數據的標準Q-Q圖中的點均接近中間的直線或在直線上,服從正態分布。

表2 四姑娘山百度指數與客流量的正態分布檢驗
注:*表示真顯著性的下限。
利用SPSS對四姑娘山網絡關注度和客流量進行相關性檢驗,輸出結果如表3所示。其顯著性水平為0.000,小于0.05,拒絕原假設,即四姑娘山百度指數和客流量顯著相關。

表3 四姑娘山百度指數與客流量的相關性分析
注:**表示在0.01級別(雙尾),相關性顯著。
經過以上檢驗之后,發現該兩組數據存在線性關系、符合正態分布,且具有很強的相關性,符合回歸分析的前提條件,因而對兩個變量進行了回歸分析。選擇“四姑娘山”百度指數作為自變量,選擇四姑娘山國慶假期日客流量為因變量,得出的回歸模型如下:
Y=-1018.251+1.978X,R=0.663,R2=0.422。
(1)
其中,Y:四姑娘山日客流量;X:四姑娘山百度指數;R:相關系數;R2:擬合優度,R2是評價方程擬合優度的決定系數。該回歸方程的R2值為0.422,表示回歸方程的擬合程度在可接受范圍內,回歸值較接近觀測值,較能體現觀測數據的內在規律。從(1)式可看出,在四姑娘山國慶假期時的游客量與其對應的1~2天前的四姑娘山百度指數具有相關關系,客流量隨著網絡關注度的增長而增加。
在當前網絡信息十分發達的環境下,旅游者在出行前習慣利用搜索引擎對旅游目的地的相關信息進行檢索。網絡搜索指數的高低在一定程度上代表著網民關注度的高低。旅游者在出行前可通過網絡搜索了解旅游目的地的相關信息,進而制定旅行計劃,準備出行。經過SEO統計分析工具發現,旅游者出行前,主要會對旅游目的地的天氣、交通、旅游攻略、住宿、門票、圖片等信息進行檢索,這些信息將會嚴重影響到旅游者的出行決策。即網絡關注度在一定程度上會影響到景區的客流量,但該類影響有著相應的滯后性。游客往往會選擇提前數天進行信息檢索,從而決定是否出行。
受地理環境等因素影響,景區承載力有限,因而對客流量的控制十分必要。本文以四姑娘山為例,采用線性回歸方式對景區網絡關注度與客流量的關系開展研究,發現兩者間存在線性關系。利用四姑娘山的網絡關注度數據可以初步預測景區未來1~2天的日客流量。
網絡是游客出發前對景區進行了解的渠道,旅行者在出行前通過網絡信息檢索輔助制定最終的旅行計劃,網絡關注度是旅行者出行前或出行中的一種預兆。本文以四姑娘山作為研究對象,利用站長工具、線性回歸等研究方法,得出以下研究結論:網絡關注度最高的4個關鍵詞按關注度由高到低依次為:“四姑娘山”“四姑娘山天氣”“四姑娘山旅游攻略”“四姑娘山門票”;國慶期間,四姑娘山客流量相對于“四姑娘山”百度指數存在1~2天的滯后期;旅游目的地的網絡關注度與客流量之間存在相關關系。
為預防景區客流量超出其承載力范圍,景區可通過建立景區網絡關注度與客流量間的線性關系,對旅游旺季未來的客流量進行預估。同時,在客流量過大時,景區可采取相應調整措施,如門票預約、分時進入、限制進入、交通控制等措施,達到對景區的客流量進行提前預知和管控的目的,避免由于景區爆棚而造成損失。
注 釋:
①數據來源:四姑娘山景區官網。