段艷++林軼++張琳艷
摘要:選取關鍵詞的百度指數和海南游客接待量 2011年3月—2016年2月5年的月度數據進行實證分析。通過對數據進行ADF單位根檢驗、協整檢驗、格蘭杰因果檢驗得出:百度指數與游客接待量存在著長期的均衡關系;不同的關鍵詞百度指數與游客接待量存在著不同的格蘭杰因果關系。
關鍵詞:百度指數;游客接待量;協整檢驗;格蘭杰因果檢驗;VECM
中圖分類號:F2文獻標識碼:Adoi:10.19311/j.cnki.16723198.2017.23.010
1引言
在互聯網的時代,游客進行旅游決策時,會通過網上進行信息的搜尋、信息的篩選,最后進行旅游決策。許多旅游學者對網絡搜索數據與旅游客流量、旅游經濟發展等方面進行了相關的研究。基于百度指數的網絡搜索數據,對旅游目的地的游客量進行研究,通過閱讀大量文獻可以發現學者研究主要分為三大類:相關性分析、時空分布特征分析、客流量預測。馬麗君等(2011)對30個城市的客流量及游客網絡關注度采用了時空相關模型進行了相關性分析,得出游客網絡關注度與客流量之間有著密切的關系。王碩等(2013)采用OLS方法構建相關模型,對廬山、華山、八達嶺長城風景名勝區的黃金周時間里客流量與網絡關注度的變化特征進行了相關性分析。通過百度指數,對旅游目的地的客流量進行預測,對旅游目的地具有較大的作用。汪秋菊,劉 宇(2014)等研究得出可以將網絡空間關注度作為客流量預警的先兆指標。黃先開等(2013)、任樂等(2014)等研究得出搜索數據與旅游客流量之間存在協整關系,并建立了旅游客流量預測模型。許多學者基于百度指數,對旅游目的地的時空特征進行了分析。徐凡等(2016)以長三角 5A 級景區為例,采用GIS等方法,分析得出網絡關注度在時間上呈現出周內 “日前兆”,月內呈現明顯的“月前兆”特征。
本文選取我國最南端的海南省為例。海南省擁有得天獨厚的豐富旅游資源,2015年海南接待游客總數5335萬人次,同比增長11.4%,旅游總收入達到572億元,同比增長13%,旅游發展質量不斷提升。本文的研究是基于百度指數,以海南的游客接待量和關鍵詞的百度指數為數據,基于VECM模型對海南關鍵詞的百度指數與游客接待量的關系進行檢驗。
2實證研究
2.1百度指數
百度指數是以百度海量網民行為數據為基礎的數據分享平臺,是當前互聯網乃至整個數據時代最重要的統計分析平臺之一。截至2014年,百度指數的主要功能模塊非常強大,可以滿足不同的需求者。基于單個詞的趨勢研究(包含整體趨勢、PC趨勢還有移動趨勢)是本文應用的模塊。主要運用到搜索指數,搜索指數是以網民在百度的搜索量為數據基礎,以關鍵詞為統計對象,科學分析并計算出各個關鍵詞在百度網頁搜索中搜索頻次的加權和。
2.2數據收集
2.2.1旅游數據來源
海南旅游游客接待量(單位:萬人次)月度數據來源是海南省旅游發展委員,由于2011年1月和2011年2月的數據缺失,所以所選取的數據為2011年3月至2016年2月的旅游統計月度數據。關鍵詞百度指數來源于百度指數,百度指數PC趨勢積累了2006年6月至今的數據,移動趨勢展現了從2011年1月至今的數據,所以本次選擇了2011年為始的整體趨勢指數,數據為2011年3月至2016年2月期間的整體趨勢月平均值。
2.2.2關鍵詞的選取
根據游客出游行為,先選取目標初始關鍵詞,通過觀察百度指數及站長工具的,首先選取部分關鍵詞作為目標關鍵詞,運用站長工具、站長幫手工具、愛站網,選取“海南旅游”“海南旅游攻略”“海南旅游景點 ”“去海南旅游要多少錢”“去海南旅游必備物品”“海南旅游地圖”“海南旅游景點大全”“海南旅游報價”“海南旅游線路”“海南旅游價格”“海南旅游圖片”“海南天氣”作為基準關鍵詞。再多次通過選取,最后確定“海南旅游”“海南旅游攻略”“海南旅游景點 ”“海南旅游地圖”“海南天氣”為目標關鍵詞。
2.2.3數據的處理
通過收集到的海南每月旅游游客接待量與關鍵詞的搜索指數月度值的數據整理到Excel里。如圖1所示,可以看出海南旅游游客接待量(萬人次)與關鍵詞“海南旅游”的搜索指數變化趨勢基本一致。游客接待量(萬人次)與“海南旅游”百度指數在每年的1月和2月份呈相反趨勢,游客在寒冷的1月已經到海南度假,對“海南旅游”的搜索也相應的減少。
通過圖1可以看出“游客接待量”有明顯的時間趨勢,因而提供取對數處理消除時間趨勢,把“游客接待量”“海南旅游”“海南旅游攻略”“海南旅游景點 ”“海南旅游地圖”“海南天氣”分別記為lnJDL、LY、GL、JD、DT、TQ。
2.3.1平穩性檢驗
本研究采用的數據為時間序列,為防止出現單位根,保證數據序列的平穩性,對時間序列進行平穩性檢驗,平穩性檢驗采取單位根ADF( Augmented Dickey - Fuller test)檢驗,檢驗如表1。
通過表1可以看出,序列數據進行一階差分后6個變量在99%的置信水平下單位根皆平穩,拒絕原假設,因而原序列都是一階單整時間序列 I( 1)。
2.3.2協整檢驗
原序列都是一階單整序列,進一步可以通過協整分析檢驗變量間的長期協整關系,判斷變量之間是否存在協整關系,以及存在的協整關系的個數。協整檢驗有兩種,一是適用于大樣本變量的E-G兩步法檢驗;二是以VAR模型為基礎的基于回歸系數的Johansen極大似然法協整檢驗。由于是確定多變量協整關系,因而采用的是Johansen-Juselius向量誤差修正模型(VECM)的分析框架來檢驗變量之間的協整關系,并確定出協整向量的個數。
首先,建立VAR模型確定最優滯后階數,從表2可以看出滯后階數是介于1和3之間,為保證模型的有效性,根據AIC準則,選取最優滯后階數為3進行協整分析。endprint
進一步來確定通過Johansen檢驗確定協整個數,結果如表三所示。表3可以看出,協整方程個數為1時,跡統計量58331314和最大特征值統計量27718088均小于5%的臨界值,接受存在至多一個協整關系的原假設,變量之間存在協整關系。協整方程為:
lnJDL=00013843LY+00018966GL-00112043JD+00139547DT-00005818TQ-6136019。
協整方程的各個關鍵詞系數估計值表示關鍵詞百度指數對游客接待量的彈性,關鍵詞“海南旅游”、“海南旅游攻略”、“海南地圖”百度指數與“游客接待量”有正向的關系,關鍵詞“海南旅游”百度指數的百度指數每個增長1%,游客接待量增長會增長0.0013843%;關鍵詞“海南旅游景點”、“海南天氣”與“游客接待量”有反向的關系。關鍵詞“海南旅游”、“海南旅游攻略”、“海南地圖”網絡搜索的增加使得游客會發現海南旅游的時期會出現擁擠等現象,進而可能使得游客改變去海南旅游的想法,對海南的游客接待量有反向影響。通過協整檢驗得出關鍵詞的百度指數和游客接待量存在著協整關系。
2.4格蘭杰因果檢驗
協整說明長期穩定關系不一定是因果關系,所以需要進一步通過格蘭杰因果檢驗確定兩者的因果關系。
先對VECM模型的穩定性進行檢驗,采用的是模型殘差序列的單位根檢驗。檢驗發現t統計值為-3.935,小于99%的置信度水平下的臨界值-3.567,所以在99%的置信度水平下是平穩的。
格蘭杰因果檢驗在95%的置信度下可以看出關鍵詞“海南地圖”和“海南天氣”是引起“游客接待量”的原因,反向并不成立;“游客接待量”是引起關鍵詞“海南旅游”和“海南旅游景點”的原因,反向不成立;而“游客接待量”與“海南旅游攻略”并不存在因果關系。
3結論和探討
根據實證分析的結果,可以得出以下的結論:
(1)關鍵詞百度指數與游客接待量存在著長期的均衡關系。關鍵詞“海南旅游”、“海南旅游攻略”、“海南地圖”百度指數與“游客接待量”有正向的關系;關鍵詞“海南旅游景點”、“海南天氣”與“游客接待量”有反向的關系。關鍵詞“海南旅游”、“海南旅游攻略”、“海南地圖”網絡搜索的增加使得游客會發現海南旅游的時期會出現擁擠等現象,進而可能使得游客改變去海南旅游的想法,對海南的游客接待量有反向影響。關鍵詞存在著長期的均衡關系,并且所產生的正向反向作用不一,海南省可以對關鍵詞進行篩選,然后選擇可以促進搜索量增加的并帶來游客量增加的關鍵詞進行重點營銷。同時,對具有方向作用的關鍵詞海南省可以進一步提高海南的服務質量。
(2)關鍵詞百度指數與游客接待量存在著格蘭杰因果關系。95%的置信度下可以看出關鍵詞“海南地圖”和“海南天氣”是引起“游客接待量”的原因,反向并不成立;“游客接待量”是引起關鍵詞“海南旅游”和“海南旅游景點”的原因,反向不成立;而“游客接待量”與“海南旅游攻略”并不存在因果關系。關鍵詞與游客接待量存在著格蘭杰因果關系,海南省可以通過加強排名靠前的關鍵詞的推廣,對于最南端的海南省,客源也是來自不同的地方,因而加強關鍵詞的營銷就顯得非常重要。“游客接待量”與“海南旅游攻略”不存在著因果關系,在對關鍵詞進行營銷時,需要對關鍵詞進行篩選,對于不存在著格蘭杰因果關系的,可以減少營銷。
參考文獻
[1]馬麗君,孫根年,黃蕓瑪,周瑞娜. 城市國內客流量與游客網絡關注度時空相關分析[J]. 經濟地理,2011,(04):680685.
[2]王碩,曾克峰,童潔,劉超. 黃金周風景名勝區旅游客流量與網絡關注度相關性分析——以廬山、華山、八達嶺長城風景名勝區為例[J]. 經濟地理,2013,(11):182186.
[3]任樂,崔東佳. 基于網絡搜索數據的國內旅游客流量預測研究——以北京市國內旅游客流量為例[J]. 經濟問題探索,2014,(04):6773.
[4]黃先開,張麗峰,丁于思. 百度指數與旅游景區游客量的關系及預測研究——以北京故宮為例[J]. 旅游學刊,2013,(11):93100.
[5]汪秋菊,劉宇. 基于網絡關注度的旅游景區客流量預警:研究框架與實證分析——以國家游泳中心水立方為例[J]. 旅游論壇,2014,(05):915+25.
[6]徐凡,尤瑋,周年興,胡美娟. 基于百度指數的網絡空間關注時空分布研究——以長三角5A級景區為例[J]. 資源開發與市場,2016,(04):489493.endprint