張斌儒,王 浩,張超鋒,胡 蓉
(四川文理學院數學與財經學院,四川達州635000)
?
①基于網絡搜索數據的旅游需求預測研究進展
張斌儒,王浩,張超鋒,胡蓉
(四川文理學院數學與財經學院,四川達州635000)
摘要:準確預測旅游需求對旅游管理者和決策者分配有限的資源并制定科學的定價策略十分重要.對2009年以后基于網絡搜索數據的旅游需求預測相關文獻進行評述.結論顯示,與基準模型相比,加入網絡搜索數據的模型能顯著提高預測精度,并對將來進一步研究進行展望.
關鍵詞:網絡搜索;旅游需求;預測精度
0引言
隨著經濟的增長,旅游需求呈現巨大的增長趨勢,特別是國家法定節假日的實施使得旅游市場潛力巨大.旅游需求的周期性和不確定性也給旅游管理者提出了挑戰.一方面,短期內迅速增長的旅游流不但對景區和航班等造成巨大的負擔,旅游飯店的接待能力面臨巨大的考驗.另一方面,非假期客流驟減,這可能導致部分航班座位空缺,旅游飯店客房閑置,酒店入住率低等情況,使得資源不能得到有效的利用.因此,有必要對旅游需求進行更為精確的短期預測,以最大程度降低各種風險和不確定性事件的發生,同時有利于旅游管理者進行科學決策.
為探究旅游需求建模與預測方法的研究進展,我們在谷歌學術、ScienceDirect、知網等數據庫上進行了文獻搜索,搜索的時間跨度為2009年1月到2015年3月.刪除重復文獻滯后識別出與網絡搜索數據相關的旅游需求建模與預測相關的20篇文獻.2008年以前很多學者對旅游需求預測相關的文獻進行了評述,包括Law 等(2007),[1]Crouch(1994),[2]Li等(2005),[3]Song和 Li(2008).[4]他們的主要工作集中在對模型和預測方法的評述上,本文主要對2009年以后利用網絡搜索數據進行旅游需求預測相關的文獻進行評述,從中識別出研究空白,為將來進一步研究提供必要的指導.
1研究方法與進展
1.1傳統預測方法
在經典文獻中學者主要采用兩類方法進行旅游需求預測.第一類為時間序列或統計的方法,[5]比如線性回歸,指數平滑法以及自回歸模型.第二類主要包括人工智能的方法,比如人工神經網絡,灰色理論,遺傳算法,蒙特卡洛模擬等方法.[6-8]傳統的時間序列模型以及相關模型發展很成熟并且廣泛應用于旅游需求預測,其預測能力優于其他方法.計算機技術的飛速發展促進了人工智能方法在旅游需求中的應用.當預測變量與被預測變量之間的關系為非線性的時候,神經網絡法非常有用.近幾年也有學者利用支持向量回歸、隨機森林等方法預測旅游需求.[9]
盡管如此,這些預測方法有其局限性.首先,時間序列和統計分析方法依賴于一致的歷史模式和穩定的經濟結構.一旦發生劇烈的經濟結構突變甚至大規模的一次性事件可能會降低模型的預測能力,況且歷史數據的發布具有一定的滯后性.其次,人工智能方法復雜費時費力,并且需要大量的訓練數據.因此,有必要引進更有預測能力的預測變量來克服其缺陷.
1.2利用網絡搜索數據預測社會經濟活動
截至2014年6月,我國搜索引擎用戶規模達50749萬人,網民使用率為80.3%,是中國網民的第二大互聯網應用;同時手機搜索引擎用戶規模達40583萬人,手機網民使用率達到77%,是除手機即時通信以外的第二大手機應用(中國國家旅游局旅游統計).因此,隨著信息技術的發展以及互聯網的普及,網民會在搜索引擎上搜索相關信息,他們在互聯網上的各種行為產生了豐富的數據,我們可以通過各種手段對這些數據進行追蹤,從而產生了新的研究方向:基于網絡搜索數據對經濟活動等進行預測.
事實上,搜索引擎數據已經被應用于商業,金融,經濟等預測領域.Choi 和 Varian(2009)通過實證表明谷歌查詢數據對預測美國汽車銷量,住房銷售以及旅游趨勢等方面有很大的價值.[10]由于Choi 和 Varian在2009年所做的開創性工作,Ginsberg等(2009)利用搜索引擎數據進行流行病預測,他們的預測模型能夠提前兩周探測到流行病爆發.[11]網絡搜索數據也能用于一般的經濟活動預測,比如失業率預測,[12]消費預測以及電影票房預測等.[13,14]學者們的探索有力證實了網絡搜索數據在預測各種經濟活動的價值.
1.3利用網絡搜索數據預測旅游需求
近幾年,一些學者利用網絡搜索數據進行旅游需求預測,被預測變量包括景區客流、飯店接待人數、酒店入住率等.比如Choi 和 Varian (2012)應用谷歌趨勢數據預測來自9個不同國家的來港游客量.通過將網絡搜索數據引入到自回歸(AR)模型,他們發現模型能得到好的擬合度,預測精度很高.[15]Pan等(2012)使用谷歌搜索查詢數據預測美國查爾斯頓旅游需求.他們通過引入與旅游目的地相關的查詢數據到帶有外生變量的自回歸移動平均模型(ARMAX),預測結果表明引入搜索引擎數據降低了平均絕對百分比誤差(MAPE),對預測客房需求有著顯著的貢獻.[16]Yang等(2015)利用搜索引擎查詢數據預測了中國旅游目的地海南的游客流量,比較了谷歌趨勢和百度指數的預測能力.結果顯示,對于中國來說,百度指數提供的網絡搜索數據具有更好的預測精度.在該文中作者使用了四階段過程進行關鍵詞選擇與過濾,并使用綜合加權法進行了指數合成,遺憾的是沒有說明合成指數是否最具有預測能力.[17]
預測酒店接待人數和酒店入住率十分重要,精確預測對酒店管理者分配有限的資源和制定定價策略十分重要(Weatherford and Kimes 2003).[6]Pan(2012)引入谷歌周度搜索數據預測酒店客房需求,結論認為谷歌搜索數據能提高預測精度,而谷歌搜索數據所需成本很低.[16]Yang等(2014)應用目的地營銷組織的網絡流量數據預測該目的地的酒店需求,結果顯示與基準模型相比,基于ARMAX的模型預測精度得到了顯著提高.[18]
國內學者在該領域也做了探索性的研究.黃先開等(2014)以北京故宮為例,探討了百度指數提供的網絡搜索數據與景區游客量之間的關系,并對景區游客量進行預測,結果表明加入百度指數提供的網絡搜索數據能提高模型的預測精度.[19]王煉和賈建明(2014)結合黃金周期間景區的游客數據和網絡搜索數據,探討了網絡搜索數據在旅游需求預測中的作用.實證結果顯示兩者之間存在正相關關系,相對于基準模型,基于網絡搜索數據的模型能顯著提高旅游需求預測的精度.[20]任樂和崔東佳(2014)以北京市國內游客流量為例,揭示了網絡搜索數據與游客之間的相關關系.誤差修正模型表明加入網絡搜索數據有效提高了預測精度.[21]張斌儒等(2015)利用百度指數提供的關鍵詞數據預測海南省月度旅游收入,與基準模型相比,提高了預測精度.[22]Prosper 和 Ryan (2015)基于谷歌搜索數據利用混合頻率抽樣回歸對加勒比海地區的旅游需求進行了預測,結果顯示預測精度顯著提高.[24]
從以上文獻我們可以看出:與傳統預測方法相比,引入網絡搜索數據作為預測變量能得到更為精確的預測,但基于網絡搜索數據的預測仍然在探索階段,主要體現在關鍵詞的選擇與過濾方面、指數合成方法以及模型選擇等.
2結論與展望
2.1數據頻率
學者主要使用周度或月度搜索數據,較少使用日度數據.事實上,大多學者使用了季度或月度數據,因為這些數據可獲得性強.而更高頻率的數據的優點是能為旅游需求趨勢提供實時性的信息.盡管如此,大多研究中使用搜索數據預測旅游需求會產生兩個問題.首先,更高頻率的數據很難獲得.其次,在某些情況下,我們可能面臨多頻率或混合頻率問題( Fondeur and Karamé(2013)).[23]處理混合頻率的一般方法都是將高頻率數據簡單轉化為低頻率問題,比如平均加權的方法(Choi and Varian (2012)).[15]然而,這種處理方法會導致高頻數據信息的損失.在文獻中,只有Prosper & Ryan (2015) 使用了宏觀經濟研究中常用的混合頻率數據處理方法.[24]其實質是對數據進行更為一般的加權轉換.
2.2關鍵詞選擇與指數合成
一般來說,不同的關鍵詞具有不同的搜索頻率,用于模型預測會得到不同的結果.所以關鍵詞的選擇與指數合成對模型的預測精度極為重要.盡管如此,如何從成千上萬的關鍵詞中進行關鍵詞選擇沒有一個系統的方法.大多數研究使用人工隨機選擇十余個關鍵詞作為預測變量.Choi 和 Varian (2009) 搜索關鍵詞“假期目的地/香港”是由于“香港”被收錄到谷歌趨勢里面的假期目的地的子類別中.[10]Yang 等 (2015) 利用四階段關鍵詞選擇步驟對百度指數和谷歌趨勢數據進行關鍵詞選擇,最后得到合成指數的關鍵詞.[17]但該方法得到的關鍵詞是否最具預測能力沒有說明.
2.3研究空白與展望
從上述文獻中可以識別出一些研究空白.首先,目前大多使用百度指數和谷歌趨勢數據進行旅游需求預測,除此之外,我們可以將數據來源擴展到博客、微博等利用大數據方法進行研究,探索這些數據對旅游需求的影響并分析游客的行為或進行旅游需求預測.大數據能夠彌補調查數據對象的抽樣問題的缺陷.使用大數據集能進一步提高預測精度和時效性以及模擬游客的活動,幫助旅游從業者更好的進行管理.其次,我們可以探索系統動態的關鍵詞選擇與合成方法,使得更為符合實際應用,預測能力更強.第三,目前利用支持向量回歸進行旅游需求預測主要大多建立單變量的模型,在引入關鍵詞數據之后,可以考慮利用多變量的支持向量回歸模型進行旅游需求預測.第四,大多旅游需求時間序列具有周期性和季節性的特征,在預測時選擇合適的方法進行季節調整會增加預測精度.最后,可以利用大數據集探索旅游周期、預警研究、拐點等主題.總之,與基準模型相比,如何建立模型進行更為精確的預測對學者來說是一種挑戰.
參考文獻:
[1]Law,R.,Mok,H.and Goh,C.Data Mining in Tourism Demand Analysis:A Retrospective Analysis[M].Berliu:Springer-Verlag,2007:508-515.
[2]Crouch,G.I.The study of international tourism demand:A review of practice[J].Journal of Travel Research,1994(33):41-54.
[3]Li,G.,Song,H.,& Witt,S.F.Recent developments in econometric modeling and forecasting[J].Journal of Travel Research,2005(44):82-99.
[4]Song,H.,and G.Li.Tourism Demand Modelling and Forecasting:A Review of Recent Research[J].Tourism Management,2008(2):203-209.
[5]Song H Y,Witt S.Tourism demand modeling and forecasting[M].Oxford:Pergamon Press,2000:73-74.
[6]Weatherford,L.R.,S.E.Kimes.A comparison of forecasting methods for hotel revenue management[J].International Journal of Forecasting,2003(3):401-415.
[7]Abratt,R.,Nel,D.,Nezer,C.Role of the market maven in retailing-a general marketplace influencer[J].Journal of Business and Psychology,1995(1):31-55.
[8]Andrew W P,Cranage D A,Lee C K.Forecasting hotel occupancy rates with time series models:An empirical analysis[J].Journal of Hospitality & Tourism Research,1990(2):173-182.
[9]Tsaur,R.,Chan,S.Gray support vector regression model with applications to china tourists forecasting in Taiwan[J].international journal of information and management sciences,2014,(25):121-137.
[10]Choi,H.and Varian,H.A.L.Predicting thepresent with Google Trends[J].Economic Record,2009(88):2-9.
[11]Ginsberg,Jeremy,Matthew H.Mohebbi,et al.Detecting influenza epidemics using search engine query data[J].Nature,2009(32):1012-1014.
[12]Askitas,N.,Zimmermann,K.Google econometrics and unemployment forecasting[J].Applied Economics Quarterly,2009(2):107-120.
[13]McLaren,N.,Shanbhogue,R.Using internet search data as economic indicators[J].Bank of England Quarterly Bulletin.2011(2),134-140.
[14]Hand,C.,Judge,G.Searching for the picture:Forecasting UK cinema admissions using google trends data[J].Applied Economics Letters,2012(11),1051-1055.
[15]Choi,H.,Varian,H.Predicting present with google trends[J].Economic Record,2012(S1):2-9.
[16]Pan,B.,D.C.Wu,H.Song.Forecasting hotel room demand using search engine data[J].Journal of Hospitality and Tourism Technology,2012(3):196-210.
[17]Yang X,Pan B,James A,et al.Forecasting chinese tourist volume with search engine data[J].Tourism Management,2015(46):386-397.
[18]Yang,Y.,Pan,B.,Song,H.Predicting hotel demand using destination marketing organization’S web traffic data[J].Journal of Travel Research.2014(5):1-15.
[19]黃先開,張麗峰,丁于思.百度指數與旅游景區游客量的關系及預測研究[J].旅游學刊,2013(11):93-101.
[20]王煉,賈建明.基于網絡信息搜索的旅游需求預測-來自黃金周的證據[J].系統管理學報,2014(3):345-350.
[21]任樂,崔東佳.基于網絡搜索數據的國內旅游客流量預測研究-以北京市國內旅游客流量為例[J].經濟問題探索,2014(4):67-73.
[22]張斌儒,黃先開,劉樹林.基于網絡搜索數據的旅游收入預測-以海南為例[J],經濟問題探索,2015.
[23]Fondeur,Y.and F.Karamé.Can Google data help predict French youth unemployment?[J].Economic Modelling ,2013(30):117-125.
[24]Prosper F.Bangwayo-Skeete,Ryan W.Skeete.Can Google data improve the forecasting performance of tourist arrivals?Mixed-data sampling approach[J].Tourism Management,2015(46):454-464.
[責任編輯范藻]
Tourism Demand Forecasting Based on Web Search Query
ZHANG Binru,WANG Hao,ZHANG Chaofeng,HU Rong
(Mathematics and Finance-Economics School of Sichuan University of Arts and Sciences,Dazhou Sichuan 635000,China)
Abstract:The accurate prediction of the future tourism demand is critical to allocating limited resources and scientific decision-making for tourism manager and decision maker.A large number of review articles related to tourism demand modeling and forecasting have been conducted before 2008.This article mainly aims to review the published papers on tourism demand modeling and forecasting since 2009.The results showed that forecasting model with web search query data can improve forecasting accuracy compared to baseline model,and offer some prospects for further research in the future.
Key words:web search query; tourism demand; forecasting accuracy
收稿日期:①2015-07-01
基金項目:四川革命老區發展研究中心2014年度項目“紅色旅游對區域經濟發展的影響及策略研究—以達州市張愛萍故居為例”(SLQ2014C-17)
作者簡介:張斌儒(1980—),男,四川南江人.講師,博士研究生,主要從事旅游經濟與數量經濟研究.
中圖分類號:F590
文獻標志碼:A
文章編號:1674-5248(2016)02-0041-04