[摘要]需求預測是旅游產業經營決策的基本依據,但產業的廣泛關聯性與各類突發事件使旅游需求預測尤其是中短期預測較為困難。本文采用X12-ARIMA模型、TRAMO/SEATS模型、ARMA模型與GARCH模型,對異常數據點采用附加的外部沖擊調整,利用7種估計方法估計了我國入境旅游人次的月度指數并進行了預測比較,發現采用外部沖擊檢測的TRAMO/SEATS模型由于能有效提取序列數據的信息,對預測我國入境旅游人次最為有效。
[關鍵詞]入境旅游;月度指數;需求預測;模型比較
[中圖分類號]F59
[文獻標識碼]A
[文章編號]1002-5006(2008)03-0024-05
1 序論
旅游業產業關聯廣泛,影響因子眾多,一些難以估計的因素,如疾病、自然災害、政治突發事件等經常對旅游需求產生結構性影響,導致旅游需求時間序列數據不穩定。本文以中國入境旅游者人次為觀測對象,分別采用X12-ARIMA模型、TRAMO/SEATS模型、ARMA模型與GARCH模型,對異常數據點采用附加的外部沖擊(AO,addictive outlier)調整,推導了我國入境旅游人次月度指數,并利用2007年1-8月的數據進行了檢驗預測,發現采用外部沖擊檢測的TRAMO/SEATS模型由于能有效提取序列數據的信息,對預測我國入境旅游人次最為有效。
2 相關研究簡要回顧
西方對旅游需求的預測研究起源較早,1961年第一篇以旅游需求為主題的文章發表。后續的學者相繼開發了一系列的預測模型探討旅游需求的預測,并采用區域與國家案例進行了數據檢驗。從預測效果看,通過比較不同模型對美國入境旅游者開支與人數的預測,有學者發現復雜的預測方法并不一定能得到更準確的預測結果,而且從方法中得到的收益與耗費的時間與成本不相稱。綜合看,在對旅游人數的預測上時間序列分析優于回歸分析,旅游者開支預測由于更多的影響因素,使用回歸模型較為有效。
國內學者的旅游預測研究分為定性與定量兩種類型,定性研究較多,如羅明義預測了2002年國際旅游發展的前景。定量研究分為全國與區域兩個層次,張紅賢、馬耀峰運用多元回歸分析方法預測了我國入境旅客的規模。謝北立、吳光年利用傳統的時間序列分解方法討論了旅游管理中各種隨機序列模型建立的框架。尚林、秦偉良基于ARIMA和EGARCH模型對中國入境旅游收匯進行了預測。區域性的入境旅游預測主要采用各種回歸分析,對上海、青海、桂林、西安等省市的入境旅游需求進行了研究。吳江華等基于人工神經網絡對日本游客對香港的國際旅游需求進行了分析。總體看,國內學者的預測研究集中于年度、甚至更長時間的需求預測。
雖然較長時期的預測有助于長期決策,但實際經營中要求更為迫切的是中短期預測,因此,本文以我國入境旅游月度指數為研究對象,采用不同的預測模型預測并比較預測優度,探討具有較好擬合效果的中國入境旅游預測方式。
3 數據來源與調整
本研究使用的樣本數據來自中國旅游網按月份統計的我國入境旅游萬人次按構成分統計數據,以統計口徑的外國人、香港人、臺灣人、澳門人4類數據加總。時間序列從2001年3月至2007年9月,其中2003年3月、4月、5月的數據因“非典”原因缺失,采用2003年上半年合計減去1月、2月、6月數據的平均。由圖1可以看出,中國入境旅游人次時間序列存在上升趨勢與月度因素,還有明顯的外部沖擊奇異點。后文的研究中以2001年3月至2006年12月數據發掘月度指數,以2007年數據進行預測比較。

4 預測模型與估計
4.1 X12-ARIMA模型
X12是美國商務部人口統計局開發的季節調整模型,因為需要在原序列的兩端補缺項,容易造成信息損失,為此將時間序列模型ARIMA與X12模型結合,通過X12-ARIMA模型延長原序列,彌補X12法末端項缺欠值的問題。X12-ARIMA的一般方程為:

式中p為季節AR階數,D為季節差分階數,Q為季節MA階數,L為滯后算子,對月度數據s=12,εt均值為0,方差為σ2,xit為外生回歸因子,i=1,2,3,……τ。因為序列數據中存在外部沖擊,采用附加外部影響調整(AO,addictive outlier),本研究中外部沖擊調整方程如下:

采用加法、3×3項移動平均、極大似然估計法,根據計算結果自動選擇趨勢濾波(Trend filter)項數,采用譜圖(spectral plot)診斷法估計時間序列調整質量,最終的季節調整后序列、季節因子如圖2a、圖2b。診斷譜圖顯示月度頻率垂線沒有觀測到譜峰,說明調整充分(圖略)。

4.2 TRAMO/SEATS模型
基于ARIMA模型的時間序列分解方法引入英國后被稱為“ARIMA時間序列的信號獲取”(sEATS,signal extraction in ARIMA time series),1994年戈麥茨(Gomez)與馬瑞伏(Maravall)將通常用來估計與預測具有缺失觀測值、ARIMA噪聲及外部影響的TRAMO(time series regression with ARIMA noise,missingobservation and outlier)合并形成一個兩方程的ARIMA方法,首先用TRAMO過程對時間序列進行預調整,然后將結果傳遞給SEATS過程,即先用TRAMO模型進行數據預處理,然后用SEATS將時間序列分解為趨勢要素、循環要素、季節要素與不規則要素4個部分,與X12-ARIMA模型相比,主觀判斷成分較少,對數據處理人員的要求降低,便于普及。如X12-ARIMA方法加入外部沖擊影響,以TRAMO/SEATS模型季節調整后的入境旅游人次序列、季節因子如圖3a、圖3b,推導出的季節指數如表2。

4.3 移動平均比率模型
移動平均比率(RAO)模型是傳統的月度因素分析模型,本研究中采用這一模型是為了將傳統預測模型與近期開發的較為復雜的預測模型進行比較。移動平均比率的基本思想是首先對時間序列進行中心化移動平均,然后計算月度指數與標準化月度指數,計算公式如下:
TCt=(0.5Yt+6△YT+△+0.5Yt-6)/12
Sit=Yt/TCi(i為月份)
Si=average(Si)

根據乘法移動平均比率法推出的入境旅游人次月度指數如表3。

計算月度調整后的趨勢循環序列TCt=Yt/Si,進行線性回歸,回歸方程結合月度指數用于預測。
TCt=682.1+5.45t+[AR(1)=0.767]
s.e=(43.63)(0.99)(0.07)
t=(15.64)(5.53)(9.91)
R2=0.905,對數似然值=-347.28,AIC=10.15,SC=10.25,D-W=1.88,倒數根=0.77。
4.4 AR-GARCH模型
前文綜述中提到的研究有較大比例是對時間序列進行指數或直線回歸以進行預測,因為時間序列數據存在相關性,故采用AR(p)模型是一個合適的選擇,設計回歸方程如下:
yt=α+βt+[AR(p)=γp](4)
log(yt)=ω+ζt+[AR(p)=ψp](5)
采用序列相關的單位根檢驗檢測數據的平穩性,發現雖然時間序列數據是非平穩的,但回歸殘差序列是平穩的,方程(4)、方程(5)中自變量與因變量存在協整關系,可以用于我國入境旅游人次的預測。利用自相關與偏相關系數,識別方程(4)與方程(5)都為AR(1),以此回歸的結果較為理想,但殘差檢驗發現方程(5)存在條件異方差,即大的與小的誤差成群出現(見圖4),回歸誤差項的條件方差不是自變量的函數,而是隨著時間變化并且依賴于過去誤差的大小,這可能是因為入境旅游人次的波動性容易受到天氣、自然災害、政局變動、經濟形式的影響。在回歸中,指數方程比線性方程更容易受到這些因素的影響。在滯后階數P=1時的方程(5)ARCH LM檢驗拒絕了殘差序列不存在ARCH效應的原假設,說明與方程(4)相比,方程(5)存在輕微的ARCH效應。
因此,利用GARCH(1,0)模型重新估計方程(5),結果如下:
均值方程
log(yt)=6.59+0.0057t+[AR(1)=0.40](6)
s.e=(7.46×10-4)(0.031)(0.15)
z=(7.66)(213)(2.60)
方差方程
σ2t=0.0032+0.359σ2t-1
s.e=(8.6×10-4)(0.23)
z=(3.76)(1.59)
由此,根據AR(1)模型估計方程(4)、GARCH(1,0)模型估計方程(5),推導入境旅游月度指數見表4。

4.5 虛擬變量方法
此外,如果將月度看作虛擬變量,還可以利用虛擬變量進行月度指數的估計。估計方程為:

將方程(4)、方程5分別帶入方程(7),回歸發現指數方程的條件異方差被消除(檢驗過程略),擬合優度相對AR模型上升(表略),根據以上回歸結果推導的入境旅游月度指數如表5。

5 預測評價與結論
建立預測模型的根本目的是為實際經營決策提供依據,因此預測精度是選擇預測模型的唯一度量。將以上不同方法導出的季節指數預測2007年1-9月的入境旅游人次,并與實際值比較,以平均絕對誤差(MAPE)最小值為最優模型,擬合值與擬合優度分別見表6與表7。


通常認為,如果MAPE的值低于10%即預測精度較高,本研究采用的7種預測模型的MAPE都小于10%,雖然2007年1-9月我國入境旅游發展平穩,基本沒有大的外部沖擊這一點對較高的預測精度有一定貢獻,如此高的預測精度也足以說明對預測模型的選擇是成功的。根據檢驗,7種預測模型都可以應用于入境旅游人次的預測,但從擬合優度與樣本標準差看,采用沖擊自動檢測的TRAMO/SEATS模型由于能有效提取時間序列數據中的信息,不僅預測精度最高,而且穩定,不會出現局部月份的較大偏離,可以認為,TRAMO/SEATS模型在預測我國入境旅游人次方面是最優預測模型。
[責任編輯:張憲玉;責任校對:吳巧紅]