摘 要:本文在概述時間序列模型種類及特點的基礎上,以我國鮮奶零售價格為例,示范了進行農產品市場價格短期預測時選擇合適時間序列模型的篩選過程。通過平穩性、季節性、趨勢性以及異方差等一系列檢驗后,本研究最終選擇雙指數平滑、Holt-Winters無季節性模型和ARCH模型共3種方法對我國鮮奶零售價格短期預測進行了應用模擬,結果顯示,ARCH模型預測結果精確度最高,Holt-Winters無季節性模型穩定性最好。
關鍵詞:農產品;價格預測方法;時間序列模型;鮮奶價格
中圖分類號:F304.3文獻標識號:A文章編號:1001-4942(2010)01-0109-05
Choice and Application of Short-term Forecast Method for Agricultural Products Price——Taking Fresh Milk Retail Price as Example
DONG Xiao-xia, LI Gan-qiong, LIU Zi-jie
(Institute of Agricultural Information, Chinese Academy of Agricultural Sciences/Key Laboratory of
Digital Agricultural Early-warning Technology, Ministry of Agriculture,Beijing 100081, China)
Abstract Based on summarizing the kinds and characteristics of the time series models and taking our country fresh milk retail price as example, the process of choosing the right time series models for short-term forecast of agricultural products price was demonstrated.Checked by stationarity, seasonal characteristic, trend and heteroskedasticity etc., the exponential doubles smoothing, Holt-Winters non-seasonal smoothing and the ARCH modelwere chosen for analyzing the fresh milk retail price. The results indicated that the forecast precision of ARCH model was the best, and the forecast stability of Holt-Winters non-seasonal smoothing was the best.
Key words Agricultural product; Price forecast method; Time series model;Milk price
時間序列分析和預測是根據系統觀測得到的時間序列數據,通過曲線擬合和參數估計等方法來建立系統數學模型的理論和方法。時間序列模型是發展較早而且比較成熟的預測方法之一,該模型主要思想是認為同一變量在現在時刻的取值,在時間上同以前的觀測值有聯系,這種聯系可以用一種模型來表示,利用這種模型用現有及以前的序列值可以外推預測目標未來的變化值[1]。
1 時間序列模型的種類時間序列分析與預測方法經過幾十年的發展,主要分為線性建模預測和非線性建模預測兩種。線性建模預測具體方法包括移動平均法、指數平滑法、趨勢外推法、自回歸分析法、干預模型預測法和灰色預測法;非線性建模預測主要包括神經網絡預測和混沌時間序列預測。
1.1 線性建模預測
1.1.1 移動平均法 基本思路:根據時間序列資料,逐項推移,依次計算包含一定項數的序時平均值,以反映目標未來趨勢。移動平均法適用于受周期變動和隨機波動影響起伏較大,目標發展趨勢不容易顯示的情況。移動平均法可以消除這些因素的影響,顯示出事件的發展方向與趨勢,然后再進行預測[1,3]。移動平均法有兩個主要限制:一是必須具有大量歷史觀測值,二是過去觀察值的權數相等。
1.1.2 指數平滑法 基本思路:預測值是以前觀測值的加權和,且對于未來將要發生的事物,不同時期的觀察值對其影響程度是不同的,最新的觀測值被賦予較大的權數,早期觀察值被賦予較小的權數。指數平滑法具體方法有一次指數平滑法、線性二次指數平滑法、布朗二次(或高次)多項式指數平滑法、溫特線性和季節性指數平滑法。根據時間序列數據的發展趨勢可以采用不同的指數平滑法進行預測,如時間序列數據的變化具有線性趨勢,為了避免預測值滯后于實際值,應采用線性二次指數平滑法;當數據的基本趨勢是非線性的,則可采用布朗二次(或高次)多項式指數平滑法;當數據的變化含有季節性的因素,則應使用把季節性因素考慮在內的溫特線性和季節性指數平滑法(Holt-Winters季節調整模型)[1]。
1.1.3 趨勢外推法 基本思路:利用函數分析描述預測對象某一參數的發展趨勢,通過選擇反映時間序列的趨勢模型,給定時間變量,外推指標值來預測目標未來數據。當預測對象依時間變化呈現某種上升或下降的趨勢,并且無明顯的季節波動,又能找到一條合適的函數曲線反映這種變化趨勢時,就可以采用趨勢外推法(Holt-Winters無季節性模型)[3]。趨勢外推法的假設條件較嚴格,一是假設事物發展過程沒有跳躍式變化,一般屬于漸進變化;二是假設根據過去資料建立的趨勢外推模型能適應未來,能代表未來趨勢的變化情況,即未來和過去的規律一樣。
1.1.4 自回歸分析法 基本思路:利用時間序列數據本身的相互關系,建立回歸模型擬合過去信息,進而預測未來。自回歸分析法具體方法包括自回歸移動平均模型( ARMA)、差分自回歸滑動平均模型( ARIMA)、自回歸條件異方差模型 (ARCH)等。根據時間序列數據的變動特征可以采用不同的自回歸分析法進行模擬和預測,其中自回歸移動平均模型適用于均值、方差和協方差等均不隨時間變化而變化的平穩時間序列,差分自回歸滑動平均模型和自回歸條件異方差模型適用于非平穩時間序列,同時差分自回歸滑動平均模型要求數據序列不能存在異方差。
1.1.5 干預模型預測法 基本思路:利用受干預影響之前的數據,建立一個單變量的時間序列模型,然后利用此變量進行外推預測,得到的預測值作為不受干預影響的數值,再以實際值減去預測值,得到受干預影響的具體結果,利用這些結果估計干預影響部分的參數,最后結合干預影響參數和排除干預影響后估計出的時間序列模型,求出總的干預分析模型。適用于受政策變化或突發事件影響呈現明顯階段性波動的時間序列數據[4]。
1.1.6 灰色預測法 基本思路:通過鑒別系統因素之間發生趨勢的相異程度,進行關聯分析,并對原始數據進行生成處理來尋找系統變動的規律,生成有較強規律性的數據序列,然后建立相應的微分方程模型,從而預測事物未來的發展趨勢的狀況。并根據預測的超前時間選擇適當長度的原始序列的子序列來建模和預測。灰色預測的建模要求數據序列必須等距,不能有跳躍,且指數趨勢變化特征嚴格。
1.2 非線性建模預測
1.2.1 神經網絡預測法 基本思想來源于人類大腦神經運作的模式,是人腦的某種模仿。神經網絡預測包括單變量時間序列預測和多變量時間序列預測。神經網絡預測法有自適應和學習功能,在實踐中一個重要特點是它能把自回歸方程中的系數調整成為新的為我們所需要的值。理論已經證明神經網絡預測法具有逼近任意函數的能力, 在實踐中也能夠達到很高的預測精度。但是神經網絡預測法也存在一些缺點,如訓練速度慢、隱含層點數目難以確定、容易陷入局部極值等[5,6]。
1.2.2 混沌時間序列預測 基本思路:對于任一待預測的向量X來說,如果歷史樣本點很多的話, 總會有現成的觀測點接近預測向量值。混沌時間序列包括全局、局部、半局部建模預測方法,
混沌時間序列往往有很寬的頻譜,如果吸引子的維數較低、噪聲不大,混沌時間序列預測效果確實比線性模型的預測效果好。一般來說, 局部和半局部方法是最好的,但沒有一種非線性方法在各種情況下都是最優的[6]。
2 時間序列模型的選擇
對于一個實際觀察到的時間序列,我們選擇的模型可以不同,但是預測模型選擇的正確與否直接關系到預測的準確性、精確性和科學性。實際應用過程中,需要根據實際觀察數據的特點,結合預測模型各自獨特的原理和運用前提條件,選擇合適的運用模型。一般而言,經濟指標的月度或季度時間序列包含長期趨勢、循環變動、季節變動和不規則波動4種要素。長期趨勢代表經濟時間序列長期的趨勢特性;循環要素是以數年為周期的一種變化,它可能是一種景氣變動,也可能是經濟變動或其它周期變動;季節變動要素是每年重復出現的循環變動,以12個月或4個季度為周期;不規則要素又稱隨機因子、殘余變動或噪聲,這類因素是由偶然發生的事件引起的,經濟學分析中,這些要素往往掩蓋了經濟發展的客觀變化,給研究經濟發展趨勢帶來困難[3]。因此,選擇合適模型之前,必須對經濟時間序列進行分析判斷,確認其平穩性、趨勢性、季節性、異方差等數據特征。本研究運用STATA 10軟件,以2000年1月至2009年10月我國鮮奶零售價格為例進行分析示范。
2.1 平穩性測試
研究采用單位根(ADF)檢驗鮮奶零售月度價格時間序列的平穩性,確定價格序列最終達到平穩的階數。如表1所示,水平序列的檢驗結果中麥金農近似估計值(MacKinnon approximate p-value)為0.7618,接近1,不能拒絕原假設,即鮮奶零售月度價格時間序列數據存在單位根。因此,需要進一步對價格時間序列數據做一階差分,進而再通過ADF檢驗來考察該序列是否存在單位根。一階差分序列的平穩性測試結果見表2:麥金農近似估計值(MacKinnon approximate p-value)為0.0508,拒絕原假設,即鮮奶零售月度價格時間序列數據一階差分后不存在單位根,已經平穩,因此鮮奶零售月度價格時間序列數據為一階單整序列。單整序列階數的確定對自回歸分析法中ARMA(p,q)模型、ARIMA(p,d,q)模型以及ARCH(p) 模型中參數估計非常關鍵。
表1 平穩性測試結果——水平序列
檢驗統計量1%臨界值5%臨界值10%臨界值
Z(t)-0.976-3.534-2.904-2.587
注:迪基富勒單位根檢驗;麥金農近似估計值為0.7618。
表2 平穩性測試結果——一階差分序列
檢驗統計量1%臨界值5%臨界值10%臨界值
Z(t)-3.405-4.080-3.468-3.161
注:迪基富勒單位根檢驗;麥金農近似估計值為0.0508。
2.2 趨勢性檢驗
在實證研究當中,價格變化、進出口變化等時間序列數據往往隨時間變化有著某種變動(一般是上升)趨勢。經濟分析中如果忽視了對趨勢的考慮,有可能導致變量間關系錯誤。尤其在回歸當中,如果每個變量都隨時間增長,那么在多個具有趨勢性的變量中找到某種關系的現象就是謬誤回歸,也稱偽回歸。因此,在選擇時間序列模型前對數據序列的趨勢性檢驗非常必要。本研究采用通用的趨勢性檢驗方法對鮮奶零售月度價格時間序列數據進行檢驗,即鮮奶價格與時間本身兩個變量運用最小二乘法(OLS)看兩者的相關程度,如果兩者相關系數通過檢驗,則存在趨勢性。表3回歸結果中鮮奶價格與時間本身(n)的相關系數為0.0108946,t檢驗值17.12,可以很明確地得出鮮奶零售價格與時間變量之間存在增長趨勢,即隨著時間的變化,鮮奶零售價格增長趨勢明顯。因此,選擇時間序列模型時,應該考慮適用于有趨勢性的時間序列模型。在做鮮奶零售價格影響因素分析時,也需要在模型回歸過程中添加一個趨勢變量(時間變量),提升回歸結果的可靠性。
表3趨勢性檢驗結果
離差平方和(SS)自由度(df)均方差(MS)
模型15.8404062115.8404062
殘差6.213314621150.054028823
合計22.05372081160.190118283
價格系數標準誤t值P值[95%置信區間]
時間變量(n)0.01089460.000636317.120.0000.0096343 0.012155
常數項1.6835440.043255338.920.0001.597864 1.769225
注:樣本數=117,F=293.18,P=0,R2=0.7183,調整R2=-0.7158,均方的誤差=0.23244。
2.3 季節性檢驗
如果一個時間序列是由定期觀測(如每月、每季度等)得到,那么就有可能表現出季節性。如勞動節、國慶節、元旦、春節等假日會使鮮奶零售價格在正常情況下要高于其它月份,從而提高該季度的零售價格。我國奶類消費除受假日因素影響外,季節性變動也特別明顯,第一季度和第四季度奶類消費明顯高于第二和第三季度。那么鮮奶零售價格是否與我國奶類消費趨勢一致,存在明顯的季節性,這需要通過計量方法進行檢驗。季節性檢驗的一般方法是將時間序列數據與季度虛擬變量進行回歸,再進一步對季度虛擬變量做聯合顯著性檢驗。表4是鮮奶零售價格與季度虛擬變量的最小二乘法回歸結果,可以看到鮮奶零售價格與三個季度虛擬變量之間的相關系數沒有一個通過T檢驗;進一步對季度虛擬變量做聯合顯著性檢驗,結果Prob> F=0.9498,進一步說明季節因素對鮮奶月度零售價格不存在影響。
表4季節性檢驗結果
離差平方和(SS)自由度(df)均方差(MS)
模型0.0684800630.022826687
殘差21.98524071130.194559652
合計22.05372081160.190118283
價格系數標準誤t值P值[95%置信區間]
2季度虛變量0.02133330.11388870.190.852-0.204301 0.246968
3季度虛變量0.030.11388870.260.793-0.195634 0.255634
4季度虛變量-0.0339630.1170096-0.290.772-0.26578 0.197854
常數項2.3210.080531528.820.0002.161453 2.480547
注:樣本數=117,F=0.12,P=0.9498,R2=0.0031,調整R2=-0.0234,均方的誤差=0.44109。
季度虛擬變量聯合顯著性檢驗結果:
(1)2季度虛變量=0
(2)3季度虛變量=0
(3)4季度虛變量=0
F=0.12
P(Prob> F=0.9498)
2.4 異方差檢驗
對于非平穩時間序列,我們初步可以判斷鮮奶零售價格時間序列可以運用差分自回歸滑動平均模型(ARIMA)或自回歸條件異方差模型(ARCH)。具體采用哪一種方法更精確更合理,本研究需要對鮮奶零售價格進一步進行異方差檢驗,當時間序列數據不存在異方差時,采用ARIMA模型;當時間序列數據存在異方差時,采用ARCH模型。下面是對鮮奶零售價格數據進行異方差檢驗的過程和結果。首先獲得當期鮮奶零售價格與其滯后一期價格的相關性(表5),然后觀測因變量擬和值與殘差值之間的關系(圖2),進一步采用Breusch-Pagan異方差檢驗,檢驗結果中Prob>chi2=0.0003,可以確認存在異方差。由于默認的Breusch-Pagan異方差檢驗僅可以檢驗與X相關的異方差,無法檢驗更高次的異方差,所以進一步采取White檢驗,通過White檢驗結果(表6)可以發現仍然存在異方差。
表5異方差檢驗結果
離差平方和(SS)自由度(df)均方差(MS)
模型21.71339121.71339
殘差0.181903361140.001595644
合計21.89529331150.190393855
價格系數標準誤t值P值[95%置信區間]
滯后一期價格1.0140220.0086926116.650.0000.9968016 1.031242
常數項-0.02077840.0204882-1.010.313-0.061365 0.019809注:樣本數=116,F=13607.92,Prob>F=0,R2=0.9917,調整R2=0.9916,均方的誤差=0.03995。
圖1 因變量擬和值與殘差值之間的關系
布魯薛-培根(Breusch-Pagan)異方差檢驗結果:
原假設:不存在異方差(Ho: Constant variance)
變量:價格擬合值(Variables: fitted values of price)
χ2=12.08(chi2(1)=12.80)
P=0.0003(Prob>chi2=0.0003)
表6White檢驗結果
χ2值(chi2)自由度(df)P值
異方差系數10.9620.0042
偏度系數4.9310.0264
峰度系數1.7410.1867
合計17.6440.0015
綜合上述分析可以確定,新世紀以來我國監測城市鮮奶零售月度價格得到的數據是非平穩時間序列。鮮奶零售價格的波動呈現明顯時間趨勢性,但季節性波動不明顯。鮮奶價格時間序列模型中擾動項方差穩定性較差,大的及小的預測誤差常常會成群出現,即存在異方差。因此,根據上述數據特點,結合不同時間序列模型的適用范圍(表7),實證研究中鮮奶零售價格預測采用了雙指數平滑、Holt-Winters無季節性模型和ARCH模型共3種方法進行了模擬。其中,雙指數平滑方法進行兩次單指數平滑(使用相同參數),適用于有線性趨勢的序列;Holt-Winters無季節性模型適用于具有線性時間趨勢但無季節性的序列,與雙指數平滑法一樣,這種方法以線性趨勢進行預測,但不同的是雙指數平滑方法只用一個參數,Holt-Winters無季節性模型用兩個參數;ARCH模型是為了刻畫預測誤差的條件方差中可能存在的某種關系,與ARIMA模型一致,它們均屬于非平穩時間序列模型,不同的是ARIMA模型要求時間序列不存在異方差,ARCH模型主要思想是當期擾動項的條件方差依賴于它的前期擾動項的大小。
表7 時間序列模型的適用范圍及選擇
模型平穩性趨勢性季節性異方差性選擇
單指數平滑-無無-
雙指數平滑-有--√
Holt-Winters無季節性模型-有無-√
Holt-Winters季節調整模型-有有-
ARMA模型有--無
ARIMA模型無--無
ARCH模型無--有√
3 時間序列模型的應用
表8中是采用雙指數平滑、Holt-Winters無季節性模型和ARCH模型3種時間序列分析與預測方法對我國鮮奶零售價格進行模擬后擬合值與實際值之間殘差的比較。擬合結果顯示,對我國鮮奶零售價格而言,ARCH模型預測結果精確
表8三種短期預測方法擬合值與實際值之間殘差比較
模型觀察值均值標準差最小值最大值
雙指數平滑1170.02762410.0416499-0.22002260.1118966
Holt-Winters 無季節性模型1170.02791080.0385302-0.12604190.1295652
ARCH模型1160.02669100.0401481-0.21491240.0840648
度最高,殘差均值為0.0266910,標準差為0.0401481;Holt-Winters無季節性模型穩定性最好,標準差為0.0385302,明顯低于雙指數平滑和ARCH模型的標準差值,但其誤差均值較大。
為了進一步考察不同方法的穩定性、精確性,本研究重點分析了2009年1月至10月不同預測方法在鮮奶零售價格短期預測中的應用,觀察預測值與實際值之間的誤差。表9是3種短期預測方法的預測結果與實際監測價格的比較,通過比較發現,與表8研究結論一致,Holt-Winters無季節性模型和ARCH模型的預測結果要明顯好于雙指數平滑,Holt-Winters無季節性模型平均殘差為0.0230,ARCH模型平均殘差為0.0217,ARCH模型預測精確度最高。
表9 不同短期預測方法的預測結果及其比較
月份實際監測價格雙指數平滑Holt-Winters無季節性模型ARCH模型
13.243.253.263.26
23.253.243.253.25
33.263.253.263.26
43.273.263.273.27
53.303.273.283.28
63.253.303.323.30
73.223.253.253.26
83.263.223.213.23
93.293.263.263.27
103.313.293.303.29
113.303.293.313.32
平均殘差-0.0240010.02300.0217
參 考 文 獻:
[1] 伍德里奇.計量經濟學導論[M].北京:中國人民大學出版社,2003,297-333.
[2] 赫爾穆特#8226;魯克波爾,馬庫斯#8226;克萊茨希.應用時間序列計量經濟學[M].北京:機械工業出版社,2008,6-54.
[3] 高鐵梅. 計量經濟分析方法與建模[M].北京:清華大學出版社,2006,133-152.
[4] 徐國祥.統計預測方法的特點研究[J].統計研究,1999,2:52-56.
[5] 張大海,畢研秋,畢研霞,等.基于串聯灰色神經網絡的電力負荷預測方法[J].系統工程理論與實踐,2004,12:128-132.
[6] 溫 權,張勇傳,程時杰.混沌時間序列預測技術[J].水電能源科學,2001,3:76-78.