唐家琳,陳 靜,薛 君
(西安郵電大學 經濟與管理學院,西安 710061)
自從計量經濟理被引入我國以來,基于時間序列歷史數據的經濟預測方法不僅在種類上日益增多,并且所運用的范圍也越來越廣闊。最為常見的是經典計量學中的簡單最小二乘法(OLS)、結構向量自回歸模型(ARIMA)、脈沖響應及方差貢獻及結構方程理論(SEM)的引用;而專門的預測方法也逐漸被引入,如指數平滑法、移動平均法、趨勢外推(皮爾曲線和龔伯茲曲線)及滾動天窗法;同時隨著數學與經濟學學科交叉引起的純數學理論方法的運用趨勢也不斷擴大,如機械工程領域的小波理論運用(王正歡,2011)、計算機領域的BP混合算法(尹新,2010)等;還有一些是基于傳統時間序列模型加以的改進方法,如顧晨陽(2010)引入組合規劃思想,形成了權重變化組合方法對交通流量進行預測。何其慧(2011)采用了一個權重半徑的概念,形成優化模型,根據預測區間誤差計算權重,最終形成預測依據。但學術界普遍認為,無論采取何種預測方法,也僅僅只能說是“預計的數值”,沒有一種能夠在較長時間段對所有研究序列實現精確預測的“最佳方法”,對于采取方法的好壞最終還是取決于相對誤差程度,這里認為預測誤差的根源在于:一是經濟環境內在機理的轉變,我們經常通過實證研究可以發現某一種預測方法在特定時間段內針對某一特殊指標進行預測的效度很高,但換一個對象或時期研究的模擬精度非常低;二是數理工具本身內在的缺陷,幾乎所有方法都是基于一定的假設前提和理論基礎,但實際上這些基礎條件在現實經濟活動中可以說一直不具備,故必然存在缺陷。本文的目的并非在于重新設計一種預測模型,而是在現有模型基礎上考慮如何將模型進行改進,那么提高精度的唯一途徑是準確認識誤差變動規律,采用誤差修正的措施對所有預測方法根據實際數據情況進行“精度提升”。
對于兩個相鄰的平均滾動誤差 AFE[i,i+n-1]和AFE[i+1,i+n](i≤n-1)來說,兩者之差可以表述為:?i+1=AFE[i,i+n-1]-AFE[i+1,i+n],值越大表明研究區間向后滾動一個天窗后帶來的波動性越大,更進一步說是第i+n與i數據之間發生了機理性突變,其實在時間序列發生過程中,兩個相鄰的數據之間都或多或少發生的突變現象,但由于單個數據之間關系無法準確用方法來刻畫其突變過程。上述兩個滾動誤差之間共同存在的區間是[i+1,i+n-1],使兩個AFE產生差別的根本原因是xi+n與 xi發生數據規律變動,故 ?i+1又可以表示為AFE[i?i+n],所以在2n個數時間序列下存在n個突變測算點,如圖1。
根據上述,得到了以區間長度為n的數據突變規律,記為函數?(n+t)(t=1,2,......n),具體的函數形式可以根據情況進行擬合。但這樣同樣會遇到時間序列模型的老問題:這種誤差規律的預測同樣存在誤差,所以如何尋找出科學合理的函數形式或規律軌跡至關重要。一般而言,人們通常根據已知的數據區間[1,2n]根據預測模型想得到2n+1期的實際值,如果AFE[i?i+n]數據突變軌跡仍然回重演,則表示由n+1點向2n+1點轉變過程中的規律和[1?1+n,n?2n]運動區間類似。
通過加權權重得到了AFE[n+1?1+2n],而這個值的原始意思是[n+1,2n+1]與[n,2n]的平均誤差值之差,而由于[n,2n]之間的原始數據和預測數據俱全,故AFE[n,2n]是已知的,同時AFE[n+1?1+2n]已知,所以在未預測之處便可由這樣的結論:[n+1,2n+1]之間的預測誤差為:

對于幾乎所有時間預測方法而言,其本身都是數據規律挖掘的一種方法,雖然它們用不同的機理和方式進行表達,但本質上都具有共性。但歷史數據序列由于這樣或者那樣的原因規律軌跡并不服從一定的連續性規律,或多或少產生突變性現象,而預測方法也只能挖掘到部分信息規律,而對突變規律無法掌握。這種基于誤差滾動規律挖掘的方法,正是基于單個預測方法挖掘信息相對固定的潛在特性,對其進行突變誤差修正,采用一種倒推的思想理念對由原方法產生的預測值進行修正的處理過程,可以說具有一定的創新性。并且即使是原方法的預測值,也是依靠n個數據區間進行滾動預測的,并非將2n個數據一起采用某預測方法對2n+1期進行預測得到,這樣做的目的還是在于要體現誤差統計的規律變動。
本文選取1991~2010年間我國農林牧副漁產業總產值作為預測序列,數據來源于《中國統計年鑒》。將1991年作為時間1,其余時間年份以此類推,構建簡單最小二乘法利用EVIEWS5.0軟件進行回歸,有模型:

圖2 原始序列和預測序


表1 平均誤差及運算結果
首先對20年的數據進行回歸處理,得到C=2053 ,a=2760,同時得到預測序列XF,具體如圖2所示。可以發現1991~1998、2007~2010年間實際值高于預測值,而在1998~2006年間相反。相關性檢驗系數為0.95,說明從序列角度看效果較好,但仍然存在5%的誤差,并且誤差也具有一定的規律性。
(1)滾動區間預測誤差計算
分別對1991~2000、1992~2001、1993~2002、……2001~2010共10個區間段分別采用OLS模型進行回歸,得到平均預測誤差。從表1可以看出10個滾動區間內的預測平均誤差在0.058至0.119之間,說明同樣一個回歸模型在不同區間中的預測效果不同,在1992~2001中的預測效力最低。
(2)突變點運算結果
用表1中的第二列數據進行相鄰區間計算數值進行遞級相減,得到第三列,其中正號數值表示后區間的末端點較前區間的前端點發生了負向結構突變,負號數值意義則相反。其中正號個數為4,負號個數為6,說明整體上我國農林牧副漁產值序列有負向結構變化趨勢。
(3)賦權運算
距離2011年越遠的區間其賦予的權重越低,根據第二部分的權重計算公式可以的到表2。

表2 區間突變權重
(4)預測值的修正

而用2002~2010間9年的數據進行回歸,有:



圖3 三序列比較分析圖
則可以得到修正值為72280.5億元或71565.6億元,表明修正系數為1±0.009。而從本案例實際看,在2010預測上實際值要高于預測值,按照就近參照原則,對預測值進行正向修正的可行性要大些,即72280.5億元是2011年的最佳預測值。
進一步計算討論。本文在求得突變點規律系數的過程中,分別對10個時間段進行了OLS回歸,這樣就可以求得區間末端加1期的預測值,如1991~2000數據預測2001的數值,共有10個。圖3為區間點預測、實際值和用20年數據OLS回歸得到的相應預測值,很明顯區間點預測值一直圍繞著實際值在波動,比全時間段預測結果更能貼近實際,這是因為長期數據回歸過程包含了太多了的歷史信息,對最新信息賦予權重不夠,造成預測偏差。
通過對傳統預測方法的經驗總結,認為應繞開到底種預測方法更好的傳統認識誤區,應當從預測誤差變動規律入手,在已有的預測方法基礎上提出一種修正指數概念,總體來說有以下結論。
(1)所有預測方法都只能算作一種事前估計的方法而已,所以當前很多學者盲目去做基于某特定方法的改進意義有待商榷,應當建立一種具有普遍意義和共性的誤差修正方法,能夠對所有預測方法進行精度改進。當然本文對滾動誤差規律的論述還不深刻,特別是在實例計算中也僅僅涉及到10個區間樣本,一般而言數據區間個數越多能夠挖掘出的突變信息就越多,但如果就人工進行計算那么計算量非常繁重,故應當設計相應的計算程序能夠實現高頻數據的直接計算。
(2)正確認識到誤差產生的原因才能夠降低預測偏差,從而提高精度。到底是信息長度越長越好、還是越短越好,這個問題似乎纏繞了所有理論學者,因為時間序列越長,能夠提煉出的信息容量也越大,但各種方法都不約而同的存在一個缺陷:時間越長,一些無用信息或者負面信息也被容納的越多,盡管當前采用了時期權重的方法進行了修正,但誰也無法保證自身的賦權方法是正確合理的。針對于這個現狀,本文提出了滾動區間中的“平均滾動誤差”和結構突變規律概念,主要是為了表現區間吞吐數值之間的結構性變化,從而得到對傳統預測模型預測結果的進一步無偏估計修正。
(3)案例分析說明,使用滾動天窗式的分別模型運用帶來的預測效果從整體上高于全數據預測結果。李運蒙(2004)提出了一種從長短期經濟規律變化角度考慮的支持向量機預測精度提高方法,先采用兩種模型對經濟現象進行模擬,最后將兩個預測結果進行集成。本文的想法在某種程度上與該文類似,基本思想是可以通過可觀測數據的利用方式整合,盡可能挖掘出有用的信息;不同點在于本文認為,如果經濟規律比較穩定,那么就很容易通過精度分析評測出一種最為有效的預測模型,得到了的誤差也比較穩定。但在現實中正是因為經濟規律變化(短期規律可能穩定、但長期發生變化)產生了誤差波動現象,讓預測者無所適從,只能依靠一區間內的平均相對誤差進行相對評判。針對于新的預測點來說,前面若干年的平均誤差程度并不具有很強的參考意義,因為最終考察一種預測模型有效性的標準還是預測點上的誤差,所以探尋誤差規律和挖掘滾動區間的規律波動非常重要。
[1]王正歡,劉琦,羅朝輝,楊枉元.基于小波分析的全國社會消費品零售總額時間序列預測[J].云南民族大學學報(自然科學版),2011,(3).
[2]尹新,周野,何怡剛.基于混合算法優化神經網絡的混沌時間序列預測[J].湖南大學學報(自然科學版),2010,(6).
[3]顧晨陽,羅熹,程文龍.變權重組合預測模型在短時交通流預測中的應用[J].統計與決策,2010,(6).
[4]何其慧,黃德舜,張小霞,毛軍軍.一種新的區間權重組合預測方法[J].合肥師范學院學報,2011,(6).
[5]李運蒙.一種基于支持向量機預測模型的精度提高方法與運用[J].數學的實踐與認識,2004,(8).