摘要:預測就是根據事物的運動規律推斷它的未來。在預測問題中存在很多種預測方法,在分析過程中采用的預測方法不同得到的預測精度就不同,組合預測是提高預測準確度的有效途徑。本文利用對各種預測方法的結果的比較說明了組合預測對預測準確度提高的作用。
關鍵詞:單項預測 組合預測 預測精度
0 引言
預測就是根據事物的運動規律推斷它的未來,是將預測的理論和方法應用于實際問題。在預測問題中,由于建模機制和出發點不同,通常同一問題有不同的預測方法,但由于各種預測方法都有相應的特點和應用范圍,其預測精度不盡相同,所以在分析過程中采用的預測方法不同得到的預測精度就不同。為了對預測值進行校正,提高預測的準確度,可以將不同的預測方法進行適當組合,重新得到組合預測后的預測值,這將有利于綜合利用各種方法的優勢而達到提高預測精度的目的。
1 組合預測的構建
1.1 組合預測 由于各種預測方法均存在著各自的優缺點,將各類不同的單項預測方法適當的加以組合,綜合利用各種方法所提供的信息,盡可能提高預測效果是更科學的辦法,即得到組合預測方法。
組合預測法是指建立一個模型,把兩個或兩個以上的不同預測方法得出的不同預測值通過適當的加權平均,最后取其加權平均值作為最終預測結果的一種預測方法。組合預測的關鍵是如何恰當地確定各個單項預測方法的加權權重數,而且采用不同的最優準則就會有不同的最優組合預測模型,其權重數的獲得也就存在著一定的差異。通常都是把預測精度作為衡量某一組合預測模型優劣的指標。
1.2 組合預測權重的確定 組合預測的關鍵是如何恰當地確定各個單項預測方法的加權權重數,而且采用不同的最優準則就會有不同的最優組合預測模型,其權重數的獲得也就存在著一定的差異。通常都是把預測精度作為衡量某一組合預測模型優劣的指標。可采用“估計誤差的方差最小”作為組合預測的最優準則,建立組合預測模型。
假設對某一時間序列問題建立了m個預測模型,ji(j=1,2…,n),Yi(i=1,2…,n)為第i期的歷史數據,εji=ji-Yi(1,2…,n)為第j種預測模型的第i期的預測偏差,wj為第j種預測模型的組合權重系數,且wj =1,wj≥0,j=1,2…,m,加權組合預測的模型為:
(i)=wj ji, i=1,2…,n
1.2.1 最小二乘法確定權重
組合模型的預測偏差為εji=ji-Y=wj ji-Y
=wj ji-Yiwj=wjεji
一般來說,常采用最小二乘法來確定組合模型中各個單項模型的權系數。最優準則是使其誤差的平方和SSE達到最小,即J=e2i= (wteit)2=wiwj(etietj)=WTE(m)W達到最小。其中,W=Wm=(w1,w2,…,wm)T為組合權重向量,E(m)=(Eij)mxn為m種預測方法的預測誤差協方差陣,一般為正定矩陣。為使J達到最小,就是要求解如下模型: minJ=WTE(m)Ws.t.RTmW=1
其中,R=(1,1,…,1)T是元素都為1的m維向量,目的就是要在RTmW=1約束條件下求得最優的權重向量W。
1.2.2 標準差法確定權重
設m種預測方法的預測誤差的標準差分別為σ1,σ2,…,σm且σ=σi (i=1,2,…,m),取wi=×,i=1,2,…m,m為模型個數。最終的組合預測的模型為:Y*=w1Y1+w2Y2+…+wmYm。
2 預測精度的比較
本文運用對某地區客運量預測的相關數據,采用回歸預測、時間序列預測、灰色預測以及組合預測等幾種方法做預測分析,分析過程中根據不同的預測方法解釋變量有時間t、人口兩個變量,各相關原始數據見表1。
2.1 回歸預測 回歸預測是從事物變化的因果關系出發建立具有相關關系的變量之間的回歸模型進行預測的一種數理統計預測方法。根據自變量的多少,線性回歸又可以分為一元線性回歸和多元線性回歸。根據因變量和自變量之間的函數形式的不同,回歸模型可以分為線性回歸模型與非線性回歸模型兩種。而非線性回歸模型又可分為拋物線、雙曲線、指數曲線、代數曲線回歸模型等。回歸預測的一般思路為:
2.1.1 分析一組統計數據,確定幾個特定的變量之間的數學關系式的形式。
2.1.2 對變量關系式中的參數進行估計和統計檢驗,分析影響因素與預測目標之間的關系強弱和影響程度,確定哪些變量是主要因素,哪些變量是次要因素以及它們的關系。
2.1.3 根據得到的回歸方程和自變量的值預測因變量未來的值,并且分析和研究預測結果的誤差范圍和精度。
在回歸預測時,由于客運量與城市人口有密切的關系,所以選擇人口作為自變量對客運量進行回歸,分別作人口和客運量的散點圖、人口和客運量對數的散點圖(省略),進而選擇合適的模型進行回歸。由散點圖可知,選擇建立線性回歸模型進行預測。得到預測公式為式1,預測結果見表2。
y=15443+22.82486×x (式1)
2.2 時間序列預測 時間序列預測是根據時間序列數據隨時間變化的規律進行預測的一種定量分析方法。主要有確定型時間序列預測法和隨機型時間序列預測法。確定型的時間序列預測法包括時間序列分解法(趨勢變動、季節變動、循環變動和隨機變動的加法和乘法模型)和趨勢外推法(時間模型及移動平均和指數平滑法)。隨機型時間序列預測是對平穩的隨機時間序列利用自回歸模型、滑動平均模型或自回歸滑動模型進行預測的方法。
時間序列預測就是用歷史數據構造時間序列模型,然后借助模型進行外推以預測未來。時間序列預測法有兩個假設前提:(1)決定事物過去發展的因素在很大程度上也將決定事物的未來發展;(2)事物發展過程一般屬于漸進變化,而不是跳躍式變化。
在時間序列預測中,選擇時間t作為自變量建立預測模型。由客運量和時間t的散點圖(省略)可知,客運量y與時間t呈直線關系,所以選擇線性回歸模型進行預測。采用普通最小二乘法得到的客運量預測方程為式2,預測結果見表2。
y1=28856+849.42×t (式2)
2.3 灰色預測 灰色預測法是一種對含有不確定因素的系統進行預測的方法,即對灰色系統所做的預測。灰色預測為了弱化原始時間序列的隨機性,在建立灰色預測模型之前,先對原始時間序列進行數據處理,經過數據處理后的時間序列為生成列,使生成列具有較強規律性的數據序列,然后對生成列建立相應的微分方程模型,從而預測事物未來發展趨勢的狀況。灰色預測的有四種常見的類型:灰色時間序列預測,即用觀察到的反映預測對象特征的時間序列來構造灰色預測模型,預測未來某一時刻特征量或達到某一特征量的時間;畸變預測,即通過灰色預測模型預測異常值出現的時刻;系統預測,通過對系統行為特征指標建立一組相互關聯的灰色預測模型,預測系統中眾多變量間相互協調關系的變化;拓撲預測,通過灰色模型預測事物未來變動的軌跡。灰色理論有多種預測模型。灰色模型一般記作GM(n,h),最常用的是GM(1,1)模型,GM(1,1)模型計算步驟為:
給定原始數列
X(0)={x(0)(t)│t=1,2,…n}={x(0)(1),x(0)(2),x(0)(3),…x(0)(n)}
2.3.1 對原始數列X(0)作一次累加生成(1-AGO),生成數據序列:
X(1)={x(1)(t)│t=1,2,…n}={x(1)(1),x(1)(2),x(1)(3),…x(1)(n)}式中,
X(1)(t)=x(0)(k),k=1,2,…n
2.3.2 構造累加矩陣b與常數向量y:
2.3.3 用最小二乘法求解灰參數:=(a,u)T=(bTb)-1-bTY
2.3.4 寫出時間響應函數:(1)=(t+1)=(x(0)(1)-u/a)e-at+u/a
對(1)=(t+1)=(x(0)(1)-u/a)e-at+u/a作累減還原,得原始數列的灰色預測模型,(0)=(t+1)=x(1)(t+1)-(1)(t)
把客運量的原始數列記作X(0),對X(0)作一次累加得到X(1)。利用X(1)序列中的數值求得累加矩陣中的數值,用最小二乘法求解灰參數
=(a,u)T=(bTb)-1-bTY并利用時間響應函數得到客運量的預測公式為式3,預測結果見表2。
(0)(t+1) =1352656(e0.022674t-e0.022674(t-1)) (式3)
2.4 組合預測 利用標準差法確定組合預測的權重,設回歸預測、時間序列和灰色預測的預測誤差的標準差分別為σ1,σ2,σ3且σ=σi (i=1,2,…,m)組合預測的權重wi=×,i=1,2,3,m=3為模型個數。利用各預測方法的絕對誤差序列得到各預測方法的標準差σ1,σ2和σ3。
由表2可知客運量各預測方法的預測誤差的標準差分別為σ1=265.00(時間序列預測),σ2=337.85(灰色預測),σ3=243.52(回歸預測),代入求權重的公式得到w1=0.343,w2=0.300,w2=0.357。根據這個組合權重,建立組合預測模型:
Y=0.343Y1+0.300Y2+0.357Y3(式4)
式4中Y為組合預測值,Y1為時間序列預測值,Y2為灰色預測值,Y3為回歸預測值。把回歸預測結果、灰色關聯預測結果、時間序列預測結果以及組合預測結果作比較見表2。
3 結論
通過比較回歸預測、時間序列預測和灰色預測三種模型的預測方法,灰色預測模型和時間序列模型需要的數據量相對較少,較為簡捷,直接考察序列的趨勢進行擬合。尤其是灰色預測模型不僅需要的數據最少,而且其預測精度也很高。這兩類模型的不足在于它們的預測曲線都比較光滑,因此不能有效處理原始數據出現轉折點的情況,此外無法深入考察序列趨勢變化背后的意義。而回歸預測,在選擇模型形式要耗費時間和精力,對于變量的選擇和數據的收集也提出了較高的要求。但是相對時間序列模型和灰色預測模型而言,回歸預測模型可以充分考慮因變量和自變量之間的關系,能有效擬合數據轉折點問題。組合預測法通過對各種單項預測算法的組合,綜合利用各單項預測方法的優勢,進行優化處理、取長補短,達到進一步提高預測精度并使之實用化。
參考文獻:
[1]王碩,唐小我.組合預測系統綜合研究[J].科學管理研究.2000年04期.
[2]梁慧穩,王慧敏.經濟預測方法系統研究[J].現代管理科學.2002年06期.
[3]徐惠莉,吳柏林,江韶珊.區間時間序列預測準確度探討.數量經濟技術經濟研究.2008年01期.
\"基金項目:河北省哲學社會科學規劃研究項目(HB07BLJ003)