傅坤
摘要:文章研究了基于Bayes理論和Box-Jenkins理論比較的系統建模方法,通過采用定性分析和實證實驗結合的方式,從先驗信息的使用、模型的產生機制等方面比較兩個模型的異同,結合分析1991~2010年江蘇省就業情況,從而對江蘇省就業形勢做出預測。
關鍵詞:Bayes(貝葉斯)理論;Box-Jenkins理論;ARIMA模型;時間序列
一、時間序列
時間序列是指同一種現象在不同時間上的相繼觀察值排列而成的一組數字序列。時間序列預測方法本質上仍屬于定量預測,因為它推測事務發展趨勢的前提是默認事務的發展具有一定的延續性和規律性,這種延續性和規律性可以通過分析歷史數據得出,并可延伸到未來,從而對該現象的未來做出預測。時序預測對資料要求比較單一,只需要變量的歷史數據,同時模型相對簡單,因此它廣泛應用于金融、醫學、水文、生物、計算機以及氣象等領域,并日益顯示出其強大生命力,成為一支獨立的重要數學分支。
目前,時序的預測方法主要可以分為以下兩類:1.線性時序預測,如傳統的回歸分析、博克斯-詹金斯預測模型等,這些方法大都屬于統計建模方法,在理論上都比較成熟,但是要求時間序列具有平穩性、正態性、獨立性,不太適合于復雜時間序列建模。2.非線性時序預測,如神網絡模型(ANN)等,非線性方法以其模擬復雜系統的能力強越來越受到人們的重視。
二、兩種預測方法基本原理
Box-Jenkins基本原理。Box-Jenkins法是以美國學者George Box和英國統計學家Gwilym Jenkins的名字命名的,也稱為B-J法或ARMA方法,它將預測對象隨時間變化形成的序列視作為依賴時間t的一組隨機變量,它以自相關函數、偏自相關函數的統計特性為依據,來確定模型的類型,進而對模型進行定階、參數估計、適應性檢驗、預測等,建立起適應序列的模型。
Bayes基本理原理。英國學者T·貝葉斯1763年在《論有關機遇問題的求解》中提出一種歸納推理的理論,后被一些統計學者發展為一種系統的統計推斷方法,在樣本或參數數據有限條件下,對部分未知的狀態用主觀概率推斷(先驗分布),然后用貝葉斯公式對發生概率進行修正(后驗分布),最后再利用期望值和修正概率做出最優決策。
三、兩種預測方法對比分析
(一)對系統先驗知識的應用
作為建模可利用的信息,系統先驗信息和樣本信息是兩個不同的方面。尤其在對復雜系統建模的時候,正確地利用系統的先驗信息,往往可以大大降低模型的過程擬合,從而在很大程度上提高模型的預測能力。將系統的先驗信息和樣本信息結合,這是Bayes和B-J時序模型的最大相似之處,但是他們在先驗信息的使用上有些區別。
Box-Jenkins時序預測法對于先驗信息的運用遠大于Bayes時序預測法,甚至可以直接運用先驗知識選擇參考函數和一些準則,而Bayes時序預測法在建立模型時,是將有限的先驗分布信息和似然函數結合起來,先做出假定的主觀概率預測,從而求得合理的模型參數,再利用貝葉斯公式對發生概率進行修正,最后再利用期望值和修正概率做出最優決策。
(二)模型產生機制
Box-Jenkins時序預測法是將時間序列看成是一個依賴于時間t變化的一組隨機變量,雖然在此過程中某單個時序值具有不確定性,但整個序列的變化仍會呈現一定的規律性。B-J的基本思想是,這一串隨時間變化而又相互關聯的數字序列可以用相應的數學模型加以描述,可以從本質上掌握這些動態數據內在結構和復雜特性,從而達到在最小方差意義下的最佳預測。
Bayes時序預測法必須首先要依靠先驗信息和似然函數假定出模型的結構,再利用貝葉斯理論進行相關推理。在整個推理過程中,模型結構是不變的。因此為了提高預測的效果,必須建立不同結構的貝葉斯時序模型,然后選擇其擬合效果及檢驗效果較好的貝葉斯時序模型為最終的預測模型。
在建立Bayes模型的時候,其結構需要不停地根據擬合的結構進行變化,而B-J時序模型則沒有這樣的要求,這是二者的一個顯著區別。
四、江蘇省就業形勢預測
(二)基于B-J時序模型的預測
根據江蘇統計年鑒(2015)中1991~2010年江蘇省的就業人口數和總人口數從總體變化數據統計,將其生成時序圖如圖1所示,總體趨勢呈現較為平穩。
為了進一步判斷該時間序列是否具有穩定性,通過EVIEWS軟件對進行其單位根(ADF)檢驗,通過檢驗發現不存在單位根,即該組數據同階協整,因此該時間序列平穩,可以通過自相關函數和偏自相關函數的統計特性,對該平穩時間序列進行識別,該序列的自相關函數圖(ACF)和偏自相關函數圖(PACF),如圖2、圖3所示。從圖2和圖3可以看出,ACF拖尾,PACF在p=5時候截尾,通過觀察殘差方差圖可以發現,殘差方差先按照一定幅度減小,當變化到第5次的時候為最小,因此可以初步判斷AR(5)為比較合適的模型。
從該序列相關性檢驗結果來看,各個參數都通過了顯著性檢驗,模型總體的統計顯著性方差比檢驗也通過,自相關統計值DW為0.132876,可以認為序列不存在自相關,擬合優度的可決系數R2為0.770095,數值距離1有些差距,主要是因為其他一些客觀原因,以及一些不確定因素的影響,總的來說,模型的統計檢驗可以通過。
(三)預測的比較
根據江蘇統計年鑒(2017)資料顯示,2015年、2016年江蘇省就業人口數/總人口數分別是4758.50萬人/7976.30萬人和4756.22萬人/7998.60萬人,比較Bayes時序預測法和Box-Jenkins時序預測法兩種方法預測結果,可以看出前者的誤差比后者的誤差稍高些,相比較而言,Box-Jenkins時序預測法的精確度稍微高一些。
五、結論
本文應用Bayes時序預測方法和Box-Jenkins時序預測方法兩種建模的方法對江蘇省就業人口數和總人口數(1991~2010年)數據建立時間序列模型,得出預測模型,兩種建模方法均簡單易行,但又有各自的優缺點,在考慮實際模型的時候,可以將二者有效的結合起來,吸取各自的優點。在就業形勢越來越嚴峻的今天,這兩種方法都具有較高的應用價值,所得出的數據均具有較高的參考價值。
參考文獻:
[1]王亮,劉豹.時間序列預測方法評述[J].預測,1991(04).
[2]Damodar N.古扎拉蒂.Basic Economics(第三版)[M].中國人民大學出版社,2000.
[3]陶靖軒.經濟決策與預測[M].中國計量出版社,2004.
[4]吳喜之.現代貝葉斯統計學[M].中國統計出版社,2000.
[5]陳茜.貝葉斯預測模型的應用[J].黑龍江科技信息,2007(03).
[6]張曉峒.計量經學軟件EViews使用指南[M].南開大學出版社,2003.
(作者單位:南京郵電大學)