裝甲兵學院 朱思瑾 李 康 沈吉鋒 劉新永
本文試圖通過對30年來全國安全生產歷史數據的分析、擬合,并進行短期預測,從而為正確判斷未來安全生產形勢,制訂相應措施提供可靠依據。
ARMA模型是一種比較成熟的模型,適于短期預測。模型建立,要求時間序列是隨機和平穩的,而且需要長期連續數據,編寫程序進行模型的辨識。
2.1.1 AR模型
AR模型也稱為自回歸模型,它的預測方式是通過過去的觀測值和現在的干擾值的線性組合預測。自回歸模型的數學公式為:

式中:p為自回歸模型的階數;
Φi(i=1,2,…,p)為模型的待定系數,et為誤差;Yt為一個時間序列。
2.1.2 MA模型
MA模型也稱為滑動平均模型,它的預測方式是通過過去的干擾值和現在的干擾值的線性組合預測。滑動平均模型的數學公式為:

式中:q為模型的階數;jθ(j=1,2,……q)為模型的待定系數,et為誤差,tY 為觀測值。
2.1.3 ARMA模型
自回歸模型和滑動平均模型的組合,便構成了用于描述平穩隨機過程的自回歸滑動平均模型ARMA。數學公式為:

2.1.4 ARMA模型的預測步驟
(a)對時間序列進行差分,以得到一個平穩隨機序列,然后O一1均值化序列。
(b)計算差分后序列的自相關系數和偏相關系數,以選擇一個合適的ARMA模型。
(c)用最小二乘法對ARMA模型分析,計算模型參數值。
(d)對估計得到的模型,進行適應性檢驗,重新改進模型,直至得到最優模型為止。
(e)進行預測。
1983年至2012年中國工業企業事故死亡人數、職工人數來源于《安全生產年鑒》、《中國統計年鑒》和《中國勞動統計年鑒》等正式出版物。以1983-2012年全國工業企業事故死亡人數、死亡率作為建模基礎數據,如表l所示:

表1 1983~2012年全國工業企業事故死亡人數與死亡率

表2 根據ARMA模型所得自相關系數和偏相關系數值
先對原始數據進行初步分析,通過繪制數據趨勢圖檢驗時間序列。可以發現,2O世紀8O年代初到90年代初,工傷死亡人數略呈平穩下降,然后明顯上升。1996年后逐漸下降,2000年又出現上升趨勢。但死亡率除個別年代出現波動外,總體上是呈下降趨勢,時間序列為非平穩序列。由于ARMA模型只能分析0-1均值化的時間序列,而計算出序列的均值為0.045,表明對序列的影響很小,故忽略不計,認為數據是均值化的。根據ARMA模型的自相關和偏相關分析法編寫程序,識別模型的階數。相關系數和偏相關系數分析如表2所示。
經過自相關分析圖分析,ρk的取值范圍在置信區間[-2.59,2.59]內,可見序列是一隨機列,而且當k>3時,在零值附近上下波動,可見序列是一平穩序列當ρ k>2時,取值都在[-2.59,2.59]內,且有收斂到零的趨勢,根據定階準則,證明符合AR(2)模型。
模型參數的估計使用最小二乘法.用統計軟件SAS分析,結果如下:Zt=0.003993-0.5830747Xt,F值為7.05,遠遠大于F0.01(2,43),所以回歸是高度顯著的.分析表明AR(2)是合適的。
從本研究的具體估計結果來看.多數年份相對誤差在10%以下,說明此方法預測比較精確,短期預測可信度較高。而2000年以來有所上升.這與我國經濟發展正處于快速發展上升周期,不斷加大的能源需求,而安全生產投人相對滯后等因素有較大關系。
[1]徐國祥.統計預測和決策[M].上海財經大學出版社,2006.
[2]王振龍.時間序列分析[M].中國統計出版社,2003.