張醫銘
(中國石化上海石油化工股份有限公司統計中心,上海 200540)
時間序列是以時間為順序排列并隨時間而變化,同時又具有一定關聯關系的數據序列。時間序列分析是根據相鄰數據點之間具有相關性的特點,建立相應的數學模型來對觀測數據進行擬合,并實現相關信息的有效預測[1]。時間序列分析通常在經濟領域應用較為廣泛。文章試圖采用這一方法對中國石化上海石油化工股份有限公司(以下簡稱上海石化)海運碼頭出廠數據的計量誤差進行預測,為計量數據管理提供決策依據。上海石化的柴油海運出廠通過計量流量計進行結算,但是計量數據和商檢量之間存在著隨機誤差,并且隨著季節變化存在周期性特點。為方便管理,需要知道該誤差的趨勢范圍,以便能夠及時發現異常情況,因此擬采用時間序列分析方法來進行分析建模,這里將采用移動平均自回歸模型(ARMA)對誤差數據進行預測分析。ARMA模型是一種專門處理一維時間序列數據的模型,可為柴油出廠計量誤差規律性分析提供一種新思路。
時間序列分析方法最初只有自回歸模型(AR)用于市場變化規律的預測,在此基礎上數學家瓦格兒又提出了滑動平均模型(MA)和移動平均自回歸模型(ARMA),這3個模型奠定了時間序列分析理論的基礎。ARMA模型主要應用于對一維、方差穩定的平穩時間序列分析,認為時間序列當前觀測項的值可以表示為其之前的p項觀測值及q項隨機誤差的線性組合,即滿足式(1),為移動平均自回歸模型,并記作ARMA(p,q)模型[2]。
移動平均自回歸模型的數學表達形式為:
Xy-φ1Xt-1-...φpXt-p=εt-θt-1-θqεt-q
(1)
式中:φ1為自回歸因子,θ1為滑動平均因子,{ε1}為白噪聲序列。
引入后移算子B,用Bk表示k步線性推移算子,即BkX1=Xt-k,Bkε1=εt-k,令
φ(B)=1-φ1B-φ2B2-...-φpBp
(2)
θ(B)=1-θ1B-θ2B2-...-θpBp
(3)
則(1)式簡寫為:
φ(B)Xt=θ(B)εt
(4)
這就是p階自回歸q階移動平均模型,記為ARMA(p,q)。當p=0時為純滑動平均模型,記為MA(q);當q=0時為純自回歸模型,記為AR(p);當p=q=0時,則模型表示為Xt=εt,此時,該序列為白噪聲序列[3]。
ARMA模型建模過程主要包括數據預處理、階數選取、參數估計和模型檢驗4個步驟。
(1)數據預處理:使用ARMA模型需要對數據進行預處理,主要包括異常數據剔除和序列平穩性檢驗。序列平穩性可以通過時序圖初步判斷,然后通過計算樣本數據的自相關函數與偏相關函數等判斷。如果自相關圖是截尾或者拖尾,則可以判斷數據適用ARMA模型。如果樣本數據非平穩,則可通過差分法處理進行非平穩序列建模。
(2)階數選取:確定模型的階數,即p和q值。可以通過自相關圖選擇相應的階數進行擬合,也可以采用AIC準則進行判斷。
(3)參數估計:確定自回歸因子和移動平均因子的值。參數估計主要包括最小二乘法和極大似然估計等,文章擬采用極大似然估計,使用Eviews軟件進行數據計算。
(4)模型檢驗:模型檢驗的方法主要包括卡方檢驗和實測檢驗法。卡方檢驗的基本思路是,在相應的顯著性水平下檢驗模型的殘差序列是否為白噪聲序列;實測檢驗法是將模型預測值與實測數據進行比對,計算相應的誤差,從而進一步修改完善模型[4]。
由于柴油海運出廠并非每天都有,因此數據不可能嚴格連續,為了更好地分析時間序列方法在誤差數據中的預測[5],選取2015—2017年誤差實測月平均數據作為樣本數據,根據直觀法剔除明顯的異常數據后得到誤差數據時間序列{Xt},剔除異常值后的柴油計量數據誤差值時序圖見圖1。序列自相關和偏自相關情況見圖2。

圖1 序列時序

圖2 序列自相關情況
綜合分析序列時序圖、自相關圖,判定該序列為非平穩序列,可以考慮使用差分法對序列進行處理。
一階差分后的序列時序(y)、一階差分序列自相關(ACF)和一階段差分序列偏自相關(PACF)情況見圖3~5。

圖4 一階差分序列自相關

圖5 一階差分序列偏自相關情況
由圖4~5可知:該序列圍繞0點上下波動,且樣本自相關和偏自相關因子很快落入隨機區間,說明一階差分后的序列呈現平穩性,可以對其建立ARMA模型。由圖5可見,序列的樣本自相關因子在k=3處顯著不為0,表現為拖尾性,因此可以考慮q=3;偏自相關因子表現為一階截尾性,因此可以考慮取p=1。由于對原數列進行了一階差分,因此最終可以建立ARIMA(1,1,3)模型。模型參數估計結果見表1。

表1 模型參數估計結果
根據自相關圖顯示的自相關因子的3階截尾的性質,嘗試擬合MA(3)模型,使用極大似然估計方法,確定MA(3)模型的口徑為:
xt=(1-0.6 046B+0.0 583B2-0.4 535B3)εt
(5)
根據偏自相關圖的1階截尾性,可以嘗試使用AR(1)模型進行擬合,使用極大似然估計方法確定模型口徑為:
(6)
參數估計完成后,為了驗證ARIMA(1,1,3)模型是否符合意義,運用白噪聲檢驗法對殘差序列進行檢驗。通過對殘差序列的檢驗后,發現該模型是合適的,因此可以對此進行短期預測。預測結果見表2,擬合預測見圖6。

表2 5期預測結果

圖6 擬合預測情況
(1)根據誤差數據的時序圖分析,發現該序列為非白噪聲、非平穩序列,在對其數列進行差分后滿足ARMA模型的建模要求。
(2)通過AIC定階準則選取了ARMA(1,3)模型作為最終的擬合模型對數據進行分析,最終使用極大似然估計的方法確定了模型的擬合方程。
(3)通過小樣本時間序列的預測分析,運用ARMA模型對誤差數據進行建模,得到具體的分析方程,可以預測短期的誤差值,在實際的計量數據管理中,可以提供甄別異常值的理論依據,具有較高的實用價值。
(4)模型優點:通過對油品出廠計量數據誤差進行分析,建立了相應的ARMA(p,q)模型,從預測的靜態圖上看,此種方法可以模擬數據的走勢,具有一定的參考意義,可以對異常數據進行準確的判斷。
(5)模型缺點:在數據處理上,由于這些數據本身具有一定的隨機性,規律性較弱,采用單一的模型處理時會存在較大的誤差,所以對于預測的具體數值精度較低,只能提供大概率的置信區間供參考。