王月紅,高 萌,趙帥博
(華北理工大學礦業工程學院,河北 唐山 063210)
礦塵不僅危害井下工作人員的身體,當礦塵達到一定濃度也會引發爆炸,還會造成更嚴重的井下災害事故。在煤礦生產作業過程中,如鉆井、爆破作業、采煤機及掘進機作業、煤礦的運輸轉運等多個環節都會產生礦塵[1]。在不同礦井中,由于地質條件、煤的變質程度以及采掘方法、機械化程度等不同,礦塵的產生量也有很大的差異;在同一礦井內,礦塵量也處于動態變化中。為了減小礦塵事故,預測井下礦塵濃度,許多學者進行了相關研究。相關文獻表明,學者們主要采用神經網絡模型對粉塵濃度進行預測,如:改進的神經網絡模型[2]、BP神經網絡模型[3]、熵權法RBF神經網絡[4]。對礦塵濃度進行預測的同時,也建立了相關模型預測塵肺病。譚強等[5]、王維等[6]基于灰色數列模型GM(1,1)對職業病的發病情況進行預測,時冬青[7]在灰色GM(1,1)模型的基礎上結合馬爾科夫過程構建灰色GM(1,1)-馬爾科夫預測模型探討該模型在職業病預測領域的應用,王永斌等[8]等建立灰色-廣義回歸神經網絡組合模型,研究該模型對塵肺病預測的準確性。通過對塵肺病進行預測,使煤礦管理人員根據塵肺病的發病情況制定具有針對性的預防措施。
ARIMA模型在塵肺病的預測方面有一定的應用[9],但在粉塵濃度預測方面的研究尚少,本文通過建立ARIMA模型并結合實例,具體分析了ARIMA模型在井下粉塵濃度預測方面的應用。
ARIMA模型稱為求和自回歸滑動平均模型,由博克思(Box)和詹金斯(Jenkins)于20世紀70年代初提出的一種著名時間序列預測方法,所以又稱為Box-Jenkins模型、博克思-詹金斯法。 所謂ARIMA模型,是指將非平穩時間序列轉化為平穩時間序列,然后將因變量僅對它的滯后值以及隨機誤差項的現值和滯后值進行回歸所建立的模型。ARIMA模型根據原序列是否平穩以及回歸中所含部分的不同,可分為以下三類:自回歸模型(Autoregressive Model,AR模型),滑動平均模型(Moving Average Model,MA模型),自回歸滑動平均模型(Auto-Regressive and Moving Average Model,ARMA模型)[10]。
1) AR模型。AR(p)為p階AR模型,它是僅用時間序列不同滯后項作為解釋變量的模型。模型見式(1)。
Yt=φ1Yt-1+φ2Yt-2+…+φpYt-p+et
(1)
式中:φ1,φ2,…,φp為自回歸系數;p為自回歸階數,也是模型中解釋變量的個數;et為t時刻的誤差。
2) MA模型。MA(q)為q階MA模型,它是僅用誤差的不同滯后項作為解釋變量的模型,模型見式(2)。
Yt=et+θ1et-1+θ2et-2+…+θqet-q
(2)
式中:θ1,θ2,…,θq為移動平均系數;q為移動平均階數,即模型中解釋變量的個數。
3) ARMA模型。ARMA(p,q)為(p,q)階ARMA模型,模型見式(3)。
Yt=φ1Yt-1+φ2Yt-2+…+φpYt-p+et+
θ1et-1+θ2et-2+…+θqet-q
(3)
特殊情況,若p=0,模型是移動平均模型,記為MA(q),或ARMA(0,q);若q=0,模型是自回歸模型,記為AR(p)或ARMA(p,0)。
ARIMA模型簡單,只需通過自身的歷史觀測值就可反映出未來趨勢,在預測過程中需要對非平穩數列進行平穩化處理,模型既考慮了時間序列上的依存性,又考慮了隨機波動的干擾性。在獲得初步模型以后,可以根據貝葉斯信息準則對比模型的優劣程度,從而選出最優模型,提高模型預測的準確率。
以某礦5424工作面粉塵濃度為原始數據來源,通過擬合時間在9∶31~10∶13之間的22組數據,建立合適的ARIMA模型,用于預測10∶15和10∶17這兩個時間點的粉塵濃度,再將預測值與實際值進行比較,進而驗證模型的適用性。

表1 原始數據Table 1 Original data
在SPSS軟件中導入粉塵濃度與時間數據,再繪制序列圖,見圖1。
從圖1中可以看出,隨著時間的推移,粉塵濃度有一定的下降趨勢,因此認為該序列不是平穩序列,需要對其進行平穩化處理。此時選用差分的方式對數據進行平穩化處理,這里選擇二階差分,這是由于在后期建模過程中,如果只進行一階差分,所得模型的擬合程度較低。對數據進行二階差分并繪制時序圖,差分后的數據在某一值上下波動,認為序列平穩,見圖2,故ARIMA模型d取2。

圖1 粉塵濃度時序圖Fig.1 Sequence diagram of dust concentration

圖2 二階差分時序圖Fig.2 Second order difference sequence diagram
對于ARIMA模型,如果自相關函數的滯后數為p后截尾,且偏相關函數的滯后數為q后截尾,則其階數分別為p,q。本文通過自相關與偏自相關系數來確定p值,q值。
通過圖3和圖4可以看出,圖像呈明顯的拖尾現象,偏自相關圖中滯后編號為1時,偏自相關系數超出置信區間,故p取1。同理,自相關圖中滯后編號為1時自相關系數超過置信區間,故q取1。再通過BIC準則,即選取BIC值最小的,BIC值見表2。

表2 BIC值Table 2 Numerical value of BIC

圖4 二階差分偏自相關Fig.4 Second order difference partial autocorrelation

圖3 二階差分自相關Fig.3 Second order difference autocorrelation
根據以上自相關偏相關系數及BIC準則,最后選定ARIMA(1,2,1)最合適。
輸出的ARIMA(1,2,1)模型統計量見表3。

表3 ARIMA(1,2,1)模型統計量Table 3 ARIMA(1,2,1) model statistics
由表3可知,模型自由度為16,P值(Sig.)為0.927顯著大于0.05的檢驗水平,因此不能拒絕該序列為白噪聲的原假設。由圖5分析可得,殘差自相關和偏自相關函數均在2倍標準差范圍內,因此,認為殘差沒有相關性,是白噪聲序列,進一步驗證了模型的合理性。

圖5 殘差自相關與偏自相關Fig.5 Residual autocorrelation and partial autocorrelation
利用建立的模型對時間在9∶31~10∶13之間的22組數據進行擬合,并對10∶15和10∶17兩個時間點的粉塵濃度進行了預測,預測結果見表4。

表4 模型預測結果Table 4 Model prediction results
由表4可以看出建立的ARIMA(1,2,1)模型對10∶15和10∶17兩個時間點的粉塵濃度的預測與實測值相差不大,相對誤差最大為8.34%,最小為2.40%,都在10%以內,可以認為該模型合理,能夠對粉塵濃度變化進行較好的預測。
1) 影響粉塵濃度的因素有很多,如作業場所、通風系統等,通過分析得出利用時間序列對粉塵濃度預測是可行的。
2) 粉塵濃度是非平穩隨機序列,在前人的相關研究基礎上,將ARIMA模型運用到粉塵濃度預測方面,結合某礦監測數據,建立ARIMA(1,2,1)預測模型,并對模型進行檢驗,最后將預測值與實測值進行對比,得到相對誤差都控制在10%以內,進一步驗證了模型的合理性。
3) 雖然模型精度較高,但是ARIMA模型是基于歷史數據的變化趨勢對未來進行預測,并不能準確了解到未來環境變化對數據的影響,可見模型對短期預測效果較好,若需要長期預測還要進一步結合其它模型進行研究。