周旭,王藝博,朱毅,秦思佳
(1.華北理工大學 理學院,河北 唐山 063210;2.華北理工大學 以升創新教育基地,河北 唐山 063210)
煤炭在我國能源結構中占有著絕對重要的地位,在工業化建設初期曾占到能源結構總量的90%。隨著近幾十年來對油田的開采,煤炭在能源結構中的占比才有了一定程度的下降,但仍在能源結構中占有主要地位。可以預見,煤炭工業在國家能源結構以及國民基礎經濟中的地位是不可代替的,具有長期性和穩固性。隨著煤礦機械化水平的提高,礦井粉塵不斷增加。在礦井事故中,大多數事故都與礦井中的粉塵濃度有關。礦井粉塵不僅會危害地下工人的身體,而且當粉塵達到一定濃度時會引起爆炸,甚至會造成更嚴重的地下災害[1]。因此,礦井防塵工作越來越重要,準確預測礦塵濃度對礦井安全生產具有重要意義。
相關文獻表明,學者們主要采用神經網絡模型對粉塵濃度進行預測,如:改進的神經網絡模型[2]、BP神經網絡模型[3]、熵權法RBF神經網絡[4]。王永斌等[5]建立的灰色-廣義回歸神經網絡組合模型以及基于費舍爾得分和支持順序前向搜索算法[6]的支持向量積模型,研究該模型對塵肺病預測的準確性。上述模型雖然在傳統的擬合預測領域中表現出了較高的擬合度與準確性,但由于模型中存在的遺忘機制,導致其對具有時序特征數據的預測會有一定的偏差。因此,結合神經網絡模型的預測能力,以及時間序列模型對時序型數據的處理能力,構建模型對礦井粉塵濃度進行預測無疑是一種有效的預測方法。但傳統的神經網絡模型,在數據量較小,且樣本數據受到多方面因素影響時,很難展現出良好的性能。而傳統的時間序列模型,雖然對時間變量作為自變量的數據樣本具有良好的擬合效果,但是在進行預測時,只能做到短期的預測,且誤差急速增長。
為了解決這些問題,該項研究融合時間序列與神經網絡的模型,提出一種非線性自回歸的礦井粉塵濃度預測模型,多重考慮了變量時間因素以及模型輸出結果對模型本身的影響。
時間序列的建模及預測在學術界和實際應用領域極為普遍,如城市交通量、人口增長量、股市價格、國民收入、太陽黑子數等預測問題[7]。自1970年問世以來,逐漸形成了一整套時間序列識別、估計、建模、預測及控制的理論和方法。以Box-Jenkins為代表的現代時間序列預測方法建立在隨機過程理論基礎上,具有結構簡單、建模速度快、預測精度高等優點,并且解決了非平穩序列時間序列的處理問題,非常適合現實生活中各類隨機性強的時間序列的分析和預測[7]。
一般來說,建立ARIMA模型有3個階段,分別是模型識別和定階、參數估計和模型檢驗。其中模型識別指在繪出時序圖后,判斷所需差分階數,并由ACF與PACF圖判斷 與 的取值,其原始時間序列模型為:

(1)
其中L為y的滯后算子,其滿足:

(2)
模型檢驗指根據所計算得到的模型殘差值對其進行檢驗,判斷模型反應序列變化的完整性。
神經網絡法的學習和訓練過程包括正向傳播和反向傳播2個階段。在正向傳播過程中,樣本數據通過隱藏層的傳遞函數從輸入層傳遞到輸出層[8]。如果輸出層沒有得到所需的輸出,則進入反向傳播過程,沿原正向傳播路徑返回誤差信號,采用均方誤差和梯度下降法修改網絡連接權重,調整網絡實際輸出與引導學習信號之間的均方誤差值。重復此過程,直到達到指定的錯誤要求或達到最大培訓次數為止。圖1所示為神經網絡模型的基本原理。

圖1 神經網絡原理圖
考慮到變量與樣本在訓練過程中所受到的綜合影響因素,輸入集數據不單會受到觀測值變量的影響,還會在一定程度上受到輸出數據的影響,因此需要在輸入與輸出數據之間建立影響選用外因(外部)輸入非線性自回歸NARX模型對數據集進行處理。
以某礦5424工作面粉塵濃度為原始數據來源[9],通過采集篩選時間在某日9:31~10:17之間的47組數據,建立合適的時間序列神經網絡模型,在模型檢驗通過后,將其用于預測10:18至10:21這4個時間點的粉塵濃度,進而驗證模型的適用性。表1所示為工作面在篩選時間內的對應粉塵濃度。

表1 原始數據
將表1中的時間與其所對應的粉塵濃度導入SPSS后,將其對應時間的變量進行初始化,得到定義出的時間變量并將其繪制成如圖2所示時序圖:

圖2 粉塵濃度時序圖
從圖2中所反映的粉塵濃度變化趨勢來看,時間因素在粉塵濃度變化的影響因素中占有極大的權重,且其濃度變化趨勢與時間變量的關系并非簡單的線性關系,因此采用神經網絡模型對此變量進行預測。
(1)隱藏層層數的確定
隱藏層負責處理輸入特征的信息,具有一個隱含層的網絡可被稱之為單隱含層網絡,具有兩個及以上隱藏層的網絡可被稱之為多隱含層網絡,用于解決復雜問題。網絡層數增多,會提升運算的精度[10]。但模型的復雜程度也隨之提升,且過擬合風險也會變大。若為簡單問題,一般選取單隱含層網絡,對于復雜問題一般可設置多層網絡。考慮到實際數據樣本量較少,不易發生過擬合的現象,并為了提高模型預測結果的擬合度,該項研究選擇10層網絡以及2個延時來構建模型。
(2)激活函數的選擇
由于神經網絡能夠不斷學習的本質就是在接收不斷訓練誤差的反饋中,來優化自身的模型參數。其中,當前層的誤差大小與激活函數的選擇有著密切關系[11]。由于sigmoid 函數與tanh函數的導數值均不大于1,在迭代的過程中必然會出現梯度消失的情況,導致訓練提前終止。而ReLU函數則可以很好地避免這一現象的發生,只要采用其導數值為1的神經元進行學習,就能有效地規避梯度消失的問題,因此選用ReLU函數作為該研究模型的激活函數。
(3)訓練算法的選取
在神經網絡訓練的過程中,選用Levenberg-Marquardt、貝葉斯正則化和量化共軛梯度3種算法進行訓練。對于大多數問題,推薦使用Levenberg-Marquardt,對于一些含噪聲小的問題,貝葉斯正則化雖然需要更長的時間,但能獲得更好的解。對于數據量比較大的問題,選取量化共軛梯度。因為它使用的梯度計算比其他2種算法使用的Jacobian矩陣計算更節省內存。由于該項目所使用的數據樣本較少,不易出現過擬合的現象,同時也不會花費過多的訓練時間。因此,為了追求更高的擬合度,該研究使用的是貝葉斯正則化的訓練方式。
2.3.1誤差自相關檢驗
誤差自相關是對誤差(觀測值與預測值的差值)進行自相關計算,通過觀察誤差自相關曲線可以判斷預測模型是否能夠準確預測結果的趨勢性、季節性、隨機性。誤差自相關是一個檢測性的指標,需要在預測模型構建并計算出預測值后計算來對其進行評估。對于完美模型,自相關函數只有一個非零值,并在零滯后時出現。如果預測誤差中存在顯著相關關系,則需對預測結果進行改進,誤差自相關系數的計算公式如下:

(3)
圖3是該項研究模型成果所表現出來的誤差自相關系數:

圖3 誤差自相關
由圖3所示的誤差自相關系數可以看出,除了零滯后時的1以外,其余區間的模型置信度均在置信區間內,因此模型看上去是足夠的。
2.3.2輸入-誤差互相關函數
輸入-誤差互相關函數說明誤差如何與輸入序列 相關。對于完美的預測模型,所有相關性都應為零。如果輸入與誤差相關,則應該可以改進預測,這可以通過增加抽頭延遲線中的延遲數量來實現。在這種情況下,所有相關性都在零附近的置信邊界范圍內。圖4是該項研究模型成果所表現出來的輸入-誤差互相關函數。

圖4 輸入-誤差互相關函數
由圖4可以看出,該項研究的模型結果中的輸入-誤差互相關函數的相關性,均在極大程度上收斂于零附近的置信邊界范圍內,因此可以證明該項研究的預測模型具有良好的預測效果。
2.3.3綜合檢驗指標分析
圖5所示為模型在迭代過程中,預測結果與真實結果間均化誤差的變化。

圖5 模型均化誤差
均化誤差是指擬合結果的總誤差值與擬合樣本數的比值,代表的是預測結果的整體誤差偏移;平穩R方指的是模型能解釋因變量變化的百分比例,它表示的是預測模型與原數據樣本的擬合程度[12]。由圖中數據可知,所得到的預測函數,其均化誤差達到了2.204 6的程度,等同于模型的誤差在10%以內,同時不論是訓練集還是測試集函數的平穩R方均在0.9以上,神經網絡模型集和采用數據集的回歸結果都在擬合曲線上,這表明該模型具有很好的擬合性。
圖6 所示為實際粉塵濃度以及TN預測模型對粉塵濃度的預測結果。

圖6 擬合圖像
利用模型對9:31至10:17期間的粉塵濃度進行擬合后,對10:18至10:21這3個時間點的粉塵濃度進行預測,預測結果如表2所示。

表2 模型預測結果
由表2可知,建立的時間序列神經網絡模型對10:18至10:21的粉塵濃度預測結果呈下降趨勢,這與所測得的實際值相符。同時,在之后的預測結果中,預測結果的誤差值波動較小,因此該模型對粉塵濃度的長期預測具有一定可行性。
由于該模型是基于時間序列模型和神經網絡模型所衍生出來的復合模型,因此在得出模型結果時,需對傳統的模型預測結果進行比對分析,以確定復合模型是否具有良好的擬合性能和泛化性能[13]。圖7所示為3種不同模型與原數據的擬合圖像對比圖。

圖7 擬合圖像對比圖
其中,3個模型擬合綜合結果的評價如表3所示。

表3 3個模型擬合結果的比對
由表3中的對比結果可以看出,外因輸入非線性自回歸模型(NARX模型)無論是在誤差率還是預測函數的擬合效果上都要優于傳統的2個模型。因此,相較于傳統的2個模型,NARX模型能夠更好地擬合樣本數據的變化。
(1)由于影響礦井中粉塵濃度的因素較多,且實際情況更為復雜,因此僅時間變量作為單變量來對粉塵濃度進行預測,雖然預測結果的置信度符合要求,但預測結果僅具有參考性。
(2)在使用普通的BP神經網絡對粉塵濃度進行預測時,由于其前饋的參量只有誤差,很難反映輸出結果對輸入數據本身的影響。因此采用外因(外部)輸入非線性自回歸模型來對粉塵濃度進行預測,其預測誤差率降至3.8%。
(3)外因輸入非線性自回歸模型(NARX模型)在對礦井內粉塵濃度的預測上,同時繼承了時間序列模型對原數據的良好擬合度,以及神經網絡模型較好的預測能力,并在原有基礎上降低了一定預測時間內的整體誤差,具有優越的擬合預測效果與泛化性能。