陳 立,陳賢富
(中國科學技術大學 微電子學院,安徽 合肥230027)
近年來,各國經常發生化工廠爆炸事故、危險品倉庫發生火災爆炸等引發的有毒氣體泄露[1],嚴重影響人們的生命財產安全。 2018 年12 月18 日,江蘇南通一化工廠設備爆裂,設備內的氮氣以及氟化氫泄漏,造成作業人員中毒死亡。 2019 年中國江蘇鹽城、美國休斯敦的化工廠爆炸均造成了大面積的有毒氣體的泄露。 2020 年11 月9 日1,浙江衢州中天東方氟硅材料有限公司發生火災事故,該起火災燃燒物質主要是氯硅烷,屬于高沸物,燃燒產物有毒。目前被廣泛使用的大氣擴散模型主要分為兩大類,一類是基于數理計算的,一類是基于機器學習的。 數理計算的典型代表有高斯擴散模型[2]、計算流體力學(CFD)模型等。 Mazzoldi[3]用高斯擴散模型模擬二氧化碳運輸和儲存設施泄漏的情況。高斯擴散模型使用簡單的數學表達式,易于計算,耗時少,但只適用于平坦地形上暢通無阻的氣體流動,在復雜環境下的預測往往不準確。 PONTIGGIA M[4]用CFD 模型模擬城市地區大氣中液化石油氣(LPG)擴散進行后果評估。 CFD 基于有限元計算,能較為精準地預測濃度擴散,但計算耗時長。 2019 年中國科學技術大學的程云芳[5]用機器學習算法粒子群-支持向量機模型,對苯儲罐泄漏的濃度進行了危險位置的短距離預測。這些方法仍基于傳統的機器學習方法。
因此,本文提出了一種利用深度學習[6]技術進行有毒氣體擴散預測的方法。 首先根據有毒氣體擴散原理,對經典的公開數據集草原牧場數據集的樣本數據進行特征選取,將選擇的特征參數輸入到基于GRU 的3 層神經網絡模型,最后得到預測點濃度值。 實驗結果表明該模型的平均絕對誤差(MAE)、均方誤差(RMSE)和相關系數(r)均優于BP 神經網絡模型。
GRU 神經網絡由CHUNG J[7]等于2014 年提出,是一種改進型循環神經網絡(RNN)。 與人工神經網絡(ANN)的全連接不同,RNN[8-9]的隱藏層之間相互連接。 ANN[10]的輸出是相互獨立的,而RNN 的輸出不僅受當前輸入特征的影響,而且受前一時刻的輸出影響,所以RNN 具有更好的時間序列性能。 但是,RNN 卻很難得到很好的訓練。 主要原因是RNN會產生梯度消失和梯度爆炸。 因此更多的是使用它的變體形式,GRU 就是其中一種變體。 GRU 和RNN具有相似的結構,區別在于隱藏層的存儲單元結構。GRU 的結構圖如圖1 所示。

圖1 GRU 神經網絡結構圖
GRU[11]有兩個門,即一個重置門和一個更新門。重置門決定了新的輸入信息與前面的記憶信息如何結合,更新門決定了之前記憶保存到當前時間步的信息。 GRU 信息處理過程公式如下所示:

其中,rt、zt分別為重置門和輸出門,Wr、Wz、tanh 分別為對應的權值和激勵函數。 當前輸入值、輸出值分別為xt、ht。
草原牧場數據集[12]是在1956 年7 月至8 月進行的經典的野外實驗數據集。 實驗地點位于內布拉斯加州奧尼爾東北約5 英里處。 釋放發生在距離地面高度為0.46 m 的點源,SO2作為示蹤劑, 每10 min抽樣測量一次濃度值。 水平方向以180°弧度為中心,利用高度為1.5 m 的采樣器,在順風處的5 個弧度處采樣(50 m,100 m,200 m,400 m,800 m)。 該實驗收集了下風向距離、風速、風向等多個特征數據。對數據集進行整理分析得到68 個不同版本數據,每個版本均有多個觀測值,合計8 173 條有效樣本。 部分特征參數如表1 所示。
分析特征數據,有的特征數值非常大,有的特征數值非常小,為避免數值較高的特征在模型中所占作用較強,相對數值較低的特征被削弱作用,需要對數據進行歸一化操作,本文使用最常用的MinMax 歸一化[13],它將所有特征都線性映射到0~1 之間,計算公式如下:


表1 部分特征參數
式中表示標準化后的特征矩陣,其中xi表示第i列的特征矩陣,max(xi)、min(xi)分別表示當前特征矩陣的最大值、最小值。
在訓練模型之前需要將標準化后的數據集劃分為訓練集和測試集,由于GRU 是時間相關的,因此將草原牧場數據集數據按時間先后排序。 選擇前58 個版本的7 480 條樣本數據作為訓練集,后10 個版本693 條數據作為測試集。 首先將風速、風向等19 個參數作為特征值輸入,經過具有GRU 結構的3 層神經網絡模型訓練,最終以濃度值作為輸出。再將測試集的特征參數作為輸入,經過訓練好的模型,得到測試集的預測濃度值。
硬件平臺為Intel Core i5-8250U CPU 和8 GB RAM 的Windows 64 操作系統,使用Python 編寫程序。
本文選取平均絕對誤差(MAE)、均方根誤差(RMSE)[14]和相關系數(r)[15]來評估模型的性能。 平均絕對誤差可以避免誤差相互抵消的問題,因而可以準確反映實際預測誤差的大小。均方根誤差表示預測值與與其真實值之間的偏差, 因此MAE 和RMSE 越小越好。 相關系數描述了預測值與真實值之間的相關程度,所以r越接近于1,表示模型效果越好。

基于GRU 的神經網絡模型的預測結果如圖2所示,從圖中可以看出,本文方法預測結果未出現負數濃度值,且對于峰值點濃度值的預測較好,可以有效地預測有毒氣體擴散濃度。

圖2 GRU 神經網絡預測結果
為了證明基于GRU 的神經網絡模型方法的性能,將該方法與基于BP 神經網絡模型的方法進行對比。 BP 模型的預測結果如圖3 所示,從圖中看出BP 模型的預測結果在低濃度值時出現了負數濃度值,并且在濃度值較高的點誤差較大。
表2 記錄了通過多次實驗兩種不同模型預測結果的平均值,從表中可以看出,基于GRU 神經網絡模型的MAE、RMSE 均低于BP 神經網絡模型,r值更接近于1,評價指標值均優于BP 模型。

圖3 BP 神經網絡預測結果

表2 不同模型預測結果的對比
對于毒害氣體擴散濃度預測問題, 本文提出了基于GRU 模型的有毒氣體擴散模型,實現快速、高效的有毒氣體濃度預測。 此模型在草原牧場數據集上進行了驗證。 結果表明,本文方法對毒氣擴散有更高的預測精度。 在未來工作中,期待將模型擴展到實際應用中。