













摘" 要:由各種傳感器檢測爆炸物的技術已經在多種條件下被用于檢測不同類型的爆炸物,但同類型的爆炸物識別分類技術幾乎沒有,且針對傳統BP神經網絡模型收斂速度慢、易陷入局部最優值等問題,該文采用PWCLM混沌映射和高斯突變算子來改進麻雀搜尋算法(SSA),優化模型的初始權值,并對6種易燃易爆氣體進行識別分類。最后再將該模型與BP、SSA-BP和WOA-BP等模型進行對比,使用3種評價指標對3種模型進行評價。結果表明,ISSA-BP模型穩定性高,識別精度優于其他幾種模型,最終ISSA-BP模型的分類準確率、召回率和F1指數分別為99.01%、99.12%和99.12%。
關鍵詞:麻雀搜尋算法;PWCLM混沌映射;高斯變異算子;BP神經網絡;易燃易爆氣體
中圖分類號:TP18" " " " 文獻標志碼:A" " " " " 文章編號:2095-2945(2024)04-0028-06
Abstract: The technology of detecting explosives by various sensors has been used to detect different types of explosives under various conditions, but the same type of explosives identification and classification technology is almost not available, and the traditional BP neural network model convergence speed is slow, easy to fall into the local optimal value and other problems. In this paper, PWCLM chaotic mapping and Gaussian mutation operator are used to improve the Sparrow search algorithm (SSA), optimize the initial weight of the model, and identify and classify six kinds of flammable and explosive gases. Finally, this model is compared with BP, SSA-BP, WOA-BP and other models, and three evaluation indexes are used to evaluate the three models. The results show that ISA-BP model has high stability and better recognition accuracy than other models. The classification accuracy of ISA-BP model, recall rate and F1 index were 99.01%, 99.12% and 99.12% respectively.
Keywords: Sparrow Search Algorithm(SSA); PWCLM chaotic mapping; gaussian mutation operator; BP neural network; flammable and explosive gas
21世紀初后,隨著社會的進步與全面發展,許多新能源氣體,例如氫氣、甲烷已經廣泛應用于汽車、電池等多個領域,這些氣體與空氣中的氧氣混合后,會變成易燃易爆氣體,在遇到明火或火花后極易產生起火和爆炸等安全事故。所以人們對易燃易爆氣體的檢測需求也是日益增多。據統計我國2022年發生了306起火災爆炸性事故,造成了93人死亡,其中多數是由于易燃易爆氣體引發閃爆或是高溫間接引起爆炸性混合氣體爆炸,所以易燃易爆氣體的檢測成為公共安全領域很重要的一環。
爆炸性氣體廣泛的化學和物理性質促使許多類型的采樣技術得到發展,用于檢測衡量爆炸性氣體,例如使用傳感器和光譜方法等[1-2]。近年來,曾子威等[3]提取不同濕度下爆炸性氣體的太赫茲吸收光譜數據,以ResNet-50網絡模型為基本網絡結構對爆炸物進行分類識別。龔克[4]在標記中子檢測爆炸物研究中利用小波閾值去噪與BP神經網絡相結合的辦法可以區分爆炸物與非爆炸物。Lin等[5]利用超聲輻射法對單一氣體進行分析,并利用灰狼優化雙隱層BP神經網絡即GWO-DHBP模型對氣體進行識別分類和濃度測量。張旭等[6]用粒子群優化算法去改進傳統的遺傳算法,來優化BP神經網絡的初始權值和閾值,得到了不錯的PM2.5濃度檢測效果。
本文采用ISSA-BP神經網絡模型對爆炸物氣體進行分類識別。該模型對BP神經網絡模型的初始閾值和權值進行了優化,增強了全局搜索能力,加快了收斂速度,提高了模型的泛化性能。再將該模型與BP、SSA-BP和WOA-BP等模型進行了對比,以驗證ISSA-BP擁有更好的準確性。
1" 理論和算法
1.1" 主成分分析(PCA)算法
主成分分析(PCA)是一種特征提取和數據降維技術[7-10]。由于其無監督的性質對數據探索非常有用,所以大多用于處理和解釋物理和生物科學等領域的高維數據。PCA主要思想是通過線性變換,將原始數據映射到一個全新的低維特征空間上。在這個低維空間中,新的特征是正交的,也被稱為主成分。換句話說,PCA通過尋找數據中的最大方差方向,將其作為新特征的第一主成分,然后尋找與第一主成分正交的最大方差方向作為第二主成分,以此類推。這樣做的目的是降低數據的維度,同時保留盡可能多的信息,需要強調的是,不是簡單地從n維特征中去除其余n-k維特征,而是重新構造出全新的k維正交特征,且新生成的k維數據盡可能減少信息損失。
若數據集X={x1,x2,…xn},則PCA算法具體步驟如下:
1)去平均值意味著對數據進行中心化處理,即每個特征減去該特征在樣本中的平均值,以便使數據集以原點為中心分布。
3)用特征值分解方法求協方差矩陣的特征值與特征向量,以便找到數據的主要方向和對應的重要特征。
4)對特征值從大到小排序,選擇其中最大的K個。然后將其對應的K個特征向量分別作為行向量組成特征向量矩陣P。
5)將數據轉換到K個特征向量構建的新空間中實現降維,以便在更低維度下表示數據并保留盡可能多的信息。即Y=PX。
1.2" BP神經網絡
BP神經網絡具有良好的自學習能力、魯棒性、泛化能力。BP神經網絡被D.E.Rumelhart等提出以后,已被廣泛應用于求解非線性問題。BP神經網絡由輸入層、隱藏層、輸出層組成[11-12],其學習過程由正向傳播和反向傳播構成。在正向傳播過程中,輸入層的神經元接受輸入信息,經過處理后傳遞給隱藏層的神經元;隱藏層的神經元對信息進一步處理后傳遞給輸出層的神經元,正向傳播結束。如果預測結果與實際不匹配,則會進入反向傳播階段,不斷修正網絡的權值和閾值使誤差函數沿著負梯度方向下降,直到輸出達到預期目標。
本文應用BP神經網絡的數學模型如下
式中:x為輸入層的輸入;h為隱藏層的輸出;y為輸出層的輸出;w1、w2分別為輸入層對隱藏層和隱藏層對輸出層的權值;b1和b2分別為隱藏層和輸出層的偏置;g(x)為隱藏層的激活函數;f(x)為輸出層的激活函數。
BP神經網絡易燃易爆氣體識別模型的網絡結構如圖1所示。
1.3" 麻雀搜尋算法
SSA是近年來根據麻雀覓食并逃避捕食者的行為而提出的群智能優化算法。該算法新穎、收斂速度快[13-14]。在覓食過程中,一部分麻雀會作為發現者,為整個群落提供覓食區域和方向;一部分麻雀作為參與者,跟隨發現者尋找食物;最后一部分麻雀作為偵查者,當意識到危險時,發現者和參與者都會放棄它們目前的獵物,飛到安全區域。
在麻雀搜尋算法中,適應度值較好的發現者可以在搜尋過程中率先獲得食物,并提供方向。因此,和其他2種麻雀相比,發現者能獲得更大的食物搜索范圍。發現者位置的更新公式為
式中:t為當前迭代數;X為t+1次迭代時第i只麻雀在第j維中的位置;L為一個由1組成的1×d矩陣;T為迭代次數;Tmax為迭代的最大次數;Q為服從正態分布的隨機數;α為(0,1]范圍內的隨機數;R2和ST分別為預警值和安全值。當R2lt;ST時,表示偵查者已經發現了捕獵者的存在,向整個種群發出警告,其他麻雀會立刻停止捕食并飛到其他安全區域重新覓食。當R2≥ST時,說明覓食區域暫時沒有發現捕獵者,因此發現者可以擴大覓食搜索范圍并向種群反饋這一信息。
參與者的位置更新公式為
在麻雀覓食的過程中,群體中的一部分成員負責保持警戒。當危險接近時,它們會放棄當前的食物,并迅速移動到新的位置。偵查者的位置更新公式為
式中:K為一個在范圍[-1,1]內的隨機數;β為用來控制步長的參數;Xbest為當前的全局最佳位置;為了避免分母為0的情況出現,引入常數ε為最小值;在覓食過程中,麻雀需要考慮到當前的全局最差適應度(fw)和全局最優適應度(fg),以及個體自身的適應度(fi)。當fi=fg時,說明處于麻雀偵查到了當前位置的危險情況,為了降低被捕食的風險,它們會向其他麻雀靠近;當figt;fg時,表示麻雀正處于種群的邊緣位置,此時極易受到捕食者的攻擊。
1.4" 改進麻雀搜尋算法
改進麻雀搜尋算法,首先利用PWLCM混沌映射來初始化種群,可以增強算法的全局搜索能力;然后在發現者位置更新時,利用高斯突變算子對位置進行擾動,使得更新后的位置有一定的隨機偏移,避免陷入局部最優解;最后用貪婪策略比較新舊解的適應度值來確定是否更新位置。
1)混沌映射。混沌映射[15]是生產混沌序列的一種方法,常見的混沌映射方式有Logistic映射[16]、Tent映射[17]、Chebyshev混沌映射[18],而PWLCM映射作為混沌映射的典型代表,數學形式簡單,具有遍歷性和隨機性,PWLCM映射使用多項式系數將數據映射到目標范圍內,并且可以精確控制曲線的彎曲度。故本文采用該映射進行種群初始化,其公式為
式中:p為控制參數,p∈[0,1];x(t)為產生的隨機迭代值,x(t)∈[0,1]。
2)高斯突變算子與貪心算法。高斯突變算子[19]是優化算法中的一種變異算子,本質是通過對解向量的某些維度進行隨機的正態分布擾動,生成新的解向量,以增加搜索范圍并提高算法的全局收斂能力。
雖然上述擾動策略可以增強算法的全局搜索能力,但不能確定擾動突變之后產生的新解比之前更好。因此,在進行擾動突變之后,使用貪心算法,通過比較新解和舊解的適應度值來確定是否更新解向量。貪心算法公式如下
式中:Xbest為當前最好的解向量;X為下一時刻的解向量;fXbest和fX
分別為2個時刻的適應度值。
1.5" ISSA-BP算法步驟
本文通過一個流程圖(圖2)展示了采用改進的麻雀搜尋算法優化BP神經網絡模型的建模過程,具體步驟如下:
1)通過初始化BP神經網絡的拓撲結構,確定輸入層、隱藏層、輸出層的節點數。
2)利用PWCLM混沌映射初始化整個種群,將神經網絡模型中的權值和閾值表示為ISSA算法中的d維空間向量。
3)對麻雀搜尋算法參數進行初始化,確保算法能夠正確執行優化過程。
4)計算每個個體適應度值并根據該值大小進行排序。
5)根據公式更新發現者、參與者、偵查者的位置,在發現者位置更新時加入高斯突變算子對位置進行擾動。
6)用貪婪策略比較新舊解的適應度值來確定是否更新位置。
7)將得到的群體最優個體賦值給BP神經網絡的權值以訓練得到最高的準確率。
2" 數據分析
2.1" 實驗數據
本文選取的數據集是加州大學機器學習數據庫中的16個化學傳感器記錄的6種不同純氣態物質的數據,測量系統平臺提供了多功能性,能夠以高精度和高度可重復的方式獲得感興趣的化學物質的所需濃度,從而最大限度地減少人為干預引起的常見錯誤。選取300組數據進行PCA降維處理,將240組數據用作模型的訓練樣本集,其余數據用作模型的測試樣本集。
2.2" 模型相關參數
分別比較了BP、WOA-BP、PCA-WOA-BP、SSA-BP和ISSA-BP神經網絡模型在易燃易爆氣體分類預測問題上的性能,預測輸入數據為8維,輸出數據為6維。每個網絡模型迭代進行1 000次,學習率為0.1,分別使用tanh(x)和sig(x)作為隱藏層和輸出層的激活函數。
對于隱藏層節點數的確定,可以使用經驗公式來得到一個大致的范圍,然后通過試湊法在這個范圍內選取隱藏層節點數使得均方根誤差最小化。經驗公式為
式中:m為隱藏層神經元的個數;n為輸入層神經元的個數;l為輸出層神經元的個數;z為一個固定的常數,z∈(0,10)。
試湊法最終確定的隱藏層節點數為13。
2.3" 性能評價指標
為了評價模型的準確性,本文選取了分類準確率、召回率、F1指數作為評價指標對不同模型的預測效果進行評價。分類準確率是對于給定的數據,分類正確的樣本占總樣本數量的比值。召回率衡量了模型在識別出所有正樣本方面的表現,即模型將預測正樣本占所有正樣本的比例。F1指數是精確率和召回率的加權平均,用于評估分類器的綜合性能。
2.4" 結果分析
BP模型和ISSA-BP模型的混淆矩陣和氣體分類圖如圖3、圖4和圖5所示,可以看出ISSA-BP模型相比于最初的BP模型對6類氣體的整體分類準確率提升了許多,基本符合準確分類的基本要求。
5個模型的分類準確率、召回率、F1指數見表1,結果表明經過優化后的ISSA-BP模型的分類效果最好。從表1可以看出,只用BP神經網絡進行分類時,分類準確率較低,再加入優化算法后分類準確率有明顯提升;在WOA-BP和PCA-WOA-BP 兩個模型中,說明了PCA處理數據后分類準確率還能有明顯提升;而在ISSA-BP模型中,對麻雀搜尋算法進行了進一步的優化,且對數據進行了PCA處理,結果顯示該模型最后的分類準確率、召回率和F1指數分別為99.01%、99.12%和99.12%,表明該模型的分類精度是最好的。
3" 結論
本文采用了ISSA-BP模型對幾種不同的易燃易爆氣體進行分類預測。由于麻雀搜尋算法全局搜索能力較弱、收斂速度慢且易陷入局部最優解,故用PWLCM混沌映射初始化種群,然后在發現者位置更新時利用高斯突變算子進行位置擾動,產生新解,避免出現局部最優解;最后用貪婪策略比較新舊解的適應度值來確定是否更新位置,再利用優化后的SSA對BP神經網絡的權值和閾值進行優化,以此來提高算法的分類檢測性能。相較于BP、SSA-BP、WOA-BP等模型,ISSA-BP模型分類準確率更高,并提高了模型的泛化性能,能夠高效、穩定地對爆炸性氣體進行分類預測。
參考文獻:
[1] United States bomb data center (usbdc) Explosives Incident report (eir)[Z].2021.
[2] KA C T, SULTAN B J, IVAN P P. Recent developments in the fifield ofexplosive trace detection[J].ACS Nano, 2020,14:10804e10833.
[3] 曾子威,金尚忠,李宏光,等.高濕度環境下爆炸物太赫茲光譜的特征提取與精準識別[J].光學精密工程,2023,31(7):1065-1073.
[4] 龔克.小波閾值去噪與BP神經網絡在標記中子檢測爆炸物中的應用研究[D].長春:東北師范大學,2022.
[5] LIN S, ZHOU Y C, HU J H, et al. Exploration for a BP-ANN model for gas identification and concentration measurement with an ultrasonically radiated catalytic combustion gas sensor[J]. Sensors and Actuators:B. Chemical, 2022,362:131733.