田 斌,葛友鋮,梁 冰,文仕強
(武漢工程大學 電氣信息學院,武漢430205)
在過去探測鐵磁性目標研究中,地磁探測[1]占據主角地位,然而隨著各國軍事力量的壯大,出現了一批低噪聲、低熱輻射的鐵磁性目標,這些“新型”目標對地磁探測、聲學探測[2]和光學探測[3]等傳統探測手段提出了新挑戰。工頻探測相較于傳統探測手段,具有實時探測、大范圍遙感探測、動靜目標探測等優良特性。世界各國高壓輸/變/用電網絡可以產生一個強度穩定、分布廣泛、可探測的工頻磁場[4],當工頻磁場和鐵磁性目標相互作用時,鐵磁性目標的存在會改變整個空間的磁場分布,造成磁場局部異常,從而產生一種工頻磁擾動時序信號。
關于時序信號的處理問題,通常有3 類模型(統計模型、機器學習模型和深度學習模型)幫助解決。統計模型主要包括自回歸滑動平均(ARMA)模型和卡爾曼濾波(KF)模型。例如文獻[5]通過建立ARMA 模型對某地區用電量異常數據進行識別與預測,預測結果的誤報率保持在6%以下。然而,統計模型預測的準確率一般;機器學習模型主要有支持向量機模型(SVM),BP 神經網絡模型和隨機森林(RF)等。例如文獻[6]提出一種基于混沌類電磁學(CEM)優化支持向量機(SVM)的短期負荷預測方法,預測模型的最大誤差在3.02%以內。但機器學習模型也存在特征提取能力較弱,泛化能力一般等缺點。
針對以上統計模型及機器學習模型的缺點,本文將引入深度學習模型,并提出了一種CNN-LSTM混合模型,該模型同時具備CNN 網絡的特征提取能力和LSTM 網絡的時序信息表達和預測能力。
卷積神經網絡(CNN)是一種包含卷積計算和深層次結構的深度前饋神經網絡[7],它被廣泛運用在圖像分類、目標識別、自然語言處理等領域。
一個典型的CNN 網絡包含5 個部分: 輸入層、卷積層、激活函數層、池化層和全連接層。其中卷積層作用是提取輸入的特征信息;激活函數層是使樣本輸出的特征具有非線性特性;池化層作用是進一步對卷積操作得到的特征映射結果進行處理;全連接層是把前面幾層所提取到的特征進行非線性組合。卷積運算的過程表示為

式中:S 為輸出的特征序列;I 為輸入數據;K 為卷積核。
傳統的RNN 網絡在處理輸入序列的長期依賴時[8],會產生梯度下降或梯度消失的問題,為了解決該問題,文獻[9]在1997年提出了LSTM 網絡。LSTM本身就是RNN 中一種特殊的循環體結構,其單個神經元結構如圖1 所示。

圖1 LSTM 單個神經元結構Fig.1 LSTM single neuron structure
LSTM 由3 個門控單元(輸入門、遺忘門和輸出門)、1 個細胞態、1 個候選態和記憶體組成。其中門控單元是使用Sigmoid 激活函數對輸入的信息進行控制的結構,輸入門是用來確定向記憶體狀態中添加的新信息,輸出門表示輸出當前細胞狀態的信息,遺忘門則將細胞狀態中的沒用的信息選擇性遺忘,細胞態表示長期記憶,記憶體表示短期記憶。每個部分的計算過程如式(2)~式(7)所示:

式中:xt表示當前時刻的輸入特征;W 和b 分別表示各單元結構的待訓練參數矩陣和偏置項;σ 表示Sigmoid 函數。
在實際情況中,目標產生的微弱工頻磁擾動信號,會受到惡劣天氣、居民用電設備以及復雜觀測環境等因素的影響,呈現出低信噪比、微弱難提取等特點。單一模型很難保證模型的訓練效果,預測結果的準確率會大大降低,而混合模型能有效改進單一模型的缺點,它能充分提高磁擾動信號預測的準確性,增強工頻磁場對鐵磁性目標的探測能力。
模型總體設計的思路為:首先,利用低噪聲、高靈敏度感應式磁力儀[10]采集外場試驗數據(0~250 Hz),通過快速傅里葉變換(FFT)提取原始數據中50 Hz 的時間序列數據{fn},進而對{fn}進行分析和預處理;其次,將處理后的數據送入模型中的卷積層和全連接層,完成特征工程(特征提取和特征融合);最后,數據通過LSTM 層后輸出,實現時序信息的表達與預測。
目標在工頻磁場下產生的擾動信號是連續時序信號f(t),將傳感器采樣率設置為500 后進行采樣,得到離散時間信號f(n·Δt)=fn,(n=0,1,2,…,N-1),其中N 是信號長度,再通過FFT 轉換成{fn},提取一組正常狀態下(無目標)與擾動狀態下(有目標)的信號數據,用Matlab 分別繪制出50 Hz 數據,如圖2 和圖3 所示。

圖2 正常狀態下50 Hz 數據Fig.2 Under normal condition 50 Hz data

圖3 擾動狀態下50 Hz 數據Fig.3 Under disturbance 50 Hz data
圖中橫坐標代表測量時間,單位s,縱坐標代表磁感應強度,單位nT。從圖2 可以看出,無目標時,工頻背景場可以近似看作一個較為穩定的正弦波,磁場強度在0.2~0.6 nT 之間波動; 從圖3 可以看出,目標物(車輛)出現時,傳感器測到了明顯的工頻磁擾動信號,且不同目標物引起的磁擾動信號強度有所不同。目標1 為電瓶車,體積小、含鐵量少(磁導率較低)、速度慢,引起的磁擾動信號強度約為0.88 nT;目標2 為小轎車,體積大、含鐵量多(磁導率較高),速度快,引起的磁擾動信號強度約1.28 nT,但目標物1 和目標2 引起的磁場強度均高于背景場平均值0.4 nT,可以初步推斷鐵磁性目標與工頻磁場相互作用產生的電磁擾動信號與目標物本身的磁導率以及運動狀態有關。
數據處理分為2 個部分:缺失值填補和數據集歸一化。
1)傳感器、數采卡等探測設備故障時可能導致數據缺失,針對缺失數據,本文將采用線性插值法填補缺失值,即用t-1 與t+1 時刻的數據填補t 時刻的缺失值,具體計算公式為

2)為了加快訓練時梯度下降的速度,避免由目標物產生過大的擾動信號對預測結果產生影響,數據集在送入到神經網絡訓練前要進行歸一化處理。其計算公式為

式中:x 為轉換前的值;xnorm為歸一化的值;xmax為樣本的最大值;xmin為樣本的最小值。
通過數據分析和預處理后,將高質量的數據集按時間順序劃分為2 個子集(訓練集和測試集)送入到混合模型。模型各層參數具體設置如下:卷積核個數為64,大小為1×1;激活層使用Relu 激活函數,目的是產生更多的稀疏性,避免梯度消失;LSTM 層設置為2 層,其神經元個數分別是80 和100,并增加2 層Dropout 層(rate=0.2)避免過擬合;優化器Optimizer 采用Adam 算法。CNN-LSTM 混合模型參數如表1 所示,神經網絡訓練流程如圖4所示。

圖4 CNN-LSTM 訓練流程Fig.4 CNN-LSTM training flow chart

表1 模型各層參數Tab.1 Parameters for each layer of model
本文使用的測量系統由1 臺單軸感應式磁力儀、1 塊電池組和1 個數據采集器組成,其中磁力儀量程為±200 nT,工作電壓為±5 V,即靈敏度為40 nT/V。實驗數據來源:本課題組于2020年9月11日前往湖北省紅安縣金沙河地區,進行了工頻探測目標(車輛)外場試驗,共采集到21744 組磁信號數據。把這些數據集劃分為80%的訓練集和20%的測試集,訓練集用于找出最佳的權重和偏置,測試集用來評估模型性能的好壞和預測效果。
將訓練樣本送入到CNN-LSTM 網絡中訓練,得到損失函數,如圖5 所示。可以看出,訓練集和驗證集損失曲線隨著迭代次數的增加而降低,當達到一定次數后會趨于一個平穩值。

圖5 CNN-LSTM 模型的損失函數Fig.5 Loss function diagram of CNN-LSTM model
訓練完畢后,為了驗證本文CNN-LSTM 混合模型的優越性,同時還采用了單一的LSTM 模型進行預測,CNN-LSTM 混合模型和單一LSTM 模型實驗結果分別如圖6 和圖7 所示。

圖6 CNN-LSTM 模型預測結果Fig.6 CNN-LSTM model prediction results

圖7 LSTM 模型預測結果Fig.7 CNN-LSTM model prediction results
兩個模型的預測評估指標對比如表2 所示。

表2 模型預測評估指標對比Tab.2 Model prediction evaluation index comparison
根據兩個模型的預測結果和評估指標對比可以看出,CNN-LSTM 模型預測的整體趨勢和真實趨勢更吻合,特別是在峰值處的預測值和真實值十分貼近,更容易判定目標物的存在。此外,相對于單一的LSTM模型,本文提出的CNN-LSTM 混合模型使得磁信號數據在時間維度上的特征更容易提取,更有利于解決鐵磁性目標存在的多特征維度和時序特征問題。
為了充分發揮工頻磁場在目標探測領域的推廣應用,完善鐵磁性目標探測機制,提高磁擾動信號預測準確性,本文引入了深度學習模型,深度學習模型的優點在于能夠隨著訓練樣本量的增加以及數據特征的多元化變化,可以有效提升模型對數據分布規律的總結與表達。
同時本文提出了一種CNN-LSTM 混合模型,通過CNN 提取到磁信號特征信息,減少了原始特征的損失,再利用LSTM 進行擬合和預測,可以更清楚表達信號中的關鍵信息。下一階段目標是使用三軸磁力儀采集更多特征的信號,豐富磁信號數據集,進一步提升混合模型的預測性能。