王龍剛 鐘威 阮恒心 賀凱 李廉林
(北京大學信息科學技術學院,北京 100871)
大尺度電磁散射與逆散射問題是遙感、隱身和醫療等領域的關鍵性、基礎性和共性問題.例如,電磁散射在大量軍民用平臺得到廣泛應用,在這些領域,當探測目標區域較大時,傳統高精度計算電磁方法(例如,矩量法、有限元方法、時域有限差分法等)需要消耗大量計算資源,耗時極長.盡管各種近似數值方法(例如,高頻近似方法,Born近似方法等) 一定程度上提高了計算速度,但這些方法往往忽略了目標之間的電磁互耦作用,導致低的計算精度.另一方面,對于電磁逆散射問題,如雷達成像等, 在過去的幾十年當中,許多重構算法得以應用,例如后向投影算法、牛頓迭代算法、基因算法等. 這些算法通常受限于逐點掃描成像或迭代成像等過程,在應用到大尺度成像場景時,往往計算量巨大,無法滿足實時性需求.因而如何提高成像速度,降低計算量已成為眾多學者研究的熱點[1-2].
近年來,深度學習已成為人工智能領域的重要研究方向,被廣泛應用于模式識別、分類、回歸等問題,并取得了巨大成功[3].目前深度學習中所采用的網絡多工作于實數域,而電磁散射與逆散射問題則均為復數域問題,且目前深度學習網絡尚無準確的物理支撐,造成現有的深度學習框架很難直接應用于電磁散射與逆散射問題.針對上述問題,本文提出了兩種基于物理機制的深度學習模型,分別應用于大尺度電磁散射問題和電磁逆散射問題.本文通過對小尺度電磁場景樣本數據的訓練,實現高精度預測電磁散射與逆散射問題中大尺度目標的散射場與成像結果.從算例結果可知,本文提出的方法為實現大尺度電磁散射仿真與電磁成像奠定了基礎.
本論文模型只考慮二維標量電磁問題.如圖1所示,入射平面波Ein沿x軸照射目標區域Dinv,距離原點為R均勻分布在Γ上的M個接收機用于接收散射場數據.第m個接收機接收到的散射場可以表示為[4]:
(1)
(2)


圖1 二維電磁散射模型Fig.1 The 2-D electromagnetic scattering scenario
盡管傳統電磁數值計算方法能夠獲得高精度電磁散射數據,但隨著計算區域的擴大,計算復雜度成指數級增長,難以有效實時處理大尺度問題.深度學習是目前興起的一種重要的數據處理框架,其具有結構簡單、性能優越、處理速度極快等優點.目前深度學習方法均應用于實數域問題,難以直接用于大尺度電磁散射數據獲取.基于上述問題,本文對傳統卷積神經網絡(convolutional neural network, CNN)進行修正,結合式(1)提出了一種基于物理機制的復數域卷積神經網絡深度學習模型.如圖2所示,復數域卷積神經網絡前向傳播的第0層表示為E(0)=Ein,第1層輸出表示為
E(1)=Ein+A(1)χ(E(0)).
(3)
同理,第n層輸出表示為
E(n)=Ein+A(n)χ(E(n-1)).
(4)
第N層輸出為預測散射場,且表示為
E(N)=A(N)χ(E(N-1)).
(5)
式中,A(N)=G(rm,r).
式(3)~(4)中的A(n)表示需要學習的卷積核.訓練網絡時的價格函數為

(6)
式中,E(gnd)表示測量散射場.

圖2 基于物理機制的復數域卷積神經網絡Fig.2 The physical-driven complex CNN
基于物理機制的復數域卷積神經網絡可以利用傳統神經網絡通過后向傳播傳遞誤差的網絡訓練方法[3].在后向傳播過程中,各層的梯度可以通過方程(7)和方程(8)求解:
(7)

(8)
由上述分析可知,基于物理機制的復數域卷積神經網絡可以快速預測目標散射場數據.
不失一般性,電磁逆散射問題可描述為
y=Ax.
(9)
式中:y表示獲取的散射場數據;x表示成像目標;A表示兩者之間的非線性(或線性)映射關系.由于算子A的非線性與病態性,為求解大尺度電磁成像問題,需要消耗昂貴的計算資源.算子A的病態性導致方程(9)存在偽解,為解決病態性問題,通常需要融合x的先驗知識,再通過與觀測數據有機融合實現高精度電磁成像[5-6].為解決算子A的非線性問題,在過去幾十年,研究人員提出了許多確定性和統計算法,例如對比源反演方法,變形玻恩迭代法,隨機優化方法等[1-2].當成像區域增大時,隨著未知數的增多,現有成像算法的計算量會急劇增加,實時性得不到有效保障.基于上述問題,本文提出了一種基于物理機制的大尺度逆散射深度學習方法.該方法繼承了傳統機器學習計算量小、速度快等優點,也賦予神經網絡隱含層一定的物理含義,為下一步實現高精度實時成像奠定了理論基礎.
在文獻[1]中,作者修正了傳統玻恩近似模型中目標具有各向同性散射特征的假設,將目標的各向異性特征考慮到成像建模過程中,啟發式地提出了廣義反射率概念.在文獻[2]中,作者通過三層串聯網絡框架來表示圖像重構過程:第一層為觀測變量;第二層是機器學習中的隱藏層,可以表征重構的感應電流等;第三層表示目標反射率.基于上述兩項工作,本文構建了基于物理機制的大尺度逆散射卷積神經網絡模型(如圖3所示),通過將輸入數據分別與多個卷積核進行卷積,重構出多個視角下的感應電流,再通過連接(例如全連接等)獲得預測的雷達成像結果[7].

圖3 基于物理機制的單層逆散射卷積神經網絡Fig.3 The physical-driven single-layer EM inverse scattering complex CNN
本仿真散射目標均來源于MNIST手寫數字數據集[3].本仿真的雷達散射模型如圖1所示,目標介電常數為4.二維目標區域的入射平面波信號為4 GHz單頻信號,成像區域(L=1.4λ)被均勻剖分為196個0.1λ×0.1λ的正方形網格.M=19個雷達接收機距原點距離R=10λ,且均勻分布在-90°~90°的半圓上.依據式(1)產生的10 000組仿真樣本被劃分成兩部分:3 000組樣本被用于訓練網絡參數,7 000組樣本被用于測試網絡的泛化能力.同時利用如下價格函數來定量分析預測散射場和測量散射場(由式(1)獲得的散射場)之間的誤差[8]:

(10)
為了進一步說明基于物理機制的卷積神經網絡的有效性,本算例將對傳統玻恩近似方法預測散射場數據與神經網絡預測散射場數據做比較.傳統玻恩近似方法預測散射場數據可以通過式(11)獲得:
(11)
圖4中(a)~(c)給出了通過訓練復數域卷積神經網絡,其網絡輸出的三組小尺度目標的預測散射場和測量散射場數據之間的關系.如圖4所示:復數域卷積神經網絡輸出的預測散射場(紅色曲線)能夠很好地擬合測量得到的散射場數據(藍色曲線),平均誤差僅為ERR=0.001 6,且圖4中各實部、虛部最大絕對誤差分別為(0.023,0.008),(0.051,0.034)和(0.036, 0.078); 而通過玻恩近似方法獲得的散射數據(黑色曲線)則相比網絡預測的散射場誤差極大.由此可知,本文提出的基于物理機制的卷積神經網絡能夠有效預測相同尺度目標的散射場.
為進一步說明上述小尺度目標樣本所訓練的復數域神經網絡可以直接應用于預測更大尺度目標的散射場數據,本文將測試目標區域擴大至2.8λ×2.8λ(即訓練樣本目標區域的四倍),其他參數不變,隨機產生5 000組測試樣本數據.如圖5中(a)~(c)所示:三組網絡預測的大尺度目標區域的散射場和測量散射場誤差較小,5 000組測試數據的平均誤差為0.017,且圖5中各實部、虛部最大絕對誤差分別為(0.316,0.123),(0.73,0.147)和(0.625,0.274);而通過玻恩近似方法獲得的散射場數據僅能夠簡單擬合曲線趨勢.

(a) 測試樣本1(a) Testing sample 1

(b) 測試樣本2(b) Testing sample 2

(c) 測試樣本3(c) Testing sample 3圖4 基于小尺度目標訓練網絡測試小尺度目標散射場仿真結果Fig.4 The small-scale scenario training and testing results with complex CNN

(a) 測試樣本1(a) Testing sample 1

(b) 測試樣本2(b) Testing sample 2

(c) 測試樣本3(c) Testing sample 3圖5 基于小尺度目標訓練網絡預測大尺度目標的散射場Fig.5 The large-scale EM scattering scenario testing samples using well-tuned small-scale scenario complex CNN
由上述兩組仿真結果可知:本文提出的面向大尺度電磁散射問題的基于物理機制的復數域卷積神經網絡具有強的泛化能力,不僅能夠精確預測相同尺度目標的散射場,而且所訓練的卷積網絡可直接用于預測更大尺度目標的散射場.
本仿真采用圖6所示的雷達系統,系統采用收發分置,發射天線36個,接收天線90個.雷達目標的介電常數設置為13.系統發射信號為2 GHz單頻信號,成像區域(L=7.2λ和9.6λ)被均勻剖分為6 912個0.1λ×0.1λ的正方形網格.雷達發射和接收機距原點距離R=10λ.基于玻恩近似假設,利用后向投影成像方法將散射場數據變換為后向投影成像結果.如圖7所示,在本仿真中,從后向投影成像結果中隨機切出36×48大小的圖像作為網絡輸入,將相對應的真實目標反射率圖像作為網絡輸出,構成一組樣本數據.隨機產生的4 000組樣本數據平均劃分為兩部分,其中3 000組訓練樣本用于訓練網絡參數,1 000組驗證樣本用于驗證網絡的有效性.本仿真中基于物理機制的卷積神經網絡采用具有256個卷積核的四層串聯網絡結構,并用式(12)中的價格函數來衡量網絡預測誤差[8]:

(12)

圖6 大尺度電磁逆散射仿真模型Fig.6 The large-scale EM inverse scattering scenario

(a) 訓練網絡輸入(后向投影)(a) The complex CNN inputs(back projection)

(b) 訓練網絡輸出(真實目標)(b) The complex CNN outputs(real goal)圖7 小尺度目標逆散射訓練網絡的輸入和輸出Fig.7 The complex CNN inputs and outputs in small-scale EM inverse scattering scenario
訓練網絡輸入輸出均做歸一化處理,將上述所訓練的網絡應用于預測完整人體目標的逆散射成像.如圖8所示:后向投影成像結果(第一列)與真實目標(第三列)相比,其噪聲較大,鬼影較多,肉眼很難分辨人體姿勢,僅有模糊的外部輪廓,其誤差ERR平均高達0.197 2,且圖中三幅圖的最大絕對誤差分別為0.890 3,0.895 7,0.832 1;網絡預測輸出結果(第二列)與真實目標(第三列)相比,盡管最大絕對誤差分別高達0.982 5,0.998 7,0.974 1, 但預測輸出結果僅在邊緣和細微處與真實目標有部分差別,并有效消除了輸入圖像存在的鬼影,其平均誤差僅為0.027 9.

圖8 基于小尺度目標訓練網絡預測大尺度目標成像結果Fig.8 The large-scale EM inverse scattering scenario testing samplesusing well-tuned small-scale EM inverse scattering scenario complex CNN
本文針對現有方法無法滿足實時獲取高精度大尺度電磁散射數據與大尺度目標成像結果的問題,分別提出了兩種不同的基于物理機制的卷積神經網絡.該方法既繼承了傳統神經網絡結構簡單,計算速度快等優點,也啟發式地將物理意義賦予神經網絡,從而構建基于物理機制的神經網絡結構.由仿真結果分析可知,該網絡對與訓練樣本相同尺度的小目標具有很好的泛化能力,其訓練得到的神經網絡可以直接應用于更大尺度目標場景,并具有較好的泛化能力.該方法極大地降低了獲取高精度大尺度電磁散射數據與成像的難度.如何進一步提高網絡預測精度,降低網絡訓練難度,增強網絡泛化能力,擴展到三維成像場景,適用不同環境目標將成為作者下一步的研究重點.盡管如此,論文研究結果表明:本文所提出的基于物理機制的深度學習模型為解決現有大尺度電磁測算融合與電磁成像等計算成本昂貴的難題提供了新思路,開辟了新方向.