程 曦 張志勇
(新疆農業大學計算機與信息工程學院 烏魯木齊 830052)
隨著科學技術的快速發展,探地雷達技術作為一種非侵入淺表地球物理探測技術,已在土建、環保與軍事等諸多重要領域得以廣泛應用[1-5]。在對探地雷達系統電磁波束傳播過程進行分析研究時,數值模擬是有效方法之一[6]。近年來,針對探地雷達系統的建模與仿真分析,有不少研究工作先后提出了性能良好的數值模擬算法。時域有限差分法以其易于實現,且可以對色散、有損介質進行建模仿真而成為常用方法之一。在探地雷達系統工作過程中,由于其電磁脈沖特性參數會受到諸如傳輸介質介電特性等相關參數的影響,系統對探測目標或對象的測量精度受到不同程度影響。故而,在對探地雷達系統進行建模仿真時必須考慮模型輸出結果對這些相關參數集(即模型中輸入參數集)的依賴性。然而,在實際建模仿真中,由于對輸入參數(如土壤的介電特性)缺乏精確的知識,模擬仿真輸出結果中存在不確定性[7]。為使模擬仿真結果更具現實指導價值,當考慮對輸出結果置信度進行定量化表征時,針對探地雷達建模仿真進行不確定性分析就顯得尤為必要[8]。
不確定性分析法可分為兩類:非嵌入式方法和嵌入式方法。傳統的非嵌入式方法即為蒙特卡羅方法[9],該算法要求執行數千次仿真代碼直到結果收斂,這勢必會導致高額的計算成本。在目前已有的研究中[8],有學者提出了將廣義多項式混沌展開應用到輔助微分方程時域有限差分(Auxiliary Differential Equation - Finite Difference Time Domain,ADE-FDTD)中的嵌入式不確定性分析方法來量化由不確定輸入參數引起的輸出結果的不確定性。該方法較蒙特卡羅方法在運算量與計算效率方面已取得了顯著的性能提升。然而,這種方法亦有一定局限性,其主要缺陷表現在:其一,計算復雜度會隨著輸入不確定參數集維數增加而迅速增加,顯然這對于輸入不確定參數集維數較大的情況是不適用的;其二,廣義多項式混沌展開通常在仿真模型輸入參數變化不大的情況下,可得到的較理想的不確定分析結果。但是在輸入參數變化較劇烈,引起數值仿真輸出結果較大波動的情況下,該方法很可能達不到預期的結果。
為了有效解決上述問題,在探地雷達建模仿真不確定性分析研究過程中,本文構造了一種基于人工神經網絡(Artificial Neural Network, ANN)的替代模型,該模型通過模擬替代探地雷達仿真模型的方式,可對系統參數不確定性進行分析與研究。考慮到在獲取建立ANN替代模型所需訓練、測試與驗證數據樣本時仍需運用基于ADE-FDTD進行全波仿真,文中首先闡述了探地雷達系統物理模型及其基于ADE-FDTD全波仿真計算的理論原理;其次,提出并設計基于ANN的替代模型,對構建替代模型過程中若干關鍵問題進行了詳細分析與討論,如激活函數[10]的選擇與比較分析、如何降低或抑制過擬合[11]現象等;最后,為了驗證ANN替代模型的準確性與有效性,結合探地雷達系統某一特定應用場景,利用ANN替代模型對系統輸出結果進行預測,并與蒙特卡羅仿真(Monte Carlo Simulation, MCS)的結果進行比較分析。經數值模擬應用分析,基于ANN的替代模型所得預測結果與傳統不確定性分析方法蒙特卡羅方法的結果達到較好的一致性,這使得探地雷達建模仿真輸出結果不確定性分析過程擺脫運算量大、計算效率低下的困境。
在建模中,土壤被認為是一種非磁性介質,其介電常數與頻率有關,并且將其建模為具有靜態電導率σs的2維德拜模型。該模型相關參數均可由測量獲得[1]。然而,由于測量系統誤差與偶然誤差等測量誤差的存在與影響,必然導致模型相關參數中均包含不確定性的成分。研究中,土壤介質材料相對介電常數εr(ω,θ)由式(1)確定

2維空間中描述電磁波傳播規律的麥克斯韋方程可由式(2),式(3),式(4)給出


式中,

同理,可得到沿x,y軸方向上的磁場強度Hx與Hy。ADE-FDTD更新方程表明,土壤模型參數的不確定性會引入Hx,Hy和Ez數值仿真結果的不確定性。因此,為使模擬仿真結果更具現實指導意義,對輸出結果中的不確定性進行量化分析就顯得尤為必要。本文基于ANN技術,設計構造ANN替代模型模擬替代探地雷達仿真模型。
基于ANN的替代模型旨在對任意給定一組包含不確定性的輸入參數時,能夠準確預測探地雷達系統的輸出結果,其訓練過程與測試過程如圖1所示。

圖1 ANN替代模型的訓練過程與測試過程

在本研究設計中,神經網絡的數據集分為3個部分:訓練集、測試集和驗證集。其中,訓練數據集占全部數據的60%。模型參數均采用一種基于低階矩估計的隨機目標函數一階梯度優化算法,即自適應矩估計(Adam)算法[12],進行優化處理。
在ANN替代模型超參數的選擇與設計上,考慮到ANN隱藏層激活函數對模型的學習能力與預測精度有重要影響,文中針對當前幾種主流ANN激活函數,如ReLU(Rectified Linear Unit)函數[13]、LReLU(Leaky Rectified Linear Units)函數[14]、PReLU(Parametrized Rectified Linear Units)函數[15]以及ELU(Exponential Linear Unit)函數[16],分別將其應用于ANN替代模型隱藏層,并分析比較它們對ANN整體性能的影響。
其中,ReLU函數的具體函數形式如式(13)


當分別將ReLU函數、LReLU函數、PReLU函數與ELU函數應用于ANN替代模型隱藏層后,經過對模型進行反復訓練學習,得出不同激活函數作用下ANN替代模型的訓練損失函數和驗證損失函數隨Epochs的變化規律,如圖2所示。
從圖2可以看出,除應用ELU函數外,選擇將其余3種函數作為ANN隱藏層激活函數時,ANN均產生較大程度的過擬合問題。為此,研究中針對選取ReLU函數、PReLU函數和LReLU函數作為隱藏層激活函數的ANN在其訓練過程中分別應用DropOut方法來抑制過擬合問題。DropOut方法的核心思想如式(18)-式(21)所述[16]

圖2 4種不同激活數屬分別應用于ANN替代模型隱藏層后訓練損失函數與驗證損失函數隨Epochs的變化關系(未應用DropOut方法)



針對前述應用ReLU函數、PReLU函數和LReLU函數作為隱藏層激活函數而產生過擬合問題的ANN網絡,對其分別應用DropOut方法,經過模型訓練與學習,使用DropOut方法能夠顯著地抑制ANN網絡的過擬合問題。表1分別給出了應用DropOut方法前后,選擇不同函數作為隱藏層激活函數時,ANN替代模型在經過5000次迭代之后的訓練數據與驗證數據的損失值情況。
通過對表1進行比較分析,不難發現如下結論:(1)相較于ReLU函數、LReLU函數和PReLU函數,選取ELU函數作為ANN替代模型隱藏層激活函數時,其在替代模型訓練過程中能夠在一定程度上改善過擬合問題,并且模型收斂速度更快;(2)針對前三者作為隱藏層激活函數時替代模型存在過擬合的問題,若對替代模型的隱藏層應用DropOut方法,可顯著改善訓練數據過擬合的問題。

表1 應用DropOut方法前后,不同激活函數作用時ANN替代模型的損失函數值
圖3給出了本文所研究探地雷達系統及其具體應用場景在進行ADE-FDTD全波仿真時的2維模型。如圖所示,一塊邊長為1 m的正方形金屬目標物埋置于色散土壤內,且在其旁邊存在一邊長為0.5 m的干燥花崗巖。圖中Tx與Rx分別表示發射機與接收機,其均被建模為點源[17-19]。研究采用Blackmann-Harris脈沖作為激勵源脈沖。其中,中心頻率fc=200 MHz,Ts=1.55/fc。同時,將各向異性完全匹配層(Uniaxial Perfectly Matched Layer,UPML)作為吸收邊界條件。

圖3 探地雷達系統及其應用場景模擬模型
模擬計算中,模型計算域為xoy平面內x × y= 4.00 m × 4.00 m的區域,并且將其分解為方形單元網格。空間采樣寬度Δx = Δy =Δ= 5.00 mm。時間步長Δt = Δx/(2c) = 8.33 ps,式中c表示自由空間中的光速。UPML的厚度是10Δ。德拜模型的相關參數均通過測量得到,各參數中均含有不確定性成分,如表2所示。

表2 色散土壤模型參數
圖4給出了當包含不確定性的輸入參數個數為7時,采用MCS方法,在2維探地雷達模型接收機Rx處觀測得到電場強度Ez隨時間變化的規律。該曲線基于60個采樣點繪制而成,且模擬中每個輸入參數的不確定性變化范圍為10%。從電場強度Ez的變化規律曲線中亦可以看出,輸入參數中的不確定性會致使模擬輸出結果中產生不確定性成分。與已有研究成果[8]相比較,本研究將輸入參數的變化范圍從5%提高到10%,較大的不確定輸入參數的變化范圍會引起輸出相對更大的不確定性,增大了不確定性分析的難度。

圖4 基于MCS方法的電場強度E z變化規律
研究中,色散土壤濕度取2.5%,干燥花崗巖的相對介電常數εg為5,電導率σg為10-5mS/m。所有數值模擬計算過程均由一臺處理器為Intel i5-6440HQ,主頻2.6GHz,內存為16GB的計算機完成。執行一次全波仿真的CPU用時為1098.80 s。
研究中在ANN替代模型運用之前,FDTD仿真模擬中輸入輸出值均對其進行標準化處理。同時,采用拉丁超立方采樣法(LHS)獲取模型輸入參數。此外,對于ANN替代模型的Batch size參數、隱藏層數量,以及各隱藏層內神經元數量等其它超參數的設置如表3所示。

表3 ANN替代模型超參數設置
當ANN替代模型完成訓練學習過程后,其即可被用來對探地雷達系統輸出結果進行預測,并進一步用于不確定性分析中。圖5給出了基于ANN替代模型對接收機Rx處電場強度Ez的預測值進行統計計算得到Ez的均值與標準差變化規律。
從圖5可以看出,當ANN替代模型隱藏層激活函數采用ELU函數時所得結果與基于ADE-FDTD的全波仿真所得結果,無論是均值還是方差都具有較好的一致性。與此同時,從圖5也可以發現,當ANN替代模型隱藏層激活函數分別采用ReLU函數、LReLU函數、 PReLU函數并應用DropOut方法的3種結果基本相似,所得方差與全波仿真的結果有一定偏差。當與圖6進行對比分析會發現,分別采用ReLU函數、LReLU函數、PReLU函數作為ANN隱藏層激活函數,且不應用DropOut 方法減少過擬合時,得到的方差與全波仿真所得方差的偏差進一步增大。綜上所述,采用ELU函數可以得到較好的預測結果,并且無需考慮過擬合問題。

圖5 土壤中含有金屬塊以及花崗巖,輸入不確定性參數個數為7且變化波動范圍均為10%時,R x處電場強度E z統計特性

圖6 土壤中含有金屬塊以及花崗巖,輸入不確定性參數個數為7且變化波動范圍均為10%時,R x處電場強度E z統計特性
表4給出了分別采用傳統MCS不確定分析法和ANN替代模型(ELU函數作為激活函數)進行數值模擬的CPU耗時情況。其中,ANN替代模型的數值模擬CPU耗時主要由兩部分組成:(1)替代模型訓練學習耗時(2011.21 s);(2)任給一組新輸入參數,替代模型預測1000個輸出結果的耗時(1.80 s)。
從表4可以看出,在結果保持較好一致性的情況下,采用ANN替代模型極大地減少了ADE-FDTD仿真次數,并且計算效率更高。需要注意的是,盡管ANN的訓練時間以及預測時間較短,但是為了得到訓練樣本進行200次全波仿真也需要消耗時間。

表4 傳統MCS不確定分析法和ANN替代模型進行數值模擬的CPU耗時
為了進一步研究分析ANN替代模型對GPR系統數值模擬模型中異常體數量、類型、分布形態、介電參數等參數變化的適應性與有效性,研究去除了圖3所示模型中的干燥花崗巖,僅保留正方形金屬目標物,并將其邊長由1 m減小至0.3 m,其他數值模型參數條件保持不變。同時,模型輸入不確定性參數個數仍為7個,且隨機波動變化范圍也為10%。圖7給出了基于ANN替代模型對接收機Rx處電場強度Ez的預測值進行統計計算得到Ez的均值與標準差變化規律。在這里,ANN替代模型隱藏層激活函數直接采用ELU函數。從圖7所示模型預測結果的統計特性曲線可以看出,即使系統模擬模型變化,GPR系統回波時域波形發生改變,本文提出的ANN替代模型預測結果的統計特性依然可以與MCS不確定分析法所得結果保持較好一致。

圖7 土壤中含有金屬塊,輸入不確定性參數個數為7且變化波動范圍均為10%時,R x處電場強度E z統計特性
本文旨在對2維探地雷達系統建模仿真中因色散有損土壤介質的不確定性參數所引起的仿真輸出結果的不確定性量化分析方法進行研究。針對傳統不確定性分析方法解決此類問題時計算效率低、運算量大的問題,提出了一種基于ANN的替代模型,替代探地雷達系統全波仿真行為的方式,基于該模型方法可對探地雷達系統輸出結果進行預測,進而得到輸出結果統計特性以進行有效的參數不確定性分析。其次,文中對構建ANN替代模型的關鍵問題,如隱藏層激活函數的選擇、如何抑制過擬合現象等,進行了詳細的比較分析。結果顯示:相較于ReLU函數、LReLU函數與PReLU函數,選擇ELU函數作為替代模型隱藏層激活函數可獲得較為理想的網絡性能。當選取前三者作為隱藏層激活函數時,替代模型將會產生明顯的過擬合問題,為此可采用DropOut方法來抑制過擬合問題。最后,經具體應用案例模擬仿真驗證分析,在相同的數值模型、不確定性輸入參數個數,以及參數變化范圍為10%的前提條件下,通過ANN替代模型所得不確定性分析結果與傳統基于MCM法所得結果具有較好的一致性,且相較于后者,前者計算時間效率提升79.82%。本文的不足之處是土壤模型較為簡單假設為均勻介質,沒有考慮土壤的孔隙率等因素,在將來的工作中將完善仿真模型,考慮現實應用中的真實情況進行非均勻介質建模仿真。盡管ANN的訓練時間以及預測時間相對MCS較短,但是為了得到ANN的訓練樣本,仍然耗時進行200次全波仿真。未來的工作將考慮如何減少ANN所需訓練樣本數,進一步減少時間消耗,提高效率。