中圖分類號:0389 國標學科代碼:13035 文獻標志碼:A
Abstract: Artificial intellgence/machine learming methods candiscover hidden physical patters in data.Byconstructing an end-to-end surogate model between state parameters and dynamic results, many complex engineering problems such as strong coupling,nonlinearity,and multiphysicscan be eficiently solved.Inthe fieldof highlynonlinearexplosion and shock dynamics,a clasic detonation driving problem was chosen asthe research object.Using numerical simulation results as trainingdatafor machine learningsurrogate models,and combining forward simulation and reversedesign organicall. Based on deepneural network technology,anend-to-end surogatemodel wasconstructed between feature position velocity profiles, material dynamic deformation,and engineering factors.And the calculation accuracyof the surrogate model was provided, verifyingtheabilitytoinvertengineering factorsfromvelocityprofiles.Theresearchresultsindicatethattheend-to-end surrogate model has high predictive ability,with relative errors of less than 1 % in both velocity profile prediction and enginering factorestimation.Itcanbeappliedtotherapiddesign,high-precisionprediction,andagileiterationof highly nonlinear explosion and impact dynamics problems.
Keywords:computational explosionmechanics; detonation drive;artificial inteligence; machine learning; end-to-end surrogatemodel; deep neural network
人工智能(artificial inteligence,AI)是能夠和人一樣進行感知、認知、決策和執行的人工程序或系統,是新一輪科技革命和產業變革的重要驅動力量。我國在人工智能方面取得了長足進步,集群作戰、有人/無人協同作戰、智能自主作戰等新型作戰方式不斷涌現,各類新裝備層出不窮,作戰領域正在發生前所未有的深刻變革[1];國外的人工智能也在高速地發展,如美國國防高級研究計劃局(DefenseAdvanced Research Projects Agency,DARPA)研制的無人水面艇[2],能夠自動航行數月、自己設定目標,并且無需指定航線就能理解周圍艦船的行為;2022年,美國洛斯阿拉莫斯國家實驗室發布了系列報告3,介紹了實驗室未來材料戰略的7大領航領域,其中在材料設計和模型開發領域力求使用機器學習人工智能方法實現材料設計和相關驅動預測,并給出了未來 6 ~ 1 0 年的研究目標。
機器學習技術是現代人工智能系統的基礎和核心,它使計算機系統能夠通過識別和利用現有知識來獲取新知識和新技能,賦予了機器從數據中學習潛在規律的能力。在過去幾十年里,機器學習影響了許多領域,如自動駕駛[4]、醫療保健[5]、金融[、智能制造[、能源[8]等。在自然科學領域,機器學習被廣泛應用于物理學的多個分支,包括統計物理學[9]、凝聚態物理學[10]、生物物理學[1]、天體物理學[12]等。在材料科學領域,機器學習快速發展,已被應用于加速高應變的連續尺度脆性斷裂模擬[13]、多晶金屬延性損傷模型參數預測方法[14、平衡相變[15]等的研究中;而在計算流體力學領域,機器學習也有了大量應用,例如劉泮宏[1研究了訓練集和測試集數據來自不同幾何模型時機器學習模型對湍流演化的預測能力,劉永澤[17]實現了艦船毀傷特性的快速準確預測,張筱迪[18]對不同溫度和跌落工況下混凝土樓板的動態響應做出了深入分析等。
爆轟驅動問題是材料、結構或產品在炸藥爆炸作用下的復雜流動變形問題,是高度非線性的瞬態動力學問題。其典型時刻和典型位置的熱力學狀態受初始狀態或工程因素的影響,可通過動態診斷測試設備或數值模擬獲取。本文中,利用機器學習技術,建立物理模型輸入參數與輸出參數之間的黑箱式映射關系,即端到端代理模型,從而實現實驗狀態參數的高效預測:在離線階段,使用比較昂貴的大規模數據(來自數值模擬或實驗)和計算資源訓練物理模型的代理模型;在在線階段,使用相對輕量的代理模型替換數值模擬過程,實現敏捷迭代和快速預測。針對爆轟驅動問題,以數值模擬結果為機器學習的訓練數據源,基于深度神經網絡建立端到端代理模型,以期為爆轟驅動問題的實驗設計與快速預測提供技術支撐。
1基于深度神經網絡的機器學習方法
常規擬合函數,如多項式函數、線性函數、指數函數、對數函數等,可以解析求導,其描述的行為偏線性,對特定問題有較強的擬合能力,但總體上常規擬合函數的表達能力十分有限。與常規擬合函數相比,深度神經網絡擬合函數的特點是表達能力強,描述的行為非線性,參數集非常大,可半解析求導,對于通用問題具備較強的擬合能力,其表現形式為:

式中:
為神經網絡的輸出結果; x 為輸入變量;
為迭代函數,上標
為迭代層數; ±b θ 為輸入序參量,包含一次擬合線性項
和線性擬合常數項 
神經網絡的體系結構是一個多層前饋網絡,由數個隱示層(hiddenlayer)連續堆疊而成,這種多層結構使神經網絡能夠學習做出準確預測所需的關鍵特征。深度神經網絡本質上是一組帶有權值的邊和節點組成的相互連接的層,稱為神經元,如圖1所示,其中:
為神經網絡的輸入值, y 為輸出值。訓練過程開始前,每組神經元會被賦予一個隨機權重,以保證同層不同神經元的行為不會趨同;訓練過程中,如果網絡不能準確實現輸人到輸出的映射時,系統將按照選定的最優化算法調整神經元權重;經過充分的訓練后,由神經元權重表達的輸出模式(如圖2所示)就能較好地近似訓練數據集中輸入和輸出的映射關系。圖2中箭頭上的數字為權重,紅色箭頭和節點表示對輸出的影響可以忽略的網絡結構。圖2同時展現了神經網絡結構的自組織性。神經網絡持續將低維向量非線性映射到高維空間,不斷尋找特征、壓縮數據,將模型參數放人高維空間中,它能在不同參數下生成模型,即神經網絡本身可作為代理模型使用。神經網絡一般包括3部分,即顯示層(輸入變量)、隱示層和顯示層(輸出變量),隱示層的描述通常包含隱示層的深度和寬度,如圖3所示。


影響機器學習代理模型精度的因素很多,包括數據、優化算法、網絡結構等。機器學習所需的數據分為2個子集:第1個子集被稱為訓練數據集,用于擬合代理模型;第2個子集稱為測試數據,不在模型訓練過程中使用,而是作為代理模型行為的期望,用于測試訓練完成的模型的預測能力。機器學習方法中不同的優化算法也會對代理模型的計算結果產生影響,為了進一步說明,對比分析了BFGS(Broyden-Fletcher-Goldfarb-Shanno)和 ADAM(adaptive moment estimation)2 種算法。其中 BFGS 算法由 Broyden[19]、Fletcher[20]、Goldfarb[21]和Shanno[22]在20世紀70年代初提出,主要針對無約束優化問題,通過目標函數和一階導數構造出目標函數的曲線近似,具有收斂速度快的優點,是一種比較常用的牛頓算法。ADAM算法是一種基于低階自適應矩估計的隨機目標函數的一階梯度優化算法[23],通過對梯度指數的加權平均實現對網絡的平滑處理、降低梯度的擺動幅度,適用于含大規模數據和參數的優化問題,相比于傳統梯度下降法,收斂速度更快、效果更好,能提高算法的整體性能。圖4比較了爆炸加載波形的數值模擬結果與2種優化算法的結果,其中:實線為模擬結果,虛線為算法優化結果。可以看出,相較于BFGS算法,ADAM算法的結果更接近數值模擬結果,因此,本文的機器學習均采用ADAM算法。深度神經網絡的超參數選擇,特別是神經網絡隱示層深度
和隱示層寬度
的取值,也會對代理模型的計算結果產生影響。這里以一個算例來進行說明。機器學習的數據來源于雙變量函數
,其中:
為函數;
為第1個變量,
為第2個變量,
輸出數據維度為 2 0 0 × 2 0 0 ,使用ADAM優化算法獲得基于神經網絡的機器學習代理模型。選取6種不同
組合,比較代理模型與解析解之間的差異,結果如圖5所示,其中:實線表示解析結果,虛線表示代理模型的輸出。表1給出了代理模型與解析解之間的標準誤差,可以看出,不同的超參數可能使代理模型的預測標準誤差相差數倍。




2爆轟驅動問題中的機器學習代理模型及其驗證
2.1數值模擬模型及代理模型構建
數據是代理模型的基礎,其來源主要有實驗采集、理論計算和數值模擬。針對爆轟驅動問題,只考慮單因素(炸藥與內殼之間的間隙厚度)影響,采用爆炸與沖擊動力學方法[24-25]進行數值模擬,模擬結果用于代理模型的訓練數據源。
單因素影響的爆轟驅動模型(圖6)是軸對稱模型,其中外殼和內殼的材料為銅,炸藥的初始起爆點為底部殼體的內側中心位置,炸藥與內殼之間的間隙厚度為 h ,取值范圍為
,測點
和
分別位于外殼底部外界面的中心位置和外殼右側外界面的中心位置。數值模擬中,輸出 h 分別為 0 , 1 , 2 , 3 , 4和
工況下
和
的速度-時間(
曲線,同時每間隔
輸出內、外殼體材料的變形分
布,這2套數據用于機器學習代理模型的訓練。數值模擬的計算域為
,網格尺寸為
,每一個模型的串行計算機時約為 
采用3種不同的機器學習代理模型。第1種為速度 ( ν ) 剖面代理模型,可表示為:
ν = f ( h , t )
第2種為速度反函數代理模型,可表示為:


第3種為流場中材料動態時空分布代理模型,可表示為:

式中:
為速度, t 為時間, Z 為體積分數, G 為任意多元函數,
和
為空間坐標。
采用如圖3所示的深度神經網絡代理模型,根據具體問題中的數據集規模、輸入/輸出數據的維度、數據分布特征等因素調整隱示層深度
和寬度
這2個參數。模型參數的選取原則為:(1)數據集規模較小、輸入/輸出數據維度較低時,為減輕過擬合現象,不宜采用大規模的神經網絡模型,即應選取較小的
和
;(2)輸入數據與輸出數據之間的映射關系越接近線性,越容易被小規模的神經網絡模型描述,即可選擇較小的
和
;(3)如果同一組數據集可以訓練多個代理模型,然后再選擇其中最有效的一個,則應在滿足精度要求的前提下,盡可能選擇規模更小的模型,即選擇
和
更小的模型配置。在速度剖面(速度-時間曲線)代理模型和速度反函數代理模型中,
、
;在流場中材料動態時空分布代理模型中,
。
代理模型在訓練過程中接收輸入的數值模擬數據。在速度剖面代理模型和速度反函數代理模型中,自變量為2個,且輸入數據具有典型的一維特征,規模較小;在流場中材料動態時空分布代理模型中,自變量有4個,輸入數據涉及空間位置坐標,與數值模擬的網格數相關,規模較大。在代理模型的構建過程中,考慮到速度剖面和材料空間分布的取值均可能接近零,此時,相對誤差無法定義,因此,采用更具普適性的均方誤差(mean square error,MSE)作為損失函數。同時,為了限制神經網絡模型的過擬合程度,采用L2正則化優化模型參數。在評估代理模型的預測效果時,依舊采用了相對誤差。
2.2代理模型的計算精度及其預測能力分析
圖7顯示了 h 分別為 0 、 1 、 2 、 3 、 4 和
工況下測點
和
的速度剖面。可以看出,
的速度剖面比較光滑,
的速度剖面出現明顯的層裂現象,說明
處的外界面材料存在局部拉伸情況。圖8比較了采用速度剖面代理模型計算的
和
的速度剖面與訓練點上的數值模擬結果,其中,為清晰地展示速度剖面曲線上的波動特征,圖8(b)采用增量層疊的方式放置曲線。表2給出了速度剖面代理模型在訓練點上的相對誤差(為避免除零錯誤,本文中所有速度剖面的相對誤差均采用有效時間內的積分作為分母,給出整條曲線的平均相對誤差),均小于 0 . 0 1 % ,可見其精度極高。
以預測點上相關物理量的計算精度評估代理模型的預測能力,圖9給出了 h 分別為0.5、1.5、2.5、
工況下采用速度剖面代理模型計算的
和
的速度剖面,并與數值模擬結果進行比較。從圖9可以看出,
處,代理模型預測的速度剖面與數值模擬結果吻合良好;
處,預測的層裂現象出現時刻與數值模擬結果存在差異,說明代理模型對于材料破壞行為的預測能力還存在不足。表3給出了速度剖面代理模型在預測點上的相對誤差,可以看出,
處(沒有層斷裂),機器學習代理模型預測的速度剖面精度很高,相對誤差小于 0 . 1 % :
處(有層斷裂),代理模型預測的精度明顯降低,相對誤差在0 . 1 % ~ 1 . 0 % 之間。根據式(2),給出 h 和 t ,瞬間就能給出 ν ,一條上百個點的速度曲線的計算機時不到
。





如果已知
和
的速度剖面,可通過式(3)獲得 h 。為了檢驗速度反函數代理模型對 h 的計算分辨能力,在訓練點
和預測點
附近(偏離 12 % )分別取2個點
、
以及
、
,即 h 取 0 . 9 8 , 1 . 0 0 , 1 . 0 2 , 2 . 4 5 , 2 . 5 0 和
,數值模擬給出了
的速度剖面(圖10)作為輸入,采用訓練好的速度反函數代理模型計算 h 。經過
個循環步后,計算結果為: h 取 0 . 9 8 , 1 . 0 0 和
(訓練點及附近)時,速度反函數代理模型計算的 h 分別為0.97502、1.00003和
,相對誤差分別為 0 . 5 1 0 % / 0 . 0 0 3 % 和 0 . 0 7 5 % h 取 2 . 4 5 、 2 . 5 0 和
(預測點及附近)時,模型計算的 h 分別為 2 . 4 3 4 7 6 , 2 . 4 8 7 2 7 和
,相對誤差分別為 0 . 6 2 % 、 0 . 5 1 % 和0 . 5 6 % 。可以看出,速度反函數代理模型在訓練點和預測點附近計算的 h 有很高的計算精度。根據式(3),給出速度剖面, h 優化迭代的計算機時約為
。
對于爆炸力學流場,用于代理模型訓練的輸入數據為h、內外殼體材料的體積分數和 t , h 取0、1、2 、 3 、 4 、 5 m m , t 取0、1、2、3、…、
,共計156組數據。采用流場中材料動態時空分布代理模型,深度神經網絡的
和
分別取16和50,計算流場的體積分數。圖11給出了
時代理模型計算的材料的空間分布,并與數值模擬結果進行對比。表4給出了流場中材料動態時空分布代理模型計算的流場體積分數與數值模擬結果的標準差以及相對誤差(體積分數為 0 ~ 1 之間的無量綱數),可以看出,在訓練點上標準差小于 6 . 4 % ,相對誤差小于 1 % ,計算精度較高。圖12為預測點( h 取0.25、1.50、3.75、
)上不同時刻流場中材料動態時空分布代理模型計算的流場體積分數,并與數值模擬結果進行比較,二者吻合較好。




(a) h=0.25 mm,
(b) h=1.50 mm,
(20 (c) h=3.75mm,
(20 (d) h=4.75 mm,
(2
雙因素影響的爆轟驅動模型如圖13所示,其中:
為有機玻璃厚度, d 為有機玻璃與炸藥之間的間隙厚度,
取 $0 、 1 、 2 、 3 、 4 、 5 \mathrm { m m } ,$ d 取
,共計18組數據。深度神經網絡中,根據 ν = f ( c , d , t ) ,
和
分別取8和20,獲得速度,
處的速度剖面如圖14所示;根據
和
分別取16和50,獲得流場體積分數。圖15給出了
、
、
時代理模型計算的流場體積分數,并與數值模擬結果進行比較,二者符合良好。



3結論
應用人工智能機器學習技術,對深度神經網絡優化算法進行了初步探索,以典型爆轟驅動問題為算例,構建了基于數值模擬數據的端到端代理模型,并給出了代理模型的計算精確度,驗證了代理模型從速度剖面反演工程因素的能力。為驗證深度學習代理模型的預測能力,基于一種單影響因素典型爆轟驅動模型,在數字模擬生成的數據上訓練和測試了深度學習代理模型的預測誤差和計算效率。測試表明:端到端代理模型具有較高的預測能力,相對誤差均小于 1 % ,可用于高度非線性的爆轟驅動問題的快速設計、高精度預測和敏捷迭代,是深度學習技術和爆炸與沖擊動力學融合的有效嘗試。在另一種雙影響因素典型爆轟驅動模型上所進行的測試中,深度學習代理模型依然能夠與數值模擬數據符合良好,表明所提出的端到端深度學習代理模型可以在一定程度上推廣到多影響因素爆轟驅動模型。考慮到多影響因素模型的復雜性,深度學習代理模型在不同場景中是否適用以及應該如何應用,將是進一步研究的重要問題。
感謝中國工程物理研究院流體物理研究所實驗物理數值模擬創新研究中心原職工張恒第在計算程序實現上提供的幫助。
參考文獻:
[1] 楊凱,呂文泉,閆勝斌.智能化時代的作戰方式變革[J].軍事文摘,2022(1):7-11. YANG K,LYU WQ,YANS B.Reformof combat methods in the era of intelligence[J]. MilitaryDigest,2022(1):7-11.
[2] 中國國防科技信息中心.DARPA成功完成“海上獵手”無人水面艇項目[R/OL].(2018-02-02)[2024-04-07].https:// www.sohu.c0m/a/220477417_313834. China National Defense Science and Technology Information Center. DARPA successully completed the Sea Hunter unmanned surface vehicle project [R/OL]. (2018-02-02)[2024-04-07]. htps://www.sohu.com/a/220477417_313834.
[3] DATTELBAUM A M. Materials dynamics: LA-UR-22-25248 [R]. Los Alamos: Los Alamos National Laboratory,2022.
[4] SHALEV-SHWARTZ S,SHAMMAH S, SHASHUA A. Safe,multi-agent,reinforcement learning for autonomous driving[EB/OL].arXiv:1610.03295.(016-11-11)[2024-04-10].hps://rxivorg/abs/1610.03295.DOI: 104855/arXiv.610. 03295.
[5] CHAR D S,SHAHNH,MAGNUS D. Implementing machine learning in healthcare—addresing ethical challenges[J]. The New England Jourmal of Medicine, 2018, 378(11): 981-983.DOI: 10.1056/NEJMp1714229.
[6] LIN WY,HUYH,TSAI CF.Machine learning in financial crisis prediction: a survey[J]. IEEE Transactionson Systems, Man,and Cybermetics,Part C(Applicationsand Reviews),2012,42(4): 421-436.DOI: 10.1109/SMCC.2011.2170420.
[7] LIPSON H,POLLACKJB. Automatic design and manufacture of robotic lifeforms [J]. Nature,2000, 406(6799): 974978. DOI: 10.1038/35023115.
[8] BERRAL JL,GOIRI i,NOUR,etal. Towards energy-aware scheduling in data centers using machine learning [Cl// Proceedingsof the 1st International Conference on Energy-Eficient Computing and Networking.Passau: ACM,2010: 215- 224. DOI: 10.1145/1791314.1791349.
[9] ENGELA, VANDENBROECK C.Statistical mechanicsof learming [M].Cambridge: Cambridge University Press,2001.
[10] CARLEO G,TROYER M. Solving thequantum many-body problem with artificial neural networks [J]. Science,2017, 355(6325): 602-606.DOI: 10.1126/science.aag2302.
[11]SCHAFER NP,KIMBL,ZHENG WH,etal.Learning tofold proteinsusing energy landscape theory[J]. IsraelJoualof Chemistry, 2014, 54(8/9): 1311-1337. DOI: 10.1002/ijch.201300145.
[12]VANDERPLAS J, CONNOLLYA J,IVEZICZ,et al. Introduction to astroML: machine learning for astrophysics [/ Proceedingsof 2012 Conferenceon InteligentData Understanding.Boulder:IEEE,2012:47-54.DOI:10.1109/CIDU. 2012.6382200.
[13]BLASCHKE D N,NGUYEN T,NITOL M,et al. Machine learning based approach to predict ductile damage model parameters for polycrystaline metals [J]. Computational Materials Science,2023,29:112382.DOI:10.1016/j.commatsci. 2023.112382.
[14]FERNANDEZ-GODINO M G,PANDA N, O'MALLEYD, et al. Acelerating high-strain continuum-scale britle fracture simulationswith machinelearming[J].Computational Materials Science,2021,186:109959.DOI:10.1016/j.commatsci. 2020.109959.
[15]楊寓翔,李煒,申建民,等.機器學習在相變中的應用[J].中國科學:物理學 力學 天文學,2023,53(9):290011.DOI: 10.1360/SSPMA-2023-0130. YANG Y X,LIW,SHEN JM,etal. Machine learning applications inphase transitions[J]. Scientia Sinica Physica, Mechanica amp; Astron0mica, 2023, 53(9): 290011. DOI: 10.1360/SSPMA-2023-0130.
[16]劉泮宏.基于機器學習的湍流建模應用研究[D].哈爾濱:哈爾濱工業大學,2021.DOI:10.27061/d.cnki.ghgdu.2021. 001683. LIU P H. Application of turbulence modeling based on machine learning[D]. Harbin: Harbin Institute of Technology,2021. DOI: 10.27061/d.cnki.ghgdu.2021.001683.
[17]劉永澤.水下爆炸載荷下板架結構毀傷特性的機器學習方法及應用研究[D].哈爾濱:哈爾濱工程大學,2022.DOI:
10.27060/d.cnki.ghbcu.2022.001951.
LIUYZ.Research onthemachine learning methodand itsapplication in damage assessmentof plate frame subjected to
underwater explosion[D].Harbin: HarbinEnginering University,2022.DOI: 10.27060/d.cnki.ghbcu.2022.001951.
[18]張筱迪.混凝土樓板火災及沖擊作用下力學性能數值仿真研究[D].撫順:遼寧石油化工大學,2021.DOI:10.27023/ d.cnki.gfssc.2021.000186. ZHANG XD. Numerical simulation studyon mechanical properties of concrete floor under fire and impact[D].Fushun: Liaoning Shihua University, 2021. DOI: 10.27023/d.cnki.gfssc.2021.000186.
[19]BROYDENCG.Theconvergence ofa classof double-rank minimizationalgorithms: 2.thenewalgorithm[J]. IMA Journal of Applied Mathematics, 1970, 6(3): 222-231. DO1: 10.1093/imamat/6.3.222.
[20]FLETCHERR.Anewapproach tovariable metric algorithms[J].TheComputerJournal,1970,13(3):317-32DOI: 10.1093/comjnl/13.3.317.
[21] GOLDFARB D.A familyof variable-metric methods derived by variational means [J]. Mathematics of Computation,1970, 24(109): 23-26. DOI: 10.1090/S0025-5718-1970-0258249-6.
[22]SHANNODF.Conditoning ofquasi-Newtonmethods for function minimization[J].Mathematicsof Computation,1970, 24(111): 647-650.DOI: 10.2307/2004840.
[23] KINGMA D P,BALJ. Adam: a method for stochastic optimization[C]//Proceedingsof Intemnational Conference onLearning Representations. Ithaca: ICLR,2015.
[24] 寧建國,王成,馬天寶.爆炸與沖擊動力學[M].北京:國防工業出版社,2010:347-364. NING JG, WANG C,MA TB.Explosion and shock dynamics [M].Beijing: NationalDefense Industry Press,2010:347- 364.
[25] 童石磊.多介質界面改進數值模擬方法研究[D].綿陽:中國工程物理研究院,2016. TONG SL.Numerical simulation method of multi-media interface [D]. Mianyang: China Academy ofEnginering Physics, 2016.
(責任編輯 王影)