宋凌寒,王 琛,樊健生,2
(1.清華大學(xué)土木工程系,北京 100084;2.清華大學(xué)土木工程安全與耐久教育部重點(diǎn)實(shí)驗(yàn)室,北京 100084)
隨著數(shù)字孿生等信息化、智能化轉(zhuǎn)型理念[1-2]的推廣,以機(jī)器學(xué)習(xí)、深度學(xué)習(xí)為代表的新一代人工智能技術(shù)[3-4]憑借卓越的擬合能力與計(jì)算效率,正吸引越來越多學(xué)者將其應(yīng)用于土木工程結(jié)構(gòu)計(jì)算方向,以期超越傳統(tǒng)計(jì)算模型的性能表現(xiàn),追求實(shí)現(xiàn)工程結(jié)構(gòu)在數(shù)字世界的高效仿真。
目前結(jié)構(gòu)智能計(jì)算領(lǐng)域的研究已覆蓋工程結(jié)構(gòu)各個(gè)層次,例如:在材料層次,CHOU 等[5]根據(jù)試驗(yàn)和模擬數(shù)據(jù),采用多種機(jī)器學(xué)習(xí)方法預(yù)測了混凝土材料強(qiáng)度;FREITAG 等[6]運(yùn)用循環(huán)神經(jīng)網(wǎng)絡(luò)模型(RNN)作為有限元方法的補(bǔ)充,計(jì)算了工程材料在帶隨機(jī)擾動(dòng)輸入下的時(shí)變效應(yīng);王琛和樊健生[7]進(jìn)一步提出了適用于具有歷史依賴效應(yīng)的力學(xué)響應(yīng)預(yù)測通用深度學(xué)習(xí)模型,首次將Transformer 架構(gòu)及注意力機(jī)制[8]應(yīng)用于結(jié)構(gòu)計(jì)算分析領(lǐng)域。在構(gòu)件層次,F(xiàn)ENG 等[9]采用集成學(xué)習(xí)方法預(yù)測鋼筋混凝土柱的塑性鉸長度;ABAMBRES和LANTSOGHT[10]運(yùn)用深度神經(jīng)網(wǎng)絡(luò)(Deep neural network, DNN)模型,根據(jù)287 組試驗(yàn)數(shù)據(jù)估算集中荷載下混凝土單向板的抗剪承載力;韓小雷等[11]提出了深度學(xué)習(xí)輔助的鋼筋混凝土梁集中塑性鉸模型,智能預(yù)測人工本構(gòu)模型骨架線的關(guān)鍵特征點(diǎn),進(jìn)而實(shí)現(xiàn)滯回曲線的模擬;張翀等[12]則針對(duì)結(jié)構(gòu)的數(shù)據(jù)特征工程提出了一種特征處理無量綱化算法,準(zhǔn)確預(yù)測了鋼筋混凝土柱雙向壓彎的屈服承載力。在體系層次,程詩焱等[13]提出了基于BP 神經(jīng)網(wǎng)絡(luò)的地震易損性曲面分析方法,可預(yù)測地震動(dòng)輸入下RC 框架結(jié)構(gòu)的損傷指標(biāo);許澤坤和陳雋[14]基于長短期記憶(LSTM)提出了計(jì)算非線性結(jié)構(gòu)地震響應(yīng)的網(wǎng)絡(luò)架構(gòu);TORKY 和OHNO[15]運(yùn)用混合深度學(xué)習(xí)技術(shù)分析了結(jié)構(gòu)體系在多波段輸入地震波下的非線性響應(yīng);鄭秋怡等[16]將LSTM運(yùn)用于大跨橋梁的溫度-位移預(yù)測模型。
類似的研究已在許多結(jié)構(gòu)計(jì)算場景取得了寶貴的研究成果。然而,考慮到結(jié)構(gòu)體系分析是工程中的重中之重,目前結(jié)構(gòu)智能計(jì)算在體系層次的研究與應(yīng)用仍存在以下局限性:1) 數(shù)字化表征手段缺失,上述結(jié)構(gòu)智能計(jì)算方法只能應(yīng)用于特定的可進(jìn)行自由度凝聚的結(jié)構(gòu)體系,例如固定截面配置的常規(guī)混凝土框架等,事實(shí)上,結(jié)構(gòu)體系層次由于繁復(fù)的拓?fù)溥B接關(guān)系與組成構(gòu)件布置,其特征復(fù)雜度相較于材料與構(gòu)件層次呈指數(shù)上升,目前線性的數(shù)據(jù)組織方式無法完整描述結(jié)構(gòu)體系的完整特征;2) 面臨嚴(yán)重的數(shù)據(jù)匱乏問題,上述智能計(jì)算模型采用的均為數(shù)據(jù)驅(qū)動(dòng)模式,依賴大量的數(shù)據(jù)訓(xùn)練和參數(shù)調(diào)整,而體系層次試驗(yàn)數(shù)據(jù)少,數(shù)據(jù)生成成本高,存在嚴(yán)重的數(shù)據(jù)匱乏和參數(shù)不完備問題,導(dǎo)致以大數(shù)據(jù)為驅(qū)動(dòng)邏輯的經(jīng)典智能模型適用性差;3) 計(jì)算結(jié)果理論正確性難以保證,基于數(shù)據(jù)驅(qū)動(dòng)的智能模型其推理過程是一個(gè)黑匣子,忽視了結(jié)構(gòu)工程鮮明的力學(xué)意義,研究者與工程人員難以根據(jù)部分測試結(jié)果判斷模型的正確性,這對(duì)于以安全性為首要目標(biāo)的工程應(yīng)用而言是無法接受的。
為解決上述問題并填補(bǔ)相關(guān)研究空白,本文將以彈性結(jié)構(gòu)體系為初步研究對(duì)象,創(chuàng)新提出理論驅(qū)動(dòng)的圖神經(jīng)網(wǎng)絡(luò)計(jì)算模型StructGNN-E(Structural analysis based on graph neural networkelastic),以適用于任意桿系結(jié)構(gòu)體系的彈性內(nèi)力分析。本文研究內(nèi)容組織如下:第1 節(jié)理論分析了DNN 等常規(guī)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)在體系層次的不適用性,提出了基于非歐數(shù)據(jù)結(jié)構(gòu)的結(jié)構(gòu)體系數(shù)字化表征方法;第2 節(jié)詳細(xì)介紹了StructGNN-E 模型的基本原理,并對(duì)其中采用的圖神經(jīng)網(wǎng)絡(luò)架構(gòu)和理論驅(qū)動(dòng)范式進(jìn)行了闡釋;第3 節(jié)開展了一系列數(shù)值試驗(yàn),以檢驗(yàn)?zāi)P驮诓煌Y(jié)構(gòu)體系規(guī)模下的計(jì)算精度與計(jì)算效率;第4 節(jié)通過對(duì)比算例討論了體系層次場景下常規(guī)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和純粹數(shù)據(jù)驅(qū)動(dòng)模式的局限性,進(jìn)一步闡釋StructGNN-E 的有效性與合理性。
結(jié)構(gòu)計(jì)算分析的機(jī)理可抽象為在已知結(jié)構(gòu)屬性S=(C1,C2,···,Cm)和外界輸入作用I=(Xt0,Xt1,···,Xtn)下,預(yù)測滿足物理定律的結(jié)構(gòu)響應(yīng)O=(Yt0,Yt1,···,Ytn)。在結(jié)構(gòu)體系層次,結(jié)構(gòu)自身屬性Ci包括空間拓?fù)潢P(guān)系、截面屬性、材料性質(zhì)等,Xti/Yti表示研究關(guān)注的輸入/輸出指標(biāo),如荷載、位移等,其中下標(biāo)t表示關(guān)注的時(shí)刻。結(jié)構(gòu)智能計(jì)算的目標(biāo)即是利用人工智能技術(shù)建立已知條件(S,I)與響應(yīng)O之間的映射關(guān)系。
目前,在體系層次的結(jié)構(gòu)智能計(jì)算研究往往只關(guān)注外界輸入I,卻鮮有考慮甚至是忽略了結(jié)構(gòu)自身屬性S,導(dǎo)致模型的通用性和泛化能力不足。結(jié)合經(jīng)典結(jié)構(gòu)數(shù)值研究與工程設(shè)計(jì)經(jīng)驗(yàn),結(jié)構(gòu)體系層次的完整特征屬性可以歸納為兩方面:1) 拓?fù)溥B接關(guān)系,結(jié)構(gòu)體系包含大量結(jié)構(gòu)構(gòu)件,其位置信息以及相互之間的連接關(guān)系構(gòu)成了結(jié)構(gòu)體系最直觀的特征信息,同時(shí)也是外界輸入作用I的物理載體;2) 組成構(gòu)件屬性,梁、柱等結(jié)構(gòu)構(gòu)件作為結(jié)構(gòu)體系的基本組成部分,其自身屬性,例如截面尺寸、材料性質(zhì)等,會(huì)顯著影響結(jié)構(gòu)體系內(nèi)部的傳力機(jī)制以及整體的力學(xué)響應(yīng)。與常規(guī)的線性數(shù)據(jù)結(jié)構(gòu)(例如文本序列、圖片像素等)相比,結(jié)構(gòu)體系的特征數(shù)據(jù)具有如下特點(diǎn):1) 非序列性,即結(jié)構(gòu)體系各構(gòu)成要素之間難以定義固定的前后關(guān)聯(lián)順序,不存在具有物理意義的起始點(diǎn)與終點(diǎn),因此無法應(yīng)用RNN 等序列模型;2) 非平移不變性,結(jié)構(gòu)體系由于受到建筑功能、構(gòu)件布置等因素影響,在不同的空間位置很難維持固定的鄰域結(jié)構(gòu),因此,既無法確定輸入特征維度,也無法類似網(wǎng)格數(shù)據(jù)(例如圖像等)定義卷積核,導(dǎo)致DNN 與CNN 模型失效。綜上所述,現(xiàn)有研究所采用的DNN、CNN、RNN 等常規(guī)深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)均不適用于處理結(jié)構(gòu)體系問題。
為完整刻畫結(jié)構(gòu)體系層次的數(shù)據(jù)特征,本文引入非歐幾里得數(shù)據(jù)結(jié)構(gòu)——圖數(shù)據(jù)來實(shí)現(xiàn)對(duì)任意結(jié)構(gòu)體系的數(shù)字化表征。具體而言,我們將采用無向圖進(jìn)行結(jié)構(gòu)體系描述:
式中:V為節(jié)點(diǎn);E為節(jié)點(diǎn)之間的邊,對(duì)應(yīng)到結(jié)構(gòu)體系中,可用節(jié)點(diǎn)與邊分別表示結(jié)構(gòu)節(jié)點(diǎn)位置與相連構(gòu)件。例如:框架體系中V表征梁柱節(jié)點(diǎn),E表征梁、柱等構(gòu)件;剪力墻體系中可用V表征邊框節(jié)點(diǎn),E表征內(nèi)嵌鋼板特征等。拓?fù)潢P(guān)聯(lián)矩陣(topological adjacency matrix)A表征節(jié)點(diǎn)間的連接關(guān)系,其元素Ai,j取0 時(shí)表示節(jié)點(diǎn)i與j之間沒有構(gòu)件連接,取有效值時(shí)可表征連接構(gòu)件的截面、剛度等屬性,研究者可以根據(jù)需要靈活調(diào)整各元素的表達(dá)形式。以圖1 的平面框架結(jié)構(gòu)為例,其拓?fù)潢P(guān)聯(lián)矩陣可表示為:

圖1 某平面框架結(jié)構(gòu)示意圖Fig.1 Illustration of a planar frame structure
式中:對(duì)角元素Ai,i表示節(jié)點(diǎn)i的邊界條件;上三角元素Ai,j表示節(jié)點(diǎn)i、j間連接構(gòu)件的抗彎剛度;下三角元素Aj,i則表示軸向剛度,從而充分利用無向圖關(guān)聯(lián)矩陣的對(duì)稱性節(jié)省存儲(chǔ)空間。
此外,節(jié)點(diǎn)V還可囊括前文所述的Xti/Yti等輸入/輸出指標(biāo),從而用無向圖G充分表征研究的結(jié)構(gòu)體系,并將結(jié)構(gòu)計(jì)算抽象為G在不同狀態(tài)間的轉(zhuǎn)換問題。為了適配非線性的圖數(shù)據(jù)結(jié)構(gòu)表征方法,本文將引入圖神經(jīng)網(wǎng)絡(luò)(Graph neural network,GNN)[17-18]以代替常規(guī)深度學(xué)習(xí)模型,通過信息傳遞(Message passing)機(jī)制實(shí)現(xiàn)結(jié)構(gòu)體系內(nèi)力計(jì)算,契合結(jié)構(gòu)體系的非序列性與非平移不變性。
考慮到大部分工程結(jié)構(gòu)在設(shè)計(jì)階段均采用彈性設(shè)計(jì)方案,同時(shí)彈性情形也是體系非線性智能計(jì)算研究的基礎(chǔ),能夠?yàn)槠涮峁╆P(guān)鍵技術(shù)方案。因此,本文將以彈性結(jié)構(gòu)體系作為研究對(duì)象。
基于結(jié)構(gòu)體系的圖數(shù)據(jù)結(jié)構(gòu)表示,本節(jié)引入同構(gòu)圖神經(jīng)網(wǎng)絡(luò)(Graph isomorphism network, GIN)架構(gòu)[19]建立了適用于彈性結(jié)構(gòu)體系內(nèi)力分析的深度學(xué)習(xí)模型StructGNN-E(Structural Analysis based on Graph Neural Network - Elastic)。模型的整體結(jié)構(gòu)如圖2 所示:首先將已知的結(jié)構(gòu)體系信息預(yù)處理后轉(zhuǎn)化為圖結(jié)構(gòu)數(shù)據(jù),輸入GIN 模型,其中每一層都考慮周邊相連節(jié)點(diǎn)的信息傳遞,可以由拓?fù)潢P(guān)聯(lián)矩陣計(jì)算,即模擬受力結(jié)構(gòu)的內(nèi)力分配,并采用MLP 作為聚合函數(shù),ReLU[20]作為激活函數(shù);輸出的位移、內(nèi)力等數(shù)據(jù)信息用于計(jì)算是否滿足物理約束(三大基本方程),作為損失函數(shù)回傳梯度到網(wǎng)絡(luò)中間層,根據(jù)梯度下降算法優(yōu)化網(wǎng)絡(luò)參數(shù),再進(jìn)行下一輪循環(huán)迭代。

圖2 StructGNN-E 模型結(jié)構(gòu)示意圖Fig.2 Architecture of StructGNN-E model
以下將詳細(xì)說明模型的組成結(jié)構(gòu)和主要算法。
圖神經(jīng)網(wǎng)絡(luò)是最常用于處理圖結(jié)構(gòu)數(shù)據(jù)的深度學(xué)習(xí)模型,其基本思路是鄰域聚合策略(neighborhood aggregation strategy),即對(duì)每個(gè)節(jié)點(diǎn)聚合其鄰節(jié)點(diǎn)的特征信息,往復(fù)迭代實(shí)現(xiàn)對(duì)整個(gè)圖結(jié)構(gòu)信息的充分表達(dá)。一般的GNN 包含兩個(gè)重要組成部分[18]:1) 聚合函數(shù)(用AGG(·)表達(dá)):決定鄰域信息的聚合方式;2) 信息傳遞函數(shù)(用COM(·)表達(dá)):決定信息傳遞如何至下一層。一般的,圖神經(jīng)網(wǎng)絡(luò)包含若干層,即每個(gè)節(jié)點(diǎn)可以延伸的層數(shù),第k層可寫作:

圖3 2 層GNN 模型示意圖Fig.3 Architecture of GNN model with 2 hops
StructGNN-E 模型所采用的GIN 網(wǎng)絡(luò)是XU等[19]在一般GNN 基礎(chǔ)上提出的同構(gòu)圖神經(jīng)網(wǎng)絡(luò),被證明具有較強(qiáng)的表達(dá)能力,其中AGG(·)對(duì)節(jié)點(diǎn)信息進(jìn)行直接求和,COM(·)則選取多層感知機(jī)(Multi-layer perceptron,MLP),即:
具體而言,本模型中的GIN 網(wǎng)絡(luò)第k層可寫作:
式中,Av,u為拓?fù)潢P(guān)聯(lián)矩陣A的對(duì)應(yīng)元素。由于一般框架結(jié)構(gòu)的拓?fù)湫再|(zhì),實(shí)踐中取k=2~5 可保證節(jié)點(diǎn)充分獲取周邊的信息,同時(shí)避免過度平滑問題(Over-smoothing)[21]。GIN 網(wǎng)絡(luò)的各個(gè)節(jié)點(diǎn)輸入?yún)?shù)包括節(jié)點(diǎn)坐標(biāo)(初始位移)和荷載條件,輸出參數(shù)包括實(shí)際位移、構(gòu)件內(nèi)力和支座反力,通過鄰域聚合策略,各節(jié)點(diǎn)綜合周圍節(jié)點(diǎn)的信息,近似于“模擬”內(nèi)力的分配和傳遞,適應(yīng)一般框架的結(jié)構(gòu)特點(diǎn),并可根據(jù)研究者的需要調(diào)整。
如引言所述,傳統(tǒng)的深度學(xué)習(xí)方法需要試驗(yàn)或有限元生成數(shù)據(jù)以訓(xùn)練網(wǎng)絡(luò)參數(shù),即有監(jiān)督的學(xué)習(xí)過程[1]。然而,在體系層次,結(jié)構(gòu)體系試驗(yàn)數(shù)據(jù)量極為匱乏,而通過精細(xì)有限元模型等傳統(tǒng)計(jì)算方法生成數(shù)據(jù)所需時(shí)間開銷大,且不可能覆蓋各種構(gòu)件布置與截面屬性。同時(shí),常規(guī)數(shù)據(jù)驅(qū)動(dòng)的人工智能模型,其推理過程不具有可解釋性,忽視了結(jié)構(gòu)工程的力學(xué)背景,導(dǎo)致研究者與工程人員無法判別計(jì)算結(jié)果的正確性。為此,StructGNN-E模型將提出基于三大力學(xué)方程的理論驅(qū)動(dòng)模式,擺脫對(duì)于標(biāo)簽訓(xùn)練數(shù)據(jù)的依賴,并保證深度學(xué)習(xí)模型推理結(jié)果的理論正確性。
具體而言,根據(jù)彈性結(jié)構(gòu)力學(xué),宏觀平衡方程、變形協(xié)調(diào)方程以及彈性本構(gòu)方程這三大力學(xué)方程具有理論完備性,即在彈性情形下,結(jié)構(gòu)體系各處若同時(shí)滿足三大方程,則其內(nèi)力分布是正確且唯一的。得益于圖數(shù)據(jù)結(jié)構(gòu)表征方法,在各個(gè)節(jié)點(diǎn)處,可以同時(shí)維護(hù)協(xié)調(diào)的平動(dòng)自由度與可分離的轉(zhuǎn)動(dòng)自由度(即可視構(gòu)件連接方式為鉸接或剛接等情形進(jìn)行調(diào)控),因此自然滿足變形協(xié)調(diào)方程。構(gòu)件的彈性本構(gòu)關(guān)系則可借助式(2)的拓?fù)潢P(guān)聯(lián)矩陣或邊屬性特征進(jìn)行存儲(chǔ)。因此,在模型求解過程中,僅需關(guān)注宏觀平衡方程,并可依此構(gòu)造優(yōu)化目標(biāo):
式中:Fin為模型計(jì)算的節(jié)點(diǎn)內(nèi)力;Fex為外部輸入的荷載;||·||2為L2 范數(shù)(MSE Loss)。
區(qū)別于訓(xùn)練—測試—泛化應(yīng)用的常規(guī)數(shù)據(jù)驅(qū)動(dòng)智能模型范式,在理論驅(qū)動(dòng)模式下,模型的訓(xùn)練過程即對(duì)應(yīng)求解過程,模型收斂則代表著求解完成,并由前述三大方程的理論完備性保證計(jì)算結(jié)果的正確性。
梳理上述流程可以發(fā)現(xiàn),理論驅(qū)動(dòng)模式無需標(biāo)簽數(shù)據(jù),從根本上緩解了體系層次數(shù)據(jù)嚴(yán)重匱乏的問題,且對(duì)待模擬的結(jié)構(gòu)體系沒有任何限制,具有極強(qiáng)的通用性。同時(shí),其求解信息完全依賴于底層圖數(shù)據(jù)表示的拓?fù)湫畔鬟f,充分發(fā)揮了非線性數(shù)據(jù)結(jié)構(gòu)的優(yōu)勢,從力學(xué)意義上可直觀理解為通過深度學(xué)習(xí)技術(shù)進(jìn)行自動(dòng)識(shí)別體系內(nèi)部的傳力路徑,實(shí)現(xiàn)體系內(nèi)力分析。
為了快速檢驗(yàn)StructGNN-E 模型的計(jì)算效果,本節(jié)采用多層平面框架結(jié)構(gòu)開展數(shù)值試驗(yàn)。
根據(jù)框架結(jié)構(gòu)的特點(diǎn),設(shè)計(jì)了可根據(jù)研究需要隨機(jī)生成平面框架結(jié)構(gòu)的子程序,可人為設(shè)置層數(shù)、跨數(shù)、截面等參數(shù),生成框架數(shù)據(jù),并轉(zhuǎn)化為StructGNN-E 模型可操作的拓?fù)潢P(guān)聯(lián)矩陣,提供給模型進(jìn)行訓(xùn)練求解。例如,生成某14 層5 跨帶支撐辦公樓框架結(jié)構(gòu),各構(gòu)件均采用焊接Q355B 工字鋼板材,彈性模量均取200 GPa,如圖4所示;外界荷載同樣可根據(jù)需要隨機(jī)生成,并施加在任意位置。試驗(yàn)中框架節(jié)點(diǎn)數(shù)N可直觀反映結(jié)構(gòu)的規(guī)模,也表征了模型的網(wǎng)絡(luò)規(guī)模。以下將在節(jié)點(diǎn)數(shù)N=10、100、1000 的不同問題規(guī)模下,檢驗(yàn)StructGNN-E 模型的有效性與性能表現(xiàn)。

圖4 典型試驗(yàn)框架示意圖 /mmFig.4 Illustration of a typical frame model
為更清晰地闡述算法流程,以圖1 所示的框架結(jié)構(gòu)為例進(jìn)行說明:
1) 輸入結(jié)構(gòu)基本信息,提取節(jié)點(diǎn)坐標(biāo)(xv,yv)和拓?fù)潢P(guān)聯(lián)矩陣A(式(2));對(duì)于節(jié)點(diǎn)規(guī)模較小的情形,將坐標(biāo)與節(jié)點(diǎn)荷載Fex直接拼接作為輸入:
設(shè)定輸出為節(jié)點(diǎn)位移增量(平面框架情形):
2) 構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu),通過輸入線性變換層Linear1得到GIN 的節(jié)點(diǎn)輸入(即式(7)的初始輸入):
通過GIN 進(jìn)行鄰域聚合,并選用ReLU 函數(shù)激活,2-hop 情形下簡化為:
再通過輸出線性變換層Linear2得到最終輸出:
3) 計(jì)算損失,主要通過式(8)確定的節(jié)點(diǎn)平衡方程控制輸出的準(zhǔn)確性,其中節(jié)點(diǎn)荷載Fex由輸入決定,節(jié)點(diǎn)內(nèi)力Fin=(Fx,Fy,M)則根據(jù)模型輸出的位移增量計(jì)算。
4) 通過Pytorch 平臺(tái)的自動(dòng)計(jì)算梯度技術(shù)回傳損失,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),再迭代2)~ 4)過程直至結(jié)果滿足要求。
試驗(yàn)中根據(jù)不同規(guī)模的結(jié)構(gòu),分別建立對(duì)應(yīng)規(guī)模的StructGNN-E 模型,圖神經(jīng)網(wǎng)絡(luò)部分包括1 層輸入變換線性層、2 層(2-hops)GIN 和1 層輸出變換線性層,基本模型參數(shù)如表1 所示,可見參數(shù)總量P與問題規(guī)模N大致滿足P∝N0.58。

表1 模型參數(shù)選取Table 1 Setup of model parameters
模型的優(yōu)化器采用Adam 算法[22],參數(shù)默認(rèn)值β1=0.9 , β2=0.999,?=10-8,初始學(xué)習(xí)率為0.01,并根據(jù)迭代周期(epoch)遞減;損失函數(shù)考慮到計(jì)算效率和結(jié)果平滑度,采用MSE 損失函數(shù)。由于計(jì)算無需訓(xùn)練數(shù)據(jù),不考慮批次(batch)劃分,對(duì)每個(gè)模型隨機(jī)生成100 種荷載輸入工況進(jìn)行計(jì)算,每種工況下當(dāng)epoch 數(shù)達(dá)到10 000 或計(jì)算損失低于1%時(shí)停止迭代。
模型基于Pytorch 平臺(tái)實(shí)現(xiàn),考慮到后續(xù)將與SAP2000 等傳統(tǒng)有限元計(jì)算軟件進(jìn)行對(duì)比,僅使用i7-8700 CPU 進(jìn)行訓(xùn)練求解。
針對(duì)不同規(guī)模的框架在隨機(jī)外荷載輸入的情況下,模型的計(jì)算準(zhǔn)確性穩(wěn)定在99%左右,圖5展示了不同規(guī)模問題下最優(yōu)模型平均的計(jì)算精度和迭代周期的關(guān)系,可見隨結(jié)構(gòu)規(guī)模增大,雖然收斂速度有所降低,但均能達(dá)到高精度指標(biāo)。

圖5 不同規(guī)模的平均收斂情況Fig.5 Average convergence curves for different scales
對(duì)同一節(jié)點(diǎn)規(guī)模的結(jié)構(gòu),試驗(yàn)了模型隱藏層參數(shù)取值對(duì)計(jì)算收斂能力的影響,如圖6~圖8 所示??梢?,一定范圍內(nèi),模型參數(shù)量越大,最終準(zhǔn)確度越高,且收斂到同一精度所需的迭代次數(shù)降低。

圖6 N=10 時(shí)不同參數(shù)規(guī)模的收斂情況Fig.6 Average convergence curves with different models(N=10)

圖7 N =100 時(shí)不同參數(shù)規(guī)模的收斂情況Fig.7 Average convergence curves with different models(N=100)

圖8 N =1000 時(shí)不同參數(shù)規(guī)模的收斂情況Fig.8 Average convergence curves with different models(N=1000)
選取N=100 的計(jì)算結(jié)果與SAP2000 軟件v20.0版本建模進(jìn)行對(duì)比,繪制彎矩分布圖和虛功(內(nèi)力乘以變形)值分布圖,如圖9、圖10 所示。由圖可見,模型的計(jì)算精度與有限元軟件基本沒有差異,達(dá)到結(jié)構(gòu)分析的需求。

圖9 彎矩分布圖對(duì)比Fig.9 Comparison of moment diagrams

圖10 虛功分布圖對(duì)比Fig.10 Comparison of virtual work diagram
試驗(yàn)中針對(duì)不同規(guī)模問題,每組隨機(jī)生成20 個(gè)結(jié)構(gòu),記錄了模型的平均計(jì)算時(shí)間(單位:s,同一臺(tái)設(shè)備上以精度達(dá)到99%為準(zhǔn)),并與結(jié)構(gòu)工程計(jì)算常用的SAP2000 有限元軟件[23]進(jìn)行對(duì)比,如表2 所示,可見在小規(guī)模問題上,StructGNN-E模型的計(jì)算效率與之相差不大,略低于SAP2000軟件;但隨著規(guī)模增大,SAP2000 軟件的計(jì)算開銷迅速增加,而StructGNN-E 模型則增速低于前者,當(dāng)問題規(guī)模達(dá)到10 000 節(jié)點(diǎn)時(shí),StructGNN-E 的平均計(jì)算效率超過SAP2000 軟件36%。因此,深度學(xué)習(xí)模型在實(shí)際復(fù)雜工程中具有可觀的應(yīng)用價(jià)值。

表2 模型收斂時(shí)間對(duì)比Table 2 Comparison of convergence time
綜上所述,本數(shù)值試驗(yàn)驗(yàn)證了StructGNN-E模型的有效性,證明其能夠高精度求解任意規(guī)模的桿系結(jié)構(gòu)彈性內(nèi)力分析問題,且計(jì)算時(shí)間開銷隨問題規(guī)模上升緩于傳統(tǒng)計(jì)算方法,從而可在實(shí)際工程應(yīng)用中的大規(guī)模結(jié)構(gòu)分析場景下實(shí)現(xiàn)計(jì)算效率的大幅提升。
與已有體系層面的研究方法不同,StructGNN-E模型沒有采用最常見的深度神經(jīng)網(wǎng)絡(luò)模型(DNN),而是采用了更符合結(jié)構(gòu)拓?fù)湫再|(zhì)的圖神經(jīng)網(wǎng)絡(luò)(GNN)。從數(shù)據(jù)角度而言,DNN 適合處理類似文本、向量的一維數(shù)據(jù)(CNN 則針對(duì)二維以上的歐式定義數(shù)據(jù)),需要將結(jié)構(gòu)體系輸入轉(zhuǎn)化為向量或矩陣,例如將所有框架節(jié)點(diǎn)按順序排列,如圖11所示,但這種傳統(tǒng)方法的弊端在于丟失了結(jié)構(gòu)的拓?fù)湫畔?,?shù)據(jù)經(jīng)過DNN 的映射難以得到符合力學(xué)原理的計(jì)算結(jié)果。其本質(zhì)可能在于,DNN 的隱藏層建立了所有節(jié)點(diǎn)之間的聯(lián)系,相當(dāng)于拓?fù)潢P(guān)聯(lián)矩陣的所有項(xiàng)均非零,而實(shí)際情況下結(jié)構(gòu)中的很多節(jié)點(diǎn)主要受臨近節(jié)點(diǎn)影響,拓?fù)潢P(guān)聯(lián)矩陣的非零項(xiàng)主要集中于對(duì)角線附近。

圖11 DNN 與GNN 模式對(duì)比Fig.11 Comparison of DNN and GNN frameworks
此外,將結(jié)構(gòu)信息直接整合為一維數(shù)據(jù),大規(guī)模結(jié)構(gòu)問題中往往出現(xiàn)維度爆炸,導(dǎo)致神經(jīng)網(wǎng)絡(luò)臃腫而降低計(jì)算效率和收斂能力。為驗(yàn)證論述,將StructGNN-E 模型中的GNN 模塊替代成參數(shù)量相近的DNN 模塊進(jìn)行對(duì)比試驗(yàn),收斂曲線如圖12 所示,可見相近參數(shù)量的訓(xùn)練情況下,同一規(guī)模問題中DNN 模型無法收斂到可接受精度,因此,可證明DNN 不適用于結(jié)構(gòu)體系層次的內(nèi)力分析。

圖12 DNN 與GNN 收斂曲線對(duì)比Fig.12 Comparison of convergence curves of DNN and GNN
為了進(jìn)一步論證理論驅(qū)動(dòng)方案在體系層次的合理性,采用SAP2000 軟件生成2 組共1000 條帶標(biāo)記數(shù)據(jù)訓(xùn)練模型,其中:第一組,500 條數(shù)據(jù)為問題規(guī)模N=10 的不同結(jié)構(gòu)體系,輸入為每個(gè)結(jié)構(gòu)體系的信息和一種隨機(jī)荷載工況,輸出為SAP2000軟件計(jì)算得到的對(duì)應(yīng)節(jié)點(diǎn)位移D;第二組,500 條數(shù)據(jù)的問題規(guī)模N=100,輸入信息與第一組相仿。純數(shù)據(jù)驅(qū)動(dòng)模式下,對(duì)每組數(shù)據(jù)按照3∶1∶1的比例劃分訓(xùn)練集、驗(yàn)證集和測試集;理論驅(qū)動(dòng)模式下,將數(shù)據(jù)的標(biāo)記結(jié)果D舍去,直接計(jì)算各個(gè)問題的結(jié)果進(jìn)行對(duì)比。
表3 給出了純數(shù)據(jù)驅(qū)動(dòng)模型學(xué)習(xí)結(jié)果與StructGNN-E 模型的對(duì)比(模型參數(shù)基本相同),結(jié)果表明,純粹數(shù)據(jù)驅(qū)動(dòng)模型雖然在訓(xùn)練集上實(shí)現(xiàn)了收斂,但不具有泛化性,無法應(yīng)用于訓(xùn)練集以外的具有不同拓?fù)溥B接方式的結(jié)構(gòu)體系,因此計(jì)算結(jié)果完全依賴于訓(xùn)練集的優(yōu)劣;而理論驅(qū)動(dòng)模式則不同于傳統(tǒng)的訓(xùn)練-測試模式,模型訓(xùn)練的本身即問題求解,因此可以避免搜集和標(biāo)記大量數(shù)據(jù)的過程[24],直接針對(duì)待研究結(jié)構(gòu)進(jìn)行計(jì)算。

表3 純數(shù)據(jù)驅(qū)動(dòng)模式與理論驅(qū)動(dòng)模式對(duì)比Table 3 Comparison of data-driven mode and physicsinformed mode
綜上所述,在結(jié)構(gòu)體系層次,經(jīng)典的DNN 等智能模型以及純數(shù)據(jù)驅(qū)動(dòng)模式均不具有適用性,而理論驅(qū)動(dòng)的StructGNN-E 可以突破常規(guī)智能技術(shù)的局限,捕捉并處理結(jié)構(gòu)體系的拓?fù)溥B接信息,無需依賴底層數(shù)據(jù)分布,實(shí)現(xiàn)對(duì)任意桿系結(jié)構(gòu)體系的彈性內(nèi)力分析。進(jìn)一步針對(duì)非線性彈塑性問題,可以考慮結(jié)合數(shù)據(jù)驅(qū)動(dòng)和理論驅(qū)動(dòng)的優(yōu)點(diǎn)構(gòu)建混合驅(qū)動(dòng)模式。
本文分析了體系層面結(jié)構(gòu)智能計(jì)算問題的特性,基于圖神經(jīng)網(wǎng)絡(luò)提出了一個(gè)適用于常見桿系結(jié)構(gòu)體系的彈性計(jì)算模型StructGNN-E。模型可以充分表征體系中構(gòu)件的拓?fù)潢P(guān)系,并借鑒理論驅(qū)動(dòng)神經(jīng)網(wǎng)絡(luò)的思想,利用平衡條件、本構(gòu)關(guān)系等物理方程構(gòu)造參數(shù)迭代的損失函數(shù),從而優(yōu)化求解空間,通過不依賴于數(shù)據(jù)訓(xùn)練的理論驅(qū)動(dòng)架構(gòu)求解彈性范圍的內(nèi)力分析問題。主要研究結(jié)論有:
(1) 結(jié)構(gòu)體系層次需要同時(shí)考慮拓?fù)溥B接關(guān)系與組成構(gòu)件屬性,具有非序列性與非平移不變性,無法采用DNN、CNN、RNN 等常規(guī)深度學(xué)習(xí)模型進(jìn)行表征與處理。
(2) 引入了非歐的圖數(shù)據(jù)結(jié)構(gòu)以刻畫結(jié)構(gòu)體系信息,建立了結(jié)構(gòu)體系拓?fù)潢P(guān)系與構(gòu)件布置到圖數(shù)據(jù)結(jié)構(gòu)元素的映射關(guān)系,實(shí)現(xiàn)了對(duì)任意桿系結(jié)構(gòu)體系的高保真數(shù)字化。
(3) 基于圖神經(jīng)網(wǎng)絡(luò)建立了智能計(jì)算模型StructGNN-E,并提出了適用于結(jié)構(gòu)體系層次的理論驅(qū)動(dòng)模式,實(shí)現(xiàn)了無外部標(biāo)簽數(shù)據(jù)情形下的體系內(nèi)力分析,克服了體系層次數(shù)據(jù)嚴(yán)重匱乏的問題,并保證了計(jì)算結(jié)果的理論正確性。
(4) 數(shù)值試驗(yàn)證明,StructGNN-E 能夠高精度求解桿系結(jié)構(gòu)體系的內(nèi)力分布,并能夠在實(shí)際大規(guī)模問題計(jì)算中表現(xiàn)出卓越的計(jì)算效率,相較于傳統(tǒng)計(jì)算模型提升可達(dá)36%。
(5) 通過對(duì)比試驗(yàn)說明了DNN、CNN、RNN等常規(guī)深度學(xué)習(xí)模型以及數(shù)據(jù)驅(qū)動(dòng)模式運(yùn)用到體系層次的局限性,深化證明了StructGNN-E 模型的合理性與有效性。