歐 柱,李明剛,聶常華,劉 杰,劉志龍,羅 騫
(中國核動力研究設計院, 成都 610213)
結(jié)構(gòu)可靠性作為產(chǎn)品的重要屬性之一,越來越受到機械行業(yè)的重視。近年來,我國相繼啟動一系列重大工程,如載人空間站、大飛機項目、先進軌道交通、深海探測載人潛水器、航空母艦等。這些重大工程中的服役產(chǎn)品普遍存在缺乏統(tǒng)計數(shù)據(jù),使用環(huán)境惡劣等問題,對可靠性評估提出了更為嚴苛的要求。因此,必須在產(chǎn)品分析與設計環(huán)節(jié)采用更為高效的可靠性分析理論對運行可靠性進行有效評估,否則一旦發(fā)生故障,將造成巨大的經(jīng)濟損失和人員傷亡。
針對機械結(jié)構(gòu)可靠性評估,國內(nèi)外學者提出了很多計算失效概率的方法,如一次二階矩法[1]、重要抽樣法[2]、子集模擬法[3]、方向采樣法[4]、響應面法[5]和蒙特卡洛(Monte Carlo,MC)法[6-7]等。這些方法為結(jié)構(gòu)可靠性理論的發(fā)展作出了巨大貢獻。在結(jié)構(gòu)可靠性評估中,MC法由于其簡潔易懂、適應性強、普適性好而被廣泛使用,而且常常被視為基準算法用來驗證其他方法的計算精度。MC法最大的不足在于計算失效概率時的高計算成本問題,特別是對于非常耗時的有限元計算或其他仿真。因此,對于工程應用,直接采用MC法計算失效概率會面臨巨大的挑戰(zhàn)。
國內(nèi)外大量學者為降低MC法自身不足所帶來的影響,常將MC法和其他數(shù)學理論進行結(jié)合。該方式既確保了MC法的強適應性,又彌補了其自身的不足。其中使用較多的當屬各類代理模型,如Kriging模型[8]、人工神經(jīng)網(wǎng)絡模型[9]、支持向量機(support vector machine,SVM)模型[10]以及混沌多項式模型[11]等。上述代理模型中涉及的人工神經(jīng)網(wǎng)絡模型僅為淺層次學習模型,屬于經(jīng)典機器學習理論的范疇。2006年,Hinton等[12]首次提出的深度學習理論成為了近年來處理數(shù)據(jù)的一把利刃。深度學習是通過模擬大腦的學習過程,構(gòu)造深層次模型,并結(jié)合海量數(shù)據(jù)進行學習,從而刻畫數(shù)據(jù)的有效特征,最終提升分類或預測的精度。相對經(jīng)典機器學習理論,深度學習理論不需要人為提取特征,而是機器自主學習,因此可進行更深層次學習,找到全局最優(yōu)解。深度信念網(wǎng)絡(deep belief network,DBN)作為深度學習的一種代表性方法,可以通過組合低層特征形成更加抽象的高層表示,從而發(fā)現(xiàn)數(shù)據(jù)的分布特征。它從低層原信號出發(fā),逐層貪婪學習獲得高層特征的學習網(wǎng)絡,排除了人為影響。目前,DBN被廣泛運用到故障診斷[13-14]、圖像識別[15]和語音識別[16]等方面,但在結(jié)構(gòu)可靠性評估中應用得較少。鑒于此,本文將DBN模型引入到結(jié)構(gòu)可靠性評估中,詳細闡述了整個評估計算流程,并代入算例,驗證方法的可行性。
本節(jié)首先對DBN物理模型結(jié)構(gòu)進行介紹,接著對DBN參數(shù)結(jié)構(gòu)進行介紹,最后對DBN參數(shù)結(jié)構(gòu)優(yōu)化進行介紹。DBN物理模型結(jié)構(gòu)主要為受限制玻爾茲曼機(restricted Boltzmann machine,RBM)的堆疊過程。DBN預訓練是RBM逐層貪婪訓練過程。本文給出單個RBM參數(shù)訓練過程,其余堆疊的RBM通過類推可得。DBN參數(shù)優(yōu)化過程是每個RBM參數(shù)優(yōu)化過程的堆疊。本文給出最后一個RBM參數(shù)調(diào)優(yōu)過程,其余RBM優(yōu)化過程從最后一個類推到第一個即可得到。
對多個RBM進行堆疊,將前一層的輸出作為后一層的輸入,這樣就構(gòu)成了DBN模型。RBM模型和對應DBN模型如圖1所示。圖1中,每個低層RBM對輸入數(shù)據(jù)進行訓練并輸出到高層RBM作為輸入,逐層傳遞形成完整的DBN結(jié)構(gòu),在最高層形成更抽象、更具有表征能力的特征向量。與反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡相比,DBN的一大優(yōu)勢是將訓練得到的權(quán)值用于初始化其他相同結(jié)構(gòu)的網(wǎng)絡參數(shù),以此避免因隨機初始化參數(shù)而陷入局部最優(yōu)和訓練時間過長的困境。

圖1 RBM模型和對應DBN模型Fig.1 RBM model and corresponding DBN model
對一個完整的DBN模型,其訓練過程分為以下兩步。
①預訓練階段采用無監(jiān)督逐層貪婪訓練的方法,從底層到高層,逐次訓練每層RBM的參數(shù),確保低層特征向量映射到高層特征空間時,盡可能多地保留特征信息。
②經(jīng)過預訓練后,將整個深度網(wǎng)絡視為傳統(tǒng)的BP神經(jīng)網(wǎng)絡,進入有監(jiān)督微調(diào)的階段,即從網(wǎng)絡的高層到低層,根據(jù)誤差的傳播,依次對每層的參數(shù)進行微調(diào),以修正整個DBN的權(quán)值。
對訓練好的DBN模型進行分類,只需要在模型的尾部加一個分類器即可。目前,使用比較多的分類器有softmax和SVM兩種。
DBN的預訓練是RBM的逐層貪婪訓練。因此,本部分僅給出了單個RBM的預訓練。RBM是一種神經(jīng)感知器,由一個顯層和一個隱層構(gòu)成。顯層與隱層的神經(jīng)元之間為雙向全連接。RBM網(wǎng)絡結(jié)構(gòu)如圖2所示。

圖2 RBM網(wǎng)絡結(jié)構(gòu)示意圖Fig.2 RBM network structure diagram
圖2中:v=[v1v2…vNv]為顯層節(jié)點;h=[h1h2…h(huán)Nh]為隱層節(jié)點;W={wij},1≤i≤Nh,1≤j≤Nv為顯層節(jié)點和隱層節(jié)點之間的連接權(quán)重;a=[a1a2…aNv]和b=[b1b2…bNh]分別為顯層節(jié)點和隱層節(jié)點的偏置向量。
RBM的優(yōu)點是所有顯層(隱層)節(jié)點獨立于其他顯層(隱層)節(jié)點,因此可以通過使用基于層的快速學習算法來訓練網(wǎng)絡,例如對比散度方法。
對于一個給定狀態(tài)(v,h)的RBM,可定義其能量函數(shù)為:
(1)
式中:θ為RBM中的參數(shù),θ=(W,a,b)。
狀態(tài)(v,h)下的聯(lián)合概率分布可以根據(jù)吉布斯分布得到:
(2)

由式(2)可得顯層和隱層的邊緣分布為:
(3)
(4)

(5)
為方便求偏導數(shù),式(5)可以改寫為:
(6)
通常,參數(shù)θ是通過最大化訓練集上的對數(shù)似然函數(shù)學習得到的。
(7)

(8)
式中:η為學習參數(shù),η>0。
DBN預訓練主要用于提取數(shù)據(jù)特征,并得到一個大范圍的優(yōu)化解集,即預訓練并不能得到高精度的最優(yōu)解,此時就需要啟用反向微調(diào)算法。DBN反向微調(diào)和BP神經(jīng)網(wǎng)絡反向調(diào)節(jié)方法相同。具體過程如下所述。
網(wǎng)絡的最后一層由Softmax作為分類器,DBN微調(diào)也是從最后一層逐層向前進行的。現(xiàn)假設DBN由l個RBM模型堆疊而成,另有若干個訓練樣本表示為S={v(1),v(2),…,v(T)},v(i)=(x1x2…xm),i=1,2,…,T,T為m維的樣本向量。則最后一層輸出向量為:
(9)
第i個樣本經(jīng)前向l層堆疊RBM學習后,屬于類別yi(yi∈[1,2,…,c])的概率為:
(10)
式中:V為參數(shù)系數(shù),選取最大概率所對應的類別即為Softmax模型判別類型。
第l層誤差函數(shù)表達式為:

(11)
式中:λl為第l層的參數(shù)集合,λl={wl,bl,cl,Vl};l(yi=k)為邏輯指示函數(shù),當yi=k時值為1,當yi≠k時值為0。
為求誤差最小值,使用梯度上升法,對參數(shù)求偏導如下:
(12)
最終進行微調(diào),參數(shù)如式(13)所示:
λl=λl-αλlJ(λl)
(13)
式中:α為學習率。
以此類推,可以微調(diào)1層到l層相關參數(shù)。
在結(jié)構(gòu)可靠性分析當中,通過對隨機變量的聯(lián)合概率密度函數(shù)進行積分,可以得到失效概率的準確值。失效概率的具體積分過程可如式(14)所示:

E[IF(x)]
(14)

但是在復雜的可靠性分析中,因為概率密度函數(shù)極難獲取,所以通常計算失效概率采用的是MC法而不是積分的方法,可以表示為:
(15)
式中:xj為由偽隨機發(fā)生器根據(jù)聯(lián)合概率密度函數(shù)生成的第j個偽隨機樣本點;N為總樣本點數(shù);Nf為失效樣本點數(shù)。

得到訓練模型以后,根據(jù)隨機變量的聯(lián)合概率密度函數(shù)f(x;μ,σ2)生成N個需要的數(shù)據(jù)樣本xj(j=1,2,…,N)。將xj(j=1,2,…,N)代入訓練好的模型并且判斷該樣本是否為失效樣本,并計算失效概率。基于DBN的失效概率估算流程如圖3所示。該流程具體步驟如下。

圖3 基于DBN的失效概率估算流程Fig.3 Estimation process of failure probability based on DBN
②通過極限狀態(tài)函數(shù),可以求出Ntraining個訓練樣本中的失效樣本和安全樣本。
③根據(jù)訓練樣本訓練DBN模型,包括DBN的預訓練和微調(diào)兩部分。
④根據(jù)聯(lián)合分布概率密度函數(shù)f(x;μ,σ2),使用偽隨機數(shù)發(fā)生器生成N個樣本xj(j=1,2,…,N)。利用訓練好的DBN模型代替功能函數(shù)判斷第j個訓練樣本xj(j=1,2,…,N)是否落入安全域。如果它落入安全域,則對應的樣本點標簽為+1,然后判斷下一個樣本點;如果它落入失效域,則對應的樣本點標簽為-1。

(16)
(17)

(18)

為了說明本文所提出算法的精度和效率,將給出一個數(shù)字算例和一個工程算例。數(shù)字算例主要是為了說明該方法的精度,而工程算例則主要是為了說明該方法的效率。
算例1 現(xiàn)有一個非線性功能函數(shù)如下所示:
g(x)=2x1x2x3x4-x5x6x7x8+x9x10x11x12
(19)
式中:xi為服從均值為8、方差為1的正態(tài)分布的變量,即xi~N(8,1)(i=1,…,12)。
對于式(21)中的功能函數(shù),分別使用MC法和建立的DBN模型來求解失效概率、失效概率的標準差,并在此基礎上求得了DBN模型相對于MC法的相對誤差。算例1計算結(jié)果如表1所示。

表1 算例1計算結(jié)果Tab.1 Calculation results of Example 1
表1中,MC法作為一種標準來驗證本文提出的模型,平均失效概率為100次失效概率的平均值,每次進行106次抽樣。DBN每次的訓練樣本個數(shù)為4 000。由表1結(jié)果可知,兩種方法所計算的平均失效概率值很接近,相對誤差不到2%。因此,DBN模型可以運用在結(jié)構(gòu)可靠性分析中。
算例2 現(xiàn)有一個具有兩個極限狀態(tài)函數(shù)的并行系統(tǒng)y=g(x)=max{g1(x),g2(x)}。其中,兩個函數(shù)為y1=g1(x)和y2=g2(x),可以被重新定義為:
(20)
式中:c=4,xi為相互獨立的標準正態(tài)分布變量,即xi~N(0,1),i=1,2。
針對式(22),分別利用MC法和DBN模型去求解失效概率。算例2計算結(jié)果如表2所示。

表2 算例2計算結(jié)果Tab.2 Calculation results of Example 2
表2中的DBN模型利用4 000個訓練樣本點,采用DBN方法進行訓練。其中,平均失效概率為100次失效概率的平均值,每次進行106次抽樣。從表2可以看出,DBN模型與MC法計算出的失效概率非常接近,分別為3.36×10-6和3.35×10-6,相對誤差為0.3%。因此,本文所提出的DBN模型在一定程度上可以替代傳統(tǒng)的MC法。
本實例考慮單擺振蕩問題,并且對擺動的最大振蕩角速度進行研究。最大振蕩角速度不能低于y0=309 rad/s,否則認為鋼棒失效,則相應的功能函數(shù)可以表示為:
y=g(r,L,ρ)-y0
(21)
式中:r、L和ρ分別為鋼棒的半徑(m)、長度(m)以及密度(kg/m3)。這三個變量之間相互獨立,且服從正態(tài)分布,均值分別是μr=0.01、μL=1及μρ=7 930,標準差為σr=10-4、σL=0.007及σρ=0.05。

該算例使用Simulink建立單擺的振蕩模型,其Simulink仿真模型如圖4所示。分別使用MC法和DBN模型對失效概率進行估計,仿真計算結(jié)果如表3所示。由于仿真中利用MC法進行失效概率所花費的時間太長,本算例以105次仿真為例進行說明。

圖4 Simulink仿真模型Fig.4 Simulink simulation model

表3 仿真計算結(jié)果Tab.3 Simulation results
從表3可以看出,以MC法為參考時,DBN模型計算的失效概率與MC法計算的失效概率之間相對誤差僅為1.92%,但是MC法所消耗的計算時間卻約為DBN模型的32倍。這是因為MC法耗費了100 000次仿真時間,而DBN只耗費4 000次仿真時間。為了進一步對比該方法的準確率和效率,分別運用SVM模型和克里金-蒙特卡洛結(jié)合仿真(active Kriging and Monte Carlo simulation,AK-MCS)模型進行對比,可知DBN模型的精度最高,證明所提出的模型極大地提高了問題分析效率。
本文提出的方法在數(shù)字算例中對精度和傳統(tǒng)的MC法進行對比,結(jié)果表明提出的DBN模型有較高的計算精度。
在工程算例中對DBN模型的效率進行了對比,結(jié)果表明提出的DBN模型能夠?qū)鹘y(tǒng)的計算方法效率提高約32倍,和傳統(tǒng)的可靠性評估方法(SVM模型和AK-MCS模型)進行對比,結(jié)果表明所提出的DBN模型精度最高。