王彬文, 呂帥帥, 楊 宇
(中國飛機強度研究所 西安,710065)
近年來,碳纖維增強復合材料由于具有比強度/比剛度高、性能可設計和易于整體成型等優點,被廣泛應用于飛機主承力部件[1]。相比于傳統的金屬結構,CFRP 的主要缺點是對外來物的沖擊敏感,特別是在起降過程中的跑道碎片撞擊,或在維護過程中的工具跌落等低速沖擊,都會造成層壓結構內部大面積分層,結構壓縮強度下降40%以上,但結構外觀通常并不產生目視可見的損傷[2],這就給飛行安全帶來巨大隱患。針對此問題,能夠實時甚至在線對結構狀態進行監測的結構健康監測(structural health monitoring,簡稱SHM)技術為上述問題提供了一條潛力巨大的解決途徑[3]。基于導波的損傷監測技術在結構中能傳播較長距離,且對分層、脫粘和裂紋等損傷敏感[4-5],是目前在航空結構損傷監測領域有前景的一種結構損傷監測方法,已成功應用于商業領域[6]。然而,導波損傷診斷方法對專家經驗具有較強的依賴性。導波信號受結構不確定性、邊界條件和環境溫度等因素的影響較大,損傷診斷的準確性取決于專家水平以及專家對監測對象的先驗知識[7]。
深度學習是解決此類問題一個強有力的工具,研究人員利用深度學習開展了基于導波的結構損傷識別[8-10]、定位和定量研究[11-13]。Guo 等[14]設計了一種可以識別金屬梁結構裂紋損傷的深度學習模型。模型以各振動模態的波形為輸入,使用多尺度卷積神經網絡、殘差網絡和全連接層等結構抑制噪聲和數據缺失的影響,并增強模型的收斂性和魯棒性,其對裂紋長度預測的準確率超過90%。Sbarufatti等[15]開展了基于深度學習的板結構裂紋損傷識別和定量研究,主要工作集中在裂紋損傷數值模擬方法。Xu 等[16]針對由結構不確定性導致的裂紋損傷監測可靠性低的問題,通過對6 個尺寸相同的鋁合金耳片進行疲勞實驗加載,獲取基于真實飛機結構的裂紋損傷導波監測數據。以上2 個深度學習模型的高損傷診斷準確率均是針對驗證集,無法代表模型的泛化能力,且模型本身并沒有對深度學習技術在結構健康監測領域所面臨的限制和挑戰提出解決方法。
筆者提出了一種基于能量圖譜和孿生卷積神經網絡的導波損傷診斷方法,其創新性主要體現在:①使用導波監測網絡的能量圖譜取代傳統的單路徑損傷指數作為損傷診斷樣本,該方法能夠解決單信號作為數據樣本時,樣本標簽質量完全依賴專家水平的問題,同時為深度學習模型提供更加豐富有效的損傷信息;②針對數據樣本量較少的問題,設計了孿生卷積神經網絡,降低了模型對樣本數量的需求,進而在考慮結構不確定性的情況下,實現深度學習模型的高準確率損傷診斷。
筆者使用的CFRP 加筋壁板采用CCF300/BA9916 CFRP,導波監測網絡結構如圖1 所示。損傷監測區域位于紅框內,分為A,B,C,D4 個位置,其中A,C位于兩長桁間的壁板上,B,D位于長桁與壁板粘結處。為了分析導波信號在CFRP 加筋板上的傳播特性,在監測區域布置了9 個壓電傳感器(藍色圓點),每4 個相鄰的壓電傳感器組成一個矩形網絡,包含6 條信號傳播路徑。通過對24 條路徑進行監測,診斷紅框區域是否存在損傷以及損傷的具體位置。

圖1 導波監測網絡結構圖(單位:mm)Fig.1 Structure diagram of Lamb wave monitoring network(unit:mm)
深度學習模型的設計主要分為2 部分:①以壓電傳感器監測網絡為基礎,確定深度學習模型的樣本形式和樣本標注方法,筆者采用壓電監測網絡的能量圖譜作為樣本的基本形式,為準確、便捷的樣本標注提供基礎;②針對樣本特征和數據特點,設計語義提取模型和分類模型,筆者采用孿生策略進行模型設計,以減少模型參數的數量,進而降低模型對訓練樣本數量的需求。
基于導波的結構損傷識別,目前廣泛采用的是針對單路徑,對比分析損傷前后的導波信號特征,采用相應算法計算損傷指數,根據損傷閾值判別[17]損傷。若深度學習模型使用單路徑信號作為樣本,并采用該方法進行標簽標定,則模型的損傷診斷水平會隨著專家水平的變化而變化。這是由于深度學習模型的標簽質量是模型診斷水平高低的決定性因素,標簽標定既可以依賴客觀事實,也可以依賴專家經驗。但是導波信號易受結構、溫濕度、載荷以及路徑與損傷間的距離等因素影響,因此專家經驗也存在不確定性。
實際上,圖1 中區域A,B,C,D內的損傷會對24 條監測路徑中的多條信號產生影響,且損傷位置與信號特征存在對應關系[18]。例如,處于區域A內的位置1 或處于區域B內的位置2 產生分成損傷時,24 條監測路徑散射信號的電壓分布如圖2 所示。筆者運用圖像處理技術,將監測網絡的散射信號電壓分布轉化為能量灰度圖譜,得到24 條監測路徑能量分布的灰度圖像如圖3 所示,并將其作為深度學習模型的樣本。該方法的優勢主要體現為:①將損傷診斷問題轉化為深度學習最善于處理的圖像識別問題;②相比單路徑信號,基于多路徑散射信號的能量圖譜包含了更多的結構狀態信息,易于區分信號變化是由環境因素還是損傷因素產生;③擺脫依靠專家經驗來判斷樣本標簽類型的局限性。
筆者采用監測網絡中24 條路徑散射信號的能量圖譜作為學習樣本,樣本標簽分為0,1,2,3 和4,分別代表監測區域無損傷、損傷位于區域A、區域B、區域C和區域D。
針對CFRP 損傷診斷問題,深度學習模型設計面臨的挑戰主要有2 個:①模型的訓練參數不可過多;②模型能夠提取導波監測信號的高層特征。在深度學習領域,網絡的深度和寬度越大、結構越復雜,就代表需要更多的學習樣本。目前的解決方式是通過數值仿真產生大量的虛擬數據樣本[10],但這對模型的仿真程度提出了更高的要求,且產生的樣本數量依然有限。因此,用于損傷診斷的深度學習模型需保證結構簡潔、參數少。

圖2 24 條監測路徑散射信號的電壓分布Fig.2 The energy distribution of the scattered wave in 24 monitored paths
具有相同構型的加筋壁板對相同損傷產生的導波散射信號也存在較大差別。在實際工程應用中無法直接在監測對象上設計實驗來收集損傷樣本,這就要求深度學習模型能夠在學習數據中提取對結構不確定性敏度較低的高層損傷特征,進而在結構構型相同的不同監測對象上實現高準確率的損傷診斷。
1.2.1 孿生策略
針對圖1 中的加筋壁板和壓電傳感器網絡,導波信號的采樣點個數n通常設置為3000~5000,能量圖譜的尺寸為24n,屬于長寬比失調的圖像樣本。若采用深度學習領域中傳統的圖像識別模型,則必須對該類樣本進行預處理,即將24n的圖片轉換為n×n,以方便卷積核對圖像進行特征提取。然而,圖像尺寸轉換的本質是將24 條監測信號沿圖像寬度方向直接進行堆疊,未引入新的有效損傷信息,卻使圖像像素點數擴大了n/24 倍,進而增加了模型的深度和參數數量。圖4 為圖像尺寸轉換原理,其中,xi為圖像中第i個像素點的像素值。筆者采用孿生策略開展損傷診斷模型設計,孿生模型工作原理如圖5 所示。首先,24 條路徑分別通過24 個共享權值的卷積神經網絡(即24 個孿生網絡)進行語義特征提取;其次,在融合層將提取的所有特征合并;最后,融合特征進入神經網絡分類器進行損傷診斷。與傳統圖像識別模型相比,該模型的優勢在于通過24 個語義提取網絡共享權值,大幅降低了特征提取網絡的參數量,其本質是實現了卷積神經網絡對圖像像素的逐行掃查和綜合診斷。

圖3 24 條監測路徑能量分布的灰度圖像Fig.3 Gray-scale image of the energy distribution of 24 paths monitored

圖4 圖像尺寸轉換原理Fig.4 Principle of image size conversion

圖5 孿生模型工作原理Fig.5 Schematic of the twin model
1.2.2 網絡結構
筆者針對深度學習模型在結構健康監測領域面臨的問題,構建了基于孿生策略的卷積神經網絡。該網絡主要由語義特征提取模型和分類模型2 部分組成,其基本架構分別如圖6,7 所示。

圖6 語義特征提取模型的基本架構Fig.6 The basic architecture of the semantic feature extraction model

圖7 分類模型的基本架構Fig.7 The basic architecture of the classification model
語義特征提取模型采用分布時序特征提取方法。“分布”指的是將一條路徑的監測信號分割成10個數據片段,分別通過同一個CNN 模型來提取局部特征。“時序”指的是在基于“分布”式特征提取之后,將10 個片段的局部特征按時間順序輸入長短記憶網絡(long-short term memory,簡稱LSTM),從而實現各數據片段間的時序趨勢特征提取[19]。筆者使用一個包含32 個神經元的全連接層作為特征提取模型的輸出。其中,CNN 模型包含3 個卷積層和2 個最大池化層。根據模型設計經驗,在深度較小的卷積神經網絡中,每個卷積層通常設置32 或64個卷積核,表示從32 或64 個維度對片段信號進行局部特征提取。通過對以上2 種結構的測試,選擇診斷效果較好的64 作為卷積核數量。同時,針對導波信號采樣頻率較高、采樣點較多的特點,特征圖的像素點需具備較大的感受野,以保證能夠提取更多采樣點間的關聯特征,因此卷積核長度設計為12,近似占每個片段長度的30%。最大池化層采用常用步長2,將特征圖尺寸減小為原來的1/2。此外,語義特征提取模型采用“ReLu”作為卷積核的激活函數,以避免在訓練過程中出現梯度爆炸和梯度彌散現象。使用L2正則化和“隨機丟棄”技術對每一層卷積核的訓練參數進行稀疏化處理,增強模型的的泛化能力,降低網絡的計算成本。
分類模型由1 個特征融合層和3 個全連接層組成。特征融合層用于合并由語義特征提取模型輸出的24 條路徑的損傷特征;全連接層用于提取24 條路徑的綜合高層特征。需要指出的是,前2 個全連接層的激活函數仍采用“ReLu”,最后一個全連接層由于要完成5 種損傷的分類任務,選擇了“SoftMax”作為激活函數。該函數可以將最后一層神經元的輸出映射到(0,1)內,并根據一定的概率關系確定分類結果,即

其中:S為激活函數的輸出向量;Si為S的第i個元素;e 為自然常數;V為全連接層的輸出向量,Vi和Vj分別為V中的第i個和第j個元素。
在本模型中,V中共包含5 個元素,模型認為S中最大元素的所在位置即為分類結果。
深度學習模型的損失函數采用交叉熵函數,可表述為

其中:損失函數L由交叉熵和L2正則化2 部分組成;m為批處理樣本的個數;K為樣本標簽種類數;y(i)為第i個樣本標簽的真值;1{y(i)=k}表示樣本標簽真值為k時,系數為1,其他情況系數為0;λ為正則化系數,是該模型的超參數,在[0.001,0.015]內通過網格搜索法確定;w為深度學習網絡的權重矩陣。
深度學習采用“Adam”優化器更新網絡權值,該優化器可對優化過程中梯度的一階和二階估計進行綜合考慮,進而計算出合理的更新步長,增強優化過程的穩定性、避免梯度彌散。
為使深度學習模型從數據樣本中提取對結構不確定性敏感度較低的高層特征,并在結構相同的不同實驗件上測試模型的泛化能力,筆者使用6 塊結構構型和材料完全相同的加筋壁板(S1~S6)進行實驗,其尺寸和壓電傳感器網絡布置如圖1 所示。其中,S1~S4和S5~S6分別用于模型訓練和測試。
應用在實驗件表面粘帖專用膠泥的方法來模擬損傷[18],損傷面積從8mm×8mm~15mm×15mm不 等。將 實 驗 件 分 為S1和S2,S3和S4,S5和S63 組,先對第1 組進行損傷模擬實驗,再對第2 和第3 組重復第1 組的實驗。分組進行模擬實驗的目的是引入環境變化(溫度、傳感器狀態等)對監測信號的影響,豐富樣本的多樣性。采集樣本的具體方法為:①在2 個實驗件的相同位置粘帖尺寸相近的膠泥,同時采集監測信號并將其作為損傷信號,然后隨機更改損傷位置和膠泥尺寸,重復以上操作;②每采集10條損傷信號后,采集一次無損傷的基線信號。S1~S6上共收集損傷數據2614 個,基線數據270 個,每個數據包含24 條路徑,各路徑的采樣頻率均為120 Hz,采樣點個數均為4000,其中,0~600 采樣點信號為電磁串擾,不參與數據分析。數據收集過程歷時21 d,最大溫度變化為3°,期間更換壓電傳感器4 個,更換過程對實驗件的敲擊引起一定的信號變化。在每個實驗件采集的數據中隨機抽取一個損傷數據和一個基線數據,將其相減得到的散射數據作為一個樣本,通過該方法共生成訓練樣本5592 條,測試樣本319 條,S1~S6的采集數據數量和生成樣本數量如表1 所示。

表1 S1~S6的采集數據數量和生成樣本數量Tab.1 The number of collected data and generated samples of S1~S6
需要指出的是,為避免壓電傳感器性能、采集設備參數設置(增益、激勵幅值等)和傳感器粘貼工藝的差異對散射信號能量分布的影響,能量圖譜中的像素值為散射信號的歸一化電壓,即為每條路徑的散射信號與其基線信號最大電壓的比值。
從5592 條訓練樣本中隨機選擇592 條作為驗證集,其余5000 條作為訓練集,對筆者設計的深度學習模型進行訓練。每訓練128 個樣本模型更新一次網絡參數,訓練完成5000 個樣本為一個循環,訓練過程共經歷80 個循環。在第60 個循環后,驗證集的損失函數明顯增大,說明模型開始出現嚴重的過擬合現象[19]。因此,選擇第60 個循環的模型參數作為最終結果,此時驗證集損傷識別和損傷定位的準確率分別為94%和93%。
深度學習模型對測試數據集的損傷識別結果和損傷定位結果如表2 和表3 所示。

表2 測試數據集的損傷識別結果Tab.2 The damage identification results of test dataset

表3 測試數據集的損傷定位結果Tab.3 The damage location results of test dataset
由表2 和表3 可知,在考慮結構不確定性的情況下,深度學習模型損傷識別和損傷定位的平均準確率分別為88%和85%;相較于基于專家經驗的傳統方法具有較大優勢,但與驗證集結果相比分別產生了6%和8%的退化,說明模型依舊存在一定的過擬合現象。損傷定位結果中第1,2 類樣本的診斷準確率最高,僅有一個樣本判斷錯誤;但第0,3 類樣本的召回率、第4 類樣本的精確率均較低。分析發現,這是由于模型將0,3 類中大多數的錯誤樣本診斷為第4 類,直接導致第4 類樣本的精確率大幅降低,而其召回率為100%,說明模型向第4 類樣本嚴重偏斜。導致該現象的根本原因是第4 類訓練樣本的數量過少,僅占樣本總數的9%,樣本數量無法準確描述第4 類損傷特征的分布狀態,干擾了模型對其他類樣本的分析診斷。該問題可以通過增加訓練樣本數量得到改善。
為了說明深度學習方法與傳統專家經驗方法相比,不易受結構不確定性的影響,針對S5和S6的相同損傷,分別使用2 種方法計算導波監測網絡特征矩陣的相似度,并進行比較。
筆者以特征矩陣間的歐幾里得距離表征特征相似度。其中:傳統方法的特征矩陣由24 條導波監測路徑的8 種損傷指數構成[16],包括互相關值、空間相位差、頻譜損失、中央頻譜損失、微分曲線能量、歸一化相關動量、微分信號能量和均方根偏差。傳統方法 對S5和S6提 取 的 特 征 矩 陣 分 別 記 為X5,24×8和X6,24×8,則其相似度為

其中:xk,ij為Xk,24×8中第i行第j列的元素。
深度學習方法的特征矩陣為分類模型中第2 個全連接層的輸出,對S5和S6提取的特征矩陣分別記為Y5,1×128和Y6,1×128,則深度學習方法的特征相似度可表示為

其中:yk,i為Yk,1×128中的第i個元素。
針對10 組S5和S6上的相同損傷,分別計算和并求得平均值=0.0108,=0.0070。這說明在考慮結構不確定時,深度學習方法的診斷結果比傳統方法具有更高的可靠性,且隨著樣本數量的增加和種類的豐富,可靠性會不斷提高。
深度學習模型提取損傷特征的可視化分析如圖8 所示。圖8(a)為樣本能量分布圖,圖8(b)為第1 個卷積層中64 個疊加特征,圖8(c)~(e)為第1 個卷積層的3 個獨立特征。可以看出:第1 個卷積層的作用是選擇合適的閾值抑制低梯度像素點;由于圖8(c)~(e)的閾值依次升高,所以圖像中像素值為0 的區域逐漸增大;圖8(b)可理解為該卷積層根據平均閾值對原始圖像進行處理的結果。深度學習模型訓練的作用是確定像素梯度的具體計算方法并調整64 個獨立閾值。隨著網絡的加深,模型提取特征的可解釋性逐漸降低。由第3 個卷積層的特征圖(圖8(f)~(h))可知,雖然圖像在樣本的高灰度區域依舊保持較高的特征水平,但無法解釋其細微變化以及其他區域特征分布的物理意義。圖8(i)為LSTM 層的輸出特征,其中樣本高灰度區域的曲面存在明顯波動,而其他區域的變化相對平滑。

圖8 深度學習模型提取損傷特征的可視化分析Fig.8 Visualization of damage characteristics of deep learning model
1)針對深度學習損傷識別技術,相較于單路徑,基于多路徑監測信號能量圖譜的樣本設計方法優勢明顯,能夠借助圖像識別領域的設計經驗開發模型新架構,為深度學習模型提供更加豐富有效的學習信息,同時擺脫樣本標注方法對專家經驗的依賴。
2)深度學習模型能夠提取導波信號的高層特征,且該特征受結構不確定性的影響較小,但是實現該技術工程應用的最大限制是樣本數量不足。因此,需開展復合材料損傷的數值模擬技術研究和小數據驅動的深度學習模型設計技術研究。
3)借助特征可視化技術,能夠對深度學習網絡提取的損傷特征進行直觀分析,但是目前深層網絡提取特征的可解釋性較低,后續需進一步結合專家經驗分析高層特征的物理意義,為解釋導波信號的變化規律和神經網絡的工作機制提供基礎。