劉 昉,陳浩東,梁 超,龐博慧
(1.天津大學水利工程仿真與安全國家重點實驗室,天津 300354;2.華能瀾滄江水電股份有限公司,云南 昆明 650214)
近年來一系列300 m 高壩大庫相繼建設完成,這些工程身處高山峽谷之中,在巨大的水頭落差作用下,泄洪建筑物內的高速水流可達50 m/s,內部結構極易發生破壞。 內部結構破壞后若繼續承受水流的沖擊荷載,會引發嚴重的安全事故,如美國胡佛拱壩泄洪洞內發生的空蝕破壞,最終導致了超過5 000 m3的混凝土及巖體破壞。 因此,為保障水利樞紐的泄洪安全,有效識別泄洪建筑物的結構安全狀態十分必要。 楊弘等[1]、練繼建[2]研究指出泄洪建筑物的結構安全狀態與結構振動位移相關,并提出通過振動信號判斷結構安全狀態的理論,但缺少具體的計算方法,實際使用中存在較大困難。 傳統的識別方法通常需要通過先驗知識,人工選擇判斷指標,因此人的因素決定了方法的優劣,存在明顯的局限性。
隨著深度學習的發展,智能識別在各個領域逐漸得到廣泛應用。 深度神經網絡能夠通過多次非線性變化,自適應地從數據中提取特征。 智能識別就是運用這種特征提取能力,在大量的已識別數據中自主學習最佳的識別特征,進而識別目標數據的所屬類別。 黎陽羊等[3]提出了一維卷積神經網絡和長短期記憶網絡相結合的混合模型,能夠通過齒輪箱振動信號有效識別齒輪箱故障類型。 李大柱等[4]結合車輛車輪振動信號的特征,提出了基于多尺度時頻圖與卷積網絡的車輪故障智能診斷方法,準確率高達97%。 周謙等[5]將力和振動信號轉化為二維頻譜圖,輸入VGG13卷積神經網絡,成功實現了對生產刀具磨損狀態的監測。 然而,這些識別方法是針對單點振動數據提出的,泄洪建筑物結構安全狀態識別的輸入信號卻是多測點振動數據,因此方法和數據之間不能很好地匹配。 本文以Inception 模塊為主體結構,結合門控循環單元(GRU)和高效通道注意力(ECA)機制,提出了一種Inception-GRU 深度神經網絡模型,其能夠通過多測點泄洪振動數據,對泄洪建筑物的結構安全狀態進行智能識別,并通過實測振動數據進行測試,驗證該模型的識別效果。
卷積神經網絡(CNN)是針對圖像任務提出的神經網絡結構,在許多領域得到了廣泛應用,通過卷積核在特征圖上的滑移操作,能夠逐層提取深層特征。 增大網絡的深度和寬度是提高網絡性能的主要方式,但會導致過擬合和網絡難以訓練的問題[6]。 Inception 模塊是解決這些問題的有效方法(基本結構見圖1),它對同一層特征圖使用不同尺寸的卷積核進行特征提取,然后通過1×1 卷積核進行通道降維,最后對通道拼接匯總提取特征信息[7]。 基于 Inception 模塊的結構,使得在擴展網絡寬度的同時,參數量保持相對不變。

圖1 Inception 模塊基本結構
批標準化(BN)一般在卷積層和激活函數之間使用,它在通道維度上對數據進行歸一化處理,能夠有效地解決梯度消失問題,減少過擬合現象,提高訓練速度[8]。 批標準化公式如下:

式中:μB為訓練批次的平均值為訓練批次的方差;m為訓練批次單通道的數據量分別為標準化前、標準化后、縮放平移后特征圖上的第i個數據;γ、β分別為空間縮放、空間平移的控制因子;ε為保證方差為0 時計算可正常進行的常數。
循環神經網絡(RNN)是針對時序信號提出的神經網絡結構,能夠存儲和分享不同時刻的信息,并共享權重因子,進而學習不同時刻輸入間的隱藏信息,被廣泛應用于自然語言處理(NLP)領域。 GRU 是基于RNN 的一種優化模型(單元內部結構見圖2),解決了傳統循環網絡反向傳播過程中出現的梯度消失問題,能自適應地學習不同時間尺度間的依賴關系[9]。

圖2 GRU 單元內部結構
GRU 單元使用重置門和更新門控制單元的信息流動,重置門用于控制記憶信息的保留程度,更新門用于控制輸入信息和記憶信息的結合程度。 GRU 單元結構相對簡單,參數量約為長短期記憶神經網絡(LSTM)的3/4,性能表現基本相當,適用于構建較大的網絡模型。 GRU 單元內信息更新公式如下:

式中:zt、rt分別為更新門、遺忘門;σ為 Sigmoid 函數;為Hadamard 乘法;xt為當前時刻的輸入為當前時刻 GRU 單元內的隱藏信息;ht-1、ht分別為t-1 時刻、t時刻 GRU 單元內的記憶信息;Wxu、Wxr、Wxh、Whu、Whr、Whh為權重矩陣;bu、br、bh為偏置矩陣。
通道注意力機制能夠計算特征的重要程度,賦予特征不同權重,進而提升網絡對主要特征的敏感程度。ECA 機制是一種超輕量注意力模塊(內部結構見圖3),避免了SENet 中的通道降維操作及可能帶來的負面影響,能以較小的參數量獲取網絡性能的顯著提升[10]。

圖3 ECA 內部結構示意
ECA 機制首先對輸入的特征圖進行全局平均池化(GAP),然后對得到的向量進行快速一維卷積,在使用sigmoid 函數激活后獲取通道的權重,最后將通道權重和輸入特征圖相乘就能得到具有通道注意力的特征圖。 一維卷積尺寸k決定著跨通道信息交互的覆蓋范圍,可以通過下式進行計算:

式中:C為特征圖的通道數;|·|odd為距離“·”最近的偶數;γ、b分別為 2、1。
Inception-GRU 模型的結構如圖4 所示,大致分為3 部分,分別為 CNN 模塊、Inception 模塊、GRU 模塊。模型的輸入為三維特征矩陣,尺寸為4 × 8 × 10,首先通過2 個二維卷積層組成的CNN 模塊初步提取淺層特征,然后通過Inception A、Inception B、Inception C 3 個子模塊逐步提取深層特征,接著再以時序的方式輸入GRU 模塊,匯總子時間段內的切片信息,最后通過Softmax 激活函數輸出識別結果。

圖4 Inception-GRU 模型結構示意
InceptionA、Inception B、Inception C 是 Inception基本結構進行卷積核分解后得到的3 種優化結構(內部結構見圖5),它們在保持感受野不變的情況下,提升了網絡的非線性表達能力[11-12]。 3 種優化結構分別適用于不同尺寸和通道數的特征圖,Inception A、Inception B結構在網絡前期表現較好,Inception C 結構則適用于網絡后期。

圖5 Inception 優化結構示意
Inception-GRU 模型的具體參數見表1。 Inception結構由左至右為分支1、分支2、分支3、分支4,表1 中相關參數為對應分支的卷積核數量和池化類型。

表1 Inception-GRU 模型結構參數
模型識別的輸入信號為泄洪建筑物受水流脈動影響的振動信號,該信號的時域、頻域統計量對結構變化敏感,具有良好的表征能力。 因此,對于原始的振動信號,進行數據預處理時,選取7 個時域統計量和3 個優勢頻率形成特征矩陣作為模型的輸入。
數據增強是指通過增加數據的多樣性,來增強模型的泛化能力,以在測試集和實際應用中取得更好的表現。 本試驗通過在固定時長內隨機抓取振動片段的方式,增加單條數據的隨機性,實現對振動信號的數據增強操作。
本試驗采用某水電站的8 個測點振動數據來測試模型的性能,振動數據共5 704 條,標簽類別為正常狀態、異常狀態A、異常狀態B 和傳感器故障4 類,每一類各1 426 條數據。 在數據預處理和數據增強后,數據以三維特征矩陣的形式輸入模型(見圖6)。

圖6 數據輸入模型示意
為進一步驗證模型的識別能力,應對異常狀態和傳感器故障類別的數據進行矩陣隨機行變換,從而增強數據的隨機性和模型的泛化能力。 試驗中訓練集、驗證集、測試集的數據比例為8 ∶1 ∶1,用隨機分層抽樣的方式進行劃分,以確保樣本集之間數據分布的均勻和相似。
模型訓練時使用SGDM 優化器,動量因子為0.9,使用L2 正則化選項;學習速率為0.01,使用余弦退火算法進行衰減;批數據量為128,訓練次數為100 次,損失函數使用交叉熵損失函數。 在模型評價時,選用準確率作為主要評價指標,以精準度、召回率和F1 分數作為輔助評價指標。
為更好地評估模型的性能,同時引入其他模型作為對照,分別為Inception 模型、CNN-GRU 模型和 Inception-LSTM 模型,模型訓練過程和測試結果分別見圖7、表2。 從圖7 中可以看出,在100 次更新優化中,4 個模型都能完成訓練,達到相對最優狀態。 從表2可以看出,本文提出的Inception-GRU 模型識別效果最佳,在測試集上的準確率可達97.15%,能夠通過多測點振動數據高效地識別泄洪建筑物的結構安全狀態;Inception-LSTM 模型識別效果略差,準確率為95.12%,基本能夠完成識別任務;相比之下CNN-GRU 模型和Inception 模型效果較差,但準確率也超過了90%。 4個模型結構依次從簡單到復雜,模型參數逐漸增加,分類的準確率在90%~98%范圍內波動,說明對于泄洪振動數據來說,時域、頻域統計量能夠較好地代表原信號,轉換過程中信息丟失較少,適合作為模型輸入進行識別,能簡化模型結構,減少參數量,加快訓練和識別速度。

圖7 模型訓練過程

表2 模型測試結果 %
此外,具有循環神經網絡結構的CNN-GRU 模型、Inception-GRU 模型和Inception-LSTM 模型對時序信息敏感、收斂更快,準確率較Inception 模型均有所提升。 而Inception 模型沒有進行數據增強,對于特征的提取能力較差,延后約20 次訓練才達到最優狀態,同時識別表現也最差。 CNN-GRU 模型和Inception-GRU模型準確率相差5.69 個百分點的原因在于卷積部分的性能差異,能夠看出對于規模較小的矩陣來說,Inception 模塊的分支卷積結構能夠更加有效地進行深層特征提取。 Inception-LSTM 模型的參數量較Inception-GRU 模型更多,但進行訓練的數據量較少,導致其在訓練過程中出現了過擬合的現象,盡管理論性能更好,實際準確率卻低了2.03 個百分點。 在未來數據量更多的情況下,可考慮使用Inception-LSTM 模型,以期獲得更好的識別效果。
圖8 為Inception-GRU 模型在識別測試集數據后繪制的混淆矩陣,主對角線為正確識別的樣本數量,其余位置為錯誤識別的樣本數量,可以看出Inception-GRU 模型對4 類數據都能有效識別。 傳感器故障類別的數據與其他3 個類別的數據相比特征更加明顯,在本次試驗中能夠全部正確識別,而正常狀態、異常狀態的數據均存在錯誤識別的情況。

圖8 Inception-GRU 模型混淆矩陣
為研究模型提取特征的性能,將CNN 模塊、Inception 模塊和GRU 模塊的輸出分別取出,使用t-SNE 算法[13]將多維特征降維到二維,繪圖實現可視化,如圖9 所示。 從圖9 可以看出,CNN 模塊提取了淺層特征,基本能夠判斷傳感器故障類別,但此時在高維空間內其他3 類數據的特征向量仍十分混亂,無法有效區分;Inception 模塊進一步提取深層特征,正常狀態和異常狀態的數據點在高維空間中逐漸分離,但仍有少許交叉,此時已能夠基本識別;GRU 模塊較好地處理了Inception 模塊輸入的時序信號,進一步優化了提取特征,使4 類數據進一步分離。 總的來說,Inception-GRU模型提取的特征逐漸變強,混亂的輸入數據在高維數據空間內逐漸分離,最終達到距離較遠、區分度較高的空間位置,實現了對泄洪建筑物結構安全狀態的有效識別。

圖9 模塊輸出特征t-SNE 可視化
鑒于識別泄洪建筑物結構安全狀態的必要性和傳統識別方法的局限性,提出一種Inception-GRU 深度神經網絡模型,智能化地實現泄洪建筑物結構安全狀態的識別,進而確保水利樞紐泄洪過程中的運行安全。主要結論如下。
(1)提出的Inception-GRU 混合網絡模型,經測試以97.15 %的準確率高效地識別泄洪建筑物的結構安全狀態。 該模型比 Inception 模型、CNN-GRU 模型、Inception-LSTM 模型識別效果更好,原因在于Inception結構對小尺寸輸入的特征提取能力更強,而門控循環單元(GRU)在較好地處理時序信息的同時沒有產生過擬合現象。
(2)對于泄洪振動信號來說,提取時域、頻域統計量作為模型的輸入,能較好地保持原始振動數據的信息完整,在減少參數量的同時,具有較高的準確率;使用隨機抓取振動片段進行時序堆疊的數據增強方法,模型能夠獲取更多信息,識別能力得到顯著增強。