(廣東工業大學土木與交通工程學院 廣東 廣州 510006)
近年來多層、高層建筑及大跨度橋梁的出現給結構健康監測帶來一系列問題,如何提取結構的特征用于損傷識別是我們正在面臨的重要挑戰。為實現這一目標,國內外學者做出了很多成果,神經網絡是其中重要的分支。[1]BP神經網絡的結構損傷識別方法一般先通過分析各種不同的損傷序列或破壞模態來建立模式庫,然后觀察實測振動信號的變化,并將它與可能發生損傷的模式數據庫進行比較選擇最相似的模式。
BP網絡的結構設計流程主要包括:輸入層神經元數目、隱層的層數及神經元數目、輸出層的神經元數目等。理論上已經證明,三層(一個隱層)的BP網絡可以任意表達一個非線性連續函數。另外,從誤差反傳算法中可以看到,誤差是通過輸出層到輸入層反向傳播的,層數越多,反向傳播誤差在靠近輸入層時就越不可靠,因此,多數學者傾向認為,用于結構損傷識別的神經網絡采用一個隱層已經夠了。[2]選擇隱層神經元的數目也是一個很重要的問題。若數量太少,網絡所能獲取的用以解決問題的信息太少;若數量太多,不僅增加訓練時間,難以在人們接受的時間內完成訓練,更重要的過多的隱節點還可能出現“過度吻合”問題。
輸入參數的選擇對神經網絡的應用非常重要。在結構損傷識別的建模過程中,神經網絡輸入參數的選擇及其表達形式將直接影響到結構損傷識別的結果。為了使輸入參數能有效識別損傷的位置和程度,它必須滿足兩個基本的條件,即它應該是位置坐標的函數和對局部損傷敏感。此外,作為輸入參數,它還應具有易于提取、受環境干擾影響小等特點。神經網絡剛開始用于結構損傷識別與檢測時,用振動信號作為神經網絡的輸入,使得網絡結構過于復雜且訓練時間過長。
神經網絡所用的樣本對網絡的性能及實際應用具有至關重要的影響,它可以影響神經網絡的學習速度、網絡結構的復雜性和網絡泛化的精度。對神經網絡所用樣本集進行數據前處理的步驟一般分為4步:變量(數據)的收集、數據變換處理、特征參數的提取和樣本集的構造。
首先要深入調查,了解實際情況與問題,并收集有關的信息,如網絡模型中可能的所有輸入變量及輸出變量、定性描述及定量數據等;其次是向有關的專家和學者請教、咨詢或查詢有關資料,對于具體結構損傷檢測問題而言,輸入變量還要求其容易測量、測量結果準確可靠。
一般來說,數據集中常常存在大量的多維變量數據,它們的數值可能較小但卻起著決定性的重要作用。這樣就需要對映射樣本空間的數據先進行變換處理,刪除原始數據中的無用信息,使樣本空間映射成數據空間,即進行數據歸一化處理。
在數據空間上通過某種變換,提取數據中的不變特征,根據問題的需要,決定是否對所選擇的模式特征矢量進行量化壓縮變換,在盡可能保持信息量基本不變的前提下,在降維空間內選擇有用的特征,在所得的降維模式空間提取模式樣本的特征信息來形成特征空間。
常用的特征參數提取方法包括:博里葉變換、梅林變換、時頻分析、分形維數、向量擴張法、小波分析法、主成分分析法、神經網絡方法等。
樣本集的構造與選取對神經網絡的訓練和推理性能具有相當重要的作用:如果樣本數量太少,不能很好他反映問題內在的規律和相互關系,在驗證樣本集中就不能得到合理的推理結果;如果樣本數量過大,不僅增加了網絡的學習時間,而且使網絡與學習數據太貼近,導致網絡的抽取歸納能力下降。目前對學習樣本集中的樣本數目還沒有一個統一的規則和要求。
神經網絡的輸出層按照其用途來設計,對結構損傷識別問題,有以下幾種形式:
(1)o={o1,o2,…,oi,…,on}
其中oi表示第i單元的損傷程度,其值在區間[0,1],損傷程度為100%×oi%。n為要檢測的單元總數。
(2)o={o1,o2}
其中o1表示損傷位置信息(例如距梁端的距離等),o2表示損傷程度信息。o1,o2∈[0,1]
(3)o={o1,o2,…,on}
其中,oi=0或1,當oi=1表示發生第i種類型的損傷,當oi=0時表示第i種類型的損傷不發生,n為損傷類型總數.
BP網絡的輸入、輸出節點數完全根據使用者的要求設計,如果BP網絡用作分類器,其類別數m個,那么輸入一般取m個神經元,其訓練樣本集中的Xp屬于第j類,要求其輸出為Y=(0,0,0,1j,0,0,0m)T,即第1個輸出1,其它輸出為0,因此對于一個n維輸出,X∈Rn進行分類映射Y∈Rn,滿足Yi=1(Xp屬于第j類),Yj=0(Xp不屬于第j類)。輸出神經元還可以根據類別進行編碼,即m類的輸出只要用log2m個輸出節點即可。輸入節點還可以根據求解的問題和數據表示的方式而定。總之問題確定后,輸入與輸出的節點數就隨之確定。在設計中應盡可能減小系統的規模,以使學習的時間和系統復雜性減小。
大多數通用的神經網絡都預先確定了網絡的層數,而BP網絡可以包含不同的隱層。但理論上已經證明,在不限制隱層節點數的情況下,兩層(只有一個隱層)的BP網絡可以實現任意非線性映射。在模式樣本相對較少時,較少的隱層節點,可以實現模式樣本空間的超平面劃分,選擇兩層BP網絡就可以了;當模式樣本數很多時,減小網絡規模,增加一個隱層是必要的,但BP網絡隱層數一般不超過兩層。
關于隱含層節點數的選擇是一個十分復雜的問題,通常參照相關技術資料予以確定。它與求解問題的要求、輸入以及輸出節點數的多少都有直接的關系。[3]