李沐陽,苑宇
(1.大連交通大學 機械工程學院,遼寧 大連 116028;2.大連交通大學 機車車輛工程學院,遼寧 大連 116028)*
機械設備的運行狀態與滾動軸承有著密不可分的關聯,為確保滾動軸承處于正常狀態,需對其振動信號進行采集與檢測,在軸承發生故障的初期及時發現并修復問題.傳統的信號采集方法是依據香農-奈奎斯特采樣定理對信號進行均勻采樣,為保證采樣精度,理論上要求采樣頻率至少為信號最高頻率的2倍才能保證頻譜不發生混疊,而在實際應用中往往會達到5~10倍,不僅對采樣設備要求高,還會產生大量的數據,且存在較大冗余,增大了數據傳輸及分析的難度.
壓縮感知(Compressive Sensing,CS)[1-2]理論亦稱壓縮采樣理論,是一種新的信號采集與處理方法,由D.Donoho、E.Candes、J.Romberg、T.Tao等人于2006年正式提出.壓縮感知可在采集原始信號的同時對其進行壓縮,采樣頻率與信號的結構和所包含的信息有關,不再由信號帶寬決定,信號中的部分噪聲及冗余信息也得以剔除,能夠大幅減少采集的數據量,降低采集端的壓力.目前,壓縮感知技術已在影像壓縮[3]、人臉識別[4]、雷達成像[5]、通信[6]等領域取得了一定進展.
本文將壓縮感知技術應用于滾動軸承故障檢測,在采集軸承振動信號的同時對其進行壓縮,再利用神經網絡對非線性時間序列的預測能力對觀測值進行二次壓縮,通過觀測值的前一部分預測全部觀測值,在數據量遠小于傳統方法的情況下以較高精度重構原始信號,通過信號頻譜準確提取軸承的故障信息.
壓縮感知理論的核心思想是假設信號在一個變換基下能夠稀疏表示,采用線性隨機觀測方法將信號投影到低維空間上,得到少量包含原始信號絕大部分信息的觀測值,再通過非線性優化算法復原出與原信號近似的重構信號.

x=Aθ
(1)
其中,系數向量θ=[θ1,θ2,…,θN]T,θi=〈x,ai〉=aiTx,由此可見,θ是時域信號x在A域的表示.如果θ中僅有K個元素非零或為大系數,并且K?N,則稱θ是K稀疏的,即信號x為正交基A下的稀疏信號.
給出一個與正交基A不相關的M×N(M﹤N)維測量矩陣Φ,對信號x進行降維觀測,得到觀測向量y∈RM×1,即
y=Φx
(2)
其中,觀測向量y包含了原始信號x的主要信息,而y中的元素數量比原始信號x少得多,即減少了數據量,通過解線性方程組的方式可以由觀測值y重構出原始信號x,但是由于M﹤N,使得方程組中未知數的數量大于方程的個數,這是一個欠定問題,但依據前文所述,信號x可以稀疏表示,因此,觀測過程可以表示為
y=Φx=ΦAθ
(3)
通過重構θ可以間接重構出原始信號x,盡管其仍為一個欠定問題,但由于θ是稀疏的,大幅減少了未知數的數量,縮小了解空間大小,使得重構原始信號成為可能,只需解決如下優化問題:
θ(1)=arg min‖θ‖1s.t.y=Φx=ΦAθ
(4)
由壓縮感知的過程可以看出,對其的研究主要包含三個部分,即信號的稀疏表示方法、測量矩陣的設計以及信號的重構算法,本文也將基于以上三部分進行分析.
信號的稀疏性決定了壓縮感知的效率和精度,傳統的正交基字典難以保證信號足夠稀疏,因此人們提出了基于優化學習算法構造冗余字典的方式,其中,K-奇異值分解(K-Singular Value Decomposition,K-SVD)算法[7]由于對各種信號均有較好效果而被廣泛使用.
K-SVD算法是在K-means聚類算法的基礎上提出的一種字典訓練算法,其特點是在更新字典時對每一列原子進行更新,而不是對整個字典進行更新,訓練效率得以提升,其具體步驟為:
步驟1 選取原始信號x,確定初始字典原子個數K、原子長度n、樣本集合原子個數N、稀疏表示時線性組合的原子數L、迭代次數J.
步驟2 將x中每n個數據構成一個原子,選擇N個原子構成樣本集合S∈Rn×N,隨機選取其中K個原子構成初始字典D∈Rn×K.
步驟3 求信號在D下的稀疏系數矩陣θ.
步驟4 固定θ,利用奇異值分解逐列更新每一個原子,計算殘差.
步驟5 重復步驟3~4,直到達到迭代次數或誤差條件為止.
為確定算法中各參數值,本文使用美國凱斯西儲大學軸承數據中心提供的故障滾動軸承數據進行測試,取原子長度n=512,對初始字典原子數K、樣本集合原子數N、稀疏表示時線性組合的原子數L和迭代次數J進行分析,依次調整K、N、L、J的參數值,固定剩余三個參數,計算重構信號相對誤差,其中,K取700~950以保證字典完備,N取950~1200確保字典訓練足夠充分,L和J通常取值較小,本文取2~12進行測試,其結果見表1.

表1 K-SVD算法參數值與相對誤差
通過表1可選擇出使相對誤差較小的參數值組合,即K=900,N=1100,L=8,J=6.
測量矩陣是對信號進行降維投影的關鍵,分為隨機矩陣和確定性矩陣,本文采用前者.目前常用的隨機測量矩陣包括高斯隨機矩陣、伯努利隨機矩陣、部分哈達瑪矩陣等,對于不同性質的信號,各矩陣的性能不盡相同.
為選擇適合本文故障信息提取方法的測量矩陣,以故障軸承512個數據作為原始數據,分別用各測量矩陣進行壓縮感知,對比各矩陣的故障信息提取準確度.由于只需檢測出故障頻率,因此不需要精確重構信號,只要求重構信號頻譜譜峰與原始數據頻譜譜峰一致,即視為該次壓縮感知成功,最終對比各方法的故障檢出成功率.
研究發現,傅里葉域中每個諧波成分對應的頻率特性為兩條譜線[8],因此取信號的稀疏度K=2,壓縮后的數據量M分別取100,150,…,400,使用各測量矩陣在M的不同取值下各進行1000次壓縮感知過程,測試結果如圖1所示.

圖1 各測量矩陣故障檢出成功概率
由圖1可以看出,部分哈達瑪矩陣的故障信息提取成功率明顯高于其它矩陣,盡管部分哈達瑪矩陣要求原始數據個數為2的整數次冪,對于原始數據量較大的信號會造成數據量進一步增大,但本文使用的故障軸承信號的數據較少,易滿足部分哈達瑪矩陣的適用條件,因此本文選用部分哈達瑪矩陣作為壓縮感知的測量矩陣.
信號重構的本質是解決式(4)的優化問題,找到方程中盡可能稀疏的解,目前主要有兩類方法,即基追蹤法和貪婪算法,本文將采用后者.
依據壓縮感知原理,對于維度較大的信號,求解l1范數最小化問題重構信號的計算量較大,所需時間也會增多,利用貪婪算法的迭代方式可以較低計算復雜度,縮短信號恢復時間,易于硬件實現.目前較常用的迭代方式是正交匹配追蹤(Orthogonal Matching Pursuit,OMP)算法[9],本文選用的子空間追蹤(Subspace Pursuit,SP)算法[10]是對傳統OMP算法的改進,提高了效率和穩定性.
神經網絡是一種非線性動態學習系統,其基本結構如圖2所示.其中,x為神經網絡輸入值,y為輸出值,ω表示輸入層與隱含層的權值,b為隱含層到輸出神經元的權值,m和n分別代表輸入層與隱含層各自神經元的數量.

圖2 神經網絡結構圖
網絡的學習過程是將學習樣本X1,X2,…,Xn輸入網絡,通過神經元之間的傳遞函數計算網絡輸出值Z1,Z2,…,Zn,將Zi與期望的輸出樣本Yi進行對比,通過訓練函數調整權值,令Zi逼近Yi.對于非線性時間序列,可以將一組連續的數據xm-s,xm-s+1,…,xm輸入學習完成的神經網絡,得到輸出值zm+1,zm+2,…,zm+t,這些輸出值理論上將與xm+1,xm+2,…,xm+t相近,這個過程即為對xm+1,xm+2,…,xm+t的預測.由于神經網絡單次預測多個數值的誤差較大,因此本文采用滾動預測的方式,在開始預測時將xm,xm+1,…,xm+s作為輸入,得到下一個數據點的預測值zm+s+1,再將其與xm+1,xm+2,…,xm+s一并作為輸入,對xm+s+2進行預測,再利用zm+s+2對xm+s+3進行預測,如此重復迭代即可得到后一段連續數據的預測值.
本文將壓縮感知過程中的觀測值用于網絡學習,取觀測值的前半部分用于數據的傳輸和存儲,實現信號的二次壓縮,再通過神經網絡預測觀測值的后半部分,即可通過重構算法復原原始信號.
實驗選用美國凱斯西儲大學軸承數據中心采集的故障滾動軸承數據,所用軸承為6205-2RS JEM SKF型深溝球軸承,采樣頻率12 kHz,轉速1797r/min,故障點為軸承內圈刻痕.根據軸承轉速和采樣頻率可計算出每個轉動周期的采樣點數約為401個,考慮到壓縮感知測量矩陣使用的部分哈達瑪矩陣要求數據個數為2的整數次冪,因此取512個連續數據作為原始信號.
本文采用MATLAB軟件進行仿真試驗.首先將原始信號通過K-SVD算法進行稀疏表示,訓練得到冗余字典,利用部分哈達瑪矩陣與原始信號相乘,取壓縮比為0.6,得到205個觀測值,然后將取得的少量觀測值作為訓練樣本,利用MATLAB神經網絡工具箱對網絡進行訓練,再通過滾動預測的方式對觀測值后102個數據進行預測,總壓縮比約為0.8,考慮到壓縮感知觀測值的隨機性較大,因此選用4層神經網絡,即包含2個隱含層,以減少神經元數量,輸入層與隱含層、隱含層與隱含層之間的傳遞函數選用雙曲正切S型(Tan-Sigmoid)函數,其表達式為
(5)
隱含層與輸出神經元之間的傳遞函數選用線性傳輸(Pureline)函數,經測試,神經網絡輸入層取15個節點,兩個隱含層分別取11和5個節點可在盡可能少的神經元下以較高概率完成預測,預測結果如圖3所示,可以看出,通過神經網絡預測的觀測值與原始觀測值沒有明顯差異.

(a)原始觀測值
最終,將全部預測的觀測值利用SP算法進行重構,并利用MATLAB軟件生成重構信號及其頻譜圖,如圖4所示.不難發現,本文方法的重構信號能夠較好地模擬原始信號,僅在部分采樣點有一定誤差,而采用傳統方法時的誤差則較為明顯,如第160個采樣點附近的信號存在嚴重失真,盡管在實驗的壓縮比例下二者都能通過各自頻譜準確檢測出軸承的故障頻率約為154 Hz,但傳統方法已存在明顯誤差,經實驗表明,在壓縮比例較大時,使用傳統方法已無法準確判別軸承的故障頻率.

(a)原始信號及其頻譜
為定量對比本文方法與傳統K-SVD算法在不同壓縮比下的重構精度,引入匹配度(Matching Rate,MR)[11]作為重構精度的衡量標準,其計算公式為
(6)

由表2可以看出,總壓縮比在0.72~0.92之間,即二次壓縮比在0.3~0.8之間時,本文方法的匹配度穩定在0.83左右,傳統K-SVD算法的匹配度明顯低于本文方法,且隨著壓縮比的升高,二者之間的差距進一步增大.
本文對軸承外圈和滾動體故障信號進行了類似的實驗,由于其過程基本相同,在此不再贅述,實驗結果如圖5所示.
圖5(a)與(b)上方的曲線為原始信號,下方的曲線為重構信號,實驗中,外圈故障重構信號匹配度約為0.91,滾動體故障匹配度約為0.76,從圖5中也能夠看出,本文方法對外圈故障信號的重構效果較好,而對于滾動體故障,盡管重構誤差相對較大,但其變化趨勢保持不變.
本文將壓縮感知理論應用于滾動軸承故障信息提取,提出了將神經網絡與壓縮感知相結合的信息提取方法.首先通過對比實驗說明了部分哈達瑪矩陣作為測量矩陣能夠保證較高的重構精度,并利用單因素分析法對K-SVD算法參數值組合進行了選取,接著將觀測值分為前后兩部分,前半部分觀測值用作信號傳輸及樣本,利用神經網絡對后續觀測值進行預測,以此達到了信號二次壓縮的目的,最終利用SP算法基于預測值對信號進行重構.本文通過仿真實驗證明了在總壓縮比為0.72~0.92之間時,本文方法對于軸承內圈信號的重構匹配度約為0.83,重構精度明顯優于傳統K-SVD方法,通過重構信號頻譜能夠準確判定軸承的故障頻率,而對于軸承外圈和滾動體信號同樣能夠保證其匹配度分別為0.91和0.76左右,重構信號可以較好地模擬原始信號以實現信息的準確提取.