(東北電力大學能源與動力工程學院,吉林 吉林 132012)
現代汽輪機轉子的結構越來越復雜,出現故障的原因也日趨多樣性,這給設備的故障診斷帶來了困難[1-2]。汽輪機轉子的故障診斷過程大體可以分為3個步驟:①故障信號的采集及處理;②故障特征的提取;③模式識別。其中特征提取是故障診斷的關鍵步驟。因而尋找一種有效可行的故障特征提取方法對于順利進行故障模式識別分類和完成設備的故障診斷具有重要的意義和價值。
針對高維非線性的故障數據空間,利用線性局部切空間排列(linear local tangent space alignment,LLTSA算法對數據進行特征提取[3-4],數據降維前后的內在屬性沒有任何變化。LLTSA算法保持了非線性流形結構的低維內在本質特征,比傳統的流形學習算法具有更好的分類識別能力[5-6]。
極限學習機(extreme learning machine,ELM)是近年來由Huang G B提出的一種單隱含層前向反饋神經網絡(single-hidden layer feed-forward neural network,SLFN)分類器[7-10],這種分類器相對于BP神經網絡(BP neural network,BPNN)、支持向量機(support vector machine,SVM)等分類器[11-12],不僅具有良好的泛化性,也極大地提高了前向神經網絡的學習速度和效率。本文采用了“故障信號-時域與頻域的融合-LLTSA-ELM”的診斷模型,該模型實現了故障診斷的全程自動化、快速化和準確化。
LLTSA是在LTSA的基礎上發展起來的,算法增加了主成分分析(principal component analysis,PCA)過程,通過無限靠近每一樣本點的空間來構建低維的線性局部空間,然后利用局部切空間排列求出整體低維嵌入坐標。
故障樣本個數為n,故障樣本維數為m,XORG為含噪聲故障樣本集,LLTSA算法的目的是找到高維樣本集XORG在Rd空間的數據集Y,其表達式為:
Y=ATXORGGn
(1)
式中:Gn=E-iiT/n為中心矩陣,E為單位矩陣,i為所有元素為1的n維列向量;Y為XORG潛在的d維非線性流形。
線性局部切空間排列算法步驟如下。
② 計算鄰域。通過K-近鄰(KNN)方法搜尋數據點xi的鄰域,首先應用歐幾里得原理得出所有數據點的距離矩陣,再通過分析距離矩陣尋找數據點xi的k個同類近似點xj。
③ 獲取局部信息。計算XiGk(其中,Xi=[xi1,…,xik])的d個最大特征值對應d個特征矢量構成的矩陣Fi,Gk=E-iiT/k。
④ 排列矩陣的構造。
通過局部累加構造矩陣A為:
(2)

⑤ 映射的計算。
XGnAGnXTβ=λXGnXTβ
(3)
與特征值λ1,λ2,…,λd(λ1<λ2<…<λd)對應的特征解為β1,β2,…,βd,則BLLTSA=[β1,β2,…,βd]。轉換矩陣B=BPCA×BLLTSA,則X→Y=BTXORGGn
對于N個不同的訓練樣本,其集合表示為N={(Xi,Yi)|i=1,2,…,N;Xi∈Rn;Yi∈Rm},具有隱藏節點數M且激活函數為f(x)的SLFN模型為:
(4)
式中:αi為連接第i個隱藏層節點的輸出權值;βi為連接第i隱藏層節點的輸入權值;bi為第i個隱藏節點的偏置;oj為第j個樣本的輸出值。
假設標準單隱層前饋神經網絡能夠零誤差逼近N個樣本,即:
(5)
由αi、βi、bi可得:
(6)
Gα=T
(7)
式中:G為神經網絡的隱層輸出矩陣。
G中的第i列定義為第i個隱層節點對應的輸入X1,X2,…,XN的輸出向量,其表達式為:
(8)
輸出權值可通過最小范數的最小二乘解來獲得,即:
α=G+T
(9)
式中:G+為隱層輸出矩陣G的Moore-Penrose廣義逆。
極限學習機的基本思路是:網絡參數并不需要全部進行設定,輸入權值β和隱含層節點偏置值b在計算過程中可隨機給定,這大大提高了收斂速度。通過式(9)使輸出權值得到了最小的訓練誤差,自身的最小范數也得到了最優的泛化性能,最終計算結果使得范數的最小二乘解是唯一的,從而使算法不會產生局部最優解。
轉子振動試驗臺可以模擬振動信號,通過人為措施制造一些故障來模擬汽輪機轉子的振動故障。試驗裝置包括轉子ZXP- 4A、振動試驗臺、數字測振儀主機、信號采集器、電渦流傳感器、計算機以及信號處理器DASP等。模擬的故障分為3類,包括不對中、不對中加松動、轉子質量不平衡。各種故障模擬的方法具體如下:不對中故障是將聯軸器換成硬質橡膠管,并在軸末端的軸承座底墊上1~2個墊片,人為地將軸承座扭轉一定角度實現;不對中加松動故障則是在不對中的試驗中同時加入軸承座松動來實現;不平衡故障通過在臨近電渦流傳感器的轉子轉盤上旋入3~5個螺絲釘。
故障信號的原始振動頻率為1 000 Hz,采取樣本點數為8 000點,試驗中,3種轉子轉速分別為1 000 r/min、1 150 r/min和1 200 r/min。在每個轉速下,每種故障采取10組樣本數據。
故障診斷過程中,為了全面刻畫轉子系統不同類型的故障特性,本文將采用混合域特征融合方法(時域和頻域的融合)來描述轉子不同故障的信息,從而解決汽輪機故障診斷方法的通用性問題。從樣本信號中選取11個時域特征和3個頻域特征來構造14維特征空間,用絕對均值、均方根值、方根幅值、歪度、峰值指標、裕度指標、峭度指標、最大峰值、方差、峭度、脈沖指標代表11個時域參數,將平均頻率、譜峰穩定指數、相對功率譜能量作為頻域統計指標。在試驗數據中,截取長度為t的振動信號,利用相空間重構方法將數據劃分為N個子數據量,然后再分別算出每個子數據量的14維特征值,這樣就構造了N×14的高維特征矩陣,N代表樣本點數,高維特征空間包括了14種描述機械振動特性的特征參數。
3種降維方法的特征分布圖如圖1所示。

圖1 3種降維方法的特征分布圖
分別用LLE、LTSA、LLTSA對高維矩陣X降維,得到低維空間Y,然后投影到可視空間來完成視覺故障分類。設定近鄰點數K=15,投影維數d=3。在分析過程中,LLE的分類效果最差,3種故障樣本有交疊的部分,而且不同故障的類型距離也非常近,不能區分故障。LTSA的分類效果相對于LLE要好一些,但是不對中和不平衡故障樣本也有交疊的部分,不同故障類型距離也較近,不太容易進行故障分類。LLTSA效果較好,不同故障點沒有交疊的部分,而且也相對距離較遠,容易分辨不同類型的故障。
為了進一步說明LLTSA的性能,每類故障選用160個訓練樣本,80個測試樣本,選用支持向量機作為分類器對結果進行分析、通過反復試驗,確定高斯函數為核函數,確定核半徑σ=0.99和誤差懲罰參數λ=100為最優參數,計算機配置為Core(TM)2,CPU 2.20 Hz,內存2 GHz。不同特征提取方法比較如表1所示。從表1可以看出,每種方法的樣本訓練時間和測試時間相差不大,但是LLTSA與SVM構造的故障分類器訓練準確率和測試準確率最高,充分體現了LLTSA具有較高的綜合性能。

表1 不同特征提取方法比較
本文以20作為初始化隱藏節點個數,然后以5為單位依次遞加,選取Sin、Sigmoidal、Radial basis作為激活函數進行試驗。測試準確率變化曲線如圖2所示。

圖2 測試準確率變化曲線
從圖2可以看出,隨著隱藏節點數的增加,各種激活函數的測試準確率也隨之增加,增加到一定程度后都保持穩定。經綜合考慮,我們確定Sin函數為ELM的激活函數,最優隱藏節點數確定為70。BP網絡模型選用運算速度最快、最穩健的Levenberg-Marquardt 算法,確定最佳隱藏節點數為130。每類故障依然選用160個訓練樣本和80個測試樣本。
不同診斷模型比較如表2所示。

表2 不同診斷模型比較
從表2可以看出,在訓練速度方面,由于ELM自動調整網絡的輸入權值以及隱元的偏置,LLTSA和ELM構造的故障分類器所用的訓練時間非常短;而SVM和BP網絡的訓練過程需要反復迭代來確定參數,所以耗時較長;ELM的測試速度也要好于其他兩者,訓練和測試準確率也非常高,說明該模型的泛化能力更好。
本文將流形學習方法應用到轉子故障診斷中,提出了一種有效的線性局部切空間排列算法(LLTSA)。將LLTSA的維數化簡效果與LTSA、LLE作對比,表明了LLTSA算法成功提取了高維非線性數據的低維流形的特征,明顯改善了故障模式識別的分類效果。這3種流形算法維數化簡后的故障診斷精度表明,無論是在提取低維流形特征方面,還是在故障診斷率方面,LLTSA的分類性能都優于LTSA、LLE。
不同的激活函數會影響ELM的性能,本文使用了Sin、Sigmoidal、Radial basis作為激活函數進行試驗,說明了Sin函數和其他激活函數相比,具有更好的測試分類效果。通過LLTSA+ELM和其他兩種故障診斷模型對比,充分證明了ELM在訓練速度、測試速度、準確率方面的優越性。
[1] 簡小剛,張艷偉,馮躍,等.工程機械故障診斷技術的研究現狀與發展趨勢[J].中國工程機械學報,2005,3(4):446-449.
[2] 程加堂,艾莉,徐紹坤.汽輪機轉子故障診斷中的應用[J].自動化儀表,2012,33(11):13-14.
[3] Seung H S,Daniel D L.The manifold ways of perception[J].Science,2000,29(55):2268-2269.
[4] Kouropteva O,Okun O,Pietikainen M.Supervised locally linear embedding algorithm for pattern recognition[J].Pattern Recognition and Image Analysis,2003,26(9):386-394.
[5] Liu X M,Yin J W,Feng Z L,et al.Orthogonal neighborhood preserving embedding for face recognition[C]//2007 IEEE International Conference on Image Processing,New York,USA:IEEE,2007:133-136.
[6] 薛廣鑫,陳軍,蔣能飛.基于局部線性嵌入和云神經網絡的轉子故障診斷方法[J].振動與沖擊,2012,31(23):100-103.
[7] Huang G B,Babri H A.Upper bounds on the number of hidden neurons in feed forward networks with arbitrary bounded nonlinear activation functions[J].IEEE Transaction on Neural Networks,1998,9(1):224-229.
[8] Law Y W,Etalle S,Hartel P H.Key Management with group-wise pre-deployed keying and secret sharing pre-de-ployed keying[R].Technical Report TR-CTIT- 02-25,University of Twente,2002.
[9] Eschenauer L,Gligor V D.A Key management scheme for distributed sensor networks[C]//Proceeding of ACM Conference on Computer and Communication Security,2002:41-47.
[10]常玉清,李玉朝,王福利.基于極限學習機的生化過程軟測量建模[J].系統仿真學報,2007,19(23):5587-5590.
[11]萬鵬,王紅軍,徐小力.局部切空間排列和支持向量機的故障診斷模型[J].儀器儀表學報,2012,33(12):2790-2795.
[12]王忠峰,湯偉,黃俊梅.BP神經網絡在軸承故障診斷中的研究與應用[J].化工自動化儀表,2010,38(3):327-331.