籍永建,王紅軍
(1.北京信息科技大學 現代測控技術教育部重點實驗室,北京 100192;2.北京信息科技大學 機電工程學院,北京 100192)
回轉機械的振動信號中隱含著大量與運行狀態相關的信息。合理提取所關注的信息能更好地評價其運行狀態。流形學習算法是近年來比較熱門的降維方法,它能夠提取高維數據集中的低維流形,更直觀地反應數據的本質特征。目前流形學習方法主要有主成份分析法(PCA)[1]、多維尺度分析算法(MDS)[2]、局部線性嵌入(LLE)[3]和等距映射(Isomap)[4]等。
等距映射(Isomap)算法是一種全局算法,建立在經典MDS的基礎上,它使用比歐氏距離更好地反映數據全局幾何結構的測地距來處理高度扭曲折疊的非線性流形,Isomap對數據進行降維的步驟如下[5]:
1)構建鄰域圖G;
對于數據集X中的所有數據點xi,(XRD? ),以K最近鄰或以ε為半徑的球定義其鄰域,離xi最近的K個數據點或者與xi距離小于ε的所有點都記作xi的鄰接點。設任意兩個鄰接點xi與xj的邊長為。
若xi與xj之間存在邊,則否則接下來對所有的k=1,2,3,...,N,依次更新 (i,j)dG的值;
dG(i,j)=min{dG(i,j),dG(i,k)+dG(k,j)},至此得到距離矩陣dG={dG(i,j)},表示圖G中每兩點之間的最短路徑距離。
3)構造低維嵌入空間;
將殘差(residual variance)作為評價降維效果的標準,殘差計算公式如式(1)。

Isomap算法中唯一的自由參數為K或鄰域球半徑ε,隱含參數為低維嵌入空間維數d。一般根據低維嵌入殘差R來估計數據的本征維數。也就是說數據流形的固有維數d通過殘差下降曲線的“拐點”來確定[7]。在鄰域選擇中,如果鄰域太大,那么鄰域中會包含流形中其他分支中的數據點,導致低維嵌入時發生錯誤;如果鄰域太小,會將流形分割成很多不連通的區域。利用式(2)[8,9]確定最優鄰域參數K。

上式表明使殘差最小的鄰域參數即為最優鄰域參數。
利用內裝IC壓電加速度傳感器(ULT2010)采集本特利轉子試驗臺在正常、碰磨、松動三種運行狀態下的振動數據。設置采樣頻率為8192Hz。數據采集現場如圖1所示。

圖1 數據采集現場
由于采集的振動信號中含有噪聲,首先對信號進行去噪處理,然后進行歸一化處理,選取13個時域特征、7個頻域特征構造高維特征空間。時域指標有絕對均值、均方根值、方根幅值、最大峰值、方差、峰峰值、峭度、歪度、峰值指標、波形指標、脈沖指標、欲度指標、峭度指標,頻域指標有平均頻率、諧峰穩定指數,以及根據不同狀態的頻率特點將頻域分成的5個頻帶[10]。利用上述指標分別構造不同運行狀態振動信號的高維特征空間。
2.3.1 確定嵌入維數d
選取正常運行時的數據構造的高維特征空間為例。初步設定鄰域參數K為8。運用Isomap對其進行降維處理。不同嵌入維數所對應的殘差值如表1所示。

圖2 不同嵌入維數d所對應的殘差值

表1 不同嵌入維數d所對應的殘差值
由表1、圖2可以看出,d=2時殘差值出現拐點,所以嵌入維數選為2。
2.3.2 鄰域參數K的取值
選取正常運行時的數據構造的高維特征空間。設置嵌入維數d=2。運用Isomap對其進行降維處理。不同鄰域參數K對應的殘差值如表2所示。

表2 不同鄰域參數K所對應的殘差值

圖3 不同鄰域參數K所對應的殘差值
由表2、圖3可以看出,K=7時殘差值最小,為0.0016643,所以取鄰域參數K=7。
2.3.3 提取低維流形
經過以上分析,選取嵌入維數d=2,鄰域參數K=7。運用Isomap分別對轉子系統正常、碰磨、松動三種運行狀態的振動信號構造的高維特征空間進行降維處理,提取其中的低維流形。三種運行狀態對應的二維流形如圖4所示。

圖4 降維后的二維流形圖
由圖4可以看出,等距映射算法能夠很好的區分轉子系統運行正常與故障時的低維流形,但是無法區別碰磨與松動兩種運行狀態。所以可以運用此方法來判別轉子系統是否正常運行,但是若對故障類型進行判別,則需要做進一步研究。
Isomap算法是一種典型的非線性流形學習方法,此算法能夠提取高維特征空間的低維流形。針對回轉機械運行狀態的識別問題,構造振動信號的高維特征空間,并運用Isomap算法提取轉子試驗臺不同運行狀態下振動信號的低維流形,結果表明,此種方法能夠很好地區分轉子系統正常運行與故障運行兩種運行狀態,但是在具體識別何種故障時仍有缺陷,需要做進一步探究。
[1]T.Hastie and W.Stuetzle.Principal Curves[J].Journal of the American Statistical Association,1989,84:502-516.
[2]T.Cox and M.Cox.Multidimensional Scaling[M].Chapman&Hall, Londom,2001.
[3]S.Roweis, J.Saul.Nonlinear dimensionality reduction by locally linear embedding[J].Science,2000,290:2323-2326.
[4]J.Tenenbaum,Vde Silva, J.Landford.A global geometric framework for nonlinear dimensionality reduction[J].Science, 2000,290:2319-2323.
[5]聶秀山,劉琚,秦豐林.基于等距映射的視頻水印算法[J].計算機工程,2010,19:237-238,243.
[6]張銀鳳,王晅,馬建峰.基于最優鄰域圖的等距映射流形學習算法[J].計算機工程與應用,2011,14:124-127,145.
[7]張銀鳳.流形學習算法的研究[D].陜西師范大學,2010.
[8]J.B.Tenenbaum,Vde Silva, J.C.Langford.The Isomap algorithm and topological stability-response[J].Science,2002, 295: 5552-5559.
[9]O.Samko,A.D.Marshall, RL.Rosin, Selection of the optimal parameter value for the Isomap algorithm[J].pattern Recognition Letters,2006,27:968-979.
[10]萬鵬.基于流形學習的主軸系統故障診斷方法研究[D].北京信息科技大學,2013.