房立清, 呂 巖, 張前圖, 齊子元
(軍械工程學院 火炮工程系,石家莊 050003)
基于半監督鄰域自適應LLTSA算法的故障診斷
房立清, 呂 巖, 張前圖, 齊子元
(軍械工程學院 火炮工程系,石家莊 050003)
為了有效利用振動信號進行故障診斷,提出了一種基于半監督鄰域自適應線性局部切空間排列(SSNA-LLTSA)算法的故障診斷方法。從多域提取振動信號的混合特征,構建原始高維特征集。利用半監督鄰域自適應線性局部切空間排列算法對原始特征集進行維數約簡,提取出辨識性較高的敏感特征子集。將得到的低維特征輸入SVM分類器進行識別,判斷故障類型。液壓泵故障診斷實驗結果表明,該算法克服了LLTSA無監督和使用全局統一鄰域參數的不足,可更有效地尋找數據的低維本質流形,提高了識別準確率,具有一定優勢。
故障診斷;維數約簡;半監督;鄰域自適應;LLTSA
目前,機械設備的監測方式日趨多元化,設備運行監測數據涵蓋了其工作狀態的大量信息。振動信號通常作為設備狀態信息的載體[1],對其從多角度提取特征并進行分析處理是實現設備狀態檢測的常用方法。但經多角度特征提取創建的高維特征集中往往包含一定數量的非敏感特征,且存在大量的冗余和混疊信息[2],降低了數據的區分度,影響機器識別精度。因此,須采用維數約簡方法對高維多域特征集中敏感特征進行提取,獲取分類錯誤率低、敏感性高的低維特征。
自Tenenbaum等[3-4]提出流形學習的方法后,流形學習在圖像處理、人臉識別和故障診斷等領域得到了較為廣泛的應用[5-6],成為一類重要的維數約簡算(法。線性局部切空間排列[7](Linear Local Tangent Space Alignment, LLTSA)作為一種新型流形學習算法,比局部保持投影[8](Locality Preserving Projection, LPP)等算法具有更好的維數約簡能力。但LLTSA是一種無監督的流形學習算法,降維過程中不能有效利用少量樣本的類別信息;且在維數約簡時,使用全局統一的鄰域參數,導致算法性能受到影響,降低維數約簡效果。
因此,本文提出了一種基于半監督鄰域自適應線性局部切空間排列(Semi-Supervised Neighborhood Adaptive Linear Local Tangent Space Alignment,SSNA-LLTSA)算法的故障診斷方法。首先,從多域提取振動信號特征,構建原始特征集;然后,將SSNA-LLTSA應用在多域特征構成的高維特征集中,該算法有效地克服了LLTSA無監督和使用全局統一鄰域參數的不足,可充分挖掘數據信息的本征流形結構,提高所得低維特征集的可辨識性。最后,將得到的低維特征子集輸入分類器,對設備運行狀態進行識別。通過液壓泵故障診斷實例驗證了本文所提方法的有效性。
1.1 問題描述
LLTSA的主要思想[9]是尋找一個轉換矩陣A將RD空間中具有N個點的含噪數據集XORG映射為Rd空間數據集Y=[y1,…,yN],即
Y=ATXORGHN(d (1) 式中:HN=I-eeT為中心化矩陣;I為單位矩陣;e為所有元素為1的N維列向量;Y為XORG的d維非線性流形。 1.2 算法步驟 LLTSA主要有以下幾個步驟 (1) 構建鄰域 采用ε-臨界法搜索數據點xi的鄰域Xi,若dist(xi-xj)≤ε,則判定xj為xi的鄰近點,得到Xi=[xi1,…,xik],k為鄰近點個數。 (2) 獲取局部鄰域切空間 在數據樣本點xi的鄰域中尋找一組正交基Qi,并將Xi投影到Qi上提取鄰域內的主要流形結構信息,即 (2) 式中:Hk=I-eeT/k為中心化矩陣;e為k維全1向量;I為單位矩陣。Qi的求取過程相當于在Xi上進行主成分分析(Principle Component Analysis, PCA),Qi為由XiHk的d個最大特征值所對應的d個特征矢量構成的切空間正交基矩陣。Xi的局部低維坐標為 (3) (3) 局部切空間全局排列 局部切空間全局排列實際上是對數據集的本征結構進行重構的過程,為了使低維坐標能夠保持更多的高維數據信息,通常需要使得重構誤差達到最小,即如下目標函數 (4) XHNBHNXTα=λXHNXTα (5) 2.1 半監督線性局部切空間排列(SS-LLTSA) LLTSA屬于無監督的維數約簡算法,無法將類別信息融入維數約簡過程來提高低維特征集的可辨識屬性[10]。然而在實際中,部分樣本的類別信息往往是可以獲取的,在高維樣本空間中,具有相同類別信息的點具有相同的流形結構,不同類別點的流形結構不同,對這些類別信息進行有效的利用能夠使算法更充分地提取高維空間中的本質流形。因此,將半監督學習思想引入LLTSA算法,具體步驟如下: (1) 距離度量公式 LLTSA通過計算樣本點間的歐式距離,然后直接通過歐式距離的大小來選擇鄰近點,但歐氏距離只能反映樣本間的空間位置關系,不能反映流形結構關系[11]。因此,結合文獻[12]將多種距離結合作為度量函數的思想,文中將余弦相似度[13]和歐氏距離結合,即 (6) 表1 三種方法計算的距離值 (2) 半監督方法重構距離矩陣 假設有高維故障數據特征集X={X1,X2},其中X1={(x1,l1),(x2,l2),…,(xm,lc)},m為含類別信息樣本個數,li(i=1,2,…,c)為樣本點xi的類別,c為類別數目;X2=(xm+1,xm+2,…,xm+n},n為不含類別信息樣本個數。在構建鄰域時,選擇的鄰近點中同類樣本點個數越多,異類樣本點個數越少,則構建的局部空間越準確,降維所得的低維數據越容易保持高維數據的本質流形。因此,為提高算法的降維效果,并充分利用部分樣本類別信息,定義距離矩陣如式(7)所示 (7) 圖1 D與d關系曲線 2.2 鄰域參數自適應調整 在LLTSA算法中鄰域參數ε的選取對降維結果起著直接的影響。若參數選取過大,則會將非鄰近點納入鄰域,破壞局部鄰域結構;若參數選取過小,則會導致鄰域構建不關聯,而無法準確地將局部切空間整合為全局的低維流形,因此鄰域參數ε的選取非常關鍵[14]。一般情況下,LLTSA采用的是全局統一的參數ε,而實際中數據點的局部空間分布往往并不均勻,選取全局統一的鄰域參數必然會降低算法的維數約簡能力。若能根據數據點的局部空間分布自適應地調整鄰域參數ε,則將會提高算法的降維能力,得到的低維數據也更能反映高維數據的本質流形。Parzen窗概率密度估計[15]是一種非參數的概率密度估計方法,它不需要有關數據分布的先驗知識,對數據分布不附加任何假定,可從數據集本身出發估計數據總體概率密度。因此,利用Parzen窗估計樣本數據的分布,根據每個樣本點鄰域空間的概率密度自適應地調整局部鄰域參數。 假設高維空間RD中存在一個數據集X={x1,x2,…,xN},對于數據點xi(i=1,2,…,N),Parzen窗的概率密度估計式為 (8) 設定LLTSA中鄰域參數ε初始值為ε0,則數據點xi的初始鄰域為Nε0(xi),窗函數選擇平滑性較好的正態窗函數[16] (9) 窗寬h對估計結果有較大影響,若窗寬選擇過大,則會導致估計的分辨力降低,反之則會使估計的統計變動很大,根據文獻[15]設定窗寬h=ε0,則數據點xi的鄰域概率密度為 (10) 根據p(xi)通過式(11)調整鄰域參數ε (11) 分析式(11)可知:當數據點xi的概率密度小于平均概率密度,即其局部空間較稀疏時,可自動減小ε(xi),降低非鄰近點納入鄰域的幾率,保證建立數據點鄰域空間的可靠性;當數據點的概率密度較大時,能自動增大ε(xi),保持鄰域的局部線性結構,保證低維數據集全局結構的恢復。 2.3 半監督鄰域自適應LLTSA算法流程 SSNA-LLTSA算法的具體步驟如下: 輸入,高維空間數據樣本集X={(x1,l1),(x2,l2),…,(xm,lc),xm+1,xm+2,…,xm+n},xi∈RD,li∈R為數據樣本類別信息,目標低維特征空間維數d,鄰域參數初始值ε0。 輸出,低維特征向量Y,轉換矩陣A。 (1) 根據式(6)和式(7)計算高維空間數據點的距離矩陣D,并對距離矩陣進行歸一化; (2) 設定鄰域參數初始值ε0,根據式(10)和式(11)計算調整后的鄰域參數ε(xi); 為了提高特征提取的全面性,在特征提取時,需要從不同角度提取原始振動信號特征。因此,本文從四個方面進行特征提?。孩?提取原始信號的波形、峰值、脈沖、裕度、偏斜度、峭度共6個時域指標;② 提取原始信號均值頻率、標準差頻率、頻率中心、均方根頻率共4個頻域指標;③ 對原始信號進行局部特征尺度分解[17](Local Characteristic-scale Decomposition,LCD),從時頻域提取前m個內稟尺度分量(Intrinsic Scale Component,ISC)的能量信息和將ISC分量組成m維矩陣進行奇異值分解所得的奇異值作為特征;④ 計算m個ISC分量的模糊熵,從復雜度域提取特征。基于SSNA-LLTSA的故障診斷方法流程如圖2所示,具體步驟如下: 步驟1 獲得原始振動信號,按一定的采樣頻率采樣,得到一定數量的數據樣本。 步驟2 確定m值,并對訓練樣本和測試樣本進行特征提取,得到高維混合域特征集。 步驟3 將訓練樣本和測試樣本的高維特征輸入SSNA-LLTSA算法,得到d維特征集,1≤d≤D。 步驟4 將訓練樣本的d維特征子集用于SVM訓練,使用已訓練的(Support Victor Machine,SVM)分類器對測試樣本進行分類識別。 圖2 基于SSNA-LLTSA的故障診斷流程 4.1 故障數據獲取 實驗數據源于液壓泵實驗平臺,液壓泵型號SY-10MCY14-1EL,為斜盤式軸向柱塞泵,柱塞數為7,額定轉速為1 500 r/min,在泵端蓋處安裝壓電式加速度傳感器采集振動信號,傳感器安裝位置如圖3所示。 分別選用一個柱塞松靴故障(S1)、兩個柱塞松靴故障(S2)、正常(N)、滑靴磨損故障(H)的液壓泵運行狀態進行實驗,主溢流閥壓力為10 MPa,采樣頻率為20 kHz。按時間順序以2 048個采樣值為一組數據樣本,分別測取4種運行狀態數據各40組,液壓泵4種狀態的振動信號如圖4所示。 圖3 傳感器安裝位置 (a)單松靴信號(b)雙松靴信號(c)正常信號(d)滑靴磨損信號 圖4 液壓泵4種狀態時域波形 Fig.4 Time domain waveform of hydraulic pump in four states 4.2 實驗結果與分析 在對數據樣本進行特征提取時,首先要對其進行LCD分解,圖5所示為雙松靴故障中一組數據樣本的分解結果。 分析全部樣本數據分解結果可知,多數數據樣本被分解為10個ISC分量和1個剩余量,因此,可確定m=10,按照基于SSNA-LLTSA的故障診斷方法中步驟2所述對數據樣本中的每一組數據進行特征提取,可得到4個維數為40×40的特征矩陣。隨機選取每種狀態的15組數據作為訓練樣本,剩余25組作為測試樣本,訓練樣本中含類別信息和未含類別信息的樣本按1∶2比例隨機分配。 將特征集輸入SSNA-LLTSA中進行維數約簡,作為比較,選用主成分分析(PCA)、LLTSA對特征集也進行維數約簡。使用SSNA-LLTSA、LLTSA算法時,目標維數d和鄰域參數ε0通過多次試驗確定為d=16,ε0=0.8。圖6為3種方法得到的低維特征集的前3個矢量三維空間分布圖。 (a)(b)(c)(d)(e)(f)(g)(h)(i)(j)(k) 圖5 雙松靴故障振動信號LCD分解結果 圖6 3種算法維數約簡結果對比 Fig.6 Comparison of dimension reduction results of three algorithms 分析圖6可知,PCA對雙松靴故障(S2)的聚類效果較差,對滑靴磨損故障(H)、單松靴故障(S1)和正常狀態(N)實現了有效的聚類,但三者的類間距較小,且存在著一定的混疊現象;LLTSA的聚類效果相比于PCA有所提高,可有效區分4種狀態,但N和S1狀態間存在一定程度的混疊,對S2降維后類內散度較大;SSNA-LLTSA可將4種狀態完全區分開,具備較高的類別區分度,相比于PCA和LLTSA,每種狀態內的數據聚集性有所提高,取得了較理想的降維效果。 為了能夠定量評價文中所提出算法的性能,將所得低維特征集的類間距與類內散度的比值作為評價指標,比值越大,說明同類樣本的低維坐標分布越集中,異類樣本越分散,降維效果越理想。分別給出采用不同方法降維得到低維特征集的指標值如圖7所示,圖7中橫軸的1~6分別表示PCA、LLTSA、SSNA-LLTSA、SSNA-LLTSA(歐氏距離)、NA-LLTSA(Neighborhood Adaptive LLTSA)、SS-LLTSA(Semi-Supervised LLTSA)降維方法。 分析圖7可知,將半監督(SS)和鄰域參數自適應(NA)與LLTSA算法結合的低維特征聚類效果要優于僅將半監督或鄰域參數自適應與LLTSA結合;同時,采用文中所提出的距離度量方式的效果要優于歐氏距離。 圖7 6種方法低維特征類間距與類內散度的比值 將采用不同方法維數約簡得到的低維特征輸入SVM進行分類識別。實驗中SVM的核函數選用性能較好的徑向基核函數(RBF),設置懲罰參數C=1,核函數參數g=1,識別結果如表2所示(其中None表示高維特征集未經降維處理)。 分析表2可知,未經降維處理的高維特征集識別率偏低,對于本次實驗而言可能從多域提取的特征集中包含大量的冗余混疊信息,影響SVM的識別精度;由于PCA屬于線性降維方法,旨在將高維數據轉換到數據最大方差集方向,忽略了原始特征集的非線性結構,因此使用PCA降維后的平均識別率低于LLTSA;但LLTSA屬于無監督降維方法,沒有考慮原始樣本的類別信息,且選取的鄰域參數ε0為全局固定的參數,所以LLTSA的診斷精度低于SSNA-LLTSA(歐氏距離)。由于文中提出的算法采用余弦相似度和歐氏距離結合的度量函數計算樣本點間的距離,融合了樣本點的空間位置和夾角信息,得到的距離更精確,構建的局部空間中樣本點的流形相似性更高,使獲得的低維特征具有更好的辨識能力,所以平均準確率達到了最高。 表2 支持向量機識別結果 本文提出了一種基于半監督鄰域自適應線性局部切空間排列(SSNA-LLTSA)算法的故障診斷方法。該方法采用余弦相似度與歐氏距離結合的距離度量方式代替傳統的歐氏距離,并在維數約簡時利用少量帶有類別信息的樣本重構原始特征空間樣本點間的距離矩陣,使同類樣本點間的距離更近,異類樣本點間的距離更遠,改善數據的區分度;同時,針對LLTSA算法中采用統一鄰域參數的不足,利用Parzen窗估計樣本點的空間分布情況從而自適應地調整鄰域參數,可更有效地獲取數據的低維本質流形。利用SSNA-LLTSA對從多域提取出的原始特征集進行維數約簡,將獲得的低維特征輸入SVM進行分類,結合SSNA-LLTSA的維數約簡能力和SVM的模式識別優勢,可對機械故障進行有效的診斷,提高了識別準確率,具備一定優勢。 [1] 張淑清, 孫國秀, 李亮, 等. 基于LMD近似熵和FCM聚類的機械故障診斷研究[J]. 儀器儀表學報, 2013, 34(3): 714-720. ZHANG Shuqing, SUN Guoxiu, LI Liang, et al. Study on mechanical fault diagnosis method based on LMD approximate entropy and fuzzy C-means clustering[J]. Chinese Journal of Scientific Instrument, 2013, 34(3): 714-720. [2] 蘇祖強,湯寶平,姚金寶,等.基于敏感特征選擇與流形學習維數約簡的故障診斷[J].振動與沖擊,2014,33(3):70-75. SU Zuqiang, TANG Baoping, YAO Jinbao, et al. Fault diagnosis method based on sensitive feature selection and manifold learning dimension reduction[J].Journal of Vibration and Shock,2014,33(3):70-75. [3] TENENBAUM J B, SILVA V, LANGFORD J C. A global geometric framework for nonlinear dimensionality reduction[J]. Science, 2000, 290:2319-2323. [4] ROWEIS S T, SAUL L K. Nonlinear dimensionality reduction by locally linear embedding[J]. Science, 2000, 290:2323-2326. [5] JIE G, WEI J, LING Z, et al. Locality preserving discriminant projections for face and palm print recognition[J]. Neurocomputing, 2010, 73: 2696-2707. [6] 楊慶,陳桂明,何慶飛,等.局部切空間排列算法用于軸承早期故障診斷[J].振動、測試與診斷,2012,32(5): 831-835. YANG Qing, CHEN Guiming, HE Qingfei, et al. Inchoate fault diagnosis of rolling bearing based on local tangent space alignment algorithm[J]. Journal of Vibration, Measurement & Diagnosis, 2012, 32(5): 831-835. [7] ZHANG T H, YANG J, ZHAO D L, et al. Linear local tangent space alignment and application to face recognition[J]. Neurocomputing, 2007, 70: 1547-1553. [8] HE X F, YAN S C, HU Y X, et al. Face recognition using laplacianfaces[J]. IEEE Trans. Pattern Analysis and Machine Intelligence, 2005, 27 (3):328-340. [9] 李鋒, 湯寶平, 陳法法. 基于線性局部切空間排列維數化簡的故障診斷[J]. 振動與沖擊, 2012, 31(13): 36-40. LI Feng, TANG Baoping, CHEN Fafa. Fault diagnosis model based on dimension reduction using linear local tangent space alignment[J]. Journal of Vibration and Shock, 2012, 31(13): 36-40. [10] 蘇祖強, 湯寶平, 鄧蕾,等. 有監督LLTSA特征約簡旋轉機械故障診斷[J]. 儀器儀表學報, 2014, 35(8): 1766-1771. SU Zuqiang, TANG Baoping, DENG Lei, et al. Rotating machinery fault diagnosis with supervised-linear local tangent space alignment for dimension reduction[J]. Chinese Journal of Scientific Instrument, 2014, 35(8): 1766-1771. [11] 劉志勇,袁媛. 基于測地距離的半監督增強[J].計算機工程與應用,2011,47(21):202-204. LIU Zhiyong, YUAN Yuan. Semi-supervised boosting based on geodesic distance[J]. Computer Engineering and Applications, 2011,47(21):202-204. [12] CAO Q, YING Y M, LI P. Similarity metric learning for face recognition[C]//Proceedings of the 2013 International Conference on Computer Vision. Sydney: IEEE, 2013: 2408-2415. [13] 李文博,王大軼,劉成瑞. 一類非線性系統的故障可診斷性量化評價方法[J].宇航學報,2015,36(4):455-462. LI Wenbo, WANG Dayi, LIU Chengrui. An approach to fault diagnosability quantitative evaluation for a class of nonlinear systems[J]. Journal of Astronautics, 2015, 36(4):455-462. [14] 董冀媛,穆志純,歐陽定恒. 基于改進的局部切空間排列算法的多姿態人耳識別[J].北京科技大學學報,2010,32(12):1637-1642. DONG Jiyuan, MU Zhichun, OUYANG Dingheng. Multi-pose ear recognition base on a local tangent space aliment algorithm[J]. Journal of University of Science and Technology Beijing, 2010,32 (12):1637-1642. [15] 楊望燦,張培林,吳定海,等. 基于改進半監督局部保持投影算法的故障診斷[J]. 中南大學學報(自然科學版),2015,46(6):2059-2064. YANG Wangcan, ZHANG Peilin, WU Dinghai, et al. Fault diagnosis based on improved semi-supervised locality preserving projections[J]. Journal of Central South University (Natural Science), 2015,46(6):2059-2064. [16] 劉晗,張慶,孟理華,等. 基于Parzen窗估計的設備狀態綜合報警方法[J].振動與沖擊,2013,32(3):110-114. LIU Han, ZHANG Qing, MENG Lihua, et al. Comprehensive alarm method for equipment conditions based on parzen window estimation[J]. Journal of Vibration and Shock, 2013,32 (3):110-114. [17] 曾鳴,楊宇,鄭近德,等. 基于LCD和KNNCH分類算法的齒輪故障診斷方法[J].中國機械工程,2014,25(15):2049-2054. ZENG Ming, YANG Yu, ZHENG Jinde, et al. Fault diagnosis approach for gears based on LCD and KNNCH classification algorithm[J]. China Mechanical Engineering, 2014,25(15):2049-2054. Fault diagnosis based on semi-supervised neighborhood adaptive LLTSA FANG Liqing, Lü Yan, ZHANG Qiantu, QI Ziyuan (Department of Artillery Engineering, Ordnance Engineering College, Shijiazhuang 050003, China) In order to diagnose faults effectively using vibration signals, a fault diagnosis method based on the semi-supervised neighborhood adaptive linear local tangent space alignment (LLTSA) was proposed. Firstly, the mixed features of vibration signals were extracted in multi-domain to construct the original high-dimensional feature set. Then, the algorithm of semi-supervised neighborhood adaptive LLTSA was used to reduce the dimension of the original feature set and to extract the sensitive feature subset with the higher identifiability. Finally, lower dimensional features were input into a SVM classifier to recognize fault types. The fault diagnosis test results of hydraulic pumps indicated that the proposed algorithm overcomes drawbacks of LLTSA without supervision and using globally unified neighborhood parameters; lower dimensional intrinsic manifolds of data can be more effectively found with this algorithm; it improves the recognition accuracy and has certain advantages. fault diagnosis; dimension reduction; semi-supervised; neighborhood adaptive; linear local tangent space algorithm (LLTSA) 河北省自然科學基金(E2016506003) 2015-12-31 修改稿收到日期:2016-05-26 房立清 男,博士,教授,1969年生 TH113.1;TN911.7 A 10.13465/j.cnki.jvs.2017.13.030


2 半監督鄰域自適應LLTSA算法











3 基于SSNA-LLTSA的故障診斷方法

4 實驗驗證






5 結 論