寧子俊,陳 濤*,徐 峰,王立勇,賈 然
(1.北京信息科技大學 現代測控技術教育部重點實驗室,北京 100192;2.中國人民解放軍32184部隊,北京 100075)
綜合傳動裝置是一種機械、液壓、電控高度耦合的復雜機電系統,是實現特種車輛裝備動力傳遞的核心部件。其運行狀態一旦發生異常,將影響特種車輛的機動性能,進而造成嚴重的經濟及軍事損失。
路面負載及戰場環境的隨機性,使得綜合傳動裝置運行工況復雜多變;同時,綜合傳動內部離合器、轉向泵馬達、液力變矩器等關鍵傳動部件能量流間的相互耦合,使得綜合傳動裝置運行狀態參數存在復雜的動態變化特征。這種特征與綜合傳動裝置異常引起的特征難以被直接區分,為綜合傳動裝置狀態監測數據異常檢測帶來困難。因此,開展復雜工況條件下對綜合傳動裝置狀態監測數據異常檢測方法的研究,對實現綜合傳動裝置健康管理與劣化評估及提高特種車輛裝備的安全性與可靠性具有重要意義。
近年來,由于具有極強的適應性和深層信息挖掘的能力,深度學習已逐漸被應用于復雜機電系統的異常檢測中[1-8]。
羅輝[9]將深度學習、遷移學習的理論與方法引入到民航發動機氣路異常檢測中,提出了一種無標簽條件下,基于權重約束對抗判別領域自適應的發動機氣路異常檢測方法,通過真實的氣路狀態監測數據驗證了該方法的正確性。戴俊等人[10]提出了一種基于生成對抗網絡和自動編碼器的異常檢測方法,通過兩次編碼得到異常的潛在特征差異;與傳統方法相比,其所得差異值指標在異常發生時能更穩定地表征故障演化過程。ZHAO Hong-shan等人[11]提出了一種基于棧式自編碼器網絡的深度學習方法,采用自適應閾值檢測方法重構了誤差的趨勢,并將其作為檢測發電機異常狀態的預警準則,實現了風力發電機組異常狀態的檢測與分析目的。席亮等人[12]提出了一種基于深度對抗學習潛在表示分布的異常檢測模型,解決了單類分類器超參數敏感問題,從而有效提高了異常檢測的整體性能。向玲等人[13]提出了一種基于級聯深度學習預測模型的風電機組狀態檢測方法,結果表明該方法能夠準確地檢測到齒輪箱軸承溫度異常,為風電機組安全可靠地運行提供了重要保障。LIU Yong-zhi等人[14]針對高速列車軸承溫度異常問題,提出了基于層次分析法熵的檢測模型和基于雙向長短期記憶網絡的實時預測模型,并采用證據理論給出了最終決策,結果表明該方法能成功地消除一維模型診斷的誤判現象,具有良好的預警能力。洪星蕓[15]設計了一種異常檢測框架,將多變量和注意力機制引入循環神經網絡模型,提出了兩種網絡結構分別用于目標變量的單步和多步預測,解決了火力發電機組設備的旋轉分離器異常檢測等問題。
然而上述研究主要依賴于深度學習的深層信息挖掘能力,忽略了復雜機電系統狀態監測數據中隱含的關聯關系;同時,進行異常檢測時缺少對綜合傳動裝置“機-電-液”多域耦合特征的考慮[16]。
針對上述問題,筆者提出一種適用于復雜工況下綜合傳動裝置狀態監測數據異常檢測的方法。
首先,對狀態監測數據進行變量聚類,獲取最大關聯變量集;然后,利用深度降噪自編碼網絡構建適用于復雜工況下的關聯數據重構模型,獲取對異常數據敏感的偏差特征;最后,利用支持向量數據描述(SVDD)算法完成對復雜工況下綜合傳動裝置狀態監測數據異常的檢測工作。
綜合傳動裝置運行狀態監測數據異常檢測方法流程如圖1所示。

圖1 異常檢測方法流程圖
異常檢測方法具體流程如下:
1)利用基于數據密度的聚類方法(DBSCAN),分析狀態監測數據在斯皮爾曼相關距離[17]下的關聯密度;篩選出彼此存在潛在關聯關系的狀態監測數據,排除非關聯數據的干擾,為之后深度降噪自編碼網絡的訓練與特征挖掘提供更優的數據集;
2)對裝置正常運行狀態下的關聯數據集添加噪聲,并用以訓練深度降噪自編碼網絡,使其盡可能挖掘和學習復雜工況下綜合傳動裝置狀態監測數據的深層次特征與隱含信息;進而構建關聯數據重構模型,并生成與正常數據偏差穩定、與異常數據偏差明顯的重構數據。該類偏差特征因對異常數據更為敏感,且在正常工況下相對平穩,故可作為復雜工況下綜合傳動裝置狀態監測數據異常檢測的關鍵特征;
3)使用正常偏差特征集訓練SVDD異常檢測模型,獲取模型支持向量與最優超球體;通過判斷新數據的偏差特征是否在超球體內,實現對復雜工況下綜合傳動裝置狀態監測數據的異常檢測目的。
受綜合傳動裝置內多種能量流傳遞的影響,狀態監測數據在數據空間中存在特殊的關聯關系。分析數據結構中存在的關聯關系,有利于挖掘狀態監測數據的隱含信息,提升綜合傳動裝置狀態監測數據重構模型的整體性能。
DBSCAN算法具有在數據空間中發現任意形狀的簇,將密度足夠大的相鄰區域連接為一類,并將邊緣數據視為孤立點予以剔除的能力。因此,筆者將每個傳感器的監測數據視為一個個體,將監測數據間的關聯關系視為個體間的距離,利用DBSCAN算法對監測數據進行聚類,獲取高密度的簇,識別彼此具備關聯關系的狀態監測數據,為深度降噪自編碼網絡提供更有效的數據輸入。
DBSCAN算法流程如下:
1)在數據集中,任選一個未被訪問的個體,找出與其關聯距離在最小近鄰距離(esp)之內的所有鄰域個體。如果鄰域個體的數量小于最大鄰居數目(minPts),則當前個體被標記作為離群個體;
2)如果鄰域個體的數量大于等于minPts,則當前個體與其鄰域個體形成一個新簇,并將當前個體標記為已訪問;
3)逐個訪問簇中未被訪問的個體,當其鄰域個體的數量小于minPts,將標記為已訪問;當其鄰域個體的數量大于等于minPts,則其鄰域個體歸屬于同簇,并將當前個體標記為已訪問;
4)重復步驟1)~3),直至將所有點標記為已訪問。
斯皮爾曼相關系數是根據原始數據的排序位置進行求解,來評估兩個連續變量之間的單調關系。
綜合傳動裝置關聯節點的運行狀態參數整體上保持同步變化,斯皮爾曼相關系數能夠有效識別這種同步性。因此,筆者以斯皮爾曼相關距離作為DBSCAN算法中空間密度距離的度量標準,評價綜合傳動裝置狀態監測數據的關聯關系。
斯皮爾曼相關系數與斯皮爾曼相關距離d計算方法如下:
(1)
d=1-|ρ|
(2)
式中:i為訓練集樣本序號;n為訓練集樣本總數;ρ為兩組監測數據的關聯程度,取值范圍為-1~1,其絕對值越大表明關聯程度越高;d為兩組監測數據互為鄰居的距離,d取值范圍為0~1,距離越大表明兩組數據的關聯關系越弱。
綜合傳動裝置運行環境惡劣,使該裝置部分工況下的狀態監測數據存在較為明顯的動態變化特征;這種特征是造成綜合傳動裝置狀態監測數據異常難以被直接檢測的重要原因,因此,需要一種能夠適應多工況動態變化特征的數據重構方法,以此來獲取更加平穩的偏差特征。
深度降噪自編碼網絡具有對低維特征的深度挖掘能力,以及對含噪聲數據的降噪重構能力,成為現階段較為可靠的針對深度學習數據重構及異常的檢測方法。
自編碼網絡分為編碼器和解碼器兩個模塊。其中,筆者利用編碼器對輸入數據進行壓縮,獲取輸入數據的低維特征;利用解碼器對低維特征進行解碼,生成與訓練數據相似的重構數據。深度降噪自編碼網絡是采用深度學習的方法,挖掘復雜工況下綜合傳動裝置運行狀態更深層次的隱含信息,可以適應綜合傳動裝置復雜工況下狀態監測數據的動態變化,實現對狀態監測數據準確的重構目的。
深度降噪自編碼網絡的架構如圖2所示。

圖2 深度降噪自編碼網絡架構
深度降噪自編碼網絡的編碼器與解碼器有多層隱含層,網絡整體呈現對稱式結構,其構造公式如下:
z=f(x)=s(Winx+Bin)
(3)
x′=g(z)=s(Woutz+Bout)
(4)
式中:z為隱含特征;x′為重構數據;W為神經元權重;B為神經元偏置;f為編碼器映射函數;g為解碼器映射函數;s為激活函數。
其中,隱含層的激活函數為RelU函數,輸出層的激活函數為線性函數。
在綜合傳動裝置狀態監測數據中,重構難度更大的動態數據更值得關注。因此,筆者選用對高誤差更敏感的L2損失函數,其構造公式如下:
L(x,x′)=L(x,g(f(x)))=(x′-x)2
(5)
筆者應用深度降噪自編碼進行關聯數據重構時,在正常數據上添加高斯噪聲,形成加噪聲訓練集,將其作為模型的輸入進行訓練。通過這種方式改變模型的損失函數,以強迫模型學習關聯數據中更具有魯棒性的隱含信息,使得模型對含有一定噪聲的綜合傳動裝置狀態監測數據也能具備良好的數據重構能力,其表達式如下:
(6)

(7)

重構誤差e是衡量數據重構模型對每個節點狀態監測數據重構效果的重要指標。e值越小,說明數據重構模型對該節點的狀態監測數據重構效果越好,其表達式如下:
(8)
式中:i為訓練集樣本序號;n為訓練集樣本總數;j為傳感器編號。
針對綜合傳動裝置狀態監測數據重構模型,筆者利用編碼器提取裝置正常運行時,獲得監測數據的深層低維特征,并利用解碼器對正常特征進行解碼,獲得與正常狀態監測數據偏差極小的重構數據。異常數據經過編碼,將得到與正常數據不同的深層低維特征,這種特征無法通過解碼器進行正確的解碼,最終將獲得與異常狀態監測數據偏差較大的重構數據。因此,偏差特征p在正常工況下相對平穩,對異常數據更為敏感。
利用這種偏差特征可以對綜合傳動裝置狀態監測數據的異常進行檢測。
偏差特征計算公式如下:
(9)

偏差特征是對重構數據與模型輸入數據偏離程度的描述,正常數據的偏差特征可以近似地看做高斯分布。當裝置發生異常時,因綜合傳動裝置狀態監測數據的高耦合性,關聯數據彼此相互影響,進而造成異常數據的偏差特征在多個維度產生明顯變化。筆者利用SVDD算法通過在多維數據空間中尋找正常數據邊界,構建多維數據集最優超球體,對監測數據進行異常檢測工作。
因此,筆者使用正常數據偏差特征集訓練SVDD異常檢測模型,可獲取模型球心、半徑、支持向量等相關參數,并構建多維偏差特征的最優超球體。
該超球體構造問題描述如下:
s.t.‖φ(pi)-a‖2≤R2+ξi,ξi≥0,?i=1,…,n
(10)
式中:R為超球體半徑;a為超球體的球心;ξi為松弛因子;C為權衡超球體體積和誤分率的懲罰參數;φ為將多維偏差特征映射至特征空間的映射函數。
使用高斯函數作為模型核函數,其公式如下:
K(x,y)=e-γ*‖x-y‖2
(11)
式中:γ為高斯函數的超參。
對于一個綜合傳動裝置狀態監測數據的偏差特征p,當‖φ(p)-a‖2≤R,則偏差特征p位于超球體內,判斷該數據為正常數據;當‖φ(p)-a‖2>R,則偏差特征p位于超球體外,判斷該數據為異常數據。
為了驗證該方法對綜合傳動裝置狀態監測數據異常檢測的有效性,筆者以某型綜合傳動裝置為研究對象,在多組綜合傳動裝置漏油實驗數據上進行異常檢測驗證分析。
綜合傳動裝置結構框架與傳感器測點示意如圖3所示。

圖3 綜合傳動裝置結構框架與傳感器測點示意圖
圖3中,方塊箭頭為機械動力傳遞方向,線條箭頭為液壓系統流向。
機械動力由發動機給出,主要經由液力變矩器、換檔離合器、齒輪變速系統及轉向泵馬達傳遞至匯流行星排,再通過減速器傳遞至驅動輪。
油泵為液壓系統供油,經過操縱油濾后,為操縱離合器閥組、泵馬達操縱、液黏離合器閥等模塊供油,各模塊液壓油經過潤滑模塊流回油箱。
各傳感器編號與監測節點名稱如表1所示(各監測節點位置已在圖3括號內標出)。

表1 傳感器監測節點編號與名稱
12支壓力傳感器和4支轉速傳感器分別監測綜合傳動裝置不同節點的液壓和轉速參數。正常工作狀態下油壓監測數據范圍為0~2.5 MPa,轉速監測數據范圍為0~4 000 r/min。
在數據空間中,綜合傳動裝置狀態監測數據存在隱含的關聯關系,筆者利用DBSCAN算法對狀態監測數據進行聚類分析。
在該算法中,需要設置鄰居數目minPts與近鄰距離esp2個參數。考慮綜合傳動裝置狀態監測節點數目較少,同時在物理空間中,邊緣監測節點通常僅與一個節點相連,因此,筆者將鄰居數據minPts設置為1。
筆者以斯皮爾曼距離衡量數據密度,充分考慮了監測節點在數據空間中的相鄰性,針對不同近鄰距離進行了聚類分析,其聚類結果如圖4所示。

圖4 監測節點關聯密度聚類分析
圖4中,橫軸數字為傳感器監測節點編號(其對應傳感器節點見表1);圖中線段表示了傳感器監測節點的近鄰關系,如編號3與編號4的傳感器監測節點在最小為0.016的近鄰距離可保持近鄰關系。
其中,最大近鄰距離為0.05、0.15、0.25、0.35的綜合傳動裝置狀態監測數據聚類分析結果如表2所示。

表2 不同最大近鄰距離下的關聯密度聚類結果
由表2可知:在最大近鄰距離為0.05的聚類分析中,A類為操縱濾后壓力與操縱濾前壓力,C類為變矩器入口壓力與變矩器出口壓力,均是對綜合傳動裝置中液壓零部件輸入端與輸出端油壓參數的監測。該聚類結果表明,綜合傳動裝置零部件輸入與輸出油壓變化存在極高的關聯性。
在各最大近鄰距離的聚類分析中,B類保持一致結論;其中,5、7分別為雙聯主油濾前壓力、減速器出口壓力的傳感器編號,表明這2個節點的狀態監測數據存在極為密切且獨立的關聯關系;6、15分別為液黏壓力、風扇轉速的傳感器編號,在物理意義上,液黏壓力控制著風扇的轉動,然而該類只在最大近鄰距離為0.35的聚類分析結果中出現,說明這2個節點監測數據的關聯關系較弱。
在最大近鄰距離為0.25、0.35的聚類分析中,其A類結果相同,該類是綜合傳動裝置8個重要液壓節點與2個重要轉速節點的運行狀態監測數據。
經綜合分析,筆者選用傳感器編號為1、2、3、4、8、10、11、12、13、16的狀態監測數據構成最大關聯變量集,作為后續深度降噪自編碼網絡與SVDD異常檢測模型訓練、測試的輸入變量。
綜合傳動裝置傳感器監測了多種物理參數,各數據彼此存在較大的數值大小差異。
為了提升狀態監測數據重構模型的數據重構效果,筆者對傳感器監測數據進行歸一化處理:
(12)
式中:Zmin為狀態監測數據的最小值;Zmax為狀態監測數據的最大值。
為展現基于關聯密度的聚類方法對深度降噪自編碼網絡數據重構的提升效果,筆者分別以全部數據及其關聯數據作為輸入,構建了兩個模型,即全數據重構模型與關聯數據重構模型;將綜合傳動裝置監測數據分為訓練集與測試集,并使用加噪聲的訓練集訓練這兩個模型。
筆者經過多次實驗分析,將全數據重構模型的網絡層數設為[10,7,3,3,7,10],關聯數據重構模型的網絡層數設為[8,5,2,2,5,8],網絡訓練學習率設為0.001,訓練終止最大次數設為500次,訓練終止最小誤差設為10-6,噪聲系數α設為0.1。
筆者使用測試集對模型進行測試,各節點狀態監測數據重構誤差如表3所示。

表3 模型數據重構誤差表
由表3可以看出:在全部數據重構模型中,模型對低關聯數據(包括5、6、7、9、14及15號傳感器)的重構誤差較大;在數據重構模型構建時,采用關聯變量聚類方法,排除非關聯數據,提升了數據重構模型的重構效果。
關聯數據重構誤差對比如圖5所示。

圖5 兩模型對關聯數據的重構誤差對比
由圖5可知:關聯數據重構模型對各關聯數據的重構誤差均小于該數據在全數據重構模型中的重構誤差。
該結果證明,關聯數據重構模型比全部數據重構模型數據重構效果更好。
基于數據重構模型偏差特征,筆者采用SVDD算法對綜合傳動裝置狀態監測數據進行異常檢測,即分別使用遺傳算法(genetic algorithm,GA)、粒子群算法(particle swarm optimization,PSO)和貝葉斯超參優化(Bayesian)對模型超參數進行優化。
SVDD模型超參數優化結果如表4所示。

表4 SVDD模型超參數優化結果
筆者對3種優化方法的結果取均值,最終確定參數C、γ分別為0.25、0.016;分別利用全數據重構模型與關聯數據重構模型,提取綜合傳動裝置正常狀態監測數據的偏差特征,并訓練SVDD異常檢測模型。
SVDD模型訓練結果如表5所示。

表5 SVDD模型訓練結果
表5結果表明:關聯數據異常檢測模型的超球體半徑遠小于全數據異常檢測模型的超球體半徑,說明關聯數據的偏差特征更加集中;同時離群點數目更少,說明關聯數據異常檢測模型出現誤檢的可能性更低,更適合用于復雜工況下綜合傳動裝置狀態監測數據異常檢測。
為了分析模型對異常數據檢測的準確度,筆者以綜合傳動裝置輕微漏油故障條件下的狀態監測數據異常檢測為例,開展了實驗驗證研究。
實驗開展過程中,筆者在綜合傳動裝置操縱濾油器前端增加可調節泄油流量大小的漏油口,模擬裝備實際運行過程中漏油故障;分別設置漏油流量為5 L/min、10 L/min、15 L/min,并以上述條件下的實驗數據為基礎,構建不同程度漏油故障的異常檢測數據集。每個數據集中前500樣本點為綜合傳動裝置正常運行時(不泄露)的實驗數據,后500樣本點為裝置漏油異常實驗數據。
筆者對基于全數據重構模型與關聯數據重構模型偏差特征的異常檢測效果進行了對比分析。
漏油流量5 L/min數據集檢測結果分析如圖6所示。

圖6 漏油流量5 L/min數據集檢測結果分析
漏油流量10 L/min數據集檢測結果分析如圖7所示。

圖7 漏油流量10 L/min數據集檢測結果分析
漏油流量15 L/min數據集檢測結果分析如圖8所示。

圖8 漏油流量15 L/min數據集檢測結果分析
模型判別結果的準確率、真陽率及假陽率如表6所示。

表6 模型異常檢測結果分析
由表6可知:對漏油流量為5 L/min、10 L/min、15 L/min的數據進行異常檢測實驗驗證,關聯數據異常檢測模型的準確率分別為92.70%、96.60%、97.40%,真陽率分別為86.80%、93.60%、95.00%;全數據異常檢測模型的準確率分別為91.60%、94.70%、96.70%,真陽率分別為84.60%、90.00%、93.60%。
由此可見,關聯數據異常檢測模型整體性能明顯優于全數據異常檢測模型的性能,同時關聯數據異常檢測模型能更早地發現漏油異常,這可為綜合傳動裝置狀態監測與健康管理提供更高的保障。
筆者提出了一種復雜工況下綜合傳動裝置狀態監測數據異常檢測方法,即采用關聯變量聚類、深度降噪自編碼網絡及SVDD算法,系統地解決了非關聯傳感數據對綜合傳動裝置狀態監測數據異常檢測的干擾;并以綜合傳動裝置漏油異常為例,進行了實例分析,驗證了該方法的有效性。
研究結論如下:
1)采用DBSCAN方法對綜合傳動裝置狀態監測數據進行了關聯變量聚類,在0.25、0.35的最大近鄰距離下,均獲得了包含綜合傳動裝置8個重要液壓節點與2個重要轉速節點的最大關聯變量集;
2)基于深度降噪自編碼網絡,構建了綜合傳動裝置數據重構模型,對于最大關聯變量集,相較于全數據重構模型的誤差,關聯數據重構模型的重構誤差平均減少了0.025,證明該方法能有效地降低關聯傳感數據的重構誤差;
3)利用SVDD算法構建了異常檢測模型,對綜合傳動裝置不同程度漏油故障條件下狀態監測數據異常進行了有效檢測,且準確度整體高于92%,這為綜合傳動裝置健康管理與劣化評估奠定基礎。
筆者采用該方法對綜合傳動裝置漏油故障進行了異常檢測,今后將進一步開展對綜合傳動裝置裂紋、點蝕等典型故障異常檢測的研究,在多故障模式下探索該方法的適用性。