潘 暉, 劉 澤
(長春工業大學基礎科學學院,吉林長春 130012)
近年來,在汽車變速器的故障診斷方法研究中,“極限參數法”理論[1-2]得到了廣泛應用。由德國迪斯卡姆公司與美國戴姆勒-克萊斯勒公司合作開發的ROTAS-GP振動噪聲檢測系統[2]就是以“極限參數法”理論為基礎,建立了基于標準差算法的故障診斷模型。該模型要求訓練樣本數據必須具有一定規模且滿足正態分布,因此,這種約束條件僅適用于大子樣水平的樣本。但是汽車變速器在生產實踐中,受生產條件和成本的限制,一般很難在初始階段提供大量樣本進行系統的學習和訓練,只能通過不滿足正態分布的小子樣水平的樣本進行基本訓練,使系統具備初步的判別能力,所以,該模型在汽車變速器生產實踐初期會存在很大的誤差,導致錯誤的學習結論。
文中基于分位算法提出了一種汽車變速器的故障診斷方法。由于分位數在計算過程中不受樣本規模、樣本數據統計分布與極端異常值的影響,使得該方法能夠在汽車變速器整個生產實踐過程中,對存在故障的汽車變速器作出迅速、準確的故障判別。
由于汽車變速器的振動信號[3]成分比較復雜,為了防止對故障作出漏判或誤判的情況,應對振動信號進行時域和頻域的綜合分析[4]。
汽車變速器存在故障的一個重要表現形式是產生較大的噪聲。噪聲的幅度決定于產生非正常振動的能量,由此在檢測過程中,可以通過分析時域信號中反映振動加速度幅值變化的峰值、平均值和極差值,刻畫噪聲能量的變化規律,達到分析噪聲幅度的目的。對于一給定的振動信號,其樣本數據觀測矩陣X為

式中:n——觀測樣本個數;
m——每個觀測樣本的大小。
其中,由m個數據組成的第i個觀測樣本向量可記為

i=1,2,…,n令j表示某一觀測樣本中數據的序號,則有:

i=1,2,…,n,j=1,2,…,m
式中:Peak——峰值,反映了每個觀測樣本的最大振幅;
RMS——平均值,反映了每個觀測樣本的平均幅度,即每個觀測樣本所包含的能量;
Crest——極差值,反映了峰值Peak與平均值RMS的差值。
Peak,RMS和Crest計算原理如圖1所示。

圖1 Peak,RMS和Crest計算原理示意圖
對時域信號使用快速傅里葉變換[5](FFT)的方法進行時頻變換[6-7],將時域信號轉換為階次譜,所提供的頻域特征可以作為故障分類的特征。
對1.1中樣本數據觀測矩陣X進行時頻變換,得到階次譜集合
Sn={S1,S2,…,SN}
式中:n——觀測樣本個數;
N——階次數。
Sn的幅值矩陣為:

則第l階的幅值向量為
Sl=(a1l,a2l,…,anl)T
l=1,2,…,N
一組時域信號經過時頻變換后得到的階次譜如圖2所示。

圖2 經FFT變換后得到的階次譜
標準差也稱均方差,是用于衡量一組數據中某一數值與其平均值差異程度的指標,能綜合反映一組數據的離散程度或個別差異程度。
由1.1中的觀測樣本向量Xi,可得其標準差(Xi)std為

i=1,2,…,n
j=1,2,…,m
基于標準差算法的時域極限參數故障診斷模型為:

式中:Peakth,RMSth,Crestth——分別表示Peak,RMS和Crest的極限值;
Peakstd,RMSstd,Creststd——分別表示Peak,RMS和Crest的標準差;
3Peakstd,3RMSstd,3Creststd——分別表示Peak,RMS和Crest的標準差的置信區間[8]。
基于標準差算法的頻域極限參數故障診斷模型為
(Sn)th={(S1)th,(S2)th,…,(Sl)th,…,(SN)th}其中
(Sl)th=+3(Sl)std
l=1,2,…,
N式中:(Sl)th——第l階幅值向量的極限值;
(Sl)std——第k階幅值向量的標準差;
3(Sl)std——第k階幅值向量的標準差的置信區間。
由統計理論假設檢驗理論可知,RMS,Peak和Crest以及各階次的極限值的置信度為99%,即99%的訓練樣本取值均將不超出此范圍。
分位數[8]是用于反映順序數據的集中趨勢的一種統計測度值,提供了有關各數據項如何在最小值與最大值之間分布的信息。
設1.1中的觀測矩陣X的分布函數為

對給定的p∈(0,1),方程F(x)=p的解

稱為該總體(或該分布)的p分位數。
在建立基于分位算法的故障診斷模型時,引入了修正參數。在觀測樣本逐漸積累的過程中,通過調整參數值,對診斷模型中的極限值進行修正,形成新的、具有更強魯棒性的極限參數,使診斷模型得到更高的泛化精度。
基于分位算法的時域極限參數故障診斷模型為:

式中:Peakth,RMSth,Crestth——分別表示Peak,RMS和Crest的p分位數;
kPeak,kRMS,kCrest——分別表示Peak,RMS和Crest的修正系數。
基于分位算法的頻域極限參數故障診斷模型為:
(Sn)th={(S1)th,(S2)th,…,(Sl)th,…,(SN)th其中
(Sl)th=(Sl)p×kl
l=1,2,…,N
式中:Sl)th——第l階幅值向量的極限值;
(Sl)p——第l階幅值向量的p分位數;
kl——第l階的修正系數。
本實驗使用的數據為試驗現場采集的汽車變速器振動信號。將整個觀測樣本集分為兩部分,即訓練樣本集和測試樣本集。在訓練樣本集中提取樣本,形成小子樣水平、中子樣水平和大子樣水平的3個訓練樣本集,分別對這3個樣本集進行學習訓練,提取時域極限參數和頻域極限參數,分別建立基于標準差算法和基于分位算法的故障診斷模型,并用兩種模型依次對測試樣本進行故障判別,對測試結果進行對比。
為了介紹方便,將基于標準差算法的故障診斷模型稱為模型1,將基于分位算法的故障診斷模型稱為模型2。時域極限值對比結果見表1。

表1 時域極限值對比
從表1中可以看出,對于3個樣本集,使用模型1得到的極限值大于使用模型2得到的極限值。
在頻域極限參數值的分析中,將所有階次的極限值連接起來,形成一條曲線,稱為極限曲線。對比結果如圖3~圖5所示。
從頻域分析的角度看,圖3~圖5分別表示小子樣樣本、中子樣樣本和大子樣樣本的極限曲線對比情況。
從圖中可以更為直觀地看出模型1與模型2的差別。對于3個樣本集,使用模型1得到的極限曲線明顯大于使用模型2得到的極限曲線。

圖3 小子樣樣本極限曲線對比圖

圖4 中子樣樣本極限曲線對比圖

圖5 大子樣樣本極限曲線對比圖
通過時域和頻域兩種分析方法,對模型1和模型2進行綜合對比,結果見表2。

表2 兩種模型的綜合對比
從表2中可以看出,模型1與模型2在實驗中所用的時間都很短,而且相等,這對汽車變速器的在線快速檢測十分重要;在學習初期,訓練樣本庫中僅有少量訓練樣本時,使用模型2進行故障判別的誤判率要遠遠小于使用模型1的誤判率;隨著樣本數量的不斷積累,兩種診斷模型的誤判率都有很大程度的下降,但是模型2的誤判率仍然小于模型1的誤判率;當訓練樣本數足夠大時,即滿足正態分布時,兩種診斷模型基本達到相同的判別精度。
實驗結果表明,基于分位算法的故障診斷模型與基于標準差算法的故障診斷模型相比,在僅有少量訓練樣本的學習初期,得到的極限參數值更為準確。在后期生產過程中,大量的樣例數據逐漸積累,通過調整修正參數值,使故障診斷模型具有更強的自適應能力和更高的泛化能力,提高了對汽車變速器故障診斷的精度,這在實際應用中具有非常重要的意義。
[1] 尚文利,史海波,何柏濤.設備維護模式選擇決策支持框架研究[J].機械設計與制造,2006,12:127-128.
[2] DISCOM GmbH.Gearbox analysis system ROTAS-GP[EB/OL].[2006-08-15](2011-09-18).http://www.discom.de.
[3] 于柏森.基于神經網絡的發動機故障診斷分類器設計[D]:[碩士學位論文].長春:長春工業大學,2010.
[4] 魏宏亮.汽車發動機機械故障診斷系統裝置與特征抽取算法研究[D]:[碩士學位論文].長春:長春工業大學,2007.
[5] 姜建國,曹建中,高玉明.信號與系統分析基礎[M].北京:清華大學出版社,1997.
[6] 張賢達.非平穩信號分析與處理[M].北京:國防工業出版社,1998.
[7] 王志杰.齒輪箱振動信號時頻分析與故障診斷[D]:[碩士學位論文].重慶:重慶大學,1999.
[8] 茆詩松,王靜龍,濮曉龍.高等數理統計[M].北京:高等教育出版社,2006.