侯照文 張 斌
(廣州市特種機電設備檢測研究院 廣東 廣州 510180)
隨著越來越多的復雜機電設備被應用在多種工業領域,對這些設備做出高效和準確的狀態監測以及故障診斷是保證其穩定運行的關鍵所在,而有效的數據挖掘技術正是提高診斷效率和精度的重要手段。 目前人們往往將各種智能算法應用于機械信號的特征提取,取得了一定成效,但這些算法也有各自不同的優點和缺點[1-2]。 為了更好地選取機械信號中的敏感特征,本文提出了基于粒計算的旋轉機械信號特征提取技術。
作為粒計算領域中的重要分支,鄰域粗糙集在屬性約簡方面的作用越來越受到人們的關注和研究[3]。 由于省去了以往粗糙集約簡都要先進行連續屬性離散化的過程,因此這種算法可以在極大的保留原有決策表包含的數據信息的前提下,最大限度的剔除冗余信息。
本文首先介紹基于歐式距離評估的鄰域粗糙集的基本概念和粒化約簡方法;然后通過實驗室齒輪振動信號分析驗證了新方法的作用。
首先定義鄰域概念,對于xi∈U,U 為論域,定義xi的δ-鄰域為

其中Δ 是一個距離函數,對于
?x1,x2,x3∈U,Δ 滿足如下關系:
Δ(x1,x2)≥0,Δ(x1,x2)=0,當且僅當x1=x2;
Δ(x1,x2)=Δ(x2,x1);
Δ(x1,x3)≤Δ(x1,x2)+Δ(x2,x3);
δ(xi)稱為由xi生成的δ 鄰域信息粒子,也就是所取鄰域值,所以當選擇不同大小鄰域值時,論域就可以相應被劃分為不同的粒度層。
為了方便討論對論域的粒化,定義A 包含于B 的強度函數I(A,B)為

當A=? 時,規定I(A,B)=0。 這時有0≤I(A,B)≤1。
設集合X 為論域U 的非空子集, 定義可變精度k-下近似和上近似分別為:

其中k≥0.5。
鄰域粗糙集粒化屬性的關鍵在于選擇合適的鄰域δ 值。本文先用基于特征歐式距離的方法得到鄰域基點, 設S=(U,A,V,f)是一個數值型信息系統,其中U:對象的非空集合,即論域;A: 屬性的非空有限集合,V=a∈A∪Va,V?R,R 為N 維實數
空間,Va為屬性a 的值域;f:U×A→V 是一個信息函數, 它為每個對象的每個屬性賦予一個信息值,即?a∈A,x∈U,f(x,a)∈Va。 則U 關于屬性集P 的歐式距離矩陣Mdp=(dp(xi,xj))是一個|U|×|U|的矩陣。 其中任一元素為:


即取得鄰域基點值為

取兩側鄰域值:n_value1=n_value2-r;n_value3=n_value2+r,其中r 為半徑。
1.2 節中選取了三個不同大小的鄰域值, 分別對應三個粒度層。 為了使不同粒度層的k 值配合上正區域的動態變化[4-5],需要在原鄰域粗糙集中加入動態調節因子。 在改進的模型中,包含度k 值將隨著選取鄰域值的逐層增加而相應減小。
首先,在鄰域基點即中間層n_value2 下可變精度k 的定義同1.1 節中(3)和(4)式。
接著引入動態調節因子k0,0.01≤k0≤0.1, 則在第一層鄰域值n_value1 下定義可變精度k1=k+k0下近似和上近似分別為:

在第三層n_value3 下定義可變精度k2=k-k0下近似和上近似分別為:

X 的近似邊界定義類似中間層。
由上述定義可以看出,粗糙集包含度隨著鄰域值的增大而減小,這種動態的變化改善了約簡的k 區間和正區域動態變化的配合問題,從而進一步改進原有鄰域粗糙集模型對噪聲信號的容納能力。
分別在三個鄰域值和相應包含度下對提取到的屬性集進行約簡粒化。 定義決策D 對屬性B 的依賴度為γB(D)=Card(NBD)/Card(U),其中Card( )表示求集合的基數。
由此給定一個鄰域決策系統
NDT=<U,A,D>,B?A,?a∈A-B,其中U:對象的非空集合,即論域;A:屬性的非空有限集合,D:決策屬性。
定義a 相對于B 的重要度為

基于屬性重要度指標,在一定鄰域值下構造貪心式屬性約簡算法[3]。
基于鄰域粗糙集模型的數值特征選擇算法:
Input:NDT=<U,A,D>;
Output:約簡red.
Step 1:□a∈A:計算鄰域關系Na;
Step 2:?→red;
Step 3:對任意ai∈A-red
計算SIG(ak,red,D)=γred∪ai(D)-γred(D),//此處定義γ?(D)=0.
Step 4:選擇ak,其滿足:

Step 5:If SIG(ak,red,D)>0,
red∪ak→red
go to Step 3
else
return red, end.
該算法以空集為起點,每次計算全部剩余屬性的屬性重要度, 從中選擇屬性重要度值最大的屬性加入約簡集合中,直到所有剩余屬性的重要度為0,即加入任何新的屬性,系統的依賴性函數值不再發生變化為止。 本文在1.2 節里取得依次從大到小的鄰域值n_value1、n_value2、n_value3 可以對應得到三層核屬性集(Core Features Sets)。

圖1 實驗模擬裝置
為了驗證提出的特征提取技術在實際應用中的效果,在齒輪實驗臺上進行故障模擬,實驗裝置如圖1 所示。 本故障實驗臺由直流電機、加載電機、直流調速加載系統、齒輪減速器構成,通過齒輪換檔實現不同故障齒輪的嚙合。 可以組合為6 種不同的齒輪形態:正常、點蝕、剝落、剝落和偏心復合故障、點蝕和偏心復合故障、正常和偏心復合故障。
表1 列舉了齒輪傳動系統的相關參數。

表1 齒輪傳動系統的運動和動力參數
在上述6 種齒輪組合形態下,利用加速度傳感器分別測取原始振動信號,實驗時電動機轉速為1000r/min,采樣頻率為6.4kHz,數據長度為116736。 測點布置在第二級齒輪的軸承座上,位置示于圖2 中。 數據記錄裝置安裝了低通濾波器用來抗混濾波。 其中正常狀態的振動信號示于圖3 中。

圖2 加速度傳感器位置

圖3 正常齒輪的原始時域信號波形圖
采用10 階Daubechies 離散正交小波db10 對采集的各個故障形態的振動信號進行3 層小波包分解,得到8 個頻帶的分解信號,分解后每段信號的頻率寬度為分析頻率的八分之一,即0.4kHz。 這8 段分解信號分別分布在0~0.4kHz;0.4~0.8kHz;0.8~1.2kHz;1.2~1.6kHz;1.6~2.0kHz;2.0~2.4kHz;2.4~2.8kHz 以及2.8~3.2kHz 上。
分別提取每個頻帶的6 個時域特征和13 個頻域特征,共152 個特征組成原始特征集。 通過前述的歐氏距離特征評估取得鄰域基點為n_value2=0.10106, 根據鄰域基點的大小設半徑為0.1,k0=0.01。 則取得另外兩個鄰域值分別為n_value1=0.001057, n_value3=0.20106。 基于取得的三層鄰域值用前述的前向貪心算法對特征集進行粒化約簡,進行特征評估時第一層第一次迭代如圖4 所示,每層鄰域的每次迭代選取重要度最大的特征加入核屬性中,直至剩余屬性為0 時獲得核屬性集。 第一層鄰域經過4 次迭代,第二層鄰域經過12 次迭代,第三層鄰域經過9 次迭代獲得如表2 所示核屬性集。

圖4 鄰域為0.001057 時第一輪計算特征重要度值

表2 三層鄰域下選擇的核屬性集
從表2 可以看出,本文提出的特征提取技術可以將冗余復雜的特征集約簡到了不同的粒度層中,提取到的核屬性集具有更多的分類信息和多分辨特性。 從而為下一步信號分類提供依據,更好地完成旋轉機械的狀態監測和故障診斷。
本文提出了基于粒計算的旋轉機械信號特征提取技術。研究了粒化分層的實現方法。 應用基于鄰域粗糙集的屬性約簡粒化算法對特征集進行了約簡粒化,確定了三層鄰域值來對特征集進行粒化分層。 該方法體現了粒計算多分辨、多層次解決復雜問題的特點。
通過齒輪實驗, 提取了不同狀態、 不同粒度層的核屬性集,為下一步旋轉機械的狀態分類和智能診斷打好了基礎。
[1]Ham FM, Kostanic I. Principles of neurocomput ing for science & engineering [M]. New York: Mc-Graw Hill, 2001.
[2]Wei L L, Long W J, Zhang W X. Fuzzy data domain description using support vector machines [A]//International Conference on Machine Learning and Cybernetics[C].2003,5:3082-3085.
[3]Hu Qing-Hua, YU Da-Ren, Xie Zong-Xia. Numerical Attribute Reduction Based on Neighborhood Granulation and Rough Approximation, Journal of Software, Vol.19, No.3, March 2008:640-649.
[4]王加陽,羅安,陳松喬.可變精度粗糙集模型區間約簡[J].系統工程學報,2007,22(6):126-133.
[5]Wang G Y. Algebra view and information view of rough sets theory[A]//Data Mining and Knowledge Discovery: Theory, Tools, and Technology [C]. Bellingham: SPIE-The International Society for Optical Engineering, 2001: 200-207.