呂中秋,魏 波
(鄭州工業應用技術學院 信息工程學院,新鄭 451150)
現代工業過程趨于復雜化,規模逐漸擴大,自動化程度日益增加。在該背景下,企業的機械化程度也在增加,但是其中的機械故障頻發,其導致企業整體的產品質量和工作效率下降,同時減少設備的使用壽命。因此,檢測機械加工過程中的設備故障十分必要[1,2]。國內相關專家針對機械加工過程設備疊加振動檢測方面的內容進行了大量的研究,例如任世錦等人[3]將集成局部均值分解以及改進的稀疏多尺度支持向量機相結合的方式進行機械故障檢測,但是該方法的誤報率較高。彭聰等人[4]根據盲源信號分離方法以及超定視覺盲源分離方法獲取高速視頻,獲取多源振動信號的分離和定位,進而達到機械故障檢測的目的,但是該方法在去噪處理后的重構誤差率大。在上述兩種方法的基礎上,提出一種基于隨機森林算法的機械加工過程設備疊加振動檢測方法。實驗測試證明,本文方法能夠以更高的精度完成設備疊加振動檢測。
EMD分解主要是將非平穩信號k(t)分解成n個內蘊模態函數,如式(1)所示:

式(1)中,a(i)(t)代表信號總數;b(t)代表趨勢預項。
IMF分解需要經過迭代,即分解過程為“篩選”過程,具體的計算式為:

式(2)中,c(i)(t)代表原始信號的單分量信號。
在以轉子為主要部件的大型旋轉機械,其在冶金以及機械制造方面均發揮著重要的作用。但是,由于設備運行過程采集到含有大量噪聲的信號,影響設備的運行效果,因此,降噪處理噪聲信號,將機械加工過程設備振動信號z(t)表示為式(3)的形式:

式(3)中,d(t)代表信號受到的噪聲干擾。
當z(t)經過經驗模態分解后,得到有限個頻率由大到小分布的固有模態分量,具體計算式如下:

式(4)中,E(i)代表不同層次對應的I M F 分量;代表余量。
引入小波閾值到EMD分解后,雖然去噪處理了振動信號,但是去噪效果并不理想。即使是在無噪聲的情況下,在隨機時間段的振幅絕對值也下降到設定閾值范圍內。因此,進一步去噪處理,其中,EMD進行去噪的主要操作步驟為:
在機械設備加工過程,設備被污染的噪聲主要集中在低頻位置,越到高頻位置,信號的含量越低,為了有效剔除多余的噪聲,同時有效保持信號的細節部分,選取最佳的分解尺度較為重要。以下引入自相關函數對白噪聲進行特性檢驗,根據設定的序列xu獲取對應的自相關函數估計式:

式(5)中,z(k)代表自相關函數的估計值;zi代表第i個自相關函數;k代表常數。
通過以上分析,劃分IMF分量,該劃分通過連續均方誤差準則區分設備中的信號和噪聲,獲取全新的索引值,同時從初始階段對IMF分量進行重構,確保重構的誤差取值達到最低:

式(6)中,cmse(i,j)代表重構誤差的最小值;zi(i,j)代表第i個信號對應的重構誤差。
固有模態在振動信號去噪過程中占據主導地位,其需要選取較大的閾值,確保有效去除信號中的噪聲,達到去噪的目的。
結合以上分析,設定閾值yu,計算式為:

通過圖1給出機械加工過程設備振動信號去噪的詳細操作步驟:

圖1 機械加工過程設備振動信號去噪流程圖
1)對機械加工過程中設備振動信號進行EMD分解;
2)采用閾值降噪降噪處理除了第一個以外的IMF分量,即信號重構;
3)調整第一個IMF分量的采樣位置;
4)重構構建一個含有噪聲的原始信號;
5)對步驟4)中獲取的噪聲信號進行EMD分解;
6)獲取經過降噪處理后的信號;
7)多次重復步驟3)~步驟6),獲取k個降噪后的信號;
7)計算降噪后的信號平均值;
8)信號重構,實現信號去噪[5]。
隨機森林算法是一種集成學習算法,可以有效提升故障檢測精度。構建隨機森林主要包含以下內容:
1)抽取決策樹訓練集
在隨機森林算法中,各個決策樹的訓練集均是在原始訓練集的基礎上隨機抽取,增加各個決策樹之間的差異性。在抽取樣本過程中,主要采用無權重的方式增加訓練精度。
2)組建CART決策樹
在原始訓練集中,主要通過bagging方法為多棵決策樹抽取訓練子集,進而形成隨機森林。
利用圖2給出隨機森林算法的示意圖:

圖2 隨機森林算法操作示意圖
RF采用不同的訓練集可以有效降低各個決策樹之間的相關性,獲取對應的決策樹 {j1(x),j2(x),… ,jn(x)}達到提升檢測結果準確性的目的。同時,組建多分類模型系統,該系統根據投票的方式獲取系統最終的決策結果,如式(8)所示:

式(8)中,J(x)代表集成器對應的分類模型;ji代表決策樹;L代表系統的輸出函數。
通過隨機采用的方式得到模型對應的訓練集,進而獲取余量函數mf(i,j),如式(9)所示:

式(9)中,ab(i,j)代表錯誤數據的平均程度。
單類分類器只要含有足夠的離群點,則可以獲取理想的分類性能,但是離群點需要覆蓋全部特征空間,才能將目標數據和離群點分離。
當確定離群點的分布情況后,通過特征空間維度判定離群點數據。如果異常數據均勻分布在矩形空間內,則離群點對應的離群系數可以表示為式(10)所示:

式(10)中,Khypercube(f)代表離群系數;m代表特征角的維度。
其中,離群點的數量通過式(11)計算:

式(11)中,Voutliers(i,j)代表離群點總數;Koutliers代表超立方體的數量;10-p代表胞元的數量。
通過上述分析,通過隨機森林算法檢測機械加工過程設備疊加振動,詳細的操作步驟如下所示:
1)先驗信息提取:
(1)計算目標函數的歸一化直方圖p,如式(12)所示:

(2)通過式(12)獲取的計算結果,可以和離群點對應的歸一化直方圖進行互補。
2)離群點形成意見隨機森林訓練:
(1)在訓練數據集中通過bagging抽樣,獲取對應的訓練樣本。
(2)將訓練樣本映射到對應的k維隨機子空中。
(3)在設定的閾值范圍,通過歸一化直方圖形成多個離群點。
(4)通過形成的離群點和目標數據訓練決策樹分類器。
(5)重復上述操作步驟,直至完成機械加工過程設備疊加振動特征提取。同時構建DOCRF模型,通過模型求解樣本相似度,最終完成機械加工過程設備疊加振動檢測。
為了驗證本文的基于隨機森林算法的機械加工過程設備疊加振動檢測方法的有效性,進行仿真實驗測試。利用Simulink工具完成測試,其屬于MATLAB軟件平臺。處理器為intel i5,硬盤容量為1TB HDD,內存容量為8GB,Windows10系統。模態激振器(接觸式)DH40100進行接觸式振動,通過配套功放DH5872對激振信號進行調節。實驗過程通過調節功放DH5872改變振動信號的頻率和加速度等。
將機械加工過程設備疊加振動檢測的重構誤差率和誤報警率作為測試指標,計算公式如下:

式(13)中,Trate代表重構誤差率;Crate代表誤報警率;Xerr代表自己樣本被錯誤檢測的數量;Xnum代表參與測試的自己樣本總數。
實驗以對比分析的形式進行驗證,對比方法分別為文獻[3]方法和文獻[4]方法,在相同環境下,使用三種方法驗證機械加工過程設備疊加振動檢測效果,檢測結果和實際信號一致性越高,表明方法的檢測效果越好,實驗結果如圖3所示。

圖3 不同方法振動信號的檢測效果分析
由圖3中的實驗數據可知,所提方法檢測的振動信號和實際信號一致,文獻[3]方法檢測的振動信號在6s到7s之間的檢測結果和實際信號誤差較大,其曲線明顯偏離實際信號曲線,文獻[4]方法檢測信號雖然多數和實際信號一致,但是在6s以后其檢測效果出現較大誤差,并且持續出現誤差,因此,所提方法可以有效檢測振動信號,提高了檢測性能。
為了進一步分析所提方法的性能,在相同環境下,使用三種方法驗證機械加工過程設備疊加振動檢測的重構誤差率,誤差率越小,表明方法檢測性能越好,實驗結果如圖4所示。

圖4 不同方法檢測振動檢測的重構誤差率
根據圖4可知,所提方法的振動檢測重構誤差率在1.0%左右,未高于1.2%,文獻[3]方法的重構誤差率最低為4.0%,文獻[4]方法的最低重構誤差率為3.7%,文獻方法的重構誤差率分別高出所提方法的最高值2.8%和2.5%,因此,所提方法振動檢測的重構誤差率最低,有效降低了誤差率,提高了提高了機械加工過程設備疊加振動的檢測率。
驗證三種方法的機械加工過程設備疊加振動的誤報警率,該實驗指標有效反映方法的性能,其誤報警率越低,表明方法的性能越好,實驗結果如圖5所示。

圖5 不同方法檢測振動信號的誤報警率
分析圖5可知,誤報警率隨著樣本數量的的增加而增加,但是所提方法的增加程度較低,并且其在樣本數量500個時,誤報警率僅為0.9%,但是文獻[3]方法的誤報警率達到了4.9%,文獻[4]方法的誤報警率達到了3.2%,相比于所提方法的誤報警率均高出2%以上,并且其是所提方法的三倍以上,遠遠高于所提方法,因此,所提方法因為在檢測前期,對設備運行過程中的振動信號進行去噪處理,降低了設備疊加振動的誤報警率,提高了檢測效率和性能。
針對傳統的機械加工過程設備疊加振動檢測方法存在的重構誤差大、誤報警率高的問題,設計并提出了一種基于隨機森林算法的機械加工過程設備疊加振動檢測方法,該方法有機結合了隨機森林算法。實驗結果表明,所提方法的重構誤差率低于1.2%,誤報警率均在0.18%以下,并且受轉速影響較小,可以以更高的精度完成機械加工過程設備疊加振動檢測,全面提升了檢測結果的準確性。