王麗華 楊家巍 張永宏 趙曉平 謝陽陽
1.南京信息工程大學信息與控制學院,南京,210044
2.南京信息工程大學計算機與軟件學院,南京,210044
在刀具磨損監測過程中,采集的刀具信號包含大量切削過程信息和周圍環境噪聲信息。研究刀具磨損狀態監測技術的重點之一是研究如何從刀具非平穩信號中提取出表征刀具狀態的特征。
面對非線性、非平穩的檢測信號,小波分析和經驗模態分解(empirical mode decomposition,EMD)等時頻分析技術應運而生,其中EMD因其自適應的特點得到了廣泛應用[1]。模式識別方法是實現對刀具磨損狀態進行監測的關鍵技術之一。小波神經網絡、支持向量機(support vector machine,SVM)和反向傳播(back propagation,BP)神經網絡等方法在刀具磨損狀態識別中得到了廣泛應用。陶潤喆[2]利用互補總體平均經驗模態分解(complementary ensemble empirical mode decomposition,CEEMD)方法將聲發射(acoustic emission,AE)信號分解成多個固有模態函數(intrinsic mode function,IMF),由于IMF依然存在模態混疊的問題,故利用小波包變換(wavelet package transform,WPT)進行修正,并輸入到SVM中進行訓練以完成對刀具磨損狀態的識別。但上述方法存在如下2個缺陷:①網絡訓練的樣本數量太少,這會使得樣本缺少多樣性,網絡的魯棒性無法得到保證,也易形成過擬合[3];②在使用傳統方法進行刀具磨損監測時,因單一方法所得到的特征不能很好地表征原信號,故利用多種方法來提取信號特征,以彌補單一方法的不足,但這需要依賴大量實際工程經驗和消耗大量處理數據的時間,浪費人力。
近年來,深度學習在機械狀態識別等領域得到了廣泛應用。HINTON等[4]提出了深度置信網絡(deep belief network,DBN),并采用非監督貪心逐層訓練算法為解決深度結構優化難題提供了方法,同時DBN網絡在機械故障診斷領域也得到了應用[5]。隨后堆疊自動編碼器(stacked autoencoder,SAE)、卷積神經網絡(convolutional neural network,CNN)等優秀的深度網絡結構相繼被提出。深度學習方法在面對大量帶有標簽的訓練數據時,能實現精準且高效的數據分類,且適用于復雜的機械故障診斷。雷亞國等[6]構建了SAE網絡,以頻域信號為輸入進行齒輪的狀態識別,并與傳統方法作比較,顯示出SAE在處理“大數據”樣本時的優勢。堆疊降噪自編碼(stacked denoising autoencoder,SDAE)在自編碼的基礎上進行了改進,能夠無監督地提取出更有效的特征表示[7]。
AE信號具有受切削條件和刀具參數變化影響小、抗環境干擾能力強、靈敏度較高等優點[8],能及時準確地處理與刀具磨損狀態相關的信息[9]。
本文提出了一種基于SDAE網絡的刀具磨損狀態識別方法。以后刀面磨損量為磨鈍標準,為采集的AE信號制定標簽;構建了SDAE網絡,以AE信號的頻域為網絡輸入;通過SDAE網絡實現了對未知狀態AE信號的分類判別,并最終實現了對刀具磨損狀態的有效識別。
自動編碼器(autoencoder)[10]是一種 3層無監督網絡,結構上可分為編碼器和解碼器兩部分,見圖1,其中第1、2層構成編碼部分,第2、3層構成其解碼部分。編碼器完成從輸入向量x到輸出表征y的映射轉換,其典型表達式為yi=xi。
編碼是實現輸入樣本xi通過激活函數映射到低維空間的過程,其表達式如下:

式中,hw,b(x)表示隱含層輸出;f(?)為激活函數;xi為第i個樣本;w為編碼過程的網絡權值;b為編碼過程的網絡偏置。
解碼是實現將低維空間的hw,b(x)通過激活函數逆向映射到高維空間,進而重構輸入樣本xi的過程,其表達式如下:

式中,x?為重構后的樣本;w′為解碼過程的網絡權值;b′為解碼過程的網絡偏置。
通過重構得到的樣本x?與訓練樣本x是不相等的,兩者的誤差為

式中,J(·)表示目標函數;m為樣本數量。
利用誤差反向傳播算法來調整各層的權值W和偏置B,以此訓練自編碼網絡,從而使得誤差收斂并達到最小。當誤差達到最小值時,hw,b(x)才可視為樣本最有效的特征表達。
在實際應用中,訓練樣本數據經常會混入噪聲,從而導致數據失去了真實性。通過自動編碼器得到的特征會因噪聲的存在產生誤差。降噪自編碼器(denoising autoencoder,DAE)[11]可通過重構含有噪聲的輸入數據來解決該問題,如圖2所示。對樣本加入一定量的噪聲后再輸入DAE,通過隱含層的訓練,可盡量還原出同原始樣本相同的數據[12]。
將隨機噪聲按qD分布加入訓練樣本x,其表達式如下:

式中,x?為包含噪聲的樣本;qD為二項隨機隱藏噪聲。
DAE通過在訓練樣本中加入隨機噪聲,迫使編碼器學習去除噪聲以獲得沒有被噪聲污染的輸入信號,從而提高了系統的泛化能力。
為了得到更高級的特征表達,采用深度網絡結構的形式將DAE逐層堆疊起來,形成一個由多個DAE上下連接而成的模型結構,即堆疊降噪自編碼(SDAE)[13]。構建 SDAE 就是將多個 DAE進行堆疊(即下一級DAE隱含層的輸入來自于上一級隱含層輸出的特征向量,以此進行堆疊構建多層次的網絡結構),SDAE網絡結構見圖3。

圖2 降噪自編碼Fig.2 Denoising autoencoder

圖3 SDAE網絡結構Fig.3 Network structure of stacked denoising autoencoder
圖3 中hi(i=1,2,…,n)表示第i個自編碼網絡隱含層的輸出。SDAE網絡的作用是對輸入樣本進行特征編碼,合適的網絡層數可使樣本的差別更加突出,從而實現更好的狀態識別。由于SDAE網絡結構屬于無監督的網絡結構,本身無法進行樣本分類,為了實現這一功能,本文在SDAE網絡的最后1層加入1個Softmax分類器[14],使整個網絡成為有監督的網絡。構建有監督的網絡結構見圖4。

圖4 有監督的網絡結構Fig.4 Supervised network structure
整個有監督的網絡訓練步驟如下:①將數據輸入SDAE網絡進行訓練,輸出得到最終的特征編碼;②將得到的特征編碼輸入至Softmax分類器進行分類;③SDAE網絡和Softmax分類器均訓練完成后將兩者進行組合,形成一個新的網絡,再利用誤差反向傳播算法對整體網絡進行微調;④當整體網絡誤差達到最小值時,網絡訓練過程則完成。
本文設計了一個3層的網絡結構(5 120-100-50-5),包含雙隱含層結構和1個Softmax分類器,其中5 120為輸入層節點數,100為第1隱含層節點數,50為第2隱含層節點數,5為最終輸出層節點數。輸入網絡的樣本經過降低維度、融合和非線性變換,再由Softmax分類器壓縮融合,最終得到變換為5維的輸出。
基于SDAE網絡的刀具磨損狀態識別網絡訓練過程見圖5。
本文選擇寶雞CS6140車床作為實驗平臺,見圖6,該車床能夠承擔各種車削工作。
本文采集AE信號數據時選擇由美國物理聲學公司(PAC)研制的R15-ALPHA諧振式AE傳感器(圖7),輸出接口為側面的SMA接頭。AE傳感器的主要參數見表1。
實驗中,采用車削加工方式,機床主軸轉速為260 r/min,切削深度為1 mm,每轉進給量為0.08 mm。為了使刀具磨損速率加快,縮短采集數據時間,采集AE信號時,采用無冷卻干切削的加工方式。

圖5 刀具磨損狀態識別流程圖Fig.5 Flow chart of tool wear state recognition

圖6 寶雞CS6140機床Fig.6 Baoji CS6140 machine tool

圖7 聲發射傳感器Fig.7 Acoustic emission sensor
本實驗建立的數據采集系統見圖8。在切削加工時,將聲AE感器采集的信號傳輸至前置放大器進行處理,再由信號采集卡傳輸給計算機并保存。

表1 聲發射傳感器主要技術參數Tab.1 Main technical parameters of acoustic emission sensor

圖8 聲發射信號采集系統Fig.8 Acoustic emission signal acquisition system
為了對刀具在不同磨損狀態下進行監測,需要對刀具的磨損狀態進行分類。依據刀具后刀面磨損量的大小通常將刀具的磨損狀態分為3個階段(即初期磨損階段、中期磨損階段和后期磨損階段)[15-16]。但在實際生產加工中,當刀具處于中期磨損階段的后期時就應及時更換刀具,防止因刀具的損壞而產生不必要的損失,因此本文依據刀具后刀面磨損量的大小將刀具磨損狀態進行了更細致的劃分,劃分標準見表2。

表2 刀具磨損狀態劃分標準Tab.2 Standard of cutting tool wear
由表2可以看出,本文將刀具磨損狀態進一步分為5個狀態階段。狀態1為初期磨損階段,而中期磨損階段細分為狀態2、狀態3,后期磨損階段細分為狀態4、狀態5。不同磨損狀態在不同加工條件下采集的樣本數量均為2 000個,每個樣本大小為10 240個點。采用更細致的刀具磨損狀態分類能夠使工作人員對刀具的具體狀態有更好地監測。如當刀具磨損量達到中期磨損階段后期的磨損量時,工作人員可及時對刀具的磨損狀態作出判斷,并對刀具進行更換以保證滿足加工精度,從而提高了加工效率。
實驗中,將時域樣本和頻域樣本的分類準確率進行比較,分別將時域信號和頻域信號制作成樣本數量各為10 000的實驗樣本,多次訓練后的結果見表3。從表3中可以看出,時域信號樣本訓練得到的平均準確率遠小于頻域信號樣本的平均準確率,因此以頻域信號樣本訓練的網絡能夠得到較高的診斷精度。

表3 時域信號和頻域信號準確度對比Tab.3 Comparison of the accuracy of time domain signals and frequency domain signals
在進行SDAE網絡訓練之前,需將采集的AE信號制備成適合網絡輸入的樣本,并匹配標簽,用來進行整體網絡的訓練。本實驗AE信號的采樣頻率為100 kHz。圖9中,將采集到的一維信號Sig∈[]1×N(1×N表示矩陣的大小)分割成M個采樣時間為0.1 s的時域信號,通過傅里葉時頻變換將時域信號轉換成頻域信號得到SDAE網絡的樣本,每個樣本的維度l=5 120。

圖9 SDAE網絡樣本制備流程Fig.9 SDAE network sample preparation process
根據刀具磨損狀態分類制備的標簽見表4。由表4可以看出,不同標簽對應不同的刀具磨損狀態,制作標簽使用的是獨熱編碼(即One-Hot編碼),在任何時候,其中只有1個數位有效。頻域信號輸入至網絡后,當輸出中的某1個數位近似等于1,其他4個數位近似等于0,即可準確地識別出刀具當前的磨損狀態。

表4 有監督樣本標簽Tab.4 Supervised sample label
本實驗將所有樣本均分為5份,依次選取,其中4份作為訓練樣本,剩下1份則作為測試樣本。
SDAE網絡實質上是將幾個DAE網絡按照要求進行堆疊的,因此,網絡層數和隱含層節點數對整個網絡的效果影響很大。網絡層數和隱含層節點數決定了網絡提取的最終特征向量,會嚴重影響刀具磨損狀態識別的精確度。為了找到合適的網絡參數,在其他網絡參數(表5)不變的情況下,本文對比了在不同網絡結構下刀具磨損狀態識別的準確率,識別結果見表6。

表5 SDAE網絡參數Tab.5 SDAE network parameters

表6 不同網絡結構下SDAE網絡識別結果Tab.6 SDAE network recognition results under different network structures
從表6中可以看出,當SDAE網絡層數相同時,網絡的測試準確率并非隨著隱含層節點數的增加而提高;同時,當網絡層數逐漸增多,SDAE網絡的測試準確率也并非逐漸提高,結果表明SDAE網絡的隱含層節點數和網絡層數并非越多越好。其中3個網絡結構5 120-100-50-5、5 120-200-100-50-5、5 120-300-100-100-5的測試準確率均達到了100%,但當網絡層數增多時,網絡訓練的計算量就增大,網絡訓練時間也隨之增加,因此本文在刀具磨損狀態監測實驗中采用5 120-100-50-5的網絡結構。
為了尋找合適的網絡學習率參數,本節采用3.3節中的最優網絡結構5 120-100-50-5進行分析,測試結果見表7。在對不同學習率進行分析時,其他參數保持不變。
當進行網絡訓練時,學習率在訓練過程中起重要的作用。若學習率設置過小,網絡的收斂速度會很慢,進而浪費大量的訓練時間;若學習率設置過大,網絡的波動會較大,極可能會跳過最優解而導致網絡無法收斂,因此在網絡訓練過程中,要尋找最優的學習率。

表7 不同學習率下SDAE網絡識別準確率Tab.7 Accuracy of SDAE network recognition under different learning rates
為了進一步分析不同學習率對網絡結果的影響,本文從表7中選擇學習率分別為0.1、1.0、1.5、2.0的4種測試準確率較高的情況,對這4種情況的誤差減小情況進行了可視化,結果見圖10。一般來說,網絡誤差越小,表明網絡識別準確率越高;誤差減小速度越快,表明網絡結構越好。由于圖10中線條的分布過于密集,為了更好地反映誤差減小曲線的變化情況,故將圖10中的曲線部分放大,見圖11。

圖10 不同學習率下SDAE網絡誤差減小曲線Fig.10 SDAE network error descending curve under different learning rates

圖11 不同學習率下SDAE網絡誤差下降曲線(放大圖)Fig.11 SDAE network error descending curve under different learningrates(enlarged view)
從圖10和圖11中可以看出,不同的學習率,其誤差減小的速度不一樣。隨著迭代次數的增加,網絡的誤差也在逐漸減小。對比圖11中4條誤差減小曲線,不難發現,當學習率設置為1.0時,誤差的減小速度比其他3種情況的誤差減小速度都要快,因此本實驗最終選擇的學習率為1.0。
批處理大小(Batchsize)也是網絡訓練過程中的一個重要參數,表示在訓練過程中一次性輸入到網絡中的樣本數量。合適的Batchsize具有如下3個優勢:①高效的內存利用率;②可減少迭代次數和縮短實驗時間;③在一定范圍內,Batchsize越大,引起的訓練震蕩越小。
本文分別選取不同大小的Batchsize進行SDAE網絡訓練,得到的測試準確率均很高。為了比較不同Batchsize對網絡的影響,在網絡結構為5 120-100-50-5的情況下,分別對網絡的測試準確率和實驗時間作對比分析,結果見表8。

表8 不同Batchsize識別準確率與實驗時間Tab.8 Accuracy and measurement time of different Batchsize measurements
由表8可以看出,只有當Batchsize為20時,測試準確率才達到了100%,在其他情況下均存在一定誤差,加之實驗過程中不同Batchsize所用的實驗時間相差并不大,因此最終選取Batchsize為20。
(1)提出了一種基于SDAE網絡的刀具狀態識別方法,有效地實現了從大量AE信號中自適應地提取刀具不同磨損狀況的特征信息,克服了利用傳統的時頻分析方法進行特征提取時,需人為地進行參數選擇而導致診斷效率低的缺點,同時也解決了對大量信號進行處理時計算量大、計算時間長的問題,并在實際應用中取得了100%的測試準確率。
(2)構建了SDAE網絡,對比了不同的網絡結構、學習率和批處理大小等參數對網絡的影響。實驗結果表明,網絡結構并非越復雜網絡效果越好,網絡層數過少,難以得到樣本有效的特征表達,網絡層數過多,極可能導致過擬合;學習率設置過小時,網絡收斂很慢,而學習率設置過大時,網絡極可能跳過最優解,從而導致網絡識別準確率降低;合適的批處理大小可利用較少實驗時間就能使網絡快速收斂,進而得到最高的識別準確率。