史珂銘 鄒益勝 劉永志 丁昆 丁國富
1.西南交通大學機械工程學院,成都,610031 2.西南交通大學計算機與人工智能學院,成都,610031
刀具磨損是影響工件加工質量的重要因素之一,在生產現場的復雜環境下,一旦發生嚴重的刀具磨損或破損都可能引起連鎖反應,導致加工機床異常停機以及人員傷害。因此對銑削刀具進行智能狀態監測具有重要意義[1-2]。
近年來,深度學習因其強大的非線性特征自適應提取能力而得以迅猛發展,一些研究已將深度神經網絡應用于刀具磨損狀態辨識領域[3]。該類智能辨識方法借助深度神經網絡強大的非線性特征表征能力自適應提取刀具切削過程監測信號中的磨損狀態隱藏特征,利用反饋優化后的分類器智能識別當前刀具磨損狀態。何彥等[4]利用多傳感器信號提出了一種基于長短時記憶卷積神經網絡的刀具磨損在線監測模型。陳啟鵬等[5]基于深度門控循環單元神經網絡監測刀具磨損狀態。WANG等[6]提出了一種深度置信網絡的多任務學習方法用于刀具磨損狀態識別,其辨識準確率達到了99%。雖然上述方法可以完成狀態監控,但是仍然存在一定的不足:一是在實際生產環境下由于生產需要,受到主軸轉速、切削深度等工藝條件變化的影響,刀具加工過程也會隨之發生改變,導致監測數據的分布不同,進而使得利用歷史工藝條件進行數據訓練的辨識模型在辨識新的工藝條件下刀具樣本時準確率很低甚至失效;二是當前海量的監測數據仍需要手工標記健康狀態,效率極低,這都將給復雜環境下刀具磨損狀態辨識帶來困難。
利用遷移學習可以從帶標簽的歷史工藝條件數據(源域)學習分類特征,并將其應用到無標注信息的新的工藝條件數據(目標域)中進行分類。遷移學習模型在圖像識別、文本分類等領域的研究已經取得了飛躍式發展[7-10]。雷亞國等[11]利用深度殘差網絡提取可遷移故障特征,然后在訓練過程施加領域適配正則項約束進行目標域數據的遷移辨識。KUREK等[12]利用少部分數據訓練卷積神經網絡構建鉆頭磨損狀態遷移辨識模型。陳仁祥等[13]利用深度特征聯合適配的方法識別不同刀具磨損狀態。WANG等[14]提出了深度對抗性領域自適應網絡結合有監督實例的方法優化源域特征以學習更好的可區分性特征,提高領域對齊能力。ZOU等[15]提出了一種方差約束,以縮小源域特征類內距離,擴大其類間距離,提高滾動軸承故障遷移辨識的準確性。基于領域自適應的遷移辨識模型通過縮小工藝條件變化引起的特征分布差異來獲取不同工藝條件下故障公共特征,從而提高辨識準確率。
在上述基于領域自適應的特征遷移模型中,僅考慮了對源域數據施加約束來提高不同類別樣本之間的類間距離以及同類樣本的類內聚集程度,從而提升故障特征分布對齊能力,忽略了目標域故障特征的分布特性,導致遷移辨識準確率較低。針對此,本文提出了一種基于卷積神經網絡(CNN)的刀具磨損跨工藝條件遷移辨識模型——多類域適應卷積神經網絡(multi class domain adaptive convolutional neural network,MCDACNN),首先構建領域共享卷積神經網絡對原始振動信號提取故障特征,利用最大均值差異[16](maximum mean discrepancy,MMD)測量并縮小源域特征和目標域特征的整體分布差異;然后分別對源域特征與目標域特征概率矩陣增加類間-類內距離約束(inter-class-intra-class distance constraint,IDC)、最大化核范數的正則化策略,縮小源域與目標域可遷移特征的類內距離、擴大類間距離,進一步提高不同工藝條件下特征領域適配的能力;最后通過實驗驗證了所提出模型的有效性。
本文構建了一種多類域適應卷積神經網絡的刀具磨損狀態跨工藝條件遷移辨識模型,其結構如圖1所示,主要由特征提取模塊、領域自適應模塊和分類模塊三部分組成。

圖1 多類域適應卷積神經網絡跨工藝條件遷移辨識模型
(1)特征提取模塊。該模塊由兩個卷積層、兩個最大池化層和一個全局平均池化層構成。通過全局平均池化對提取的故障特征進行降維,能有效降低模型參數規模和樣本內沖擊特征的時移影響。
(2)領域自適應模塊。該模塊首先利用最大均值差異縮小源域特征和目標域特征之間的整體分布差異;然后,對源域和目標域分別采用類間-類內距離約束和最大化核范數以改善源域和目標域樣本間的特征距離關系,從而提高模型對不同工藝條件下同類刀具磨損狀態數據之間的分布適應能力;最后,通過綜合損失函數,基于反向傳播算法優化特征提取模塊的權重參數,以提取出源域和目標域樣本的公共特征,實現不同工藝條件下刀具磨損特征之間的更高準度分布適配。
(3)分類模塊。由一個全連接層映射降維特征,然后通過softmax層得到全連接層輸出特征概率矩陣,源域樣本真實標簽矩陣與源域樣本的預測類別概率矩陣通過交叉熵損失函數反向傳播優化模型。
MCDACNN模型的特征提取模塊利用卷積神經網絡構建。源域數據和目標域數據共享特征提取模塊訓練參數,以1條樣本為例,特征提取模塊參數如表1所示。

表1 特征提取模塊參數
卷積神經網絡具有強大的無監督特征學習能力,能降低人工提取特征的錯誤率。卷積神經網絡以卷積層與池化層交替連接提取特征。利用卷積核對輸入數據進行卷積運算:
(1)

池化層主要是對卷積層提取的特征降維,提高模型魯棒性,池化層通常連接在卷積層后。池化的方式一般有最大池化與均值池化。文中構建的網絡模型采取最大池化操作:
(2)

為防止MCDACNN模型出現過擬合,采取L2正則化控制模型復雜度,L2正則化損失函數如下:
(3)
式中,w為網絡模型的權重系數向量矩陣。
分類模塊采用一層全連接層和softmax層構成,全連接層由4個神經元組成。利用softmax層分別得到源域數據與目標域數據的各類別概率輸出。然后,源域特征的類別概率向量和源域真實標簽通過交叉熵損失函數反向優化模型,交叉熵損失函數的表達式如下:
(4)

目前許多基于特征遷移的跨工藝條件辨識模型都基本側重于縮小源域和目標域樣本之間的整體分布差異,MMD作為一種衡量整體分布差異的非參數距離度量指標被廣泛用于基于領域自適應的辨識模型中。基于MMD的領域自適應的損失函數
(5)

特征分布自適應主要是為了使源域與目標域中相同狀態樣本之間更好地分布對齊,分布對齊能力對準確辨識不同工藝條件刀具樣本狀態有重要影響。為縮小不同工藝條件下同一類磨損狀態樣本之間的分布差異,采用IDC和最大化核范數分別改善源域特征和目標域特征的距離關系。
利用源域數據有標簽的條件,提出了一種IDC優化源域特征判別性,旨在提高不同狀態樣本類間距離、增加同類狀態樣本聚集程度,提升遷移辨識特征分布對齊能力,進一步提高刀具磨損狀態遷移辨識準確率。IDC的計算公式如下:
(6)
(7)
(8)

在遷移任務中,目標域缺失標簽,所以IDC對目標域樣本不適用,導致目標域分類邊界附近數據存在混淆。為了同時提取具有高判別性的目標域特征,減少數據對標簽的依賴,提出最大化目標域樣本分類概率矩陣的核范數。核范數等價于矩陣奇異值之和,結合文獻[17]可知,核范數推廣至故障辨識領域具有以下的分類特性:核范數與樣本分類混淆程度成反比,最大化核范數即降低分類邊界的混淆程度,提高特征的可區分性。最大化核范數的計算公式為
LN=max(sum(svd(Pt)))
(9)
式中,Pt為目標域分類概率矩陣向量;svd(·)表示求矩陣的奇異值。
MCDACNN模型的優化目標主要由四部分組成:源域樣本的分類損失函數、源域與目標域分布距離度量損失函數、分別增強源域和目標域特征判別性的類間-類內距離約束和最大化核范數、防止模型過擬合的L2正則化項。模型的具體訓練過程如下。

(3)結合式(3)~式(6)和式(9),構成MCDACNN模型目標綜合損失函數L:
L=min(Lc+αLMMD+τLd+ηLN+L2)
(4)利用Adam優化算法反向傳播優化參數集θ,直至模型收斂。
MCDACNN模型訓練所需超參數見表2。

表2 模型超參數列表
本文使用的刀具監測數據采集自成都某企業車間THM6380IV五軸數控加工中心,實驗所切削的工件材料為40鋼,每次走刀行程為420 mm,用于切削工件的刀具為SWT數控磨制超硬3齒直柄立銑刀(16×16×32×92)、應用東華振動采集儀采集主軸振動信號,實驗設備布置如圖2所示,振動傳感器布置于主軸上。

圖2 實驗設備布置
刀具試驗臺采集振動信號的加速度傳感器的采樣頻率為10 kHz,依據刀具后刀面磨損量將刀具健康狀態分為4類[18],見表3。

表3 刀具磨損狀態劃分
在切削加工過程中,每走刀一次,使用工業顯微鏡測量刀具后刀面磨損量VB值,測量結果如圖3所示。

(a)初期磨損VB=0.028 mm (b)正常磨損VB=0.161 mm
在不同工藝條件下采集主軸振動信號,具體參數見表4。最終整個實驗數據集包含3種工藝條件數據,每種工藝條件下包含4種健康狀態樣本,每種健康狀態包含1500條樣本,樣本長度取1200,每個樣本都進行標準化處理。將3種不同工藝條件數據集中的樣本按照7∶3的比例劃分為訓練集和測試集,即訓練集4200個樣本,測試集1800個樣本。標準化處理公式如下:

表4 工藝條件參數
(10)
為分析本文提出的MCDACNN方法對不同工藝條件下刀具磨損狀態遷移辨識的性能,設置6組交叉驗證實驗。每次實驗均重復進行10次,取10次實驗結果準確率最大值的平均值以保證模型辨識準確率的穩定性。設置以下幾組對比實驗用于驗證MCDACNN方法的有效性:卷積神經網絡結合最大均值差異的領域自適應方法(CNN-MMD);在CNN-MMD方法基礎上使用IDC提取源域判別性高的特征(CNN-MMD-IDC);文獻[14]深度對抗性領域適應網絡(deep adversarial domain adaptation network,DADAN);文獻[19]多領域適應方法(deep convolutional transfer learning network,DCTLN)。遷移辨識結果如表5所示。

表5 不同工藝條件下刀具磨損狀態遷移辨識結果
由表5可以看出,CNN-MMD方法的平均辨識準確率最低,僅為91.9%。DADAN方法在每次迭代優化中考慮了實例對之間的距離關系從而提高了故障樣本的分布對齊能力,其平均辨識準確率為92.5%。CNN-MMD-IDC方法通過IDC提升源域特征同種磨損狀態樣本的聚集程度,以達到更好的分布適配,其平均辨識準確率達到了94.3%,相較于無距離約束的CNN-MMD準確率提升2.4%。相較于其他方法,MCDACNN方法具有更高的遷移準確率96.8%,一方面是因為IDC促使源域特征具有更好的分布特性,另一方面是最大化核范數提高了目標域特征的區分性,因此,兩者同時提高了模型對提取特征的分布適配能力,進一步提升了模型的遷移辨識性能。
為了進一步對比分析MCDACNN方法的有效性,利用t-分布隨機鄰域嵌入算法[20](t-distributed stochastic neighbor embedding,t-SNE)對CNN-MMD、CNN-MMD-IDC與MCDACNN 3種方法在遷移任務1→2上進行特征可視化處理,結果如圖4所示。
由圖4a~圖4f可以看出,IDC使得源域不同類別間距離增大,不同類別樣本之間分布更為均衡,且同類樣本之間的聚集程度更高,一定程度上提高了對目標工藝條件數據的辨識準確率。然而這兩種方法目標域特征仍然存在混淆,圖4g~圖4i是本文所提出的MCDACNN方法的特征分布圖,可以看出源域特征與目標域特征得到明顯改善,減少了不同類別樣本混淆的情況,提高了源域特征與目標域特征的適配能力,結果表明,同類樣本的分布對齊能力以及不同類別故障樣本邊界開闊性直接影響不同工藝條件下刀具磨損狀態遷移辨識準確率。

(a)源域特征(CNN-MMD) (b)目標域特征(CNN-MMD) (c)源域特征和目標域特征(CNN-MMD)
為了更直觀表達出上述3種辨識方法對每一種磨損狀態樣本的分類準確率,圖5給出了不同辨識方法對于遷移任務1→2的混淆矩陣。
由圖5可以看出,處于急劇磨損狀態的目標域樣本辨識準確率較低,CNN-MMD-IDC方法在IDC的作用下對急劇磨損狀態樣本的辨識準確率僅為88%,而MCDACNN方法對急劇磨損狀態樣本的辨識準確率達到了99%,這是由于MCDACNN方法不僅利用IDC改善了源域樣本之間的距離關系,而且引入了最大化核范數增強了目標域樣本可區分性,兩種措施分別作用于源域樣本和目標域樣本,增強了不同工藝條件下刀具磨損樣本的領域適應能力,同時結合圖4d~圖4i可以綜合分析出MCDACNN方法有效降低了急劇磨損樣本和失效期樣本的混疊程度,所以MCDACNN方法相較于CNN-MMD-IDC方法,對急劇磨損階段樣本的辨識準確率更高。通過圖5不同方法的混淆矩陣結果表明,MCDACNN方法對4種磨損狀態的遷移辨識準確率都是最高的。

(a)CNN-MMD
為衡量同類隨機樣本的離散程度,給出了上述3種方法在目標工藝條件下的4種磨損狀態特征方差統計柱狀圖,如圖6所示。方差越小代表同種磨損狀態樣本聚集程度越高。由圖6可以看出,采用MCDACNN方法得到的目標域不同磨損狀態特征的方差均最小。圖6從類內距離的角度解釋了MCDACNN方法相較于其他幾種方法取得了更優異的遷移辨識準確率。此外,為定量分析不同類別間的類間距離,圖7給出了不同方法提取的目標域4種磨損狀態樣本的整體核范數統計圖。核范數通過類別間混淆程度可以間接表達類間距離,核范數越大表示類別間混淆程度越低,類間距離越大。由圖7可知,采用MCDACNN方法獲得的特征整體核范數最大,為84.025 269,所以采用MCDACNN方法獲得的不同磨損狀態樣本特征之間的類間距離最大。圖8為不同方法提取的目標域4種磨損狀態樣本特征各自的核范數統計圖。可以看出,MCDACNN方法對于每一類樣本特征的核范數均是最小,說明該方法所提同類樣本特征的聚集程度最高。結合圖6、圖7與圖8可以得出,本文方法相較于其他方法類間距離最大,類內距離最小,故而遷移辨識效果最好。綜上可知,MCDACNN方法通過IDC與最大化核范數同時改善了源域與目標域可遷移特征的距離關系,提升了不同工藝條件特征之間的適配能力,對比實驗證明了本文方法的有效性。

圖6 方差統計圖

圖7 不同方法整體核范數統計圖

圖8 不同方法不同磨損類別樣本核范數統計圖
(1)通過特征可視化結果可知,類間-類內距離約束和最大化核范數通過改善樣本距離關系,能夠同時提升領域適配能力,實現不同工藝條件樣本特征高準度分布對齊。
(2)相比于其他同類深度遷移學習方法,MCDACNN方法對不同工藝條件下刀具磨損狀態遷移辨識具有一定的優勢,平均辨識準確率達到了96.8%。
(3)MCDACNN方法克服了生產現場不同工藝條件帶來的樣本分布差異影響,實現了利用一種工藝條件下的標記數據訓練模型而識別另一種工藝條件下無標簽刀具磨損樣本的狀態,降低了模型對有標簽數據的依賴,因此具有實際的工程應用價值。
(4)本文在4種工藝參數改變的跨工藝條件下驗證了方法的有效性,實際加工制造過程中變化的工況類型還比較多,例如工件材料、刀具類型等,未來將在更多類型的復雜工藝條件下驗證本文方法的有效性。