












摘要:針對當(dāng)前遷移學(xué)習(xí)算法應(yīng)用于軸承故障診斷領(lǐng)域時,目標域中可能存在未知故障類別進而導(dǎo)致識別準確率過低的問題,引入了開集域自適應(yīng)方法。針對現(xiàn)有的開放集域自適應(yīng)算法在進行分布對齊時,多注重跨域?qū)R,很少關(guān)注領(lǐng)域內(nèi)部的分布情況,從而導(dǎo)致對未知類別識別率較低的問題,提出了一種采用集約化開放集差異分布對齊(IDAOD)策略的軸承故障診斷方法,集成了跨域散度對齊和域內(nèi)分布異化方法。使用開放集最近鄰類驗證方法獲取目標域偽標簽,然后構(gòu)造源域和目標域的總體散度矩陣,進行跨域的散度對齊?;诜植歼m配加權(quán)條件分布,進一步異化同領(lǐng)域內(nèi)不同類別的空間分布。在結(jié)構(gòu)風(fēng)險最小化框架下,基于開放集差異理論構(gòu)造的損失函數(shù),引入正則化項,得到最優(yōu)解和新的目標域偽標簽。通過在Office-31數(shù)據(jù)集上進行試驗,驗證了IDAOD算法的可行性。分別在CWRU和JNU軸承數(shù)據(jù)集上進行故障診斷試驗,所提方法對未知故障類別的識別率均高于其他對比開放集算法,驗證了所提方法在軸承數(shù)據(jù)集上能有效提高目標樣本含有未知樣本時的準確率。
關(guān)鍵詞:開放集差異;分布對齊;軸承故障診斷;散度矩陣
中圖分類號:TH17
DOI:10.3969/j.issn.1004-132X.2024.09.012
Bearing Fault Diagnosis Method Based on Intensive Distribution Alignment with Open Set Difference
LI Can WANG Guangbin2,1 ZHAO Shubiao1, 2 ZHONG Zhixian1 ZHANG Hui
1.School of Mechanical and Control Engineering,Guilin University of Technology,Guilin,Guangxi,541006
2.School of Mechanical and Electrical Engineering,Lingnan Normal University,Zhanjiang,Guangdong,524048
Abstract: In view of the facts that the current transfer learning algorithm was applied to the field of bearing fault diagnosis, there might be unknown fault categories in the target domain, which led to the problems of low recognition accuracy, and an open set domain adaptive method was introduced. Aiming at the problems that the existing open set domain adaptive algorithm paid more attentions to cross-domain alignment and paid little attention to the distribution within the domain when performing distribution alignment, which led to the low recognition rate of unknown categories. A method was proposed based on intensive distribution alignment with open set difference(IDAOD), which integrated cross-domain divergence alignment and intra-domain distribution alienation method. Firstly, the open set nearest neighbor class verification method was used to obtain the pseudo-label of the target domain. Then, the overall divergence matrix of the source domain and the target domain was constructed, and the cross-domain divergence alignment was performed. Based on the distribution adaptation weighted conditional distribution, the spatial distribution of different categories was further alienated in the same domain. Finally, under the framework of structural risk minimization, the loss function constructed was introduced based on the open set difference theory, and the regularization term was introduced to obtain the optimal solution and the new target domain pseudo-label. The feasibility of the IDAOD algorithm was verified by experiments on Office-31 dataset. The fault diagnosis experiments were carried out on CWRU and JNU bearing data sets respectively, and the recognition rate of unknown fault category is higher than that of other comparative open set algorithms. It is verified that the method proposed herein may effectively improve the accuracy of the bearing data set when target sample contains unknown samples.
Key words: open set difference; distribution alignment; bearing fault diagnosis; divergence matrix
0 引言
軸承作為現(xiàn)代工業(yè)生產(chǎn)的關(guān)鍵組件,其意外故障不僅可能導(dǎo)致經(jīng)濟上的巨大損失,甚至可能威脅工作人員的生命安全[1],因此,對軸承的運行狀況進行高效且直接的診斷對于提高機械設(shè)備的可靠性至關(guān)重要。
近年來,針對訓(xùn)練集與測試集分布不一致的問題,研究者提出了眾多無監(jiān)督域自適應(yīng)(unsupervised domain adaptation, UDA)算法[2-3]。UDA算法作為一種遷移學(xué)習(xí)方法,旨在將含有豐富標記樣本的源域中的相關(guān)知識轉(zhuǎn)移到缺乏標記的目標域,其核心目標是縮減兩個域之間的分布差異。目前,UDA算法的研究主要集中在兩個方向:一是特征匹配[4-6],該方法通過探索一個新的特征空間,使兩個域在該空間中的邊際分布或條件分布達到一致;二是實例重加權(quán)[7-8],該方法通過調(diào)整源域樣本的權(quán)重來減少分布偏差。
值得注意的是,大部分現(xiàn)有UDA算法都基于一個內(nèi)在假設(shè),即源域和目標域具有一致的標簽集。在這一假設(shè)基礎(chǔ)上,UDA算法進一步演化為無監(jiān)督閉集域自適應(yīng)(unsupervised closed set domain adaptation, UCSDA)方法。BEN-DAVID等[9]對閉集域自適應(yīng)的學(xué)習(xí)邊界進行了闡述,指出目標分類器的表現(xiàn)取決于源分類器的效能和兩個域間的差異?,F(xiàn)有的多種UCSDA算法都是在此理論邊界的基礎(chǔ)上提出的,致力于最大程度地縮小不同域之間的差異。
遷移成分分析(transfer component analysis, TCA)[4]利用最大均值差異(maximum mean discrepancy, MMD)策略,在新的特征空間中實現(xiàn)分布的匹配。進一步地,聯(lián)合分布自適應(yīng)(joint distribution adaptation, JDA)[5]通過同時匹配邊際分布和條件分布優(yōu)化了TCA方法。自適應(yīng)正則化遷移學(xué)習(xí)(adaptation regularization transfer learning, ARTL)[10]則引入流形正則化,探索不同域間的幾何連續(xù)性,實現(xiàn)分布匹配。
近期的研究成果揭示,深度學(xué)習(xí)網(wǎng)絡(luò)已經(jīng)在閉集域自適應(yīng)任務(wù)中展現(xiàn)出不錯的效果。深度自適應(yīng)網(wǎng)絡(luò)(deep adaptation networks, DAN)[11]引進了三層自適應(yīng)結(jié)構(gòu)進行分布匹配,并采用多核MMD策略優(yōu)化深度表征?;赪asserstein距離的表示學(xué)習(xí)[12]則通過整合Wasserstein距離至神經(jīng)網(wǎng)絡(luò)中,致力于最小化分布偏差。另一方面,實例重加權(quán)[13]方法通過調(diào)整源域樣本權(quán)重來縮減分布偏差。MENG等[7]提出一種動態(tài)重加權(quán)域自適應(yīng)方法,通過動態(tài)權(quán)重策略計算平衡因子,以消除分類器訓(xùn)練和域適應(yīng)之間不平衡造成的負遷移。吳磊等[8]對這類重要的重加權(quán)方法進行了深入的理論探討。然而,顯著的域間差異導(dǎo)致許多有價值的源域樣本權(quán)重下降,進而遺失關(guān)鍵信息。更需指出的是,由于存在未知目標樣本干擾分布匹配,現(xiàn)有算法在開集域自適應(yīng)場景下往往無法有效應(yīng)用,可能引發(fā)負遷移現(xiàn)象。
無監(jiān)督開放集域自適應(yīng)(unsupervised open set domain adaptation, UOSDA)方法應(yīng)運而生,最初由BUSTO等[14]和SAITO等[15]引入。在此方法中,未標記的目標域涵蓋了不屬于源域標簽集的未知類別,目前解決UOSDA問題涉及兩大核心難題。首先,目標域缺乏對未知樣本進行鑒別的充分信息,需要深入挖掘目標域中的細微信息來確定已知類與未知類的界限。其次,在UOSDA中,當(dāng)對整體分布進行匹配時,必須避免將未知目標樣本納入匹配過程,以免引發(fā)負遷移現(xiàn)象。
目前,解決UOSDA問題的遷移學(xué)習(xí)算法并不多見。迭代分配和變換(assign and transform iteratively, ATI)[14]是首個被提出的UOSDA算法,該算法采用約束性整數(shù)規(guī)劃來辨別未知目標樣本,并通過排除這些預(yù)測出的未知樣本來學(xué)習(xí)源域與目標域間的線性映射。然而,ATI依賴于一個假設(shè),即源域內(nèi)含有目標域所不包含的未知類別。為解決此局限,SAITO等[15]提出首個深度UOSDA算法——開放設(shè)置回傳播(open set back propagation, OSBP),致力于在不依賴此假設(shè)的情況下解決UOSDA問題。OSBP通過實施一個二值交叉熵損失函數(shù)拒絕未知目標樣本,并利用概率估計來區(qū)分目標域內(nèi)的已知類和未知類樣本。ZHONG等[16]提出了一種新原則指導(dǎo)的深度UOSDA方法,通過梯度下降最小化源域風(fēng)險,并通過開集條件對抗訓(xùn)練策略最小化分布差異。LUO等[17]提出了漸進圖學(xué)習(xí)(progressive graph learning, PGL)框架,PGL通過將圖神經(jīng)網(wǎng)絡(luò)與情景訓(xùn)練相結(jié)合,并利用對抗學(xué)習(xí)來縮小源域和目標分布之間的差距。WU等[18]提出了一種新的無監(jiān)督學(xué)習(xí)算法,通過經(jīng)驗最小化目標誤差的上界。FANG等[19]確立了開放集域自適應(yīng)的學(xué)習(xí)邊界,并引入了一種創(chuàng)新的無監(jiān)督開放集域自適應(yīng)算法——開放差異分布對齊(distribution alignment with open difference,DAOD)。該算法通過開放集差異技術(shù)有效地從未知目標樣本中實現(xiàn)分離,從而針對UOSDA問題的首要難題提供了解決方案。
觀察現(xiàn)有UOSDA算法在分布對齊過程中的實踐不難發(fā)現(xiàn),這些算法過度側(cè)重于跨域?qū)R而忽視了域內(nèi)分布的微妙變化。針對此現(xiàn)象,本研究提出了一種集約化開放集差異分布對齊策略(intensive distribution alignment with open set difference,IDAOD)。該方法融合了跨域散度對齊與域內(nèi)分布異化技術(shù),不僅旨在消除域間偏移和域內(nèi)類別重疊問題,還致力于加強跨域?qū)R的精確度,以更全面地應(yīng)對UOSDA問題中的第二個難題。
1 開放集差異分布對齊方法
閉集和開放集域自適應(yīng)之間的差異如圖1所示,大多數(shù)現(xiàn)有的域適應(yīng)方法在圖1a情況下工作,但在目標域中出現(xiàn)新故障類別的圖1b情況下識別率較差,圖1c方法不僅可以對齊已知類分布,而且可以檢測到新的故障類別。
4 采用集約化開放集差異分布對齊策略的故障診斷步驟
本文采用集約化開放集差異分布對齊策略進行故障診斷,首先使用開放集最近鄰(open-set nearest-neighbor,OSNN)類驗證方法(OSNNcv-t)[23]來學(xué)習(xí)偽標簽,我們從測試樣本s中選擇兩個最近鄰點v,u。如果兩個最近鄰具有相同的標簽yc,則用標簽yc對s進行分類。否則,在假定‖v-s‖2≤‖u-s‖2的情況下,計算‖v-s‖2/‖u-s‖2。如果該比值小于或等于一個預(yù)定義的閾值t,0lt;tlt;1,則s與v具有相同的標簽,否則,s被識別為未知樣本。在本文中,設(shè)定源域與目標域的共享類別為N,而目標域中包含的未知類別均被識別為未知類別,即第N+1類為識別的未知類別。為了使偽標簽更加準確,分別構(gòu)造源域和目標域的總體散度矩陣,進行跨域散度對齊;然后在適配加權(quán)條件分布的基礎(chǔ)上進一步異化領(lǐng)域內(nèi)類別間的空間分布,有效減小域內(nèi)類別的重疊現(xiàn)象;最后在最小化結(jié)構(gòu)風(fēng)險框架下構(gòu)建故障診斷模型。本文所提故障診斷整體流程如圖2所示,具體步驟如下。
(1)將已知標簽的軸承振動信號作為源域Ds,未知標簽的信號數(shù)據(jù)作為目標域Dt。通過多尺度子頻帶模糊熵方法[24]對源域和目標域振動信號樣本進行特征提取后作為輸入,使用開放集最近鄰類驗證方法(OSNNcv-t)獲取目標域偽標簽t。
(2)散度對齊。根據(jù)源域樣本Ds和目標域樣本Dt,分別計算類間散度矩陣Sb和類內(nèi)散度矩陣Sw,并由式(6)構(gòu)造源域和目標域的總體散度矩陣Sos和Sot。在子空間優(yōu)化目標函數(shù)中嵌入域內(nèi)散度矩陣進行跨域散度對齊,得到新的優(yōu)化目標函數(shù):argminZ‖ZTSosZ-Sot‖2F,根據(jù)目標函數(shù)導(dǎo)出的線性變換矩陣Z,可對原源域數(shù)據(jù)進行變換XNews=XsZ,得到散度對齊后的新源域數(shù)據(jù)XNews。
(3)加權(quán)條件分布適配。由最大均值差異函數(shù)與核技巧可將跨域加權(quán)條件分布適配表示為:D(c)f*(Ds,Dt)=tr(ξTKMKξ),然后根據(jù)當(dāng)前每個類別的樣本個數(shù)計算類別c的先驗概率P(yc),并根據(jù)式(17)計算類別c的條件分布矩陣Mc,得到所有條件分布矩陣M=∑Cc=1Mc。
(4)域內(nèi)類間分布異化。類似地,將源域和目標域的類間分布異化項轉(zhuǎn)化為矩陣跡的形式:D-(c)f*(Ds)=tr(ξTKM-(s)Kξ)和D-(c)f*(Dt)=tr(ξTKM-tKξ),計算目標域內(nèi)類別c的先驗概率,
根據(jù)式(18)、式(19)計算源域和目標域內(nèi)類別c的最大均值差異矩陣M-sc和M-tc,求和得到總的分布矩陣M-s=∑Cc=1M-sc和M-t=∑Cc=1M-tc。
(5)計算拉普拉斯正則化矩陣L、核矩陣K,根據(jù)式(20)求得最優(yōu)解ξ,代回式(9)得到分類器f*,使用此分類器更新目標域偽標簽t(x)=f*(Xt),重復(fù)步驟(2)~(5),直至結(jié)果收斂。
5 實驗驗證
5.1 參數(shù)設(shè)置
IDAOD主要涉及以下超參數(shù):①核函數(shù)K;②自適應(yīng)參數(shù)λ、σ、ρ、p、μ;③開放集參數(shù)α、γ;④迭代次數(shù)T和閾值t,其中t的范圍為(0,1)。以下將對各參數(shù)進行深入探討。
(2)自適應(yīng)因子μ。該系數(shù)標識了邊際分布與條件分布間的相對關(guān)系。WANG等[25]首次嘗試通過應(yīng)用A-距離來估算μ,d0-1H為差異距離dlH的特例。A-距離也可以被闡述為,基于假設(shè)集H構(gòu)建的二分類器以區(qū)分兩個領(lǐng)域的誤差。WANG等[25]通過線性假設(shè)集來計算A-距離。令ε(h)為線性分類器h在源樣本Su和目標樣本Tu的判別誤差,于是有A-距離公式:
(3)開放集參數(shù)α、γ。IDAOD在不同α值和γ值下的準確率分別如圖3和圖4所示,從圖中可以明顯看出,IDAOD能夠在α∈[0.2,0.4]和γ∈[0.15,0.5]區(qū)間中表現(xiàn)出穩(wěn)定良好的性能,且當(dāng)α=0.4和γ=0.25時,IDAOD表現(xiàn)出的識別準確率是最佳的。這揭示了在適當(dāng)調(diào)整這兩項參數(shù)后,IDAOD的穩(wěn)定性表現(xiàn)依照特定規(guī)則。首先,需要推導(dǎo)出開放集差異中的正項Rtu,C+1和負項Rsu,C+1。較大的正項意味著較多的樣本被歸類為未知類,較大的負項意味著較多的樣本被識別為已知類。為了保證正負項之間的平衡,差異|α-γ|不能設(shè)置得過大;而且考慮到正項的系數(shù)1/(1-πtC+1)大于1,α應(yīng)該大于γ。在本研究中,設(shè)定α=0.4和γ=0.25。
(4)其他超參數(shù)。IDAOD展現(xiàn)出對廣泛超參數(shù)值的魯棒性。經(jīng)過測試,優(yōu)選的參數(shù)值為:λ∈[50,100],ρ∈[0,1],p∈[2,32],σ∈[0.2,1.6],t∈[0,0.9],且IDAOD能夠在10次迭代內(nèi)收斂。總體而言,IDAOD在廣大參數(shù)范圍下仍保持良好的魯棒性。因此,在實際操作中,無需對這些參數(shù)進行細微調(diào)整。本文中,我們選擇了固定參數(shù)值:p=10,ρ=1,σ=1,T=10,t=0.5以及λ=50。
對IDAOD的參數(shù)進行進一步優(yōu)化,參數(shù)選擇遵循以下原則:①考慮正則化項‖f*‖2K的重要性,傾向于選擇較大的σ(σ=1)以避免IDAOD性能下降;②參數(shù)ρ和p的選擇依據(jù)文獻[26]的建議;③考慮到IDAOD的分布對齊的必要性,傾向于選取較大的λ(至少為50)進行計算。
其中,*是預(yù)測的分類器;Tc為類別c的樣本的集合;TN+1為未知類別樣本的集合。需要注意的是,Acc(O)是評價UOSDA算法性能的主要指標,表示在所有目標域樣本上評估的平均準確率;Acc(O*)表示僅在已知類別的目標域上測量的平均準確率;U表示未知類的準確率;Hs表示O*和U的調(diào)和平均值,只有當(dāng)共享類O*和未知類U的準確率同時較高時,Hs的值才會較高。
5.2 Office-31數(shù)據(jù)集評估
首先,在圖像跨域識別任務(wù)Office-31數(shù)據(jù)集上進行了算法評估。Office-31數(shù)據(jù)集由3個實際應(yīng)用中的對象域組成,包括Amazon在線電商圖片(以下簡稱A)、DSLR單反相機拍攝的高解析度圖片(以下簡稱D)和Webcam網(wǎng)絡(luò)攝像頭拍攝的低解析度圖片(以下簡稱W),含4652張圖片,分布在31個類別中,如圖5所示。據(jù)此,我們設(shè)定了6個領(lǐng)域自適應(yīng)任務(wù):A→D,A→W,D→A,W→A,D→W和W→D。為了遵循標準協(xié)議并與其他算法進行比較,從AlexNet的全連接層-7(fc7)提取特征向量。對于此數(shù)據(jù)集,我們提出了一個開放集協(xié)議,其中類1~10被定義為共享類,而類21~31作為目標域的未知類。
我們選擇以下算法與IDAOD進行比較。
(1)無轉(zhuǎn)移。采用OSNN[23],通過計算樣本與其兩個最近鄰類別的相似度得分比率,并與預(yù)定閾值進行對比,以辨識未知樣本。
(2)封閉集。結(jié)合TCA[4]和OSNN,使用
TCA旨在證明UCSDA算法在處理UOSDA問題時可能導(dǎo)致負遷移,從而影響性能。
(3)開放集。結(jié)合ATI[14]和OSNN,盡管ATI是第一個UOSDA算法,但它需要通過對未知的源樣本進行操作來解決問題。因此,為適應(yīng)設(shè)置的環(huán)境,使用ATI來選擇離群值,并學(xué)習(xí)匹配源域和目標域的新特征。最終,使用OSNN進行偽標簽預(yù)測。
(4)OSBP[15]。OSBP使用對抗性神經(jīng)網(wǎng)絡(luò)和二值交叉熵損失學(xué)習(xí)目標樣本的概率分布,并據(jù)此估算概率以識別未知樣本。
(5)DAOD[19]。DAOD利用開放集差異從樣本中分離出未知的目標樣本。
不同UOSDA任務(wù)中的分類精度表現(xiàn)如表1所示,該結(jié)果顯示:①封閉集算法TCA在大多數(shù)場景下的表現(xiàn)較為不佳,其效果甚至低于標準的OSNN算法,表明可能存在負遷移現(xiàn)象;②開放集算法在大多數(shù)任務(wù)中均優(yōu)于OSNN,主要因為源樣本與已知目標樣本的分布存在差異。
在多數(shù)任務(wù)環(huán)境中,IDAOD算法的Acc(O)優(yōu)于5種基準算法。具體來說,IDAOD在6個任務(wù)中的平均分類準確率Acc(O)、Acc(O*)分別達到88.2%、90.9%,相較于DAOD算法,性能提高了2.9%、5.3%,驗證了IDAOD算法的可行性。
5.3 CWRU和JNU軸承數(shù)據(jù)集評估
為了驗證所提方法不僅在公開的圖像數(shù)據(jù)集上具有較好的識別能力,在軸承復(fù)合故障數(shù)據(jù)集上也有較好的效果,本文采用凱斯西儲大學(xué)(CWRU)的開放軸承振動數(shù)據(jù)集和江南大學(xué)(JNU)軸承數(shù)據(jù)集進行軸承故障診斷算法驗證。CWRU實驗裝置由左側(cè)的一個二馬力三相感應(yīng)電動機和右側(cè)的用于產(chǎn)生額定負載的測力計組成,兩者通過扭矩傳感器進行精確對準,測試對象為安裝在電動機驅(qū)動端的深溝球軸承,而振動傳感器則位于電動機驅(qū)動端的上側(cè)。
CWRU選擇的數(shù)據(jù)覆蓋了4種狀況:健康(NO)、內(nèi)圈故障(IF)、滾動體故障(BF)以及外圈故障(OF)。每種故障狀態(tài)具有3種不同的故障尺寸(0.007″、0.014″,0.0021″)和3種電機工況(0 HP/1797 r·min-1、1 HP/1772 r·min-1、2 HP/1750 r·min-1),采樣頻率設(shè)定為12 kHz。本研究設(shè)定了不同工況下的軸承遷移任務(wù),分別構(gòu)造源域和目標域樣本集,以模擬實際變工況下的軸承故障診斷。每種健康狀態(tài)包含100個樣本,每個樣本具有2048個數(shù)據(jù)點,形成一個包含1000個樣本的樣本集。通過這種方式構(gòu)建了3個不同的樣本集,從而形成了6個變工況故障診斷的遷移任務(wù)。CWRU軸承數(shù)據(jù)集描述情況及類型描述情況分別如表2和表3所示。同時為CWRU軸承數(shù)據(jù)集引入一個開放集協(xié)議,將類1~6定義為共享類,類8~10被用作目標域中的未知類。
JNU軸承故障數(shù)據(jù)集由加速度計分別在3種轉(zhuǎn)速條件(0 HP/600 r·min-1,1 HP/800 r·min-1和2 HP/1000 r·min-1)下采集滾動軸承故障數(shù)據(jù),采樣頻率同樣設(shè)置為12 kHz。包含3種健
康狀況:正常狀態(tài)(NO)、外圈故障(OF)、滾動體故障(BF)。同樣設(shè)定了不同工況下的軸承遷移任務(wù),每種類別包含100個樣本,形成400個樣本的樣本集。JNU軸承數(shù)據(jù)集描述情況如表4所示。同時也為JNU軸承數(shù)據(jù)集引入一個開放集協(xié)議,將類1、3定義為共享類,類2、4被用作目標域中的未知類。
本文通過多尺度子頻帶模糊熵[24]對軸承數(shù)據(jù)進行特征提取。首先,小波包方法用于將原始信號分解成多個子尺度信號,隨后計算這些子帶信號的模糊熵值。由于該算法能夠逐層分解并挖掘數(shù)據(jù)的特征值與特征向量,因此它能高效且準確地提取復(fù)雜信號中的故障特征。
與其他5種基準算法相比較,在CWRU軸承數(shù)據(jù)集上測得的分類結(jié)果如表5所示。
所示??梢钥闯?,本研究所提出的IDAOD方法在CWRU數(shù)據(jù)集和JNU軸承數(shù)據(jù)集上大部分任務(wù)的識別率均顯著優(yōu)于其他算法,在CWRU軸承數(shù)據(jù)集上,對未知類別的平均識別精度高達99.5%;在JNU軸承數(shù)據(jù)集上,對未知類別的識別精度也達到了92.8%。這得益于該方法在處理不同工況下數(shù)據(jù)時,對域間數(shù)據(jù)散度偏移進行了充分的考慮,進而通過數(shù)據(jù)散度對齊和域內(nèi)分布結(jié)構(gòu)的挖掘來調(diào)整類間距離。該方法還引入了加權(quán)因子以對齊數(shù)據(jù)分布,有效地規(guī)避了特征失真,并可通過迭代過程不斷優(yōu)化數(shù)據(jù)的空間分布。綜合來看,該方法在開放集、變工況、多故障尺寸、多故障類型的環(huán)境下,識別準確率表現(xiàn)出色。
5.4 結(jié)果可視化
為了更精確地評估對目標域的診斷性能,選取具有代表性的2種算法與本文所提方法進行對比,通過t-SNE技術(shù)將不同方法學(xué)習(xí)到的高級表示進行可視化,其中標簽1~6為與源域共享的已知故障類別,標簽7為識別的未知故障類別,相關(guān)結(jié)果如圖7所示。
由圖7a可知,OSBP存在嚴重重疊,不僅未能正確識別出未知類別,而且對已知的故障類別分類效果差,混淆了類別的界限,導(dǎo)致整體識別準確率低。由圖7b可知,DAOD能較好地區(qū)分已知故障類別與未知類別的界限,但仍有部分混淆,已知類別之間分類也存在部分重疊,整體分類效果不理想。由圖7c可知,IDAOD不僅能夠高效地區(qū)分已知類別與未知類別之間的界限,而且消除了域偏移與域內(nèi)重疊現(xiàn)象,提升了跨域?qū)R的效果,對未知故障類別的識別效果好,整體分類精度高。
為進一步明確對目標域的診斷明細,將CWRU遷移任務(wù)測試結(jié)果整合成混淆矩陣[27],如圖8所示,IDAOD診斷結(jié)果優(yōu)于其他2種方法。
5.5 消融實驗分析
消融分析是去除模型的某些部分,以便更好地理解模型的過程。為了精確評估散度對齊、跨域加權(quán)條件分布對齊以及類間分布異化在本研究方法中的貢獻,我們選擇了CWRU數(shù)據(jù)集中的3種任務(wù)(F0→F1、F0→F2和F1→F2)進行詳細的消融分析。我們構(gòu)建了3種消融模型:消去散度對齊(DDA)、消去加權(quán)條件分布對齊(DWF)以及消去類間分布異化(DIDA),并與本研究的完整方法進行了對比。得出的Acc(O*)和Acc(O)準確率分別展示在圖9中。
從圖9中可以看出,本文所提的故障診斷模型中的每一個部分對模型整體性能均有顯著貢獻,其中散度對齊對模型整體的貢獻度最大,識別準確率最大提高了20%,加權(quán)因子和類間分布異化項對遷移任務(wù)的準確率也起到了積極作用,進一步證實了本研究方法的各個部分對整體模型而言,均為不可或缺的元素。
6 結(jié)論
本文提出一種采用集約化的開放集差異分布對齊(IDAOD)策略的軸承故障診斷方法。該方法集成了跨域散度對齊和域內(nèi)分布異化方法,旨在消除域偏移與域內(nèi)重疊現(xiàn)象,提升跨域?qū)R的效果,以更好地解決軸承故障診斷中開放集域適應(yīng)分布上的差異問題,即解決了當(dāng)總體分布相匹配時不應(yīng)匹配未知的目標樣本的問題,從而提高對未知的目標樣本的識別率。通過在Office-31數(shù)據(jù)集上進行試驗,驗證了IDAOD算法的可行性。在CWRU軸承數(shù)據(jù)集上進行故障診斷試驗,對未知類別的識別率接近100%;同時在JNU軸承數(shù)據(jù)集上進行驗證,對未知故障類別的識別率也達到了92.8%。與其他開放集算法對比,驗證了本文所提方法在軸承故障診斷中能有效提高目標樣本含有未知樣本時的準確率。最后,在CWRU數(shù)據(jù)集上進行了消融實驗,進一步證實了本研究方法的各個部分均為不可或缺的元素。
雖然本文所提出的方法操作簡便,且算法的參數(shù)調(diào)整需求不大,但是包含較多的超參數(shù),應(yīng)用到實際的故障診斷工程中有一定的局限性。下一步可簡化模型結(jié)構(gòu),減少超參數(shù)的數(shù)量,以提高模型的解釋性和泛化能力;此外,也可以引入深度學(xué)習(xí)和其他前沿技術(shù),如自動化機器學(xué)習(xí),來自動選擇和優(yōu)化這些超參數(shù),降低其對復(fù)雜參數(shù)調(diào)整的依賴,從而提高其在實際工程中的適用性和準確性。
參考文獻:
[1]黃南天, 楊學(xué)航, 蔡國偉, 等. 采用非平衡小樣本數(shù)據(jù)的風(fēng)機主軸承故障深度對抗診斷[J]. 中國電機工程學(xué)報, 2020, 40(2):563-574.
HUANG Nantian, YANG Xuehang, CAI Guowei, et al. A Deep Adversarial Diagnosis Method for Wind Turbine Main Bearing Fault with Imbalanced Small Sample Scenarios[J]. Proceedings of the CSEE, 2020, 40(2):563-574.
[2]XIAO Ni, ZHANG Lei. Dynamic Weighted Learning for Unsupervised Domain Adaptation[C]∥2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR). IEEE, 2021:15237-15246.
[3]溫江濤, 張鵬程, 孫潔娣, 等. 殘差卷積自編碼網(wǎng)絡(luò)無監(jiān)督遷移軸承故障診斷[J]. 中國機械工程, 2022, 33(14):1707-1716.
WEN Jiangtao, ZHANG Pengcheng, SUN Jiedi,et al. Unsupervised Transfer Learning with Residual Convolutional Autoencoder Networks for Bearing Fault Diagnosis[J]. China Mechanical Engineering, 2022, 33(14):1707-1716.
[4]LI Yuanyuan, SHENG Hanmin, CHENG Yuhua, et al. State-of-health Estimation of Lithium-ion Batteries Based on Semi-supervised Transfer Component Analysis[J]. Applied Energy, 2020, 277:115504.
[5]HAN Te, LIU Chao, YANG Wenguang, et al. Deep Transfer Network with Joint Distribution Adaptation:a New Intelligent Fault Diagnosis Framework for Industry Application[J]. ISA Transactions, 2020, 97:269-281.
[6]DANG Wei, XIANG Longhai, LIU Shan, et al. A Feature Matching Method Based on the Convolutional Neural Network[J]. Journal of Imaging Science and Technology, 2023, 67(3):030402.
[7]MENG Yu, XUAN Jianping, XU Long, et al. Dynamic Reweighted Domain Adaption for Cross-domain Bearing Fault Diagnosis[J]. Machines, 2022, 10(4):245.
[8]吳磊, 王家序, 張新, 等. 基于最大重加權(quán)峭度盲解卷積的風(fēng)電故障診斷[J]. 中國機械工程, 2022, 33(19):2356-2363.
WU Lei, WANG Jiaxu, ZHANG Xin, et al.Blind Deconvolution Based on Reweighted-kurtosis Maximization for Wind Turbine Fault Diagnosis[J]. China Mechanical Engineering, 2022, 33(19):2356-2363.
[9]BEN-DAVID S, BLITZER J, CRAMMER K, et al. Analysis of Representations for Domain Adaptation[M]∥SCHLKOPF B, PLATT J, HOFMANN T. Advances in Neural Information Processing Systems 19.Cambridge:MIT Press, 2007:137-144.
[10]HU Qin, SI Xiaosheng, QIN Aisong, et al. Balanced Adaptation Regularization Based Transfer Learning for Unsupervised Cross-domain Fault Diagnosis[J]. IEEE Sensors Journal, 2022, 22(12):12139-12151.
[11]WANG Tianchi, YU Lu, WANG Wenyu, et al. Specific Emitter Identification Based on the Multi-discrepancy Deep Adaptation Network[J]. IET Radar, Sonar amp; Navigation, 2022, 16(12):2079-2088.
[12]SHEN Jian, QU Yanru, ZHANG Weinan, et al. Wasserstein Distance Guided Representation Learning for Domain Adaptation[C]∥Proceedings of the AAAI Conference on Artificial Intelligence. New Orleans, 2018:10.1609/aaai.v32i1.11784.
[13]董紹江, 朱朋, 朱孫科, 等. 基于仿真數(shù)據(jù)驅(qū)動和領(lǐng)域自適應(yīng)的滾動軸承故障診斷方法[J]. 中國機械工程, 2023, 34(6):694-702.
DONG Shaojiang, ZHU Peng, ZHU Sunke, et al. Fault Diagnosis Method of Rolling Bearings Based on Simulation Data Drive and Domain Adaptation[J]. China Mechanical Engineering, 2023, 34(6):694-702.
[14]BUSTO P P, GALL J. Open Set Domain Adaptation[C]∥2017 IEEE International Conference on Computer Vision(ICCV).Venice, 2017:754-763.
[15]SAITO K, YAMAMOTO S, USHIKU Y, et al. Open Set Domain Adaptation by Backpropagation[C]∥European Conference on Computer Vision—ECCV 2018. Cham:Springer International Publishing, 2018:156-171.
[16]ZHONG Li, FANG Zhen, LIU Feng, et al. Bridging the Theoretical Bound and Deep Algorithms for Open Set Domain Adaptation[J]. IEEE Transactions on Neural Networks and Learning Systems, 2023, 34(8):3859-3873.
[17]LUO Yadan, WANG Zijian, CHEN Zhuoxiao, et al. Source-free Progressive Graph Learning for Open-set Domain Adaptation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 45(9):11240-11255.
[18]WU Jun, HE Jingrui. Domain Adaptation with Dynamic Open-set Targets[C]∥Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining.Washington DC, 2022:2039-2049.
[19]FANG Zhen, LU Jie, LIU Feng, et al. Open Set Domain Adaptation:Theoretical Bound and Algorithm[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 32(10):4309-4322.
[20]ZHAO Shubiao, WANG Guangbin, LI Xuejun, et al. Fault Diagnosis of Rolling Bearing Based on Cross-domain Divergence Alignment and Intra-domain Distribution Alienation[J]. Journal of Vibroengineering, 2023, 25(6):1124-1140.
[21]秦玉峰, 史賢俊. 基于MMD的故障可診斷性定量評價方法[J]. 控制與決策, 2023, 38(10):2925-2933.
QIN Yufeng, SHI Xianjun. Quantitative Evaluation Approach of Fault Diagnosability Based on Maximum Mean Discrepancy[J]. Control and Decision, 2023, 38(10):2925-2933.
[22]CHEN Renxiang, ZHU Jukun, HU Xiaolin, et al. Fault Diagnosis Method of Rolling Bearing Based on Multiple Classifier Ensemble of the Weighted and Balanced Distribution Adaptation under Limited Sample Imbalance[J]. ISA Transactions, 2021, 114:434-443.
[23]MENDES JNIOR P R, de SOUZA R M, de O WERNECK R, et al. Nearest Neighbors Distance Ratio Open-set Classifier[J]. Machine Learning, 2017, 106(3):359-386.
[24]WANG Guangbin, ZHAO Shubiao, ZHONG Zhixian, et al. Research on Shaft Current Damage Identification of Variable Condition Motor Bearings Based on Multiscale Feature Label Propagation and Manifold Metric Transfer[J]. Lubricants, 2023, 11(2):69.
[25]WANG Jindong, FENG Wenjie, CHEN Yiqiang, et al. Visual Domain Adaptation with Manifold Embedded Distribution Alignment[C]∥Proceedings of the 26th ACM International Conference on Multimedia.Seoul, 2018:402-410.
[26]ZHAO Huimin, ZHENG Jianjie, DENG Wu, et al.Semi-supervised Broad Learning System Based on Manifold Regularization and Broad Network[J]. IEEE Transactions on Circuits and Systems I:Regular Papers, 2020, 67(3):983-994.
[27]王軍輝, 雷文平, 劉華杰, 等. 基于深度動態(tài)域適應(yīng)的軸承故障診斷研究[J]. 振動與沖擊, 2023, 42(14):245-250.
WANG Junhui, LEI Wenping, LIU Huajie, et al. Bearing Fault Diagnosis Based on Deep Dynamic Domain Adaptation[J]. Journal of Vibration and Shock, 2023, 42(14):245-250.
(編輯 王旻玥)
作者簡介:
李 燦,男,1999年生,碩士研究生。主要研究方向為軸承故障診斷和壽命預(yù)測。E-mail:Lc142366@163.com。
王廣斌(通信作者),男,1974年生,教授、博士研究生導(dǎo)師。主要研究方向為機械動力學(xué)、健康監(jiān)測與故障診斷。E-mail:jxxwgb@126.com。
收稿日期:2023-12-14
基金項目:廣東省基礎(chǔ)與應(yīng)用基礎(chǔ)研究基金海上風(fēng)電聯(lián)合基金(2022A1515240043);廣東省自然科學(xué)基金(2023A1515012698)