













摘要:針對(duì)復(fù)雜工況下軸承故障診斷的難題,文章提出了一種融合數(shù)據(jù)與知識(shí)的智能故障診斷方法。該方法首先利用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD) 對(duì)軸承振動(dòng)信號(hào)進(jìn)行預(yù)處理,然后基于支持向量機(jī)(SVM) 、隨機(jī)森林(RF) 和 K 近鄰(KNN) 等算法構(gòu)建預(yù)選模型庫,并通過網(wǎng)格搜索優(yōu)化模型參數(shù)。最終,將模型輸出結(jié)果與預(yù)先構(gòu)建的軸承故障知識(shí)圖譜關(guān)聯(lián),實(shí)現(xiàn)故障根因分析和輔助決策。實(shí)驗(yàn)結(jié)果表明,該方法在某軸承故障數(shù)據(jù)集上取得了 93.1% 的診斷準(zhǔn)確率,有效提升了故障診斷效率和準(zhǔn)確性。
關(guān)鍵詞:支持向量機(jī);隨機(jī)森林;K 近鄰算法;故障知識(shí)圖譜;故障診斷
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2025)01-0121-06 開放科學(xué)(資源服務(wù)) 標(biāo)識(shí)碼(OSID) :
0 引言
軸承作為關(guān)鍵部件,其壽命和可靠性直接影響設(shè)備的整體性能。尤其在高轉(zhuǎn)速、腐蝕性強(qiáng)、寬溫域等嚴(yán)苛環(huán)境下,軸承的服役壽命將顯著縮短。因此,如何有效地開展軸承故障診斷,并制定相應(yīng)的維護(hù)策略,對(duì)于保障設(shè)備的穩(wěn)定運(yùn)行至關(guān)重要。
傳統(tǒng)的設(shè)備維護(hù)策略經(jīng)歷了從事后維修到定期維修,再到視情維修的演變。事后維修適用于非關(guān)鍵設(shè)備,定期維修雖然可以減少突發(fā)故障,但存在過度維護(hù)和欠維護(hù)的問題。而視情維修則通過收集設(shè)備運(yùn)行數(shù)據(jù),預(yù)測(cè)潛在故障,從而實(shí)現(xiàn)更經(jīng)濟(jì)有效的維護(hù)。故障預(yù)測(cè)與健康管理(Prognostics and Health Man?agement,PHM) 技術(shù)是實(shí)現(xiàn)視情維修的關(guān)鍵。通過實(shí)時(shí)數(shù)據(jù)采集和分析,PHM 技術(shù)能夠?qū)崿F(xiàn)對(duì)系統(tǒng)的故障監(jiān)測(cè)、診斷和預(yù)測(cè)[1-2]。自 20 世紀(jì) 90 年代中期提出以來[3],PHM 技術(shù)已成為研究熱點(diǎn),并在航空航天、能源等領(lǐng)域得到廣泛應(yīng)用。
具體而言,PHM 技術(shù)主要分為基于物理模型的方法、基于統(tǒng)計(jì)的方法和基于數(shù)據(jù)驅(qū)動(dòng)的方法[4]。基于物理模型的方法通過結(jié)合設(shè)備故障失效模式,構(gòu)建反映設(shè)備性能退化規(guī)律的數(shù)學(xué)模型,以實(shí)現(xiàn)診斷和預(yù)測(cè)[5-6]。然而,由于軸承運(yùn)行工況復(fù)雜,力和載荷呈現(xiàn)非線性變化,導(dǎo)致建模的準(zhǔn)確性受到限制。基于統(tǒng)計(jì)的故障診斷方法以統(tǒng)計(jì)理論為基礎(chǔ),利用快速傅里葉變換[7]、小波變換[8]、經(jīng)驗(yàn)?zāi)B(tài)分解[9-10]和變分模態(tài)分解[11]等方法對(duì)軸承振動(dòng)信號(hào)進(jìn)行分析和處理,提取隱藏的故障特征[12]。這類方法具有數(shù)學(xué)理論嚴(yán)謹(jǐn)、適用性強(qiáng)的特點(diǎn),但計(jì)算量較大。基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法則利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等人工智能技術(shù),對(duì)軸承振動(dòng)信號(hào)進(jìn)行特征提取和模式識(shí)別,從而實(shí)現(xiàn)快速診斷。這類方法不依賴于故障模式的準(zhǔn)確識(shí)別,適用于各類復(fù)雜設(shè)備的故障診斷,且能有效降低計(jì)算復(fù)雜度,因此在軸承故障診斷中的應(yīng)用最為廣泛[13]。
在軸承故障診斷和根因分析中,大多數(shù)依賴專家的診斷經(jīng)驗(yàn)和已有知識(shí)。然而,這些知識(shí)往往是零散的、碎片化的,難以被高效利用。Google 于 2012 年提出了知識(shí)圖譜的概念,用于存儲(chǔ)和表示大規(guī)模的語義信息,從而完善存儲(chǔ)引擎[14]。知識(shí)圖譜是一種結(jié)構(gòu)化的語義知識(shí)庫[15],能夠?qū)﹄x散的、碎片化的、不同形式的知識(shí)進(jìn)行有效的加工、處理和整合,轉(zhuǎn)化為簡(jiǎn)單、清晰的三元組形式,進(jìn)行知識(shí)的關(guān)聯(lián)聚合,從而實(shí)現(xiàn)快速的知識(shí)查詢與高效的路徑推理。因此,通過構(gòu)建軸承故障知識(shí)圖譜以對(duì)知識(shí)進(jìn)行有效的組織和管理,可以提高知識(shí)利用率,挖掘引發(fā)故障的深層次原因,實(shí)現(xiàn)精準(zhǔn)的故障定位,進(jìn)而提升故障診斷全流程的智能化水平,這已成為軸承故障診斷及運(yùn)維決策的研究熱點(diǎn)[16]。
為提高軸承故障診斷的準(zhǔn)確性,并有效指導(dǎo)軸承運(yùn)維決策,本文提出了一種融合數(shù)據(jù)與知識(shí)的軸承智能故障診斷方法。該方法通過將故障知識(shí)圖譜中的故障現(xiàn)象與基于數(shù)據(jù)驅(qū)動(dòng)的故障狀態(tài)識(shí)別結(jié)果關(guān)聯(lián),實(shí)現(xiàn)軸承狀態(tài)監(jiān)測(cè)、故障診斷和處置決策的全過程健康管理。
1 基于融合數(shù)據(jù)與知識(shí)的軸承智能故障診斷模型
1.1 系統(tǒng)架構(gòu)設(shè)計(jì)
本文提出了一種融合數(shù)據(jù)與知識(shí)的軸承故障診斷模型,如圖 1 所示。首先,對(duì)軸承振動(dòng)信號(hào)數(shù)據(jù)進(jìn)行預(yù)處理,剔除信號(hào)噪聲并將其轉(zhuǎn)換為適用于模型訓(xùn)練的數(shù)據(jù)結(jié)構(gòu)。隨后,對(duì)預(yù)選模型庫中的支持向量機(jī)(SVM) 、隨機(jī)森林(RF) 、K 近鄰(KNN) 等故障診斷模型進(jìn)行訓(xùn)練,并通過參數(shù)尋優(yōu)方法實(shí)現(xiàn)預(yù)置模型的自動(dòng)優(yōu)化。最后,基于軸承故障知識(shí)的抽取與融合,構(gòu)建軸承故障知識(shí)圖譜。結(jié)合故障診斷結(jié)果,系統(tǒng)能夠識(shí)別故障根原因,并提出軸承健康狀態(tài)的控制和優(yōu)化建議,從而實(shí)現(xiàn)軸承故障診斷與維修保障的智能決策。
1.2 數(shù)據(jù)預(yù)處理
軸承數(shù)據(jù)的預(yù)處理操作分為3個(gè)步驟,分別為數(shù)據(jù)清洗層、數(shù)據(jù)分析層以及特征工程層,如圖 2 所示。
數(shù)據(jù)清洗層主要通過對(duì)包含缺失值、異常值和重復(fù)值的數(shù)據(jù)進(jìn)行空值清洗、野值剔除和數(shù)據(jù)過濾等操作,得到完備、正確的軸承數(shù)據(jù)集,從而減少數(shù)據(jù)采集過程中因環(huán)境噪聲等因素對(duì)數(shù)據(jù)的影響。
數(shù)據(jù)分析層分為可視化分析和定量分析兩個(gè)部分。首先,對(duì)數(shù)據(jù)在時(shí)間軸上進(jìn)行可視化分布處理,分析數(shù)據(jù)的平穩(wěn)性、趨勢(shì)性、周期性和分散性特點(diǎn)。進(jìn)一步,對(duì)不同類型的數(shù)據(jù)開展針對(duì)性的定量分析:對(duì)于平穩(wěn)性好的數(shù)據(jù),進(jìn)行定量化的平滑性檢驗(yàn);對(duì)于近似正態(tài)分布的數(shù)據(jù),進(jìn)行正態(tài)性檢測(cè);對(duì)于具有線性趨勢(shì)性的數(shù)據(jù),進(jìn)行差分分析以實(shí)現(xiàn)平滑處理;對(duì)于線性一致性強(qiáng)的二維散點(diǎn)數(shù)據(jù),計(jì)算皮爾遜相關(guān)系數(shù)和斯皮爾曼相關(guān)系數(shù);對(duì)于平穩(wěn)性較差的數(shù)據(jù),采用 FFT 變換、EMD 分解或小波包分解,分別分析其分解后的頻率振幅、IMF 分量或不同濾波器下的分解系數(shù)。上述分析為特征向量的提取奠定了基礎(chǔ)。
特征工程層是在數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析的基礎(chǔ)上,根據(jù)不同參數(shù)的分布特點(diǎn)提取數(shù)據(jù)特征。常見的特征提取方式包括:1) 對(duì)于平穩(wěn)且具有統(tǒng)計(jì)分布特性的遙測(cè)參數(shù),提取時(shí)域統(tǒng)計(jì)特征;2) 對(duì)于具有線性相關(guān)性的多變量,提取相關(guān)性特征;3) 對(duì)于在時(shí)域上變化具有一致性的參數(shù),提取相似度特征;4) 對(duì)于非平穩(wěn)的遙測(cè)參數(shù),提取時(shí)頻域特征。
需要注意的是,在特征提取后,可能會(huì)遇到特征樣本過多或正負(fù)樣本不均衡的情況。此時(shí),可以通過樣本重采樣和均衡化方法,使不同模式之間的樣本量趨于平衡,從而提高模型的訓(xùn)練效果。
1.3 故障診斷模型訓(xùn)練及評(píng)估
本文基于 K 近鄰算法(KNN) 、支持向量機(jī)(SVM) 以及隨機(jī)森林(RF) 算法構(gòu)建預(yù)選模型庫。隨后,使用交叉驗(yàn)證和超參數(shù)尋優(yōu)對(duì)模型進(jìn)行參數(shù)優(yōu)化,并利用準(zhǔn)確率、精確率、召回率和 F1 指標(biāo)等評(píng)估模型性能,以獲取最佳模型,具體流程如圖 3 所示。交叉驗(yàn)證是將經(jīng)過處理后的軸承特征樣本集分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,利用若干組訓(xùn)練集對(duì)預(yù)選模型庫中的模型進(jìn)行訓(xùn)練,再通過驗(yàn)證集評(píng)估模型的準(zhǔn)確率,取不同組準(zhǔn)確率的平均值作為模型的性能指標(biāo),將其中超過準(zhǔn)確率閾值的模型作為候選模型。
超參數(shù)尋優(yōu)是通過網(wǎng)格搜索法或梯度下降法實(shí)現(xiàn)模型參數(shù)的優(yōu)化。網(wǎng)格搜索法的速度較慢,但可以找到全局最優(yōu)的超參數(shù)組合;梯度下降法的優(yōu)化速度較快,但可能會(huì)陷入局部最優(yōu)。由于軸承數(shù)據(jù)樣本量相對(duì)較小,且初始模型候選參數(shù)較少,因此網(wǎng)格搜索法可在犧牲一定搜索效率的條件下,保證最佳的模型優(yōu)化效果。
在使用超參數(shù)尋優(yōu)得到模型的最優(yōu)參數(shù)組合后,即可使用測(cè)試集對(duì)模型進(jìn)行評(píng)估,通過準(zhǔn)確率指標(biāo)、F1 得分、召回率和精確率的值進(jìn)行分析,確定模型是否可取。
本文將軸承故障診斷中應(yīng)用最為廣泛的 K 近鄰算法、支持向量機(jī)和隨機(jī)森林算法作為預(yù)選模型,下面對(duì)模型進(jìn)行簡(jiǎn)要介紹。
1) 基于 K 近鄰算法的軸承故障診斷技術(shù)。
K 近鄰(KNN) 算法是通過查找訓(xùn)練樣本中與測(cè)試樣本最相似的k 個(gè)鄰居,并根據(jù)這些鄰居的類別來確定測(cè)試樣本的類別。因此,最近鄰個(gè)數(shù)是KNN算法中最關(guān)鍵的參數(shù)之一,它決定了在進(jìn)行分類時(shí),模型會(huì)參考的最近鄰樣本數(shù)量。憑借計(jì)算量小、靈活性高,以及對(duì)不同數(shù)據(jù)分布和數(shù)據(jù)特征適用性更強(qiáng)的優(yōu)勢(shì),K近鄰算法在文本分類、圖像分類等模式識(shí)別領(lǐng)域得到了廣泛應(yīng)用。
本文利用 KNN算法分析軸承故障數(shù)據(jù)的特征分布,實(shí)現(xiàn)對(duì)軸承故障的分類識(shí)別。具體算法為:將軸承故障數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,計(jì)算測(cè)試集樣本與訓(xùn)練樣本的相似度:
然后,根據(jù)結(jié)果進(jìn)行相似度排序,將測(cè)試集樣本分配到相似度值最大的類別中。
式中:?為類別屬性函數(shù),如果該測(cè)試樣本屬于該類別,則函數(shù)值為1,否則為0。
2) 基于支持向量機(jī)的軸承故障診斷技術(shù)。
支持向量機(jī)(SVM) 算法常用于分類問題的監(jiān)督學(xué)習(xí),具有良好的高維特征處理能力、對(duì)噪聲敏感度低以及計(jì)算成本低的特點(diǎn)。SVM 算法的參數(shù)主要受到C 參數(shù)、核函數(shù)和 gamma 參數(shù)的影響。C 參數(shù)控制模型的復(fù)雜度和對(duì)誤分類的容忍度;核函數(shù)(如線性、RBF、多項(xiàng)式等) 根據(jù)數(shù)據(jù)的性質(zhì)進(jìn)行選擇;gamma 參數(shù)決定了核函數(shù)的影響范圍,從而影響模型的平滑性。
軸承數(shù)據(jù)信號(hào)往往包含大量特征和復(fù)雜模式,本文采用 SVM 算法對(duì)軸承數(shù)據(jù)進(jìn)行分類,能夠有效應(yīng)對(duì)數(shù)據(jù)噪聲和高維特征等問題,同時(shí)保持較高的準(zhǔn)確性。假設(shè)有 K 個(gè)類別,SVM 會(huì)為每個(gè)類別訓(xùn)練一個(gè)二分類模型,將該類別的樣本與其他所有類別的樣本進(jìn)行區(qū)分。在預(yù)測(cè)階段,當(dāng)一個(gè)新的樣本輸入時(shí),所有 K 個(gè)分類器都會(huì)給出一個(gè)預(yù)測(cè)結(jié)果。每個(gè)分類器輸出一個(gè)預(yù)測(cè)值,然后選擇得分最高的分類器作為最終的分類結(jié)果。
3) 基于隨機(jī)森林算法的軸承故障診斷技術(shù)。
隨機(jī)森林算法(Random Forest,RF) 的主要思想是集成學(xué)習(xí)。通過多棵決策樹的集成來實(shí)現(xiàn)高效的分類和回歸任務(wù),并通過隨機(jī)采樣和隨機(jī)特征選擇等技術(shù)提高模型的多樣性,從而增強(qiáng)模型的穩(wěn)定性和準(zhǔn)確性。由于其強(qiáng)大的性能和較少的超參數(shù)調(diào)節(jié)需求,隨機(jī)森林算法能夠在大規(guī)模設(shè)備監(jiān)測(cè)系統(tǒng)中實(shí)時(shí)提供故障診斷,適合在工業(yè)環(huán)境中長(zhǎng)期運(yùn)行。
RF 的算法參數(shù)主要受到以下因素的影響:樹的數(shù)量(n_estimators) ,較多的樹能夠提高模型的穩(wěn)定性;節(jié)點(diǎn)分裂所需的最小樣本數(shù)(min_samples_split) ,該值越大,樹的復(fù)雜性越小,有助于防止過擬合。本文將隨機(jī)森林算法加入預(yù)選模型庫中,以增強(qiáng)模型診斷的實(shí)時(shí)性和穩(wěn)定性。
隨機(jī)森林模型的主要步驟為:
①Bootstrap 采樣:從原始訓(xùn)練數(shù)據(jù)集中隨機(jī)選擇n 個(gè)樣本(有放回抽樣) ,構(gòu)建一個(gè)新的子數(shù)據(jù)集,用于訓(xùn)練一棵決策樹。
②隨機(jī)特征選擇:每次劃分節(jié)點(diǎn)時(shí),隨機(jī)選擇m個(gè)特征,從中選擇最優(yōu)的特征進(jìn)行劃分,而非使用全部特征。
③生成決策樹:利用選定的子數(shù)據(jù)集和特征集訓(xùn)練一棵決策樹,直到滿足樹的停止條件(如樹深度、葉節(jié)點(diǎn)數(shù)量、數(shù)據(jù)最小樣本量等) 。
④重復(fù)過程:重復(fù)以上過程,生成多個(gè)決策樹,最終得到一組獨(dú)立的樹。
⑤投票機(jī)制:對(duì)于新的輸入樣本,所有決策樹對(duì)該樣本進(jìn)行分類,最終通過“投票”機(jī)制得出預(yù)測(cè)類別。即,每棵樹對(duì)樣本的預(yù)測(cè)值投票,最終選擇票數(shù)最多的類別作為最終預(yù)測(cè)結(jié)果。
4) 模型評(píng)估。
對(duì)于訓(xùn)練好的模型,使用評(píng)估指標(biāo)對(duì)模型進(jìn)行評(píng)價(jià),以確定模型的優(yōu)劣。本文使用準(zhǔn)確率、精確率、召回率和 F1 指標(biāo)進(jìn)行評(píng)價(jià)。
準(zhǔn)確率的計(jì)算公式為:
準(zhǔn)確率= 正確分類樣本/總樣本
精確率表示在所有被模型預(yù)測(cè)為正類的樣本中,實(shí)際上為正類的樣本比例:
準(zhǔn)確率= 真正類(TP )/真正類(TP ) + 假正類(FP )
召回率表示在所有真實(shí)正類樣本中,被正確識(shí)別出來的樣本比例:
召回率= 真正類(TP )/真正類(TP ) + 假負(fù)類(FN )
F1指標(biāo)是精確率和召回率的調(diào)和平均數(shù),用以評(píng)估模型的總體效果:
F1 = 2* 精確率*召回率/精確率+ 召回率
式中,真正類(TP) 表示模型正確預(yù)測(cè)為正類的正類樣本數(shù);假正類(FP) 表示模型錯(cuò)誤預(yù)測(cè)為正類的負(fù)類樣本數(shù);真負(fù)類(TN) 表示模型正確預(yù)測(cè)為負(fù)類的負(fù)類樣本數(shù);假負(fù)類(FN) 表示模型錯(cuò)誤預(yù)測(cè)為負(fù)類的正類樣本數(shù)。
1.4 基于軸承故障知識(shí)圖譜的根原因分析及運(yùn)維決策技術(shù)
知識(shí)圖譜是一種機(jī)器認(rèn)知智能的技術(shù)形式,通過本體模型構(gòu)建、知識(shí)抽取、知識(shí)存儲(chǔ)等步驟,從多源數(shù)據(jù)中自動(dòng)抽取知識(shí)并有效整合,構(gòu)建出結(jié)構(gòu)化的知識(shí)圖譜。本文為了有效管理軸承故障信息,構(gòu)建了軸承故障知識(shí)圖譜的本體模型,采用基于規(guī)則的方法對(duì)FME(C)A表、故障記錄和維修記錄等軸承故障知識(shí)進(jìn)行命名實(shí)體識(shí)別,提取故障實(shí)體和關(guān)系,并存儲(chǔ)到圖數(shù)據(jù)庫Neo4j中,從而構(gòu)建軸承故障知識(shí)圖譜,為快速識(shí)別故障原因并提供維修決策提供支撐。
1.4.1 軸承故障知識(shí)本體模型
采用自頂向下和自底而上相結(jié)合的知識(shí)建模技術(shù)對(duì)軸承故障知識(shí)進(jìn)行統(tǒng)一定義,建立統(tǒng)一的數(shù)據(jù)模型,如“故障現(xiàn)象—原因—故障原因”“故障現(xiàn)象—影響—故障影響”“故障影響—控制措施—控制措施”等,如圖 4 所示。
1.4.2 知識(shí)抽取
FMEA 針對(duì)產(chǎn)品所有可能的故障,并根據(jù)對(duì)故障模式的分析,確定每種故障模式對(duì)產(chǎn)品工作的影響,并按故障模式的嚴(yán)重度及其發(fā)生概率確定其危害性。通過對(duì) FMEA 表進(jìn)行知識(shí)加工,生成結(jié)構(gòu)化數(shù)據(jù)并存儲(chǔ)在數(shù)據(jù)庫中,從而創(chuàng)建故障知識(shí)庫。表1為本文使用的FMEA的部分內(nèi)容示例。
針對(duì) FMEA 等半結(jié)構(gòu)化知識(shí),首先批次讀取不同結(jié)構(gòu)的 FMEA 表格,對(duì)表中存在的空格進(jìn)行填充。然后按照定義的本體模型,將實(shí)體類型與 FMEA 表中的表頭進(jìn)行正則匹配。最后對(duì)表格進(jìn)行拆分和合并,獲取關(guān)聯(lián)設(shè)備、故障現(xiàn)象、故障原因、故障影響、控制措施等共 8 類實(shí)體類型,包括 81 個(gè)實(shí)體和 111 條關(guān)系。將抽取的實(shí)體和關(guān)系以三元組的形式存儲(chǔ)到 Neo4j 中,實(shí)現(xiàn)故障知識(shí)圖譜的抽取和存儲(chǔ)。
1.4.3 基于故障知識(shí)圖譜的軸承運(yùn)維決策
運(yùn)維人員在通過故障診斷模型獲取軸承故障信息后,可以基于構(gòu)建的軸承故障知識(shí)圖譜,準(zhǔn)確定位軸承故障部位,分析導(dǎo)致故障發(fā)生的根本原因,并獲取設(shè)備運(yùn)維的決策建議,從而更好地開展軸承設(shè)備的維修保障工作。具體方法為:通過“故障現(xiàn)象—關(guān)聯(lián)—設(shè)備結(jié)構(gòu)”三元組確定最小隔離單元;根據(jù)“故障現(xiàn)象—原因—故障原因”三元組確定導(dǎo)致故障發(fā)生的根本原因;根據(jù)“故障現(xiàn)象—相關(guān)記錄—故障記錄”三元組獲取歷史故障案例,為運(yùn)維人員推送相對(duì)應(yīng)的故障處置策略。
2 基于軸承故障數(shù)據(jù)集的試驗(yàn)驗(yàn)證
2.1 數(shù)據(jù)來源
軸承數(shù)據(jù)集由 Christian Lessmeier 等人提供,用于研究和開發(fā)先進(jìn)的軸承故障診斷技術(shù),涵蓋了不同類型的軸承故障、轉(zhuǎn)速和負(fù)載條件。數(shù)據(jù)集包括振動(dòng)信號(hào)數(shù)據(jù)和標(biāo)簽信息,每個(gè)樣本包含多個(gè)傳感器的數(shù)據(jù),對(duì)應(yīng)不同的軸承故障類型或工況。同時(shí),每個(gè)樣本的標(biāo)簽信息對(duì)應(yīng)了軸承的工作狀態(tài)(正常或故障) 以及故障的類型。這些故障類型通常與軸承的結(jié)構(gòu)性問題相關(guān),包括外圈故障、內(nèi)圈故障、滾動(dòng)體故障和保持架故障。
除了故障數(shù)據(jù),數(shù)據(jù)集中還包括了軸承在正常運(yùn)行狀態(tài)下的數(shù)據(jù),以便進(jìn)行對(duì)比和分析。本文使用的數(shù)據(jù)在轉(zhuǎn)速為 1 500 rpm、負(fù)載力矩為 0.7 nm,徑向力為 1 000 N 的工況下采集,采樣頻率為4 kHz,每組數(shù)據(jù)時(shí)長(zhǎng)為4 s。使用軸承編碼為 K001、KI01、KA04 的部分?jǐn)?shù)據(jù)樣本進(jìn)行試驗(yàn),其中 K001 為健康軸承,KI01 的軸承損傷部位為內(nèi)圈損傷(電火花加工) ,KA04 的軸承損傷部位為外圈疲勞點(diǎn)蝕。樣本量大小為1 198×3,標(biāo)簽狀態(tài)分為3 種,分別為內(nèi)圈故障、外圈故障和健康數(shù)據(jù),使用 0、1、2 對(duì)其進(jìn)行標(biāo)注。
本文對(duì)德國(guó)帕德博恩大學(xué)軸承數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理,采用 EMD 特征提取方法將軸承振動(dòng)信號(hào)數(shù)據(jù)分解為多維度的特征,隨后利用網(wǎng)格搜索法對(duì)分類模型進(jìn)行優(yōu)化,并利用優(yōu)化后的模型實(shí)現(xiàn)故障模式識(shí)別,得到準(zhǔn)確的分類結(jié)果,最終實(shí)現(xiàn)故障根因分析和輔助決策。
2.2 數(shù)據(jù)預(yù)處理
首先對(duì)軸承數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理操作,包括數(shù)據(jù)清洗、刪除空缺值和去除噪聲操作,得到標(biāo)準(zhǔn)化的振動(dòng)信號(hào)數(shù)據(jù)。然后通過可視化分析軸承信號(hào)分布特征,初步判斷軸承數(shù)據(jù)為時(shí)序非平穩(wěn)特征。因此,采用 EMD 方法從振動(dòng)信號(hào)中提取均值、標(biāo)準(zhǔn)差、均方根值、峰值、偏度、峭度等指標(biāo),得到振動(dòng)信號(hào)的時(shí)頻域特征。軸承原始振動(dòng)信號(hào)分布如圖5所示。
由于軸承故障信號(hào)的頻率分布隨時(shí)間變化,具有典型的時(shí)變非平穩(wěn)特征,因此采用經(jīng)驗(yàn)?zāi)B(tài)分解(Em?pirical Mode Decomposition,EMD) 方法對(duì)軸承故障信號(hào)進(jìn)行處理。EMD 可將非平穩(wěn)信號(hào)分解為不同時(shí)頻域的數(shù)據(jù),從而提取出數(shù)據(jù)中的隱含有效信息。
EMD 是一種基于數(shù)據(jù)本身時(shí)間尺度等性質(zhì)進(jìn)行分解的數(shù)據(jù)分析方法,它將收集到的軸承信號(hào)分解為有限的本征模態(tài)函數(shù)(Intrinsic Mode Function,IMF) 和一個(gè)殘差,即:
式中:IMFi (t) 表示原軸承信號(hào)在不同頻段的頻率成分,包含了局部特征信息;rn (t) 表示偏離原軸承信號(hào)的趨勢(shì)。
2.3 模型訓(xùn)練及評(píng)估
將特征樣本數(shù)據(jù)的 80% 劃分為訓(xùn)練集,10% 作為測(cè)試集,10% 作為驗(yàn)證集,用以進(jìn)行模型訓(xùn)練及評(píng)估。進(jìn)一步將訓(xùn)練集分為4份,作為交叉驗(yàn)證節(jié)點(diǎn)的訓(xùn)練集,重復(fù)訓(xùn)練 5 個(gè)模型,并利用驗(yàn)證集評(píng)估模型的準(zhǔn)確率或 F1 指標(biāo)。計(jì)算平均指標(biāo),當(dāng)準(zhǔn)確率(ACC) 大于閾值 0.7 時(shí),認(rèn)為該算法適用于該樣本的狀態(tài)分類;若小于閾值,則重新選擇算法,重復(fù)交叉驗(yàn)證操作。
在模型訓(xùn)練中,使用網(wǎng)格搜索法對(duì)KNN、SVM、RF 算法的模型參數(shù)進(jìn)行尋優(yōu),以得到最優(yōu)的模型。預(yù)選模型庫中各模型的參數(shù)尋優(yōu)范圍及最優(yōu)參數(shù)值見表 2。
按照表2中各模型的最優(yōu)參數(shù)值,對(duì)軸承測(cè)試集數(shù)據(jù)進(jìn)行故障診斷,并通過準(zhǔn)確率、精確率、召回率和 F1 指標(biāo)對(duì)模型診斷效果進(jìn)行評(píng)估,評(píng)估指標(biāo)結(jié)果見表3。
如表3所示,SVM 的評(píng)估結(jié)果均優(yōu)于KNN和RF,準(zhǔn)確率達(dá)到了93.1%,因此最終選擇使用預(yù)選模型庫中的 SVM算法。
SVM 在測(cè)試集上的診斷結(jié)果與真實(shí)結(jié)果的對(duì)比情況如圖 6 所示。橫坐標(biāo)為樣本編號(hào),縱坐標(biāo)為樣本類別。圖6表明,經(jīng)過訓(xùn)練和評(píng)估分析的 SVM 模型對(duì)于軸承潛在故障模式具有良好的診斷分析能力。
2.4 根因分析及運(yùn)維決策
根據(jù)故障診斷模型提供的診斷結(jié)果,基于構(gòu)建的軸承故障知識(shí)圖譜,獲取軸承故障的根本原因及處置措施建議。以診斷得到的內(nèi)圈故障表面裂紋為例,通過查詢知識(shí)圖譜中的“ 故障現(xiàn)象—影響—故障影響” 三元組,得知表面裂紋會(huì)引發(fā)劇烈的振動(dòng)和噪聲,產(chǎn)生不利影響,因此應(yīng)采取有效的控制措施;通過查詢知識(shí)圖譜中的“ 故障現(xiàn)象—原因—故障原因” 三元組,可得知表面裂紋的可能故障原因包括“速度過快”“裝配不當(dāng)”“潤(rùn)滑不良”;進(jìn)一步根據(jù)“ 故障影響—控制措施—控制措施” 三元組,可以獲取到“降低負(fù)荷”“停機(jī)檢查、更換備件”“注入潤(rùn)滑劑”等輔助維修決策信息。
3 結(jié)論
本文提出了一種融合數(shù)據(jù)與知識(shí)的軸承故障診斷模型框架,構(gòu)建了包括支持向量機(jī)、隨機(jī)森林、K 近鄰算法的預(yù)選模型庫,具備模型自動(dòng)選擇和參數(shù)尋優(yōu)能力,并在公開數(shù)據(jù)集上進(jìn)行了試驗(yàn)驗(yàn)證,診斷準(zhǔn)確率達(dá)到了 93.1%。利用故障診斷結(jié)果,基于事先構(gòu)建的軸承故障知識(shí)圖譜進(jìn)行根因分析和維修決策,實(shí)現(xiàn)了軸承故障的全面診斷和智能決策。結(jié)果表明,該方法能夠準(zhǔn)確進(jìn)行軸承故障診斷,并結(jié)合歷史信息提供有效的故障處置和控制措施建議。
未來將從以下兩個(gè)方面深入研究,以提升該方法在實(shí)際軸承故障診斷及維修決策中的應(yīng)用效果:
一是進(jìn)一步豐富預(yù)選模型庫,引入卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法,提升診斷模型對(duì)不同類型軸承故障數(shù)據(jù)的適應(yīng)能力及故障診斷結(jié)果的準(zhǔn)確性。
二是結(jié)合該方法在實(shí)際軸承故障診斷過程中的應(yīng)用,不斷積累實(shí)際診斷數(shù)據(jù)和維修決策案例,持續(xù)豐富知識(shí)圖譜的知識(shí)內(nèi)容,提高運(yùn)維決策的指導(dǎo)性和有效性。
參考文獻(xiàn):
[1] 邱立軍,吳明輝.PHM技術(shù)框架及其關(guān)鍵技術(shù)綜述[J].國(guó)外電子測(cè)量技術(shù),2018,37(2):10-15.
[2] 呂琛,馬劍,王自力.PHM技術(shù)國(guó)內(nèi)外發(fā)展情況綜述[J].計(jì)算機(jī)測(cè)量與控制,2016,24(9):1-4.
[3] FAKHARZADEH M,TAZLAUANU M.Rf system-in-packagewith microstrip-to-waveguide transition: US20140285389[P].2014- 09-25.
[4] 陸劍峰,徐煜昊,夏路遙,等.數(shù)字孿生支持下的設(shè)備故障預(yù)測(cè)與健康管理方法綜述[J].自動(dòng)化儀表,2022,43(6):1-7,12.
[5] 高瑞洋.基于機(jī)理—數(shù)據(jù)模型融合的高速列車軸箱軸承故障診斷研究[D].石家莊:石家莊鐵道大學(xué),2024.
[6] 石雙平.滾動(dòng)軸承故障診斷機(jī)理研究[J].機(jī)械設(shè)計(jì)與制造,2014(10):236-239.
[7] 曹仕駿,鄭近德,潘海洋,等.基于改進(jìn)自適應(yīng)經(jīng)驗(yàn)傅里葉分解的滾動(dòng)軸承故障診斷方法[J]. 振動(dòng)與沖擊,2022,41(15):287-299.
[8] ROHANI BASTAMI A,VAHID S.Estimating the size of natu?rally generated defects in the outer ring and roller of a taperedroller bearing based on autoregressive model combined with en?velope analysis and discrete wavelet transform[J].Measurement,2020(159):107767.
[9] HUANG N E,SHEN Z,LONG S R,et al.The empirical mode de?composition and the Hilbert spectrum for nonlinear and nonstationarytime series analysis[J].Proceedings of the Royal Soci?ety of London Series A:Mathematical,Physical and EngineeringSciences,1998,454(1971):903-995.
[10] 王瑞辰,趙京.基于EEMD的聲振信號(hào)特征融合軸承故障診斷[J].自動(dòng)化應(yīng)用,2024(19):13-17.
[11] WANG Y X,MARKERT R,XIANG J W,et al.Research onvariational mode decomposition and its application in detect?ing rub-impact fault of the rotor system[J].Mechanical Sys?tems and Signal Processing,2015(60):243-251.
[12] 劉亞兵,杜宇.基于頻譜幅度調(diào)制的礦用刮板輸送機(jī)軸承故障診斷方法[J].工礦自動(dòng)化,2024,50(S1):126-129,186.
[13] YU J,DING B,HE Y J.Rolling bearing fault diagnosis basedon mean multigranulation decision-theoretic rough set andnon-naive Bayesian classifier[J]. Journal of Mechanical Sci?ence and Technology,2018,32(11):5201-5211.
[14] SINGHAL A. Introducing the Knowledge Graph: things, notstrings[EB/OL]. (2012-05-16)[2023-10-20]. https://blog.google/products/search/introducing-knowledge-graph-things-not.
[15] BOLLACKER K,EVANS C,PARITOSH P,et al.Freebase:a col?laboratively created graph database for structuring humanknowledge[C]//Proceedings of the 2008 ACM SIGMOD inter?national conference on Management of data. VancouverCanada.ACM,2008:1247-1250.
[16] LI Z B,LI Y Y,SUN Q C,et al.Bearing fault diagnosis methodbased on convolutional neural network and knowledge graph[J].Entropy,2022,24(11):1589.
【通聯(lián)編輯:唐一東】