史志遠(yuǎn),滕虎,馬馳
(1. 安標(biāo)國家礦用產(chǎn)品安全標(biāo)志中心有限公司,北京 100013;2. 中國礦業(yè)大學(xué) 機(jī)電工程學(xué)院,江蘇 徐州 221008)
行星齒輪箱作為重要的傳動部件,以其承載能力強(qiáng)、速比大、運行平穩(wěn)等特點,被廣泛運用于大型煤礦機(jī)械設(shè)備中[1]。由于其經(jīng)常在高速重載工況下運行,運行環(huán)境惡劣、運行時間長,太陽輪、行星輪、內(nèi)齒圈和軸承等行星齒輪箱關(guān)鍵部位若發(fā)生斷齒、磨損、裂紋等故障,將導(dǎo)致整個傳動系統(tǒng)停機(jī),造成巨大的經(jīng)濟(jì)損失并帶來安全隱患。因此,準(zhǔn)確診斷行星齒輪箱故障,對于保障煤礦機(jī)械設(shè)備健康運行具有重要意義[2]。
早期主要依靠工人和專家的經(jīng)驗來判斷行星齒輪箱運行狀態(tài),隨著技術(shù)發(fā)展,逐漸形成了以振動信號為主,油液、鐵譜和紅外分析為輔的故障診斷模式[3-5]。針對振動信號的分析方法從原來的單一分析方法發(fā)展為時域、頻域和時頻域的綜合分析方法[6-7]。近年來,隨著機(jī)器學(xué)習(xí)在各領(lǐng)域的運用,基于機(jī)器學(xué)習(xí)的行星齒輪箱故障診斷方法得到廣泛研究。文獻(xiàn)[8]從齒輪箱振動信號中提取有效值、嚙合頻率幅值、頻率重心和差分能量信號,并輸入到自適應(yīng)神經(jīng)模糊推理系統(tǒng)中進(jìn)行訓(xùn)練,從而實現(xiàn)對行星齒輪箱故障的有效識別。文獻(xiàn)[9]提出了一種基于Elman神經(jīng)網(wǎng)絡(luò)的齒輪箱故障診斷模型,選取4個時域動態(tài)特征參量和3個頻域動態(tài)特征參量作為模型輸入、故障類型作為模型輸出,利用改進(jìn)遺傳算法對Elman神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,提升了齒輪箱故障診斷準(zhǔn)確率。文獻(xiàn)[10]提出了一種利用遺傳算法和蟻群算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò),能夠?qū)π行驱X輪箱進(jìn)行快速、準(zhǔn)確診斷。
上述診斷方法均依賴人工選擇特征向量,而特征向量選擇的優(yōu)劣很大程度上決定了診斷方法的準(zhǔn)確率。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)作為目前深度學(xué)習(xí)的代表算法之一,能通過卷積運算自動提取特征,其非線性特征提取能力強(qiáng)。文獻(xiàn)[11]設(shè)計了一維CNN結(jié)構(gòu),并與Softmax分類器相結(jié)合,構(gòu)建了一種行星齒輪箱智能診斷架構(gòu),將一維振動信號直接輸入網(wǎng)絡(luò)就能輸出診斷結(jié)果。文獻(xiàn)[12]對行星齒輪箱振動信號進(jìn)行經(jīng)驗?zāi)B(tài)分解后,利用深度CNN對本征模態(tài)函數(shù)分量進(jìn)行融合并自動提取特征,實現(xiàn)了行星齒輪箱故障診斷的自動化。
以上研究是將單個振動信號作為輸入數(shù)據(jù),然而行星齒輪箱發(fā)生故障時往往表現(xiàn)出多種征兆,單個振動信號無法體現(xiàn)完整的故障特征,造成故障診斷準(zhǔn)確率低。因此,本文提出了一種基于多信息融合和CNN的行星齒輪箱故障診斷方法。將三向(水平徑向、垂直徑向與軸向)振動信號和聲音信號進(jìn)行多信息融合,從而獲得二維信號;將二維信號輸入CNN進(jìn)行特征提取及分類,實現(xiàn)故障精確診斷。
多信息融合是對多個信息源采集到的信息進(jìn)行綜合分析處理,從而獲得比單一信息更精確、更有價值的結(jié)論。多信息融合要求所采集的信號具有關(guān)聯(lián)性,且是同步采集的。多信息融合方式主要有數(shù)據(jù)層融合、特征層融合及決策層融合[13]。
(1) 數(shù)據(jù)層融合是將多個信息源采集的信息直接進(jìn)行融合。其優(yōu)點是數(shù)據(jù)蘊(yùn)含的信息豐富、精度高;缺點是計算量大,且數(shù)據(jù)需要進(jìn)行預(yù)處理。
(2) 特征層融合屬于中間層次的融合,它是對原始信息進(jìn)行故障特征提取后,將所提取的特征進(jìn)行融合后再進(jìn)行綜合分析處理。其優(yōu)點是實現(xiàn)了數(shù)據(jù)壓縮,計算量較小;缺點是相比于數(shù)據(jù)層融合損失了部分有用信息,導(dǎo)致精度下降。
(3) 決策層融合屬于高層次的融合,先根據(jù)每個信號作出決策,再將這些決策融合成最終的推理和決策。其優(yōu)點是具有很高的靈活性,抗干擾能力強(qiáng),對傳感器的依賴小;缺點是相比于數(shù)據(jù)層融合和特征層融合,損失的數(shù)據(jù)最多,導(dǎo)致精度最低。
由于數(shù)據(jù)層融合獲得的信息最豐富、精度最高,且本文中信息源共4個,所需計算量不算太大,所以本文采用數(shù)據(jù)層融合。
一般情況下,CNN由卷積層、池化層和全連接層等組成[14]。
(1) 卷積層是CNN的核心,其功能是對數(shù)據(jù)進(jìn)行特征提取,一般由多個卷積核組成。每個卷積核與上一層特征圖的局部區(qū)域相互連接,這部分區(qū)域即為卷積核在上一層的感受野,卷積核通過卷積操作能夠得到新的特征圖。特征圖的計算一般分為2步:先通過卷積核對上一層數(shù)據(jù)進(jìn)行卷積運算,之后對每個運算結(jié)果施加非線性函數(shù)。通常卷積層的形式為

式中:為第l層輸出的第j個特征量;f(·)為激勵函數(shù);k為特征量個數(shù);為第l-1層 輸出的第i個特征量;*為卷積運算符號;為第l層輸出的第j個卷積核的權(quán)重矩陣;為第l層輸出的第j個卷積核的偏置矩陣。
(2) 池化層一般位于卷積層后面,主要負(fù)責(zé)對卷積后的數(shù)據(jù)進(jìn)行信息過濾和特征選擇,可減少網(wǎng)絡(luò)計算量和控制過擬合。池化層主要分為2種類型:最大池化層,即在池化窗口中找到矩陣的最大值作為輸出;平均池化層,即將池化窗口中矩陣的平均值作為輸出。近年來研究證明最大池化層較平均池化層有更好的效果[13]。
(3) 全連接層通常位于CNN的尾部,1個網(wǎng)絡(luò)可以有多個全連接層。全連接層和傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)類似,其中的每個神經(jīng)元都會與前一層的所有神經(jīng)元相連,因此,全連接層包含數(shù)據(jù)的全局信息。將全連接層的每個神經(jīng)元連接到Softmax函數(shù),Softmax函數(shù)通常應(yīng)用于分類問題的輸出層,其功能是將預(yù)測結(jié)果用概率的形式顯示:

式中:S(zm)為第m個 神經(jīng)元的輸出值zm通過Softmax函數(shù)轉(zhuǎn)換為的概率;C為神經(jīng)元個數(shù);zc為第c個神經(jīng)元的輸出值。
基于多信息融合和CNN的行星齒輪箱故障診斷步驟如下。
(1) 將采集的行星齒輪箱振動信號和聲音信號劃分為訓(xùn)練集和測試集。
(2) 對信號進(jìn)行數(shù)據(jù)預(yù)處理,將振動信號和聲音信號進(jìn)行數(shù)據(jù)層融合,采用并聯(lián)方式將一維的振動信號和聲音信號整合為一個二維信號。
(3) 確定CNN結(jié)構(gòu)和參數(shù),包括網(wǎng)絡(luò)層數(shù)和各層維度大小,卷積核、最大池化層的核尺寸和步長,激勵函數(shù),學(xué)習(xí)率等。
(4) 將數(shù)據(jù)預(yù)處理后的訓(xùn)練集作為CNN輸入,通過卷積和池化操作實現(xiàn)對數(shù)據(jù)的特征提取與信息過濾,之后通過BP算法反向調(diào)節(jié)網(wǎng)絡(luò)參數(shù)。
(5) 利用訓(xùn)練好的CNN對測試集進(jìn)行故障診斷,評估網(wǎng)絡(luò)的故障診斷準(zhǔn)確率。
將行星齒輪箱三向振動信號和聲音信號作為CNN的輸入,由于振動信號和聲音信號都具有一維時序性,所以可將振動信號和聲音信號進(jìn)行數(shù)據(jù)層融合,采用數(shù)據(jù)并聯(lián)方式將振動信號和聲音信號整合為二維信號,該信號長度為截取的振動信號和聲音信號的長度,信號寬度為信息源數(shù)目。本文分析的聲音信號采樣頻率為44.1 kHz,由于聲音信號是非平穩(wěn)信號,但一般認(rèn)為在短時間范圍(30~50 ms)內(nèi),聲音信號是短時平穩(wěn)的[15],所以每幀數(shù)據(jù)長度為1 323~2 205。為便于計算機(jī)處理,將每幀數(shù)據(jù)長度設(shè)為2 048。同時,為了使數(shù)據(jù)對齊,將振動信號長度也設(shè)為2 048。
由于振動信號和聲音信號的量綱不同,為消除影響,對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理:

式中:X*為 標(biāo)準(zhǔn)化處理后的數(shù)據(jù);X為振動和聲音原始數(shù)據(jù);為數(shù)據(jù)均值;σ(X)為數(shù)據(jù)方差。
CNN結(jié)構(gòu)如圖1所示。輸入層為4×2 048的二維信號,經(jīng)過3次卷積和最大池化操作后,將特征矩陣展平成一維向量(對每個卷積層輸出的數(shù)據(jù)進(jìn)行歸一化處理和非線性映射后再接入池化層,其中非線性映射函數(shù)選擇ReLU函數(shù)),在一維向量后面接入3個全連接層,用以連接所有特征,并將輸出值送給輸出層的分類器。由于輸入層為數(shù)據(jù)層融合的信號,計算量大,所以本文采用自適應(yīng)動量的優(yōu)化方法——Adam方法進(jìn)行學(xué)習(xí)率自動調(diào)整,該方法計算高效、所需內(nèi)存少,適用于大規(guī)模的數(shù)據(jù)集[16]。

圖1 CNN結(jié)構(gòu)Fig. 1 Structure of CNN
CNN參數(shù)見表1。

表1 CNN參數(shù)Table 1 Parameters of CNN
搭建了行星齒輪箱故障診斷實驗臺,可模擬行星齒輪箱在不同負(fù)載、轉(zhuǎn)速下的各種故障形式。實驗臺主要由三相異步電動機(jī)、聯(lián)軸器、轉(zhuǎn)矩轉(zhuǎn)速傳感器、行星齒輪箱、磁粉制動器、振動加速度傳感器和聲音傳感器等組成,其中振動加速度傳感器和聲音傳感器分別采集振動信號和聲音信號,磁粉制動器作為一種負(fù)載裝置,主要功能是為行星齒輪箱提供轉(zhuǎn)矩。由于行星齒輪箱的高速輸入軸更易發(fā)生故障,所以將故障植入在行星齒輪箱的高速輸入軸。在高速輸入軸的水平徑向、垂直徑向和軸向布置振動加速度傳感器,在高速輸入軸旁的轉(zhuǎn)矩轉(zhuǎn)速傳感器上布置聲音傳感器,如圖2所示。

圖2 傳感器布置Fig. 2 Layout of sensors
通過實驗臺模擬行星齒輪箱正常狀態(tài)和8種故障狀態(tài),如圖3所示。在低速(300 r/min)、中速(600 r/mim)和高速(1 200 r/min)3種不同轉(zhuǎn)速下,分別在5,10 N·m的負(fù)載下采集100組數(shù)據(jù),獲得數(shù)據(jù)集(表2),每種狀態(tài)包含600組數(shù)據(jù),每組數(shù)據(jù)長度為2 048。每種行星齒輪箱狀態(tài)的振動信號時域波形如圖4所示,可看出太陽輪斷齒、行星輪磨損和軸承內(nèi)外圈故障波形相比于正常狀態(tài)的波形區(qū)分較為明顯,其他故障較難與正常狀態(tài)區(qū)分。

圖4 行星齒輪箱不同狀態(tài)的振動時域波形Fig. 4 Vibration time domain waveform of planetary gearbox in different status

表2 數(shù)據(jù)集Table 2 Data set

圖3 行星齒輪箱故障狀態(tài)Fig. 3 Fault states of planetary gearbox
將數(shù)據(jù)集分為訓(xùn)練集和測試集(隨機(jī)選擇80%的數(shù)據(jù)作為訓(xùn)練集,其余20%的數(shù)據(jù)作為測試集),用訓(xùn)練集進(jìn)行網(wǎng)絡(luò)訓(xùn)練,用測試集進(jìn)行驗證。
為驗證基于多信息融合和CNN的行星齒輪箱故障診斷方法的優(yōu)越性,在相同條件下選取水平徑向振動信號、垂直徑向振動信號、軸向振動信號、聲音信號4種單源信息分別與CNN相結(jié)合的方法進(jìn)行對比。對于單源信息輸入的CNN,其輸入數(shù)據(jù)為長度為2 048的一維數(shù)據(jù),卷積核尺寸為1×7,最大池化核尺寸為1×4,輸出層維度為9,對應(yīng)數(shù)據(jù)集中1種正常狀態(tài)和8種故障狀態(tài)的9個標(biāo)簽。不同方法在訓(xùn)練集和測試集上的故障識別準(zhǔn)確率變化曲線如圖5、圖6所示,具體數(shù)據(jù)見表3。
從圖5、圖6及表3可看出:軸向振動信號+CNN和聲音信號+CNN 2種方法在測試集上的故障識別準(zhǔn)確率分別只有74.07%和75.13%,可能是由于行星齒輪箱故障在高速輸入軸的軸向振動及聲音方面表現(xiàn)不太敏感;水平徑向振動信號+CNN和垂直徑向振動信號+CNN 2種方法在測試集上的故障識別準(zhǔn)確率分別達(dá)89.70%和87.09%,這是由于行星齒輪箱的高速輸入軸在水平徑向振動和垂直徑向振動方面可能蘊(yùn)含的故障信息更加豐富;多信息融合+CNN方法的收斂速度最快,且在測試集上的故障識別準(zhǔn)確率最高,為93.33%,這是由于多信息融合+CNN方法可獲得行星齒輪箱各方向的信號,所獲得的故障信息量更大、提取的故障特征更多。

表3 不同方法的故障識別準(zhǔn)確率Table 3 Fault identification accuracy of different methods

圖5 基于多信息融合和CNN的故障識別準(zhǔn)確率Fig. 5 Fault identification accuracy based on multi-information fusion and CNN

圖6 基于單源信息和CNN的故障識別準(zhǔn)確率Fig. 6 Fault identification accuracy based on single source information and CNN
(1) 提出了一種基于多信息融合和CNN的行星齒輪箱故障診斷方法。在數(shù)據(jù)層實現(xiàn)多信息融合,將多個一維振動和聲音信號通過并聯(lián)整合為一個二維信號;將二維信號作為CNN的輸入,利用多個卷積層進(jìn)行深度特征提取,采用多個最大池化層進(jìn)行信息過濾,通過Softmax分類器輸出故障診斷結(jié)果。
(2) 搭建了行星齒輪箱故障診斷實驗臺,采集不同轉(zhuǎn)速和負(fù)載工況下的振動和聲音信號,并輸入網(wǎng)絡(luò)中進(jìn)行訓(xùn)練和驗證。實驗結(jié)果表明,相較于單源信息+CNN,多信息融合+CNN的收斂速度更快,且具有更高的故障識別準(zhǔn)確率,達(dá)93.33%,更適用于行星齒輪箱故障診斷。