王宜忺,周大可
(1.國營蕪湖機械廠,安徽 蕪湖 241000;2.南京航空航天大學 自動化學院,南京 211100)
傳動設備是機械系統重要組成部分之一,作為核心零部件傳統設備在精密加工、航空航天、船舶制造、汽車制造等領域,有著十分廣泛的應用。傳動設備的工作狀態不僅會影響到機械系統的工作效率、工作穩定性和動能損失,還涉及到安全生產問題。隨著機械系統精密化程度的不斷提升,對傳動設備控制精度、工作強度及可靠性等,都提出了更高的要求。傳動設備的安全性與可靠性在很大程度上取決于日常維護保養及實施有效的在線監控,尤其是對于一些服役時間較長及使用強度較大的傳動設備,應實施嚴格的在線監控,通過采集到的數據指標判定傳統設備的工作狀態[1],及預判其使用壽命[2]。傳動設備的在線監控過程,主要包括原始信號采集,信號處理,在線故障分析判別和故障點定位和分類識別等。故障信號處理和信號分析,是傳動設備在線監控的關鍵,從現有的研究成果來看,主要從對原始信號特征的特征提取[3],特征參數分析及狀態識別等角度展開研究[4]。
文獻[5]提出一種基于FFT(Fast Fourier Transform,快速傅里葉變換)特征信號提取與分析算法,利用傳感器采集傳動設備的工作信號,再融合細化譜和小波變換識別出原始故障集中的異常特征,進而對傳統設備的運行狀態做出判斷。但FFT算法最大的缺點是延時,在多幀運算環境下由于信號的重疊幀較大,直接影響到算法的識別精度。此外,FFT算法的實現復雜度較高,當獲取到的故障數據集規模較大時受數據規模和長度的限制,同樣會影響到算法的工作效率;文獻[6]設計一種經過改進的SVM模型,算法先利用小波包提取故障集特征,適用于多種故障并存情況下故障定位、分類和檢測。改進SVM模型的優勢是能夠在小樣本環境下,相對準確地實現對多故障類型的分類,由于模型中引入了不同類型的核函數,在高維映射條件下不會使故障判斷中出現維數災難;但SVM模型在處理多種故障問題時的效率明顯降低,在應對大規模數據集時也存在故障分類與診斷精度降低的情況。文獻[7]提出一種基于模糊理論模型的故障在線檢測算法。模糊算法模型為復雜數據樣本集條件下的傳動設備在線監測,提供了另一種思路,該算法具有較強的靈活性,容錯性高,通過模糊規模調整和隸屬度函數的選擇而靈活地處理和應對不同情況下設備狀態問題。同時,通過模糊評價得出的結果也較為直觀,有助于對最終結果的判斷;但模糊算法模型也有其自身的缺點,例如將采集到的原始數據進行模糊處理,會限制最終的檢測結果精度,即使在模糊處理后進行反模糊化,也無法還原到最佳水平。
隨著神經網絡算法的不斷發展和進步,深度神經網絡模型已經成為主流[8],并開始在故障檢測領域應用。尤其是在非監督環境下,可以通過構成多層深度網絡結構顯著提升模式的故障數據訓練能力。深度結構的優勢是使用較少的參數來表示復雜的函數,模型運算能力得到顯著提升的同時,對于故障點的識別精度同樣能夠得到保證。較為常用和訓練能力較強的深度網絡模型包括卷積神經網絡[9]、遞歸神經網絡[10]、生成對抗神經網絡[11],YOLO模型[12],深度置信網絡[13]等。本文針對傳統設備故障診斷的特征提出一種改進的SSD模型(Single Shot Detector,單激發多框檢測),SSD是一種優秀的目標檢測算法,與深度卷積神經網絡(CNN)相比,其計算性能和提取多尺度故障特征的能力更強,與YOLO相比其在計算速度和MAP(平均精度)方面的優勢更加明顯。但經典的SSD模型容易受到噪聲干擾,尤其在利用高層特征層進行故障檢測時往往由于信息量過少而降低故障檢測精度;為此本文引入了注意力機制模塊和特征增強模塊,提升SSD網絡的表達能力,也有助于改善算法的檢測精度和總體性能。
針對傳動設備故障信號的采集,可以根據策略參數要求選擇不同類型的傳感器,選用傳感器時主要考慮傳感器的靈敏度、線性范圍及頻率響應等。故障信號的處理過程如圖1所示。

圖1 傳動設備故障信號的處理過程
采集到的故障信號中包含系統噪聲和環境噪聲,會后續故障信號特征提取和視頻分析構成不利影響,因此要對采集到的信號做濾波處理[14]。根據香農采樣定理可知[15],故障信號的采樣頻率要至少高于時頻分析頻率2倍以上才能確保分析效果。原始信號濾波調制包括幅值調制和頻率調制兩個部分:首先,幅值調制就是信號卷積使高頻時域信號低頻信號周期的脈沖變化。調制中將兩個信號在時域上相乘,通過改變幅值達到抑制噪聲的目標;其次,頻率調制能夠使采集到的原始信號轉換成變頻信號,提升信號的穩定性同時也能夠達到抑制噪聲的目的。共振信號解調[16]是一種包絡頻譜分析方法,當傳動系統元件受到損傷時,高速旋轉中的固有振動會產生巨大沖擊,并混雜系統噪聲和環境噪聲。帶通低頻濾波器對信號包絡頻譜進行檢測,并通過剝離共振信號能夠診斷出包絡頻譜的異常情況。
時頻分析時最常見和最有效的原始信號分析方法之一[17],傳統設備故障信號具有明顯的波形特征,通過觀察信號的時域波形可以識別出設備是否存在異常。當傳動設備的零部件發生局部損傷或存在缺陷時,信號的調制波形會出現異常,本文基于包絡譜分析判定傳動設備信號是否存在異常,設實時采集到的原始故障信號為s(t),對該信號進行希爾伯特變換[18]:
(1)

(2)
其中:h(t)對應的幅值信號為g(t),原始信號s(t)為幅值信號的包絡譜:
(3)
幅值信號g(t)由于經過了幅值調制和變換,相當于對原始信號進行了預處理和噪聲濾除,可以作為故障數據分析模型的輸入項。根據信號的頻率、幅值、包絡譜等差異,能夠識別出傳動設備的常見故障,如點蝕、磨損、偏磨等。將振動信號圖像化處理能夠更直觀地觀測出故障點位置和故障類別,在故障信號的采集周期內,基于信號的相位點和序列特征判斷故障數據與時間t的函數關系。
對傳感器提取到的信號進行短時傅里葉變換,得到相位和振動之間的對應頻譜,分別以信號的頻率值、時間t和振動信號的幅值作為圖像的橫坐標、縱坐標和像素點,得到對應的振動圖像,實現了從振動信號到振動圖像的轉換。基于圖像故障識別的優勢在于更直觀地提取故障特征,并可以對故障特征向量進行降維處理[19],能夠處理相對規模較大的故障數據集。故障數據集中第i個復合故障信號h(t)i對應的故障圖像中的像素點為(xi,yi)。
SSD是一種單階段檢測模型,可以對采集到的故障數據做卷積操作,并提取原始故障數據特征。無論是圖像數據還是原始故障信號,SSD網絡模型都能夠省略重采樣環節,縮短故障檢測的時間。在模型卷積核的選擇方面,SSD網絡模型采用了較小的金字塔型結構的卷積核,能夠縮短數據訓練的時間和提高對故障數據定位與檢測的精度,SSD網絡適合處理圖像數據,因此可以將故障信號轉換為不同分辨率的圖像數據。SSD網絡從結構上分為基礎卷積部分、輔助卷積部分和預測層,如圖2所示。

圖2 SSD網絡結構設計
在基礎卷積部分采用了VGG-16對輸入數據進行處理,SSD與傳統卷積網絡相比去掉了分類層的結構,使網絡結構更加簡潔高效,VGG-16的基礎功能與深度卷積網絡模型類似。根據輸入數據集的規模和復雜程度可以適度調整VGG-16結構的復雜度,具體包括了卷積層、池化層,并選擇適合的激活函數調整整個網絡的參數體系和結構設計;而與傳統的深度神經網絡結構相比,SSD增加了CONV-6,CONV-7,CONV-8,CONV-9等4個卷積層替代了傳統復雜的隱含層和神經元連接結構[20]。卷積層在數據訓練能力方面超過了傳統深度網絡的神經元結構,同時結構設計更加簡潔。輔助部分是在傳統卷積層結構基礎上增加的特殊結構,如CONV-10和CONV-11,輔助結構提升了模型的數據訓練性能,同時能夠按照數據集規模大小或圖像尺寸大小排序,提高SSD網絡的適用性。
SSD網絡卷積核結構采用了類似于金字塔式的結構設計,符合原始故障數據集特征提取的規律,對于每個卷積層都采用了L2級的正則化處理模式,一方面通過正則化提升對不同特征的權值賦值;另一方面正則化有助于提升置信度計算的精度,同時提升對設備故障點定位的準確性。在針對傳動設備的目標檢測中,經典SSD算法在檢測效果上有一定程度改善,但算法效率較低,尤其在故障數據集規模較大時較低的檢測效率無法滿足在線檢測的要求,為此本文對經典SSD網絡模型的性能進行改進,從兩個維度進行優化和改進:其一是引入注意力機制模塊提升網絡數據訓練的性能。注意力機制模塊本質上是一種信息共享模塊,在對故障數據訓練過程中避免了數據特征出現冗余,可以實現對數據的降維處理,進而提升和改進的網絡模型性能;其二時引入特征增強模塊,突顯出更多的故障細節。
首先,引入注意力機制模塊,卷積核的大小為k表示故障數據訓練中信息共享的范圍(即參與通道注意力預測臨近數據個體的數量),因此在卷積核大小為k的條件下,用wk表示SSD網絡模型的通道注意力機制:
(4)
在wk中共包含了k×n個參數,注意力機制中第j項權重ωj與主體之間的關系表示如下:
(5)
其中:κ為注意力機制的控制參數,取值范圍在0~1之間,wk與權重的關系還可以表示如下:
wk=κ(Ck(ωj))
(6)
其中:C表示為模型的一維卷積,注意力機制模塊能夠在指定區域內實現信息的交互和共享,當故障數據集內部的數據量累計到一定程度時,維數較小的通道和周圍相近的一維卷積表現為一種線性關系:
C=ζ(ω)+b
(7)
ζ表示線性函數的斜率,當一維卷積C的數值為一個確定值時,SSD卷積核k的計算過程如下:
(8)
其次,引入特征增強模塊,提升改進SSD網絡模塊對小故障目標及微弱特征的提取能力。特征增強的思路是在基礎卷積層進行空洞卷積操作,形成特征增強模塊同時還可以提高SSD網絡模型原有各個模塊的運算效率。將CONV4_3的卷積層進行特征融合并形成底層特征圖,分別利用1×3和3×1卷積做特征二次提取,基于1×1卷積提升SSD網絡模型的訓練性能,及基于3×3卷積結構增強視野范圍,同時改善經典SSD網絡模型的數據訓練效率,特征增強模塊的示意圖,如圖3所示。

圖3 特征增強模塊的示意圖
從兩個維度對經典SSD網絡結構進行改進,盡管從一定程度上增加的模型的復雜度,但注意力機制模塊的引入增強了區域內部信息的共享程度,有助于提高網絡模型的效率;而引入特征增強模塊在沒有改變分類網絡結構和增加回歸復雜的前提下,增加了4個BN層有效控制了模型參數復雜度,并提升了經典SSD網絡特征融合的能力。改進后的結構設計,如圖4所示。

圖4 改進后的SSD模型結構設計
基于改進SSD模型的傳動設備在線檢測過程,包括多尺度特征融合與上采樣,特征金字塔結構的改進與先驗框的匹配,及損失函數選擇等5個步驟:
1)傳感器信號多尺度特征融合。
2)特征層的上采樣。
3)特征金字塔結構的改進。
4)特征圖先驗框比例分析。
5)損失函數的確定
對SSD模型中特征層進行多尺度融合可以提高網絡的表達能力和算力,尤其在輸入特征故障集規模較大的條件下,能夠改善模型在線檢測的準確率和效率。模型特征融合的方法有相加方法和通道拼合兩種方法,由于簡單相加容易導致特征層中出現過多冗余的信息,故本文選擇了通道拼合方法。拼合指將長寬尺寸相同但包含通道數量不同的特征層進行融合,由于特征層長寬值沒有改變,即使在融合時也不會改變特征層內的原始故障數據規模,還可以保留原始數據集內的全部信息。在拼合后,特征層的信息容量增大,算力增強,能夠應對更大規模的故障數據集。但在特征層多尺度融合后,通道數據增加容易導致特征融合出現冗余現象,在針對SSD模型的改進中由于引入注意力機制模塊,可以實現對冗余的消除和對高維特征降維處理。基于通道拼合進行多尺度特征融合,還能夠降低特征層內部不同元素差異度,改善在故障數據訓練過程中故障特征提取準確率。

(9)
近鄰插值方法的計算量較小,能夠獲取在不同尺度下的新圖像,解決由于數據降維帶來的圖像失真及檢測率下降等問題。
在經典SSD目標檢測中,多模型檢測大都基于最后一層檢測,因為最后一層卷積尺寸大且算力更強,數據訓練和特征融合的能力也更強。但金字塔結構設計中位于底層特征信息量盡管較少,但位置準確率和特征提取的準確性均較高;而高層特征層盡管包含的特征較為豐富,但經過多次卷積以后對故障點的定位信息會發生偏差。為此本文采用線性插值的方法對原有SSD網絡模型中的特征層金字塔結構進行優化,具體的過程是將最小的特征層尺寸增加為上一特征層尺寸,再進行下一步的特征融合,改進的過程如圖5所示。

圖5 對金字塔結構的改進
使用1×1卷積操作調整網絡通道數量,然后在基于累加的方式選擇最佳的通道數量,融合后再基于2×2卷積消除混疊效應。通過對金字塔結構的優化和改進將高層與底層特征進行有效融合,一方面有助于故障集深度特征信息的提取,另一方面也能夠避免降維過程中圖像失真情況的發生。SSD金字塔結構高低層特征在原圖上的感受視野不同,不同特增層對應尺度存在差異,但生成比例一致。
由于故障特征數據集的視野感受范圍不一致,為了適應不同規模的數據集會在不同的卷積層上生成同比例但不同層尺度的先驗框。假定原始的故障集特征圖尺寸為m維,對應大小為k的卷積,每個網格所包含的先驗框數量與卷積大學一致也為k,那么該特征圖生成的先驗框數量為m×n×k個,每個先驗框用坐標值機圖像的高度和寬度定位和預測(x,y,W,H),先驗框在對應的特征圖上縮放比例S,表示如下:
(10)
其中:Smax為高特征圖的最大值,Smin為低特征圖的最小值,根據特征圖的復雜程度和待檢測數據集的規模大小設置特征圖縮放比例值,先設置不同的寬高比例ξ,通常情況下取值如表1所示。

表1 待檢測的特征圖寬高比值范圍
每個特征圖單元格寬及高計算過程如下,單元格寬、高值與比例ξ密切相關:
(11)
固定的寬高比值能夠確保先驗框的縮放比例始終保持一致,基于改進的SSD算法模型訓練時先將先驗框和圖像的真實框進行比對,并提取特征圖中預測制定目標像素點特征,并將先驗框標定為正樣本;如果通過比對,所有先驗框與真實框的比例都不一致,將該類樣本標定為負樣本,判斷正負樣本還可以通過觀測先驗框和真實框之間的重疊面積來判定,給定一個理論上的閾值范圍(通常設定為0.5),通過對比重疊面積和理論閾值的大小關系判斷目標樣本的正負。通常情況下輸入改進SSD模型的樣本均衡度都較差,正樣本數量要遠遠低于負樣本的數量,而待檢測傳動設備故障圖像數據集,通常只包括有限多個指標,且受到系統噪聲和環境噪聲的影響會導致檢測效率和檢測精度的降低。正樣本數量過少和不均衡分布,容易導致訓練模型向負樣本數據集的方式收斂。為解決上述問題,一方面通過調整負樣本先驗框的寬高比,加速負樣本數據的特征提取以改善均衡度;另一方面,選擇合適的SSD模型損失函數,并提高負樣本數據損失函數計算效率和函數值,改善正負樣本之間的不均衡度,保障模型對故障數據定位和檢測的準確性。
SSD模型損失函數既是故障圖像先驗框匹配的關鍵,同時也是決定整個模型性能的重要工具,損失函數的值越低證明模型的數據訓練性能越強,對設備故障定位和檢測的準確度越高。本文選用適用于多分類的復合函數L作為改進SSD網絡模型的損失函數,復合函數L的優勢在于能夠處理較大規模的故障集,能夠處理包含多種故障在內的故障集,而且與SSD網絡模型的契合度更高。決定損失函數L值的因素有SSD網絡的置信度λ、邊界框信息ζ、真實框的位置τ,損失函數L主要由兩個部分構成,即置信度損失函數L1和位置損失函數L2:
L((x,y),λ,ζ,τ)=
(12)
其中:α為權重系數,對于位置損失函數和置信度損失函數而言,α是一種此消彼長的關系,根據SSD模型數據訓練的復雜度及故障集的規模等,適度調整兩個函數的權重比例關系。確定損失函數后,改進的SSD模型在線故障狀態監測進入最后一個環節,即消除精度不合適的先驗框,降低模型的冗余度和復雜度,避免出現重復檢測的情況。現將所有預測框按照置信度排序并計算閾值范圍,直接刪除置信度較低的先驗框;循環迭代操作直到宣傳最優先驗預測框,鎖定最終的傳動設備狀態檢測結果。
本文在實驗室環境下,驗證提出改進SSD算法傳動設備對齒輪箱運行狀態的監控情況,實驗用的齒輪箱實物圖,如圖6所示。

圖6 齒輪箱實物圖
實驗中選擇了德國MMF-KS76C100型高精度傳感器,在齒輪箱工作運行中共采集了4 080個樣本,包括4 000個正常樣本和80個異常樣本。實驗用齒輪箱共包括3個齒輪組和3個齒輪軸,其中故障點的分布情況統計和故障集的構建情況如下:齒輪組的故障類型包括點蝕和磨損(這兩種故障會導致齒輪箱出現異常振動和異響,嚴重會導致齒輪打齒或損壞),齒輪軸的故障類型是偏磨(該種故障會導致齒輪軸同軸度降低,影響齒輪咬合精度,引發異響和其他機械故障),如表2所示。

表2 故障樣本集的構建
實驗控制系統的硬件環境設置,如表3所示。

表3 實驗環境設置
實驗步驟如下。
1)在SSD網絡上實驗,并將SSD網絡劃分為基礎網絡、輔助網絡和預測層。
2)改進主干網絡,用注意力機制模塊和特征增強模塊改善網絡的性能。
3)調整SSD網絡模型的參數并刪除4倍以下的預測層,降低神經網絡模型的復雜度。
4)確定損失函數并根據數據集信號的幅值、頻率和像素點,將故障信號進行轉換。
將故障樣本集中80個故障樣本和4 000個正常樣本隨機分成10組,每個組中包含8個不同類型的故障樣本和400個正常樣本,基于改進SSD模型對每個小組的7故障樣本檢測情況進行分析和討論,具體如圖7(a)~(j)所示。

圖7 改進SSD算法對于每組故障的定位與檢測
如圖7的統計結果所示:當識別出故障樣本時信號的頻率會出現異常,異常頻率范圍通常在20~150 Hz,在改進SSD算法模型下,僅有第6組出現了1個漏檢故障,其他各組都能夠準確識別出8個故障點,這表明改進SSD算法具有較強的故障定位與檢測效率,平均的故障檢測率高達98.8%,而在相同的實驗環境下,沒有經過改進的SSD模型的故障檢測率為94.5%,改進后的SSD模型在性能上優于傳統的SSD模型。相對于傳統SSD算法模型,改進SSD模型盡管在結構上進行了精簡和優化,降低了模型的復雜度,但模型的故障檢測性能并沒有受到影響。
引入傳統的FFT算法、改進SVM算法和模糊算法,統計各算法的對故障數據的定位與檢測率,如表4所示。

表4 各傳統算法的故障檢測率 %
從對各傳統算法的檢測率統計結果可知:3種傳統算法的平均檢測精度較低,與改進SSD算法存在一定差距。改進SSD算法的優勢是將對故障信號的檢測轉換為圖像檢測,能夠更準確第定位故障點,同時更加頻率和幅值的變化趨勢描述圖像像素點的差異,因此顯著提高了對傳動齒輪箱故障定位和檢測的準確率,同時根據齒輪及齒輪軸點蝕、磨損及偏磨產生的不同振幅和不同頻率,還能夠準確地辨別出故障的位置和類型。
檢測效率也評價故障在線監測算法性能的重要指標之一,以10組樣本為對象觀測各算法完成整個樣本檢測的耗時情況,耗時越短表明算法的效率越高。在實際在線監測中,檢測效率具有重要的意義,尤其在數據集規模較大時檢測效率較高算法的優勢會越來越明顯,完成10組檢測各算法的耗時情況,如表5所示。

表5 各故障在線監測算法的檢測耗時對比
數據統計結果顯示,在完成10組故障樣本的檢測后,改進SSD算法的每組平均耗時僅為44 s,遠遠低于3種傳統算法。SSD算法數據訓練效率較高,與模型的金字塔結構設計密切相關,由于改變了傳統神經網絡輔助的網絡結構,同時引入了注意力機制模塊和特征增強模型,在確保在線監測準確率的同時,也進一步提升了模型對故障數據的訓練能力和檢測效率。
傳動設備是一個機械系統核心組成系統之一,傳動系統工作的穩定性決定了機械系統的性能輸出,因此有必要對傳動系統的工作穩定性實施在線檢測。本文設計了一種基于改進SSD模型的在線監測方法,先通過對信號的時頻包絡分析預處理,降低噪聲干擾,并通過信號幅值和頻率轉換,將信號轉換為圖像數據作為SSD模型的輸入數據集。設計了SSD網絡模型在基礎卷積基礎上增加了輔助卷積,引入注意力機制模塊和特征增強模塊,改善SSD網絡模型的信息共享效果,并提升模型對圖像數據的訓練能力;最后改進了SSD模型的金字塔結構,再通過先驗框匹配及選擇適合的損失函數,提高對設備故障監測性能。實驗結果顯示,改進SSD方法在檢測精度和檢測效率方面,相對于幾種傳統算法都有較為明顯的優勢。