侯文英,楊懿,王鐵輝,黃嘉成
(1.內蒙古科技大學,內蒙古 包頭 014010;2.聯邦制藥(內蒙古)有限公司,內蒙古 巴彥淖爾 015000)
鐵路貨車滾動軸承是關系到鐵路運輸安全的關鍵部件,由軸承故障引發的車輛事故是威脅行車安全的重要因素,因此鐵路部門對軸承的檢修非常重視。然而現階段貨車進入車輛段進行一般檢修時,主要通過人工目測、手感及經驗判斷軸承表面缺陷種類,該檢測方法依賴于檢測人員的經驗和責任心,勞動強度大,長時間重復作業易引起視覺疲勞,工作效率低,很容易造成漏檢。
針對以上問題,選用CCD代替人眼對軸承表面缺陷進行圖像采集,然后經過設計的圖像處理技術進行圖像處理,達到對10種常見軸承缺陷的自動分類、識別。
10種常見的軸承表面缺陷如圖1所示。圖像預處理的具體流程如圖2所示,首先,由CCD黑白攝像機對軸承表面進行圖像采集,獲得缺陷的灰度圖像,并經中值濾波去除圖像中噪聲的干擾。通過對多種缺陷灰度直方圖的多次提取,發現缺陷的灰度大多集中在一個較小的范圍之內,二值化后不僅可以有效地使缺陷與背景得到明顯區分,而且也為下一步確定缺陷最小外接矩形打下基礎。

圖1 軸承缺陷類型

圖2 圖像預處理流程圖
然后,對二值化后的圖像依次進行卷積濾波與開、閉運算的處理,完好保留缺陷的同時去除了缺陷周圍零散邊緣點的干擾,使得缺陷與背景的區分更加明顯;接著運用旋轉法確定出了缺陷主要信息的最小外接矩形。
最后,由于灰度圖像較二值圖像對于缺陷信息的表達更為真實,根據二值圖像中獲得最小外接矩形所需圖像旋轉的角度及相應最小矩形的范圍,在中值濾波后的灰度圖像中裁剪出包含缺陷主要信息的那部分灰度圖像,進行后續的特征提取,這樣避免了計算其他不相關區域的特征量,減少了計算量及非缺陷區域對缺陷區域特征量提取的影響,提高了網絡識別速度和精度。
經預處理后裁剪出的包含缺陷的灰度圖像稱為特征圖像,考慮到缺陷圖像種類繁多、缺陷特征復雜的特點,在提取如圖像長度、寬度、灰度均值、灰度方差及基于灰度共生矩陣的3個紋理特征(角二階矩、墑、相關度)等7個傳統特征的基礎上,又增加了如下特征量作為缺陷分類的依據。
壓縮度也稱為環狀度,即
(1)
式中:LA,SA分別表示特征圖像內不規則缺陷部分的周長和面積;分析中采用特征圖像的周長l和面積s代替目標區域。
采集到的缺陷中除了單純的直線或曲線,更多的是有一定寬度的缺陷,因此,引入線度來描述圖像的線性程度,即
(2)
特征圖像的距離極值比是用來描述該圖像的緊湊性,即
(3)
式中:dmax和dmin分別表示特征圖像內缺陷部分的質心(ci,cj)到缺陷區域邊緣的最大距離和最小距離,采用特征圖像的質心(cx,cy)和距離代替。
NMI(Normalized Moment of Inertia)也稱為歸一化轉動慣量,即
(4)
式中:將二維數字化灰度圖像M×N看成是二維xOy平面上的M×N個像素點,每個像素點(x,y)的灰度值為f(x,y)。NMI特征具有良好的縮放不變性、旋轉不變性和平移不變性,且不同物體的NMI特征差異明顯,非常適合作為缺陷的識別特征。
(5)
式中:mpq為中心矩,其反映了預處理后得到的特征圖像中的灰度相對于灰度重心是如何分布的。為了得到矩的不變特征,定義歸一化的中心矩為
(6)
利用歸一化的中心矩,可以獲得利用μpq表示的7個具有平移、比例和旋轉不變性的矩不變量,即預處理后得到的特征圖像的不變矩。
分類器的設計除了要求準確分類之外,還要能檢測出未知缺陷并確定分類的可靠性,指明缺陷的嚴重程度。針對貨車滾動軸承表面缺陷種類多、特征差異大等特點,選擇了BP神經網絡作為缺陷分類的學習方法。典型的BP神經網絡是一種具有3層或3層以上結構的無反饋的、層內無互聯結構的前向網絡,其中首尾兩層分別稱為輸入層和輸出層,中間各層稱為隱含層。
輸入層主要用作緩沖存儲,將源數據從輸入層加載至神經網絡。輸入層的節點數目取決于源數據的維數,每一維均對應一個輸入節點。下文中源數據均是從包含大量缺陷信息的特征圖像內提取,選擇特征圖像長度、寬度2個幾何特征,灰度均值與方差2個灰度特征,3個紋理特征,特征圖像壓縮度、線度、距離極值比、NMI特征以及7個不變矩,共18個特征量作為BP網絡的源數據用于樣本學習訓練和缺陷分類,即所使用的神經網絡輸入層神經元為18個。
人工神經網絡的輸出層節點數由采用的人工神經網絡模型和需要的輸出表示方式確定。貨車滾動軸承的缺陷一共有15種,雖然預識別的缺陷只有10種,但是為了將來可以將識別系統進行擴展,輸出層神經元設置為4個,并且輸出要求二進制數,則其組合可完全表達15種缺陷。此次規定麻點、輾皮、剝離、擦傷、燒附、腐蝕、磕碰傷、凹痕、壓痕和劃傷這10種缺陷類型的期望輸出分別為0000,0001,0010,0011,0100,0101,0110,0111,1000,1001。選擇Sigmoid形函數f(x)=1/(1+e-x)作為網絡輸出層的傳遞函數。
隱節點的作用是從樣本中提取并存儲其內在規律,每個隱節點有若干個權值,而每個權值都是增強網絡映射能力的參數。隱節點數量太少,網絡從樣本中獲取信息的能力就差,不足以概括和體現訓練集中的樣本規律;隱節點數量過多,又可能把樣本中非規律性的內容如噪聲等也學會記牢,反而降低了泛化能力,此外隱節點數太多還會增加訓練時間。在此采用試湊法確定隱節點數,首先根據經驗公式
(7)
式中:l為隱含層節點數;n為輸入層節點數;m為輸出層節點數;a為1~10之間的調節常數。由經驗公式確定隱含層節點數調節范圍為6~14,表1為在樣本集和循環迭代次數相同的情況下,不同隱含層節點數的BP神經網絡訓練誤差,由此可知該神經網絡隱含層節點數取10最為合適。選擇雙曲正切S形函數g(x)=[2/(1+e-2x)]-1作為網絡隱含層的傳遞函數。

表1 不同隱含層節點數下的BP神經網絡訓練誤差
針對傳統BP算法的缺點,系統在以下方面進行了改進。
(1)傳統BP神經網絡在訓練學習新樣本時有遺忘舊樣本的趨勢,為了解決這一問題,在設計輸入向量時,將500個特征向量分為50組,每組均遍及10種缺陷,如此讓每種缺陷每隔一定的時間間隔反復對網絡進行訓練,提高其記憶能力。
(2)網絡的輸入節點物理量各不相同,有的數值相差很大,各指標訓練樣本之間不具備可比性,無法進行綜合評估。因此,以S形函數作為轉移函數,該函數的值域為[0,1],為防止小數信息被大數信息淹沒現象的發生,可以采用歸一化方法,將各輸入樣本歸一化到[0,1]區間內。但是規范后的每一個輸出值序列中至少有一值為1,一值為0,恰好是S形函數的極小值和極大值,要求連接權足夠大才能使網絡的輸出值與其匹配,從而需要相當多的訓練次數來不斷修正權值,導致訓練速度緩慢。所以,在計算過程中把原始數據歸一化到[0.05,0.95]區間內,以便讓網絡輸出有足夠的增長空間。因此,在計算過程中用如下歸一化公式預處理數據
(8)

試驗中選取鐵路貨車滾動軸承表面常見10種缺陷的圖像,對現場采集的缺陷圖像和缺陷標準圖像進行集中標定后,從中選出700張(每種缺陷各70張)典型的能代表各類缺陷的圖像,其中500張(每種缺陷各50張)作為缺陷樣本對網絡進行訓練,200張(每種缺陷各20張)用于網絡的測試,BP分類器的缺陷識別結果見表2。

表2 BP分類器的缺陷識別結果
從表2給出的識別結果可以看出,測試數據集包括了10種缺陷類型,缺陷總數為200個,共正確識別出了187個,整體識別率達到了94%。
(1)將視覺技術應用于鐵路貨車滾動軸承表面缺陷檢測,降低了工人的勞動強度、提高了工作效率、加強了檢測結果的準確性。
(2)卷積濾波與開、閉運算相結合的圖像處理方法,既能有效去除缺陷周圍邊緣點的干擾,又能夠滿足實時處理的要求。
(3)提取傳統特征基礎上增加了壓縮度、線度、距離極值比、NMI特征和不變矩等特征量,增強了缺陷分類的依據。
(4)采用具有較強泛化能力的BP神經網絡對缺陷進行分類,加強了分類的準確性,通過對輸入矩陣和歸一化方法的改進,提高了神經網絡的記憶能力及識別速度。
(5)通過試驗對缺陷分類系統識別結果進行統計,識別率達到94%,確認了該系統的可靠性。