盛文婷,王幸,賴科學,何濤
(1.湖北工業大學機械工程學院,湖北武漢430068;2.湖北工業大學現代制造質量工程湖北省重點實驗室,湖北武漢430068)
我國是制造業大國,零件作為制造域中最基本的組成單元,在制造域中具有舉足輕重的地位[1]。有效地進行零件種類識別是制造域中不可或缺的環節。近年來,快速發展的圖像識別技術正好可以解決這一問題[2]。零件圖像種類特征提取作為零件種類圖像識別的關鍵步驟,在制造域中極其重要。
目前,常用的零件圖像特征提取方法是利用圖像處理算法從圖像中獲取零件的幾何與紋理特征[1,3]。然而,近幾年新興的多重分形可以考慮物體在形成過程中各種不同層次的特征,能夠更加全面有效地對物體進行描述[4-5]。在多重分形算法中,MF-DFA 能較好地反映非線性與非平穩對象不同尺度的特性[6],但存在過度覆蓋的缺點。
因此,文中對MF-DFA 略作改進,提出一種可以減少過度覆蓋的三角覆蓋MF-DFA,用于描述具有分形特性的環形零件圖像的種類特征,并利用SVM 對所得的種類特征進行識別驗證。驗證結果表明該方法可以準確表達環形零件圖像的種類特征。
多重分形是由多個標量指數的奇異測度所組成的集合。它使用一個譜函數從對象的部分出發,根據自相似性質,來研究其最終的整體特征[7]。MFDFA 是Kantelhardt 等人在(Detrended Fluctuation Analysis,DFA)的基礎上提出的一種非平穩時間序列多重分形特征分析方法。該方法能快捷地計算出一維數據的多重分形譜,并進行有效的多重分形特征分析[8-9]。
隨著MF-DFA 應用域的拓展,MF-DFA 已被推廣至二維以及高維數據中[10]。該次研究對象為環形零件圖像,因此選用的算法為二維MF-DFA。二維MF-DFA 對于大小為M×N的矩形序列x(m,n) (m=1,2…,M,n=1,2…,N)進行分析的具體流程如下:
1)對x(m,n)構造去均值的和序列Y(i,j)。其中,i=1,2,…,M,j=1,2,…,N,為序列x(m,n)的平均值。

2)如圖1所示,使用邊長為s的正方形模塊,對Y(i,j)從其左上角開始,從左至右、從上至下進行覆蓋,將序列Y(i,j) 分成Ms×Ns(Ms=[M/s],Ns=[N/s]) 個互不重疊的小正方形區域,每個區域均包含s×s個數據。由于M與N不一定被s整除,為防止數據的遺漏,需從序列Y(i,j)其他3 個角開始再次進行覆蓋,共得到4Ms×Ns個小正方形區域(w,v)(w=1,2,…,2Ms,v=1,2,…,2Ns)。

圖1 二維MF-DFA覆蓋
3)依次對4Ms×Ns個小區域(w,v)內的s×s個數據使用最小二乘法進行二元多項式擬合,如式(2)所示。其中,i=1,2,…,s,j=1,2,…,s。

4)計算均方誤差F2(s,w,v)。

5)對于4Ms×Ns個區域,計算q階測度波動函數Fq(s)。

Fq(s)是關于模塊邊長s與分形階數q的函數,隨著s的增大,Fq(s) 呈冪律關系增加,即Fq(s)∝sh(q)。h(q)為Hurst 指數。它與奇異指數α、奇異譜f(α)之間存在以下關系:

6)重復步驟5),不斷改變正方形模塊的邊長s,獲得一組不同尺度s下的測度波動函數Fq(s),對s和Fq(s)取對數得到log(s)和log(Fq(s)) 。將兩者進行線性擬合得到h(q),并代入式(5)中計算,即可獲得x(m,n)的多重分形譜α-f(α)。
根據1.1 節可知,在二維MF-DFA 中,通常使用正方形模塊對二維序列進行覆蓋。這樣會使得圖像中圖形輪廓占據正方形模塊區域不夠充分,造成過度覆蓋。因此,文中使用三角形模塊進行覆蓋。
此外,二維MF-DFA 通常使用二元多項式擬合計算測度波動函數Fq(s)。二元線性擬合運算的時間復雜度遠大于一元線性擬合。因而,三角覆蓋MF-DFA 選用一元線性擬合來計算Fq(s)。三角覆蓋MF-DFA 對于大小為M×N的二維矩形序列x(m,n)(m=1,2,…,M,n=1,2,…,N)進行分析的流程如下:
1)根據式(1)對x(m,n)構造去均值的和序列Y(i,j)。
2)取邊長為r的正方形模塊(r為偶數,4 ≤r≤W,W=min(M,N))。如圖2中的陰影部分所示,對正方形模塊進行分塊,分成4 個大小相同,方向不同的等腰三角形模塊。模塊1 位于正方形模塊的右上方。將模塊1 分別順時針旋轉90°、180°、270°即可獲得模塊2、3、4。其中h為三角形模塊的高度,h=r/2(2 ≤h≤W/2)。每一個模板面積占正方形模塊面積的1 4。

圖2 三角形覆蓋模塊與序號標注
3)如圖3所示,用這4 種模塊對Y(i,j)從其左上角開始,從左至右、從上至下進行覆蓋,獲得4Mr×Nr(Mr=[M/r],Nr=[N/r]) 個互不重疊的小區域。每個區域均包含s(s=h×h)個數據。由于M與N不一定被r整除,為防止數據遺漏,從Y(i,j)其他3 個角開始再次進行劃分,共得到Ns(Ns=16Mr×Nr)個小三角形區域?(v)(v=1,2,...,Ns)。如圖2所示,將每個小區域內的s個像素點依次進行序號標注。

圖3 二維三角MF-DFA覆蓋
4)分別對Ns個小區域?(v)內的s個像素點的灰度值與其對應的序號k(k=1,2,…,s)使用最小二乘法進行一元一次多項式擬合。

5)計算均方誤差F2(s,v)

6)對Ns個區域,計算q階測度波動函數Fq(s)。

7)重復步驟6),不斷改變三角形模塊的高h,獲得一組不同尺度s下的測度波動函數Fq(s),對s和Fq(s)取對數并進行線性擬合得到h(q),代入式(5)中計算即可得到x(m,n)的多重分形譜。
為了清楚顯示三角形模塊覆蓋優于正方形模塊覆蓋。該文設計了一個驗證性對比實驗。如圖4所示,對一條不規則且具有一定自相似的二維圖形,分別用正方形模塊和三角形模塊進行覆蓋。并分別計算出覆蓋該圖形所需正方形模塊面積S1與所需三角形模塊面積S2占整幅圖像面積S的比率η1與η2(η1=S1/S,η2=S2/S)。
經計算得η1=73.44%,η2=61.33%(η1>η2) 。因此,三角形覆蓋方法在保證圖像完全覆蓋的情況下,解決了過度覆蓋的問題,提高了圖像覆蓋的精度。
如圖5所示,在常見環形零件中齒環、齒輪、軸承與螺母都由自身的結構單元重復組成,并且存在突出的不規則和一定自相似性的特征,即分形特性。因此選用這四類環形零件的圖像作為研究對象。在圖6所示的環形零件圖像采集系統中,采集四類環形零件圖像,它們的原始圖像如圖7所示。

圖5 環形零件自相似性質

圖6 環形零件圖像采集系統
如圖7所示,原始環形零件圖像中背景區域偏白,零件區域偏黑,零件區域內像素點的灰度值遠小于背景區域內像素點的灰度值。此外,受拍照環境的影響,原始環形零件圖像中存在少量噪音光斑。它們均會對多重分形譜的計算結果造成影響。所以在計算前需對圖像進行預處理。預處理分為4 個步驟,分別是二值化、面積濾波、零件區域灰度值還原與零件區域灰度值取反。

圖7 環形零件原始圖像
環形零件預處理圖像如圖8所示。此時,圖像中無噪音光斑,零件區域偏白,背景區域偏黑,零件區域內像素點的灰度值遠大于背景區域內像素點的灰度值。圖像零件區域的特征被完美保留并且非常突出。至此,圖像預處理工作結束。

圖8 環形零件預處理圖像
由于單張環形零件圖像的多重分形譜無法完美詮釋環形零件圖像的整體特征。分別將四類環形零件在圖6所示系統中以不同的位置形態各采集100張圖像,使用1.2 節中的三角覆蓋MF-DFA 計算它們的多重分形譜,用于環形零件種類特征研究。
計算過程中,理論上分形階數q的取值范圍越大越好,但是隨著取值范圍的加大,所需的計算量與運算時間均會增加。綜合考慮,q的取值范圍是-10.5~10.5,取值間隔為0.2。因此,每張圖像的多重分形譜上有106 個點,每個點具有橫縱兩個坐標,共包含212 個數據。
將計算好的齒環、齒輪、軸承與螺母圖像的多重分形譜分別以不同形狀的譜線繪制于圖9(a)中。觀察圖9(a)可知,在四類環形零件圖像譜線頂點的右側,四類環形零件圖像譜線交錯重疊,雜亂無章,種類特征不明顯。而在譜線頂點的左側,如圖9(a)中黑色虛線框所示,同類環形零件圖像的譜線各自成束,非同類環形零件圖像的譜線雖有少許相交但大致錯開,種類特征較為明顯,易于區分。
如圖9(b)所示,選擇四類環形零件圖像的每根譜線中位于各自譜線頂點左側區域的數據作為環形零件的種類特征數據。在環形零件種類特征數據中,每張環形零件圖像對應一根短譜線,每根短譜線上均有53 個點,共包含106 個數據。
根據圖9(b)可知,環形零件種類特征數據呈非線性,來自400 張環形零件圖像,每張圖像均有106個數據。即特征數據的維度為106,可以組成一個大小為400×106 的矩陣A。由于A的維度較高,不利于識別驗證,需進行降維處理。

圖9 種類特征分析
在降維算法中KPCA 既可以達到數據降維的目的又兼顧了非線性的問題,適合非線性特征提取[11],選用KPCA 用于降維。
2.3.1 KPCA
KPCA 的基本思想是利用核函數,將原始低維空間數據通過非線性變換映射到高維特征空間F。在F中使用線性主成分分析(Principal Component Analysis,PCA)提取數據的特征值[11-13]。
KPCA 對于樣本數據集X={x1,x2,...xm},xk∈RN(N為樣本維度,m為樣本數量)的降維步驟如下:
1)計算X的核函數K(Kij=?(xi)·?(xj))。由于高斯徑向基RBF 核函數計算過程簡單,并且預測速度和精度通常優于其他核函數[11],選用RBF 核函數。其表達式如下所示。

2)根據式(10)中心化處理K獲得。其中,

3)對進行特征向量分解,獲得?的特征值λi與特征向量?。其中,

4)將特征值按降序排序得λ′1>…>λ′m,并以此調整特征向量的順序得v1′,…,v′m。
5)將v′1,…,v′m使用施密特正交法獲得單位正交化特征向量a1,…,am。
6)計算特征值的累計貢獻率B1,…,Bm,當Bt>0.96 時,則提取前t個特征向量a1,…,at。

7)計算前t個特征向量的投影Y=·a。a由特征向量ai(i=1,…,t)構成,Y即為通過KPCA 求取的X的主成分。
2.3.2 環形零件圖像種類特征值
使用前面所述的KPCA 對A進行降維處理即可提取出環形零件的種類特征值Y。經過KPCA 處理后A的特征值的累計貢獻率Bi如圖10(a)所示。A在第三個特征值處的累計貢獻率B3超過了0.96,因此Y是一個大小為400×3 的矩陣。

圖10 種類特征提取
為直觀表現環形零件的種類特征,將Y以三維圖像的方式展示在圖10(b)中,每個三維數據點的位置坐標為每張圖像的3 個特征值分量。數據點根據它們對應的環形零件種類組成了4 個群簇,表明環形零件圖像種類特征值提取成功。
為證實環形零件圖像種類特征值Y能夠精確表達環形零件圖像的種類特征,在此對Y進行了識別驗證。在常用的分類識別方法中,SVM 具有扎實的理論基礎和良好的泛化性[14],選擇SVM 用于識別驗證。
Lib-SVM 是臺灣的林智仁(Chih-Jen Lin)教授于2001年開發的一套操作簡單且易于使用的SVM 庫。此軟件包能夠非常方便地對數據進行分類與回歸,在物聯網與醫療等領域均得到了廣泛的應用[15-17]。因此選用Lib-SVM 作為識別驗證工具。Lib-SVM 的使用步驟如圖11 所示。在第3 步中Lib-SVM 共提供了線性、多項式、高斯徑向基(RBF)與Sigmoid 這4 種核函數,選擇其一即可,文中選擇應用最廣的RBF,RBF表達式如式(14)所示。其中σ>0 為高斯核帶寬。


圖11 Lib-SVM使用流程
環形零件種類特征值Y來自400 張圖像。從Y中每類環形零件100 張圖像的種類特征值內各隨機抽取50 張圖像的種類特征值,將它們整合后作為環形零件圖像種類訓練數據集D。其余環形零件圖像的種類特征值則整合后作為環形零件圖像種類測試數據集E。D與E經歸一化得到環形零件圖像種類標準訓練集train_chq 與標準測試集test_chq。train_chq 與test_chq 均是大小為200×3 的矩陣,如圖12 所示。

圖12 標準訓練集與測試集
train_chq 經進行交叉驗證獲得的最佳懲罰因子c與最佳核函數參數g(g=1/σ2)的值均為2-7。將c、g、train_chq 與test_chq 代入Lib-SVM 中進行訓練與分類運算所得的環形零件圖像種類識別驗證結果如圖13 所示。 test_chq 中200 張環形零件圖像有199 張圖像的零件種類被準確識別[18]。識別預測的準確率(Accuracy)較高為99.5%。證實了三角覆蓋MF-DFA 可以良好表達環形零件圖像的種類特征。

圖13 種類驗證結果
文中針對MF-DFA 具有過度覆蓋的缺點,對其略作改進提出三角覆蓋MF-DFA。使用三角覆蓋MF-DFA 從全局和局部兩方面出發[19],深層次發掘環形零件圖像的種類特征,并得到以下結論:1)根據對比實驗驗證了三角覆蓋MF-DFA 相較傳統MF-DFA 的圖像覆蓋精度更高,解決了過度覆蓋問題。2)選用常見且分形特性較好的齒環、齒輪、軸承與螺母這四類環形零件為研究對象,利用三角覆蓋MF-DFA 與KPCA 從它們的圖像中獲取環形零件種類特征值Y。使用SVM 對Y進行識別驗證,所得識別準確率為99.5%。證實三角覆蓋MF-DFA可以準確表達環形零件圖像的種類特征,具有工程應用價值,可應用于工業生產中的環形零件圖像的種類識別。