馬彥 白俊

摘要:為了提取到能夠反映織物瑕疵的關鍵特征,文章對織物瑕疵圖像從多個角度分別提取了基于分形維的空隙特征、多重分形特征、傅里葉變換特征、小波變換特征共計19維特征;高維特征會造成運算成本的增加,為此利用主成分分析法,從原始特征空間中得出了8個主要特征;運用模糊C均值聚類算法(FCM)對正常織物圖像和瑕疵圖像進行了聚類分析。
關鍵詞:織物瑕疵檢測;特征選取;主成分分析;模糊C均值聚類算法;瑕疵圖像;高維特征 文獻標識碼:A
中圖分類號:TP391 文章編號:1009-2374(2016)09-0029-02 DOI:10.13535/j.cnki.11-4406/n.2016.09.013
特征提取和特征選擇是圖像檢測的關鍵問題,它直接影響到后續處理中分類器的設計以及整個算法結果的性能。特征提取和特征選擇是從原始特征中找出最有效(同類樣本的不變性、不同樣本的鑒別性、對噪聲的魯棒性)的特征。特征提取過程的實質是通過映射或變換的方法,將高維空間中的特征描述用低維空間的特征來描述。特征選擇則是從眾多特征中找出那些最有效的特征來實現降維。
Yoshio等人在對織物進行疵點檢測時,把灰度共生矩陣作為圖像的特征值,通過Bayes決策對疵點進行分類和評判;Cohen等人采用了基于模型的特征提取方法,他采用高斯馬爾科夫隨機場(GMRF)紋理模型作為織物疵點檢測的特征值,然后進一步進行疵點的判別和分類,然而GMRF模型的計算量往往很大,而且實現起來較為復雜,檢測的實時性不高,尤其對于在線檢測尤為困難;步紅剛等人對織物紋理估計了4個分形參數組成特征向量,并采用歐式檢測器完成了織物瑕疵檢測;張卉在參考文獻[5]中將分形和小波理論相結合提取了織物瑕疵的紋理特征;步紅剛在參考文獻[6]中為了更細致地描述瑕疵紋理、降低檢測錯誤率,提出了一種兼顧紋理概貌與細節信息、經向和緯向信息的混合特征向量提取思想,并采用單類模糊聚類檢測器完成了織物瑕疵的檢測。本文研究織物瑕疵檢測過程中的特征提取與選擇時,基于主成分分析方法,選擇具有代表意義的特征,對特征空間降維,減少運算成本,以圖提高檢測速度和檢測結果的準確率。
1 主成分分析原理
1.1 主成分分析的思想
主成分分析是采取一種數學降維的思想,找出幾個綜合變量來代替原來眾多的變量,使這些綜合變量能盡可能地代表原來變量的信息量,而且彼此之間互不相關。具體做法就是找到少數幾種線性組合,用這些組合來代替原來較多的變量,并且盡最大努力保留原來所有變量所包含的信息,這些組合指標就是主
成分。
1.2 主成分分析步驟
(1)對原始數據標準化處理;(2)計算相關系數矩陣R;(3)求出相關系數矩陣R的特征根,得到特征值λ1≥λ2≥…≥λp≥0和相應的特征向量μi=(μi1,μi2,…,μip),i=1,2,…,p;(4)計算主成分貢獻率和累積貢獻率,本實驗取累積貢獻率為95%的特征值對應的主成分;(5)計算主成分得分,根據標準化后的原始數據,分別帶入主成分表達式,就可以得到各主成分下的各個樣本的新數據即主成分得分。
2 織物圖像特征提取
為了能夠提取到盡可能全面地反映織物瑕疵的關鍵特征,本文基于織物瑕疵圖像的特點,從多角度入手,分別提取了基于分形維的空隙特征、多重分形特征、傅里葉變換特征、小波變換特征共計19維特征,作為原始的織物瑕疵圖像的特征空間。
2.1 空隙特征
分形在計算機視覺領域最為成功的應用是在紋理識別領域。分形維數作為紋理信號的一種特征,具有光照、幾何形變不變性等優點,所以這種特征在不同情況下對紋理的識別率都很高。Mandelbrot引入空隙(lacunarity)這個術語去描述具有不同外表或紋理的分形及具有相同的分形維這一性質。
2.2 多重分形特征
多重分形特征可用廣義維數譜曲線q-D(q)來描述,廣義維數譜比簡單分形維數攜帶了更豐富的圖像特征信息,多重分形廣義維數譜的寬度對應了場中數值的差異性程度。當應用到織物圖像檢測時,正常織物圖像的灰度梯度的差異性較均勻,而出現瑕疵時的灰度梯度的差異性分布則比較奇異,便可以利用廣義維數譜的寬度來區別瑕疵點。本文通過3個不同的q值對應的D(q)作為3個特征值。
2.3 傅里葉變換特征
傅里葉變換是把圖像從空間域變換到頻域的常用方法,傅里葉功率譜數值的大小反映不同頻率成分的強度。提取傅里葉變換特征,其依據是不同的特征反映著樣本不同的方向、紗線密度、亮度或紋理周期的規律
性等。
本文采用通過長方環周向譜能量百分比法提取的8個方形能量環各個百分比作為8個特征。
2.4 小波變換特征
由于本文實驗選取的樣本是128×128像素的圖像,為了提取得到更多的信息,進行了二階小波分解(分解階數過多后得到的子圖像過小不適合作為特征選用),因此采取對原本織物圖像樣本進行一階和二階小波變換的后水平和垂直細節圖像共7個子圖像灰度值作為7個
特征。
3 模糊C均值聚類(FCM)聚類算法
對運用主成分分析選取的主成分特征組合數據,用FCM算法進行聚類劃分。
模糊C均值算法的基本思想是使目標函數迭代最小化,目標函數為:
(1)
式中:U=[uik]為隸屬度矩陣;uik是第k個樣本對于第i類的隸屬度;m是加權指數;V是類中心矩陣;dik2=||xk-vi||2是樣本xk與聚類中心vi的歐氏距離;J(U,V)值越小說明聚類效果越好。約束條件:某一個樣本對于各個聚類的隸屬度之和為1。
在約束條件下計算式(1)的極小值,用偏導數為0得到極小值必要條件:
(2)
(3)
根據式(2)和式(3)可循環迭代得到滿足要求的聚類中心和隸屬度矩陣結果,具體步驟如下:(1)設定算法的相關參數,如聚類類別數c、加權指數m、最大迭代數tmax、各個初始聚類中心vi、迭代次數t、迭代結束誤差e;(2)基于當前的聚類中心利用式(3)計算隸屬函數;(3)基于當前隸屬函數根據式(2)更新織物圖像各個類別的聚類中心;(4)選用適宜的矩陣范數e,若||Uk+1-Uk||≤e或t≥tmax,則停止迭代,結束運算,否則t=t+1,返回步驟2。
4 實驗結果與分析
本實驗選取的織物瑕疵樣本種類是雙緯瑕疵,樣本圖片均為128×128像素,取正常樣本100幅,瑕疵樣本50幅進行實驗。首先對織物圖片樣本進行了直方圖均衡化處理,有效抑制了噪聲的影響;隨后按照第2部分選取的特征分別提取到了相應的特征,并分別對特征進行歸一化處理,于是得到了原始的19維織物圖像特征;然后通過主成分分析算法后得到8個新特征;最后采用FCM聚類算法對特征空間進行聚類,得到正常和瑕疵兩類,實驗結果如下所示:
對于原始19個特征,正常樣本分類正確率為85.52%,瑕疵類正確率為83.11%,平均正確率為84.31%,平均聚類時間為14.1~17.7s。
主成分8個新特征,正常樣本分類正確率為91.61%,瑕疵類正確率為87.08%,平均正確率為89.35%,平均聚類時間為8.3~11.5s。
從實驗結果可以看出,經過主成分分析后得到的新特征,比原始選取的19個特征,在聚類正確率和聚類消耗時間上均有顯著提升。
5 結語
本文提出了較多織物圖像特征,然后用主成分分析對這些特征進行了篩選,得到貢獻率比較高且重疊效果較少的特征,對原始較多的特征實現了降維,減少了后續聚類算法所需時間,提高了性能。從實驗結果可以提取的織物圖像特征是有效的,采用的主成分分析對織物瑕疵特征進一步選取后在準確性和算法時間消耗上更進一步提高,這對于織物瑕疵檢測在實際生產中的應用有重大意義。
參考文獻
[1] Yoshio Shimizu.Expert system to inspect fabric defects by Pattern recognition [J].Sen-I Gakkaish,2000,46(1).
[2] F S Cohen,Z Fan,S Attali.Automatexl inspection of textile using text mal models[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2001,13(8).
[3] 徐貴力,毛罕平.利用傅里葉變換提取圖像紋理特征新方法[J].光電工程,2004,(11).
[4] 步紅剛,黃秀寶,汪軍.基于多分形特征參數的織物瑕疵檢測[J].計算機工程與應用,2007,43(36).
[5] 張卉.基于分形與小波理論的特征提取方法研究與應用[D].武漢理工大學,2008.
[6] 步紅剛.基于混合特征向量和單分類檢測器的織物瑕疵自動檢測研究[D].東華大學,2010.
[7] B.B.Mandelbrot.The Fractal Geometry of Nature[M].San Francisco:Freeman,1983.
作者簡介:馬彥(1992-),男(土家族),湖北恩施人,武漢紡織大學碩士研究生,研究方向:機器學習。
(責任編輯:黃銀芳)