錢勇,白瑞林,倪健,杜斌
江南大學 智能控制研究所 輕工過程先進控制教育部重點實驗室,江蘇 無錫 214122
基于顏色特征的地板層次分類研究
錢勇,白瑞林,倪健,杜斌
江南大學 智能控制研究所 輕工過程先進控制教育部重點實驗室,江蘇 無錫 214122
隨著經濟的快速發展,地板的需求量亦越來越大,地板在生產過程中如何快速準確地分類,成為了一個迫切需要解決的問題。目前,地板的分類實現主要靠人工目測,其人為因素的影響比較大,因此利用數字圖像處理技術對地板進行分類,更能有效地保證地板分類的準確性。
由于地板顏色是反映地板表面視覺和心理感覺的重要特征,與分類的評定有著密切關系,從而使得近年對基于顏色特征的分類處理進行了一定的研究。如戴天虹等通過主顏色特征,分別利用神經網絡中的RBF網絡、K-最近相鄰和最近鄰對木材樣本圖像進行分類處理[1];王克奇等利用均勻色彩空間對木材的顏色特征進行測量與辨別[2];相似的還有竹片[3]及瓷磚[4]等材料基于顏色的的分類研究。
然而在上述的研究中,皆沒能有效地去除光照條件及地板紋理特征對顏色分類效果的影響。本文通過在HSV色彩空間去除光照條件對其影響,并給予色調分量及飽和度分量不同的權重以減小紋理特征影響,對未知類別的地板樣本進行分類處理。通過建立粗分類及細分類兩層樣本分類依據庫,對未知地板樣本最短距離決策、K-最近相鄰對未知地板樣本進行逐層分類處理,實現地板快速分類。
2.1 HSV色彩空間
在顏色表示上,采用更加符合人眼對色彩感知的HSV色彩空間,以一個亮度的屬性值V和兩個色度屬性值(色調H、飽和度S)來表示一種色彩。其中,RGB色彩空間轉換HSV色彩空間的計算公式為:

2.2 顏色特征
對顏色特征的表達方法有直方圖法、主色調法、顏色聚合矢量法、顏色矩法及顏色熵法等[5]。其中,顏色矩同其他顏色特征相比,無需對顏色進行量化處理,同時又降低了顏色特征的維數。其思想在于:圖像中任何的顏色分布都可以用它的矩來表示,且顏色分布信息主要集中在低階矩中[1,6],如一階矩μ描述平均顏色,二階矩σ描述顏色方差,三階矩s描述顏色的偏移性。這種近似的方法能夠十分有效地表征圖像的顏色分布,從中可以看出顏色的差異(色差)。
顏色矩特征的三個低階矩的數學表達式的形式為:

式中,hij表示第i顏色通道中灰度為j的像素出現的概率,n表示灰度級數。
為降低光照條件對地板分類效果的影響,在此選用兩個色度屬性值(色調、飽和度)提取其相關顏色矩特征以進行地板的分類檢測處理,去除亮度的屬性值。
通過觀察地板樣本的顏色特征數據發現,由于受到地板紋理特征的影響,地板樣本飽和度特征數據分布離散性較高,使得飽和度特征數據不能有效地刻畫出同類地板的顏色特性。但色調特征都保持著相對較好的集中性。因此在地板之間相似度的度量上需要給色調特征數據分配較高的權重,給飽和度特征數據分配較低的權重,以減小紋理特性對地板分類的影響。不同地板顏色矩向量的加權歐式距離可表示為:

其中,ω1、ω2分別表示色調顏色矩特征及飽和度顏色矩特征的權值。
3.1 最大最小距離算法
聚類分析中一個重要的環節就是找到數據中客觀存在的類別數目。當聚類中心數c未知時,有兩種途徑去處理:(1)嘗試多種可能的c,并比較不同的準則函數值,選最優準則值所對應的c值進行聚類;(2)設置一個閾值來控制新的聚類類別的建立。
后一種方法對在線學習更為適合,其主要有最臨近規則的試探法及最大最小距離算法[7],而最臨近規則的試探法受到閾值T的影響很大。閾值的選取是分類成敗的關鍵之一,而最大最小距離算法充分利用樣本內部特性,計算出所有樣本間的最大距離作為歸類閾值的參考,改善了分類的準確性。若某樣本到某一聚類中心的距離小于最大距離Dmax的1/2,則歸入該類;否則建立新的聚類中心。
3.2 建立分類依據庫過程
在地板分類實現之前預先建立給定地板樣本分類依據庫,以便對未知地板樣本進行層次分類,實現未知地板樣本快速有效的分類。其層次結構,如圖1所示。

圖1 樣本分類依據庫示意圖
在建立樣本分類依據庫時,首先根據給定的地板樣本確定出各地板樣品的顏色矩,然后通過最大最小距離分類算法對各地板樣品進行聚類處理,將顏色矩數值相近類別合并到一起,求取相似類別地板樣品顏色矩的數據均值。
使用相似地板樣品合并后的特征數據作為分類過程的初次分類的依據,用以確定未知地板樣本的所屬的近似類別。而預先給定的各地板樣本顏色矩數據則作為第二次分類的依據,用以確定未知地板樣本的所屬的準確類別。
4.1 分類決策方法
4.1.1 最短距離分類
最短距離分類規則[8]最初是由Cover和Hart于1967年提出的,其分類識別率可以用來比較不同特征矢量對樣本描述的有效性。它的基本思想是:計算輸入數據向量到表示所有目標類數據向量的距離,當到某一類的距離比到其他任何類的距離都短時,將未知模式分配到這一類[9]。
4.1.2 K-最近相鄰分類
K-最近相鄰是一種基于統計的分類方法,其基本思想是:從測試樣本點x開始生長,不斷地擴大區域,直到包含進k個訓練樣本為止,并且把測試樣本點x的類別歸為這最近的k個訓練樣本點中出現頻率最大的類別[10]。
然而在實現時經常遇到的問題是:在x的k個近鄰中,屬于最大近鄰數對應的類別可能不只一個。針對上述問題,將K-最近相鄰法與最短距離法相結合,提出了K-最近相鄰-最短距離法。其思路是:首先求出樣本x的k個近鄰。設最大近鄰數為kmax,判斷kmax是否唯一;若唯一,則該類別ωmax為x所屬;若是多個(如N個),求近鄰數kmax的所屬地板樣品類別特征均值與x的距離:

其中,S為地板樣品類別特征均值,n為特征數目。
此時決策規則為:

4.2 未知地板樣本處理過程
在分類的實現過程中,首先通過最短距離分類判斷未知地板樣本所屬的近似樣品類別,然后通過K-最近相鄰分類實現未知地板樣本準確類別的判定實現,其具體實現流程如圖2所示。

圖2 未知地板樣本分類實現流程圖
在建立地板分類樣本庫時,由于初始類別中心選定的隨機性,會使位于所有樣本最大距離Dmax的1/2附近的同一樣品的不同樣本,在分類時判定到不同的近似類別,從而產生最終的分類錯誤。所以在判定樣本類別時,定義一個中間區域。當未知樣本進入此區域時,將與之相近的類別同樣歸入到下一層判定。
其具體實現步驟為:
(1)計算未知樣本特征向量到所有相似類別合并后的向量的距離;
(2)對所有距離進行排序處理;
(3)將與最短距離之差小于Dmax/4的所有相似類別皆歸算到下一層次的處理過程。
K-最近相鄰分類確定待測地板所屬準確類別的實現過程:
(1)求取未知地板樣本與所屬樣品大類中各樣本的距離;
(2)按距離大小對樣品大類中各樣本進行排序處理;
(3)統計前N個距離所對應的地板樣品類別數目,求取類別數目最大值Kmax;
(4)判斷Kmax是否唯一,唯一則進行第(5)步,不唯一則進行第(6)步;
(5)則將未知地板歸類到Kmax所對應的類別中,分類處理結束;
(6)求取待測地板與所有Kmax相同的地板樣品的距離;
(7)將未知地板樣本歸類到與其距離最小的地板樣品中,分類處理結束。
在上位機以270個地板樣本圖像進行分類實驗,共9類樣品,每類各30個樣本,其中15個地板樣本用于建立分層依據庫,剩下的15個地板樣本用于未知地板樣本分類檢測;通過VS2010操作平臺進行仿真。各類別地板樣品的色調及飽和度顏色矩特征均值數據,如表1所示。

表1 樣品色調及飽和度顏色矩特征均值
通過最大最小距離法對9種地板樣品進行聚類處理后,求取的相似類別地板樣品顏色矩特征的具體數據均值參數及其所包含的地板樣品序號,如表2所示。

表2 相似類別地板樣品相關參數
在本文分類方案下,不同飽和度權重所對應的正確率的對比關系,如圖3所示。通過觀察可以看出,在飽和度權重為10%時,其地板紋理對未知地板樣本分類的影響最小,正確率最高,約為95.6%。

圖3 飽和度權重與分類正確率對比關系
用本文方法與其他相關分類算法對135個地板樣本進行分類,其正確率及單地板樣本于上位機分類檢測平均時間對比結果,如表3所示。通過觀察可以看出,本文分類方案具有較高的正確率及較快的分類速度。

表3 地板分類識別方法的正確率及平均分類時間對比
在HSV色彩空間提取出色調及飽和度的顏色矩特征數據,以加權的方式對地板樣本的色調特征數據分配以較高的權重,減小地板紋理對分類準確性的影響。通過最大最小距離算法對相似地板樣品類別進行聚類處理,建立層次分類樣本庫,減少K-最近相鄰分類法的計算數據量,提高了未知地板樣本的分類速度。針對K-最近相鄰分類中屬于最大近鄰數對應的類別可能不只一個的問題,提出了K-最近相鄰-最短距離法。測試結果表明,本文方案在保證K-最近相鄰分類法正確率的基礎上能夠有效地減少地板分類所需要的時間。
[1]戴天虹,王克奇,楊少春.基于顏色特征對木質板材分級的研究[J].系統仿真學報,2008,20(5):1372-1376.
[2]王克奇,楊少春,戴天虹,等.基于均勻顏色空間的木材分類研究[J].計算機工程與設計,2008,29(7):1780-1784.
[3]羅玉娟,李熙瑩,蔡志崗,等.采用均勻顏色空間的竹片分類研究[J].計算機工程與應用,2010,46(16):238-240.
[4]羅瑋,彭復員,柳健.彩色瓷磚的自動分類系統[J].華中科技大學學報:自然科學版,2001,29(3):79-81.
[5]孫君頂,趙珊.圖像低層特征提取與檢索技術[M].北京:電子工業出版社,2009.
[6]徐琨,李燕.基于分塊顏色矩和紋理特征的圖像檢索方法[J].西安石油大學學報:自然科學版,2005,20(2):77-79.
[7]周涓,熊忠陽,張玉芳,等.基于最大最小距離法的多中心聚類算法[J].計算機應用,2006,26(6):1425-1427.
[8]Cover T M,Hart P E.Nearest neighbor pattern classification[J]. IEEE Trans on Inform Theory,1967,13:21-27.
[9]Acharya T.Ray A K.Image processing principles and applications[M].Wiley-Interscience Publication,2005.
[10]Duda R O,Hart P E,Stork D G.Pattern classification[M]. 2nd ed.[S.l.]:Wiley-Interscience Publication,2000.
QIAN Yong,BAI Ruilin,NI Jian,DU Bin
Key Laboratory of Advanced Process Control for Light Industry(Ministry of Education),Institute of Intelligent Control,Jiangnan University,Wuxi,Jiangsu 214122,China
The floor hierarchical classification based on the color characteristics is proposed to improve the automate degree. Through clustering the pre-specified color characteristics of the floor sample,the broad categories and specific categories are created to determine the training samples.To classify the unknown floor samples,the first use of the shortest distance classification is to determine the general category of the sample,then uses the improved K-nearest neighbor classification to determine the specific categories.Test results show that the hierarchical processing program reduces the K-nearest neighbor of the data processing phase with a higher classification accuracy.
color moments;floor classification;maximum minimum distance algorithm;minimum distance classification; K-nearest-neighbor classification
為提高地板生產過程中分類處理的自動化程度及其快速性,提出了一種基于地板顏色特征的層次分類方法。在HSV色彩空間提取出地板的顏色矩特征,并給予色調特征數據以較高權重,降低紋理特征對分類的影響。在對未知樣本分類時,利用預先建立的粗細兩層分類依據庫,采用最短距離決策、K-最近相鄰對未知地板樣本由粗到細進行逐層判定。測試結果表明,該分層處理方案在保證較高的分類正確率(95.6%)的基礎上,有效地減少了K-最近相鄰的數據處理量。
顏色矩;地板分類;最大最小距離算法;最短距離分類;K-最近相鄰分類
A
TP391
10.3778/j.issn.1002-8331.1111-0069
QIAN Yong,BAI Ruilin,NI Jian,et al.Floor hierarchical classification research based on color characteristics.Computer Engineering and Applications,2013,49(13):245-247.
國家自然科學基金(No.60804013);“嵌入式機器視覺關鍵技術的研究與開發”產學研合作資助項目(No.11002)。
錢勇(1986—),男,碩士研究生,研究方向:嵌入式系統與智能儀器,圖像模式識別;白瑞林(1955—),男,教授,博士生導師,研究方向:智能控制與嵌入式系統;倪健(1976—),男,碩士研究生,研究方向:嵌入式系統與智能儀器,圖像匹配;杜斌(1986—),男,碩士研究生,研究方向:嵌入式系統與智能儀器,圖像特征提取與識別。E-mail:qianyong-1986@163.com
2011-11-08
2012-01-02
1002-8331(2013)13-0245-03
CNKI出版日期:2012-04-25http://www.cnki.net/kcms/detail/11.2127.TP.20120425.1722.085.html