鐘智彥,文志強,葉德剛
(湖南工業大學計算機與通信學院,湖南株洲412007)
基于改進協方差矩陣的半色調圖像分類研究*
鐘智彥,文志強,葉德剛
(湖南工業大學計算機與通信學院,湖南株洲412007)
針對半色調圖像分類中只存在0和1的特點,提出了一種基于改進的協方差矩陣在半色調圖像中的分類方法。根據協方差矩陣在實現半色調圖像分類中個數少且并未體現其局部和全局信息的特性,對協方差矩陣的底層特征進行改進。利用樣本的局部特性和核密度估計方法,實現黎曼流形上的貝葉斯分類策略。實驗中研究協方差矩陣的底層特征與傳統協方差矩陣的特征提取方法并對其進行分類性能比較。實驗結果表明,在半色調圖像分類中,與傳統的協方差矩陣相比較,改進的協方差矩陣提取出的特征在分類中平均錯誤分類率更低。
半色調圖像;協方差矩陣;黎曼流形;最近鄰分類器
目前數字半色調圖像分類方法的研究比較少。Chang[7]首先對半色調圖像分類進行研究,指出在半色調圖像恢復成連續灰度圖像之前運用一維自相關函數,提取出四類半色調圖像,最后用BP神經網絡進行分類。雖然該方法分類結果有時能達到100%,但獲取的類別比較少。文志強[1,8]提出一種在3個方向上利用像素自相關特征進行同或運算來描述紋理特征的有監督流形上的半色調分類方法,利用圖像分塊的思想獲取紋理特征,目的在于提高建模效率和紋理特征的有效性。
以上方法都基于歐式空間,本文提出的方法需在黎曼空間上進行特征匹配,再利用黎曼距離和局部概率密度來實現對半色調圖像的分類。黎曼流形是具有黎曼度量的微分流形,即有一個對稱正定協變的二階張量場在這個流形上,相比于歐式空間,具有更豐富的黎曼度量方法,是研究概率分布和模式匹配的有效工具。
通過多種半色調技術可將多級灰度圖像轉化為半色調圖像樣本,并對其進行分類。12種常用半色調技術,如表1所示。圖1給出相應的12幅灰度圖像產生的半色調圖像(以lena(大小:256×256)為例)。由圖1可知,不同半色調技術產生的半色調圖像具有不同的紋理特征。一些半色調圖像紋理比較明顯,如圖1中的(a)、(g)、(h)、(i)子圖;另一些紋理差別不明顯,分類較困難,如圖1中(b)、(c)、(e)和(l)子圖難以區分,子圖(d)、(f)、(j)和(k)區別也較小。由分析可知,造成半色調圖像分類錯誤率高的最主要原因是紋理差別不明顯。因此,本文在半色調圖像上對協方差矩陣改進之后再進行構建與分類。

序號1 2 3 4 5 6 7 8 9 1 0縮寫方法S t e F l o S t u B u r J a r C l u 4 C l u 8 B a y 8 B a y 4 D i s 8半色調類型誤差分散法誤差分散法誤差分散法誤差分散法誤差分散法聚簇型有序抖動法聚簇型有序抖動法分散型有序抖動法分散型有序抖動法分散型有序抖動法1 1 1 2 M e s 1 6 K n u 4點分散法點分散法半色調特征方法使用S t e n e n s o n濾波器[9]使用F l o y d -S t e i n b e r g誤差濾波器[9]使用S t u c k i濾波器[9]使用B u r k e r濾波器[10]使用J a r r i s濾波器[10]抖動模板法4 × 4,共1 6灰度級[11]抖動模板法8 × 8,共6 4灰度級[11]使用分散型B a y e r 8 × 8抖動模板,共6 4灰度級[11]使用分散型B a y e r 4 × 4抖動模板,共1 6灰度級[11]使用分散型D i s p e r s e _ C L 8 × 8抖動模板,共6 4灰度級[11]使用M e s e -V a i d y a n a t h a n 1 6 × 1 6矩陣[11]使用K n u t h 4 × 4抖動模板,共1 6灰度級[12]

圖1 半色調圖像示意圖
協方差矩陣[13-14](Covariance matrix,COV)是概率論、統計學的一個概念,通過不同維度計算協方差構成的矩陣,衡量兩個隨機變量的變化。協方差矩陣表示一個多維隨機變量各個維度之間的相關性。協方差矩陣于2006年被Tuzel O,Porikli F[15]作為描述子最先應用在醫學圖像處理的目標檢測中,能夠很好地描述圖像,因為將其用于圖像特征提取時,將區域圖像不同的特征值通過統計矢量的方式統一于協方差矩陣中。COV作為描述子具有很好的魯棒性,對外部形態和光照的改變能很好地維持其主要特征的不變性,所以可將COV應用于半色調圖像的特征提取中[16]。
COV定義如下:
設I為一維強度或三維強度的彩色圖像,f為原圖I內具有M×N個像素的區域圖像,h為該區域f內提取的d維特征向量,如式(1)所示:
游客感知價值研究通常將感知價值維度置于一個層次,缺乏對各維度間關系的分析。本研究包括兩個部分,第一部分,運用階梯訪談法繪制游客“屬性-結果-目的”3個層次的感知結構價值圖,提出相應假設。第二部分,運用SPSS20.0對樣本數據進行探索性因子分析,并對“屬性-結果層”“結果-目的層”的因子進行多元回歸分析,驗證假設并且構建鄉村游客中心的游客感知價值層次模型。

將區域f每個像素的特征向量通過共生關系統一到協方差矩陣C中,如式(2)所示:

其中,h(x,y)為區域矩陣每個元素的特征向量,u為M×N個dx1維特征向量h(x,y)的均值,h(x,y)表示區域圖像每個像素的底層特征,如式(3)所示:

式(2)中C(f)為協方差矩陣,融合了原始圖像底層的五個特征,等價于公式(4):

由公式(1)~(4)可知,COV能夠較好地表示圖像的特征,且具有如下優點:
(1)很好的辨識度。能夠將區域圖像多種特征融合于COV中。
(2)更低的維數。COV是一個對稱的半正定矩陣,所以d維的特征向量構成的協方差矩陣具有(d2+d)/2個不同值。
(3)很好的魯棒性。將一幅圖像旋轉后,若選取的特征適當,則形成的COV不發生相應的改變。
COV雖然有很多優點,但也存在不足。由公式(2)可知,當h(x,y)=u時,協方差矩陣的行列式有可能為0,所以準確地講,協方差矩陣應屬半正定矩陣,針對該問題可采用附加一個足夠小的對角矩陣p來進行預處理。
可以看到,圖1中12幅半色調圖像的紋理不明顯,分類較困難。針對這一難點,可將半色調圖像求梯度,即通過梯度信息來描述圖像中物體的邊緣、輪廓、形狀等紋理特征。對圖像加入水平邊緣算子[-1,0,1]和垂直邊緣算子[-1,0,1]T,并將該特征加入協方差矩陣的底層特征中。所以提出改進的協方差矩陣(Improved covari-ance matrix,ICM)。
本文獲取區域半色調圖像f的底層特征如公式(5)所示,通過公式(2)將其構成COV。

其中,x,y分別為區域半色調圖像的坐標值,f(x,y)設定以位置(x,y)為中心的n×n(實驗中n取9)鄰域各個像素值之和,|fx|、|fxx|為像素值在x方向的一階、二階導,|fy|、|fyy|為像素值在y方向的一階、二階導。arctan|fy|/(|fx|+p)為f(x,y)在位置(x,y)處的梯度。由于協方差矩陣的行列式有可能為0,所以添加一個無窮小量。S1(x,y)=(|Ix|*|Ix|+|Iy|*|Iy|+|fx|*|fx|+|fy|*|fy|),其中Ix為水平邊緣梯度,Iy為垂直邊緣梯度。S2(x,y)=arctan|Iy|/(|Ix|+p)。圖2為對應圖1中ICM特征圖像示例圖。由圖2可知,各矩陣的特征圖都有一定的差別,這說明提取的特征矩陣可用于描述半色調圖像。即加入梯度算子后,圖像的輪廓明顯變得更清晰。將梯度算子加入COV的底層特征后,特征更明顯,更容易區分圖像的紋理信息。ICM算法實現步驟如下:
算法:ICM算子的構造
輸入:一幅大小為M×N的區域半色調圖像f
輸出:能夠表征原始半色調圖像的改進協方差矩陣
Step1根據公式(5)獲取區域半色調圖像的十個底層特征,分別是x,y,|fx|,|fxx|,|fy|,|fyy|,f(x,y),arctan|fy|/(|fx|+p),S1(x,y),S2(x,y);
Step2根據公式(2)計算區域半色調圖像f的協方差
矩陣C(f)。

圖2 改進的協方差矩陣特征圖像示例圖
3.1 實驗環境
本實驗在Windows 7操作系統環境下進行,采用VC6.0結合OpenCV 1.0及MATLAB 7.11進行編程。常用半色調圖像由VC6.0結合OpenCV 1.0產生,ICM特征的提取使用MATLAB 7.11生成。
3.2 實驗結果
對原始圖像產生12類常用半色調圖像庫,對每類隨機取出410幅樣本(大小為256×256)。對每幅圖像提取ICM特征,之后從每類410個協方差矩陣的特征中隨機抽取205個作為訓練樣本,剩余205個作為測試樣本。為驗證提出方法的有效性,取相同K值不同類型的特征矩陣在黎曼流形上采用K最近鄰分類器對紋理特征進行分類?,F取K=23,應用傳統的協方差矩陣與本文提出方法對隨機取出的410×12幅圖像進行分類,比較其分類精度如表2和表3所示。
由表2可知,采用傳統協方差矩陣對12類常用的半色調圖像的平均分類正確率為83.487 5%,由表3可知,提出方法對12類常用半色調圖像的平均分類正確率為92.598 3%。比較表明,本文所提出的方法有所改善。

表2 傳統協方差矩陣的分類

表3 本文提出方法的分類
3.3 參數影響
對于多類別(類別數大于2)投票時可能會出現兩種或多種類別票數相同問題,這種情況下分類器取K個近鄰值中最小值對應的類別為最終類別。分類結果性能采用平均分類錯誤率(公式(7))和分類錯誤方差率(公式(8))來評價,其中公式(6)為錯誤分類率。平均分類錯誤率越小說明分類效果越好,分類錯誤方差率越小說明分類器越穩定。


其中,nj為測試樣本總數,mj為正確分類樣本數,N為總的類別數(N=12),j為類別數,j=1,2,…,12。
本實驗測試不同K值對相同類型的影響。由12類常用半色調圖像變更不同的K值,分別取11,15,19,23,27,31,35七個值來比較傳統協方差矩陣和提出方法提取特征矩陣對其進行eave和v比較,折線圖比較如圖3和圖4所示。由圖3可知,常用12類半色調圖像的分類中,COV在K=19時分類效果最好,ICM在K=23時分類效果最好。但不管K為何值,提出方法效果均優于COV。由圖4的v折線圖可知,COV在K=23時分類器最穩定,ICM在K=27時v最小,此時的分類器性能最穩定。不管K為何值,本文提出方法的分類器更穩定。由此證明,提出方法的有效性。
針對12類常用半色調圖像的分類問題,對半色調圖像的特征建模和分類方法進行了深入研究,提出對傳統的協方差矩陣進行改進,并用黎曼流形上的K最近鄰方法對提取出的特征矩陣進行分類。通過比較分類精度來驗證提出方法的有效性。實驗證明,將傳統的協方差矩陣與提出方法進行eave和v比較,可知提出方法在K=23時,eave最低,即分類效果最好;在K=27時,v最小,即分類器性能最穩定,所以在選擇K值時應視需求而定。
[1]文志強,胡永祥,朱文球.基于統計量模板的半色調圖像特征提取與分類[J].計算機科學,2013,40(12):94-112.
[2]LIU Y F,GUO J M.New class tiling design for dot-diffused halftoning[J].IEEE Trans.on Image Process,2013,2(3):1199-1208.
[3]STEVENSON R.Inverse halftoning via MAP estimation[J]. IEEE Trans.on Image Processing,1997,6(4):574-583.
[4]MESE M,VAIDYANATHAN P P.Recent advances in digital halftoning and inverse halftoning methods[J].IEEE Trans. on Ciruits and Systems:Fundamental Theory and Applications,2002,49(6):790-805.
[5]LIU Y F,GUO J M,LEE J D.Inverse halftoning based on the Bayesian theorem[J].IEEE Trans.on Image Process,2011,20(4):1077-1084.
[6]文志強,胡永祥,朱文球.黎曼流形上半調圖像的協方差建模與貝葉斯分類方法[J].模式識別與人工智能,2013,26(11):993-1003.
[7]CHANG P C,YU C S.Neural net classification and LMS reconstruction to halftone images[C].Proc.of the SPIE Visual Communications and Image Processing,San Jose,USA,1998:592-602.
[8]WenZhiqiang,HuYongxiang,ZhuWenqiu.Anovel classification methodofhalftoneimageviastatisticsmatrices[J].IEEE Trans.on Image Process,2014,23(11):4724-4736.
[9]GUOJM,LIUYF,CHANGJY,etal.Efficient halftoning based on multiple look-up tables[J].IEEE Trans. on Image Process,2013,22(11):4522-4531.
[10]MESE M,VAIDYANATHAN P P.Recent advances in digital halftoning and inverse halftoning methods[J].Circuits andSystemsI:FundamentalTheoryandApplications,IEEE Transactions on,2002,49(6):790-805.
[11]ULICHNEY R.Digital halftoning and the physical reconstruction function[C].Ph.D Dissertation.Cambridge,USA:Massachusetts Institute of Technology,1986.
[12]KNUTH D E.Digital halftones by dot diffusion[J].ACM Trans.on Graphics,1987,6(4):245-273.
[13]MESE M,VAIDYANATHAN P P.Optimized halftoning using dot diffusion and methods for inverse halftoning[J]. IEEE Trans.on Images Process,2000,9(4):691-709.
[14]WU Y,CHENG J,WANG J,et al.Real-time probabilistic covariance tracking with efficient model update[J].IEEE Trans.on Image Process,2012,21(5):2824-2837.
[15]PORIKLI F,TUZEL O,MEER P.Covariance tracking using model update based on lie algebra[C].Computer Vision andPatternRecognition,2006IEEEComputerSociety Conference on.IEEE,2006:728-735.
[16]WenZhiqiang,HuYongxiang,ZhuWenqiu.Bayesian classification of halftone image based on region covariance[J]. Intelligent System Design and EngineeringApplications,2013(3):398-401.
Study on halftone image classification based on the improved covariance matrix
Zhong Zhiyan,Wen Zhiqiang,Ye Degang
(School of Computer and Communication,Hunan University of Technology,Zhuzhou 412007,China)
For the characteristic of halftone image classification that only has two values 0 and 1,this paper proposes an improved covariance matrix classification method based on halftone image.According to the covariance matrix in the realization of a halftone image classification does not reflect the less number and its local and global information on the characteristics,the underlying features of the covariance matrix is improved.Local features of samples and kernel density estimation method are used to achieve Bayesian classification strategy Riemannian manifolds.Experimental study of low-level features of the covariance matrix of the covariance matrix of features with traditional extraction methods to classify performance comparison.Experimental results show that the traditional covariance matrix comparing the halftone image classification and improved covariance matrix extracted feature less in the category average misclassification rate.
halftone image;covariance matrix;Riemannian manifold;the nearest neighbor classifier
TP391
A
1674-7720(2015)19-0054-04
2015-07-01)
鐘智彥(1990-),女,在讀碩士研究生,主要研究方向:圖像處理。
鐘智彥,文志強,葉德剛.基于改進協方差矩陣的半色調圖像分類研究[J].微型機與應用,2015,34(19):54-57.
湖南省研究生科研創新項目(CX2015B566)
文志強(1973-),男,教授,主要研究方向:圖像處理。
葉德剛(1992-),男,在讀碩士研究生,主要研究方向:圖像處理。