鄒小林
(肇慶學院數學與統計學院,廣東肇慶 526061)
1993年,我國水果產量躍居世界第一。2010年,我國水果總產量約占世界總產量的30%[1]。然而我國水果在售價只有國際平均售價一半的情況下,水果出口量卻不足產量的5%[1],原因是國內水果在采摘后,進行處理的技術偏低[2],沒有根據水果的形狀、大小、色澤等進行檢測和分類。因此銷售水果前,應對水果進行等級分揀。為了減少分揀過程中的工人工作時間和工人的經驗技術限制等,基于圖像處理[3]的計算機分揀技術是實現水果等級分類的有效方法。該方法的關鍵步驟是提取水果圖像中的目標。蔡健榮等分別采用色差分量、鄰差和、支持向量機、對數相似度約束等理論結合Otsu閾值算法分割水果圖像[4-10]。黃辰等采用改進的3層Canny邊緣檢測算法提取蘋果輪廓[11]。Deb等提出一種新的框架檢測并刪除圖像的陰影[12]。皇帝柑是由于特殊原因形成的一種柑橘品種,因被唐宋明清這些朝代列為朝廷貢品而得名[13]。關于柑橘的圖像分割與識別的研究主要如下:蔡建榮等采用色差分量結合Otsu閾值算法分割圖像,再對分割結果進行處理[4]。周志宇等利用Otsu方法計算canny算子的高低閾值,從而實現柑橘邊緣的自動檢測[14-15]。廉世彬等采用多項式函數對圖像的亮度進行轉換,再2次使用Otsu算法分割圖像獲得圖像的陰影區域[16]。本研究針對含有高光、陰影和葉片的皇帝柑圖像提出了融合去除陰影和高光的譜聚類閾值圖像分割算法。
光源照射到物體表面的光被反射到人眼時,物體上最亮的那個點稱為高光。當光線照射到非均勻物質表面時,一部分光反射到物體表面與空氣之間的界面上,稱為鏡面反射或高光。圖像的高光點表示具有最高亮度值的圖像區域。皇帝柑圖像的高光改變了皇帝柑的本色,須要去除皇帝柑圖像中的高光,作為圖像分割的預處理步驟之一。
Gòrny先把圖像從RGB(紅、綠、藍)顏色空間轉換為YUV(Y表示明亮度,U表示色度,V表示濃度)顏色空間,再對亮度通道Y進行歸一化、均衡化處理和多項式函數轉換[17]。廉世彬等提出的去除高光的算法步驟[16]具體為:
(1)將圖像讀入R、G、B3個通道。(2)將圖像從RGB顏色空間轉換為YUV顏色空間。(3)對亮度通道Y進行歸一化處理。(4)對Y進行直方圖均衡化處理。(5)對Y進行多項式轉換。
在光照無關圖中,一個物體表面的灰度值被認為是相同(或相似)的。根據該原理,只要找到最優投影方向,就可以消除圖像陰影。
研究結果顯示,在不同的光照條件下,一個物體表面的對數色度波段比近似在一條直線上,而不同物體表面之間的對數色度波段比近似平行[18]。根據該原理,提出去除陰影的算法步驟如下。
(1)根據公式(1)計算色度波段比向量:
(1)
其中:IR、IG、IB分別表示圖像I的3個波段向量,即IR=I(:,:,1),IG=I(:,:,2),IB=(:,:,3)。
(2)根據公式(2)計算對數色度波段比三維向量ρ:
ρm=ln(cm),m=R、G、B。
(2)
式中:ρm由ρR、ρG、ρB構成的三維向量。
(3)根據公式(3)計算二維的對數色度波段比:
χ=Uρ。
(3)

(4)計算最佳投影方向。根據公式(4)計算每個角度θ投影后的一維灰度圖像,再根據公式(5)計算每個一維灰度圖像的熵,熵最小的方向即為最佳投影方向θwpt。
Iθ=χ1cosθ+χ2sinθ,θ∈[0,180];
(4)
(5)
(5)根據公式(6)計算光照無關圖:
Iθwpt=χ1cosθwpt+χ2sinθwpt。
(6)
Ncut譜聚類算法[20]克服了K-means等聚類算法的缺點,對非凸分布的數據具有很好的分類能力,適合解決一些實際應用問題。
Ncut算法的步驟:
輸入:點集V=(v1,v2,…,vn),vi∈Rd,Rd為d維實數空間,k和σ為參數。
輸出:數據分成的k個類。
(1)根據定義的相似度函數,計算相似矩陣S=(sij)∈Rn×n。
(2)計算度矩陣D和拉普拉斯矩陣Lsym=I-D-1/2AD-1/2。
(3)求矩陣Lsym的k個最大特征值對應的特征向量u1,u2,…,uk,設U0=[u1,u2,…,uk],并對矩陣U0進行歸一化處理,得矩陣U。
(4)矩陣U的每行元素構成k維空間中的1個點,作為1個樣本,用K均值算法將這些樣本分為k類。
(5)U的第i行分在第j類,即數據點vi分在第j類。
本研究的基本思想分為2部分:第1部分是圖像預處理,去掉圖像中的高光和陰影,第2部分是圖像分割。本研究的圖像預處理分為先采用文獻[17]提供的算法去除高光,再采用文獻[18]提供的算法去除陰影。最后根據文獻[19]提出的Ncut譜聚類算法,提出基于Ncut的閾值圖像分割算法分割去除高光和陰影的皇帝柑圖像。
本研究的算法步驟如下:
(1)將圖像讀入R、G、B3個通道。
(2)根據公式(7)將RGB顏色空間轉換為YUV顏色空間:

(7)
(3)對亮度通道Y進行歸一化處理。
(4)對通道Y進行直方圖均衡化處理。
(5)根據公式(8)對通道Y進行多項式轉換,Y變換后的值仍用Y表示。
Y=1.54Y4-3.426Y3+1.773Y2+0.743 5Y+0.004 36E。
(8)
其中:E是元素全為1的矩陣。
(6)根據公式(9)將YUV顏色空間轉換為RGB顏色空間:

(9)
(7)根據公式(1)和公式(2)計算對數色度波段比三維向量ρ。
(8)根據公式(3)計算二維的對數色度波段比χ=[χ1χ2]T。
(9)根據公式(4)~公式(6)計算最佳投影方向和光照無關圖。
(10)定義去除高光和陰影的圖像直方圖為H=[h(i)](i=0,1,…,255),定義圖G的頂點集合為V={v(i)=[i,h(i)|i=0,1,…,255]},根據公式(10)計算圖G中連接2個頂點v(i)和v(j)的邊的權值,并獲得相似矩陣S=(sij)∈Rn×n。
s[v(i),v(j)]=exp{-min [h(i),h(j)]×(i-j)2/σ2}。
(10)
其中:σ2為參數。
(11)計算度矩陣D和拉普拉斯矩陣L=I-D-1/2AD-1/2。
(12)求L的k個最大特征值對應的特征向量u1,u2,…,uk,設U0=[u1,u2,…,uk],并對矩陣U0進行歸一化處理,得矩陣U。
(13)矩陣U的每行元素構成k維空間中的1個點,即作為一個樣本,用K均值算法將這些樣本分為k類。
(14)U的第i行分在第j類,即數據點vi分在第j類。
本研究采用分類誤差(ME)[21]、假陽性率(FPR)[22]和疊加系數(OI)[23]作為分割效果評價標準。
分類誤差[21]的定義如下:
(11)
假陽性率[22]的定義如下:
(12)
疊加系數[23]的定義如下:
(13)
式中:BO和FO分別表示人工分割圖像的背景和目標;BT和FT分別是根據算法分割圖像的背景與目標。
本試驗分割3幅帶葉片且成熟度不一樣的皇帝柑圖像,且有2幅圖像中含有2個皇帝柑。將本研究方法與文獻[23]和Matlab軟件中提供的Otsu算法作對比試驗。試驗都采用分類誤差[20]、假陽性率[21]和假陰性率[22]3個指標檢驗分割效果。
試驗的分割結果如圖1和表1~表3所示,其中圖1-a為原始的帶陰影和高光的皇帝柑圖像,其人工分割圖像見圖1-b;圖1-c是本研究算法分割的結果;圖1-d是文獻[23]算法分割的結果;圖1-e是Otsu分割的結果。表1的數據顯示,本研究算法的平均分類誤差是4.6%,而文獻[23]和Otsu算法的平均分類誤差分別為14.9%和16.8%。表2顯示,本研究算法的平均假陽性率是2.1%,而文獻[23]和Otsu算法的平均假陽性率分別為23.5%和26.2%。表3顯示,本研究算法的平均疊加系數是94.9%,而文獻[23]和Otsu算法的平均疊加系數分別為76.9%和 71.5%。試驗結果顯示,提出算法能夠很好地提取含有陰影、高光和葉片的皇帝柑圖像中的目標,說明提出算法具有很好的分割性能。


表3 圖像分類的疊加系數OI
針對含有高光、陰影和葉片的皇帝柑圖像在分割時,難以準確提取圖像中的目標這一問題,本研究引入了去高光和去陰影2種圖像預處理,有效消除了皇帝柑圖像中的高光、陰影,再采用譜聚類閾值圖像分割算法分割去除高光和陰影后的皇帝柑圖像,可以在含有高光、陰影和葉片的皇帝柑圖像中,很好地提取圖像中的目標。