張春艷
(沈陽理工大學信息科學與工程學院,遼寧 沈陽 110159)
通過對番茄葉片圖像進行顏色特征的提取,將提取到的數據輸入SVM算法,通過訓練求得可以對產生病害的番茄葉片圖像進行識別的模型。
直方圖作為一種特征描述,具有簡單有效的特點,用其來統計特性非常方便,因此,其被廣泛應用于計算機視覺。在圖像處理領域,對于圖像直方圖的特征提取十分方便,其對圖像無任何要求;關于圖像的多模態的體現,直方圖也有非常良好的表現,并且對于圖像的任意指定區域的統計特征也能很好的表示;直方圖還對旋轉不敏感,具有旋轉不變性。因此衍生出各種各樣的直方圖,如顏色直方圖、亮度直方圖、局部二值模式直方圖、HOG等。對于圖像處理領域,顏色直方圖應用最為廣泛,但是傳統的顏色直方圖容易受光照變化影響,并且對于圖像內部的具體像素點的分布情況不敏感,對于像素位置不敏感。
求圖像的顏色矩特征是通過對線性代數的中矩的理解,同樣將圖像中的顏色分布抽象提取,用其矩表示出來。分為平均值Average、方差Variance和偏斜度Skewness,并將其分別起名為顏色一階矩、二階矩以及顏色三階矩,通過這些其矩來對圖像的空間信息進行表示。使用顏色矩的概念來表示圖像與顏色直方圖是有差異的,顏色直方圖需要顏色量化的操作,而顏色矩不需要顏色量化。關于圖像的像素點,通常可以分為3個顏色通道進行表述,而對于顏色矩每個通道可以抽象出3個分量來進行描述,因此一共可以得到9個分量的信息。因為顏色矩得到的特征維數相對少一些,所以使用顏色矩時一般還需要提取一些圖像其他的特征,幫助更好地對圖像進行分析處理。3個低階矩的數學模型計算公式進行如下:
(1)
(2)
(3)
其中,pij在以上公式中的下標j代表的是第j個像素點,i代表的是像素點的第i個分量,N代表的是總的像素數是N。
圖像的顏色變化可以通過取其抽象出的顏色矩進行表示,如上所述,可以得到一個9維的顏色直方圖量化后的向量,以下公式是將顏色分量分別用Y,U,V來表示:
Fcolor=[μY,σY,sY,μU,σU,sU,μV,σV,sV]
(4)
顏色特征與局部特征對應,可以很好地將圖像的整體特征描述出來。而顏色特征的本質其實是圖像本身像素點所表現出來的特征,但其只是一種整體上的或者說是一種表面上的特征,而對于空間以及更加細致具體的特征無法顯示,因此對于圖像的局部特征并不能以這個來體現。鑒于此,當只將顏色信息作為一種查詢圖像的標準時,當數據量小時,可能得到所期望的結果,但是對于數據量很大的時候,常會將許多不需要的圖像也檢索出來。總的來說,利用顏色直方圖的原理簡單并且容易理解分析,因此應用很多,雖然其不能很好地表示出圖像的空間信息以及圖像的局部特性,但對于圖像本身的變化如平移和旋轉等不敏感,抗這些因素的干擾性較強。
SVM[4,5]的原理是通過核函數將特征空間找到,找到之后將特征空間進行分析得到軟間隔分離超平面,再用正則化因子對其進行優化得到樣本的二分類操作。使用核函數來將點積運算表示出來并且得到最優的分類面:
(5)
式中,ai代表Lagrange乘子,ai≥0;xi,yi代表兩類中的支持向量SV;b*代表根據訓練樣本確定的閾值;K(x,xi)代表核函數。
將圖像在邊界方向上的形狀特征進行提取出來,在此基礎上再進行顏色直方圖的分提取和分析。該方法簡單有效,在增加了準確性的基礎上保留了對圖像自身的旋轉平移不敏感的特點,另外其對于圖像的縮放也不敏感。為了將圖像檢索的準確性進行提高,還將反饋機制結合起來,可以動態地調整權值系數,并將相應的算法進行抽象出來,通過訓練可以將不同數據庫的最佳權值系數求出來進行圖像分析與識別研究。通過實驗發現,此方法具有很好的識別效果,準確性也很高。通過將其與邊緣檢測結合分析,將邊緣的信息進行提取抽象,將小領域內的信息抽象并唯一地確定位置,再將求得的各個小領域內的信息點聯合起來,進行總體的抽象與分析,將各個點進行連線,取得連線中點的信息,求得一個能體現圖像特征的邊緣信息的特征模型,這個過程通常稱為擬合過程。在這個過程中,連線之間會產生一定的角度,從而引發一些多余的噪聲,因此分析時需要注意排除噪聲的干擾,提高準確性。
邊緣方向直方圖是對圖像輪廓特征的一種描述方法,通過Canny邊緣檢測算子對病變番茄圖像的輪廓特征進行提取,并計算出每個邊緣像素點的方向,對每個方向上的邊緣點數目進行統計進而形成邊緣方向直方圖。

圖1 邊界方向直方圖
目前基于圖像分類使用較為廣泛的模式識別算法包括歐式距離法、BP神經網絡、支持向量機。針對本實驗樣本數量有限的特點,最終選擇SVM對病害番茄圖像進行識別。
SVM(Support Vector Machine)是通過某種事先選擇的映射(核函數)將輸入向量映射到一個高維特征空間,然后在這個空間中尋找最優分類超平面。
根據SVM軟件包提取符合條件的向量集;對數據進行篩選;考慮選用適當的核函數,主要包括上述的4種核函數;應用交叉驗證方法獲取最優參數C和g,并使用這2個參數處理全部訓練集來得到SVM模型;用模型對樣本圖像進行測試,完成識別。
本實驗針對樣本顏色特征、邊緣方向特征、混合特征進行識別。將顏色特征與邊界方向直方圖參數特征合成為一個向量。每種特征的識別準確率如表1。

表1 識別準確率匯總
本研究對病害番茄圖像的顏色特征和邊緣特征進行提取,通過SVM對特征進行分類完成對病害番茄圖像的識別,在單一顏色特征識別的基礎上對顏色特征與邊界方向特征進行混合識別,并且識別的準確率好于基于單一特征的識別。