陳 宇,黃仲洋,江露,鐘秋波
(東北林業大學信息與計算機工程學院,黑龍江哈爾濱150040;2.寧波工程學院,浙江寧波315000)
進入21世紀,機器人研究取得了重大進展。全自主仿人機器人是仿人機器人研究中非常熱門的一個領域,許多大學或研究機構都對其投入了巨大的精力。嵌入式視覺系統是全自主仿人機器人系統的基礎,它對機器人的總體性能起著決定性作用,機器人對目標的識別是建立在視覺系統基礎上的[1-2]。
果實顏色是果實非常直觀的重要特征,不同果實的顏色差別很大,這樣就能有效提取果實特征,從而對果實進行識別。過去工作主要依靠人工完成,耗時耗力并且效率低下,借助計算機提高了工作效率,并將此技術和類人機器人結合,大大提高了分析的準確性。
類人機器人自帶的攝像頭作為視覺,通過攝像頭獲取彩色圖像。傳統的彩色圖像分析是基于RGB色度空間的,但是RGB空間是顏色顯示空間,并不適合人的視覺特性,而HSV色度空間能很好地體現出人眼辨別顏色的特點,在HSV空間,圖像特征明顯,易于處理[3]。因此該研究采用HSV色度空間對圖像進行顏色提取。
將顏色作為果實特征后,結合高斯混合模型算法,對顏色進行辨識,從而達到對果實的辨識。高斯混合模型算法滿足收斂條件并且提高了識別的效率,試驗結果表明,該算法是有效的,與BP神經網絡、SVM支持向量機、決策樹的識別算法相比,基于高斯混合模型的果實識別算法獲得了較高的識別率,取得了很好的試驗效果。
1.1 顏色空間的選擇 要處理彩色圖像,首先要選取合適的顏色空間。顏色空間指的是某個三維顏色空間中的一個可見光子集。它包含某個顏色域的所有顏色。顏色空間的用途是在某個顏色域內方便地指定顏色。一般,圖像常采用RGB三元色彩色空間表示,但RGB三色空間中兩點間的歐氏距離與顏色距離不呈線性比例,換句話說,就是顏色受亮度的影響很大,RGB顏色空間不具有進行彩色圖像處理所要求的獨立性和均勻性指標。所謂獨立性是指顏色空間的3個分量互不影響,對于其中某個分量的處理不導致其他分量相對于人眼感覺發生變化。而均勻性是指對顏色空間中的每一個分量來說,相同的處理改變量在不同的取值處應引起相同的視覺變化。然而絕對滿足獨立性和均勻性的顏色空間是不存在的[4],只能根據實際情況,找到一種能在較大范圍內符合上述兩個條件的顏色空間。為更好地進行顏色辨識,通過試驗,該研究采用了HSV顏色空間。
1.2 HSV色度空間變換原理 攝像頭獲取的圖像一般為RGB圖像,因此先要將顏色空間從RGB轉換到HSV。如圖1,HSV 色彩空間是一個六棱錐體,0≤H≤360,0≤S≤1,0≤V≤1,對于 R、G、B∈[0,1],RGB 空間到 HSV 空間的映射過程如下:

果實識別算法有BP、貝葉斯、決策樹等,但高斯混合模型試驗得到了較好的效果,識別率較高。

圖1 HSV色彩空間
高斯混合模型是一種常用的描述混合密度函數分布的模型,矢量特征在概率空間的分布狀況通過若干個高斯概率密度函數的加權和進行描述。即每個高斯混合模型是由K個Gaussian分布構成,1個 Guassian是“Gomponent”,形成多個分類器,對Gomponent進行線性加和形成混合高斯模型的概率密度函數[5]:

式中,xi是 d 維矢量;θ=(μ1,μK,Σ1,Σk),為高斯混合分布參數;αk是加權的系數,代表選中每個Component的概率,需要滿足限制條件是 Component的高斯概率密度分布,如下:

式中,μk是均值;Σk是協方差矩陣。
GMM模型的各個分量是通過均值和方差表示的,GMM的分類過程是以均值為中心的橢圓體分布,方差決定它的幾何性質。使用高斯混合模型對流型樣本分類,首先對未知參數 K、αk、μk、Σk的值進行初始化,才能構造 GMM 模型,對概率密度函數建模。果實樣本分為5類:香蕉、西瓜、番茄、葡萄、蘋果。因此參數K=5,對于剩余3個參數的估計有多種方法,使用的比較頻繁的是EM算法。
EM算法也稱作期望最大算法,是對參數的最大似然估計,此算法主要應用在如下方面:①對不完整數據的估計;②假設缺失的數據存在,降低似然函數復雜度[6]。
EM算法的執行過程[7]如下。
首先,計算期望(Expectation),估計隱含變量。觀測數據確定,對完整似然函數的期望計算。

式中,θk-1是當前的參數估計值;θ是更新后的參數值。
然后,計算極大值,估計其他參數。求解θ,使 Q(θ,θk-1)得到極大值,即:

在高斯混合模型中,樣本數據由不完整數據構成,則加入隱含變量 Z={z1,z2,…,zN},zi=(zi1,zi2,…,zik)獨立分布于K類,隱含變量的概率分別為α1,…,αk,滿足如下:

算法執行過程中對數似然函數定義為:

式中,p(k|xi,θt-1)是K類分布的后驗概率:

使用梯度法求解條件極值,可得如下關系式:

即:


其中:

對 Q(θ,θt-1),求其關于 μk、Σk的導數,讓其為 0,可得均值重估公式:

方差重估公式:

迭代終止的條件就是迭代重估公式,直到滿足預先設定的條件。EM算法涉及的理論比較簡單和單一,其主要優點是簡單和穩定,每次迭代都能保證觀察數據對數似然是增大的。但EM算法也有其缺點,主要是收斂速度慢,尤其當輸入的數據維數過高或者規模過大時,將嚴重影響收斂速度。EM算法能找到局部最大點,但對于找全局最大點比較困難[8]。EM算法的初始化有嚴格的要求,對于不同的初始值,能夠使得結果有較大差異[9]。目前最有效的方法是將Kmeans算法與EM算法相結合,使用Kmeans算法來計算群聚中心點,當作EM參數中均值的初始輸入值。
Kmeans聚類是聚類算法中常用的算法[10]。該算法輸入參數K,將輸入特征矩陣劃分為K個聚類,相同聚類對象的相似度較高,反之較小。主要思想是:選取K個中心點聚類,對最靠近中心點的對象歸類,通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結果[11]。得到各個聚類的中心點之后,將其作為EM算法初始值。該算法使用的很廣泛,尤其是和EM算法相結合,先對初始數據進行粗略分類,再將得到的數據作為參數估計初始化的數據。將這兩種算法結合能提高EM算法收斂的速度和分類的正確率。
由于季節等試驗條件的原因,該試驗均為類人機器人對不同果實圖片的識別,見圖2。

圖2 類人機器人果實辨識試驗
圖3顯示了類人機器人識別的果實圖像樣本及HSV顏色直方圖。
該試驗每類果實收集樣本30個,共150個,其中隨機選取每類中20個作為訓練樣本,其余樣本作為測試樣本。該試驗總共測試數據為50組,果實識別效果如表1所示。

表1 試驗結果
該試驗設計了一個具有視覺的能夠識別果實的類人機器人系統,通過采集圖像,獲取目標信息,采用HSV顏色空間,結合高斯混合模型算法,通過訓練得到每類果實所對應的分類器模型參數,構造分類器,實現了類人機器人對果實準確高效的識別。

圖3 果實樣本圖片及HSV顏色直方圖
[1]張勇.足球機器人識別算法和決策仿真[D].長沙:湖南大學,2002.
[2]陳鳳東,洪炳,朱瑩.基于HIS顏色空間的多機器人識別研究[J].哈爾濱工業大學學報,2004,36(7):928-930.
[3]張全海,施鵬飛.基于HSV空間彩色圖像的邊緣提取方法[J].計算機仿真,2000,17(6):25-27.
[4]ZHARALIC R M,SHAPRO L G.Computer and robot vision[M].New-York:Addisiona-Wesely,1992:105-120.
[5]岳佳,王士同.高斯混合模型聚類中EM算法及初始化的研究[J].微計算機信息,2006,11(3):244-246.
[6]王鑫.基于高斯混合模型的聚類算法及其在圖像分割中的應用[D].太原:中北大學,2013.
[7]龐強,鄒濤,叢秋梅,等.基于高斯混合模型與主元分析的多模型切換方法[J].化工學報,2013(8):2938-3946.
[8]曹紅麗.混合高斯模型的混合EM算法研究及聚類應用[D].烏魯木齊:新疆大學,2010.
[9]焦賓,呂霞付,陳勇,等.一種改進的自適應高斯混合模型實時運動目標檢測算法[J].計算機應用研究,2013(11):3518-3520.
[10]JAMSHIDIAN M,JENNRICH R I.Conjugate gradient acceleration of the EM algorithm[J].Journal of the American Statistical Association,1993,88:221-228.
[11]CAO J,WU Z,WU J J,et al.Towards information-theoretic K-means clustering for image indexing[J].Signal Processing,2013,93(7):2026-2037.