許文龍,朱加雷,王 飛,陳國華
(1.北京化工大學機電工程學院,北京 100029);2.北京石油化工學院能源工程先進連接技術北京市工程研究中心,北京 102600);3.中國石油長慶石化公司,陜西咸陽 712000)
目標跟蹤一直是機器人視覺伺服控制的研究任務和熱點,不斷發展的快速而穩定的跟蹤算法[1]促進了機器人技術的工程應用與普及。早期使用的背景差分法和幀間差法對光照、背景擾動等情況魯棒性差,一般只用于靜態背景下的目標跟蹤。著名的光流法抗干擾性強,但其采用迭代方法計算光流場比較耗時,且遵循的灰度守恒假設限制了使用范圍。基于顏色直方圖的均值漂移法(Mean-shift)采用核函數建模,對目標變形、遮擋和旋轉等不敏感,但直方圖對目標特征描述能力較弱,跟蹤性能在目標和背景顏色相似時會大大折扣,該算法的變種Camshift[2]同樣存在這些固有的缺陷。近年來圖像局部特征算子SIFT[3]和SURF[4]因其良好的尺度不變性常用于目標的特征跟蹤與匹配,但算子本身計算復雜度偏高。文獻[5]則利用目標主動輪廓進行某種相關準則運算以實現跟蹤的目的。學者們后來發現在跟蹤的過程中引入學習和預測機制[6],主要包括分類器學習(貝葉斯分類器、決策樹、Boosting 等)和預測模型(卡爾曼濾波、拓展卡爾曼濾波、隱馬爾科夫模型、粒子濾波等)等數學工具,不僅提高了跟蹤的性能,還能進一步實現目標的檢測,但普遍存在的問題是需要學習大量樣本才能發揮功能的分類器常常面臨維數災難,而濾波器模型參數無法通過先驗知識獲得。
針對分類器學習常常面臨高維數據的問題,本文借助稀疏表示理論[7]對目標多尺度Harr特征[8]進行數據降維,采用高斯分布對稀疏后的Harr 特征值分布進行近似,并構建樸素貝葉斯分類器[9]進行目標正負樣本的學習和更新,選擇具有最大分類器響應值的狀態向量作為目標的當前狀態,實現了對運動目標的快速而有效的跟蹤。實驗結果表明該方法適用于視覺機器人運動目標跟蹤,在提高實時性的同時能保持一定的魯棒性。

將長度為m的原始信號xm×1,在某一個矩陣Φ∈Rn×m(n ?m)做線性隨機投影得到一個長度為n 的輸出樣本yn×1,在滿足某種條件時由yn×1完全可以恢復出原始信號xm×1,而稀疏表示理論的核心在于構建合適的變換基Φ(或投影矩陣)。
典型的投影矩陣是隨機高斯矩陣R ∈Rn×m,rij~N(0,1),但是當m較大的時候R的致密性會帶來較重的內存存儲與計算負擔,因此本文參考文獻[10]對R 的元素進行重新定義來構建稀疏測量矩陣,如下所示:

使用該矩陣進行投影能保存原始目標特征空間分布信息,得到和傳統的隨機高斯矩陣一樣的準確度,且該矩陣的構建僅僅需要一個均勻隨機數發生器。特別地,s=3時投影矩陣R自身也變得非常稀疏(2/3 的元素全為0),能有效減少2/3 的計算負荷。本文利用均勻隨機產生的s ∈{2,3,4 }構建測量矩陣R,每一行只有2 ~4項元素需要計算,因此一次投影的計算復雜度很低。此外,只需要存儲R 中的非零項,這大大降低了內存負擔。
對于給定的大小為w×h 的目標,利用不同尺度的隨機矩形濾波器hi,j(x,y)對其做卷積運算,濾波器的構造如下所示:


稀疏降維后的特征向量v中的每個元素vi都是不同尺度下Harr 特征的線性表示,保留著原始目標的圖像特征信息,這樣可以大膽的對壓縮后的特征vi進行分類器快速學習而不用擔心維數的問題。

其中p(y=1)=p(y=0),用來區別vi是否隸屬于目標。
英國環保署R&D128方法是由英格蘭和威爾士基于評價歐洲委員會棲息地指令中2000個自然廠址的輻射效應開發的,由海洋、淡水和陸生環境的一系列微軟Excel電子數據表模型組成。該方法模型可采用默認的一般參數或者廠址特定數據進行計算。計算非人類物種劑量的基礎與ERICA模型類似(由參考生物的尺寸、放射性核素的攝入量和環境外照射決定),但考慮的參考生物和核素種類較少。特別是,R&D128方法包含惰性氣體對非人類物種的影響評價,這在ERICA模型中沒有包括。R&D128方法也包含ERICA模型默認的參考生物中未予考慮的英國重要的保護性生物。
實際上高維隨機向量的隨機投影總是遵循高斯分布,因此采用高斯分布對稀疏后的特征值分布進行近似,于是上式中的條件分布遵循高斯分布如下所示:

其中方差和均值遵循以下的跟新公式:


作為一種自上而下的跟蹤方法,本文采用經典的貝葉斯跟蹤框架并引入時下流行的正負樣本學習機制,具體流程如下:

(2)分別提取多尺度的Harr 特征向量x 并在投影矩陣R上投影得到一系列低維向量v;

(4)得到Iz后用(1)同樣的方法采集兩種待學習樣本,一種離目標比較近,作為正樣本,一種較遠,作為負樣本,即:

(5)利用(2)的方法得到正負樣本的低維特征,送入貝葉斯分類器學習,并用式(6)來更新分類器參數;
(6)第(t+1)幀里同(1)循環,實現運動目標跟蹤。
分別利用SIFT-KLT[3]、Camshift[2]、融合多特征的粒子濾波法PF[11]和本文方法針對靜態背景下的身份證正面和監控視頻中的行人進行跟蹤定位,測試平臺為雙核計算機(Intel T4400+1G RAM)、微軟HD3000 攝像頭以及計算機視覺庫Opencv2.3.1,計算平均處理時間得到圖像幀率(fps)如表1所示。

表1 處理時間對比
對比結果可知本文方法具有良好的實時性,究其原因是本方法將稀疏理論引入經典的貝葉斯跟蹤中,稀疏降維后的樣本特征學習和更新效率得到明顯的提高,此外,稀疏后的特征向量依然保留原始圖像特征信息,因此本文方法在提高實時性的同時不會引起跟蹤性能的降低。
針對目標旋轉、模糊以及光照變化等進行了PC-Webcam 平臺上的跟蹤性能試驗,效果如圖1所示,可知本文跟蹤算法針對光照變化和旋轉具有較強的魯棒性,針對目標模糊具有一定的魯棒性。由于本文使用的Harr 特征是一種基于灰度計算的矩形特征,常用于人臉檢測和識別,對目標旋轉的敏感度很小,而樸素貝葉斯分類器對正負樣本強大的學習功能能夠不斷更新目標外觀模型,從而提高了對光照變化的魯棒性。但是參數r、α 、β 、λ 的取值大小直接作用于稀疏后的Harr 特征值高斯分布特性,取值越大分布相對越集中,檢測模糊性越小,這會給目標模糊檢測帶來一定的影響。

圖1 跟蹤效果(r=5,α=10,β=50,λ=0.85)
在單目視覺伺服機器人MOTOMAN-UP6上進行目標跟蹤定位測試,圖2 為機器人結構圖,將目標物塊沿著正方形工作臺面上的箭頭方向移動,手眼一體(eye-in-hand)機器人捕獲運動目標視覺信息用于伺服反饋,驅動手臂到達跟蹤目標中心位置。為了便于比較,取實際移動直線的6 等分點作為參考,綜合物體實際移動直線、視覺圖像處理理論計算得到的目標中心位置連線以及手臂移動位置連接線繪成圖3。

圖2 機器人系統結構(上)和實物(下)

圖3 軌跡比較圖(坐標軸單位與工作平臺一致為50 mm)
可知,圖像處理得到跟蹤目標中心點軌跡和實際情況吻合度較好,說明本文目標跟蹤算法滿足機器人對運動目標的定位要求,而機器人手臂移動軌跡與實際路徑存在一些差距,推測原因是PC端圖像處理和機器人關節控制的不同步直接導致圖像雅各布矩陣的傳遞產生滯后。
本文的創新之處是在經典貝葉斯跟蹤框架的基礎上借助稀疏表示理論對目標多尺度Harr 特征進行有效降維,有效提高了貝葉斯分類器的樣本學習和更新效率。由于稀疏后的特征保留了目標圖像特征信息,因此本文方法在提高運動目標跟蹤實時性的同時依然表現出良好的魯棒性,試驗結果表明本文方法適用于視覺伺服機器人的運動目標跟蹤與定位。
[1]侯志強,韓崇昭.視覺跟蹤技術綜述[J].自動化學報,2006(04):603-617.
[2]郭世龍,李文鋒,李波.基于Camshift 算法的移動機器人視覺跟蹤系統[J].華中科技大學學報:自然科學版,2008(S1):156-158+166.
[3]劉玉,王敬東,李鵬.一種基于sift 和klt 相結合的特征點跟蹤方法研究[J].宇航學報,2011,32(07):1618-1625.
[4]彭欣,劉富強,宋華軍.基于surf 目標跟蹤算法研究[J].長春理工大學學報:自然科學版,2011,34(02):138-141+153.
[5]叢奎榮,韓杰,常發亮.視覺機器人貨物輪廓提取與定位[J].山東大學學報:工學版,2010(01):15-18.
[6]CHAUMETTE F,HUTCHINSON S.Visual servo control.II.Advanced approaches [Tutorial][J].Robotics& Automation Magazine,IEEE,2007,14(1):109-118.
[7]鄧承志.圖像稀疏表示理論及其應用研究[D].武漢:華中科技大學,2008.
[8]Grabner,H.,M.Grabner.Real-time tracking via on-line boosting [A].Proc.BMVC [C].British Machine Vision Association,2006.
[9]蔣良孝.樸素貝葉斯分類器及其改進算法研究[D].北京:中國地質大學,2009.
[10]LIU L,FIEGUTH P.Texture classification from random features[J].Pattern Analysis and Machine Intelligence,2012,34(3):574-86.
[11]趙璇,何波,吉德志.基于粒子濾波的機器人定位及動態目標跟蹤[J].系統仿真學報,2008,20(24):6490-6493,6497.