董大明
(山西交通職業技術學院,太原 030031)
基于計算機視覺的動態障礙物檢測算法利用攝取的車前視頻圖像在復雜背景下檢測動態障礙物,從而估計出潛在的危險,具有重要應用價值,也是目標檢測與跟蹤領域的重點和難點,其背景的復雜多樣性和攝像機的隨車體運動增加了檢測算法的難度,也對檢測算法的魯棒性和實時性提出了很高的要求。
動態障礙物檢測主要采用背景模型法、運動場法和幀間差分法等。與背景差分法對背景模型的依賴和光流法的計算高復雜度相比,相鄰幀間差分法用連續的二幀或者三幀圖像逐像素差分消除背景影響,但其需要連續的相鄰幀圖像背景是相對靜止的,為此,當攝像機隨車運動時,須先進行相鄰幀間圖像的配準,即背景全局運動的補償,文獻[1]從理論上分析了全局背景補償的參數估計值直接決定著幀間背景的配準精度,進而影響最后的目標檢測效果。
李強等人[2]采用圖像灰度編碼方法實現快速匹配;施家棟等人[3]基于塊匹配減少計算量,但當攝像機有非線性運動時,準確性受到影響。朱志文等人[4]采用金字塔和分塊策略以及匹配過程的并行化來提升SIFT算子匹配的精度和效率,但受到主機CPU核數的限制,加速比的提升有限;閘旋[5]采用分塊策略和GPGPU加速改進SIFT算子的計算效率實現大面陣影響的快速匹配;姚國標[6]利用MSER和Harris-Affine算法獲取初始匹配,再使用最小二乘自適應迭代匹配,但匹配策略不夠理想的問題,所以難以保證匹配效果。肖雄武[7]等人提出具有仿射不變性快速匹配方法,通過估算影像的相機軸定向參數計算出初始仿射矩陣,對影像進行糾正,然后進行SIFT匹配,匹配點對較為密集、均勻、且效率較高。Mortensen[8]等人結合全局信息的SIFT特征描述符,降低了由于局部信息相似造成的誤匹配率,但計算量較大,而且不具有尺度不變性。
結合前人的研究成果,文中在幀間差分法基礎上,提出基于改進SIFT算子背景補償和改進假設檢驗方法的目標檢測方法,算法通過影像金字塔和動態幀間特征點位置估計改進SIFT算法,提高參數估計的實時性,通過改進假設檢驗方法提高動態目標的檢測準確性,實驗驗證了算法的有效性。
SIFT[9-10]特征點對圖像的旋轉、尺度縮放以及光照變化具有較好的穩定性,對目標的運動、遮擋、噪聲等因素也有很好的魯棒性[11],但其描述符維數和配準策略使得算法的匹配時間長,錯匹配較多,實時性和穩定性不滿足要求[12]。
為此,本節采用多分辨率影像金字塔和圖像分塊策略使得算法可以根據行車環境的復雜性選擇合適的分辨率,以減少特征點數并保持點數穩定,其次采用相鄰幀特征點位置估計對配準策略進行改進,提高算子對行車背景適應性算法的配準精度,滿足算法的實時性要求。
文中對圖像五層多分辨率圖像,首先對第一層低分辨率圖像進行分塊并提取SIFT特征點,當低分辨率圖層塊中的特征點數較少未達到預設閾值時,則將高一層分辨率圖像對應塊用于特征點提取和配準,這樣提取特征點,一方面通過控制每個塊內特征點數使特征點分布于整幅圖像,避免了特征點密集對全局背景補償參數整體產生影響,另一方面在處理不同復雜度背景時,可以提取相對穩定的特征點數,從而確保穩定的算法運行效率。
文中根據文獻[13]方法,采用如圖1所示的鄰域窗口來計算特征點描述符,以中央特征點為中心,每兩個像素的寬度范圍為一層,建立四層鄰域。
以45°為間隔均分空間,累加鄰域內8個方向范圍內的梯度值,則特征點描述向量為4×8=32維,并按照區域位置對向量排序。像素累加時先灰度歸一化以減少光照影響:
則最終計算得到的32維描述符向量為:
Fi兼顧向量隆維和反映鄰域像素的距離貢獻特性,因而對特征點的描述更準確。
視頻圖像的相鄰幀間時間間隔較短,因而,當圖像生成影像金字塔時,其低分辨率圖像的配準特征點之間變化并不大,基于此利用當前幀頂層圖像的特征點位置作為下一幀配準特征點的預測值,并在其領域內搜索配準特征點。然后以這些配準特征點計算全局背景補償參數的粗值,再以粗值進一步計算參數的精確值,完成圖像精確配準。
文中采用仿射參數模型計算補償參數,其計算相對簡單,對攝像機運動較小情況較適合,設特征點及其配準點之間的仿射變換關系為
其中,γ 為縮放因子,θ為旋轉角,(c,d)為平移量。利用頂層配準特征點對,根據式(3)建立超定方程組,可以求解攝像機的參數。
利用低分辨率的頂層圖像特征點進行位置估計,然后在估計位置的鄰域內對特征點進行配準,從而實現頂層圖像特征點的快速配準,并計算式(3)的參數值作為粗值,然后利用式(3)粗值進一步對所有特征點進行位置估計和配準,計算式(3)的參數的精確值,其配準過程如下:
步驟1 將相鄰幀圖像分為矩形小塊,塊間不重疊,計算相鄰兩幀圖像SIFT特征點及其描述符,為減少特征點分布不均的影響,僅對每個塊內的一定數量特征點進行配準。
步驟4 當由于估計位置的鄰域交疊等原因,使得配準過程出現多對一的情況時,采用式(5)的互相關系數進行重新配準,取相關系數最大的特征點。
其中,x(n),y(n)為待配準描述符。分塊策略和位置估計的配準過程,減少了特征點配準的搜索范圍,提高了配準速度,并通過位置鄰域約束,避免兩個位置相差較大的特征點誤配準,同時使得特征點對在圖像中分布較均勻。
運用特征點進行運動補償時,存在誤匹配特征點,即外點。文中采用RANSAC[14-15]的方法去除誤匹配點,再利用最小二乘法求解出較更為準確的參數值。
背景精確匹配后,動態背景下運動目標的檢測可近似為攝影機固定下連續圖像序列的動目標檢測,文中采用三幀間差分的方法消除背景,并通過假設檢驗及密集度檢測的方法消除背景中的干擾噪聲點以確定動目標區域,最后通過邊緣檢測與目標區域相“與”實現動目標的最終檢測。
三幀差分法能突出動目標的位置和輪廓信息,但由于攝影機隨車抖動,光線及背景紋理變化等影響,差分后的背景圖像仍存在噪聲像素干擾,為此對差分圖像進行形態學處理后,采用假設檢驗及密集度檢測方法消除背景中的干擾噪聲點以確定動目標區域。
幀差后的圖像噪聲灰度im服從的高斯正態分布[16],取H0表示無運動目標區域的背景噪聲,而備擇假設H1則表示運動目標區域,根據3σ法則,當像素灰度在H0假設下時,其位于區間[-3σ,3σ]的概率小于 3‰,因此,以 c·3σ 為閾值,則有如下判斷
其中,方差σ按下式計算
式中,Sk為第k幀幀差圖像中無運動目標的背景區域,其選擇對干擾像素的剔除影響較大,dm為Sk中像素灰度值,N為Sk中的像素數。M表示取連續M幀圖像的平均值。
由于在采集的行車圖像中,目標出現位置的概率相等,因而,固定選擇圖像中動目標出現概率較低的某些固定區域作為Sk[18]并不準確,為此結合圖像配準過程,文中采用配準特征點對作為種子點,以其領域組成背景區Sk,計算σ。由于配準特征點對多分布在背景區域,因而以配準點鄰域并集作為Sk可以較準確地估計σ2。
運動目標區域中既有目標也包含部分的背景區域,為此,文中采用邊緣檢測與目標區域相“與”的方法精確確定目標最終區域。
首先對單幀圖像進行邊緣檢測,得到既有運動目標的邊緣也有背景物體的邊緣圖像,邊緣像素值為1,非邊緣像素值為0;然后將運動目標區域像素值設置為1,非運動目標區域像素值設置為0;將兩圖像對應像素相乘,則目標邊緣被保留。通過一定的形態學運算,對相乘后的結果圖像進行連接填充,則得到完整的運動目標。
為了驗證算法的有效性,在NVIDIA的Jetson TX2嵌入式智能平臺(6核Tegra Parker處理器、256個CUDA、8GB LPDDR4內存)上利用OpenCV3.2庫和Python進行實驗,實驗中,特征點配準圖像分塊大小為45個像素寬度,假設檢驗閾值c=1.1,M=10,窗口大小為5個像素。
使用3種動態目標檢測方法進行對比實驗,方法1為傳統的SIFT方法;方法2采用本文改進SIFT方法,但僅使用文獻[18]中背景噪聲干擾消除方法,文獻[18]中計算σ時Sk取固定區域;方法3為本文方法。如圖2所示,為簡單背景和復雜背景下動態目標檢測結果,圖中紅色標記的為文中算法檢測目標區域,綠色標記的為方法1檢測目標區域。可以看出,文中算法盡可能檢測到運動目標的完整區域,消除背景干擾的影響,這主要是因為文中算法采用圖像分塊的方法,使得特征點分布較均勻,避免特征點集中對匹配參數整體造成偏差。從第二幅圖檢測結果看,當目標位于圖像邊緣位置時,文中方法則通過準確計算Sk區域,避免邊緣位置目標漏檢情況。從全部實驗可以看出,在不同背景和目標分布情況下,本文算法都取得較好的動態目標檢測結果。
為測試算法的運行效率,仍取簡單背景和復雜背景兩組序列圖像(降分辨率為1 024×768),實驗時對每幅圖像檢測結果取50次運算平均值,3種算法實驗結果如表1所示。

表1 對比實驗目標檢測結果
從表中特征點配準對數可以看出,本文方法通過影像金字塔對分辨率控制和圖像分塊策略對配準對數的約束,在不同背景下,算法取得的特征點數目和點對相對較穩定,從而確保算法運算耗時較為穩定,保證算法取得魯棒的運行效率;同時配信點對數控制及相鄰幀待配點位置估計又極大減少了算法的運行時間。從實驗結果看,在25幀/s的圖像采集幀率下,算法滿足行車狀態實時檢測動目標的速率要求。
為解決行車輔助駕駛系統動態目標檢測時面臨的復雜多變背景和系統的實時性要求,提出一種基于改進SIFT算子和改進三幀差分方法的動態目標實時檢測算法,算法通過圖像多分辨率控制和分塊約束,約束配準點對數及分布,提高了全局背景補償參數的估計速度和精度;通過改進背景區域選擇方式,提高動態障礙物區域檢測準確性,進而借助密集判斷和動目標區域與邊緣檢測相“與”實現動態目標的快速高效檢測。對比實驗結果驗證算法的有效性,滿足系統對算法實時性要求。
參考文獻:
[1]游安清,程義民.基于背景運動補償的紅外運動分析[J].強激光與粒子束,2003,15(5):431-434.
[2]李強,張鈸.一種基于圖像灰度的快速匹配算法[J].軟件學報,2006,17(2):216-222.
[3]施家棟,王建中.動態場景中運動目標檢測與跟蹤[J].北京理工大學學報,2009,29(10):858-891.
[4]朱志文,沈占鋒,駱劍承.改進SIFT點特征的并行遙感影像配準[J].遙感學報,2011,15(5):1024-1039.
[5]閘旋,王慧,程挺,等.一種基于分塊策略的SIFT特征快速提取與匹配方法[J].測繪科學技術學報,2014,31(5):505-509.
[6]姚國標,鄧喀中,艾海濱,等.傾斜立體影像自動準稠密匹配與三給重建算法[J].武漢大學學報(信息科學版),2014,39(7):843-849.
[7]肖雄武,郭丙軒,李德仁,等.一種具有仿射不變性的傾斜影像快速匹配方法 [J].測繪學報,2015,44(4):414-421.
[8]MORTENSEN E N,DENG H L,SHAPIRO L.A SIFT descriptor with global context[C]//Proc.Of CVPR'05.San Diego,California,USA:IEEE Press,2005.
[9]LOWE D G.Object recognition from local scale-invariant features [C]//IEEE Proceedings of the International Conference on Computer Vision,1999.
[10]LOWE D G.Distinctive image features from scale-invariant key points [J].The International Journal of Computer Vision,2004,60(2):91-110.
[11]MIKOLAJCZYK K,SCHMID C.A performance evaluation of local descriptors [J].IEEE Trans.Pattern Anal.Mach.Intell.,2005(13):1615-1630.
[12]KUMAR P,HENIKOFF S.Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm [J].Nature Protocols,2009,4(7):1073-1081.
[13]劉佳,傅衛平,王雯,等.基于改進SIFT算法的圖像匹配[J].儀器儀表學報,2013,34(5):1107-1112.
[14]曲天偉,安波,陳桂蘭.改進的RANSAC算法在圖像配準中的應用[J].計算機應用,2010,30(7):1849-1851.
[15]郭紅玉,王鑒.一種基于RANSAC基本矩陣估計的圖像匹配方法[J].紅外,2008,29(2):5-8.
[16]賴作鎂,王敬儒,張啟衡.背景運動補償和假設檢驗的目標檢測算法[J].光學精密工程,2007,15(1):112-116.
[17]GAO T,LI G,LIAN S,et al.Tracking video objects with deature points-based particle filtering [J].Multimedia Tools Applications,2012,58(1):1-21.
[18]梅躍松,于劍橋,陳曦.移動背景下的運動目標跟蹤[J].紅外與激光工程,2011,40(4):757-761.