陳世偉,楊小岡,張勝修,王雪梅
(火箭軍工程大學控制工程系,陜西 西安 710025)
基于自適應上下文信息的目標相對定位方法
陳世偉,楊小岡,張勝修,王雪梅
(火箭軍工程大學控制工程系,陜西西安 710025)
針對成像末制導中地面固定目標識別難度大的問題,基于最穩定極值(maximally stable external region,MSER)區域提出一種新的相對定位識別算法。提取基準圖中目標周圍具有尺度和仿射不變特性的MSER特征,根據權重指數自適應選取一定數量的MSER特征作為上下文地標。提取實時圖中的MSER特征,與上下文地標基于規則化互相關準則進行特征匹配,利用雙層匹配矯正策略減少誤匹配,得到匹配特征對。提取匹配特征對的中心點作為參考點求解基準圖與實時圖之間的空間映射關系,進而利用最小二乘擬合一次多項式計算實時圖中目標的位置坐標。實驗結果表明,針對復雜地面場景,該方法的最大相對定誤差不大于3個像素。基本滿足成像末制導對自動目標識別算法穩健性好、識別精度高、抗干擾能力強等要求。
上下文地標;相對定位;最穩定極值區域;目標識別
網址:www.sys-ele.com
目標自動識別是成像末制導過程中的一個技術難點,尤其是針對地面復雜背景下的目標識別,存在目標形態各異、背景遮擋,特征適應性差等諸多困難[1-2]。文獻[3]提出利用目標圖像的仿射梯度方向直方圖特征進行目標直接識別,針對簡單背景,該方法具備很好的旋轉不變性和錯切不變性。文獻[4]提出以目標的三維模型為基礎來制作匹配模板圖像,在一定信噪比的前提下,可實現目標的有效識別。以上這些算法都是利用目標自身的特征信息來進行識別,因此這些方法通常只適用于簡單背景下的高大、顯著目標,而對于背景復雜、距離遠、低矮、存在遮攔等情況下的目標則很難或者不能直接識別。針對這一問題,文獻[5]提出了改進的光電混合聯合變換相關器對遮攔目標進行探測和識別,雖然取得不錯的效果,但本質上仍然依賴目標自身的特征信息。文獻[6]提出一種上下文不變性的機場檢測方法,擺脫了對目標自身信息的依賴,但沒有實現目標的精確定位。文獻[7]提出了一種相對定位方法,其思想是首先選擇目標附近的高大、顯著、容易識別的“上下文地標”進行識別,進而利用它與直接目標之間在實時圖中的相對位置關系對直接目標進行相對定位,從根本上擺脫了對目標特征信息的依賴。但是,該方法的運用也存在一些問題:目標周圍需要有高大、容易識別的上下文地標,這就限制了算法的適用范圍;需要探測器的位置和姿態信息進行三維坐標變換計算,這直接將飛行器的中制導誤差引入到目標相對定位中,并且無法消除。
針對上述兩個問題,本文提出一種新的地面固定目標相對定位識別方法。基本思想是利用目標區域的遙感偵查圖像作為基準圖,自適應提取目標周圍的MSER特征區域作為上下文地標,并與實時圖中提取的最穩定極值(maximally stable external region,MSER)特征區域進行匹配識別,得到一定數量的匹配特征點對,最后利用直接目標與特征點對的相對位置不變性,計算直接目標在實時圖中的位置。具體流程如圖1所示。

圖1 目標相對定位算法流程圖
1.1相對定位原理
設t1(u,υ)為實時圖上一點,t2(x,y)是基準圖上的對應點,兩者的坐標之間存在一種非線性變換f,即

理論上,實時圖與基準圖上所有的共同點都應該滿足這種空間映射關系。由于拍攝位置、角度不同,兩幅圖像之間會存在一定的幾何畸變,相對定位的本質上也是一種空間坐標的幾何校正[8-9]。
用多項式逼近表示式(1)即為式(2)。

式(2)即為最終的像素相對定位計算式,其中n為多項式階次,一次變換式只能校正線性失真,如剛性變換、仿射變換,二次多項式可以校正徑向畸變,而三次多項式不僅可校正上述幾何畸變,還可消除透視效果[1011]。
1.2相對定位誤差分析
影響相對定位精度的誤差可以分為兩類:一類為隨機誤差,主要是由匹配點對的定位隨機誤差決定;另一類為方法誤差,主要是由多項式的階次決定,多項式的階次越高越逼近真實模型。針對隨機誤差因素,為了避免個別匹配點對的隨機定位誤差影響所求坐標變換方程系數的精度,通常采用多選匹配點對而后按最小二乘法求解系數,使擬合誤差平方和ε為最小,也就是使

式中,L為選取的匹配點對的個數;n為多項式階次,其中s= 0,1,…,n;t=0,1,…,n-s。
通過求解式(4),即可求出aij。同理可求出bij,再將其代回式(2)就可實現兩個坐標系之間的變換。
針對相對定位的方法誤差,理論上選擇的多項式階次越高,定位精度越高,但同時需要的匹配點對也越多,計算量也越大。下面通過實驗進一步分析各誤差因素對相對定位精度的影響,為保證結論的有效性,取一組飛行器實飛序列圖像來進行誤差分析。文中假設探測器視場張角為3.4°× 4.3°,圖像大小為320×256。實驗中選擇第1幀圖像為基準圖,依次間隔100幀共取8幅圖像作為實時圖。在基準圖與實時圖上取12組匹配點對,并加入2~3個像素的匹配點隨機定位誤差。另外,在第7幅實時圖上設置兩個誤匹配點。圖2給出了相對定位誤差仿真曲線。其中,橫坐標表示圖像幀序列,與飛行器向目標飛行的過程一致;縱坐標表示相對定位的距離誤差在圖像上表現的像素個數;L 1代表采用最小二乘擬合一次多項式,L2代表采用最小二乘擬合三次多項式,L 3代表采用一次多項式。從實驗結果可以看出,采用最小二乘擬合多項式系數可以很好地抑制隨機誤差,而采用多項式的階次對定位誤差的影響并不明顯;從第7幅實時圖的定位誤差結果可以看出,誤匹配對定位精度的影響很明顯;綜合上述情況,采用最小二乘擬合一次多項式對定位誤差的抑制效果最好。因此,本文采用最小二乘擬合一次多項式作為相對定位計算模型。

圖2 相對定位誤差曲線
根據相對定位原理[12],首先需要在目標附近尋找易識別且具有不變特征的上下文地標作為基準參考點。2005年文獻[13]對6種主流局部不變特征檢測子進行比較,發現使用MSER方法檢測出的局部特征在視角變換、尺度變換、光照變換、圖像壓縮和圖像模糊這五種情況下具有更好的不變性。因此,這里采用MSER特征區域作為上下文地標。
2.1最穩定極值區域
文獻[14]在研究寬基線圖像匹配問題時提出了最穩定極值區域算法。該方法通過給定的一系列閾值分割得到一組二值圖像,接著分析前后相鄰閾值圖像間的連通區域,最終得到若干個MSER。這些MSER分為MSER+和MSER-,可以理解為圖像最暗與最亮的區域。
當灰度圖像通過0~255的256個閾值時,記錄從0開始的大于閾值的像素點,這樣記錄下的相鄰點就形成了極值區域。那么對于比較寬的閾值范圍內形狀保持穩定的區域就形成了MSER+。通過同樣方法(使灰度圖像通過255~0的閾值)可以得到MSER-。MSER具有良好的穩定性、抗噪性和仿射不變性,并且計算簡單高效。
2.2上下文地標的自適應選取
最穩定極值區域作為一種不規則的仿射不變區域,這不利于特征描述操作。通常需要對這些不規則的特征區域進行擬合,如橢圓擬合、多邊形擬合、凸包圍擬合等。由于特征區域協方差矩陣的特征值和特征向量唯一確定一個橢圓,因此這里采用橢圓擬合方法。如圖3(a)所示。
提取后的MSER特征區域數量很多,其中一些特征區域并不適合作為上下文地標。因此,如何選取自動選取上下文地標非常關鍵。如果設置固定的面積閾值,一方面可能會造成符合條件的特征區域過少甚至沒有,另一方面可能造成特征區域過多從而增加后續的匹配識別工作量。從識別的角度分析,上下文地標應該具備面積較大、特征顯著、目標附近、數量適當等特點。因此,這里采用比例選取、總量控制、就近取點的策略來選取上下文地標。具體方法如下,首先計算每一個特征區域的選擇權重指數,然后將所有特征區域按選擇權重指數從大到小排序,最后取前10個作為上下文地標,如圖3(b)所示(圖中黑色框體表示直接目標)。

圖3 上下文地標提取
選擇權重指數λi可以通過式(5)得出。

式中,Si為特征區域面積;Li為特征區域擬合橢圓中心與直接目標中心的距離。
上下文地標選取之后,需要將它們進行逐一的編號、定位,并建立與直接目標對應的位置變換關系矩陣,最后將這些數據作為基準數據模板儲存起來用于后續的目標匹配識別。
通過第1.2節的相對定位誤差分析可知,影響相對定位精度的主要原因是上下文地標的定位誤差。因此實現上下文地標的精確匹配定位是相對定位技術的關鍵所在。
3.1基于規則化互相關的MSER特征匹配
在末制導階段,飛行器雖然按照預定的航跡和姿態進入目標成像區域,但是成像過程仍然會受到視角、拍攝距離等因素影響,同一場景的實時圖與基準圖會出現復雜的形變。如何對實時圖與基準圖提取的MSER特征進行關聯匹配是一個關鍵問題。互相關性在特征匹配中有較好的應用,但是不能抗旋轉、尺度等畸變影響,因此不能直接應用。
特征區域規則化就是將不同尺寸的MSER特征橢圓區域映射為某個固定大小的圓形區域。假設橢圓的中心在點Xo處,特征區域規則化的數學描述為:對于橢圓上的點X=(x,y)T,尋找一個2×2的變換矩陣A,使得式(6)成立。

式中,r為規則化后的圓半徑。因為點X在橢圓上,故有

式中,U為協方差矩陣。
由式(6)和式(7)可得

通過變換矩陣A,可將橢圓區域映射至一個固定大小的圓形區域。特征區域規則化結果如圖3(c)所示。
歸則化后的MSER區域可以消除扭曲變形、尺度大小和旋轉方向上的差異。針對MSER區域這一優點,引入特征區域之間的互相關性指標corr作為匹配量度。兩個特征區域之間的互相關性指標可以通過式(9)得出。

式中,MSERm(i,j)和MSERn(i,j)分別代表兩幅圖像中的MSER區域的灰度值。
由于在參考圖上設定的相對定位點數量有限,且互相關性指標計算簡單,因此采用窮盡搜索法來尋找實時圖上的匹配特征區域。
3.2雙層匹配矯正
當特征區域之間灰度信息區別明顯時,直接采用相關性指標,設置恰當的閾值時即表示實現正確匹配。但對于復雜地面復雜背景,出現區域灰度信息接近的概率很高,因此會出現一對多的誤匹配情況。針對這個問題,文獻[15]提出采用隨機采樣一致性(random sample consensus,RANSAC)算法[16]來消除誤匹配。但RANSAC算法的迭代次數沒有上限。對于存在較多誤差的觀測數據集,尋找支撐點集需要的迭代次數非常高,將會浪費很多的時間。
針對以上不足,本文設計了一種雙層匹配識別策略。首先對匹配特征對進行預檢測,即利用位置權重指數μ來消除大量一對多的誤匹配情況,對于每組一對多匹配,只取權重指數最大的一對,然后再采用RANSAC算法進一步剔除誤匹配特征對,從而實現上下文地標的精確匹配識別。位置權重指數μ可由式(10)計算得出。

式中,corr為互相關性指標;d*為每對匹配特征區域擬合橢圓中心的2-范數。
4.1實驗結果的評價指標
根據相對定位原理,正確識別上下文地標的個數越多,相對定位精度越高,相反如果出現了誤識別,將會影響目標的相對定位精度。因此,本文以整體像素誤差?為相對定位精度的評價指標,來直接反映目標的相對定位精度;以相對誤識別率(relative error recognition probability,RERP)作為單次識別實驗的評價指標,來間接反映目標的相對定位精度;將絕對誤識別率(absolute error recognition probability,AERP)作為多次識別實驗的評價指標,來考察算法的穩健性。

式中,Ni為第i次單次識別實驗中誤識別個數;Mi為正確識別個數;Oi為不能識別個數。
從式(11)~式(13)可以看出?越小,RERP越小,則直接目標的定位精度越高;AERP越小,算法穩健性越好。
4.2實驗結果及分析
實驗環境為:因特爾酷睿1.7 GHz處理器,4 GB內存,Windows 8操作系統,Matlab R2014a計算平臺。實驗選取10組不同類型的復雜地面場景圖像,分別采用MSER特征和尺度不變特征變換(scale-invariant feature transform,SIFT)特征作為上下文地標,進行目標相對定位實驗,其中圖像分辨率320×256,MSER特征區域中取擬合橢圓中心作為匹配點,基準圖中提取的SIFT特征點中隨機選取目標周圍的10個作為上下文地標。
表1給出本次實驗的數據對比結果。從實驗結果可以看出,上下文地標的誤匹配率對直接目標相對定位精度的影響很大,SIFT特征不具有仿射不變性,出現了很高的誤匹配率,而MSER特征具有較好的仿射不變性,誤匹配率較低;匹配點對的定位誤差也對相對定位精度有一定影響,MSER特征采用擬合橢圓中心作為匹配點,存在一定的定位隨機誤差,因此即使沒有誤匹配的情況下也會存在一定的相對定位誤差。另外,由于SIFT特征點較多,計算復雜性較大,相對于MSER特征實時性相對較差。

表1 實驗數據對比結果
圖4~圖6給出3組MSER特征和SIFT特征用于相對定位的對比實驗結果。其中,每組實驗結果中分圖(a)、分圖(c)為上下文地標匹配識別結果,分圖(b)、分圖(d)為直接目標相對定位結果,每幅圖像中左半部分為基準圖,右半部分為實時圖。這3組實驗考慮了成像末制導過程中可能出現的尺度、旋轉、平移等各種圖像畸變情況,充分考察算法的適應能力和魯棒性。從實驗結果可以看出,本文算法的目標相對定位誤差最大不超過3個像素,圖4(a)中出現一個誤匹配點對,但并沒有對相對定位結果產生明顯影響,這說明算法具有較好的魯棒性。圖6(a)中盡管沒有誤匹配現象,但圖6(b)仍然出現了3個像素的相對定位誤差,這樣也說明匹配點對存在一定的隨機定位誤差。考慮到本文算法對上下文地標的選取原則,限定在目標周圍隨機選取10個SIFT特征點,這樣就增加了SIFT特征點的誤匹配幾率。因此,采用本文的相對定位策略,利用SIFT特征的相對定位精度很低。

圖4 尺度變化目標相對定位實驗結果

圖5 旋轉變化目標相對定位實驗結果

圖6 平移變化目標相對定位實驗結果
(1)通過自適應提取、識別目標周圍的MSER特征形成上下文地標,進而利用相對定位技術對目標進行定位識別,解決了前視成像末制導中針對背景復雜、距離遠、低矮、存在遮攔等情況下的地面固定目標的識別定位問題。
(2)相對于文獻[7]中的相對定位方法,文中選用MSER特征作為上下文地標,擺脫了對目標周圍高大顯著地標的依賴,隔離了飛行器的制導誤差。另外,實驗過程中對比了SIFT特征,MSER特征具有更高的匹配識別成功率。實驗結果表明,針對復雜地面建筑場景,文中算法的最大相對定位誤差不超過3個像素,基本滿足了成像末制導對目標識別精度的要求。
(3)從實驗結果可以看出,本文算法的目標相對定位精度還有進一步提高的空間。改進的措施主要有兩個:一是提高MSER特征區域的中心擬合精度,二是提高上下文地標的正確匹配識別率。這也將是下一步工作的重點研究內容。
[1]Jia P,Xu N,Zhang Y,et al.Automatic target recognition based on local feature extraction[J].Optics and Precision Engineering,2013,21(7):1898-1903.(賈平,徐寧,張葉,等.基于局部特征提取的目標自動識別[J].光學精密工程,2013,21(7):1898 1903.)
[2]Ratches J A.Review of current aided automatic target acquisition technology for military target acquisition tasks[J].Optical Engineering,2011,50(7):1-8.
[3]Song D,Tang L B,Zhao B J.The object recognition algorithm based on affine histogram of oriented gradient[J].Journal of Electronics&Information Technology,2013,35(6):1429 1434.(宋丹,唐林波,趙保軍.基于仿射梯度方向直方圖特征的目標識別算法[J].電子與信息學報,2013,35(6):1429-1434.)
[4]Yang X Y,Zhang T X.Method of target recognition from images based on complex natural scenes[J].Systems Engineering and Electronics,2011,33(1):13-16.(楊校余,張天序.一種基于復雜地物背景圖像的目標識別方法[J].系統工程與電子技術,2011,33(1):13-16.)
[5]Hua M,Chen Y,Wang W S.Research on the technology of partial masked target recognition[J].Key Engineering Materials,2013,552:560-566.
[6]Firat O,Tursun O T,Vural F T Y.Application of context invariants in airport region of interest detection for multi-spectral satellite imagery[C]//Proc.of the Signal Processing and Communications Applications Conference,2012:1-4.
[7]Li Z J,Liu Y,Chen Z P.Relative positioning technology of FLIR ground targets in terminal guidance[J].Infrared and Laser Engineering,2012,41(11):2861-2864.(李志軍,劉洋,陳曾平.前視紅外地面固定目標末制導相對定位技術[J].紅外與激光工程,2012,41(11):2861-2864.)
[8]William K P.Pratt digital image Process[M].3rd ed.New York:Wiley,2001.
[9]Lin W,Wang Z Q,Gao F D.Real time digital correction for distortion in photoelectronical measuring system[J].Opticsand Precision Engineer,2007,15(2):277-282.(凌偉,王志乾,高峰端.光電測量系統畸變的實時數字校正[J].光學精密工程,2007,15(2):277-282.)
[10]Shah S,Aggarwa J K.A simple calibration procedure for fisheye lens camera[C]//Proc.of the IEEE International Conference on Robotics and Automation,1994:3422-3427.
[11]Castleman K R.Digital image processing[M].2nd ed.Upper Saddle River:Prentice Hall,1996:387-418.
[12]Zhang G G,Wei Z.A novel calibration approach to structured light 3D vision inspection[J].Optics&Laser Technology,2002,34(5):373-380.
[13]Mikolajczyk K,Tuytelaars T.A comparison of affine region detectors[J].International Journal of Computer Vision,2005,65(2):43-72.
[14]Matas J,Chum O,Urban M,et al.Robust wide-baseline stereo from maximally stable external regions[J].Image Vision Computing,2004,22(10):761-767.
[15]Chen B,Zhao Y G.A new approach to scene matching during
electro-optical imaging terminal guidance[J].Acta Optica Sinica,2010,30(1):163-165.(陳冰,趙亦工.一種新的光電成像末制導景象匹配方法[J].光學學報,2010,30(1):163-165.)
[16]Hartley B,Zisserman A.Multipleυiew geometry in computer υision[M].2nd ed.Cambridge:Cambridge University Press,2003:290-293.
Relative positioning method of target based on adaptive context information
CHEN Shi-wei,YANG Xiao-gang,ZHANG Sheng-xiu,WANG Xue-mei
(Department of Control Engineering,Rocket Force Uniυersity of Engineering,Xi'an 710025,China)
According to the difficulties of the recognition for the ground stationary target in imaging terminal guidance,a new localization and recognition approach based on the maximally stable external region(MSER)is proposed.MSER features which are scale and affine invariant are extracted respectively around the target in the reference image.A certain amount of MSER features are adaptively selected as context landmarks according to the weighting exponent.The matching feature pairs between the MSER features extracted from the real-time image and the context landmarks are obtained based on the normalized cross correlation criterion.The double matching correction strategy is used to reduce the probability of mismatching.The center points taken as the reference points are extracted from the matching feature pairs to solve the space mapping relation between the reference image and the real-time image.The position coordinate of the target in the real-time image is calculated according to a polynomial based on the least squares fitting.In view of the complex ground scene,the experiments demonstrate that the maximum relative error location probability of the method is less than 3 pixels.It can satisfy the imaging terminal guidance for automatic target recognition algorithm requirements of higher precision and rapid speed,as well as strong anti-jamming and stabilization.
context landmark;relative position;maximally stable external region(MSER);target recognition
TP 394.1
A
10.3969/j.issn.1001-506X.2016.05.02
1001-506X(2016)05-0984-06
2015-04-22;
2015-10-19;網絡優先出版日期:2015-12-23。
網絡優先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20151223.1019.008.html
國家自然科學基金(61203189);二炮院校青年基金(2014QNJJ023)資助課題
陳世偉(1979-),男,講師,博士研究生,主要研究方向為機器視覺、先進控制理論。
E-mail:cshw3876@tom.com
楊小岡(1978-),男,副教授,博士,主要研究方向為機器視覺、精確制導。E-mail:yangxiaogang@163.com
張勝修(1965-),男,教授,博士,主要研究方向為先進控制理論、精確制導技術。
E-mail:ZSHX@tom.com
王雪梅(1968-),女,教授,主要研究方向為精確制導技術。
E-mail:WXM1968@163.com