郭雷, 姚西文, 韓軍偉, 程塨, 錢曉亮
(西北工業大學 自動化學院, 陜西 西安 710072)
從遙感圖像中自動檢測機場目標,在飛機導航、軍事偵察和精確打擊等領域有著重要的實用價值,受到人們越來越多的關注。近些年來,多數檢測算法[1-4]通過提取機場跑道的線性特征或機場目標候選區域的形狀、SIFT等特征進行辨識檢測,但巨幅遙感圖像背景復雜,通常存在與機場目標特征屬性相似的物體干擾,僅依靠上述特征,無法有效區分,影響機場檢測的準確率。基于超完備字典的圖像稀疏編碼是一種新的圖像表示理論,利用超完備字典的冗余性可以有效地捕捉圖像的各種結構特征,形成對機場目標的魯棒表征。
本文提出了一種新穎的遙感圖像機場檢測算法,通過構建滑動窗口檢測器,將目標檢測問題轉化為模式分類問題,為了提高檢測的效率,引入基于改進LSD算法[5]的窗口目標初判方法,如果窗口沒有存在目標的可能性則不進行后續處理,如果窗口可能存在目標,則對窗口圖像按照空間金字塔表示方法進行稀疏編碼,為了更魯棒地表征窗口圖像,采用基于視覺顯著性的特征抽取策略,形成描述窗口的全局特征向量,對該特征向量進行分類判別,判定該窗口中是否含有目標,最后采用局部鄰域抑制算法完成機場檢測任務。
圖像在過完備字典下的稀疏表示是指圖像可以完全或近似地由字典中少量的原子的線性組合表示。給定過完備字典D=[d1,d2,…,dk],x為圖像的向量展開形式,通過(1)式求解圖像x在過完備字典D中的最稀疏表示

(1)
λ為正則化參數。
為了獲得圖像更稀疏、更精確的表示,過完備字典的學習也是一個重要的方面。字典學習就是一種尋找稀疏表示下最優基的構造,并能滿足稀疏表示唯一的條件約束。對于所有的訓練集,需要求解

(2)
式中:xi表示每一個訓練樣本,si表示訓練樣本xi在字典D下的稀疏表示。雖然(2)式對于D和S=

本文按照文獻[7]提出的金字塔模型,將窗口圖像在空間上進行3層金字塔劃分,其第0層仍是原圖像,第1層對圖像進行2×2分塊,第2層對圖像進行4×4分塊,一共可以得到21個不同大小和不同空間位置的圖像區域。由于圖像區域中的單個稀疏編碼特征對于圖像的旋轉、噪聲等比較敏感,不能形成對圖像區域的魯棒表達。為了克服稀疏編碼的這個缺點,在圖像局部區域,對稀疏編碼特征進行最大抽取,依靠稀疏編碼的統計特性來獲得魯棒的特征表達。
max:zj=max{|si|},i=1,2,…M
(3)
式中:M表示第j個圖像區域中稀疏編碼特征的數目,si表示每個圖像子塊(Patch)的稀疏編碼。在每個圖像區域中的稀疏編碼特征進行抽取得到特征向量zj。但是在遙感圖像中,背景復雜、雜物較多,容易抽取圖像中的一些雜物的特征。
面對復雜場景,人類能迅速地將自己的注意力聚集在一些顯著的目標上,從而對這些目標進行優先處理, 這是人類視覺注意機制在發揮重要作用,視覺注意機制保證了人類對視覺圖像中相關信息進行選擇和處理的能力。我們在特征抽取過程中,加入視覺注意選擇機制,即:
zj=max{|si|·smj},i=1,2,…M
(4)
式中:smj為圖像第j個局部區域的視覺顯著圖。利用視覺顯著來對稀疏編碼特征進行選擇抽取,使得抽取后的特征能夠更傾向于對前景目標進行表征,而對背景雜物等無關信息進行抑制。經過實驗對比,我們采用基于圖像空間頻域分析的FT算法[8]計算遙感圖像顯著圖,這個算法利用顏色、亮度特征的中央-周邊算子來得到顯著圖,有確切邊界的突出顯著區域、計算效率高。
對窗口圖像每一區域進行顯著引導抽取后,將抽取后的向量進行歸一化后,采用(5)式將其連接起來形成窗口圖像的空間金字塔特征的最終表示形式。
(5)
本文對窗口的特征表示方法,既考慮了稀疏編碼對圖像主要特征和內在結構的有效表達,采用空間金字塔表示方法又融合了局部特征的空間位置信息,同時引入具有選擇作用的視覺顯著性模型,增強了對目標與背景雜物等的區分能力,使最終的特征表示更魯棒。
基于滑動窗口的目標檢測,核心思想是將目標檢測問題轉化為對滑動窗口的二值分類問題,即判定滑動窗口屬于目標類還是背景類。
本文檢測框架如圖1所示。為了克服滑動窗口檢測效率低、計算量大的缺點,本文設計了基于改進LSD算法的目標存在性初判步驟, 在初判后只對可能含有目標的滑動窗口進行特征提取及分類判別,大大減少了需要進一步處理的滑動窗口的數量,提高了檢測效率。LSD算法采用基于假設檢驗的Helmholtz Principle準則對直線段進行判定,需要很大計算量,由于本文提取直線段僅是為了對目標的存在性進行初步判斷,并不需要對直線段進行精確判定,我們可以簡化判定規則,使用外接矩形長短軸之比對直線結構進行判定,既保證了檢測效果,又提高了處理速度。
訓練時,截取包含完整機場目標的最小圖像作為正樣本,120×120像素左右大小的背景圖像作為負樣本,按照上述金字塔特征的抽取方式提取正負樣本的特征,并將此特征作為輸入來訓練線性SVM分類器。測試時,利用訓練好的SVM分類器對測試圖像中不同位置、不同尺寸的滑動窗口進行判定分類,檢測過程中容易出現多個相互重合的目標類窗口,需要進一步處理來合并壓縮窗口區域得到目標的精確范圍,本文對傳統的非極大值抑制方法進行了改進,同時考慮窗口的目標置信值和空間重合情況,先挑選最置信的窗口然后再對窗口進行壓縮,使其精確、可靠、高效地定位目標區域,過程如下:
1) 對于判定為目標類的所有窗口,根據其目標置信值進行排序,首先選出置信值最大的滑動窗口;
2) 接著挑選剩余窗口中置信值最大的滑動窗口,并按照公式(6)計算和已經挑選出來的窗口的重疊率,如果重疊率a0大于0.8,則放棄該窗口,否則將其選出。
(6)
式中:wn為目前需要判斷的窗口,wp為已經挑選出來的窗口。
3) 重復步驟2),直到所有符合要求的窗口都被選出。
4) 創建同測試圖像一樣大小的目標概率圖像,根據步驟3)選出的滑動窗口在目標概率圖像相應位置賦該窗口的目標置信值,在目標概率圖像上應用非極大值抑制方法,得到目標的最置信區域。

圖1 本文檢測框架圖
本文在Intel Xeon E5504處理器,6G內存的硬件環境和Matlab R2011a,Windows7 64位操作系統的軟件環境下進行了實驗。實驗數據采用從中科院國際數據服務中心下載的紅外遙感圖像,波段為Band7-中紅外,空間分辨率為30 m。從中截取了30幅包含機場目標的最小目標圖像和270幅120×120像素大小的背景圖像用來訓練SVM分類器,以及140幅400×400像素大小的圖像作為測試圖像。
本文的機場檢測算法中采用改進的LSD算法進行目標存在初判來提高基于滑動窗口的目標檢測速度,采用基于視覺顯著引導抽取的金字塔特征表示方式來魯棒表征滑動窗口,為了充分說明這2個關鍵性步驟對算法性能的影響,設計了2個基準方法:基準方法1采用普通的max抽取方式來獲得滑動窗口的金字塔特征表示;基準方法2直接在測試圖像上進行檢測,沒有對窗口中是否存在機場目標進行預判斷。并同文獻[3]中的方法進行了比較,比較結果如表1所示。

表1 各種檢測方法結果對比表
從表1中可以看出,對滑動窗口進行目標存在預判斷,可以顯著提高檢測速度,而且僅僅損失了3%的識別率和增加了2%的虛警率,在實際應用中完全可以接受這樣的代價。在紅外遙感中檢測機場時,普通的max特征抽取方式沒有本文的特征抽取方式表現好,但仍強于文獻[3]的方法,主要是因為文獻[3]僅采用SIFT特征對機場目標進行表征并且采用像素級的分割方式來獲得目標潛在區域,不能有效區分機場和其他背景雜物,虛警率比較高,而且檢測速度比較慢。
本文提出一種結合視覺顯著性和空間金字塔的遙感圖像機場檢測算法,對傳統的金字塔特征提取進行了改進,通過引入視覺顯著來對特征進行引導抽取形成對滑動窗口的魯棒表征。基于滑動窗口的目標檢測一般效率比較低,通過改進的LSD算法對滑動窗口中是否存在機場目標進行初步判斷,來減少需要分類判定的窗口的數目,大大提高了檢測的速度。實驗結果表明,本文提出的特征抽取方式能夠魯棒表征窗口,提高了機場檢測的識別率和降低了虛警率,有一定的實際應用價值,但處理速度距實時處理還有一定的差距,需進一步深化研究。
參考文獻:
[1] 曲延云, 鄭南寧,李翠華. 基于支持向量機的機場檢測算法[J]. 西安交通大學學報, 2006,40(6):709-713
Qu Yanyun, Zheng Nanning, Li Cuihua. Airport Detection Algorithm Based on Support Vector Machine[J]. Journal of Xi′an Jiaotong University, 2006,40(6):709-713 (in Chinese)
[2] 張立平, 張紅,王超,等. 大場景高分辨SAR圖像中機場快速檢測方法[J]. 中國圖象圖形學報, 2010, 15(7):1112-1120
Zhang Liping, Zhang Hong, Wang Chao, et al. A Fast Method of Airport Detection in Large-Scale SAR Image with High Resolution[J]. Journal of Image and Graphics, 2010, 15(7):1112-1120 (in Chinese)
[3] Tao C, Tan Y, Cai H, et al. Airport Detection from Large IKONOS Images Using Clustered SIFT Keypoints and Region Information[J]. IEEE Geoscience and Remote Sensing Letters, 2011, 8(1): 128-132
[4] Wang X, Wang B, Zhang L. Airport Detection in Remote Sensing Images Based on Visual Attention[C]∥Proceedings of Neural Information Processing, 2011: 475-484
[5] Von Gioi R G, Jakubowicz J, Morel J M, et al. LSD: A Fast Line Segment Detector with a False Detection Control[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(4): 722-732
[6] Lee H, Battle A, Raina R, et al. Efficient Sparse Coding Algorithms[C]∥Proceedings of Advances in Neural Information Processing Systems, 2006: 801-808
[7] Lazebnik S, Schmid C, Ponce J. Beyond Bags of Feature: Spatial Pyramid Matching for Recognizing Natural Scene Categories[C]∥Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 2006: 2169-2178
[8] Achanta R, Hemami S, Estrada F, et al. Frequency-Tuned Salient Region Detection[C]∥Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 2009: 1597-1604