


摘要:紅外搜索與跟蹤系統(tǒng)被廣泛應(yīng)用于現(xiàn)代國防中針對遠(yuǎn)距離目標(biāo)的檢測、跟蹤及預(yù)警。但是,該統(tǒng)檢測的目標(biāo)一般為尺寸較小且模糊的點(diǎn)狀結(jié)構(gòu)通常難以辨別,一種基于圖像中目標(biāo)與背景局部結(jié)構(gòu)的差異性,采用NRAM模型實(shí)現(xiàn)的方法可以對單幀紅外圖像中的小目標(biāo)進(jìn)行有效檢測。
關(guān)鍵詞:紅外小目標(biāo)檢測;NRAM模型;稀疏性;低秩性
doi:10.3969/J.ISSN.1672-7274.2024.01.012
中圖分類號:TN 215? ? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ? ? 文章編碼:1672-7274(2024)01-00-04
Research on Target Detection of Infrared Image
YU Zhiqi
(The University of Hong Kong, Hong Kong 999077, China)
Abstract: Infrared search and tracking system is widely used in modern national defense for long-range target detection, tracking and early warning. However, the target detected by the system is generally a small and blurred dot structure, which is usually difficult to identify. A method based on the difference between the local structure of the target and the background in the image,which is implemented by the NRAM model, can effectively detect small targets in a single frame infrared image.
Key words: infrared small target detection; NRAM model; sparsity; low-rank
1? ?研究背景
紅外搜索與跟蹤系統(tǒng)被廣泛應(yīng)用于針對飛機(jī)、船舶等遠(yuǎn)距離目標(biāo)的檢測、跟蹤及預(yù)警。由于搜索距離較遠(yuǎn)且容易受到環(huán)境干擾,系統(tǒng)進(jìn)行檢測的目標(biāo)一般表現(xiàn)為尺寸較小且模糊的點(diǎn)狀結(jié)構(gòu),對紅外小目標(biāo)的檢測是紅外搜索與跟蹤系統(tǒng)中的一項(xiàng)難題。為了精確地檢測小目標(biāo),現(xiàn)今的研究者們提出了各種各樣的檢測方法,根據(jù)檢測弱小目標(biāo)所需的圖像類型的不同,主要分為基于單幀的檢測方法和基于序列的檢測方法兩種類型。
序列檢測方法通常一次處理多個圖像幀來估計(jì)目標(biāo),利用小目標(biāo)的形狀、灰度的變化在時間上的連續(xù)性,以及運(yùn)動軌跡的連續(xù)性等先驗(yàn)信息,有效地分離紅外圖像中的背景與小目標(biāo)。典型的方法包括匹配濾、序列假設(shè)檢驗(yàn)、動態(tài)規(guī)劃分析和高階相關(guān)。
基于單幀檢測方法按照檢測方式的不同,可以進(jìn)一步分為基于背景估計(jì)的方法和基于目標(biāo)提取的方法。除只關(guān)注單個背景或目標(biāo)之外,最近的一些方法可以同時分離目標(biāo)和背景,其中大多數(shù)方法是基于紅外圖像具有目標(biāo)是稀疏的和背景局部具有一致性的假設(shè),例如,高陳強(qiáng)[1]提出的一種基于紅外圖像數(shù)據(jù)的子空間結(jié)構(gòu)的單幅紅外小目標(biāo)檢測技術(shù),通過滑動窗口方式,分別處理每個圖像塊中的稀疏的目標(biāo)特征,將傳統(tǒng)的紅外圖像推廣到新的紅外圖像塊(Infrared Patch Image,IPI)模型。基于觀察,在IPI模型中,認(rèn)為目標(biāo)圖像塊矩陣是稀疏矩陣,背景圖像塊矩陣是低秩矩陣,將小目標(biāo)檢測任務(wù)轉(zhuǎn)化為恢復(fù)低秩稀疏矩陣的優(yōu)化問題。IPI模型具有假設(shè)與現(xiàn)實(shí)相符合的優(yōu)點(diǎn),幾乎在任何情況下都有效,與只關(guān)注單個對象的傳統(tǒng)方法相比具有明顯優(yōu)勢。但是,IPI模型也具有局限性,在描述稀疏度時會使目標(biāo)檢測陷入矛盾中,要么使背景圖像中的邊緣、角或點(diǎn)等較為稀疏的結(jié)構(gòu)也被識別為小目標(biāo),導(dǎo)致虛警率升高,分離出的目標(biāo)圖像中留下一些殘差,要么使過于弱小的目標(biāo)圖像被錯誤消除。此外,在稀疏性不一致的背景圖像塊和目標(biāo)圖像塊中,IPI模型使用的相同的全局加權(quán)系數(shù)也是較為不適合的。
本文對紅外小目標(biāo)的檢測方法進(jìn)行學(xué)習(xí)與研究,通過紅外圖像中目標(biāo)與背景局部結(jié)構(gòu)的差異性,采用改進(jìn)的IPI模型實(shí)現(xiàn)對單幀紅外圖像的目標(biāo)檢測。其中,采用范數(shù)逼近背景圖像矩陣的秩描述其低秩特性,采用加權(quán)范數(shù)描述目標(biāo)矩陣的稀疏特性,并引入額外的范數(shù)對復(fù)雜背景中的強(qiáng)邊緣噪聲進(jìn)行描述。最終,通過一組在真實(shí)場景下的紅外小目標(biāo)圖像集對采用的目標(biāo)檢測方法進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果顯示,在面對不同的復(fù)雜場景時檢測效果良好,可以得到平均檢測概率為91.23%、平均虛警率為8.92%的檢測效果。
2? ?紅外小目標(biāo)檢測模型的工作原理及建立
2.1 模型原理
主成分分析法(Principal Component Analysis,PCA)是一種常用的統(tǒng)計(jì)處理方法,其原理是利用數(shù)據(jù)內(nèi)在的低維度,應(yīng)用正交變換的方式將數(shù)據(jù)變量轉(zhuǎn)化到不同坐標(biāo)系中,從而達(dá)到將相關(guān)數(shù)據(jù)轉(zhuǎn)變?yōu)椴幌喔傻臄?shù)據(jù)、降低數(shù)據(jù)維度和減少數(shù)據(jù)冗余的目的,降維后保留的數(shù)據(jù)被稱為主成分。在圖像處理中,認(rèn)為圖像或視頻的底層背景通常變化幅度不大,是具有相關(guān)性的,因此可以基于PCA將背景建模為低秩矩陣以進(jìn)行降維。由于對弱小目標(biāo)檢測中的紅外圖像具有目標(biāo)稀疏性假設(shè)和背景一致性假設(shè),小目標(biāo)的灰度值與周圍像素不同,認(rèn)為其具有稀疏性;而背景則具有很好的局部相關(guān)性和各向同性,認(rèn)為背景矩陣所含信息量較少,即矩陣的秩其數(shù)值較小。為了使目標(biāo)檢測更加符合實(shí)際情況,結(jié)果更加準(zhǔn)確,對弱小目標(biāo)檢測通常采用魯棒主成分分析法(Robust Principal Component Analysis,RPCA)[2]來提高PCA對不同場景的適應(yīng)性,當(dāng)輸入圖像矩陣為低秩矩陣和稀疏性矩陣的疊加時,可以將它們重新分解開。
在從較遠(yuǎn)的區(qū)域拍攝得到的紅外圖像中,可以觀察得到背景圖像具有局部線性相關(guān)性,也就是說,其矩陣所包含的信息較少,通常是低秩矩陣,并且紅外小目標(biāo)相對于整個圖片來說尺寸較小,目標(biāo)圖像矩陣具有稀疏性,符合上述魯棒主成分分析法(RPCA)優(yōu)化問題的框架。通過將原始的紅外圖像推廣到IPI模型,基于圖像子空間的結(jié)構(gòu),對圖像矩陣中的數(shù)據(jù)集進(jìn)行重新排布,能夠增強(qiáng)圖像中各個部分的性質(zhì),更好地利用RPCA優(yōu)化將目標(biāo)檢測問題轉(zhuǎn)化為稀疏和低秩矩陣分解的優(yōu)化問題。
利用滑動窗口對圖像進(jìn)行重新構(gòu)造,按照從左到右,從上到下的順序以一定步長將圖像分割為若干個局部圖像塊。再將每一個圖像塊矩陣矢量化后按獲取順序進(jìn)行排列,作為新矩陣的每一列組成紅外圖像塊模型矩陣。這時,原始圖像就是等大滑動窗口下獲得的一種特殊情況。顯然,滑動窗口的大小以及水平和垂直滑動步長也會對重構(gòu)的圖像塊矩陣產(chǎn)生影響。具體的IPI模型構(gòu)建和恢復(fù)過程如圖1、圖2所示。
2.2 改進(jìn)的IPI模型的整體描述
由于IPI模型仍具有一些局限性,例如,因?yàn)楹朔稊?shù)是矩陣奇異值之和,在使用核范數(shù)對背景矩陣秩近似時必然會產(chǎn)生誤差;使用范數(shù)對目標(biāo)圖像片稀疏性描述時具有兩方面缺點(diǎn):首先,模型中使用范數(shù)作為描述的小目標(biāo)稀疏性的度量,范數(shù)不適合處理一些特殊結(jié)構(gòu)的背景,如強(qiáng)邊緣、角狀結(jié)構(gòu)或者點(diǎn)狀結(jié)構(gòu)重構(gòu)成圖像塊后也會具有稀疏結(jié)構(gòu),難以與小目標(biāo)進(jìn)行區(qū)分。其次,另一個限制是固定的權(quán)值,所有低秩的背景圖像片和稀疏的目標(biāo)圖像片之間的權(quán)重均受一個固定的參數(shù)控制。由于背景圖像片的低秩屬性和目標(biāo)圖像片的稀疏性不一定一致,因此對不同的圖像片采用全局加權(quán)參數(shù)是不符合實(shí)際的。
NRAM模型基于IPI模型中的限制進(jìn)行了改進(jìn),它采用以下方法對IPI模型中重構(gòu)的圖像塊矩陣進(jìn)行描述。
2.2.1 低秩背景矩陣的描述
在NRAM模型中,選擇采用一種非凸性范數(shù)[3]來直接逼近秩,它提供了比核范數(shù)更嚴(yán)格的逼近,稱為γ范數(shù):
式中,當(dāng)參數(shù)γ趨向零時,γ范數(shù)更加接近矩陣真實(shí)的秩,當(dāng)參數(shù)γ趨向于無窮大時,γ范數(shù)接近核范數(shù)而與真實(shí)的秩有很大偏差,適當(dāng)選擇合適的γ將更好地逼近真實(shí)的秩,克服核范數(shù)中因?yàn)槠娈愔档臄?shù)值不同而造成被施加不平衡的權(quán)值的缺陷,實(shí)際上,γ范數(shù)是一種偽范數(shù)。
2.2.2 稀疏目標(biāo)矩陣的描述
由于范數(shù)具有的魯棒性能很好地適應(yīng)大小變化的檢測目標(biāo),NRAM模型仍選取l1范數(shù)描述目標(biāo)圖像片的稀疏性,但是由于權(quán)值固定的l1范數(shù)存在2.1.4節(jié)描述的局限性,將采用推廣的加權(quán)l(xiāng)1范數(shù)[4],根據(jù)目標(biāo)一般情況下,非目標(biāo)稀疏結(jié)構(gòu)的亮度低于小目標(biāo)的亮度的先驗(yàn)知識,自適應(yīng)地分配l1范數(shù)中元素的權(quán)重:
式中,Wij是目標(biāo)圖像塊中元素的權(quán)值;C為參數(shù);εT用于避免分母出現(xiàn)零值,一般設(shè)置為數(shù)值較小的正實(shí)數(shù)。
2.2.3 復(fù)雜背景中強(qiáng)邊緣結(jié)構(gòu)的描述
正如2.2節(jié)中討論的,背景圖像中的強(qiáng)邊緣由于具有同樣的稀疏性,容易被殘留在目標(biāo)圖像中,干擾目標(biāo)檢測的進(jìn)行,采用l2,1范數(shù)[3]對強(qiáng)邊緣進(jìn)行描述:
綜合上述描述,基于局部對比度的理論和單幀檢測的方法,在現(xiàn)有IPI模型算法的基礎(chǔ)上,建立起本文所采用的基于最小化非凸性秩近似(NRAM)的紅外小目標(biāo)檢測方法,其模型公式為
式中,λ,β是系數(shù)。
可以通過廣義拉格朗日乘子法[5]將算式(4)從有約束條件的優(yōu)化問題改寫為無約束條件的形式,如下所示:
3? ?算法仿真及結(jié)果分析
3.1 實(shí)驗(yàn)準(zhǔn)備
本實(shí)驗(yàn)使用一組來自網(wǎng)絡(luò)的紅外小目標(biāo)檢測數(shù)據(jù)集,該數(shù)據(jù)集是針對單幀檢測的,由426張來自多個不同場景的單幀圖像組成,所有圖像均在真實(shí)場景下拍攝得到。為了驗(yàn)證所采用的NRAM模型面對復(fù)雜背景和弱小目標(biāo)的檢測能力,選取的紅外圖像并不是背景均勻一致且目標(biāo)清晰顯著的特殊形式,其中包含真實(shí)場景下多種類型的背景和小目標(biāo)。按照小目標(biāo)的大小、位置、對比度及形狀等差異性和背景中包含的噪聲元素的結(jié)構(gòu)與性質(zhì)大致分為幾種類別。同時,選取以下評估指標(biāo)驗(yàn)證模型性能。
3.1.1 檢測概率評估
在目標(biāo)檢測中檢測正確率Pd和虛警率Fa是常用的兩項(xiàng)評價檢測能力的指標(biāo),其定義如下:
其中,對于單幀目標(biāo)檢測,M為實(shí)際目標(biāo)數(shù);N為正確檢測數(shù);Pd=N/M,當(dāng)Pd的數(shù)值越大,F(xiàn)a的數(shù)值越小,檢測性能則越好。
3.1.2 目標(biāo)顯著性評估
為了評估目標(biāo)檢測方法對目標(biāo)的影響,防止檢測結(jié)果中分離出的目標(biāo)圖像被過度縮小,采用信雜比(Signal-to-Clutter Ratio,SCR)來衡量目標(biāo)的顯著程度,其定義如下:
式中,μT、μN分別是目標(biāo)區(qū)域和目標(biāo)周圍臨近區(qū)域像素的平均值;σN是目標(biāo)周圍臨近區(qū)域像素的標(biāo)準(zhǔn)差。目標(biāo)區(qū)域尺寸設(shè)為a×b,目標(biāo)周圍臨近區(qū)域尺寸設(shè)為(a+2d)×(b+2d)。
3.2 模型的參數(shù)選擇
平衡檢測正確率Pd和虛警率Fa,通過固定其他參數(shù)的同時只調(diào)節(jié)其中一個參數(shù)的方式,將三個參數(shù)——懲罰項(xiàng)參數(shù)μ、描述目標(biāo)矩陣的l1范數(shù)中調(diào)節(jié)權(quán)重系數(shù)Wij的參數(shù)C和描述背景矩陣的γ范數(shù)中用于逼近矩陣真實(shí)秩的參數(shù)調(diào)節(jié)至最佳數(shù)值構(gòu)建NRAM模型,參數(shù)的設(shè)置如表1所示:
3.3 實(shí)驗(yàn)結(jié)果分析
采用3.2節(jié)表1中確定的NRAM模型參數(shù)進(jìn)行實(shí)驗(yàn),計(jì)算NRAM模型的檢測正確率和虛警率。為了減少單次程序的運(yùn)行時間,以及避免因?yàn)閱未螜z測中圖像元素類別有偏差造成的識別效果偏差,將426張紅外圖像數(shù)據(jù)集分為6組,每組圖片張數(shù)為71張,分別進(jìn)行測試。
但由于存在多目標(biāo)圖像,目標(biāo)數(shù)和圖像數(shù)不同,每組的目標(biāo)數(shù)目不同的記錄在表2中,分別計(jì)算其檢測正確率和虛警率,最后再取平均值,結(jié)果如表2所示,NRAM模型的平均檢測正確率為91.23%,虛警率為8.92%。
為了直觀地顯示模型效果,從每一類圖像中挑選出有代表性的圖像進(jìn)行展示,即使在圖像中目標(biāo)較為模糊、對比度低的情況下或者是在圖像背景復(fù)雜、含有較多結(jié)構(gòu)的情況下,弱小紅外目標(biāo)都得到了很好的識別,此模型具有較好的魯棒性。
4? ?結(jié)束語
本文對紅外小目標(biāo)的檢測方法進(jìn)行學(xué)習(xí)和研究,著重對基于非凸性最小化秩近似(NRAM)檢測方法進(jìn)行研究和復(fù)現(xiàn)。
復(fù)現(xiàn)模型及求解過程通過圖像分塊、目標(biāo)檢測與圖像重構(gòu)幾個步驟實(shí)現(xiàn),具體方法:使用滑動窗口對原始的紅外圖像進(jìn)行分割并重構(gòu)為新的圖像塊矩陣,基于背景圖像具有局部相似性和目標(biāo)圖像具有稀疏性的原理,認(rèn)為待檢測的紅外圖像是低秩矩陣與稀疏矩陣的疊加,利用魯棒主成分分析方法將目標(biāo)檢測問題轉(zhuǎn)變?yōu)閮?yōu)化問題求解。針對復(fù)雜背景中灰度值變化較大的強(qiáng)邊緣,在優(yōu)化時采用額外的規(guī)則項(xiàng)范數(shù)對其進(jìn)行描述,以達(dá)到在目標(biāo)圖像中去除強(qiáng)邊緣的目的。同時,使用交替方向乘子法(ADMM)結(jié)合凸性差分規(guī)劃算法(DC)求解模型。
最后,使用一組針對單幀弱小紅外目標(biāo)的紅外圖像數(shù)據(jù)集對復(fù)現(xiàn)出的模型進(jìn)行驗(yàn)證。使用檢測正確率和虛警率這兩個檢測指標(biāo)對模型的效果進(jìn)行評價,在固定其他參數(shù)的同時只調(diào)諧其中一個參數(shù)來尋找模型最佳的檢測效果。NRAM模型最后可以達(dá)到的平均檢測正確率為91.23%,平均虛警率為8.92%。從不同場景下弱小目標(biāo)的檢測結(jié)果,可以看出NRAM模型能夠較好地抑制背景中結(jié)構(gòu)不同的噪聲,并將它們與小目標(biāo)進(jìn)行區(qū)分,從而得到較好的檢測效果,驗(yàn)證了NRAM模型具有較強(qiáng)的魯棒性。
參考文獻(xiàn)
[1] GAO C Q, MENG D Y, YANG Y, et al. Infrared patch-image model for small target detection in a single image[J]. IEEE Transactions on Image Processing, 2013, 22(12): 4996-5009.
[2] CANDES E J, LI X, MA Y, et al. Robust principal component analysis[J]. Journal of the ACM, 2011, 58(03): 1101-1137.
[3] ZHANG L D, PENG L B, ZHANG T F, et al. Infrared Small Target Detection via Non-Convex Rank Approximation Minimization Joint l2,1 Norm[J]. Remote Sensing, 2018, 10(11): 1821-1847.
[4] DAI Y M, WU Y Q, SONG Y. Infrared small target and background separation via column-wise weighted robust principal component analysis[J]. Infrared Physics & Technology, 2016, 77(07): 421–430.
[5] ZHANG L D, PENG L B, ZHANG T F, et al. Infrared Small Target Detection via Non-Convex Rank Approximation Minimization Joint l2,1 Norm[J]. Remote Sensing, 2018, 10(11): 1821-1847.
作者簡介:余祉祺(1998-),女,漢族,河南洛陽人,在讀碩士,研究方向?yàn)殡姎馀c電子信息專業(yè)通信。