(華中科技大學 圖像識別與人工智能研究所,武漢430074)
摘 要:采用高精度B樣條生成金字塔,大幅降低了計算復雜度,通過Parzen窗計算聯合直方圖并在此基礎上導出目標函數的Hessian矩陣表達式,將具備二次收斂性的Newton方法引入到優化過程從而大大提高了配準速度。對普通光學和多譜圖像的配準實驗表明,該算法大幅提高了互信息模型下的配準速度,且精度較高。
關鍵詞:互信息; 圖像配準; Powell方法; Newton方法; Parzen窗
中圖分類號:TP391.41文獻標志碼:A
文章編號:1001-3695(2009)05-1949-02
Fast image registration based on spline pyramid and mutual information
LI Qiao-liang WANG Guo-you LIU Jian-guo CHEN Shao-bo
(Institute for Pattern Recognition Artificial Intelligence Huazhong University of Science Technology Wuhan430074 China)
Abstract:This paper introduced B-Spline pyramid into mutual information based registration procedure to improve the precision and efficiency. The proposed algorithm based on B-Spline pyramid adopted Newton instead of Powell optimizer while estimated the joint probability density function by Parzen window to improve the registration accuracy and efficiency and experimental results show that the registration speed is substantially improved by the proposed algorithm with high accuracy.
Key words:mutual information(MI); image registration; Powell algorithm; Newton algorithm; Parzen window
圖像配準是圖像智能分析與處理的關鍵技術,是數據融合、運動檢測和目標識別的必要前提。配準算法將不同時間、不同傳感器、不同視角及不同拍攝條件下獲取的兩幅或多幅圖像進行幾何關系[1]匹配,其最終目的在于建立兩幅圖像像元之間的對應關系。圖像配準技術主要應用于醫學圖像分析、遙感數據分析、模式識別與計算機視覺等領域。
目前常用的圖像配準方法大致可分為四類,即基于灰度域、頻域的配準方法,以及利用圖像低級、高級抽象特征的配準方法。近年來,基于灰度域互信息的多譜圖像配準方法成為研究熱點,互信息測度對輸入圖像不作任何相關性假設,且該方法由于不需要對原始圖像進行任何預處理,具有較好的魯棒性和較廣的適用范圍,非常有利于實現多模圖像的自動配準;其在醫學圖像配準領域已取得了巨大成功,在多源遙感圖像配準上的拓展與應用也迅速成為了研究熱點。
互信息模型用于圖像配準有兩點不足:a)優化方法效率較低。在互信息圖像配準的優化算法中,常用的Powell直接優化方法不需要計算目標函數的導數且計算簡單;Powell多方向搜索算法[2,3]與一維Brent梯度搜索法的聯合優化方法通常是優化互信息目標函數的首選。但是Powell方法在初始迭代中需要對各個自由度進行試探搜索,之后才會進入下降階段,而常采用的塔式分解計算結構則希望在塔的低分辨率層上完成大部分迭代,而在較好的分辨率層上一步或幾步之內達到最優解。顯然,Powell方法不適于塔式分解的計算結構。b)聯合概率密度估計誤差較大,從而影響配準精度。
Inglada[4]分析了互信息模型配準的插值和直方圖估計誤差問題;為使互信息模型更魯棒,Shu[5]采用圖像對比度圖作為輸入圖成功提高了配準正確率;Shams等人[6]采用梯度強度作為輸入,將配準步驟分為三步以降低計算復雜度。
為有效提高配準效率且充分發揮互信息模型的優勢,針對上述不足,本文首先對待配準圖像構建樣條金字塔,最大限度地降低計算復雜度,采用Parzen窗精確求解聯合直方圖的估計,同時引入Newton方法對目標函數進行優化。Newton方法具備二次收斂性,在最優解附近搜索時能在一步或幾步內達到最優,這充分利用了塔式結構的優點。實驗表明,該方法在保證配準精度不失真的情況下,大幅提高了配準速度,具有較好的魯棒性。
1 互信息理論
互信息測度[2]認為兩幅具備共同結構的圖像達到最佳配準時它們對應的像素灰度互信息為最大,不需要對多模圖像灰度間關系作任何先驗假設,也不需要對圖像進行分割和預處理。互信息測度充分利用了概率統計學中的聯合和邊緣概率分布理論及信息論中的熵和互信息原理。式(1)中的互信息表述了兩個系統A和B間的統計相關性。
I(A,B)=H(A)+H(B)-H(A,B)=
H(A)-H(A|B)=H(B)-H(B|A)(1)
圖像配準過程[7]通過優化搜索算法搜索最優化配準參數α,使得互信息達到最大:
α*=arg maxα I(α)(2)
2 配準方法
2.1 塔式分解
圖像的塔式分解能夠大幅降低配準的計算量。通常配準過程從金字塔的頂部開始,在這一級平移參數集合都被大幅縮小,這將導致常用的單位量起始點距離最優解的距離更近,大幅增強了計算的魯棒性。在后續的各級上參數解被不斷修正,優化過程在最高分辨率級上取得最終解。為使各分辨率之間的最優解之間距離最近,本文引入樣條金字塔結構,將輸入圖像從最高分辨率起使用二維三次B樣條插值濾波器逐級降二維采樣,定義如下:
β3(x)=1/2|x|3-|x|2+2/30≤|x|< 1
-1/6|x|3+|x|2-2|x|+4/31≤|x|<2
0 2≤|x|(3)
2.2 聯合直方圖估計
Parzen 窗估計法利用已知樣本對總體分布密度函數進行估計,基本思想是利用落在一定范圍內各點密度的平均值對總體密度函數進行估計。設x為d維空間中任意一點,為了對x處的分布概率密度p(x)進行估計,本文以x為中心畫一個邊長為hN的超立方體,則其體積為VN=hdN N為總體樣本數。x處的概率密度p(x)的估計值為
p(x)=1/N∑Ni=11/VN((x-xi)/hN)(4)
其中:(u)為Parzen窗函數。本文中選取三次B樣條函數作為核函數,并將上式擴展到二維空間,設點的集合為Θ,得到
p(x,y)=1/(MN)∑i∈Θ1/(VNVM)β3[(x-xi)/hN]×β3[(y-yi)/hM](5)
2.3 優化方法
傳統的Powell搜索方法在逐次的一維搜索中動態構造梯度下降方向,通過引入Brent一維搜索方法能夠提高搜索速度。但是Powell方法在最優解附近表現出較低的效率,原因在于該方法在進入真正的下降前需要對每個一維搜索方向作出嘗試,從而不能充分利用塔式計算結構的獨特優勢。通過引入Parzen窗[8]和樣條插值函數,可以求得信息量s(μ)=-I(μ)的梯度S/μ和Hessian矩陣2S的解析式。
定義參考圖和浮動圖的離散灰度集合分別為LR、LT,參考式(5),定義聯合概率密度p(l,k;μ)=α(μ)h(l,k;μ)。其中α(μ)=∑l∈LT∑k∈LRh(l,k;
在具體實現中,可參照Marquardt-Levenberg方法,對2S疊加對角矩陣以確保正定。
3 實驗結果
本文實驗分別對單模光學圖像、多譜段遙感圖像進行配準。參與實驗比對的優化算法有Powell算法[2]、Shams[6]分步方法和本文方法。 本文實驗中所有Powell搜索方法在一維方向上均采用了Brent加速方法。圖1為光學圖像對,圖2分別為多通道制圖儀Daedalus通道2和4的圖像對,分辨率均為512×512;采用MATLAB 7.0 實現具體配準算法。
從表1的實驗結果看出,本文方法引入的Newton方法充分利用了塔式結構的特性,在基本保證運算精度的前提下大幅度提高了配準速度。
表2給出了對多譜圖像配準的實驗結果。由于多模態圖像的MI曲面平滑性較差,且更容易陷入局部極值,本文實驗對這類圖像預置較小的失真。綜合結果表明本文方法在基本保證運算精度的前提下,比Powell[2]方法運算速度提高了3倍左右,比分步互信息[6]計算速度提高了50%。
為測試算法的配準成功率,本文選取一組含150幅Daedalus多譜圖像對的圖像組作為測試對象,測試平移和旋轉角范圍為0≤θ<5°,-10≤ΔX<10,-10≤ΔY<10。實驗結果表明:文獻[2,6]算法和本文算法的配準成功率分別為42%、55%、72%,證明了在不引入全局優化算法的情況下,本文算法由于引入了高精度樣條金字塔,成功提高了收斂范圍。