韓月,康維新,李慧
哈爾濱工程大學(xué) 信息與通信工程學(xué)院,黑龍江 哈爾濱 150001
高光譜遙感技術(shù)是近年來非常流行的技術(shù)之一,通過遙感平臺形成的圖像具有高光譜分辨率、低空間分辨率的特點,這樣就造成了圖像中的一個像元中不僅包含一種純粹地物,往往含有多種地物,稱為混合像元[1][2]。非負矩陣分解(non-negative matrix factorization, NMF)[3]算法是基于線性光譜混合模型(linear spectral mixture model,LSMM)[4]進行展開的,是當(dāng)今較為流行的盲源分離(blind signals separation, BSS)算法之一,廣泛應(yīng)用于圖像處理。NMF最早由Paatero和Tapper[3]發(fā)現(xiàn),此后,Lee和Seung[4]分別介紹和推廣了它的概念。NMF是基于數(shù)據(jù)非負的條件下進行的,這樣能更好的貼合實際物理意義,使研究更具現(xiàn)實意義。此后,多種基于NMF的改進算法相繼提出,2005年Chen Z[5]提出了平滑約束的非負矩陣分解,在端元矩陣和豐度矩陣加入平滑約束(CNMF),提高了NMF算法的精度,2007年Miao Li等[6]將最小體積約束加入到非負矩陣分解(MVC-NMF),提高了分解過程的抗噪性能,2009年Qian Y等[7]提出L1/2稀疏約束的NMF,使解混結(jié)果更稀疏和精確。2014年魏一葦?shù)萚8]提出改進的MVC-NMF。有些真實地物信息通過科學(xué)測量可以獲得,但以上方法都沒有利用真實地物信息,浪費數(shù)據(jù)資源。Tang 等[9]將端元矩陣分成兩部分,一部分代表已知端元,另一部分代表未知端元,但缺點是求解時間長且結(jié)果不稀疏。本文利用已經(jīng)獲得的真實地物信息作為先驗信息對非負矩陣分解進行優(yōu)化,改善利用先驗信息求解時間長的缺陷。


W←W·XHT·/WHHT
(1)
H←H·WTX·/WTWH
(2)

隨著高光譜數(shù)據(jù)解混研究的不斷深入,真實高光譜圖像中的某些特征的先驗知識是可以獲得的。在礦區(qū)等多個場景中,鐵、云母石等材料通過現(xiàn)場調(diào)查極易識別,因此它們的光譜特征可以從光譜庫中獲得。由于現(xiàn)今的大多數(shù)分解算法在建立模型時并沒有考慮這些真實端元的已知條件,造成數(shù)據(jù)浪費及解混結(jié)果精度偏低。本文提出基于已知端元約束的非負矩陣分解的高光譜解混方法則可充分利用已知端元信息。
本文算法根據(jù)文獻[10]建立基本模型為:
(3)
式中:W1、H1分別代表已知端元矩陣和豐度矩陣;W2、H2分別代表未知端元矩陣和豐度矩陣。添加約束后模型為
(4)

由于端元不能隨意確定,當(dāng)現(xiàn)場的測量端元與估計的端元相差太大時也會產(chǎn)生極大的誤差,因此本文將真實端元與初始化端元之間范數(shù)相對小的數(shù)據(jù)作為已知端元,保證解混結(jié)果的精度。
本文算法步驟如下:
輸入高光譜圖像數(shù)據(jù)X∈RL×N
利用頂點成分分析(vertex component analysis,VCA)和全約束最小二乘(full constraint least square,F(xiàn)CLS)對端元和豐度進行初始化,計算真實端元與初始端元的范數(shù),選出已知端元;根據(jù)式(4)處理數(shù)據(jù);
輸出W,H
2實驗及結(jié)果分析
在高光譜解混中,常見的評價指標(biāo)有光譜角距離(spectral angle distance,SAD)和均方根誤差(root mean square error, RMSE)[13]。SAD表示估計端元與初始端元之間的光譜角距離,RMSE表示端元對應(yīng)的估計豐度信息與真實豐度之間的均方根誤差。光譜角距離越小,均方根誤差值越小,說明解混效果越好。在合成數(shù)據(jù)中可以同時利用以上兩種評價指標(biāo)來評判解混效果,在真實高光譜數(shù)據(jù)中,由于缺乏現(xiàn)場真實地物的分布圖,不能利用RMSE進行衡量。
SAD表示為:
(5)

RMSE表示為:
(6)

從美國地質(zhì)勘探局(USGS)測量的光譜數(shù)據(jù)庫選取不同端元合成模擬數(shù)據(jù),此光譜數(shù)據(jù)庫含224個波段,501個端元,波長范圍為0.38~2.5 μm,光譜分辨率達10 nm。本文選取其中5種端元作為端元矩陣;隨機生成相應(yīng)的豐度矩陣,同時滿足 “非負”與“歸一化”雙重約束,且服從 Dirichlet 分布。合成數(shù)據(jù)中含有真實端元信息和真實端元分布情況,因此在對解混結(jié)果進行評價時采用SAD和RMSE。
2.2.1 不同像元的合成數(shù)據(jù)的實驗
為了對比不同像元個數(shù)的高光譜數(shù)據(jù)對解混結(jié)果的影響,在本次實驗中,利用不同像元個數(shù)分別為20×20、40×40、60×60、80×80、100×100的合成數(shù)據(jù)進行對比實驗。當(dāng)實驗達到最高迭代次數(shù)停止運算。本文給出了解混所得端元矩陣的光譜角距離SAD均值和豐度矩陣的均方根誤差RMSE的均值計算結(jié)果。
在這個實驗中,分別進行本文算法與其他對比算法對不同像元合成高光譜數(shù)據(jù)的解混,此實驗中,端元矩陣和豐度矩陣均已知,因此實驗得出的SAD和RMSE結(jié)果精度較高。表1和表2分別給出了合成數(shù)據(jù)在不同像元情況下利用本文算法解混與其他對比算法的SAD和RMSE比較。
由表1可以看出,本文算法的SAD數(shù)值始終比其他對比算法要低得多,即解混得到的估計端元與真實端元信息最為靠近,在80×80像元的情況下,本文算法得出的解混效果最好;由表2可以看出本文算法得出的豐度信息更為接近真實豐度信息,解混效果最好;由表3可以看出本文提出算法相比其他算法對數(shù)據(jù)解混所需時間是最少的,但是比單純NMF算法時間長,這是因為NMF算法模型簡單,且容易陷入局部最優(yōu)。

表1 不同像元合成數(shù)據(jù)解混后SAD比較 (°)

表2 不同像元合成數(shù)據(jù)解混后RMSE比較

表3 不同像元合成數(shù)據(jù)解混所需時間比較 s
2.2.2 不同噪聲的合成數(shù)據(jù)的實驗
為了判斷本文算法的抗噪性能,實驗采用添加不同噪聲的合成數(shù)據(jù)進行解混,并與其他算法的解混效果進行對比。合成數(shù)據(jù)分別加入25、35、45、55、65 dB的噪聲,當(dāng)實驗達到要求或到達最大迭代次數(shù)停止迭代,本文給出了解混所得端元矩陣的光譜角距離SAD均值和豐度矩陣的均方根誤差RMSE的均值計算結(jié)果。
在這個實驗中,分別進行本文算法與其他對比算法對添加不同噪聲的合成高光譜數(shù)據(jù)的解混,端元矩陣和豐度矩陣均已知,因此實驗得出的SAD和RMSE結(jié)果精度較高。表4和表5給出了合成數(shù)據(jù)在添加不同噪聲情況下利用本文算法與其他對比算法解混結(jié)果的SAD和RMSE比較。由表4可以看出,本文算法的SAD數(shù)值始終比其他對比算法要低得多,即解混得到的估計端元與真實端元信息最為靠近,在添加噪聲為65 dB時,本文算法得出的解混效果最好;由表5可以看出隨著噪聲增大,本文算法的解混效果整體呈上升趨勢,得到的估計豐度信息更為接近真實豐度信息,解混效果最好;由表6可以看出本文提出算法比其他對比約束NMF算法對數(shù)據(jù)解混所需時間更少,但是比單純NMF算法時間長,這是因為NMF算法模型簡單,容易陷入局部最優(yōu)。

表4 不同噪聲合成數(shù)據(jù)解混后SAD比較 (°)

表5 不同噪聲合成數(shù)據(jù)解混后RMSE比較

表6 不同噪聲合成數(shù)據(jù)解混所需時間比較 s
真實數(shù)據(jù)選自1997年AVIRIS在美國內(nèi)達華州采集的Cuprite地區(qū)的高光譜圖像數(shù)據(jù)。濾除對實驗不利或無用的波段后,高光譜數(shù)據(jù)為X∈RL×N,L=180,N=250×191,即共有188個波段,47 750個像元。根據(jù)實際測量的地物信息,選取其中8種地物作為真實端元進行解混。由于缺乏真實場景下的端元分布信息,利用SAD和豐度圖對解混結(jié)果進行評價。真實高光譜解混后豐度如圖1。

(a)地物1 (b)地物2 (c)地物3

(d)地物4 (e)地物5 (f)地物6

(g)地物7 (h)地物8 圖1 真實高光譜解混后豐度圖
圖2是本文算法和其他對比算法對高光譜解混后的SAD比較。由圖1、2可以看出本文算法得到的解混效果更好。

圖2 各算法解混后SAD比較
通過真實數(shù)據(jù)解混實驗得到各個算法所需時間分別是42.082 3 s(NMF)、2 412.759 820 s(MVC-NMF)、913.002 5 s(L1/2-NMF)、37.708 0 s(本文算法)。相比可知,本文算法對真實數(shù)據(jù)解混所需時間更短。
本文在NMF方法來解決高光譜解混問題的基礎(chǔ)上對其進行優(yōu)化,添加先驗信息約束,使解混結(jié)果更接近真實情況。根據(jù)實驗數(shù)據(jù)分析,NMF及MVC-NMF算法收斂效果差,L1/2-NMF算法對空間信息利用不足,本文算法克服了以上的缺點,使計算過程中有較好的收斂效果,同時很大程度地利用了先驗信息。仿真實驗結(jié)果表明,相對于MVC-NMF算法和L1/2-NMF算法,本文提出的算法具有更好的抗噪性能,即使在多個像元情況下,也有較好的解混效果。如何保證算法的穩(wěn)定性值得進一步研究。