陳 雷,劉靜光,張立毅,,李 鏘,孫彥慧
?
基于像元混合模型估計的高光譜圖像解混
陳 雷1, 2, 3,劉靜光2,張立毅2,3,李 鏘2,孫彥慧2
(1. 天津大學 精密儀器與光電子工程學院,天津 300072;2. 天津大學 電子信息工程學院,天津 300072;3. 天津商業大學 信息工程學院,天津 300134)
在高光譜圖像中,線性混合像元和非線性混合像元同時存在,若采用基于單一混合模型的解混算法,會使解混精度降低。因此,提出采用神經網絡對高光譜圖像中的像元混合模型進行估計,然后針對不同的混合模型進行相應的像元解混。像元解混時,在目標函數中添加豐度非負和豐度和為一約束項,利用差分搜索算法優化求解目標函數以實現高光譜圖像的解混。仿真和實際高光譜數據實驗表明,本算法提高了解混精度,適用于線性和非線性混合模型。
高光譜圖像解混;神經網絡;像元混合模型;差分搜索算法
由于高光譜成像儀器空間分辨率的限制,高光譜圖像中多數像元是由多種地物光譜組合而成,這些像元被稱為混合像元。如何從混合像元中提取出各種光譜成分(端元)和各光譜成分所占的比例(豐度),實現高光譜圖像解混,是目前高光譜遙感領域研究的重點。高光譜圖像中像元混合模型可以分為線性混合模型(Linear Mixing Model,LMM)和非線性混合模型(Nonlinear Mixing Model,NLMM)。線性混合模型建模簡單、物理意義明確,是研究高光譜圖像解混常用的模型。該模型假設在宏觀尺度上地物之間沒有相互作用,每個像元是各個端元的線性混合。但在實際高光譜圖像中,微觀尺度上的地物和宏觀尺度上存在多層結構的地物之間會存在散射現象,此時需要利用非線性混合模型進行描述[1]。
與基于線性混合模型的解混算法相比,非線性混合模型的解混算法[2-5]取得了較好的效果。但在高光譜圖像中,往往同時存在線性和非線性混合的像元,單純采用基于非線性混合模型的解混算法對非線性混合的像元具有較好的解混效果,但由于模型不完全匹配,對線性混合像元的解混精度會有所下降。因此,本文首先采用人工神經網絡(Artificial Neural Network,ANN)對像元的混合模型進行估計,然后分別對線性混合像元進行線性解混,對非線性混合像元進行非線性解混,以提高整體解混精度。在解混過程中,采用差分搜索(Differential Search,DS)算法[6]對目標函數進行優化求解。
線性混合模型通常假設地物之間沒有相互作用,每個像元是端元光譜和相應豐度的線性混合,其模型為:
=+(1)
式中:是混合像元;=[1,2, …,m]是光譜矩陣,每一列是維的端元光譜,是端元個數;=[1,2, …,]是豐度向量;是白噪聲。根據端元混合的實際意義,混合模型必須滿足豐度和為一約束(Abundance Sum-to-one Constraint,ASC)和豐度非負約束(Abundance Nonnegative Constraint,ANC),其定義為:

非線性混合模型大都基于輻射傳輸理論,比較典型的有Hapke模型[2]和SAIL模型[3]等。這些模型的物理意義明確,但需要大量的先驗知識,計算復雜,依賴于地物類型。為了簡化非線性模型,一些學者提出了雙線性混合模型,將兩種物質之間的散射加入到線性模型中。該類模型包括NM模型[4](Nascimento Model)和Fan模型[5](Fan Model)等。其中Fan模型是較為典型的雙線性模型,它忽略3種及以上端元之間的散射現象,將兩種端元光譜的交叉乘積項加入到線性混合模型,并認為該乘積項的幅度與所包含端元的豐度有關。該模型更好地保留了非線性模型的物理意義,能夠獲得更高的解混精度,被廣泛應用于高光譜圖像非線性解混中,其模型為:

式中:和分別表示第個端元光譜向量和第個端元光譜向量在該像元中的豐度值;m⊙m表示第個端元光譜向量和第個端元光譜向量的Hadamard乘積(對應位置相乘)。非線性模型中的豐度同樣要求滿足式(2)的約束。
人工神經網絡有多種模型結構,其中前饋神經網絡(Feed-Forward Neural Network,FNN)由于結構簡單、計算量小而被廣泛應用。其中,BP神經網絡是一種多層前饋神經網絡。信號在前向傳遞過程中,通過誤差反向傳播來不斷調整網絡的權值和閾值,使網絡中的傳輸誤差達到最小。
本文采用BP神經網絡來估計像元的混合模型,輸出數據由{-1,1}構成。其中,1表示線性混合像元,-1表示非線性混合像元,網絡中采用雙曲正切函數作為隱層的傳輸函數。為了避免過度擬合并提高網絡適用性,在訓練過程中使用正則化技術,而不采用提前停止或交叉驗證的方法。與此同時,在正則化過程中加入網絡權值和偏差相關項。為了對實際高光譜圖像中像元的混合模型進行估計,首先采用基于幾何理論的端元提取算法來提取實際數據中的端元,該種算法同樣適用于非線性混合模型[7]。然后根據式(1)和式(3)得到神經網絡的訓練樣本。本文采用貝葉斯反向傳播訓練算法,該算法根據Levenberg-Marquardt方法優化權值和偏差,能最大限度地減小權重和誤差平方組合的值,產生更具有適應性的網絡,從而提高對像元混合模型估計的準確性。
通過上述兩次調查我們發現,解戒人員在社區康復過程中,初期確實有一定的效果,操守率遠比沒有進行社區康復的人員高,可隨著時間的推移,社區康復作用在慢慢弱化,實驗組和對照組人員操守率差距越來越小。筆者認為,除了本身個人意志等主觀因素外,社區康復在一定程度上促成“毒友圈”的形成,在人員跟進方面“虎頭蛇尾”,除了簽字、報到、驗尿,涉及心理咨詢、工作安置、疾病治療等全方位手段執行不到位、造成解戒人員對社區康復失去信心也是造成操守率持續下降的重要原因。因此,社區康復工作必須在為社區康復人員解決實際困難上下功夫,而非將“簽字、報到、驗尿”作為主抓工作,這樣才能逐步降低復吸率。
在得到像元混合模型估計后,針對不同的混合模型進行相應的解混。像元解混算法大都采用最小二乘估計[7-9]或基于神經網絡[10-11],它們都是基于梯度類優化的算法。而梯度類算法本身是一種局部極值搜索算法,易陷入局部收斂,并且添加約束項的方法復雜。為避免這一缺陷,本文提出采用差分搜索算法對可行解空間進行全局極值搜索,并通過在目標函數中添加豐度約束項來實現高光譜圖像的有效解混。
差分搜索算法[6]是土耳其學者Pinar Civicioglu于2012年根據生物體在遷徙過程中尋找有利生存區域(停歇地)而提出的一種新的仿生智能優化算法。該算法為提高全局收斂性,在生物體尋找停歇地的過程中,根據布朗隨機運動原理定義遷徙規則如下:
site=+×map(donor-) (4)
式中:代表生物體當前位置;是采用gamma分布生成器產生的隨機數;map是一個由0和1構成的選擇器;donor是生物個體隨機重新排序組成的矩陣;donor-表示生物體下一步要運動的方位指向。差分搜索算法的流程圖如圖1所示。

圖1 差分搜索算法流程圖
本文采用仿生智能優化算法作為優化方法進行高光譜圖像的解混,算法的計算復雜性與所使用仿生智能優化算法的搜索策略、生物個體數量和進化代數相關。本文所采用的差分搜索算法搜索策略簡單、全局優化能力強,可以在少量的生物個體數量和較少的進化代數的情況下有效地完成解混過程。


根據高光譜圖像豐度非負和豐度和為一特性,在差分搜索算法解混過程中添加相應的約束項。針對每個像元,定義豐度非負約束項為:

式中:為正整數,本文取=1;s-表示豐度估計向量中小于零的元素。定義豐度和為一約束項為:

式中:為正整數,本文?。???梢姡斚裨獫M足ANC和ASC時,ANC()和ASC()的值都為零。

式中:1和2代表兩個約束項的權重值。利用差分搜索算法優化式(8)得到像元的豐度估計。本文算法具體實現過程如下:
步驟1 利用HySime算法[12]估計觀測數據中端元數目,并用VCA算法[13]提取端元,采用Dirichlet分布產生豐度。
步驟2 將端元和豐度按照式(1)或式(3)混合得到訓練樣本,并用樣本進行訓練得到像元混合模型估計的網絡。
步驟3 把觀測數據輸入到訓練好的網絡,得到像元混合模型的估計。
步驟4 設置差分搜索算法中的種群數量、搜索維數、迭代次數和邊界限制范圍。
步驟5 初始化生物群體所處的位置,得到初始的豐度估計。根據像元混合模型的估計結果,代入式(1)或式(3)得到重構的觀測數據,將其代入式(8)得到初始的適應度值。
步驟6 生物群體按照式(4)進行尋優,并進行邊界限制。
步驟7 若生物個體尋找到的新位置的適應度值優于當前位置,則將該個體當前位置替換為新位置;否則保持當前位置不變。
步驟8 當達到設置的迭代次數后,優化結束,得到最終的豐度估計值;否則繼續進行優化求解過程。
實驗中,采用均方根誤差(Root Mean Square Error,RMSE)和重構誤差(Reconstruction Error,RE)兩個指標來衡量算法性能。其中,RMSE用來衡量豐度估計的準確度,定義為:

式中:和s分別表示真實豐度和估計出的豐度,是像元總數。RE定義為:


仿真實驗數據中的端元光譜取自美國地質勘測局(USGS)提供的礦物光譜庫,光譜數據為244個波段。從中選取3種光譜作為端元,豐度由Dirichlet分布產生,滿足ANC和ASC特性。神經網絡樣本集選取5000個像元,測試數據為2000個像元,在混合過程中加入20dB高斯白噪聲,差分搜索算法中種群數量設為30,迭代次數設為200,上限值和下限值分別設為0和1,1=2=0.5。
為了驗證神經網絡估計像元混合模型的有效性,設計仿真數據由LMM和NLMM共同構成,用本文提出的解混算法對該數據進行3種形式的解混。第1種按照LMM解混;第2種按照NLMM解混;第3種按照用神經網絡得到的像元混合模型估計,進行相應的LMM和NLMM解混,表1給出了這3種解混方案的RMSE和RE值??梢姡髢煞N方案解混性能優于第1種,說明用線性算法解混非線性混合像元會產生較大誤差,證明了非線性解混的有效性。第3種方案的解混精度高于第2種,說明單一使用非線性算法解混混合特性模型光譜圖像時,解混精度會下降,證明了用神經網絡估計像元混合模型的有效性。
為了進一步驗證本文算法的有效性,與文獻[14]提出的線性解混算法和文獻[5]提出的非線性解混算法作比較。采用3種混合數據進行實驗,數據1由LMM構成,數據2由NLMM構成,數據3由LMM和NLMM共同構成。表2和表3分別給出各算法的RMSE和RE值。數據1的結果表明,文獻[14]和本文提出的算法性能較好,而在有NLMM混合的數據2和數據3的結果中,文獻[14]的算法性能不如其他兩種算法。數據2的結果表明,本文采用差分搜索算法的解混效果優于文獻[5]算法采用的梯度方法。該實驗同時表明,本文算法根據像元混合模型估計進行相應解混,它適用于線性和非線性混合模型,將更加適應于解混實際環境光譜數據。

表1 本文算法采取不同解混模型性能的比較

表2 不同混合模型下各算法RMSE性能的比較

表3 不同混合模型下各算法RE性能的比較
在本節中,采用高光譜數字圖像采集實驗(Hyperspectral Digital Imagery Collection Experi- ment,HYDICE)中的城市高光譜數據集,對算法性能進行測試。該數據集由210個光譜波段構成,光譜分辨率和空間分辨率分別為10nm和2m,圖像的大小為307×307,圖2是波段為80的灰度圖像。
實驗中,去除水吸收和低信噪比的波段(波段1~4,76~87,101~111,136~153和198~210),只用剩下162個波段進行實驗。該數據集被廣泛應用于高光譜圖像解混和分類研究領域中,文獻[15]提供了該地面實況報告,其成像區域主要有4種地物:瀝青、草地、屋頂和樹木。圖3是用VCA算法[13]提取到的4種地物的光譜。圖4是利用本文算法得到的豐度圖像,結果與實際地物分布相符,通過觀察能夠確定這些端元所對應的地物種類。表4給出了本文算法與文獻[14]和文獻[5]中算法各自的RE值。從中可以看出,本文提出的算法性能優于其他算法。
本文提出一種基于像元混合模型估計的高光譜圖像解混算法,利用神經網絡對像元混合模型進行估計,克服了非線性算法解混線性混合像元時,使解混精度下降的缺陷。同時,采用差分搜索算法對解混目標函數進行優化求解,以克服梯度類優化方法全局收斂性不佳的問題,從而有效實現了高光譜圖像的解混。仿真數據和真實場景數據的實驗結果表明,本文基于模型估計的解混算法較之其他解混算法具有更高的精度,對于實際高光譜圖像具有更好的適應性。本文只采用了兩種混合模型進行估計,在今后的研究中,可以增加對更多種像元混合模型的估計,從而更準確地描述實際地物的混合情況,更好地提高解混精度。

圖2 HYDICE城市高光譜數據(波段80)

圖3 VCA算法提取出的光譜曲線

圖4 HYDICE城市數據的豐度結果

表4 HYDICE城市數據的RE比較
[1] KESHAVA N, MUSTARD J F. Spectral unmixing[J]., 2002, 19(1): 44-57.
[2] HAPKE B. Bidirectional reflectance spectroscopy: 1. Theory[J].:(1978-2012), 1981, 86(B4): 3039-3054.
[3] VERHOEF W. Light scattering by leaf layers with application to canopy reflectance modeling: the SAIL model[J]., 1984, 16(2): 125-141.
[4] NASCIMENTO J M P, BIOUCAS-Dias J M. Nonlinear mixture model for hyperspectral unmixing[C]//XV, 2009, 7477: doi: 10.1117 /12.830492.
[5] FAN W, HU B, MILLER J, et al. Comparative study between a new nonlinear model and common linear model for analysing laboratory simulated-forest hyperspectral data[J]., 2009, 30(11): 2951-2962.
[6] CIVICIOGLU P. Transforming geocentric cartesian coordinates to geodetic coordinates by using differential search algorithm[J]., 2012, 46: 229-247.
[7] ALTMAN Y, HALIMI A, DOBIGEON N, et al. Supervised nonlinear spectral unmixing using a post nonlinear mixing model for hyper- spectral imagery[J]., 2012, 21(6): 3017-3025.
[8] COMBE J P, LAUNEAU P, CARRèRE V, et al. Mapping micro- phytobenthos biomass by non-linear inversion of visible-infrared hyperspectral images[J]., 2005, 98(4): 371-387.
[9] 普晗曄, 王斌, 夏威. 約束最小二乘的高光譜圖像非線性解混[J]. 紅外與毫米波學報, 2014, 33(5): 552-559.
PU H H, WANG B, XIA W. Nonlinear unmixing of hyperspectral imagery based on constrained least squares[J]., 2014, 33(5): 552-559.
[10] 吳柯, 張良培, 李平湘. 一種端元變化的神經網絡混合像元分解方法[J]. 遙感學報, 2007, 11(1): 20-26.
WU K, ZHANG L P, LI P X. A neural network method of selective endmember for pixel unmixing[J]., 2007, 11(1): 20-26.
[11] KARATHANASSI V, SYKASs D, TOPOUZELIS K N. Develop- ment of a network-Based method for unmixing of hyperspectral data[J]., 2012, 50(3): 839-849.
[12] BIOUCAS-Dias J M, NASCIMENTO J M P. Hyperspectral subspace identification[J]., 2008, 46(8): 2435-2445.
[13] NASCIMENTO J M P, DIAS J M B. Vertex component analysis: a fast algorithm to unmix hyperspectral data[J]., 2005, 43(4): 898-910.
[14] HEINZD C, CHANG C I. Fully constrained least squares linear spectral mixture analysis method for material quantification in hyperspectral imagery[J]., 2001, 39(3): 529-545.
[15] GUO Z, WITTMAN T, OSHER S. L1 unmixing and its application to hyperspectral image enhancement[C]//,,XV, 2009, 7334: 73341M.
Hyperspectral Unmixing Based on Estimation of Pixels Mixing Models
CHEN Lei1, 2, 3,LIU Jingguang2,ZHANG Liyi2, 3,LI Qiang2,SUN Yanhui2
(1.,,300072,; 2.,,300072,; 3.,,300134,)
Both linear and nonlinear mixing pixels exist in the hyperspectral images. The unmixing accuracy will decrease if the unmixing algorithm is only based on a single mixing model. In this paper, we propose to adopt neural network to estimate the pixels mixing model in the hyperspectral images, and then unmix the pixels under different mixing models. To achieve the hyperspectral unmixing, we introduce the abundance non-negative constraint and abundance sum-to-one constraint to the objective function, and then the differential search algorithm is used to optimize the objective function. The experimental results on simulated data and real hyperspectral data demonstrate that the proposed algorithm can improve the accuracy of the unmixing, and it can be applied to linear and nonlinear mixing models.
hyperspectral images unmixing,neural network,pixels mixing model,differential search algorithm
TP751
A
1001-8891(2016)02-0132-06
2015-08-03;
2015-10-07.
陳雷(1980-),男,博士后,副教授,主要從事信號高光譜圖像處理,盲信號處理。E-mail:article.com.cn@126.com。
張立毅,E-mail:zhangliyi@tjcu.edu.cn。
國家自然科學基金資助項目(61401307);中國博士后科學基金資助項目(2014M561184);天津市應用基礎與前沿技術研究計劃資助項目(15JCYBJC17100)。