陳軍林, 彭潤民, 閆巖, 趙偉光
(中國地質大學(北京)地球科學與資源學院,北京 100083)
水系提取在地學研究中有很多應用,比如在水系沉積物化探中,需要提取水系網,根據水系網設計采樣點;在遙感蝕變礦物異常提取中,河道中的水體和沉積物會對異常提取產生干擾,需要對水系進行提取和掩模;同時水系還是遙感構造分析和巖性解譯的重要標志[1]。水系提取根據采用的數據可分為基于數字高程模型(digital elevation model,DEM)的和基于遙感影像的,以及二者結合的方法。基于遙感影像的水系提取大多是依據水系中的水體光譜特征,常用方法有單波段閾值法、比值法、波段差值、譜間分析、模式識別和水體指數法等,其中尤以水體指數法最為常用[2-7]。但是,在沖溝、處于枯水期的季節性河流以及干涸的河道中,因缺乏水體,水系與裸地等其他地物光譜特征相似,故上述基于水體光譜特征的方法并不適用。因此,對于干涸水系,目前主要通過增強水體特征[5]、監督分類以及利用除水體光譜特征以外的其他特征,如形態特征和地形特征等[8-13]進行識別提取。顯然,增強水體特征的方法只適合于半干旱的水系;監督分類方法需要人工選擇訓練樣本,存在主觀干預大且耗費人力的缺點;而基于水體形態特征及地形特征的方法則需要借助DEM等除遙感影像以外的其他數據。
針對以上問題,本文提出基于獨立成分分析(independent component analysis,ICA)和形態特征的干涸水系提取方法。ICA是一種線性分解技術,在目標檢測中有很好的應用效果[14-17]。通過優化算法按照統計獨立的原則將觀測數據分解成若干獨立分量,以代表在觀測變量上具有不同實際意義的獨立信號源。在遙感影像目標檢測中,不同地物可以視為不同信號源,它們之間有不同的光譜特征,大多數可以被視為統計獨立的實體。因此,通過ICA可以將目標地物和無關地物信號分解到不同分量中,從而分離出目標。利用ICA提取水系的基本思路是通過ICA對包含水系信號的遙感影像進行分離,使得水系獨立于其他地物信號,從而識別出水系。ICA是一種非監督方法,不需要選擇訓練樣本,不借助DEM等其他數據,僅利用遙感影像就可進行水系識別,操作簡便,能夠克服傳統方法的諸多不足。
通過ICA提取的水系信息分量圖中難免有一些來自于相似地物以及背景的噪聲。傳統上對于噪聲像元通過數學形態學濾波方法[18]進行壓制,能夠起到一定的作用,但該方法是全局統一尺度的,無法兼顧水系信息的保持和噪聲去除,一些較大的噪聲圖斑無法消除。為了克服這些噪聲無法消除的問題,本文提出在數學形態學濾波的基礎上再進行基于圖斑形態參數的噪聲分離。即將經過數學形態學濾波的ICA水系分割二值圖像轉換為矢量對象,提取每個矢量對象的形態參數,用這些形態參數作為依據進行水系和噪聲的分離。
以內蒙古自治區烏拉特后旗獲各琦地區為例,應用ICA方法對ASTER影像數據進行線性分解,提取出代表水系信號的獨立成分分量,對水系分量進行基于中值濾波的背景抑制,以增強局部信息,減少背景干擾;然后采用數學形態學濾波進行初步去噪;再通過將分割結果轉換為矢量對象,提取出對象的形態特征,并用這些特征進行基于規則的噪聲消除,最終分割出水系。
研究區位于內蒙古自治區烏拉特后旗獲各琦蘇木,陰山山脈狼山段西北側,處于山脈與高原轉換的部位,面積為125 km2。主要地形為山地、低山丘陵以及砂礫戈壁,植被覆蓋極少,主要分布在河道及溝谷處。區內水系發育,主要為山洪沖擊侵蝕形成,無雨時干涸見底,大雨時則為山洪泄溢通道。該地區屬溫帶大陸性氣候區,全年干旱少雨,蒸發量大。絕大多數河床常年暴露,無水體流淌,河道中以第四系河沙、風成沙為主,含有少量礫石及土壤。研究區遙感影像如圖1所示。圖1(b)為該地區典型的干涸水系地貌,僅少數河道可見地下水形成的持續水體,且規模較小。

(a) 研究區ASTER B3(R),B2(G),B1(B)合成影像 (b) 典型干涸水系局部放大(必應地圖)
ASTER影像數據具有光譜和空間分辨率較高、覆蓋范圍廣、數據容易獲取的特點,在水系提取中應用廣泛[5,19-20]。該數據具體參數見文獻[14]。其中熱紅外波段由于空間分辨率較低,會影響分類精度,故本文僅采用了2005年9月13日的ASTER L1T數據(軌道號130/31)中的B1~B9波段,統一重采樣為15 m空間分辨率,用ENVI5.2軟件對原始數據進行了輻射定標、大氣校正、重采樣和裁剪等預處理。研究中截取了水系發育、地物復雜多變的部分區域用來驗證本文提出的方法(圖1(a))。
ICA是20世紀90年代后期隨著盲源信號分離問題發展起來的一種信號處理方法。在不知道源信號和傳輸通道參數的情況下,從觀測信號出發,根據源信號的統計特性找到非高斯數據的線性表示,將其分解成在統計上獨立的組分[15,21],以作為對源信號的一組估計。ICA與主成分分析(principal component analysis,PCA)同屬線性變換技術,但PCA只能消除數據之間的二階相關性,而ICA則考慮到了數據間的高階統計特性,保證了變換后分量間相互獨立[22-24]。
設x=(x1,x2,…,xm)T為觀測數據陣,生成該數據陣的獨立源為s=(s1,s2,…,sn)T,假定第i個觀測信號xi由n個獨立成分s線性混合而成,則
xi=ai1s1+ai2s2+…+ainsn,i=1, 2, …,m,
(1)
以向量形式表示為
x=A·s
(2)
式中A=(a1,a2,…,am)是一個n×m的混合矩陣,用來組合疊加信號s。式(2)即ICA的基本模型。
ICA理論認為用來觀測的混合數據陣x是由獨立源s經過A線性加權獲得。A和s都是未知的,x是已知的,ICA的目標就是根據x來求出s的估計y,這個過程也稱作為盲源信號分離。求解思路是通過x求得一個分離矩陣W,使得W作用在x上所獲得的信號y是獨立信號源s的最優逼近,該關系可以表示為
y=W·x=W·A·s
(3)
當估計量與源信號最接近時,有
y=s
(4)
根據式(3)和式(4)可得,W=A-1
(5)
因此,問題求解的思路就是要找到最接近A的逆矩陣A-1的分離矩陣W。ICA模型的估計方法主要有非高斯的最大化、互信息的最小化(互熵最大化)和最大似然函數估計等[25]。本文使用ENVI5.2軟件中的ICA模塊執行ICA算法。
通過ICA將數據分解成不同的分量,分別代表對不同獨立信號源的近似估計。由于各個分量之間是統計獨立的,不同信號源中的信息被集中到不同分量中。對于水系分量來說,水系信息被突出顯示,呈現高頻特征,而與水系信號在統計上獨立性較大的其他信號源的信息在該分量中較少,在圖中表現為低頻信息,呈現較為連續的低緩背景,即背景值。這些背景值在空間上是有漲落變化的,如果用統一的閾值去分割水系目標和背景,就可能造成錯分,導致一些弱的水系信息不能被識別,而一些強的背景信息會被提取為水系。同時,利用ICA分解出的水系分量中可能包含其他與水系信息比較相似的地物信息,會對水系提取造成干擾。綜上所述,通過ICA提取的水系分量中可能包含的干擾信號來自于相似信號源和背景信號漲落2方面。對于相似地物造成的干擾較難分離,可以通過后續的基于形態特征的方法進行消除;對于背景造成的干擾,有很多處理方法,其中基于中值濾波的背景抑制方法是一種常用的方法[26]。該方法的具體做法是:選擇合適大小的窗口進行中值濾波,用濾波值代表每個像元點的局部背景值,將所有像元點的實際灰度值與濾波值相減,得到的值就能很好地降低背景干擾,增強水系信息。
將經過局部信息增強的圖像用閾值分割方法分割出水系。這種基于像元灰度值分割出來的結果中必然含有一些噪聲,傳統上可通過數學形態學濾波將這些噪聲與水系信息分離[18,27]。但由于數學形態學濾波是全局統一尺度的濾波,無法兼顧水系信息的保持和噪聲去除,仍可能會在消除噪聲的同時造成細小水系信息的丟失,且當噪聲數據較大時無法消除,因此應用效果比較有限。而將分割出的圖斑轉換為矢量對象后,圖斑即具有形態屬性,如面積、長寬比和形狀等,這些特征可以幫助區別水系信息和噪聲。在轉換為矢量的對象中,水系對象往往呈連續的長條形大圖斑,而噪聲往往呈零散的小圖斑,提取出這些矢量對象的形態學屬性,從這些屬性中挑選出能夠區別水系和噪聲的特征變量,就可以實現兩者的分離。對于提取出的矢量對象,可以用單個形態變量找出合適的閾值分割水系,如果沒有能夠分離水系和噪聲的單個變量,則需要用多個形態特征變量進行多閾值分割或多變量監督分類。
本文提出的水系提取方法的操作流程見圖2。其中遙感影像預處理、ICA、圖像增強、數學形態學濾波以及監督分類用ENVI5.2軟件完成,圖斑轉矢量及其矢量對象特征提取用eCognition9.0和ArcGIS10.3軟件完成。

圖2 方法流程
對經過了預處理的研究區ASTER影像數據,以可見光波段和近紅外波段(B1~B9)為輸入變量,進行ICA運算,共產生9個獨立成分分量(圖3(a)—(i)),分別記作IC1,IC2,……,IC9。同時,為與常用于特征提取的PCA方法進行對比,將數據利用PCA提取出3個包含水系的主成分分量(圖3(j)—(l)),分別記作PC1,PC3和PC4。通過目視解譯評價各分量中包含水系信息的情況。

(a) IC1 (b) IC2 (c) IC3

(d) IC4 (e) IC5 (f) IC6

(g) IC7 (h) IC8 (i) IC9

(j) PC1 (k) PC3 (l) PC4
由圖3可知,ICA提取的9個獨立成分分量中IC7的水系信息最強,所有水系在IC7中都有所顯示,水系細節清晰,且其他地物信號的干擾較少。IC7之外的其他分量中干擾信息較多,水系信息較少且都不明顯。PCA提取結果顯示水系信息分散在多個主成分分量中,而不是主要集中在某一個分量中,且其中非水系信號干擾也較強。
ICA和PCA方法提取水系的結果對比說明,ICA能夠將水系信息與其他地物信息分解到不同獨立分量中,減少其他地物對水系提取的影響。而PCA不是以分量之間的相互獨立為目標的,所以得到的水系信息與其他地物之間獨立性差,表現在圖上就是在水系分量中存在大量的其他地物信息,與水系信息相互干擾,不利于水系提取。通過與PCA提取結果的對比,可以看出ICA之所以能用于水系提取,關鍵在于其分解結果是對不同獨立信號源的近似估計,獨立分量相互之間統計獨立,即水系和其他地物之間可視為相互統計獨立,因此ICA能夠將水系和其他大部分地物分離成相互獨立的分量,從而分離出水系。
根據ICA分解結果選擇IC7提取水系。IC7中干涸水系集中在圖像中較暗的部分,較亮的部分則代表植被。圖中水系為高頻信息,其余大面積的非水系部分則表現較為連續的低頻信息,為背景值。從圖中可見,背景值在空間上是有變化的,這種變化會給水系信息的提取帶來干擾。除了背景值,還有來自于相似地物的噪聲干擾。利用前文提到的背景抑制及去噪方法消除背景及噪聲影響,結果見圖4。

(d) 濾波圖像閾值分割結果 (e) 數學形態學濾波結果 (f) 基于形態特征去噪結果
圖4(b)為沒有消除背景干擾的情況下通過閾值分割提取的水系,圖中大量的背景信息被分割為水系,而一些水系則被分割為背景,在圖左上角處最明顯。通過基于中值濾波的背景抑制方法來減小背景干擾,具體操作通過ENVI5.2軟件執行,經過反復嘗試,選擇25像元×25像元濾波窗口時背景抑制效果最好(圖4(c))。圖4(d)為經背景抑制后通過閾值分割出的水系信息,結果顯示背景的干擾已大大減少,其中最明顯的是圖4(d)中左上角的大片背景干擾已被消除,而一些較細小的水系能被正確識別。
去背景干擾之后的分割結果與水系的真實分布符合度很高,但仍然有相當數量的錯分像元,噪聲像元非常多。通過ENVI5.2軟件的數學形態學濾波功能,選擇不同尺寸的窗口進行各種數學形態學濾波嘗試,發現3像元×3像元窗口下進行先膨脹后腐蝕的操作能最好地消除噪聲和保留目標信息。圖4(e)為數學形態學濾波結果,從圖中可見,雖然通過數學形態學濾波消除了一部分較小的噪聲,但仍有很多噪聲無法消除。對于這部分噪聲,本文通過提取形態特征進行消除,即對經過數學形態學濾波的圖像,用eCognition9.0軟件進行矢量化,提取出矢量對象,通過矢量對象的形態參數進行噪聲分離。以圖斑為單位進行矢量化,提取出對象的形態參數,具體包括:面積、長度、寬度、長寬比、形狀指數、邊界指數、對稱度和邊界長度。通過觀察每個屬性的空間變化對于水系分布的響應程度確定出用于分割水系的形態特征集,并經過試驗確定出相關變量的閾值,構建水系分類規則,最終分離出水系(圖4(f))。從圖4(f)可見,噪聲大大減少,分割出的水系與實際吻合度很好。
在實際工作中,干涸水系提取更為常用的處理思路是監督分類。通過對比監督分類方法和本文方法的效果來進一步探討本文方法在水系提取中的表現。通過嘗試不同的監督分類方法,本文最終選定效果最好的支持向量機(support vector machine,SVM)算法進行分類和效果比較。SVM算法是一種常用的監督分類方法,在遙感影像分類中應用較多,其原理見文獻[28],本文不再贅述。本文SVM模型采用徑向基函數(radial basis function,RBF)作為核函數,通過網格搜索[29]選取最佳模型參數,分別為懲罰系數C=25,RBF核參數γ=0.116。根據目視解譯分別選擇5 000個水系和非水系的標注樣本,進行模型訓練和分類。分類結果的總分類精度為93.011%,Kappa系數為0.764 6,輸出結果見圖5(a)。通過3像元×3像元中值濾波進行分類后處理,結果見圖5(b)。將監督分類結果與影像疊加(圖5(c))進行對比,發現監督分類結果在影像左上部與實際吻合度較差,這主要是因為左上部一些地層(紅色圈內)的光譜特征與水系光譜特征極為相似,不容易區分。圖5(d)為本文方法提取結果與影像疊加,對比圖5(c)和圖5(d)發現監督分類對于較細小的水系識別正確率較差,如圖中藍色圈內。監督分類識別出的部分水系連續性差,而且非水系地物被分為水系的情況較嚴重(如圖5(c)中紅色圈內)。綜上所述,本文方法整體效果好于監督分類方法,且監督分類方法需要選擇訓練樣本數據,受人主觀因素以及模型和參數的影響較大;而本文方法中ICA不需要設置過多參數,也不需要訓練樣本數據,因此在實際應用中更有優勢。

(a) SVM監督分類結果 (b) SVM監督分類結果去噪處理

(c) 處理后的SVM監督分類結果與影像疊加 (d) 本文方法提取結果與影像疊加
針對干涸水系與裸地等其他地物光譜特征相似,而無法僅利用光譜信息進行干涸水系提取的問題,本文提出了基于ICA和利用形態特征去噪的干涸水系提取方法。對于ICA分離出的水系信息分量,通過中值濾波降低背景干擾,再通過數學形態學濾波和圖斑形態特征消除噪聲,最終得到精度較高的水系分布。經過對內蒙古自治區獲各琦地區的ASTER數據進行實驗,驗證了該方法的實際效果。本文研究結果表明:
1)通過ICA可以實現水系和大部分非水系地物的分離,提取的水系信息獨立分量中水系信息得到增強和突出,其他地物的干擾被大大減少。
2)通過ICA提取的水系分量中存在少量背景干擾和來自于相似地物的干擾,利用基于中值濾波去背景的方法能夠降低背景信息干擾,突出局部水系信息。
3)通過將圖斑矢量化提取其形態特征,可以提升噪聲分離的效果。
4)本文方法能夠很好地用于干涸水系信息的提取,相比于傳統的監督分類方法識別精度更高,且無需訓練樣本數據,操作簡便,實用性強。
5)本文提出的水系識別方法識別的水系結果是通過與原圖進行目視對比,以及通過與大比例尺谷歌地圖進行對比驗證的,尚缺少實地驗證,這是本文存在的不足之處。