張 微,張 偉,劉世英,楊金中,茅晟懿
基于核PCA方法的高分辨率遙感圖像自動解譯
張 微1,張 偉2,劉世英3,楊金中1,茅晟懿4
(1.中國國土資源航空物探遙感中心,北京 100083;2.四川省地質調查院,成都 610081;3.青海省地質調查院,西寧 810012;4.中國科學院廣州地球化學研究所,廣州 510640)
針對基于像元的高分辨率遙感圖像自動解譯存在的缺點,提出一種分三步走的高分辨率遙感圖像自動解譯技術流程:首先采用核PCA進行特征提取,然后采用支持向量機(Support Vector Machine,SVM)進行分類,最后采用擇多濾波器進行分類后處理。通過對覆蓋西藏山南地區的IKONOS圖像的解譯實驗表明,本文方法能夠有效地實現遙感圖像自動解譯,其結果與人工目視解譯圖基本一致,取得了理想的效果。
IKONOS;核PCA;支持向量機;分類后處理
遙感技術具有大尺度、不受自然條件(如地形)和交通條件限制等優勢,在區域地質調查中發揮著越來越重要的作用。多光譜遙感數據是傳統的遙感地質應用的數據源,其中,中低光譜分辨率圖像(如Landsat MSS、SPOT或ASTER)主要用于較大區域尺度下的地質構造與地形地貌解譯[1-3];最近發展起來的高分辨率遙感圖像(如IKONOS、QuickBird或WorldView-2)為地質信息解譯提供了新的數據源,具有更豐富的信息表達,已在地質領域進行了應用[4-9],但仍主要是對圖像的人工目視解譯。人工目視解譯雖然可以獲得較好的分類結果,但工作量大,效率低,具有主觀性強和非定量等缺陷[10]。傳統的針對中低分辨率圖像開發的基于像元的分類技術,僅利用單個像元的光譜特征進行分類,而沒有顧及高分辨率遙感圖像中豐富的空間結構和紋理信息,會導致分類結果存在嚴重的類內噪聲。由于高分辨率遙感圖像存在類內混合像元及大量陰影,使得從光譜波段有限的高分辨率圖像中獲取準確的類別信息變得困難[11,12]。針對基于像元的高分辨率遙感圖像分類存在的缺陷,科研人員已研發了基于對象的分類技術,即以光譜、紋理、形狀和尺度等對象特征為基礎的區域合并分割技術[13]。這種基于對象的分類技術已被成功地應用于多個高分辨率遙感應用領域,但是該類方法需要更多的前處理和后處理,且在分類規則制定方面也需較多的人工干預。
由于遙感圖像的不同波段之間往往存在著很高的相關性,PCA變換的目的就是把原來多波段圖像中的有用信息集中到數目盡可能少的新的主成分圖像中,并使這些主成分圖像之間互不相關,從而大大減少總數據量并使圖像信息得到增強[14]。PCA是地質信息提取中的常用方法,通過對原始樣本的協方差矩陣進行分解,選取前n個最大特征值所對應的特征向量組成最優投影矩陣;再通過將樣本數據在最優投影矩陣上投影而映射到主成分特征空間中。該方法已被廣泛應用于多光譜/高光譜數據的降維處理和信息增強[15,16]。Crosta 等[17]和 Rabelo于1993年就提出了基于PCA方法的Crosta技術,用于TM圖像對褐鐵礦和粘土蝕變制圖,此后被廣泛用于地質信息增強[18-20]。Almeida - Filho[21]則于2002年提出對Landsat ETM+的6個波段進行PCA變換后可區分粘土礦和含鐵礦物。
PCA變換首先根據原始圖像數據矩陣X求出它的協方差矩陣S,即

隨后求出矩陣S的特征值λ和特征向量,并組成變換矩陣T。解算特征方程(λI-S)U=0即可求出協方差矩陣 S的各個特征值 λj(j=1,2,…,m),將其按λ1≥λ2≥…≥λm排列,求得各特征值對應的單位特征向量(經歸一化)Uj:Uj=[u1j,u2j,…,umj]T。U矩陣的轉置矩陣即為所求的PCA變換的變換矩陣T。將T代入,得到PCA變換的具體表達式,即

可以看出,PCA方法是對特征的線性分解,它不適用于揭示遙感圖像中隱含的非線性混合的地質信息。
基于核函數的主分量分析(核PCA)是國際上新提出的一種特征提取算法,是利用核技巧對PCA的一種非線性推廣。對于服從任意分布的觀測數據,核PCA首先利用一個非線性映射函數將觀測數據從輸入空間映射到特征空間中,使得映射數據近似高斯分布;然后對映射數據進行PCA變換。核PCA可以表達圖像像元間的高階關系,提取圖像的非線性特征;同時提供一組相互獨立的主成分信息,能比較好地在高維空間將非線性問題轉化成線性問題,并回避了求取非線性映射的復雜性。
核函數是滿足Mercer條件的任意對稱函數,常用的核函數有:①齊次多項式核 k(xi,xj)=(xigxj)d;②非齊次多項式核 k(xi,xj)=(xigxj+1)d;③徑向基核(高斯核)k(xi,xj)=exp(-γ‖xixj‖)2,γ >0,常用 γ =1/2σ2;④雙曲正切函數k(xi,xj)=tanh(kxigxj+c)。
在核PCA中,首次采用非線性的映射將原始空間轉化為高維空間,即
對于控制室設置有流量計算機的計量系統應根據渦輪流量計的檢定結果,及時修改計算機中設置的儀表系數,確保工況流量傳輸的準確。要根據現場工藝情況以及儀表性能,正確選擇小流量切除的工況點,對于具有壓力、溫度傳輸故障自動補償功能的流量計算機要根據工況設置壓力、溫度的預設值,同時要合理選取壓力、溫度、流量的上下限報警點,以確保流量計算機的正常運行。

式中,k為核函數。
隨后采用傳統的PCA計算高維空間的協方差矩陣,最后得到核主成分。
基于核函數的PCA處理是一種非線性特征提取方法,隨后采用分類方法對這些特征進行監督分類。在分類中采用核函數的非線性映射的思想是最近發展起來的SVM方法。SVM技術基于統計學習理論,該理論早在20世紀60年代中期就已經由Vapnik等人提出并開始研究,20世紀90年代中期,統計學習理論逐漸發展成熟,并形成了一個較完整的理論體系。SVM利用了最大間隔超平面、Mercer核、凸二次規劃、稀疏解和松弛變量等多項技術。在遙感應用領域中的研究表明,SVM能比最大似然分類、神經網絡等傳統分類方法獲得更高的分類精度[22-27]。
SVM是由線性可分情況下的最優分類面發展而來的,所謂最優分類面就是要求分類面不但能將兩個類別正確分開,而且使分類間隔最大。設分類面的方程為x·w+b=0,使得對線性可分的樣本集(xi,yi)(i=1,…,n;x∈Rd;y∈{+1,-1})滿足
yi[(w·xi)+b]-1≥0,i=1,2,…,n (4)此時分類間隔ρ=2/‖w‖,使間隔最大等價于使‖w‖/2最小。
對于非線性問題,與核PCA的處理方法一致,只需將輸入向量映射到一個更高維的特征空間,然后再構造最優分類超平面。不必知道具體的映射函數 ф(xi)的表達式,若 K(xi,xj)=ф(xi)·ф(xj),則稱K(xi,xj)為內核函數。
如前所述,在基于像元的遙感圖像分類中,由于混合像元的存在以及分類算法是針對每個像元單獨進行的,在分類結果圖像中會出現同類地物中夾雜著零散分布的異類地物的不一致現象,表現為類別噪聲[14],這一現象在高分辨率遙感自動分類中更為明顯。為了解決這種不符合實際情況、也不滿足分類要求的問題,可通過平滑后處理來減少或消除類別噪聲的影響。
一種常用的平滑后處理方法是擇多濾波。在這種濾波中,一個移動的窗口通過分類后的數據集,并且確定這個窗口中的優勢類別。如果這個窗口中的中心像元的類別不屬于該窗口的優勢類別,就將該像元的類別替換成優勢類別;如果在窗口中沒有優勢類別,則中心像元的類別不會發生變化。平滑處理中濾波窗口大小的選擇應依據需求進行調整,總體而言,對于原本比較細小的地物用小窗口,窗口太大會消除細小地物;對于原本塊體比較大的地物用大的窗口,可以使邊界更加明顯。已有研究表明,采用Landsat TM進行黃土高原土地利用信息分類時,選用28像元×28像元大小的窗口較為適宜[28];采用SPOT 5進行水土保持信息分類時,選用6像元×6像元大小的窗口為最佳[29]。
IKONOS衛星于1999年發射,是世界上第一顆提供高分辨率衛星圖像的商業遙感衛星,軌道設計高度為682 km,可采集1 m分辨率全色(0.45~0.90 μm)和 4 m 分辨率多光譜(藍波段:0.45 ~053 μm,綠波段:0.52 ~0.61 μm,紅波段:0.64 ~0.72 μm,近紅外波段:0.77 ~0.88 μm)衛星圖像。由于該衛星可選擇探測緯度和傾斜度,因此可獲取指定地點的圖像。該衛星能夠在與地面垂直方向到傾斜45°方向上收集數據,角度變化可以沿著與軌道相交的方向進行,也可以沿著軌道運行方向實現,因而能夠提供橫向和縱向的立體像對。IKONOS圖像已應用于眾多領域(如城市規劃、土地利用調查等),在地質領域已用于滑坡等地質災害監測、礦產資源調查和礦山環境動態監測等工作。
研究區位于岡瓦納北緣晚古生代—中生代岡底斯—喜馬拉雅構造區的岡底斯—拉薩陸塊,以白堊系和三疊系構成本區地層的主體,巖性以碎屑巖、碳酸鹽巖沉積為主,局部為火山巖建造,中心部位則為始新世花崗閃長巖及花崗斑巖,總體呈近東西向展布,主要為燕山晚期至喜山期的中酸性侵入巖與火山巖;第三系則以碎屑巖、湖相碳酸鹽巖和膏鹽沉積為主;第四系為沖—洪積、湖積松散砂卵石層。區內斷裂多呈東西向展布,地層的分布嚴格受構造的控制,具有明顯的分區性和繼承性。部分地區的地層由于受到活動斷裂的破壞而失去了應有的連續性(圖1)。

圖1 研究區地質圖Fig.1 Geological map of the study area
本次研究使用的IKONOS衛星圖像數據的獲取時間為2010年1月29日。該圖像在整個覆蓋區范圍內無云覆蓋,影像清晰,信息豐富,質量較高(圖2)。圖像經過了輻射校正和高精度正射糾正處理。

圖2 研究區IKONOS圖像Fig.2 IKONOS image of the study area
本文選擇研究區中的一處實驗區(圖2中紅色方框內)進行自動解譯實驗(圖3)。

圖3 實驗區域Fig.3 Study region
從人工目視解譯圖(圖3(b))中可以看出,主要有3類地質體——南部的雅魯藏布江(遙感影像呈暗藍色,解譯圖為淺藍色),中偏南部的第四系沖積物Qal4(遙感影像呈淺灰色,解譯圖為淺黃色),中部及北部的下白堊統比馬組(K1b)石英砂巖和砂屑灰巖等(遙感影像呈灰棕色,解譯圖為綠色)。3類地質體在解譯圖上界線明顯、光滑,但在IKONOS圖像上,除水體外,界線并不明顯,尤其是在比馬組地層因受到道路、干枯河道及陰影的切割而顯得支離破碎。其中,道路色調與第四紀沖積物的色調非常相似,而陰影色調與水體一致,上述現象均容易在不同地物信息自動提取中產生混淆。
4.4.1 PCA 與核 PCA 變換
首先對IKONOS衛星圖像進行PCA和核PCA變換,分別得到其特征空間的圖像(圖4)。

圖4 PCA((a)~(c))與核PCA((d)~(f))結果比較Fig.4 Comparison of PCA((a)~(c))and Kernel PCA((d)~(f))
從圖4中可以看出,PCA與核PCA的結果比較類似,均能對目標地物進行信息增強。圖4(a)和(d)分別是PCA和核PCA對水體(紅色)增強的效果,除了東北部細長的山體陰影之外,其他地物均有較好的區分度;與圖4(a)相比,圖4(d)在非水體區域的顏色更加一致,隱蔽了大量不需增強的細節。比較圖4(b)和(e)可以發現,核PCA的結果具有多方面優勢:①第四系沖積物的增強效果相對較好,沒有與道路(圖4(b)中部紅色的線性體)混淆;②水體識別更加準確,不受河流含沙量的影響,而PCA的結果(圖4(b))中東南部的水體與第四系沖積物存在著混淆。最后一個特征波段(圖4(c)和(f))也顯示出核PCA方法具有更好區分能力,不同地物類型區分相對明顯,同時相應地壓制了干擾信息。
以上結果表明,區分遙感圖像中的地物,僅采用PCA這類線性變換的方式尚不足以適用于原本是非線性混合的光譜信息,而采用具有非線性分解能力的核PCA更為合適。
核PCA方法非線性特性的優勢不僅體現在特征增強上,也體現在分類中。如前所述,很多研究均表明了基于核方法的SVM比傳統的分類方法分類精度更高。本文采用SVM方法對核PCA的結果進行自動解譯。
4.4.2 基于核PCA的SVM分類
SVM是一種監督分類方法。很多文獻指出,訓練樣本的選擇在監督分類中非常重要,訓練樣本不同,分類結果就會出現極大的差異。因此在工作區仔細選擇各類訓練場地、正確選取有代表性的訓練樣本是分類能否取得良好效果的一個關鍵性問題。用于監督分類的訓練場地應該是光譜特征比較均一的地區,一般在圖像顯示中根據均一的色調估計只有一類地物,而且一類地物的訓練場地可選取一塊以上[14]。但是在覆蓋實驗區的IKONOS圖像中,除對水體區域可以提取色調均一的訓練樣本之外,對其他區域均難以提取理想的訓練樣本。為了體現方法的魯棒性和減少人為干預,本文以人工目視解譯的結果(圖3(b))為參考,在水體、Qal4和K1b區域內各隨機選擇100個點作為訓練樣本。
SVM的分類結果見圖5,由圖5(a)可以看出,許多明顯的干擾信息(如道路等)得到了去除,基本區分出了待自動解譯的3類地物,但水體和山體陰影仍然存在混淆;另外在圖的左上角出現的Qal4與人工目視解譯圖也不一致,但從圖像上看可能是綜合制圖導致的差異。后處理的工作就是進一步對分類結果進行綜合制圖,并對陰影線性體進行去除。由采用擇多濾波器后處理的結果(圖5(b))可以看出,3類待解譯地物的分界非常明顯,與作為參考的人工目視解譯圖基本一致,且與客觀事實更為接近。

圖5 SVM分類與分類后處理結果對比Fig.5 Comparison of SVM classification with and without post-classification
(1)地表地質信息類型多樣,空間分布復雜,具有因混合像元導致的非線性特征。本文采用核PCA方法,通過將特征空間映射到高維核空間,可以更加準確地表達圖像像元間的高階關系,從而提取出圖像的非線性特征,同時提供一組相互獨立的主成分。
(2)通過對西藏山南地區IKONOS圖像的分類實驗表明,與PCA相比,核PCA具有更好的地物區分和增強能力;在此基礎上進行的SVM分類和擇多濾波器后處理,可以獲得與人工目視解譯相一致的結果。
(3)本文提出的基于核PCA方法的高分辨率遙感圖像自動解譯流程,為采用高分辨率遙感圖像(如 IKONOS、QuickBird、WorldView -2等)進行地質信息提取提供參考,可大大地減少人工目視解譯的工作量,提高解譯效率。
致謝:在研究過程中,中國國土資源航空物探遙感中心方洪賓教授、楊清華教授和趙福岳教授,青海省地質調查院孫延貴教授,四川省地質調查院尹顯科教授等專家均給予了熱情指導,并提出了許多寶貴意見和建議,在此一并表示感謝。
[1] 朱亮璞.遙感地質學[M].北京:地質出版社,1994:168-176.
[2] Gupta R P.Remote Sensing Geology,2nd Edition[M].Berlin:Springer- Verlag,Heidelberg,New York,2003:655 -661.
[3] Wlkerr T.A Remote Sensing Study of Active Folding and Faulting in Southern Kerman province,S E Iran[J].Journal of Structural Geology,2006(28):654 -668.
[4] Metternicht G,Hurni L,Gogu R.Remote Sensing of Landslides:An Analysis of the Potential Contribution to Geo-spatial Systems for Hazard Assessment in Mountainous Environments[J].Remote Sensing of Environment,2005,98(2/3):284 - 303.
[5] 王瑜玲,劉少峰,李 婧,等.基于高分辨率衛星遙感數據的稀土礦開采狀況及地質災害調查研究[J].江西有色金屬,2006,20(1):10-14.
[6] Lin A,Nishikawa M.Coseismic Lateral Offsets of Surface Rupture Zone Produced by the 2001 M - w 7.8 Kunlun Earthquake,Tibet from the IKONOS and QuickBird Imagery[J].International Journal of Remote Sensing,2007,28(11):2431 -2445.
[7] 張自力,秦其明,曹 寶,等.高分辨率遙感影像在巖墻地質體信息提取中的應用[J].地理與地理信息科學,2007,23(3):15-18.
[8] 滿 旺.高分辨率遙感鈾礦地質勘查技術體系研究[J].廈門理工學院學報,2009,17(3):33 -36.
[9] 王治華,徐起徳,徐 斌.巖門村滑坡高分辨率遙感調查與機制分析[J].巖石力學與工程學報,2009,28(9):1810 -1818.
[10]仇江嘯,王效科.基于高分辨率遙感影像的面向對象城市土地覆被分類比較研究[J].遙感技術與應用,2010,25(5):653-661.
[11] Laliberte A S,Rango A,Havstad K M,et al.Object- oriented Image Analysis for Mapping Shrub Encroachment from 1937 to 2003 in Southern New Mexico[J].Remote Sensing of Environment,2004,93(1/2):198 -210.
[12]陳 杰,鄧 敏,肖鵬峰,等.基于分水嶺變換與空間聚類的高分辨率遙感影像面向對象分類[J].遙感技術與應用,2010,25(5):597-603.
[13] Baatz M,Shape A.Multiresolution Segmentation:An Optimization Approach for High Quality Multi-scale Image Segmentation[C]//Strobl J,Baschke T,Griesebner G.Angewandte Geographische Informationsverarbeitung XII,Wichmann - Verlag:Heidelberg,2000:12 -23.
[14]章孝燦,黃智才,趙元洪.遙感數字圖像處理[M].杭州:浙江大學出版社,1997.
[15] Zhao G,Maclean A L.A Comparison of Canonical Discriminant Analysis and Principal Component Analysis for Spectral Transformation[J].Phtotogrammetric Engineering & Remote Senisng,2000,66(7):841 -847.
[16] Mitternicht G I,Zinck J A.Remote Sensing of Soil Salinity:Potentials and Constraints[J].Remote Sensing of Environment,2003,85(1):1 -20.
[17] Crosta A P,Sabine C,Taranik J V.Hydrothermal Alteration Mapping at Bodie,California,Using AVIRIS Hyperspectral Data[J].Remote Sensing of Environment,1998,65(1):309 - 319.
[18] Ruiz- Armenta J R,Prol- Ledesma R M.Techniques for Enhancing the Spectral Response of Hydrothermal Alteration Minerals in Thematic Mapper Images of Central Mexico[J].International Journal of Remote Sensing,1998,19(10):1981 -2000.
[19] Tangestani M H,Moore F.Iron Oxide and Hydroxyl Enhancement Using the Crosta Method:A Case Study from the Zagros Belt,Fars Province,Iran[J].International Journal of Applied Earth Observation and Geoinformation,2000,2(1):140 -146.
[20] Carranza E J M,Hale M.Mineral Imaging with Landsat Thematic Mapper Data for Hydrothermal Alteration Mapping in Heavily Vegetated Terrane[J].International Journal of Remote Sensing,2002,23(22):4827 -4852.
[21] Almeida-Filho R.Remote Detection of Hydrocarbon Microseepage Areas in the Serra do Tona Region,Tucano Basin,Brazil[J].Canadian Journal of Remote Sensing,2002,28(2):750 -757.
[22] Huang C,Davis L S,Townshend J R G.An Assessment of Support Vector Machines for Land Cover Classification[J].International Journal of Remote Sensing,2002,23(4):725 -749.
[23] Zhu G,Blumberg D G.Classification Using ASTER Data and SVM Algorithms:The Case Study of Beer Sheva,Israel[J].Remote Sensing of Environment,2002,80:233 -240.
[24] Foody G M,Mathur A.A Rrelative Evaluation of Multiclass Iimage Classification by Support Vector Machines[J].IEEE Transactions on Geoscience and Remote Sensing,2004,42(6):1335 -1343.
[25] Pal M,Mather P M.Support Vector Classification in Rremote Sensing[J].International Journal of Remote Sensing,2005,26(6):1007-1011.
[26] Oommen T,Misra D,Twarakavi N K C,et al.An Objective Analysis of Support Vector Machine Based Classification for Remote Sensing[J].Mathematical Geosciences,2008,40:409 -422.
[27] Yu L,Porwal A,Holden E J,et al.Towards Automatic Lithological Classification from Remote Sensing Data Using Support Vector Machines[C]//In,EGU2010.Vienna,Austria:2010.
[28]湯國安,張友順,劉詠梅.遙感數字圖像處理[M].北京:科學出版社,2004:274.
[29]王冬梅,吳 卿,王西林,等.應用高分辨率衛星影像提取水土保持措施信息的分類后處理技術研究[J].中國水土保持,2006(5):42-43.
Automatic Interpretation of High Resolution Remotely Sensed Images by Using Kernel Method
ZHANG Wei1,ZHANG Wei2,LIU Shi-ying3,YANG Jin -zhong1,MAO Sheng-yi4
(1.China Aero Geophysical Survey & Remote Sensing Center for Land and Resources,Beijing 100083,China;2.Institute of Geological Survey of Sichuan Province,Chengdu 610081,China;3.Institute of Geological Survey of Qinghai Province,Xining 810012,China;4.Guangzhou Institute of Geochemistry,Chinese Academy of Science,Guangzhou 510640,China)
To tackle the limitation of conventional pixel-based classification methods,this paper proposes a new approach composed of three steps,namely kernel principal component analysis(KPCA)based feature extraction,support vector machine(SVM)classification and majority filtering post-classification.An experiment with an IKONOS image covering a study area in Tibet indicates the effectiveness of this approach.The resultant image from this automatic method shows a pattern very similar to the pattern of the reference map interpreted manually.
IKONOS;Kernel PCA;SVM;Post-classification
TP 751.1
A
1001-070X(2011)03-0082-06
2010-12-16;
2011-02-22
中國地質調查局地質調查項目“青藏鐵路沿線礦產資源遙感調查”(編號:1212010781043)資助。
張 微(1980-),男,蒙古族,博士,高級工程師,主要從事遙感技術在礦產資源調查及新構造運動方面的研究,已發表論文50余篇。
(責任編輯:劉心季)