尹 成
(福建經(jīng)緯測繪信息有限公司, 福建 福州, 350001)
水體在地表廣泛分布,雨水季節(jié)時最易造成洪澇災(zāi)害。由于地形的復(fù)雜分布,僅依靠布設(shè)在河道中的水深監(jiān)測系統(tǒng)難以從宏觀角度監(jiān)測水體淹沒狀態(tài)。隨著遙感傳感器的快速發(fā)展,利用高時相、高分辨率遙感影像提取水體目標(biāo),可以實現(xiàn)對水資源、水環(huán)境、洪澇災(zāi)害的動態(tài)監(jiān)測,已在氣象、水利、農(nóng)業(yè)等部門得到廣泛應(yīng)用[1-2]。隨著影像的空間分辨率及光譜分辨率的逐步提高,地物可被更為精細的表達,水體目標(biāo)的識別方法及可利用的識別特征在不斷發(fā)生變化。光譜特征一直被廣泛應(yīng)用于水體識別[3-4]。文獻[5]采用由美國國家海洋與大氣管理局(National Oceanic and Atmospheric Administration,NOAA)發(fā)射的NOAA衛(wèi)星攜帶的先進的甚高分辨率輻射儀(advanced very high resolution radiometer,AVHRR)Level-1B(L1B)數(shù)據(jù),分析了水體的光譜特性,給出了基于光譜知識的水體自動提取方法。文獻[6]提出了基于綠色波段和紅色波段的歸一化差異水體指數(shù)(normalized difference water index,NDWI)用于增強遙感影像中水體目標(biāo)與其他目標(biāo)的反差來識別水體。文獻[7-8]利用美國陸地衛(wèi)星5號衛(wèi)星專題制圖儀(thematic mapper,TM)傳感器所獲取的多波段掃描影像的中紅外波段提出了改進歸一化差異水體指數(shù)改進的歸一化差異水體指數(shù)(modified normalized difference water index,MNDWI)用于識別水體。在遙感影像目標(biāo)解譯時,所有類別的水體常作為同一類目標(biāo)進行提取而并沒有進一步區(qū)分是否為河流與湖泊等類型。不同水體目標(biāo)的識別往往需要進一步結(jié)合形狀等特征來實現(xiàn)。文獻[9]利用光譜特征先進行影像分類提取水體,然后再在區(qū)域分割與邊界跟蹤基礎(chǔ)上提取水體形狀特征以識別出不同類型的水體。文獻[10]利用增強型專題制圖儀(enhanced thematic mapper,ETM+)傳感器獲取的遙感影像數(shù)據(jù),通過光譜特征和歸一化差值植被指數(shù)(normalized difference vegetation index,NDVI)實現(xiàn)水體信息的自動提取,然后利用形狀指數(shù)、面積以及其他特征對水體進行分類。
但是由于應(yīng)用需求的不同,水體目標(biāo)的進一步類型劃分存在概念性差異,加上遙感數(shù)據(jù)的來源、獲取、傳遞以及處理的整個過程都存在引起差異性的原因,造成對水體類型進一步判讀存在著模糊性和隨機性,即遙感數(shù)據(jù)的不確定性是必然的[11]。如何根據(jù)應(yīng)用所需的分類方案來選取最佳的分類特征,實現(xiàn)高效的水體分類,區(qū)分出河流與湖泊,具有重要的研究意義。云模型作為一種有效的知識挖掘和不確定性研究工具,可有效表達水體進一步分類過程中存在的不確定性,實現(xiàn)從定量光譜信息到定性類別概念的不確定性轉(zhuǎn)換[12]。
本文針對已獲取的水體目標(biāo)的多種定量特征,利用云模型對不同的水體概念如河流與湖泊建立定性定量轉(zhuǎn)換模型,并通過樣本隸屬度測試選取最佳的水體識別特征。
1.1.1云的定義
設(shè)U是一個用精確數(shù)值表示的定量論域,C是U上的定性概念,若定量值x∈U,且x是定性概念C的一次隨機實現(xiàn),x對C的確定度μ(x)∈[0,1]是有穩(wěn)定傾向的隨機數(shù),μ:U→[0,1],?x∈U,x→μ(x),則x在論域U上的分布稱為云,每一個x稱為一個云滴[13]。
云模型的建立需獲知3個主要參數(shù):期望Ex、熵En、超熵He,用于共同描述某一特定概念,Ex是云在論域空間分布的期望,是最代表對應(yīng)概念的樣本;熵En是定性概念的不確定性度量,由概念的隨機性和模糊性共同決定,代表了定性概念的可度量粒度;超熵He是熵的不確定性度量,即熵的熵,由熵的隨機性和模糊性共同決定。
1.1.2正態(tài)云模型
若x滿足x~N(En,He2),且對C的確定度μ(x)滿足式(1)所示的隸屬度函數(shù)。
(1)
式中,Ex為期望;En為熵,則x在論域U上的分布稱為正態(tài)云模型。
正態(tài)分布和鐘形隸屬函數(shù)具有良好的通用性和普適性,沒有突變區(qū)域,在整個區(qū)間都具有連續(xù)性,符合一般情況下的隨機性和模糊度分布,在實際應(yīng)用中非常廣泛。因此,正態(tài)云是也具有良好普適性的云模型,能夠滿足一般情況下的定性研究,可作為遙感影像水體目標(biāo)識別的基本數(shù)學(xué)模型。
1.1.3云發(fā)生器
云發(fā)生器(cloud generator,CG)指云生產(chǎn)算法,可分為正向云發(fā)生器和逆向云發(fā)生器,原理圖如圖1所示。
正向正態(tài)云的生成算法:①輸入特征Ex、En、He和生成云滴的個數(shù)n;②計算得到一個以En為期望、He2為方差的正態(tài)隨機數(shù)En';③計算得到一個Ex為期望、En′2為方差的正態(tài)隨機數(shù)xi;④依據(jù)隸屬度函數(shù),計算每個xi對應(yīng)的隸屬度值μi;⑤完成足夠數(shù)量的云滴(xi,μi)。

(a)正向正態(tài)云發(fā)生器

(b)逆向正態(tài)云發(fā)生器

1.1.4X條件云發(fā)生器
已知云模型(Ex,En,He),對于特定的輸入x=x0條件,生成對應(yīng)的一個云滴(x0,μi),則稱為X條件云發(fā)生器。圖2所示為X條件云發(fā)生器原理。
具體做法:將橄欖油5 kg倒入鍋中,加入香菜段、蔥段各1 500 g,小火慢慢熬至香菜、蔥熟爛,油脂飄香即可。烹制海鮮菜起鍋時或上桌前,將自制蔥油淋入菜中,香氣四溢,海鮮更鮮。

圖2 X條件云發(fā)生器
具體實現(xiàn)算法為:已知云模型參數(shù),得到一個以En為期望、He2為方差的正態(tài)隨機數(shù)En';然后將x=x0代入式(1)計算此條件下隸屬度,(x0,μi)為云滴。
根據(jù)X條件云發(fā)生器,可以獲得特定特征值對于某一概念(云模型表示)的隸屬程度。由于En'是變化的,因此,對于相同的輸入x=x0和(Ex,En,He)也有可能獲得不同的μ,正體現(xiàn)了不同的人不同的時間對于同一數(shù)據(jù)隸屬于同一概念程度有一定的細微變化,從而使模糊性和隨機性得到較好的結(jié)合。
水體識別時,選取最合適的特征組合將更有利于水體目標(biāo)的光譜、紋理、形狀特征。水體的光譜特征主要是水體的色調(diào)相對比較均勻,基本上呈現(xiàn)為藍色調(diào),有淺藍、深藍等,光譜波段的均值和標(biāo)準(zhǔn)差,能夠有效反映水體統(tǒng)計特性。水體目標(biāo)的形狀各不相同,一般來說,河流都是細長形,湖泊都呈現(xiàn)為近圓形,實驗發(fā)現(xiàn)不對稱性、緊湊度、密度、長寬比,更能有效地顯示河流與湖泊的形狀差異。紋理特征是圖像細部結(jié)構(gòu)按照一定的頻率重復(fù)出現(xiàn)展現(xiàn)的特征。經(jīng)過試驗比較,主要選取出7個波段的基于灰度共生矩陣的對比度、相關(guān)性、角二階矩,對河流與湖泊的區(qū)分力較強。經(jīng)過初步篩選,提取39種光譜、形狀、紋理特征,從中選取最佳特征組合。
1.2.1河流與湖泊概念云的生成
在遙感影像分類中,常將水體作為同一類目標(biāo)提取,很少進行河流和湖泊的進一步區(qū)分,而在水體遙感的應(yīng)用中,常存在這一需求。如何在已提取水體目標(biāo)基礎(chǔ)上,分析這兩類目標(biāo)的特征差異,進行進一步的區(qū)分,具有十分重要的研究意義。本文擬采用云模型通過分析河流與湖泊的光譜、紋理、形狀等特征,選取合適的特征組合,并采集大量已知類別的水體樣本,利用云模型獲取河流與湖泊的概念云。
根據(jù)采集的河流與湖泊的各類特征,依照逆向正態(tài)云模型的生成算法,完成云模型三參數(shù)期望Ex、熵En、超熵He的計算,可得到相應(yīng)特征下對應(yīng)河流與湖泊的云模型。以形狀特征密度為例,利用大量樣本特征分別針對河流與湖泊的云模型三參數(shù),再利用正向云模型計算x的隸屬度μ,生成該特征的河流與湖泊概念云。
1.2.2水體特征提取
利用易康eCognition軟件對在大量的TM影像中采集河流、湖泊樣本數(shù)據(jù)進行特征選取實驗,統(tǒng)計各個特征的所有樣本數(shù)據(jù)對應(yīng)于河流或湖泊模型的隸屬度判定正確率,結(jié)果如表1所示,ML1-ML7、SL1-SL7分別代表TM波段1-7的光譜特征均值和標(biāo)準(zhǔn)差,CL1-CL7、AL1-AL7、RL1-RL7代表TM1-7個波段紋理特征中的對比度、角二階矩、相關(guān)性,以及形狀特征中的不對稱性、緊湊度、密度和長寬比。可以看出,4個形狀特征中有3個特征正確率達到80%以上,間接表明形狀是區(qū)分河流與湖泊的最本質(zhì)特征。

表1 河流與湖泊樣本特征舉例及基于云模型的隸屬度判定正確率
在大量TM影像上采集了745個河流與湖泊的樣本數(shù)據(jù),將其分為訓(xùn)練數(shù)據(jù)與檢驗數(shù)據(jù)兩部分,用于實驗分析。圖3分別為從樣本數(shù)據(jù)中選取的河流與湖泊樣本示意圖。采用基于面向?qū)ο笏枷?提取圖中2個河流與2個湖泊樣本的39個特征值如表2所示。結(jié)合圖表可以看出,河流與湖泊均作為水體,具有相近的光譜特征,但會隨著水深、含沙量、污染物等不同而存在差異。此外,河流與湖泊在形狀上具有明顯差異。本文采用基于云模型的特征選取方法,通過科學(xué)的方法對各種特征區(qū)分河流與湖泊的能力進行了測試,基本證明形狀特征中的緊湊度、密度和長寬比具有優(yōu)秀的區(qū)分能力。

(a)河流A

(b)河流B

(c)湖泊1

(d)湖泊2

表2 圖4中的河流與湖泊的樣本特征數(shù)據(jù)
為了驗證本文提出的基于云模型選取水體識別特征的有效性,通過采用如表3所示的特征分組,分別結(jié)合基于支持向量機(SVM)分類算法[14]和BP神經(jīng)網(wǎng)絡(luò)算法[15],利用訓(xùn)練樣本數(shù)據(jù)進行分類器的訓(xùn)練,利用檢驗數(shù)據(jù)對該特征組合下的分類精度進行對比分析,結(jié)果如表3所示。其中,特征組合A至F分別是光譜特征均值、光譜特征方差、紋理特征對比度、紋理特征角二階矩、紋理特征相關(guān)度、形狀特征7大類,對比可以看出,不論是利用何種分類方法,形狀特征均取得了最好的分類精度,其他特征組合的分類能力會隨分類器方法的不一樣而有所變化。特征組合G和H分別是所有的光譜特征和所有的紋理特征,可以看出,光譜特征和紋理特征區(qū)分河流與湖泊的能力差別不大,總體來說紋理特征略勝一籌。根據(jù)表1中正確率排名前3~6的特征構(gòu)造組合I、F、J、K,對比看出,利用正確率均達到80%以上的特征組合I進行分類取得了所有特征組合中最高的分類精度,達到了99%以上。隨著其他正確率稍低的特征加入,分類精度有所下降。總體分析得出,采用本文方法能夠有效地判斷候選特征的水體類型辨別能力,將有助于選取最佳的分類特征組合。密度、緊湊度、長寬比是區(qū)分河流與湖泊的最佳特征組合。

表3 不同特征組合下的分類精度對比
將本文基于云模型選取特征和傳統(tǒng)不區(qū)分特征的方法,與SVM和BP神經(jīng)網(wǎng)絡(luò)分類法進行結(jié)合,用于湖泊與河流分類,精度對比結(jié)果如表4所示。

表4 與其他方法對比的水體識別精度對比
可以看出,基于云模型的方法選取的密度、緊湊都、長寬比是非常有效的特征,與分類器結(jié)合均能達到較高的分類水平。如果不對特征加以區(qū)分,直接與分類器結(jié)合,識別能力明顯偏弱。因此,基于云模型科學(xué)有效的選取合理有效的特征對提升水體的分類識別能力有非常重要的作用。
本文利用云模型理論定量分析各類不同的光譜、紋理、形狀特征區(qū)分河流與湖泊的能力,發(fā)現(xiàn)密度、緊湊度、長寬比是河流與湖泊的區(qū)分的最有效特征組合,與傳統(tǒng)的特征分類法相比,基于云模型的特征選取方法提供了科學(xué)的特征選取方法,能更有效地指導(dǎo)合理的特征選取,有助于水體識別精度的提高。