閆如柳,楊樹文,張珊,賈鑫
(1.蘭州交通大學 測繪與地理信息學院,蘭州 730070;2.地理國情監測技術應用國家地方聯合工程研究中心,蘭州 730070;3.甘肅省地理國情監測工程實驗室,蘭州 730070)
不透水面是人類作用于自然形成的人工地表,表現為城市中的水泥路面、建筑物、瀝青等[1]。不透水面會阻止水下滲,阻礙地表蒸騰作用,對環境產生一定的負面影響。不透水面研究將為建設現代海綿城市提供有效的數據支撐。
近年來,學者們在不透水面研究方面做了大量卓有成效的工作。Schueler[2]認為不透水面是影響環境的關鍵因子,不透水面率過高會破壞城市的地熱平衡,使得夏季溫度有所上升,城市產生嚴重的熱島效應[3]。其次,暴雨情況下,高不透水面率使得城市地表徑流量增加4~5倍,嚴重時會導致城市內澇[4]。因此,及時、準確地獲取不透水面信息對生態環境保護有重要意義[5]。
在不透水面的研究中,Ridd[6]在1995年提出的V-I-S(vegetation-impervious surface-soil)模型具有代表性,該模型認為城市是由植被、裸土和不透水面按一定比例覆蓋組成。Small C[7]在改進的V-I-S模型中,進一步將城市劃分為植被-低反射率-高反射率(V-I-H)的組合,并成功提取紐約市地物信息。Wu和Murray[8]在此基礎上,提出V-H-L-S模型,把城市劃分為4種端元的結合,即高反射率端元、低反射率端元、土壤和植被,能較為有效地提取不透水面信息。然而,V-I-S模型處理組分復雜的像元效果不理想,未考慮水體及陰影的影響,使得水體與低反射率地物容易混淆,影響不透水面的提取精度[9-10]。V-H-L-S模型在不透水面提取過程中,端元選取仍是難點,僅用1個或2個端元很難描述復雜的城市地表。
綜上所述,本文在V-H-L-S模型的基礎上,提出一種基于Landsat-8影像提取不透水面的新方法。將研究重點放在透水面(水體、植被、土壤)的提取,反向提取不透水面。
本文研究區為蘭州市(35°53′N~37°04′N,102°35′E~104°37′E)主城區,包括城關區、七里河區、安寧區和西固區。該區域有多種土地利用類型,包括研究所需的水體、植被、裸地以及不透水面等,如圖1所示。

圖1 研究區影像
論文實驗選用蘭州市Landsat-8 OLI影像,成像時間為2017年3月28日,含云量為6.83%,影像質量較好。Landsat-8 OLI影像包含11個波段,實驗主要選用2(藍波段)、3(綠波段)、4(紅波段)及5(近紅外波段)波段進行處理,其空間分辨率均為30 m。
實驗前對原始影像進行預處理,包括:①結合蘭州市矢量邊界圖裁剪原始影像;②選用蘭州市30 m DEM數據,對裁剪后影像進行正射校正,糾正因傳感器自身原因及地形起伏引起的像點位移;③通過輻射定標糾正或消除因輻射誤差引起的影像變形。預處理結果如圖2所示。

圖2 預處理后影像
不透水面和透水面相對,二者共同組成地表信息。提取地表透水面信息,剩下部分即為不透水面。透水面主要包括水體、植被、裸土,因此提取不透水面就轉化為水體、植被、裸土的提取問題,而這3種地物的提取方法相對成熟,從而降低不透水面的提取難度。
最小噪聲分離(minimum noise fraction rotation,MNF)是線性變換的一種,本質上是兩次主成分變換的疊置:第一次變換分離和調節數據中的噪聲,稱為噪聲白化;第二次將白化后的數據進行主成分變換。MNF變換將一幅多波段影像的主要信息集中在前幾個波段,使得噪聲減弱,后續計算量減少。MNF變換包括正向和反向2種,本文選用正向MNF變換,將影像11個波段的信息集中在前3個波段,變換結果如圖3所示,其中粉色部分為房屋建筑道路等人工設施,水體、植被、土壤在圖3中分別呈現為紅色、綠色和藍色。

圖3 MNF變換
由于水體的反射率從可見光到中紅外波段逐漸減弱,在近紅外和中紅外波長范圍內吸收率最強,幾乎無反射。因此,用可見光波段和近紅外波段的反差可以突出影像中的水體信息。另外,植被在近紅外波段的反射率一般最強,因此,綠波段與近紅外波段的比值可以最大程度地抑制植被信息,從而突出水體。歸一化水體指數(normalized difference water index,NDWI)由McFeeters[11]在歸一化植被指數的啟發下提出,主要對綠波段(B3)和近紅外波段(B5)進行歸一化,計算公式為[2,11]:
(1)
利用NDWI提取水體,閾值選擇0.30制作水體掩膜文件,得到二值圖(圖4)。

圖4 水體掩膜
歸一化植被指數(normalized difference vegetation index,NDVI)是由Deering在1978年提出,由紅波段和近紅外波段進行歸一化運算得到。NDVI的值在[-1,1]之間,其中,0表示該地區基本沒有植被覆蓋;負值表示沒有植被覆蓋;正值表示有植被覆蓋,數值越接近1時植被數量越多,植被覆蓋面積越大。例如土壤和巖石在歸一化運算后值接近0,水體、冰雪等在紅外波段和近紅外波段反射率高,NDVI表現為負值。NDVI計算公式為:
(2)
式中:B4、B5分別代表Landsat-8 OLI影像中紅波段和近紅外波段。利用NDVI提取植被,閾值選擇0.25,制作植被掩膜文件,得到植被和其他地物的二值圖(圖5)。

圖5 植被掩膜
Huete于1988年提出土壤調節植被指數(soil-adjusted vegetation index,SAVI)[12],可有效區分植被和土壤。隨后,在SAVI的基礎上,相繼提出轉換型土壤調節植被指數(transformed soil-adjusted vegetation index,TSAVI)[13]、調整型土壤調節植被指數(modified soil-adjusted vegetation index,MSAVI)[14]、優化土壤調節植被指數(optimize soil-adjusted vegetation index,OSAVI)[15]等。蘭州市氣候條件使得其植被覆蓋率低、裸土面積大,而在低植被覆蓋度下,MSAVI 提取效果更好[16]。因此,本文選取MSAVI模型區分植被與水體,公式為:
(3)
式中:B4、B5分別代表Landsat-8 OLI影像中的紅波段和近紅外波段。MSAVI主要增強亮度較高、植被稀疏的區域,提取裸土信息,閾值選擇-0.15,制作土壤掩膜文件(圖6)。

圖6 土壤掩膜
不透水面主要包括建筑物、水泥路、巖石等阻礙水滲透的要素,透水面主要由植被、裸土構成。根據不同地物在衛星影像中的光譜差異性,結合Landsat-8 OLI影像光譜特點,對影像2-5波段進行處理。本文基于V-I-H-S模型,集成NDWI、NDVI和MSAVI對不透水層進行提取,新模型構建流程如圖7所示。

圖7 不透水面自動提取流程
關鍵步驟為:
①最小噪聲分離:對預處理后的影像進行最小噪聲分離,將地物信息集中在前3個波段,減少后續計算量。
②水體掩膜:選用NDWI模型,閾值選擇0.30,得到水體信息并制作相應的掩膜文件,取水體值為1,其他地物值取0。
③植被掩膜:同樣地,利用NDVI模型提取植被,閾值選擇0.25。制作植被掩膜,取植被值為1,其他地物值取0。
④土壤掩膜:透水面的最主要構成即為土壤,不可避免的要提取土壤。結合研究區及影像特征,綜合幾種土壤提取模型,最后選用MSAVI模型提取研究區土壤信息,閾值選擇-0.15。再進行土壤掩膜,取土壤值為1,其他地物值為0。
⑤閾值提取:將水體、植被和土壤掩膜進行疊加處理,得到包含三者的二值圖,其中水體、植被和土壤值為1,其他地物值是0。將該二值圖與MNF變換后的影像進行掩膜處理,影像中水體、植被和土壤被遮蓋,其他地物的DN值不變,閾值選擇0,將水體、植被、土壤與其他地物分開,得到的其他地物即為不透水面。
提取蘭州市不透水面信息如圖8所示。從空間分布上看,蘭州市主城區的不透水面主要分布在黃河沿岸。城關區分布最為密集,其次是安寧區,七里河區北部較為密集,其南部多為裸土,西固區不透水面主要分布在與安寧區接壤部分,這與蘭州市主城區分布基本一致。從面積占比上看,蘭州裸土面積最大,不透水面積較小,占蘭州市總面積的15.80%。

圖8 蘭州市不透水面圖
在原始影像上隨機選取200個樣本點,設置樣本點像元大小為3×3[17]。樣本點總像元數為1 800,其中不透水面實際像元數為1 116,透水面實際像元數為684,采用本文方法得不透水面和透水面正確像元個數分別為1 018、619,不透水面總體精度為90.94%,制圖精度為91.21%,錯分誤差為8.79%,Kappa系數為0.81,說明該方法能有效地提取不透水面。
為使提取結果更加直觀,選取其中2塊有代表性的區域進行說明。圖9(a)、圖9(c)中植被為紅色,綠色及深藍色為水體,偏灰色部分為不透水面,在圖9(b)、圖9(d)中分別對應棕色、藍色將綠色。對比圖9(a)和圖9(b),水體、植被提取較精確,道路及小型建筑物提取精度低,會將亮度較低的建筑物誤分到裸土中,低估不透水面面積。對比圖9(c)和圖9(d),細小水體在提取過程中會被低估,道路提取不完整,會被誤分到裸土,提取精度有待提高。

圖9 不透水面提取細節圖
本文以V-H-L-S為理論基礎,利用掩膜方法提取蘭州市不透水面,得出以下結論:采用線性光譜分解模型提取不透水面,會因端元選取不同,導致提取結果有所差異,混合像元中端元選取是一個難點。與之相比,新方法側重于分析透水面和不透水面之間光譜差異性。從不透水面的定義入手,結合實際地物類型,將水體、植被和裸土歸為透水面,其余地物為不透水面,結果證明該方法可以快速有效地提取不透水面,能實現Landsat-8 OLI影像的不透水面自動提取。
但是實驗中引入多個掩膜,多次選取閾值,造成誤差累積,降低了不透水面的提取精度;另一方面,土壤和植被在提取過程中容易誤分,低反射率建筑也容易被分到透水面中,以上問題都會影響提取精度,還需要后續的完善和研究。