李文蘋, 王旭紅, 李天文, 毛文婷, 姚 磊
(西北大學 城市與環境學院, 陜西 西安 710127)
黃河流域內陸地表水體提取方法研究
李文蘋, 王旭紅, 李天文, 毛文婷, 姚 磊
(西北大學 城市與環境學院, 陜西 西安 710127)
[目的] 對黃河流域內陸地表水體提取方法進行對比分析,為有效提取含沙量大的黃河流域水體提供方法指導。 [方法] 采用目前提取水體效果較好的兩種方法——改進的水體指數法(MNDWI)和線性光譜混合模型(LSMM),以Landsat 8 OLI數據為例,選擇黃河流域水庫、濕地、湖泊和河流作為研究對象,將其劃分為2大類,即水體和非水體,利用高分辨率影像進行精度分析,研究兩種方法的區域適應性。 [結果] (1) 利用線性光譜混合模型在提取水庫、濕地和湖泊比改進的水體指數模型精度更高; (2) 利用這2種方法在提取面積較大、分布集中的水體比提取細長型分布的線狀河流效果更好。 [結論] 混合像元在高分辨率的影像中也是存在的,在水體提取的時候,利用線性光譜混合模型考慮了混合像元對水體提取的影響,極大提高了精度,試驗證明線性光譜混合模型優于改進的水體指數法。
黃河流域; 提取方法; 水體
文獻參數: 李文蘋, 王旭紅, 李天文, 等.黃河流域內陸地表水體提取方法研究[J].水土保持通報,2017,37(2):158-165.DOI:10.13961/j.cnki.stbctb.2017.02.024; Li Wenping, Wang Xuhong, Li Tianwen, et al. Extraction Method of Spectral Information of Inland Surface Water Body in Yellow River Basin[J]. Bulletin of Soil and Water Conservation, 2017,37(2):158-165.DOI:10.13961/j.cnki.stbctb.2017.02.024
地表水主要指的是河流、冰川、湖泊、沼澤4種水體,是人類及一切生物賴以生存發展所必須的資源之一,也是地球上淡水水資源的主要組成部分,在維系流域生態平衡、滿足生產生活用水等方面起著不可替代的作用[1-2]。水體面積變化可以表征地表水受氣候變化和人類活動影響程度,快速準確地提取水體面積,準確把握地表水的空間分布狀態,對水文研究、水資源管理研究等等,都具有重要的現實意義[3]。傳統的水體提取方法多數是基于大比例尺測繪完成的,這種方法不僅耗時耗力,而且宏觀、連續、實時監測水體效果差,很難滿足時空方面的要求[4]。遙感技術具有宏觀、動態、低成本等特點,利用遙感影像快速準確地提取水體信息,不但可以準確把握黃河流域水體的空間分布狀態、變化趨勢,而且對水資源調查、流域綜合治理、水利規劃、洪水監測和災害評估及水資源管理、保護等都具有重要的意義,已經成為必不可少的手段之一[5-7]。
黃河發源于青藏高原、流經黃土高原和華北平原,該流域屬于干旱、半干旱和半濕潤氣候,水資源量先天不足;同時由于氣候逐漸變暖和人類活動的影響,黃河流域水體顯示出逐漸減少的趨勢,甚至在黃河流域的下游出現了斷流現象[8-9]。利用遙感手段提取水體信息,主要是利用水體與其它地物光譜等信息的差異,通過影像不同波段的排列組合,不斷的擴大水體與其它地物的差異,增強水體信息,抑制非水體信息[10]。由于黃河流域的水體含沙量大,其光譜反射率與清澈水體略有差別,清澈水體在可見光波段反射率為:Blue>Green>Red,在近紅外和短波紅外,其反射率幾乎為零;但黃河流域水體含有的大量泥沙,其反射率會比清澈水體的反射率略高,易與低反照率,如山體,建筑物和陰影等背景地物相混淆,這影響水體提取的精度。目前,用于提取水體信息的遙感影像主要分為兩類:光學遙感和微波遙感。由于光學遙感數據易獲取、易處理,在探測和識別地表水水域時得到了廣泛的應用,很多學者利用不同的光學遙感影像和水體提取方法進行地表水體信息的提取。如陸家駒等[11]利用Landsat TM影像紅外波段識別水體,并指出該方法主要適用于4 000 m2以上的水體區域,但會存在陰影部分。周成虎等[12]發現水體具有DNG+DNB>DNIR+DNSWIR的特點,提出了基于水體光譜知識的AVHRR影像水體自動提取技術,它與單波段閾值法相比,精度有所提高,但易受到裸土、高山陰影區等混合像元信息的干擾。Mcfeeters[13]利用Landsat MSS影像進行水體提取,提出的歸一化差異水體指數(NDWI),可以較好消除山體陰影,但提取的水體容易和建筑物相混淆。徐涵秋[14]為彌補NDWI的不足,提出了修正的歸一化差異水體指數(MNDWI),適用于城鎮地區的水體提取。丁鳳[15]構建了新型水體指數(NWI),同時運用了Landsat TM影像的藍波段、近紅外和中紅外等波段,可以消除部分由大氣和地形帶來的影響。上述方法沒有考慮到混合像元,混合像元問題無論影像分辨率多高,都是客觀存在的,尤其是中低分辨率的影像,它不僅影響地物識別和分類、提取的精度,在定量遙感中是必須解決的關鍵問題。混合像元分解模型可以在一定程度上解決這一問題,提高分類、提取的精度。張晗等[16]利用混合像元線性分解方法對武漢市湖泊面積變化進行監測,發現此方法比傳統的基于像元的方法,精度更高。本研究利用Landsat 8 OLI數據,以含沙量大的黃河流域不同水體類型為對象,以高分辨率遙感影像作為參考依據,將基于像元的水體提取方法(MNDWI)和基于亞像元的水體提取方法(LSMM)進行對比分析,比較兩種方法所提取面積之間的差異以及在不同水體類型的區域適應性,為有效提取含沙量大的黃河流域水體提供方法指導。
1.1 研究區概況
研究區選擇黃河流域不同類型的水體,主要包括: (1) 位于渭河支流千河下游的陳倉、鳳翔、千陽縣3縣交界處的馮家山水庫,它對陜西省關中地區蓄水工作起著不可替代的作用,距千河干流河口25 km,控制流域面積3 232.5 km2,占全流域面積的92.6%,多年平均輸沙量4.69×106t,灌區位于渭北高塬,呈矩形狀,東西長約80 km,南北寬約18 km,具有調控水量、農業灌溉、預防旱災等功能。 (2) 紅堿淖,屬高原性內陸湖,湖泊面積較大,不僅在陜西省排名靠前,也是中國最大的沙漠淡水湖,具有重要的參觀與旅游意義,被列入國家重要濕地,評為4 A級景區。湖岸線長43.7 km,湖面大致呈三角形狀,目前,紅堿淖的水位下降速度較快,20~30 cm/a,水域面積從1996年的67 km2縮小到現在的33.4 km2,同時面臨著水質不斷惡化的情況。 (3) 龍門區域的河流,位于秦晉大峽谷之中,龍門寬約80 m,形狀似閘口,扼黃河咽喉,水流湍急,平均海拔948 m,水域周圍含有大量的泥沙; (4) 沙湖,位于賀蘭山腳下、黃河邊部,總面積為80.10 km2,其中包括22.52 km2的沙漠與45 km2的水域毗鄰而居,構成了西部罕有的沙漠濕地特色景觀,被列為國家5A級景區。研究區域的具體情況詳見表1。
1.2 數據源及預處理
Landsat 8衛星由美國國家航空航天局(NASA)發射于2013年,搭載了陸地成像儀(operational land imager, OLI)和熱紅外傳感器(thermal infrared sensor, TIRS)2種傳感器,其中OLI陸地成像儀包括9個波段,空間分辨率為30 m,其中包括一個15 m的全色波段。與Landsat7衛星的ETM+傳感器相比,OLI增加了一個藍色波段(band1,0.433~0.453 μm)和一個短波紅外波段(band9,1.360~1.390 μm),藍色波段主要用于海岸帶觀測,短波紅外波段包括水汽強吸收特征,可用于云檢測。TIRS是有史以來最先進,性能最好的熱紅外傳感器,TIRS將收集地球熱量流失,目標是了解所觀測地帶水分消耗,特別是干旱地區水分消耗。

表1 研究區域的基本情況
本次研究所使用的數據都是經過系統輻射校正和幾何校正的Landsat8 OLI的L1T級別數據。4景影像獲取時間分別為: (1) 馮家山水庫。2014年3月15日(行列號128/36); (2) 紅堿淖。2014年7月30日(行列號127/33); (3) 龍門區域。2014年5月20日(行列號126/35); (4) 沙湖。2014年7月28日(行列號129/33),選用近紅外波段Band5,短波紅外波段Band6,紅波段Band4合成可以增強顯示效果,突出水/陸的差異性,以便更好地提取水體。
數據預處理主要包括:影像融合、大氣校正、研究區裁剪、幾何配準。運用Gram-Schmidt融合法(簡稱GS變換)將30 m分辨率的多光譜數據和15 m分辨率的全色波段數據進行融合得到15 m分辨率的多光譜數據,提高影像的空間分辨率,增強影像空間細節信息;然后進行FLAASH大氣校正,以消除大氣傳輸過程的影響,裁剪研究區域。驗證數據使用QuickBird高分辨率影像,利用二次多項式模型,將其與Landsat8融合后數據進行幾何配準,配準總的均方根誤差小于0.5個像元。
2.1 MNDWI閾值法
徐涵秋提出了改進的歸一化差異水體指數(MNDWI)比歸一化水體指數(NDWI)更能夠揭示水體微細特征,如懸浮沉積物的分布、水質的變化。另外,MNDWI可以有效識別陰影信息對水體的影響,解決了水體提取中難消除陰影的難題。
改進的歸一化差異水體指數公式為[17]:
MNDWI =(Green-SWIR)/(Green+SWIR)
在Landsat 8 OLI中有2個SWIR波段,分別是SWIR1(Band 6)和SWIR2(Band 7),Zhiqiang Du等[18]基于Landsat 8 OLI影像進行地表水提取,分別比較了NDWI(band 3,5),MNDWI(band 3,6),MNDWI(band 3,7)這3種水體指數提取地表水的精度,得出MNDWI(band 3,6)比其他2種水體指數方法精度更高,效果更好。鑒此,選用MNDWI(band 3,6)來對研究區進行地表水提取,為了更好地突出水體信息,抑制其他背景的影響,在此基礎上確定一個閾值。閾值根據灰度直方圖來確定,水體像元和周圍背景像元的灰度值差異較大,因此圖像的灰度直方圖呈雙峰分布,運用大津法(Otsu法)[19],即最大類間方差法來首先確定最小和最大灰度值這一范圍,然后確定水體像元數和背景像元數和各自平均值,再計算兩類間的方差,找出方差最大的作為閾值,如圖1所示。馮家山水庫、沙湖、紅堿淖、龍門區域河流確定的閾值分別是0.164 3,0.339 5,0.302 7,0.236 7。這里需要說明的是在龍門樣區其直方圖呈單峰分布,主要是因為龍門區域河流呈狹窄細長型,流經周圍泥沙含水量較大,河流與周圍灰度差異較小,而且龍門區域的河流與其周圍背景面積相差懸殊,該閾值的選取不能使用Otsu法,應該在直方圖的“肩部”確定一個位置,再用循環分解法進行分割,確定最佳閾值。最佳閾值的確定很好地抑制了非水體的影響,便于更好地將水體提取出來。
2.2 基于混合像元分解模型進行水體的提取
混合像元是指不同類型的地物存在一個像元內,主要出現在地類的邊界處。由于混合像元的存在使得影像識別分類精度不夠精確,特別是對線狀地類和細小地物的分類識別影響較為突出。線性光譜混合模型是混合像元分解常用的方法,是指像元在某一波段的反射率由端元組分反射率和其豐度的線性組合。端元是相當于像元中的亞像元,只包含一種地物的光譜信息。豐度是各端元在混合像元中的比例。線性分解模型公式[20]為:
(1)
式中:Rb——像元在波段b的反射率;n——端元的數目;fi——第i端元的豐度;Rib——第i端元在波段b的反射率;eb——殘差項。其中,fi須滿足如下約束條件:
(2)
評價模型用殘差ei或均方根誤差(RMSE)來衡量,也可以用混淆矩陣來評價其精度,陳利[21]利用混合像元分解法進行的MODIS森林類型識別研究中,其精度評價采用的是混淆矩陣。

圖1 利用Otsu確定研究區的閾值
本文將研究區的基本組分分為2大類: (1) 低反照度的物體,主要指水體; (2) 高反照度的物體,主要指研究區的水泥道路及屋頂等建筑用地還有綠色植被以及裸土地,作為非水體組分。首先對預處理后的研究區影像先進行最小噪聲分離,用于判斷圖像數據維數、分離數據中的噪聲,減少后處理中的計算量;再對最小噪聲分離的影像計算純凈像元指數,利用優化指數OIF方法[22]計算最佳波段組合Band2,Band4,Band5顯示最小噪聲分類的影像,然后通過二維散點圖選取水體端元和非水體端元,用線性光譜混合模型得到豐度圖像,根據豐度圖像,設定豐度大于0.5的像元為水體端元,得到水體與非水體的分類圖。
3.1 水體提取結果
根據圖2,可以發現設定閾值〔馮家山水庫(0.164 3),沙湖(0.339 5),紅堿淖(0.302 7),龍門區域河流(0.236 7)〕提取的水體效果更好,更加明顯,更好地抑制了周圍其他地物的干擾。
如圖3,利用線性光譜混合模型得到豐度圖像,根據豐度圖像,設定豐度大于0.5的像元為水體端元,得到水體與非水體的分類圖(圖3)。根據圖3可以得出,混合像元分解模型在水體邊界和支流部分提取的效果更好。
3.2 不同方法提取結果比較
分別采用定性和定量的方法,比較利用MNDWI和LSMM方法提取水體的面積和高分辨率的影像統計的水體面積進行對比(表2)。再利用混淆矩陣計算出制圖精度、用戶精度、漏分誤差、錯分誤差和kappa系數[23]來評價提取水體的質量,如表3—4,分別是利用改進的水體指數和線性的混合像元分解的方法,以高分辨率的影像為參照,來分析4個研究區水體提取的精度。
由表2數據可見,通過2種方法提取水體面積和高分辨率影像統計面積進行比較,可以發現利用LSMM提取水體面積比MNDWI更接近高分辨率影像統計的面積,效果更好。在馮家山水庫研究區,利用LSMM提取的水體面積是15.31 km2,MNDWI提取的水體面積是15.14 km2,高分辨率影像統計的水體面積是15.37 km2,說明LSMM法所提取的結果更準確一些。在沙湖區,利用LSMM提取的水體面積是78.73 km2,MNDWI提取的水體面積是78.68 km2,高分辨率影像統計的水體面積是79.90 km2,說明LSMM法優于MNDWI,但是由于沙湖周圍含有大量的泥沙,邊界不是特別明顯,存在大量的混合像元,在加上影像的分辨率之間的差異,導致提取的結果和高分辨率影像實際統計的面積有微小差別。在紅堿淖研究區,利用LSMM提取的水體面積是31.97 km2,MNDWI提取的水體面積是31.96 km2,高分辨率影像統計的水體面積是32.15 km2,說明LSMM法和MNDWI提取的結果差別不大,且和實際面積也比較接近。在提取龍門區域的河流,LSMM提取的結果是77.06 km2,MNDWI提取的結果是76.98 km2,統計的面積是77.24 km2,說明LSMM提取的結果更接近實際面積,優于MNDWI法。總體而言,由于在黃河流域的水體含沙量較多,存在大量混合像元的問題,MNDWI法沒有考慮混合像元的影響,而利用LSMM法可以很好地避免這一問題,LSMM法包含了更多水體信息,其水體識別精度高于MNDWI法。

圖2 MNDWI直接提取與MNDWI確定閾值提取水體比較

圖3 基于混合像元分解模型提取水體分類結果

表2 不同方法提取的水體面積比較

表3 比較改進的水體指數法和高精度影像的分類精度

表4 比較混合像元分解模型與高精度影像分類精度
通過比較表3和表4,可以發現利用線性光譜混合模型提取的人工水域馮家山水庫、含沙量大的沙湖、紅堿淖濕地和龍門區域的河流的Kappa系數分別為0.953 4,0.867 2,0.986 8和0.535 5,而利用改進的水體指數的方法提取的馮家山水庫、沙湖、紅堿淖和龍門區域的Kappa系數分別為0.931 0,0.835 2,0.963 8和0.587 5,說明線性光譜混合模型在提取馮家山水庫、沙湖、紅堿淖比改進的水體指數模型方法較高,更接近高分辨率影像提取的水體面積,主要是由于這3個研究區水域集中分布,形狀比較規則,離散分布的水體幾乎沒有,再加上與周圍非水體區域差異顯著,因此,提取精度較高;而在龍門區域相反,主要是由于龍門區域河流呈細長型,比較破碎,周圍主要為含水量大的泥沙,二者差異較小,存在復雜的混合像元,混合像元特別是對線狀地類和細小地物的分類識別影響較為突出。利用改進的水體指數和混合像元分解模型這兩種方法提取的湖泊和水庫比細小河流效果較好,但對細小河流提取,改進的水體指數方法優于混合像元分解模型,主要是由于河流本身形狀比較破碎,再加上周圍地物類型復雜,雖然運用混合像元分解模型可以減少混合像元存在的誤差,但是可能出現混合像元分解錯誤的發生,導致結果沒有改進的水體指數法效果更好。
(1) 利用線性光譜混合模型和改進的水體指數法2種方法,一種是基于亞像元的方法,一種是基于像元的一種方法;一種屬于軟分類,一種屬于硬分類,如何將這兩種方法進行對比,能不能對比,用什么方法來進行評價,本研究對此做了探討。分析結果表明,兩種方法可以進行比較分析,運用混淆矩陣可以進行精度評價。
(2) 利用線性光譜混合模型在提取黃河流域的水庫、濕地和湖泊比利用改進的水體指數模型提取水體的精度更高,效果更好,更接近于高分辨率影像提取水體的面積,而對于細小線狀河流,改進的水體指數提取的水體面積更接近實際面積。
(3) 水體提取精度不僅與水體聚集分布有關,與其周圍其他地物類型也有很大關系,對于黃河流域的水體,含沙量較大,選用線性光譜混合模型提取水體效果要優于改進的水體指數法。
(4) 無論利用線性光譜混合模型還是利用改進的水體指數法提取黃河流域的水體,面積較大、分布集中的水體比提取細長型分布的線狀河流效果更好。
(5) 綜合分析發現,2種方法均可以較好地提取主體水體區域,在細小水體提取方面,混合像元分解模型可能會存在分解錯誤的情況,導致分解結果不理想;改進的水體指數法關鍵在于確定閾值,而閾值的選擇有一定的主觀誤差。在以后的研究中,應該避免盡量避免主觀因素的影響,可以考慮自動提取的方法。
[1] 李景剛,李紀人,黃詩峰,等.Terra/MODIS時間序列數據在湖泊水域面積動態監測中的應用研究:以洞庭湖地區為例[J].自然資源學報,2009,24(5):923-933.
[2] 劉昌明.中國水資源現狀評價和供需發展趨勢分析[M].北京:中國水利水電出版社,2001.
[3] Huang Shifeng, Li Jinggang, Xu Mei. Water surface variations monitoring and flood hazard analysis in Dongting Lake area using long-term Terra/MODIS data time series[J]. Natural Hazards, 2012,62(1):93-100.
[4] 李景剛,李紀人,黃詩峰,等.近10年來洞庭湖區水面面積變化遙感監測分析[J].中國水利水電科學研究院學報,2010,8(3):201-207.
[5] 傅國斌,劉昌明.遙感技術在水文學中的應用與研究進展[J].水科學進展,2001,12(4):547-559.
[6] 孫敏章,劉作新,吳炳方,等.衛星遙感監測ET方法及其在水管理方面的應用[J].水科學進展,2005,16(3):468-474.
[7] 于歡,張樹清,李曉峰,等.基于TM影像的典型內陸淡水濕地水體提取研究[J].遙感技術與應用,2008,23(3):310-315.
[8] 袁麗華,蔣衛國,申文明,等.2000—2010年黃河流域植被覆蓋的時空變化[J].生態學報,2013,33(24):7798-7806.
[9] 姚文藝,冉大川,陳江南.黃河流域近期水沙變化及其趨勢預測[J].水科學進展,2013,24(5):607-616.
[10] 萬建鵬.基于Landsat TM/ETM+影像鄱陽湖地區水體提取研究[D].江西 撫州:東華理工大學,2015.
[11] 陸家駒.多種遙感資料河網水體的有效解譯[J].水利學報,1993(1):43-47,52.
[12] 杜云艷,周成虎.水體的遙感信息自動提取方法[J].遙感學報,1998,2(4):364-369.
[13] MacFeeters S K. The use of Normalized Difference Water Index(NDWI)in the delineation of open water feature[J]. International Journal of Remote Sensing, 1995,17(7):1425-1432.
[14] 徐涵秋.基于譜間特征和歸一化指數分析的城市建筑用地信息提取[J].地理研究,2005,24(2):311-320.
[15] 丁鳳.基于新型水體指數(NWI)進行水體信息提取的試驗研究[J].測繪科學,2009,34(4):155-157.
[16] 張晗,夏丹寧,張昊成,等.基于混合像元分解的武漢市湖泊面積變化監測[J].長江科學院院報,2011,28(5):67-70.
[17] 徐涵秋.利用改進的歸一化差異水體指數(MNDWI)提取水體信息的研究[J].遙感學報,2005,9(5):589-595.
[18] Du Zhiqiang, Li Wenbo, Zhou Dongbo, et al. Analysis of Landsat-8 OLI imagery for land surface water mapping[J]. Remote Sensing Letters, 2014,5(7):672-681.
[19]Nobuyki Otsu. A threshold selection method from gray-level histograms [J]. IEET Transaction Systems. Man, and Cybernetics, 1979,9(1):6266.
[20] 金鑫,柯長青.基于混合像元分解的天山典型地區冰雪變化監測[J].國土資源遙感,2012,24(4):146-151.
[21] 陳利.基于混合像元分解方法的MODIS森林類型識別研究[D].湖南 長沙:中南林業科技大學,2014.
[22] Nilanchal P, Brijesh K. Classification of features selected through Optimum Index Factor(OIF)for improving classification accuracy[J]. Journal of Forestry Research, 2011,22(1):99-105.
[23] 許文寧,王鵬新,韓萍,等.Kappa系數在干旱預測模型精度評價中的應用:以關中平原的干旱預測為例[J].自然災害學報,2011,20(6):81-86.
Extraction Method of Spectral Information of Inland Surface Water Body in Yellow River Basin
LI Wenping, WANG Xuhong, LI Tianwen, MAO Wenting, YAO Lei
(CollegeofUrbanandEnvironmentalScience,NorthwestUniversity,Xi’an,Shaanxi710127,China)
[Objective] Extraction methods of spectral information of inland surface water in the Yellow River basin were elucidated and compared to provide guidance for the extraction of spectral information of water bodies with large sediment concentration in the Yellow River basin. [Methods] Two methods that were thought effective at present were chose to extract the spectral information of water body. They were modified normalized difference water index(MNDWI) and linear spectral mixture model. Landsat 8 OLI imagery of reservoir, wetland, lake and river in the Yellow River basin was exemplified to analyze the accuracies of the two methods, and to discuss the regional applicability. In which, the study area was divided into two categories: water and non-water, and high resolution imagery was referred.[Results] The accuracy of linear spectral mixture model in extracting spectral information of reservoir, wetland and lake was higher than that of the MNDWI. The two methods performed better in the large-area water bodies, such as lakes and reservoirs, than in the linear like body as rivers. [Conclusion] In high resolution image, mixed pixels were also existed. Based on that, the linear spectral mixture model had covered the effect of mixed pixels on the spectral information extraction from water bodies, whereby it remarkably improved the extraction precision. The linear spectral mixture model is superior to the modified normalized difference water index.
the Yellow River basin; extraction methods; water body
2016-09-27
2016-09-27
李文蘋(1991—),女(漢族),河北省張家口市人,碩士研究生,研究方向為地表水提取方法。E-mail:1126047634@qq.com。
王旭紅(1968—),女(漢族),陜西省咸陽市人,博士,教授,碩士生導師,主要從事遙感圖像數據分析與應用,環境遙感等方面研究。E-mail:jqy_wxh@163.com。
B
1000-288X(2017)02-0158-07
X524