張紅梅,王大衛,高 楊,公維朕
(1.安徽理工大學 地球與環境學院,安徽 淮南 232001; 2.宿州學院 環境與測繪學院, 安徽宿州 234001)
基于OLI數據與決策樹法的去山體陰影水體信息提取研究
張紅梅1,王大衛1,高 楊2,公維朕1
(1.安徽理工大學 地球與環境學院,安徽 淮南 232001; 2.宿州學院 環境與測繪學院, 安徽宿州 234001)
研究山區地表水體信息OLI遙感數據去陰影自動提取方法,設計基于數字高程模型與指數提取的決策樹分類方法,提高水體自動識別的精度。該方法選取改進的歸一化水體指數、歸一化植被指數、比值植被指數、主成分分析前3個分量以及波段之間的組合運算,并結合DEM構建決策樹分類規則。綜合采用單波段閾值、譜間關系、植被指數和水體指數閾值完成山體水體的去陰影識別研究,與計算機自動識別分類方法比較,其精度明顯提高。結果表明,決策樹分類方法在精度上明顯高于常用的計算機自動分類方法,可以很好地被利用于OLI遙感數據水體信息的海量、大范圍提取。
山區;地表水體;山地陰影;OLI數據;決策樹法
水資源與水環境監測與調查是合理規劃和有效利用水資源的基礎。遙感水體監測技術具有監測范圍大、適時性、動態性、周期短、信息量大等優勢,在水體信息監測方面發揮著重要作用[1]。利用遙感技術提取水體信息在水資源調查與評價、濕地信息提取、海陸交替地帶監測和洪水水情監測等領域被廣泛應用。
針對Landsat衛星數據TM和ETM+影像,水體信息提取的方法研究成果較多[2-4]。常用的方法有單波段閾值法、(TM2+TM3)/(TM4+TM5)譜間關系法、植被指數法和水體指數法[5]等方法。單波段閾值法主要利用近紅外波段水體與其他地物光譜差異進行閾值確定完成水體提取,閾值確定較難。目前常用的美國陸地資源衛星系列已進入Landsat8星OLI影像數據,OLI數據的山區去山體陰影混淆的水體信息計算機自動識別方法研究,其研究結果對于調節山區水利、促進農業發展、合理排泄灌溉等具有十分重要的意義。
六安市轄3區4縣,位于安徽省西部,地處江淮之間,南北長179 km,東西寬176 km,面積約15 490 km2。六安大地構造隸屬秦嶺褶皺系(東端)和中朝準地臺(南緣)兩個Ⅰ級構造單元,自南向北為跨武當淮陽隆起、北秦嶺褶皺帶和華北斷坳3個Ⅱ級構造單元,進一步劃分為大別山復背斜、佛子嶺復向斜、合肥六安凹陷等次級構造單元。
六安市西南高,東北低,由南向北呈階梯狀分布,具山地、丘陵、崗地和平原4個地貌類型。六安市山脈隸屬大別山山脈,為長江和淮河分水嶺,將全市分為長江與淮河兩個流域。境內山脈分為西南段皖山和東段霍山,平均海拔400 m以上。
六安地區地處北亞熱帶的北緣,屬濕潤季風氣候。其特征是:季風顯著,雨量適中;冬冷夏熱,四季分明,雨季集中在7~9月份。植被為亞熱帶常綠闊葉林植被帶、皖中落葉與常綠闊葉混交林。六安市轄區有豐富的水資源。轄區內有淠河、史河、杭埠河3大河流,為防洪、工農業生產以及建立良好的生態環境,建國以來,在六安大別山三大河流上游先后修建了著名的梅山、響洪甸、佛子嶺、磨子潭及龍河口等幾座大型水庫。
2013-02-11,繼Landsat 計劃40后NASA 再次成功發射了 Landsat 8 衛星,該星攜帶有兩個主要傳感器:OLI和TIRS。OLI陸地成像儀包括9個波段,空間分辨率為30 m,其中包括一個15 m的全色波段,成像寬幅為185 km×185 km。OLI包括了ETM+傳感器所有的波段,調整了OLI Band5(0.845~0.885 um),排除了0.825 um處水汽吸收特征;新增藍色波段band 1(0.433~0.453 um)和短波紅外波段band 9(1.360~1.390 um)。
選取四景OLI影像12238(20151011)、12138(20151002)、12139(20151002)和12237(20151011),統一高斯克呂格北京54坐標系6度分帶投影方式,完成影像的大氣校正、幾何校正、鑲嵌、邊界切割處理等,完成六安市Landsat8 OLI 7個30 m空間分辨率波段數據的處理。(圖1為OLI數據band7、band5和band4波段的RGB假彩色合成影像)。

圖1 六安市OLI數據754波段RGB合成圖
遙感衛星數據地表水體的提取方法主要有:目視解譯法、單波段閾值法、監督分類與非監督分類法、指數法[6]、譜間關系法等[7]。利用目視解譯方法,山體陰影與部分河流及湖泊均為暗黑色(見圖2),難以區別,計算機自動分類方法也不理想。研究區湖泊、河流地表水體空間分布分散,目視解譯效果不佳。因此選擇合適波段,利用水體OLI數據的光譜反射特性,提取地表水體的譜間關系指數[8],建立水體光譜特征模型,確定其閾值,并結合DEM建立決策樹分類規則對地表水體信息進行提取[9-10]。

圖2 754波段RGB影像山體陰影與水體對比
提取的指數有:歸一化植被指數(NDVI,Normalized Difference Vegetable Index)、比值植被指數(RVI,Ratio Vegetation Index)、改進的歸一化水體指數(MNDWI,Normalized Difference Water Index),Band3+Band4、Band5+Band7、Band3+Band4+Band5+Band7數據,并選取主成分分析前3個分量和DEM數字高程、坡度數據,共提取相關特征指數11個,與OLI原始數據組合完成決策樹分類基礎數據庫,空間分辨率均為30 m。
其中:NDVI=(NIR-R)/(NIR+R),RVI=NIR/R,MNDWI=(G-SMIR)/(G+SMIR).
式中:NIR,R,G,SMIR分別為Landsat-8衛星OLI數據的近紅外band5、紅光band4、綠光band3和短波紅外波段band7(2.11~2.29 um)。
植物具有在可見光紅光波段強吸收,近紅外波段高反射的特征,因此利用近紅外band5和紅光band4組合運算,得到NDVI和RVI指數,利用決策樹方法,分類植被與其他地物。NDVI指數對于植被覆蓋度低、植被生長狀態的監測靈敏;植被覆蓋度較高時RVI指數值指示效果較好,并且RVI能有效地區分陰坡植被與山體陰影。徐涵秋在Mcfeeters提出的歸一化差異水體指數基礎上,提出改進的歸一化差異水體指數(MNDWI),可以很好地區分水體和水體陰影,同時達到抑制建筑物和植被覆蓋信息的效果[5]。
決策樹分類方法是基于遙感光譜特征等數據,通過對數據統計、分析、判別,結合專家經驗,建立分類指標數據集和決策樹分類規則,提取信息的方法。其技術路線為遙感影像處理→特征參數提取和DEM數據獲取→標準樣區統計→建立規則→分類后處理、精度驗證和應用。該方法具有多源數據綜合利用、便于理解、易于操作等優點,并且大量研究結果表明該方法分類精度較高[11-12]。分類精度通過目視判讀和計算機統計分析相結合的方式進行評價。
實驗結果表明:
1)水體和山體陰影在OLIband1至band5和band7波段value值均小于其他覆蓋地類。
2)band1至band4波段山體陰影的value值均接近于0,此時與深度和面積較大的水體(面積數十km2,深度50 m以上的六安地區水庫)光譜特征與山體陰影較為接近,目視效果也相似(見圖2),造成“異物同譜”的現象。
3)OLI數據的band5單波段山體陰影與水體光譜特征相似,但與其他地類差異較大,可以直接利用band5單波段閾值法區分兩個類別:第一類為水體和山體陰影,第二類為其他地類(見圖3);同時試驗得出主成分第一分量對于區分此兩類地物效果也較好。

圖3 水體、陰影和其他地物OLI數據光譜統計
4)直接利用band1至band4單波段閾值分類水體與山體陰影效果不好,如面積較大、深度較淺的水體(區域北部溝通淮河的瓦埠湖)目視效果與光譜特征與山體陰影差別較大。
5)水體與山體陰影在NDVI,RVI,MNDWI和Band3+Band4+Band5+Band7、band5+Band7、Band3+Band4及DEM坡度數據上均能較好地區分。反復試驗建立研究區決策樹分層分類規則(見圖4)。

圖4 OLI數據去山體陰影水體提取決策樹
規則1:Band5≧1600 or 主成分1≦929 or Band5+Band71677,決策其他地類,否則執行規則2;
規則2:NDVI<0 or RVI<1 or Band1+Band2+Band3+Band4>Band5,決策為水體,否則運行規則3;
規則3:MNDWI<0 or Band5+Band7>Band2,決策為山體陰影,否則運行規則4;
規則4:高程>500 or slope>15°,決策為山體陰影。部分水庫與山體陰影光譜特征相同,各波段value均接近于0,通過DEM高程和坡度決策分類。
為了更好地評價決策樹分類的精度,選擇計算機自動分類的監督分類方法(最大似然法,標準樣區與決策樹分類法相同)和非監督分類方法(動態聚類法)同時完成該研究區OLI數據的自動識別工作,分類結果部分區域顯示見圖5、圖6和圖7,圖中藍色填充部分為水體覆蓋,黑色為山體陰影,白色為其他地類;圖7紅色部分為水體。

圖5 決策樹分類結果

圖6 754波段RGB圖和決策樹分類結果

圖7 動態聚類(左)和最大似然分類(右)
從圖6和圖7可以看出,由于山體陰影和山區深度較深的水庫光譜特征極為相似,僅通過OLI數據原始波段的計算機統計識別,會產生混淆像元,從而很難區分水體和山體陰影的信息。非監督分類將水體和山體陰影直接分類為同一個類別;監督分類仍有將水體分類為陰影或陰影分類為水體的部分。
在91衛圖13級影像圖上獲取水體、山體陰影和其他地類三類地物訓練樣區276個,對樣區特征指數和DEM等數據進行統計后建立決策樹分類規則,完成六安市地表水體信息的提取。采用誤差混淆矩陣[13]的總體精度和Kappa系數評價分類結果。總體分類精度為被正確分類的像元數和驗證總像元數的比值;Kappa系數是評價分類精度的多元統計結果,一般認為其值在0.8~1.0之間,符合分類要求,分類精度較高。研究結果顯示:決策樹分類總精度為99.36%,Kappa系數為0.983 4,采用同樣的標準樣區進行最大似然法分類,其總精度為93.91%,Kappa系數為0.857 9。顯然決策樹分類方法在山體去陰影提取中優于計算機自動識別方法,很好地避免了漏分、誤分的現象。
統計六安市面積為15 468.56 km2,其中水體面積為938.78 km2,占區域總面積的6.07%。
1)研究區山體陰影與水體光譜特征比較接近,特別是水庫水體部分,與陰影光譜比較一致,目視解譯或計算機自動解譯很難區分提取。
2)Band5波段和主成分1波段對于區別水體、山體陰影與其他地物,效果明顯。
3)NDVI,RVI和MNDWI能很好地區分水體和山體陰影;與山體陰影極為相近的水庫水體部分,輔助DEM的高程和坡度建立決策規則。
4)山區山體陰影面積較大,目視判讀解譯水體,并區分山體陰影很難實現解譯工作,必須進行計算機自動識別方法研究。與常規的計算機自動監督分類與非監督分類方法相比較而言,決策樹分類方法能很好地提高山區水體提取的精度。從監督分類最大似然法Kappa系數為0.857 9提高到0.983 4。
5)對于山地地區,特別是大范圍提取地表水體信息,利用30 m空間分辨率的OLI數據,完全能夠滿足分類要求。對于研究區域范圍內小面積的水體空間位置和面積信息提取,可以從提高數據空間分辨率和像元分解方法方面進行突破。研究中只完成了決策樹分類方法與常規分類方法的對比研究,后期仍可以添加決策樹決策指標,增加決策數據源或對比其他分類方法進行更深入的研究。
[1] 李紀人. 與時俱進的水利遙感[J]. 水利學報,2016, 47(3):436-442.
[2] 韓忻憶,頡耀文. 基于決策樹的干旱區濕地信息自動提取——以疏勒河流域為例[J]. 遙感技術與應用,2015, 30(6):1146-1152.
[3] 王偉武,朱霞,孫躍池,等. 基于ETM圖像的山地水體提取方法研究[J]. 系統仿真學報,2013, 25(9):2196-2200,2205.
[4] 楊甲,張珂,劉麗,等. 基于 SPOT-5影像的吳哥地區水體提取方法研究[J]. 測繪工程, 2016, 25(3):51-55.
[5] 徐涵秋. 利用改進的歸一化差異水體指數(MNDWI)提取水體信息的研究[J]. 遙感學報,2005(5):589-595.
[6] 李輝,周啟剛,焦歡,等. 基于TM影像的重慶市都市區NDVI時空變化特征[J]. 水土保持研究,2015, 22(6):250-255.
[7] 劉曉曼,莊大方,屈冉,等. 基于遙感數據的1989~2009年拉魯濕地變化研究[J]. 濕地科學,2013, 11(4):433-437.
[8] 王冰,呂昌偉,何江,等. 基于遙感的呼倫湖水體動態監測研究[J]. 環境科學與技術,2012, 35(9):94-98,149.
[9] 余超,李明陽,何隆華. 利用決策樹分類方法的南京江寧水稻面積變化研究[J]. 遙感信息,2015, 30(2):80-84.
[10] 張紅梅,吳基文,劉星,等. 特征提取和決策樹法土地利用遙感分類[J]. 測繪科學,2014, 39(10):53-56.
[11] 宋明明,鄭文龍,卞國棟,等. 基于多時相Landsat8數據的南方丘陵區典型地物信息提取——以秦淮河流域為例[J]. 科學技術與工程,2016,16(18):209-216.
[12] 張璇. 基于高光譜遙感的城市水網水體提取研究和實現[D].濟南:山東大學,2014.
[13] 李宜展,潘耀忠,朱秀芳,等. 土地覆蓋類別面積混淆矩陣校正與回歸遙感估算方法對比[J]. 農業工程學報,2013,29(11):115-123,295.
[責任編輯:張德福]
A study of extraction method of mountain surface water based on OLI data and decision tree method
ZHANG Hongmei1, WANG Dawei1, GAO Yang2, GONG Weizhen1
(1.School of Earth and Environment, Anhui University of Science & Technology, Huainan 232001,China; 2. Environment and Surveying Engineering College, Suzhou University, Suzhou 234001,China)
The automatic extraction method of OLI remote sensing data for surface water body in mountainous area is studied. The decision tree classification method based on DEM and index extraction is designed, which improves the accuracy of automatic identification of water body. The improved normalized water index (MNDWI), ratio Vegetation Index (RVI) and normalized difference vegetation index (NDVI) are selected, and the decision tree classification rules are constructed with the digital elevation model (DEM). At the same time, the method of threshold value method, spectrum-photometric method, vegetation index and water index threshold method are used. The research result shows that the decision tree classification method is obviously higher than other methods, which can be used in the extraction of surface water of OLI image data.
mountain; surface water; hillshade; OLI data; decision tree
著錄:張紅梅,王大衛,高楊,等.基于OLI數據與決策樹法的去山體陰影水體信息提取研究[J].測繪工程,2017,26(11):45-48,54.
10.19349/j.cnki.issn1006-7949.2017.11.010
2017-01-02
國家重點研發計劃項目子課題(2016YFD0300801);大學生創新創業訓練計劃項目(201510361124)
張紅梅(1982-),女,講師,博士研究生.
P237
A
1006-7949(2017)11-0045-04