馬夢茹,張永彬,王奕丹
(華北理工大學 礦業工程學院,河北 唐山 063210)
土地利用的監測和管理不僅是我國國土資源部門的主要工作[1]還是勘探我國地理國情的重要手段[2]。遷西作為唐山典型山區縣,依靠人工調查、逐級上報的土地利用監測方法[3]對于遷西這樣地形復雜的山區縣尤其困難。遙感技術擁有經濟成本低、監測范圍廣及工作效率高的特點[4],對地物識別、植被覆蓋度反演、時空變化監測和農田災害監測等具有重要意義[5]。遙感影像分類是影像信息提取的重要步驟,以往研究多是通過影像光譜信息、影像波段說明或借用前人經驗及參考文獻提到的波段組合進行研究區地物解譯和特征提取工作[6-8]。然而隨著光譜分辨率的不斷提高,影像中相鄰波段之間的相關性大大增加,致使波段間存在大量冗余信息,最終導致分類時出現數據處理復雜、計算時間較長的現象。
選擇最佳的波段組合對提高影像分類效率和精度是非常關鍵的,李秀梅等[9]利用標準假彩色432波段合成影像用于植被解譯并根據相關性最小、信息量最大化的特點,選取742波段合成影像用于海岸線變化提取。Chavez[10]根據相關性小、信息量大的原則,研究出最佳指數因子OIF(Optimum Index Factor)進行波段組合的選取是非常有利的,文獻[11,12]利用OIF指數對影像進行波段計算,根據OIF指數的排名得出波段741和波段245為各自選擇的研究區域的最佳波段組合。劉春紅等[13]根據OIF指數提出了自適應波段選擇ABS (Adaptive Band Selection)的方法,通過ABS指數計算影像的各個波段,選出的波段不僅自身含有豐富信息還要符合與其他波段相關性少的要求。除此之外,還需要判斷地物類別可分性,找到最佳波段[14]。郭力娜等[15]通過OIF指數和不同土地利用類型的光譜特征曲線來確定地物可分性,得出波段組合157在土地利用特征提取時精度較高,最適合其研究影像和區域。變換離散度類別可分性計算方式簡單但魯棒性好,在分析地物類別之間的光譜差異是通過統計距離計算的,得到了廣泛應用[16,17]。文獻[18-21]在綜合考慮各波段的信息多少、波段間的相關性高低、波段的可分性大小以及地物光譜吸收特性等因素的基礎上,提出光譜數據最佳波段的基本思路和方法。
綜上所述,有針對性地選擇合適的波段組合是高效開展影像應用研究的基礎和前提。基于此,該項研究針對遙感影像Landsat8-OLI影像的9個波段的信息難以充分考慮的情況,以遷西縣為例,通過OIF法和ABS法2種不同波段選擇方法結合變換離散度進行不同地物的可分性度量,并進行最佳波段選擇研究分析,從而提高遷西縣的土地利用信息提取精度,以期為遷西縣的相關研究提供參考。
研究區域選擇河北省唐山市遷西縣,距離唐山市約75 km,該縣的地理坐標為東經118°6′~118°37′,北緯39°57′~40°27′,坐落于河北省的東北區域,四季分明,屬于暖溫帶大陸性半濕潤的季風氣候。遷西縣的地勢南北高中間低,山地眾多,海拔70~831.3 m,是唐山市唯一的山區縣,境內有灤河、灑河、長河、清河、還鄉河等6條河流,土地利用類型多樣,林地覆蓋率達全縣的68%,因其獨特的地形地貌特征被評選為國家級生態示范縣。
所采用的研究數據來源于地理空間數據云網站下載的遷西縣2017年6月1日的 Landsat 8-OLI影像,云量覆蓋率為0.01且研究范圍內無云量覆蓋,影像投影分度帶為 UTM Zone 50N,基準面為 WGS84。其他輔助數據包括遷西縣矢量邊界用于確定研究區精確范圍,Google Earth 高分辨率歷史影像用于目視解譯選取高精度驗證樣本。
為了精確反演地表輻射亮度值和反射率值,在 ENVI5.1 軟件中對遙感影像進行輻射定標和大氣校正,利用 Gram-Schmidt 變換方法將大氣校正結果與15 m的全色波段進行圖像融合,融合后分辨率達到15 m,再利用遷西縣矢量文件進行邊界裁剪,最終得到研究區范圍。
2.1.1單波段標準差計算
多光譜影像每個波段的標準差可以表示像元反射率在空間變化的情況,繼而反應每個波段信息量的大小[22]。標準差大則表示該波段的像元灰度級分散,反差大,可以得到更多影像信息。標準差的計算公式為:

(1)

通過預處理大氣校正、影像融合以后得到分辨率達到 15 m的7個波段的Landsat8-OLI多光譜影像。通過ENVI軟件統計7個波段的標準差并進行大小排序,如表1所示。

表1 單波段的標準差信息
標準差表示圖像各像元灰度值與平均灰度的離散程度。波段的標準差與離散程度成正比,標準差越大離散程度越大,換言之即波段包含的信息越豐富。據統計,影像7個波段的標準差從大到小分別是B5>B6> B7> B4> B3> B1> B2。故僅從單波段信息量的角度考慮,由表得知第5波段的標準差最大,也就是說第5波段包含信息最豐富,最小的是第2波段,包含較少的信息。
2.1.2 波段間相關系數計算
一般計算各波段間的相關系數來進行多元統計[23]。相關系數可以表示2個波段間的相關程度,相關系數越小表示兩波段間的重疊性越小,即相關性越小。相關性小表示波段間信息冗余少即獨立性高,其值由2個波段間的協方差以及各自的標準差決定。數學表達公式為:

(2)

通過ENVI統計出的7個波段間相關系數矩陣,如表2所示。

表2 波段間的相關系數矩陣
圖1為各波段間的相關系數,橫縱坐標表示7個波段,對角線表示自相關系數,對角線以外表示2個不同波段之間的相關系數,顏色由淺到深表示兩波段相關性由小到大。

圖1 相關系數圖
由表2和圖1可知:從Landsat8影像的7個多光譜波段之間相關性的角度考慮,B1、B2、B3這3個波段間存在顯著的相關性。即這3個波段的信息彼此重疊多,冗余性高,其中B1和B2的相關系數最大,達到0.996。B5屬于近紅外波段,由圖1可知B5波段的顏色最淺,表明B5波段與其他波段的相關性都較低,其中B4和B5這2個波段的相關系數最小,為0.754,即B4和B5有較高的獨立性。另外,B7波段與B3、B4波段的顏色較深,其中B7與B4的相關系數達到了0.977,也存在較高的相關性。
2.2.1最佳指數因子
Chavez教授于1982年在美國提出最佳指數因子(OIF)法[10],該指數因子是在信息統計的基礎上,計算波段的標準差和波段間的相關系數,通過比較波段標準差之和、相關系數之和的大小來判斷最佳波段組合。數學表達公式為:

(3)
式中:OIF表示最佳指數因子,δi代表圖像中的第i波段的標準差,Rij表示i、j兩波段的相關系數,n代表選取的最佳波段組合的波段數目,一般為3。
2.2.2自適應波段選擇
劉春紅等人[13]在2005年提出自適應波段選擇(ABS)的新方法,該方法實現特征選擇與OIF法相同之處在于都需要計算波段標準差,但不同之處在于ABS法計算的是某一波段與前后兩相鄰波段的相關系數,其次運算得到各波段ABS 指數值。自適應波段選擇的公式為:

(4)
式中:σi表示波段 的標準差,Ii表示波段的ABS指數,Ri-1,i代表波段i與前一個波段的相關系數,Ri,i+1表示波段i與后一個波段的相關系數。Ii越大表示i波段的信息量越大,與周圍波段相關性越小,即該波段越具有代表性。
在遙感分類時為判斷地物可分性,計算各地類樣本基于不同波段組合或波段的距離,這是分類精度得到提高的前提。類對間的可分性判別方法主要有均值間的標準距離、J-M距離及離散度等[24]。該研究采用變換離散度TD(transformed divergence)方法,計算i、j2類樣本的變換離散度的公式如下:

(5)
其中dij即離散度,離散度的計算公式為:

(6)

由公式可知,TD有指數約束,計算結果有最大值和最小值,符合所提到的可分性標準要求且方便判讀,是相對較好的可分性指示因子[25]。其取值范圍為0~2,若TD>1.9 表示2個類別間具有較好的可分性;若TD<1.7 表示2個類別間可分性不佳[26]。
利用TD距離可以進一步分析最佳指數法計算的結果,依據地物類別選擇波段組合。
該研究共有7個波段參與波段計算,根據OIF法波段組合的原理,排除重復波段后,共有35種波段組合。通過公式(3)計算得到各波段組合的OIF值如表3所示。

表3 波段組合的OIF值
根據表1得知:單個波段計算標準差后,波段5標準差最大,包含豐富的影像信息。分析OIF法計算的波段組合,篩選包含標準差最大的第5波段且OIF值排名在前10位的波段組合作為最佳波段組合的初選范圍,前10位排序依次為:B5-B6-B7> B4-B5-B6 >B4-B5-B7> B3-B5-B6> B2-B5-B6> B1-B5-B6> B3-B5-B7> B2-B5-B7> B1-B5-B7> B3-B4-B5。由表3可知,前10位波段組合中相關性計算結果較高的第1、第2、第3波段沒有同時出現或者兩兩出現在初選范圍內。
根據標準差和相關系數通過公式(2)計算ABS指數,如表4所示。

表4 單波段的ABS值
ABS值從大到小依次分別是B7>B5> B6> B1> B4> B3> B2。ABS值越大,表示該波段的信息量越大。ABS值最大的是波段7,最小的是波段2,表示波段7具有較強的代表性,波段2的代表性差。
ABS指數法是從信息量最大、相關性最小的角度進行單個波段計算,為了與OIF法進行對比分析,根據ABS法計算結果,每3個波段為一組進行波段組合,并將波段組合的ABS值相加進行排序,結果如表5所示。

表5 波段組合的ABS值
經ABS法進行計算得到波段7代表性高,故篩選包含波段7的ABS總值排名前10的波段組合作為最佳波段組合的初選范圍,前10位排序依次為:B5-B6-B7>B1-B5-B7>B4-B5-B7>B3-B5-B7>B1-B6-B7>B2-B5-B7>B4-B6-B7>B3-B6-B7>B2-B6-B7>B1-B4-B7。
從表6 OIF與ABS波段組合的前15名對比結果可知, OIF法和ABS法計算結果排名第一的波段組合都是B5-B6-B7,波段組合B4-B5-B7均排名第3。但是OIF值排名第9的B1-B5-B7波段組合ABS總值排名第2,OIF值排名第7的B3-B5-B7波段組合ABS總值排名第4,OIF值排名第8的B2-B5-B7波段組合ABS總值排名第6,OIF值排名第2的B4-B5-B6波段組合ABS總值排名第11,OIF值排名第4的B3-B5-B6波段組合ABS總值也跌出前10排名第13,OIF值排名第10的B3-B4-B5波段組合由表5可知ABS總值排名第22。

表6 OIF與ABS波段組合的前15名
OIF法和ABS法尋找的都是波段組合信息量最大、相關性最小的波段組合,以上2種方法選擇的波段組合還未滿足最佳波段選擇原則,即缺乏對地類可分性的評價,因此需要對波段組合的可分性分析。
3.3.1確定土地利用類型
為分析遷西縣的土地利用情況,根據GB/T21010-2017 《土地利用現狀分類》以及遷西縣實際的土地利用情況將遷西縣的土地分為如表7所示6類土地類型。

表7 遷西縣的土地利用類型及說明
3.3.2變換離散度計算
地物類別可分性評價是指計算類別樣本基于各波段組合上的統計距離再進行分析。因此,針對遷西縣的地表覆蓋類型,依據各類別選取的訓練樣本,根據表7涉及的6種土地利用類型,分別選取分布均勻且數量足夠的樣本。其中農用地樣本選取 49個;水體樣本選取 34個;林地樣本選取 55個;居民地樣本選取 48個;工礦用地選取51個;其他用地選取 31個。
基于OIF法、ABS法篩選得到的前10組波段組合,分別計算樣本之間的TD距離,分析地類之間的光譜差異,實現多數地物之間的相對區分。6種類型兩兩間樣本組合有15種類型,而農用地與林地均為植被,居民用地與工礦用地均為建筑用地易出現難區分情況,因此為減小數據運算和提高分類精度,統計農用地與林地、居民與工礦用地這2組較難區分的地物類別間的TD距離。表8、表9分別為這兩地物類別基于不同波段組合的TD距離,并按照大小進行了排序,通過分析地物類別之間的TD距離篩選最佳波段組合。

表8 不同樣本間的TD距離(OIF波段組合)

表9 不同樣本間的TD距離(ABS波段組合)
由表8、表9可知:最佳波段組合并不唯一,會隨著不同地類發生改變。經過變換離散度計算地物可分性后,原本OIF法排序第1的波段組合B5-B6-B7排序下降到了第3,另外在ABS法篩選的波段組合排序中下降到了第5,可見,僅依靠信息量進行波段選擇有相對的局限性,應分析提取地物類型的光譜特征及統計地物類別之間的光譜距離后再進行波段選擇,可達到提高精度的效果。通過2類對TD距離之和計算結果進行大小排序,TD-h最大的波段組合即為最佳波段組合。最后OIF法篩選得到的最佳波段組合是B4-B5-B7,ABS法篩選得到的最佳波段組合是B1-B4-B7。
根據上述研究結果,對OIF法篩選得到的波段4、5、7進行RGB組合分析,共有6種不同組合結果。經過目視判別得到易于信息提取的波段組合順序是B7(R)B5(G)B4(B),如圖2(a)所示。該波段組合顯示下:水域呈深藍色、工礦用地呈紅色,林地呈鮮綠色、耕地呈淺粉色、其他用地呈白色、居民用地呈灰色。同理,對ABS法篩選得到的波段1、4、7進行RGB組合分析,經過目視判別得到最利于土地利用信息提取的最佳波段組合順序是B7(R)B4(G)B1(B),如圖4所示。該波段組合顯示下:水域呈現深藍色、工礦用地呈現粉紫色,林地呈灰綠色、耕地呈黃色、其他用地呈灰白色、居民用地呈青色與灰色的夾雜色。

圖2 不同波段組合顯示
為了更加科學地判定和比較2種波段選擇方法,研究基于以上OIF法和ABS法得到的不同波段組合,采用支持向量機(Support Vector Machines, SVM)的分類方法對遷西縣進行土地利用信息提取分析。OIF法的分類結果見圖3;ABS法的分類結果見圖4。通過目視解譯結合Google Earth隨機選擇足夠多的驗證樣本進行精度對比分析,錯分精度見表10,分類精度見表11。

表10 2種方法的錯分精度對比

表11 2種方法的分類精度對比
由表10可知,針對主要難區分的地物類別,ABS算法優選的波段組合比OIF算法優選的波段組合錯分比例低,更有利于區分。并且查看圖3的分類結果可以得知,研究區域的中部在水域周圍的工礦用地被錯分為居民用地,研究區域的東部有部分耕地被錯分為林地。
由表11可知,OIF算法優選的波段組合B7-B5-B4,總體精度為81.404%、Kappa系數為0.764 1,而基于ABS法選擇的最佳波段組合B7-B4-B1分類后的總體精度為90.614%、Kappa系數為0.881 1。ABS法優選的波段組合比OIF法更利于研究區的土地利用信息提取。

圖3 4-5-7波段組合分類結果 圖4 ABS法7-4-1波段組合分類結果
(1)OIF法和ABS法雖然都是基于波段標準差和相關系數,但是2種方法篩選得到的波段組合排序存在差異,OIF法篩選的波段組合之間的相關性越小排序越靠前,ABS法篩選后排序靠前的是波段之間相關性小且信息量大波段組合。
(2)僅使用OIF法和ABS法篩選出排名第1的波段組合B5-B6-B7在該項研究方法篩選的波段組合排名中分別下降為第3和第5。
(3)ABS法選擇的B7(R)B4(G)B1(B)滿足信息量大、相關性小且地物類別能被較好區分的最佳波段選擇原則,并通過SVM的分類方法驗證,其解譯效果和精度高于OIF法的B7(R)B5(G)B4(B)組合方式,因此B7(R)B4(G)B1(B)為遷西縣土地利用信息提取研究的最佳波段選擇。