吳亞楠 董士偉 肖 聰 李西燦 潘瑜春 牛 沖
(1.山東農業大學信息科學與工程學院, 泰安 271018; 2.北京農業信息技術研究中心, 北京 100097;3.國家農業信息化工程技術研究中心, 北京 100097; 4.山東省地質測繪院, 濟南 250014)
頻繁的人類活動加劇了土地利用與土地覆被變化,精確的遙感分類圖是分析土地利用變化的關鍵,提高精度評估的準確性與可靠性是遙感分類圖合理應用的基礎。分類精度評估主要通過抽樣方式構建混淆矩陣計算總體精度(Overall accuracy,OA)和Kappa系數等[1],常見的抽樣方法包括分層抽樣、簡單隨機抽樣、系統抽樣等[2]。目前,精度評價樣本點大多采用隨機抽樣,這導致樣本點特征空間和地理空間代表性差,忽視了地物在空間分布上的自相關性和異質性,存在抽樣效率低和樣本信息冗余等問題[3-4]。在總體分類精度或各地類分類精度評估上,分層抽樣考慮了空間自相關性和分異性,且提高了樣本點在特征空間和地理空間的代表性和均勻性[5],與土地利用類型真實評價更為接近[6]。空間分層抽樣方法更為有效,空間分層方法是空間分層抽樣的關鍵環節。
基于層內方差小、層間方差大的原則,空間分層根據某種屬性特征和空間連續性將總體分為若干同質的區間,可為空間采樣調查或監測提供支撐[7-8]。空間分層的方式可大致分為兩類:一是直接利用現有分區單元對研究區域進行分層,如土地利用類型[9]、行政單元[10]等;二是利用先驗知識[11]、歷史數據、輔助數據[12-13]等信息,采用一定的分類方法對區域變量進行空間分層。空間分層的方式不同,分層結果也存在差異,因此有必要對影響空間分層的各種因素進行深入細致的分析。直接采用分區單元可看作是無先驗知識的空間分層方式[5,14-15]。遙感分類不同于空間分層,其分類結果可作為空間分層的一種體現,根據不同的分層規則同一遙感分類可以具有多種空間分層結果。遙感圖像上不同地物類型邊界處存在混合像元,而現有的常規分層抽樣算法較少考慮地類邊界和內部像元或區域對空間分層分異性的影響,致使空間分層結果的空間分異性存在明顯差異。如文獻[16]利用8鄰域算法進行內部像元和邊界像元的判斷,建立了一種考慮邊界區域分類精度的分層抽樣方法,提高了分類精度評估的準確性和穩定性。目前,空間分層的影響因素主要包括先驗知識、參考數據、目標對象等,其中目標對象的選擇尤為關鍵。目標對象分為內部對象和邊界對象兩大類,內部對象是指相同土地利用類型的像元及其在不同空間分辨率上體現的差異,而邊界對象是指不同土地利用類型之間相鄰的邊界像元。內部對象和邊界對象的不同組合構建了不同的空間分層模式:即不考慮內部與邊界對象、考慮邊界對象、考慮內部對象、考慮內部與邊界對象。目前,系統定量分析內部對象與邊界對象對空間分層結果影響的研究還非常缺乏。
評估空間分層分異性結果,通常基于空間分層結果通過選擇驗證樣本進行精度評估,或借助評估參數指標來驗證空間分層效果。由于缺乏更高分辨率的遙感數據產品及其分類精度評價指標,因此很難量化內部對象和邊界對象對空間分層分異性的貢獻,導致精度評估方式很難開展。地理探測器是探測空間分異性及揭示其背后驅動力的統計學方法[17],是度量和分析空間分層分異性的一種工具。本文以京津冀不同空間分辨率遙感數據產品為例,基于土地利用類型對遙感圖像進行內部與邊界對象劃分,并構建不同空間分層模式,設置與K-means聚類對比實驗,并采用地理探測器中的q參數定量評估不同空間分層模式對遙感圖像空間分層的分異性效果,旨在更好地認識和理解內部和邊界對象對提高空間分層分異性的貢獻作用,以提出分異性更高的空間分層方法。
京津冀位于華北平原北部,地理坐標為東經113°27′~119°50′,北緯36°3′~42°40′,總面積約為2.1×105km2,屬于典型的溫帶半濕潤半干旱的大陸性季風氣候。京津冀北部和西部屬于山區和高原,東部和南部屬于平原;土地利用類型主要為耕地、森林、草地、建設用地和水域。京津冀的氣候屬性及地形地貌特點導致各個土地利用類型相互交錯,錯綜復雜,科學合理的空間分層可以保證遙感分類精度評估的準確性和可靠性。
研究采用2017年京津冀土地利用遙感數據產品和NDVI數據,數據詳情如下:
(1)中國土地利用現狀遙感監測數據產品:來源于中國科學院地理科學與資源研究所,主要采用Landsat 8衛星數據,空間分辨率為30 m,將土地利用類型劃分為6個一級類型和25個二級類型。
(2)FROM-GLC10遙感數據產品:來源于清華大學,采用Sentinel-2衛星數據,空間分辨率為10 m,將土地覆被分為10個類型。
(3)MCD12Q1遙感數據產品:來源于地理空間數據云,采用MODIS衛星數據,空間分辨率為500 m,土地利用與土地覆被主要分為17個類型。
(4)NDVI數據:采用來源于地理空間數據云的空間分辨率為30 m的Landsat 8 OLI衛星數據,選取的影像中無云或云量較少,植被較為旺盛,對京津冀地區2017年可用的23景遙感影像進行歸一化植被指數NDVI計算并采用最大值合成法生成年度NDVI圖,用于遙感圖像空間分層分異性效果評估。
基于ArcGIS 10.6和ENVI 5.3軟件實現圖像裁剪、空間坐標系轉換及重分類處理。最終得到6類土地利用類型,分別為耕地、森林、草地、水域/濕地、建設用地和裸地。
基于土地利用類型對遙感圖像進行內部對象與邊界對象劃分構建不同的空間分層模式:不考慮內部與邊界、考慮邊界、考慮內部、考慮內部與邊界對象空間分層模式及K-means聚類分層,并分別采用直接利用土地利用類型[18]、圖像8鄰域算法、多尺度空間分異性方法、圖像8鄰域和多尺度空間分異性耦合方法、K-means聚類算法進行遙感圖像空間分層。其中,K-means聚類算法是以距離作為相似性評價指標,指定K個初始聚類中心,根據樣本之間的距離劃分為K類[19]。針對不同的土地利用類型,可以采用K-means聚類算法將每個類型分別空間聚類成K類。
區分內部與邊界對象的遙感圖像空間分層方法采用圖像8鄰域算法實現[20]。圖像8鄰域算法遙感圖像空間分層是結合“土地利用類型”與“是否邊界”2個依據進行分層,首先根據土地利用類型將遙感圖像劃分為相互獨立的層,然后在各個層內根據內部與邊界像元判別目標函數判斷像元屬性,將每個層繼續劃分為內部像元層和邊界像元層。
圖像8鄰域算法是以研究區內某當前像元點為中心,順時針或逆時針遍歷其8個鄰域內的像元,根據內部與邊界像元判別目標函數進行內部與邊界像元屬性判斷。如果當前像元與8鄰域內的每個像元土地利用類型一致,則當前像元為內部像元,反之則為邊界像元。研究區邊界處的像元(8鄰域像元不足)同樣采用以上內部像元和邊界像元判定方法。圖像8鄰域算法內部與邊界像元判別目標函數為
(1)
式中P0——研究區某一當前像元
Pi——內部像元Pe——邊界像元
T0——P0的土地利用類型
Ti——P08鄰域內像元的土地利用類型(i=1,2,…,8)
地表景觀具有復雜性及空間分異性等特點,地理要素可能在某一觀測尺度下是同質的,但在另一觀測尺度下卻是異質的。多尺度空間分異性方法是根據像元在不同空間分辨率下的差異:較大尺度可以掩蓋中小尺度數據差異;中尺度數據可以較好處理數據采集和精度間的關系;小尺度數據可以獲取復雜的地理要素信息,但對數據質量和數據處理能力有很高要求,無法反映大面積地表信息[21-22]。采用多尺度遙感數據產品,結合不同尺度優缺點,基于ArcGIS 10.6軟件對3種不同空間分辨率的遙感數據產品重分類結果進行疊置分析,確定空間分層方法。
疊置分析3種不同空間分辨率遙感數據產品重分類結果的異同之處,判別土地利用類型是否一致。以30 m空間分辨率的遙感數據產品土地利用類型為主,與10 m和500 m空間分辨率的遙感數據產品相應位置的土地利用類型進行對比,判別分析一致、基本一致與不一致屬性。根據耕地、森林、草地、水域/濕地、建設用地和裸地6類土地利用類型,最終得到土地利用類型一致、基本一致、不一致屬性共18層。
地理探測器中的分異及因子探測器使用空間分異性指數q度量了因變量Y空間分異性及自變量X對因變量Y空間分異的解釋能力[23-24],q越大則Y的空間分層分異性越高,即空間分層效果越好[17]。q計算公式為
(2)
式中Nh——層h的單元數
N——全區的單元數
σ2——全區的NDVI方差
L——空間分層總數
q越大說明Y的空間分異性越好且值域為[0,1]。NDVI能夠反映地表植被覆被情況,而土地利用方式則直接決定地表是否有植被覆蓋及覆蓋植被類型、覆蓋度、生長期等屬性,因此可以采用年NDVI間接反映不同土地利用現狀的空間差異[10]。研究采用的中國土地利用現狀遙感監測數據產品、FROM-GLC10和MCD12Q1遙感數據產品在遙感分類和特征參數選取時均直接或間接參考NDVI[25],因此可以基于參數q通過刻畫NDVI體現的不同土地利用現狀空間差異,來間接反映同時期遙感圖像空間分層的分異性。
3.1.1不考慮內部與邊界對象空間分層模式
不考慮內部與邊界對象空間分層模式直接利用土地利用類型進行遙感圖像空間分層,其空間分層結果如圖1a所示。最終處理得到6個層,分別是耕地、森林、草地、水域/濕地、建設用地、裸地層。
3.1.2考慮邊界對象空間分層模式
考慮邊界對象的空間分層模式采用圖像8鄰域算法進行遙感圖像空間分層,對重分類后的京津冀30 m空間分辨率土地利用現狀遙感監測數據,根據6類土地利用類型及內部與邊界像元判別目標函數,劃分地物類型的內部層和邊界層。經8鄰域算法處理得到6個內部層和6個邊界層,最終空間分層數為12層,考慮邊界對象空間分層模式的空間分層結果如圖1b所示,分別是內部耕地、森林、草地、水域/濕地、建設用地、裸地層和邊界耕地、森林、草地、水域/濕地、建設用地、裸地層。
3.1.3考慮內部對象空間分層模式
考慮內部對象的空間分層模式采用多尺度空間分異性方法進行遙感圖像空間分層。以30 m空間分辨率的遙感數據產品重分類結果為基準,與10 m和500 m空間分辨率的遙感數據產品重分類結果基于ArcGIS 10.6軟件進行疊置分析,獲得土地利用類型一致、基本一致、不一致屬性層18層,其中土地利用類型一致層6層、基本一致層6層、不一致層6層。考慮內部對象空間分層模式的空間分層結果如圖1c所示。
3.1.4考慮內部與邊界對象空間分層模式
考慮內部與邊界對象空間分層模式采用圖像8鄰域和多尺度空間分異性耦合方法,邊界層采用圖像8鄰域方法,內部層采用多尺度空間分異性方法進行遙感圖像空間分層。邊界層選擇圖像8鄰域算法空間分層結果的邊界地類層(6層),內部層選擇多尺度空間分異性方法空間分層結果(18層),最后綜合集成為考慮內部與邊界對象空間分層模式的空間分層結果,最終空間分層數為24層,其空間分層結果如圖1d所示。
設置與K-means聚類對比實驗進行分層分異性效果評估:一是設置不同空間分層模式的空間分層分異性效果對比實驗;二是設置相同分層數目下與K-means聚類對比實驗,主要包括:12層的K-means聚類和考慮邊界對象空間分層、18層的K-means聚類和考慮內部對象空間分層、24層的K-means聚類和考慮內部與邊界對象空間分層,旨在研究邊界對象和內部對象對遙感圖像空間分層分異性影響。針對京津冀6類土地利用類型,基于K-means聚類將每個類型分別空間聚類為2類、3類和4類,獲取12層、18層和24層的京津冀K-means聚類分層結果。定量計算京津冀2017年度NDVI的q,間接反映同時期遙感圖像空間分層的分異性效果,具體步驟如下:①獲取京津冀不考慮內部與邊界對象空間分層模式的空間分層結果(圖1a)、考慮邊界對象空間分層模式的空間分層結果(圖1b)、考慮內部對象空間分層模式的空間分層結果(圖1c)、考慮內部與邊界對象空間分層模式的空間分層結果(圖1d)、K-means聚類(12、18、24層)的空間分層結果和京津冀同時期年度NDVI。②采用空間均勻抽樣方法[26]選取5組樣本點集,格網尺寸分別為4 km×4 km、6 km×6 km、8 km×8 km、10 km×10 km和12 km×12 km,將每個格網中心作為一個樣本點,相應的樣本點數分別為13 503、6 002、3 368、2 170和1 505。③基于ArcGIS 10.6軟件的空間標識工具,獲取每個樣本點對應的空間分層屬性值及NDVI,并將其作為參數指標輸入式(2)進行計算。④分別計算不同空間分層模式在不同樣本點數下的京津冀2017年度NDVI的q,并進行定量評估與對比分析。不同空間分層模式對應的地理探測器的q、q均值和標準偏差如表1所示。

表1 不同空間分層模式q、q均值和標準偏差
q越大表示空間分層分異性效果越好,反之則越差;標準偏差越小則分層分異性效果越好,反之越差。本研究設置不同遙感圖像空間分層模式的空間分層分異性效果對比實驗。
不考慮內部與邊界對象(6層)、考慮邊界對象(12層)、考慮內部對象(18層)、考慮內部與邊界對象(24層)空間分層模式及K-means聚類12、18、24層空間分層結果對應的q均值±標準偏差分別為0.252±0.022 66、0.259±0.022 45、0.321±0.019 01、0.318±0.018 06、0.269±0.006 98、0.304±0.010 56、0.317±0.011 25。
(1)對于不同空間分層模式,考慮內部對象的空間分層模式q均值最大,考慮內部與邊界對象的空間分層模式次之,且兩者都明顯大于不考慮內部與邊界對象空間分層模式和考慮邊界對象的空間分層模式。不同樣本點數目下,考慮內部對象空間分層模式q都明顯大于考慮邊界對象空間分層模式q,可見內部對象對空間分層的空間分異性貢獻大;考慮邊界對象的空間分層模式q大于不考慮內部與邊界對象空間分層模式q,說明邊界對象也可改善空間分層分異性。
(2)考慮內部對象的空間分層模式(18層)的q明顯大于K-means聚類(18層)空間分層,而邊界對象參與的空間分層模式與相應的K-means聚類結果對比特征不具有顯著規律。因此,考慮內部對象的空間分層模式的分異性更高、效果更好。
綜上所述,內部對象比邊界對象提高空間分層分異性效果更好,起主導作用;邊界對象可以稍微提高空間分層分異性;分層數目也影響空間分層分異性。
(1)圖像8鄰域算法中內部與邊界像元定義標準過于嚴格及邊界劃分存在不確定性。判別目標函數采用“8鄰域內每個像元與當前像元土地利用類型是否一致”為判別標準過于嚴格;在多個土地利用類型的邊界交匯處,地類邊界可能相互交錯,很難嚴格按界限分離,導致圖像8鄰域算法邊界劃分可能存在一定的不確定性。
(2)空間分層數目影響空間分層分異性效果。空間分層數目越多,空間分層分異性效果不一定越好。空間分層數目太多易使得分層結果嚴重破碎化、降低空間分層效果[27-28]。不同邊界與內部對象組合構建不同的空間分層模式,各個模式的分層數目不同;但定量比較不同的空間分層方法的優劣,應該基于同一目標對象的相同分層數目下進行評估,如本研究設置的相同分層數目下與K-means聚類算法對比實驗。
(3)考慮內部與邊界對象的空間分層模式值得深入研究。由于地理探測器的原理與多尺度空間分異性空間分層方法原理一致,考慮內部對象空間分層模式分異性效果較優,但考慮到邊界對象相比內部對象更容易導致土地利用類型混淆,如何綜合考慮內部對象與邊界對象空間分層模式值得深入研究。
(1)基于京津冀土地利用類型對遙感圖像進行內部與邊界對象劃分并構建了不考慮內部與邊界對象(6層)、考慮邊界對象(12層)、考慮內部對象(18層)、考慮內部與邊界對象(24層)、K-means(12、18、24層)空間分層模式,相應的5組樣本點集的q均值±標準偏差分別為0.252±0.022 66、0.259±0.022 45、0.321±0.019 01、0.318±0.018 06、0.269±0.006 98、0.304±0.010 56、0.317±0.011 25。
(2)設置與K-means聚類對比實驗結果表明:內部對象對空間分層分異性起主導作用,邊界對象可以稍微提高空間分層分異性,分層數目也影響空間分層分異性。
(3)劃定了內部對象和邊界對象對遙感圖像空間分層的貢獻,對提出分異性更高的空間分層方法具有一定的指導意義和參考價值。但在圖像8鄰域算法、空間分層數目、考慮內部與邊界對象的空間分層模式等方面存在一定的不確定性。