江娜, 陳超, 韓海豐
(1.山東省國土測繪院,濟南 250013; 2.浙江海洋大學海洋科學與技術學院,舟山 316022)
海岸帶是陸地和海洋之間相互作用的交匯地帶,受人類活動影響大,其自然和生態環境極其脆弱和敏感[1-4]。隨著自然資源及各項調查監測工作的開展,依據不同的分類體系,管理部門形成了多源、海量的地理數據,能夠客觀反映海岸帶土地、森林、草原、濕地等要素空間分布情況。為準確評估海岸帶“山水林田湖草”等自然資源情況以支撐海岸帶保護開發與科學利用,需要以數字高程模型(digital elevation model,DEM)數據為三維空間基底,通過地類統計模型摸清地類表面面積底數,以揭示該特殊區域地類分布的空間特性、相互關系及其分布規律[5]。
DEM是地表形態的數字化表達,蘊含了三維分析所必需的地形地貌信息。多尺度是DEM的重要特征,數字地形應用分析面臨各種尺度問題[6]。DEM空間尺度對自身信息量、數據精度[7-9],以及坡度、坡向、曲率等地形因子具有直接的影響。此外,DEM尺度對地貌類型劃分[10]、生態價值評估[11]、土壤有機碳制圖[12]、土壤侵蝕預報[13]、水文模型構建[14-15]和巖性識別與分類[16]等均具有重要影響。隨著DEM采樣間隔增大,地形描述精度呈降低趨勢[8],地形信息被綜合,地形概括能力增強,整體趨于平坦化[17]。在開展具體的應用與分析時,需綜合考慮統計模型與DEM數據尺度匹配的問題[9],選取適宜的研究區間。在海岸帶地類統計模型構建過程中,DEM空間分辨率越高,越能真實、精準地表達區域地形地類空間分布,但數據體量和計算密度急速增加,影響計算和存儲的效率[5],還會導致局部區域出現微地貌,影響地類整體統計結果。因此,開展海岸帶自然資源地類三維統計時,需綜合考慮地類的空間結構、分布特點、采集指標、統計精度和計算效率等因素的影響選取最優尺度的DEM數據。
當前,鮮有針對于DEM尺度與自然資源地類統計適配性問題的專門研究,各調查監測成果統計中采用的DEM尺度也不一。在基于無縫場模型開展的大型自然資源調查監測中,地理國情監測數據基本統計主要基于10 m格網DEM開展; 第三次國土調查成果以各省最精細DEM生成的坡度數據(如山東省基于2 m格網DEM數據),分級統計耕地等地類面積。針對于此,本文研究海岸帶統計模型與DEM空間尺度的關系,討論影響統計結果的主要因素,構建評價模型,提出了一種針對海岸帶地類統計的DEM空間尺度優選方法。本文提出的方法為海岸帶地理國情監測、第三次國土調查、森林資源調查以及其他調查監測的地類統計DEM尺度選取提供了理論和實踐依據并可推廣至其他區域。
海岸帶地類統計模型中DEM空間尺度影響結果的準確性、概括性、信息量和計算效率。在本方法中,以現有最高精度DEM為數據源派生出多尺度DEM數據,以精準的地類圖斑數據為待統計數據源,從DEM空間尺度對統計結果的準確性、概括性、信息量和計算效率等4個方面選取影響因子構建評價模型,數學表達式為:
(1)
式中:S為總體影響評價;f(xi)為DEM空間尺度對準確性的影響;pxi為各準確性因子權重;y(yi)為DEM空間尺度對概括性的影響;pyj為各概括性因子權重;z(zk)為DEM空間尺度對信息量的影響;pzk為各信息量因子權重;o(og)為DEM空間尺度對計算效率的影響;pog為各計算效率因子權重。各DEM尺度影響因子層次結構如圖1所示,其中*為限制性因子。

圖1 DEM空間尺度評價模型
評價指標分為限制性指標和一般性指標,限制性指標對DEM空間尺度具有決定性: 當DEM空間尺度不滿足限制性指標要求時,需剔除該尺度; 當滿足需求時,與一般性指標共同參與影響力計算。基于客觀賦權法-熵權法計算各影響因子權重,加權計算DEM各尺度綜合得分,得分最高的尺度即為最優DEM空間尺度。具體技術流程如圖2所示。

圖2 技術流程
全國第三次國土調查、地理國情監測等自然資源調查監測成果屬于“統一比例尺、統一分辨率、統一內容指標、統一采集標準的無縫隙、高分辨率、覆蓋全域”的高精度地理要素數據[5],對其開展統計分析需優先保證統計精度,即準確性。DEM空間尺度既要滿足地類統計的精度要求,也需滿足區域基本地形因子描述的精度要求,此處選取代表性地形統計因子: 高程最大值、最小值、地表平整系數[18],統計各因子偏差率; 對于地類統計精度的測定,選取地類面積偏差率作為限制性指標。特別注意海岸帶特殊地物(如獨立房屋、固化池等面積占比小于0.1%的細小目標)的統計精度,以及鐵路與道路等線狀目標地類的統計偏差,將其作為限制性因子,當DEM尺度對特殊地物影響偏差超過設定閾值時,直接剔除該尺度。
準確性評價采用的指標為: 偏差率、偏差均方根。根據“DEM采樣間隔增大,地形描述精度呈降低趨勢[8]”這一基本規律,可將最高尺度DEM的地形統計和地類統計結果近似為真值。高程最大值偏差率mi計算公式為:
(2)
式中: max(hi)表示區域DEM尺度為im時DEM高程最大值; max(ho)為最高分辨率時的高程最大值,作為近似真值。地表平整系數是區域平面面積與地表表面面積的比值,反映地表的粗糙程度[18]; 最小值偏差率和地表平整系數偏差率計算公式與式(2)一致。
地類偏差率mi,j和偏差率均方根RMSEj計算公式分別為:
(3)
(4)

統計分析是從離散數據向信息、知識乃至智慧轉化和提升的過程[21],因此,統計結果要體現概括性和規律性。精細的DEM數據可能會保留局部微地貌,在地類統計過程中具體表現為坡度帶破碎、數據量大,村臺、路基等平坦地物存在較大坡度起伏。針對于此,選取微地貌概括因子來衡量DEM尺度的影響。
微地貌概括為限制性因子,反映DEM對于微地貌的綜合情況。其計算方式為: 選取道路、平坦房屋建筑區等作為樣本區(坡度帶在0°~2°范圍),統計該范圍0°~2°坡度帶的面積占比Sp,公式為:
Sp=S0~2/S∑×100%,
(5)
式中:S0~2為樣本區0°~2°坡度帶面積;S∑為樣本區總面積。借鑒中誤差理論,統計值落入±2倍標準差范圍內的概率為95.5%,因此以95.5%作為微地貌概括因子的閾值。

(6)
信息熵反映了數據不確定性的大小,數據信息熵越接近最大熵值,其分布也越規則[23]。在地類統計過程中,首先計算地形因子坡度帶和高程帶的信息熵; 其次以地類為單元,統計不同DEM尺度下地類信息熵; 最后,選取耕地、園地、林地、草地等空間分布與地形關聯較大的地類計算坡度帶信息熵。信息量評價因子為一般性因子。
計算效率是評價統計模型經濟性的重要因素,選取DEM格網數量以及相同處理環境下不同空間尺度DEM重要處理環節運行的時間等2個因素來開展計算效率評價,2個因子均為一般性因子。
通過限制性因子篩選適宜的DEM尺度,基于熵權法確定各因子權重。熵權法適用于定量指標的客觀賦權和無量綱化[24],其基本思想是認為評價指標的差異程度越大越重要,則權重相應也越大[25]。熵權法計算權重可分為以下步驟[25-27]:
1)構造原始指標數據矩陣Ru×v,即
(7)
式中:u為評價指標數量;v為評價對象數量。
2)對原始指標數據進行歸一化處理,得到標準化矩陣I,即
I=(rij)u×v,
(8)
式中rij為第j個評價對象在第i個評價指標上的標準值,rij∈[0,1]。對于正向指標為:
(9)
式中: minRi和maxRi分別為第i個評價指標的最大和最小值。對于負向指標為:
(10)
3)定義熵。在式(6)的基礎上,第i個指標的熵Hi定義為:
Hi=H(Ci)/lbv。
(11)
4)定義熵權。第i個指標的熵權wi定義為:
(12)
本次研究以山東省海岸帶區域為研究區(圖3),包括山東省沿海34個縣級行政區劃,涉及7個地市,位于N35°04′~38°24′,E117°30′~122°42′之間,陸域面積為4.14萬km2。山東省濱州、東營、濰坊等沿海區域瀕臨渤海,為黃河三角洲沖積平原地區,地勢平坦; 東部煙臺、青島、威海、日照沿海為膠東丘陵地貌。海岸帶地表覆蓋和土地利用方式豐富,以耕地、草地、園林地為主,建設用地占區域面積的21.4%; 同時,海岸帶是水陸交接、人類活動頻繁的區域,其生態保護和開發具有重要的意義,以此為研究區具有典型性和代表性。

圖3 研究區地形
以2020年地理國情監測地表覆蓋面數據為地類數據源,分為耕地、園地、林地、草地、房屋建筑(區)、鐵路與道路、構筑物、人工堆掘地、荒漠與裸露地表、水域等10個一級類,分類標準參見《GDPJ 01—2013地理國情普查內容與指標》。DEM數據基于LiDAR點云數據生產,空間尺度為2 m,數據現勢性為2014—2019年,是迄今為止山東省精度最高的DEM數據。以2 m格網DEM數據為基礎,在ArcGIS軟件中采用空間重采樣方式,派生5 m,10 m,15 m,20 m,30 m,40 m,50 m,60 m,70 m,80 m,90 m,100 m等12個不同尺度的DEM數據,參與計算的DEM共計13個尺度。部分尺度DEM數據如圖4所示。


(a) 2 m(b) 5 m(c) 10 m


(d) 20 m(e) 30 m(f) 50 m
2.3.1 準確性分析
基于2 m格網DEM統計區域地形特征,山東省海岸帶高程值在[-79.0,1 130.7]m之間,均值為49.6 m,地表平整系數為0.977 6。隨著DEM空間尺度增大,區域地表平整系數不斷增加,越來越趨近于1; 最大值被綜合,呈逐漸減少的趨勢,最小值和均值局部存在較大波動,見表1; 偏離率呈現增加的趨勢,如圖5所示。

表1 地形統計特征與DEM空間尺度的關系

圖5 地表平整系數和最大值偏差率隨DEM空間尺度變化
極值點的限差依據CH/T 9009.2—2010相關規定確定,2 m格網DEM近似于1∶5 000比例尺DEM精度要求,高程最大值位于嶗山山區,按山地推定高程中誤差為2.5 m,最小值均位于萊州市平原地區,推定高程中誤差為0.5 m[19]。以2 m DEM作為真值,區域高程極值應在2倍中誤差范圍內,即最小值、最大值分別需在(-79.0±1.0) m、(1 130.7±5.0)m范圍內。對比重采樣后高程極值,按最大值推定合適的尺度區間為[2,30]m,按最小值推定為[2,100]m,根據地形精度要求DEM空間尺度需在[2,30]m之間。
除地形特征外,還需保持地類統計結果的準確性,特別是對線狀以及小目標地物的統計精度。計算結果發現,隨著DEM尺度的增加,地類統計精度整體呈現降低的趨勢,如表2所示。文獻[20]中提及統計精度在萬分之幾的量級上可滿足需求,因此選取地類偏差率閾值為10/10 000,得到DEM空間分辨率需小于等于30 m。面積較小、細長地物的地類統計對于DEM尺度要求更高,試驗區內線狀地物以鐵路與道路為例(圖6),小目標地物以區域面積最小的2個子類草本果園(19 596.4 m2)和露天稀土礦采掘場(24 752.6 m2)為例開展分析。對特殊地物放寬限差要求,按照主體在2倍中誤差、置信水平95.5%內,發現鐵路與道路因基數較大各尺度均可滿足精度需求; 但小目標地物適宜DEM尺度分別限定在[2,50]m和[2,30]m之間(圖7)。由此可見,地類統計和地形精度限制性因子對DEM尺度要求是一致的,即不可超過30 m。

表2 DEM空間尺度與地類統計精度關系

圖6 線狀地物示例

圖7 小目標地物統計偏差率與DEM尺度的關系
2.3.2 概括性分析
結合遙感影像和DEM數據選取海岸帶平坦地區(坡度≤2°)面積大于150 000 m2的低矮房屋建筑區為樣本區,為避免房屋邊界出現坡度突變,將邊緣向內收縮5 m、去除多部件并再次篩選面積大于150 000 m2的376個樣本區作為研究區。開展不同DEM空間尺度下房屋建筑區各坡度帶分布統計,結果如表3所示。當空間尺度為2 m時,目標區2°以下坡度帶面積僅占77.15%,5 m時占比為87.42%; 存在大量微地貌不利于地形統計,10 m及更大尺度時2°以下坡度帶占比超過95.5%,滿足地類統計的概括性限制要求。從概括性的角度來看,適當的DEM尺度綜合對于去除微地形非常重要,在本試驗中DEM格網尺寸不能小于10 m。

表3 房屋建筑區在不同DEM尺度下各坡度帶分布情況統計
2.3.3 信息量分析
對不同尺度DEM數據開展高程帶、坡度帶分級,參照地理國情基本統計規程[18]及其操作實踐,將研究區高程分為(-50,50)m,[50,100)m,[100,200)m,[200,500)m,[500,800)m,[800,1 000)m,[1 000,1 200)m等7個高程帶,依據水土保持通用分類分級標準,將坡度分為(0,3]°,(3,5]°,(5,10]°,(10,15]°,(15,20]°,(20,25]°,(25,30]°,(30,35]°,(35,40]°, (40,45]°,(45,50]°,(50,55]°,(55,90]°等13個坡度帶。計算結果發現,DEM空間尺度與坡度帶信息熵呈負線性相關關系,即
y=-0.088 5x+2.376 1。
(13)
判定系數R2為0.933 1,坡度帶信息熵隨DEM空間尺度增加逐漸遞減,從2 m到100 m,熵值丟失率(熵值減少值與初始值的比值百分比)為45.77%; 而高程帶信息熵對DEM尺度不敏感,信息熵在[1.379 8,1.379 9]之間,變化量微小,與DEM尺度無明顯相關性,如圖8所示。
統計耕地、園地、林地和草地等植被的地類坡度信息熵,發現隨著DEM格網增大,各地類信息熵均呈現降低的趨勢,信息熵丟失率逐漸增大,變化情況如圖9所示。


(a) 坡度帶信息熵(b) 信息熵丟失率
當DEM空間尺度相同時,草地信息熵最大,2 m時值為2.80,而園地最小僅為1.80,表明草地在各坡度帶的分布較其他地類相對均勻,而園地在坡度帶上分布相對集中。同時,隨著DEM格網增大,各地類在特定坡度帶上的分布趨于聚集。100 m格網相對2 m格網地類的信息熵丟失率在[52.45%,77.07%]之間,林地的信息熵丟失率最大,表明林地坡度帶信息熵對于尺度變化最為敏感。因耕地、園地、林地和草地等植被的地類坡度信息熵具有高相關性,在構建評價指標體系時,僅選取對尺度敏感度最高的林地坡度信息熵參與權值計算。
2.3.4 計算效率分析
考慮計算效率,山東省海岸帶2 m空間尺度DEM共有103.4億個格網,而100 m有413.7萬個格網,格網數量與DEM尺度呈二次冪函數關系,即
y=4×1010x2。
(14)
從計算效率來看,以DEM坡度計算為例,2~100 m坡度帶計算耗時分別為2 648.0,413.0,103.0,47.15,25.86,10.97,7.0,4.15,3.31,2.4,2.01,1.73和1.52 s,坡度計算時間與DEM格網數量線性相關,即
y=3×10-7x。
(15)
判定系數R2=1,如圖10所示。由于要素數據量和計算時間高度線性相關,構建評價模型時,僅選取DEM格網數量作為一般性指標。

圖10 格網數量、計算時間與DEM尺度關系
2.3.5 最優DEM尺度選取
通過限制性因子篩選,適宜海岸帶地類統計的DEM尺度在[10,30]m之間,具體為10 m,15 m,20 m和30 m等4個尺度。按圖1所示構建指標評價模型,對于高相關性的指標僅選取其中具有代表性的因子,構建DEM空間尺度對地類統計影響12×4階指標矩陣R; 根據指標對統計結果影響的指向,區分為正向指標和負向指標,分別開展歸一化,得到標準化矩陣I,計算熵值和熵權值,結果如表4所示。從一級指標來看,準確性指標熵權最大,為0.376 5; 計算效率熵權最小,為0.157 1; 信息量熵權為0.267 6,概括性熵權為0.198 8。從單項指標來看,微地形概括熵權值最高,為0.198 8,最小值偏差權重最小,為0.043 0,說明不同空間尺度DEM的微地形概括熵值差異最大,而最小值偏差統計熵值差異最小。將熵權值帶入標準化后的指標矩陣I,按式(1)計算,10 m,15 m,20 m和30 m DEM綜合得分分別為0.764 8,0.572 0,0.383 0和0.141 6,可以看出,隨DEM采樣間隔的增加得分呈降低趨勢,準確性和信息量在海岸帶地類統計過程中占主導因素。10 m格網是地理國情監測、第三次國土調查等海岸帶地類統計分析的最優DEM空間尺度。

表4 熵權法確定指標權重
本文首次系統探討了海岸帶DEM空間尺度對地類統計模型的影響,在準確性、信息量、計算效率等影響因子外,兼顧統計特性加入概括性影響因子共同構建評價模型; 將影響因子分為限制性因子和一般性因子,通過限制性因素篩選適宜的DEM空間尺度區間,在此基礎上以熵權法客觀賦權后加權統計各尺度DEM綜合得分從而得到最優DEM空間尺度。主要研究結論如下:
1)不同影響因子對DEM精細度要求不一致,DEM格網越大,對統計準確性和信息量的負向影響越明顯,對概括性和計算效率的正向影響越顯著。
2)準確性因子對DEM精細度要求高,為滿足統計準確性要求,空間尺度不應超過30 m,而地貌概括則要求空間尺度不能低于10 m。
3)空間操作計算時間與DEM格網數量線性正相關,而格網數量是空間尺度的二次冪函數。
4)基于熵權法計算權重后綜合評價最優DEM空間尺度為10 m,綜合來看,DEM準確度和信息量對尺度選取結果起到決定性作用。
本文形成的DEM空間尺度優選方法在海岸帶自然資源及其他調查監測地類統計中具有通用性,也可擴展至其他區域,但需針對不同數據源、不同調查監測方式、不同使用目的等對指標和閾值進行適當調整。本文使用的DEM數據是以LiDAR點云為原始數據生成,對于細節表達較為精細,而采用其他方式生成的DEM數據在具體的計算結果上可能存在差異; 此外,本文以地理國情監測成果為地類統計數據源,其空間精度基本等同于1∶10 000比例尺基礎地理信息數據精度,若考慮其他精度地類統計,同樣可以采用本文提及的方法,針對具體的要求開展DEM尺度選取。