宋佳陽
(遼寧省鞍山水文局,遼寧 鞍山 114000)
當前河流數字化提取隨著地理信息技術快速發展已成為區域河流調查和評價的主要方式,水利普查已經完成了流域面積50km2河流數字化提取工作,但對于流域面積在10~50km2小型河流還未開展數字化提取工作,而對于鞍山地區而言,由于位于遼寧東部山區,河流水系較為復雜,尤其是小型河流分布較多[1]。為補齊鞍山地區河流數字化數據底板,開展對流域面積在現10~50km2小型河流數字化提取工作,由于這部分河流數目較大,逐條河流提取需要消耗大量的人力、物力。為提高河流數字化提取的效率,國內開展過相關研究,并取得一定研究成果[2-7],這其中河流數字化并行提取算法,可顯著提高河流數字化提取的精度。近些年來,具有密度聚類算法的河流數字化并行提取方法得到一定程度的應用,通過實例應用研究[8-14],相比于傳統串行算法,其河流提取精度得到明顯提升,但在小型河流數字化并行提取中還未得到相關應用,為提高鞍山地區小型河流數字化并行提取的效率,從工作實際出發,引入密度聚類算法,結合地理信息軟件,對鞍山地區10~50km2小型河流進行并行數字化提取研究,研究成果對于區域中小型河流數字化并行提取具有重要參考價值。
國內對于河流數字化提取的方法已有較為成熟的成果,本文重點對小型河流并行提取的密度聚類算法進行介紹,該算法通過對并行提取河流之間的空間距離進行分析后建立其密度函數,對密度函數進行不同維度樣本集合的勢度函數pi(0)進行計算:
(1)
式中,n—河流提取空間維度;a—提取區域的搜索半徑,m。
a的計算方程為:
(2)
其中搜索半徑的運算基礎為勢度函數計算值,該搜索半徑在較大數據樣本情況下收斂度相對較低,為此采用密度函數對其并行聚類進行計算:
(3)
式中,D—搜索半徑范圍內的聚類值;fd—密度聚類系數。
對搜索半徑范圍內的聚類值進行初始密度計算:
(4)
在計算完成河流并行提取樣本數據系列的初始密度后采用歐幾距離矩陣方程對其空間聚類密度進行計算:
(5)
在進行空間聚類密度計算后對其河流并行提取的復雜度進行計算:
(6)
結合計算的河流數字化并行提取復雜度值對其進行綜合聚類密度的修正計算:
(7)
式中,K—修正系數。
采用計算試驗方法分別對不同計算閾值、聚類系數下河流并行提取時效性進行對比分析,設置的河流并行提取的樣本總數為400,空間維度設置為20,2種算法下河流并行提取的時效性對比結果見表1。

表1 不同算法下小型河流并行提取計算時效對比
從不同算法下400條小型河流的計算時效對比結果可看出,在相同計算閾值和空間維度下,密度聚類算法下在聚類系數為19.8時其提取時長為16.2min,而傳統串行算法下在相同計算閾值和空間維度情況下,其聚類系數相比于密度聚類算法有所減小,400條小型河流提取的計算時長為41.3min,相比于密度聚類算法,傳統串行算法下提取時長增加25.1min,密度聚類算法下其計算時效平均可提高47.5%,這主要是因為傳統串行算法對各小型河流進行逐維度計算,其聚類系數要高于密度聚類算法,增加了其河流并行提取搜索半徑的范圍,從而使得其計算時效相比于密度聚類算法有明顯增加。
結合地理信息技術對鞍山地區10~50km2小型河流進行數字化提取,為實現小型河流數字化并行提取,結合密度聚類算法對其數字化提取方式進行并行計算,其首先基于流域數字高程數據采用D8算法進行流向的計算,流向計算如圖1(b)所示,在對不同計算網格單元流向分析后采用密度聚類算法對其進行匯流累積并行計算,如圖1(c)所示,在進行匯流并行累計計算后對其滿足一定閾值范圍內的河流進行數值化并行提取,提取過程如圖1(d)所示。

圖1 基于密度聚類算法的河流數字化并行提取過程圖
結合鞍山地區流域面積在10~50km2的10條小型河流實地調查數據,對比分析密度聚類算法下小型河流提取的精度,精度分析結果見表2。

表2 小型河流數字化并行提取精度分析
并對其數字化提取河長和比降與實際調查值的吻合度進行分析,分析結果如圖2所示。

圖2 數字化提取的河長和比降與實際調查值吻合度分析
從小型河流數字化并行提取精度分析結果可看出,對于鞍山地區流域面積在10~50km2的10條小型河流數字化提取的河長、比降和實際調查值之間的相對誤差均在20%以內,其中林家河相對誤差最高,這主要是因為該河道彎曲度較大,對其河流數字化提取精度產生一定程度影響,可見對于小型河流而言,其河流彎曲度對其數字化提取精度影響較高。從絕對誤差分析可看出,對于小型河流河長數字化提取值和實際調查值之間的絕對誤差在3km以內,河段比降絕對誤差在3%以內,對于小型河流而言,其河流數字化并行提取精度基本滿足要求。從數字化提取的河長和比降與實際調查值吻合度分析結果可看出,其相關系數總體在0.5以上,河長相關度要高于比降相關度,對于河長而言,其數字化提取的精度受河流彎曲度影響相對較小,而河段比降其受河流彎曲度影響較大,因此其吻合度要低于河長數字化提取值和實際調查值之間的吻合度。
(1)采用密度聚類算法對小型河流進行數字化并行提取時,為提高其提取效率,其應建立聚類密度指數和空間維度的關聯方程,來對其聚類密度指數進行優化,從而降低其搜索半徑范圍,一般聚類密度指數要控制在10~15之間為宜。
(2)小型河流彎曲度對于密度聚類算法下河流數字化提取精度影響較大,對于小型河流而言,其彎曲度在2.0以上,需要結合河流調查值,對其比降提取值進行適當修正。
(3)密度聚類算法適合于山丘型小型河流數字化并行提取,其對于平原地區河流提取的適用性還需進一步探討。