蔡 衡,楚 恒,單德明
(1.重慶郵電大學通信與信息工程學院,重慶 400065;2.重慶高校市級光通信與網絡重點實驗室,重慶 400065; 3.泛在感知與互聯重慶市重點實驗室,重慶 400065;4.重慶市勘測院,重慶 400020)
從遙感影像中提取道路信息是許多城市應用的前提,如交通管理、城市規劃、道路監測、地理信息系統更新等[1]。伴隨著高分辨率遙感衛星的發展,影像分辨率也顯著提高,地物細節信息更加豐富,紋理更加清晰,但也給道路提取帶來了挑戰。而且在實際成像中,除了影像中本身的噪聲以外,還存在著同譜異物和同物異譜現象[2],如空地、房屋等與道路具有很大的相似性,道路輪廓會直接受到干擾目標的影響,造成道路提取斷裂、模糊及錯分現象。因此,如何高效且準確地從遙感影像中提取道路信息具有極其重要的意義。
傳統手動標記道路需要大量的人力和時間,且局限性較大,難以滿足社會生產建設的需要。近年來,深度學習通過學習高級特征表現出優異的性能,在自動道路提取、節省手動提取成本方面都取得了理想效果。目前常用的道路提取方法主要有CNN(Convolutional Neural Network)[3]、BP(Back Propagation)神經網絡[4]、ELM(Extreme Learning Machine)[5]、SVM(Support Vector Machine)[6]等。洪紹軒等[7]將SVM與模糊C均值結合進行道路提取,通過模糊C均值聚類得到建筑類地物,然后利用SVM完成道路提取,但道路最終的提取效果受聚類中心影響較大,難以取得穩定的提取精度。Cheng等[8]提出一種CNN網絡實現級聯端到端的自動道路提取,利用CNN網絡的表現能力,能夠較好地解決樹木和汽車的復雜背景和遮擋問題,以獲得良好的道路提取效果。李洪川等[9]提出了一種道路多特征多核SVM提取方法,以全局核函數和局部核函數加權組合方式構建多核SVM對影像分類,但是該方法需要大量訓練樣本,核函數的引入導致耗時過多。總的來看,上述方法都能在一定程度上提取道路,但遇到復雜影像時,仍存在精度和提取自動化程度低的問題。
因此,本文提出了一種基于ELM的高分辨率遙感影像道路提取方法。首先,對原始布谷鳥搜索CS(Cuckoo Search)算法進行差分進化改進,從而減少種群迭代次數,加快CS算法的收斂速度;其次,將改進后的CS算法同ELM結合,自適應選擇隱含層神經元個數及其所對應的輸入權值和偏置值,以提高模型的穩定性;再次,在ELM模型中引入數據樣本的幾何特征和數據蘊含的判別信息,通過最大化異類離散度和最小化同類離散度,優化ELM輸出權值,彌補ELM學習不夠充分的問題,進而提高ELM分類性能;最后,結合數學形態學處理,完成道路最終提取結果優化。通過重慶市某地區的影像實驗表明:本文方法可以較好地提取出道路信息,并且能準確、較為完整地提取具有一定復雜形狀的道路目標。


Figure 1 Network structure diagram of extreme learning machine圖1 極限學習機網絡結構圖
具有L個隱含層節點激活函數g(x)的ELM數學表達式如下所示:
(1)
其中,i∈[1,N];ωj=[ω1j,ω2j,…,ωmj]T是連接第j個隱含層神經元和所有輸入神經元的權重向量,bj是第j個隱含層神經元的偏置值,βj=[βj1,βj2,…,βjn]T是連接第j個隱含層神經元和所有輸出神經元的權重向量,ωj·xi表示ωj和xi的內積。對式(1)的N個方程進行簡化合并后等價為:
Hβ=Y
(2)
其中,H表示隱含層輸出矩陣,β為輸出權值矩陣,Y為期望輸出矩陣:
(3)
(4)
ELM的訓練過程是一個非線性優化問題,其學習過程可以看作求取線性系統Hβ=Y的最小范數的最小二乘解,解的數學計算公式表示為:
(5)

在ELM模型中,隱含層節點的輸入權值和偏置值是隨機生成的,難免會使網絡結構中的某些節點成為死節點,導致網絡結構不穩定,無法滿足數據要求。本文通過對原始CS算法進行差分變異策略,增加CS算法種群的多樣性,提高全局搜索能力,加快CS算法收斂速度;并利用改進后的CS算法來自適應選擇ELM隱含層節點數,從而提高ELM的精度和穩定性。
CS算法是通過模擬布谷鳥寄生性育雛行為,來有效求解最優化問題的算法[10]。同時,CS也與鳥類的Levy飛行行為搜索機制結合,使優化算法更有效。每個鳥巢中的卵代表一個解,布谷鳥的卵代表新解,目標是利用新解或者潛在優解替代巢中的劣解。尋找宿主鳥巢的路徑和位置更新公式為:
(6)

本文引入一種差分進化算法對CS進行改進,策略如下:
V=Xb+δ(Xi1+Xi2-Xi3-Xi4)
(7)
其中,V代表變異后的鳥巢位置;Xb代表目前群體中最優鳥巢位置;Xik(k=1,2,3,4)是在當前群體中隨機選取4個鳥巢;δ是縮放因子,取值為[0,1]。將式(7)引入CS算法中,式(6)變為:
(8)

(9)
如果當前鳥巢的適應度值小于Levy搜索更新后鳥巢的適應度值,則進行位置更新;反之,則不變。

(10)
利用改進后的CS算法自適應地選擇隱含層節點數,選取輸入權重和偏置值。對ELM模型網絡結構優化的過程如下所示:
步驟1訓練樣本歸一化處理。
步驟2設置改進CS算法的各項參數。被寄主發現的概率參數pa,N個初始鳥巢位置,最大迭代次數T。

步驟4產生隨機數rand,如果rand 步驟5若達到最大的迭代次數,則停止搜索和更新,跳轉步驟6,否則跳轉步驟3。 步驟6選擇適應度值最小的鳥巢位置,取整數作為ELM的隱含層節點數L,最終確定當前網絡的最優結構。 通過對基本CS算法引入差分變異策略進行改進,使鳥巢種群多樣性增加,并擴大了搜索范圍,增強了全局搜索能力。綜上所述,ELM采用改進CS算法自適應地選擇適應度值最小的鳥巢位置,然后取整數作為ELM的隱含層節點數L,并選取輸入權值和偏置值,增強了模型的穩定性,提高了精度。 在確定ELM的隱含層節點數之后,由于道路樣本的復雜多變性,將會導致ELM學習過程中訓練不充分問題,于是在優化后的ELM中引入判別信息[11]。對于N個不同的數據樣本(xi,yi),同類離散度矩陣Sa、異類離散度矩陣Sb數學表達式為: (11) 其中,N為樣本類別數,Nc為第c類樣本個數,ui為樣本類內均值,u為樣本總體均值。異類離散度矩陣和同類離散度矩陣分別體現了輸入樣本的空間分布特征以及蘊含的判別信息。將這2種離散度矩陣進行融合得到信息差矩陣S=Sa-(1-η)Sb,0≤η≤1,η為常量。 信息差矩陣中的η主要用來平衡同類和異類判別信息,當參數η增大時,側重于類內信息;反之,則偏向類間差異信息。通過上述網絡結構優化和調整后,改進的ELM優化問題可表示為: (12) 其中,C為正則化參數,ξ為訓練誤差矩陣。式(12)的優化問題可通過構建拉格朗日函數表示: (13) 令式(13)對β,α,ξ的偏導數為零,可得到如下方程: β=HTα (14) (15) h(xi)β=yi-ξi,i=1,…,N (16) 將式(14)、式(15)代入式 (16)便可以得到: (17) 然后將式(14)代入式(16)可以得到: (18) 由式(18)得到網絡的輸出函數為: (19) 其中,h(x)為待測試樣本數據,將選取的影像測試樣本歸一化后通過式(19)得到期望輸出結果,獲得相應的道路提取信息。 經過上述改進后的ELM提取的道路信息,仍存在由于其它噪聲干擾造成的斷裂和孔洞等現象。數學形態學利用結構元素可以平滑道路邊緣,填充孔洞和斷裂,以及去除噪聲,從而達到優化所提取的道路信息的目的。 本文2組實驗樣本由重慶市勘測院提供,第1組實驗樣本選取重慶市某郊區的QuickBird道路高分辨率遙感影像。該影像包含空間分辨率為0.5 m的全色影像和空間分辨率為1.8 m的多光譜影像,融合后影像分辨率達到0.5 m,樣本大小為340×340,原始影像如圖2a所示。 為驗證本文方法的準確性和高效性,采用參考文獻[7]的SVM方法、文獻[8]的CNN方法作為對比算法,通過客觀與主觀相結合的方式對提取效果進行評價,不同方法的道路提取效果如圖2所示。 Figure 2 Road extraction map 1 of different methods圖2 不同方法道路提取圖1 (1) 主觀分析:從目視提取效果圖來看,SVM的道路提取效果最差,存在大量的道路斷裂、畸變,同時一些建筑物或裸地被錯分為道路;CNN相較于SVM方法,能夠較好地提取道路輪廓,但仍存在錯分、孔洞以及道路不連貫等問題;而本文方法通過結合CS算法和判別信息,能明顯提高網絡穩定性和準確性,道路提取效果要明顯優于其它2種方法。同時結合數學形態學處理后道路信息提取完整,未出現錯分、斷裂和孔洞等情況。 (2) 客觀分析:為客觀評價道路提取效果,本文通過正確率、完整率和提取質量3個指標對道路提取效果進行客觀評價。 ①正確率。 正確率是正確提取的道路長度與提取道路總長度的比值: (20) ②完整率。 完整率是提取道路總長度與影像中實際道路總長度的比值: (21) ③提取質量。 提取質量是正確提取的道路長度與影像中實際道路總長度的比值: (22) 為進一步定量分析道路提取效果,驗證本文方法的有效性和準確性,通過在原始影像中隨機選取5 000個測試樣本點,并對道路和非道路樣本點數量進行個數統計。圖3為隨機測試樣本點分布圖。道路提取評價如表1和表2所示。 Figure 3 Distribution of test sample points圖3 測試樣本點分布圖 從表2中可以看出,本文方法的正確率達到了93.5%,在道路提取完整率上遠遠優于另外2種方法,達到了97.3%。相比較SVM和ELM,提取質量分別提高了5.7%和2.6%,能夠有效地提取出完整的道路信息。 Table 1 Extraction results of road test sample points 表1 道路測試樣本點提取結果 Table 2 Road extraction evaluation 1 of different methods表2 不同方法道路提取評價1 % 為了更好地驗證本文方法的有效性,采用另外一幅重慶市某城區的WordView-2影像(數據大小為340×340,分辨率為1 m(如圖4a所示)),進行驗證實驗,不同方法的提取效果如圖4所示。 Figure 4 Road extraction map 2 of different methods圖4 不同方法道路提取圖2 從圖4可以看出,SVM和CNN均存在錯分現象,致使道路提取不連續、斷裂和畸變等,道路提取不完整。本文方法能夠很好地抑制不連續和斷裂情況的發生,道路提取效果更好。道路提取評價指標如表3所示。 從表3中可以看出,本文所提方法與SVM方法和CNN方法相比,正確率和完整率明顯提高,正確率分別提高了9.1%和5.5%,完整率分別提高了11.4%和6%,同時提取質量也明顯優于它們。在運行時間方面,本文方法遠遠小于另外2種方法的,比用時最長的CNN縮短近百倍。由上述分析可知,本文方法在訓練時間上有突出的優勢,且道路提取效果更好。 Table 3 Road extraction evaluation 2 of different methods表3 不同方法道路提取評價2 針對高分辨率遙感影像中城市道路的復雜多變性及ELM快速分類能力,本文提出了一種基于ELM的城市道路提取方法。利用改進的CS算法來優化ELM的網絡結構,確定隱含層節點數,提高模型穩定性;引入數據樣本的幾何特征和蘊含的判別信息,進一步提高ELM的提取性能,實現城市道路的有效提取。通過實驗分析和比較可知,本文方法能夠完整地提取出道路信息,在地圖更新、城市規劃、災害檢測等方面有著一定的應用意義。3.3 判別信息下的ELM
4 數學形態學優化

5 實驗結果與分析






6 結束語