韋春桃,何蔚
(重慶交通大學 重慶智慧城市學院,重慶 400074)
道路信息的提取與不斷更新對于現代城市的發展具有重要意義。如今,基于遙感圖像,尤其是高分辨率遙感圖像的道路數據庫已經廣泛應用于車輛導航、城市規劃等方面。
遙感影像道路提取方法主要可分為模板匹配、知識驅動、面向對象和深度學習四類[1]。連仁包等[2]提出了一種自適應圓形模板,結合形態學梯度圖自動設定模板尺寸,利用道路顯著圖和幾何形狀信息搜索道路中心點。潘勵等[3]發明了一種多層次知識驅動的全色遙感影像的道路變化信息提取方法,根據人的感知快速檢測出道路的變化,將結果提供給用戶,增強了地圖修測的自動化程度。胡建青[4]基于易康軟件,利用面向對象的方法,實現了對高分辨率遙感影像中的城市和鄉村道路信息提取。戴激光等[5]針對神經網絡訓練存在分辨率降低和梯度消失,導致道路提取結果誤提取率高和斷裂問題,提出了一種基于多尺度卷積神經網絡的遙感影像道路提取方法。
筆畫寬度變換(stroke width transform,SWT)是Epshtein等[6]提出的一種用于自然圖像文本檢測的算法,它通過提取出具有一致寬度的帶狀目標來實現,因此也可以用于提取遙感圖像中的帶狀地物。張霞等[7]考慮到SWT算法受周圍地物影響較大的缺陷,提出了先將高分遙感圖像通過均值漂移算法進行分割,再進行筆畫寬度變換的框架,達到完整提取道路信息的目的。張祝鴻等[8]通過結合筆畫寬度圖與目標的幾何特征,將高分二號近紅外波段中的河流信息提取出來,較好地抑制了噪聲。
陸地移動距離(earth mover’s distance,EMD)是Rubner等[9]提出的,從運輸問題演化而來,是一種度量相似性的方法,可實現多種信息間的有效匹配[10],對于遙感圖像中的目標可以用作異質性分析。李建磊[11]利用EMD計算不同時相影像對象之間的顏色和邊緣直線距離,為像斑的變化檢測結果提供依據。Zhang等[12]提出了一個基于BOF模型的高分辨率遙感圖像分類框架,通過EMD進行直方圖匹配。
考慮到利用筆畫寬度變換提取道路效果仍有待改進,本文提出了一種可自動求取最優閾值的筆畫寬度變換方法,以優化道路的初步提取結果,并結合EMD進行多特征融合分析,對該方法進一步優化。
首先,利用改進后的SWT初步提取有一定噪聲的筆畫寬度圖,并確定道路參考區域;然后,利用連通區作為索引,通過計算光譜、紋理融合后的EMD值,分析道路參考區域與其他區域之間的特征相似度,設定合理的閾值過濾噪聲,保留新的道路區域;最后,進行形態學后處理得到最終提取結果。總體技術流程如圖1所示。

圖1 道路提取流程
圖2為整個SWT的主要過程。

圖2 SWT過程
其步驟如下。
步驟1:利用Canny算子對灰度圖像進行邊緣檢測,計算邊緣圖中每個邊緣點的梯度值,得到梯度圖。

步驟3:計算每個ray的長度,即ray上兩個像素間的歐氏距離,并將該值分配給這個ray上的所有像素。該操作需另外建立一幅筆畫寬度圖像,并預先初始化(一般設為無窮大)所有像素值。
圖3為高分影像中某段道路局部,在設定的不同最大筆畫值作為閾值時獲取的筆畫寬度圖。對于無閾值的筆畫寬度變換,其結果依賴邊緣檢測,邊緣點之間的連接長度沒有限制,導致提取結果脫離了提取目標,出現了如圖3(b)中紅圈標記的大量長度過大的筆畫,這對后續過濾噪聲會有不利影響。但是,隨意設定閾值同樣無法得到最優粗提取結果。當閾值設置過小,會出現圖3(c)中紅圈標記的道路斷裂情況,無法完整提取出來;當閾值設置過大,又會出現如圖3(d)中紅圈標記的多余筆畫噪聲;圖3(e)為閾值合適時的SWT初步提取結果。
綜上,有必要設計一個求取最佳閾值的方法,使得筆畫寬度圖為最優提取結果,為后續的精提取奠定基礎。

圖3 不同寬度閾值下的筆畫寬度圖

圖4 道路參考區提取方法
自動求取最優閾值的具體步驟如下。
步驟1:在無閾值的情況下進行筆畫寬度變換,得到具有最多噪聲的筆畫寬度圖。以圖3(b)為例,對該圖進行連通區標記,圖4(a)中每個紅色矩形框內表示一個連通區。
步驟2:對筆畫寬度圖進行統計,并確定其峰值對應的筆畫寬度,如圖4(b)所示。通過圖4(c)得到其峰值處筆畫寬度占比最大的連通區,并將該區域作為道路參考區域,如圖4(d)所示。
步驟3:以道路參考區作為對象,不斷初始其最大筆畫寬度值并計算其連通區域數量,以連通區域數量N發生改變(8鄰域)作為道路斷裂的判斷依據,視其為迭代終止條件,輸出此時的最大筆畫寬度M,即最優閾值。
求取閾值流程圖如圖5所示。

圖5 最優閾值確定方法
在進行SWT初步提取后,通過1.1節中的方法對該結果再次標記連通區并確定道路參考區域。通過計算特征距離,反映道路參考區與其他區域之間的特征相似度(圖6),從而確定新的道路區域以及噪聲(非道路)區域。

圖6 特征相似度示意圖
EMD作為用來計算特征相似度而存在的特征距離,相比于范式距離(如曼哈頓距離和歐氏距離),可以更準確地量化直方圖元組之間的相似性。設現在需要求直方圖P={(p1,wp1),…,(pm,wpm)}和Q={(q1,wq1),…,(qn,wqn)}之間的相似度,其中pi和qj分別表示兩個直方圖不同的數值,wpi和wqj則分別表示它們所占的權重,則可以先求得一個距離矩陣,如式(1)所示。
D=[dij]
(1)
式中:dij表示P、Q中任意兩項pi和qj之間的代價(距離)。
此時,從P轉化為Q的工作量可以用WEMD表示(式(2))。
(2)
F=[fij]
(3)
式中:fij表示從pi到qj的權重流動量。EMD的本質就是找到一個最佳F,使得WEMD最小,它的實質是一個線性規劃問題,如圖7所示。對于以上公式有以下四個需要注意的限制條件。
1)fij不能小于0,即fij≥0。




圖7 EMD示意圖
在進行特征相似度比較前,需先提取出適用于后續基于EMD識別道路目標的特征,本文選擇通過光譜、紋理直方圖特征進行表達。
光譜特征的表達對于遙感影像不同地物的識別有較大影響,顏色直方圖一定程度上能反映地物光譜信息的分布情況,因此可作為光譜特征進行提取[13]。本文選擇在HSV顏色空間中提取直方圖,該空間顏色分為H、S、V三個分量(色調、飽和度、明度),相對于常用的RGB顏色空間,它的色相和飽和度接近于人類的視覺系統。這里將遙感影像的H、S、V三個分量提取出來進行量化,通過構造HSV累計顏色直方圖表達影像光譜特征。
紋理特征主要用來描述地表的空間分布狀態和粗糙程度,同樣也是判別遙感圖像中地物的重要標志[14]。局部二值模式(local binary pattern,LBP)[15]是一種用來描述圖像局部紋理特征的算子,通過比較中心像元與鄰域像元的灰度值表達紋理,計算簡單,能夠清晰表達紋理。通過對獲取的LBP圖譜進行直方圖統計,可得到影像的LBP紋理特征。圖8為3×3窗口的LBP值計算示例。其中,pi和pc分別表示鄰域像素值和中心像素值,T的取值由pi與pc的差值確定。其主要原理是確定一個中心像素,比較一定窗口內相鄰像素與中心像素的大小,灰度值大于中心像素的設為1,否則為0。

圖8 3×3窗口LBP計算示例
Ojala等[16]又提出了一種旋轉不變均勻的LBP算子,它相對于傳統的LBP算子包含了更多的局部紋理特征,并且減輕了由圖像旋轉引起的LBP值改變,此處采用改進的LBP算子提高去噪的精度。


(4)
(5)


(6)
(7)
式中:φ1和φ0分別表示判定為保留區域(道路)和刪除區域(噪聲)。
根據EMD 分析去噪后可去除掉大部分非道路區域,完整保留道路區域。將此時的道路提取結果轉為二值圖像,在不損壞提取出的道路信息情況下,通過形態學后處理可去除剩余的前文方法無法識別的其他噪聲,針對道路區域也可以有效去除其毛刺并且填充孔洞部分,達到優化其最終成果的目的。具體的形態學操作如圖9 所示,采用邊長為3 的方形結構元。

圖9 形態學后處理
實驗使用分辨率為0.8 m的高分二號影像。獲得多幅不同場景影像,道路的分布、形態也有所不同,如圖10(a)~圖10(e)所示。其中,道路1(359像素×361像素)為山區道路,其光譜屬性明顯區別于背景,亮度較高,彎曲程度較大,但周圍有較多與其光譜特征相似的細小巖石;道路2(444像素×392像素)、道路3(788像素×387像素)為耕地間道路,相對其他場景道路較窄,且與耕地的紋理分布有一定相似性;道路4(251像素×210像素)為廠區道路,其周圍地物相對較多,有些許建筑物稀疏分布,紋理相對道路1、2、3復雜,但道路與其他地物的特征差別較大;道路5(244像素×252像素)為住宅區道路,房屋分布密集,其他地物大多與道路相連,且與道路間有相似度較高的紋理及光譜特征,因此其提取道路難度較高。

圖10 道路原始影像
由于實現本文方法及對比方法的實驗需要,確定了 1.1節中改進SWT自動求取的閾值參數M,并人工設定了1.4節中基于多特征EMD去噪的閾值參數λ,具體數值如表1所示。其中,通過改進SWT操作后的各道路筆畫寬度如圖11所示。

表1 道路提取參數

圖11 基于改進SWT的筆畫寬度圖
在默認都使用形態學后處理的情況下,使用本文方法與僅使用SWT提取道路的結果對比如圖12所示。由圖12(a1)~圖12(e1)可以看出,SWT算法可以較為完整地提取道路信息,但同時也提取出了與道路一樣寬度變化小的其他地物。對于如道路2和道路3的田間道路,有明顯與道路幾何特征類似的區域被同時提取;對于道路4和道路5,容易提取出排列、形狀較為規律的房屋。由圖12(a2)~圖12(e2)可以看出,本文方法在完整提取道路信息的同時,也結合紋理和光譜特征,濾除了其他通過SWT提取出的多余區域,說明本文方法不僅成功將SWT運用在提取道路方面,還彌補了SWT無法高準確性提取道路的不足。

圖12 SWT與本文方法提取結果
實驗采用Bowyer等[17]提出的道路提取精度評價方法,對本文與其對比的其他方法進行定量評估。評估標準包括提取出道路的完整率Cp、準確率Cr、提取質量Ql三項。

表2 SWT與本文方法的提取精度對比 %
對于SWT與本文方法精度定量評估結果如表2所示。由表2可以看出,本文方法提取道路的完整率都要稍低于SWT,但都控制在3%以內,對于提取難度較小的道路1,提取完整率可達到97.507%,對于提取難度較大的道路4、5,提取完整率也高于85%。但SWT方法提取道路的準確率卻遠小于本文方法,尤其在住宅區道路5的準確率只有44.068%,而使用本文方法道路1、2、3、4則保持準確率在90%以上,道路5的提取準確率也能達到72.228%,因此本文方法的提取質量均要高于SWT方法。
實驗選擇使用文獻[7]中提到的將中值濾波、均值漂移算法與SWT相結合的方法,以及利用巴特沃斯高通濾波[18]圖像增強的方法,與本文方法提取道路的結果進行比較,提取結果如圖13所示。
對比圖13與圖12可以看出,文獻[7]和文獻[18]相對于SWT都能夠更少提取出非道路區域,兩種方法的提取結果都存在少許的多余地物,但文獻[18]由于可以突出圖像中模糊的邊緣輪廓,使線條變得清晰,因此明顯比文獻[7]保留了更多的道路信息,文獻[7]針對SWT受Canny邊緣檢測結果影響較大的局限性,加入中值濾波及均值漂移分割算法,減少了大量非道路的細碎區域。相比之下,本文方法與文獻[18]一樣也保留了大量的道路信息,但其不僅減少了多余的細碎區域,也刪除了大面積的其他地物,尤其體現在道路3及道路4的提取結果。

圖13 文獻[7]和文獻[18]提取結果
文獻[7]和文獻[18]方法提取結果精度定量評價結果如表3所示。對比表2和表3可以看出,對于輪廓清晰,與背景光譜及紋理差異較大的道路1,本文方法與對比方法的提取完整率都可以達到96%以上;對于其他道路,文獻[18]與本文方法的提取完整率相差不多,但文獻[7]相對較低。除道路3以外,文獻[7]的提取準確率均高于文獻[18],但兩種對比方法對道路2、3、4、5的提取準確率均小于85%,遠低于本文方法。使用文獻[7]方法提取道路4、5,提取質量僅為58.639%、54.864%;使用文獻[18]方法提取道路5,提取質量僅為55.533%;而對比方法提取道路2、3的提取質量均低于75%。綜上,使用本文方法提取道路,可以在保證道路信息完整的同時,大量減小錯提概率,得到質量較好的道路區域。

表3 文獻[7]和文獻[18]高通濾波提取精度對比 %
本文提出了一種結合改進后SWT和多特征EMD的道路提取方法。通過實驗結果的定性與定量分析,本文方法表現出了較好的效果。與深度學習方法相比,此方法的普適性更高,可用于各種不同傳感器的遙感影像及不同場景中道路識別,并且無需大量訓練及測試樣本準備,人工干涉量小。但由于SWT的效果本身依賴邊緣檢測結果,因此在應用于城區、住宅區等有陰影、遮擋物且邊緣模糊場景中的道路提取時,精度相對較低,在實驗結果中也有所體現。另外,考慮到要計算道路參考區與其他區域之間特征的EMD值,選用影像場景中的道路材質需要一致或者特征相似,因此目前本文方法一定程度上限制了場景大小。實驗中選取的EMD閾值是建立在經驗總結的情況下,后續研究會找到科學、嚴謹的確定閾值方法。