張蕾 邱顯斐 喬凱 李貞 劉少聰 劉廷昊
(1 北京跟蹤與通信技術研究所,北京 100094)(2 中國空間技術研究院遙感衛(wèi)星總體部,北京 100094)
道路作為交通路網(wǎng)的重要組成部分,是地圖制圖和地理信息系統(tǒng)的重要標記對象。在遙感影像中,道路一般寬度為幾米到幾十米,具有條帶狀幾何特征、明顯的邊緣輻射變化特征以及拓撲信息特征。隨著影像分辨率的提高,利用星載高分辨率光學遙感影像實現(xiàn)道路的自動提取成為研究熱點[1-3]。但傳統(tǒng)高空間分辨率影像僅有一個或幾個譜段,易受到噪聲、陰影、綠化帶、車輛影響,難以實現(xiàn)道路的精細分類。
隨著星載高光譜遙感技術發(fā)展,利用目標光譜的指紋特征優(yōu)勢,星載遙感系統(tǒng)的精細分類與識別能力不斷提升[4]。未來,當星載高光譜影像達到米級甚至亞米級空間分辨率時,高光譜影像將在道路的自動提取方面發(fā)揮重要作用。以往學者的研究中已經(jīng)廣泛應用端到端的圖像仿真手段,對典型場景下高光譜探測效能進行預估[5]。近年來,也已經(jīng)開展了星載米級空間分辨率高光譜探測車輛目標的效能評估,分析了小尺度目標識別能力與空間分辨率的關系。然而,目前米級空間分辨率星載高光譜系統(tǒng)還在設計階段,尚未形成對高光譜數(shù)據(jù)實現(xiàn)道路自動提取效能的系統(tǒng)性認識,道路提取效能與光譜范圍、光譜分辨率的關系未知。因此,亟需開展仿真實驗和道路提取能力的評估分析。
本文利用隨機森林方法設計基于高光譜遙感影像的道路提取方法,著重對道路分類所需的光譜分辨率進行分析,并比較可見光近紅外和短波紅外通道的提取精度,分析譜段范圍和光譜分辨率對高光譜道路提取的影響,以期為下一代高分辨率高光譜衛(wèi)星的設計優(yōu)化、譜段選擇提供參考。
本文為研究星載高分辨率高光譜數(shù)據(jù)的光譜通道和光譜分辨率對道路提取的精度影響,采用如圖1所示流程開展實驗和分析。利用機載影像進行人機交互及目視經(jīng)驗判別的道路輪廓提取和影像提取,得到道路真實類型的參考分布信息,并提取道路樣本數(shù)據(jù)集,構建隨機森林分類器;然后,以高空間分辨率、高光譜分辨率的機載影像作為輸入,模擬不同光譜分辨率(5nm、10nm、20nm)的星載高光譜影像。基于隨機森林分類器對不同光譜分辨率的影像數(shù)據(jù)進行道路分類;最后,對分類精度進行評價,對比分析不同光譜分辨率、不同光譜通道的分類精度。

圖1 實驗流程圖Fig.1 Experimental flow chart
1.1.1 高光譜數(shù)據(jù)
本文研究所用的機載高光譜影像數(shù)據(jù)采集于浙江省東陽市橫店,獲取日期為2020年5月23日。機載航帶16條,覆蓋面積為420.47km2,地貌包括城鎮(zhèn)及山地,如圖2所示。處理區(qū)域為橫店機場及周邊(黃色框范圍),高光譜影像(真彩色)如圖3所示。該機載原始數(shù)據(jù)的空間分辨率為1m、光譜分辨率為3nm,按譜段范圍分為可見光近紅外和短波紅外兩個通道:可見光近紅外通道譜段范圍為394~996nm,短波紅外通道譜段范圍為949~2493nm。以經(jīng)過輻射校正和幾何校正的機載高光譜數(shù)據(jù)作為輸入模擬星載米級空間分辨率條件下不同光譜分辨率的高光譜影像產品。然后,進行數(shù)據(jù)處理,模擬目前星載高光譜成像儀設計能力下不同光譜分辨率的影像數(shù)據(jù),以開展道路提取研究。

圖2 研究區(qū)地理位置Fig.2 Geographical location of study area

圖3 研究區(qū)高光譜影像(真彩色)Fig.3 Hyperspectral image of study area (true color)
1.1.2 數(shù)據(jù)預處理
機載高光譜成像過程中,載荷輻射響應特性、飛行方向、大氣傳輸都對測量光譜產生影響,使得直接測量到的原始數(shù)據(jù)光譜不能有效代表道路光譜特性。對機載數(shù)據(jù)進行大氣校正,得到地表反射率影像。在進行大氣校正后,對反演得到的反射率影像數(shù)據(jù)進行光譜重采樣,以模擬星載系統(tǒng)光譜響應特性。
1)大氣校正
基于快速大氣校正工具[6]校正影像中的大氣影響,反演得到地表反射率。自動從圖像上收集不同物質的波譜信息,經(jīng)過基準波譜收集、基準波譜歸一化、植被濾波、端元收集、明線光譜濾波、端元平均、確定模型系數(shù),獲取經(jīng)驗值完成0.4nm~2.5μm譜段內高光譜和多光譜的快速大氣校正。
2)光譜重采樣
按照目前星載高光譜成像系統(tǒng)常用的5nm、10nm、20nm三種光譜分辨率,對反演得到的高光譜反射率數(shù)據(jù)進行光譜維重采樣,模擬星載光譜響應狀態(tài)。重采樣時,采用光譜分辨率等于波段間距的高斯光譜響應模型對高光譜數(shù)據(jù)進行加權平均處理,權重用高斯型光譜重采樣函數(shù)表示,不同波長對應的權重為
(1)
式中:x為采樣點波長;μ為中心波長;σ為標準差,用光譜分辨率的2.355分之一表示。在高斯函數(shù)[μ-3σ,μ+3σ]范圍內積分則是經(jīng)過采樣后的光譜值。
按5nm、10nm、20nm光譜分辨率進行重采樣得到的道路像元反射率光譜如圖4所示。

圖4 反射率影像光譜重采樣結果(反射率比例系數(shù):10000)Fig.4 Spectral resampling of road reflectance spectra(ratio coefficient of reflectance:10000)
為了將隨機森林方法應用于高光譜數(shù)據(jù)進行道路提取,研究不同光譜分辨率條件下道路提取的精度,需要在高光譜影像數(shù)據(jù)中標記道路類型、標注道路位置、提取訓練數(shù)據(jù)。
通過人機交互及目視經(jīng)驗判別對影像中的道路輪廓提取,并將提取到的道路輪廓對影像進行裁剪,得到該區(qū)域影像的道路數(shù)據(jù)(如圖5所示)。結合影像中道路分布及其作用類型,可將道路分為瀝青道路、水泥道路、土路、機場跑道四大基本道路類型,考慮各類別道路實際承擔的交通功能和材質,可細分類別如圖6所示。可以看出:研究區(qū)域中土路分布在研究區(qū)的兩處不同位置,其紋理信息與光譜信息存在差異,故將其分為土路1和土路2兩種類型;瀝青道路有一段與土路1相接,車輛在行駛過程中存在將土路1中的泥土帶入瀝青道路上的現(xiàn)象,導致該瀝青道路路段表面附著一層泥土使其光譜信息發(fā)生變化,故將該瀝青道路路段分為瀝青道路(塵土)類。圖6分類結果中機場道路和機場跑道材質一致,合并為一類;水泥路和橋面水泥路材質一致,合并為一類。最終,影像中的道路類別分為6類,分別為瀝青道路、水泥路、土路1、土路2、機場跑道和瀝青道路(塵土)。圖6中的不同類別空間分布信息可作為接下來隨機森林分類結果的驗證數(shù)據(jù)。

圖5 道路影像提取結果Fig.5 Road image extraction result

圖6 道路類型分布圖Fig.6 Map of road type distribution
2001年,美國科學家Leo Breiman提出隨機森林方法,該方法是一種基于多棵分類與回歸決策樹構成的新型機器學習算法[7]。隨機森林方法使用決策樹裝袋,隨機從原始訓練數(shù)據(jù)集中有放回地選取樣本,生成訓練樣本集,再針對每個訓練樣本集創(chuàng)建相同數(shù)量的隨機變量,訓練數(shù)據(jù)和隨機變量一一對應生成決策樹。生成多棵決策樹,并綜合多棵決策樹的結果,實現(xiàn)最終分類。隨機森林分類方法具有其多級決策特性和便于集成多種分類特征的優(yōu)點,每個決策樹訓練過程相互獨立,可并行生成,提升分類效率,廣泛應用于遙感影像的分類和信息提取應用中。本文采用隨機森林方法對高光譜影像中的道路進行自動提取,共分為3個步驟,算法示意如圖7所示。

圖7 隨機森林方法示意圖Fig.7 Schematic diagram of random forest method
(1)創(chuàng)建隨機向量:根據(jù)1.3節(jié)中確定的道路類別,標記樣本點、瀝青道路、水泥道路、土路1、土路2、機場跑道和瀝青道路(塵土)共6類道路目標的像元光譜,構成訓練樣本集D。采用Bootstrap重抽樣方法,隨機地從訓練數(shù)據(jù)集D中有放回地選取t個樣本集,生成約原樣本集2/3大小的訓練樣本集{Dt,t=1,2,…,t-1,t},對t個訓練樣本集創(chuàng)建t個隨機變量{Tt,t=1,2,…,t-1,t}。由于生成決策樹時,隨機有放回抽取樣本集的過程是獨立的,所以其中{Tt,t=1,2,…,t-1,t}是一組獨立且具有相同分布的隨機向量序列。

(3)組合決策樹:生成所有決策樹后,利用t個決策樹模型分別對高光譜影像逐像元進行分類,得到t個分類結果,采用多數(shù)投票的方法對所有決策樹的分類結果進行綜合,得出最終分類結果。
在待分類影像中選取真實可靠的類別數(shù)據(jù)樣本集,將其添加至訓練決策樹中進行迭代分類,從而獲得分類結果。結合本次實驗所需確定的6類道路(包括機場跑道、水泥路、瀝青道路、瀝青道路(塵土)、土路1和土路2),在影像中均勻選擇訓練樣本,如圖8所示。訓練樣本中包括全部6類道路,組內各類地物選取同樣的樣本數(shù)均設置為300。
1)可見光近紅外影像分類結果
在道路提取處理后的不同光譜分辨率的可見光近紅外高光譜遙感影像中選出各類道路的訓練樣本數(shù)據(jù)集,并運用隨機森林分類算法進行要素提取,得到分類結果如圖9所示。可知隨著影像光譜分辨率的降低,隨機森林道路分類中錯誤識別像元數(shù)量增多。



圖9 可見光近紅外影像隨機森林分類結果Fig.9 Results of random forest classification using visible and near-infrared images
2)短波紅外影像分類結果
采用道路提取處理后的不同光譜分辨率的短波紅外高光譜遙感影像,選出各類道路的訓練樣本數(shù)據(jù)集,并運用隨機森林分類算法進行要素提取,得到的分類結果如圖10所示。由圖10可知:在該波段范圍內識別出的道路類別中存在著明顯的錯分像元現(xiàn)象,對土路類型的道路類別分類精度較低。同時該影像分類結果中對陰影區(qū)域的識別較差,未能很好地識別出原始圖像中存在的陰影區(qū)域,導致分類結果中存在著明顯的道路缺失現(xiàn)象。這就說明在短波紅外波段范圍內,圖像中的陰影區(qū)域不易劃分其參考類別。


以圖6道路類別分布數(shù)據(jù)作為參考數(shù)據(jù),對各分類結果進行精度分析,分別統(tǒng)計各類道路相對于參考數(shù)據(jù)的相對精度、總體精度和Kappa系數(shù)。分別對可見光近紅外影像、短波紅外影像結果進行統(tǒng)計,并分析分類精度隨光譜分辨率的變化。
1)可見光近紅外影像分類結果分析
表1~3是基于隨機森林方法得到不同光譜分辨率條件下可見光近紅外分類結果對應的混淆矩陣。基于混淆矩陣,進行分類精度統(tǒng)計得到分類精度。表4給出了不同光譜分辨率影像下基于隨機森林分類算法的各類別精度統(tǒng)計。可以看出:總體分類精度達到93%以上,Kappa系數(shù)達到0.87以上。在3種不同的光譜分辨率下,機場周邊地區(qū)道路采用隨機森林分類算法獲得的分類結果皆具有較高的精度。從表4可以看出如下結果。

表1 可見光近紅外影像5nm光譜分辨率混淆矩陣Table 1 Confusion matrix of visible and near-infrared images with spectral resolution machine of 5 nm

表2 可見光近紅外影像10nm光譜分辨率混淆矩陣Table 2 Confusion matrix of visible and near-infrared images with spectral resolution machine of 10nm

表3 可見光近紅外影像20nm光譜分辨率混淆矩陣Table 3 Confusion matrix of visible and near-infrared images with spectral resolution machine of 20nm

表4 可見光近紅外影像隨機森林分類算法各類別精度統(tǒng)計Table 4 Precision statistics of visible to near-wave infrared images based on random forest classification algorithm
(1)各類道路在光譜分辨率為5nm時的分類精度(OA)最高,各類道路的分類精度也都高于90%。
(2)隨著光譜分辨率的降低,各類道路在隨機森林分類結果的分類精度逐漸降低,各類別間的可分離性降低。
(3)土路2和瀝青道路(塵土)類型在各光譜分辨率下的分類精度較為穩(wěn)定,說明隨機森林分類法在這兩類道路在的魯棒性較強,不易受光譜分辨率的干擾。
(4)隨著光譜分辨率的下降,該分類方法在可見光近紅外波段范圍(394.7~996.9nm)的總體分類精度也隨之下降。由此可知,對于可見光近紅外高光譜影像,基于隨機森林分類法的道路識別精度對于光譜分辨率尤為敏感,隨著光譜分辨率的降低,該方法分類結果精度也因此而降低。
2)短波影像分類結果分析
表5~7是基于隨機森林方法得到不同光譜分辨率時短波紅外分類結果對應的混淆矩陣。

表5 短波影像5nm光譜分辨率混淆矩陣Table 5 Confusion matrix of short-wave infrared image with spectral resolution machine of 5nm

表7 短波影像20nm光譜分辨率機森林分類結果混淆矩陣Table 7 Confusion matrix of short-wave infrared image with spectral resolution machine of 20nm
基于混淆矩陣,進行分類精度計算。表8給出了不同光譜分辨率影像下基于隨機森林分類算法的各類別精度統(tǒng)計。短波影像分類結果表明:在機場周邊地區(qū)道路的短波紅外光譜范圍內采用隨機森林分類算法獲得的分類結果皆具有較高的精度。總體的分類精度達到95%,Kappa系數(shù)為0.89以上。在短波紅外波段范圍內(949.5~2493.3nm)各地物基于隨機森林分類法的分類精度不會隨著光譜分辨率的變化而變化,且在該光譜范圍內瀝青道路(塵土)、土路1和土路2這3類道路類別的分類精度較低。由表8可以看出如下結果。

表8 短波影像各光譜分辨率隨機森林分類算法各類別精度統(tǒng)計Table 8 Precision statistics of short-wave infrared images based on random forest classification algorithm
(1)機場道路類別在各光譜分辨率(5nm、10nm、20nm)下的隨機森林分類結果最穩(wěn)定,識別準確度最高,皆為0.99左右,說明在短波紅外波段范圍內基于隨機森林分類方法對“機場道路”的分類精度最高,即最適用。
(2)各道路類型在短波紅外波段范圍內不同光譜分辨率下的分類精度趨于穩(wěn)定,說明在短波紅外波段范圍內,各道路類型對光譜分辨率的敏感性較低,隨機森林分類結果在該波段范圍內不易受光譜分辨率的干擾。
(3)土路1、土路2和瀝青道路(塵土)這3類道路類型在該波段范圍內(949.5~2493.3nm)的分類精度較低,三者之間易錯分,說明該波段內土質的辨識度較弱。
(4)土路2與瀝青道路(塵土)在短波紅外波段范圍內的光譜曲線形態(tài)較為相似,難以通過光譜區(qū)分,故此這兩類道路類別的分類精度較低。
在短波影像數(shù)據(jù)中,隨著光譜分辨率的降低,其總體分類精度并沒有隨之出現(xiàn)遞減的現(xiàn)象,反而在20nm光譜分辨率時總體分類精度有一定的提升。由圖11可知,在原始5nm光譜分辨率的短波影像中,地物樣本光譜曲線存在著明顯的“鋸齒”現(xiàn)象,即噪聲存在,在經(jīng)過光譜重采樣后對其光譜曲線進行了一定程度的平滑,從而達到了對噪聲的抑制效果。在光譜分辨率為20nm時光譜噪聲更小,從而使圖像中的地物光譜信息得以有效表達,使其隨機森林方法的分類精度得以提升。說明在短波紅外波段范圍內,基于隨機森林分類法的機場及其周邊道路識別精度不易受光譜分辨率的影響,主要受光譜噪聲的影響。

圖11 短波影像不同光譜分辨率下的樣本光譜曲線圖Fig.11 Resampled spectral curves of short-wave infrared images with different spectral resolutions
本文為支撐下一代米級空間分辨率星載高光譜成像系統(tǒng)光譜分辨率設計,利用機載高光譜影像模擬不同光譜分辨率的高光譜影像,使用隨機森林方法進行道路提取,分析對比了可見光近紅外通道、短波紅外通道在不同光譜分辨率條件下的分類精度。從分類結果可知:可見光近紅外或短波紅外的總體分類精度均優(yōu)于93%,Kappa系數(shù)均高于0.87。實驗結果證明了利用可見光近紅外或短波紅外數(shù)據(jù)均能很好地實現(xiàn)機場跑道、水泥路、瀝青道路、土路的準確分類,高空間分辨率高光譜系統(tǒng)在道路精細分類方面具有巨大的應用潛能。分類精度的敏感性分析表明,道路提取精度對短波紅外光譜分辨率不敏感,而對可見光近紅外光譜分辨率敏感。光譜分辨率20nm光譜分辨率時,可見光近紅外和短波紅外光譜通道均可有效提取機場跑道和水泥路等高價值機場道路,且所需數(shù)據(jù)量小,可以為衛(wèi)星高光譜相機的光譜分辨率設計提供借鑒。