劉金滄,王成波,常原飛
(1. 廣東省國土資源測繪院,廣東 廣州 510500; 2. 中國科學(xué)院遙感與數(shù)字地球研究所,北京 100101)
隨著遙感技術(shù)的發(fā)展,高分辨率遙感影像逐漸成為監(jiān)測森林病蟲災(zāi)害的主要數(shù)據(jù)源,通過對影像上感病導(dǎo)致變色的樹木特征描述及分類識別,可實現(xiàn)變色松樹提取,進而獲取樹木染病、枯死等信息。近年來,深度學(xué)習(xí)發(fā)展迅速,在遙感影像分類與識別中得到應(yīng)用,深度學(xué)習(xí)的主流算法模型有受限波爾茲曼機、深度信念網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)及自動編碼器4種[1]。但深度神經(jīng)網(wǎng)絡(luò)模型待訓(xùn)練參數(shù)極多,往往需要大量樣本數(shù)據(jù)。對于尚未積累足夠樣本數(shù)據(jù)的應(yīng)用領(lǐng)域,采用深度學(xué)習(xí)方法存在一定的困難。在遙感影像目標識別、圖像分割或分類工作中,一般分類器通過與圖像特征結(jié)合從而達到融合上下文信息的目的,模型本身不考慮空間信息的問題。概率圖模型的引入,實現(xiàn)了在模型中加入上下文信息的概念,考慮了像素空間相關(guān)性。條件隨機場模型(conditional random field,CRF)[2]為后驗概率建模,能夠同時考慮標記和觀測數(shù)據(jù)的上下文信息,可用于各種具有不同統(tǒng)計特性的圖像的分類,具有普遍適用性,對圖像分類效果較好,已經(jīng)成功用于序列數(shù)據(jù)標記、自然圖像分割[3]、醫(yī)學(xué)影像處理[4]等。目前,國內(nèi)外學(xué)者也嘗試將CRF引入遙感圖像處理,展開了對高分辨率、多光譜、高光譜、SAR影像中CRF的使用和改進[5-8],旨在遙感圖像處理過程中更為正確和有效地發(fā)揮空間信息作用。
松材線蟲病是全球森林生態(tài)系統(tǒng)中最具危險性、毀滅性的有害物種[9]。松樹感病后,針葉快速變成黃紅色。在我國,松樹占森林資源的1/4[10],為了有效預(yù)防和控制松材線蟲病,需對其進行全面而又快速的監(jiān)測。無人機遙感作為一項新興的對地觀測技術(shù),可大幅減少森林資源調(diào)查的外業(yè)工作量,大大提高工作效率[11]。無人機影像地物清晰、細節(jié)明顯、信息豐富,為松材線蟲病的及時快速監(jiān)測提供了有效的途徑,但考慮到影像中裸地陰影明顯、樹冠變化過大及樹木之間邊界復(fù)雜等問題,對病害松樹提取帶來了一定困難,需要選擇合適的提取算法。
CRF模型通過融合多種特征提取變色松樹,主要包括:①對無人機影像進行處理,提取描述圖像的多種特征;②將所提取的特征映射到高維或低維空間中組成新的特征向量;③利用CRF模型對最終特征向量進行分類,并獲得相應(yīng)的標記,主要工作為特征提取、CRF模型的構(gòu)建與實現(xiàn)。分類模型過程如圖1所示。
圖像特征是復(fù)雜圖像的簡化表達,特征提取和選擇是高分辨率遙感影像識別和分類的基礎(chǔ)和關(guān)鍵。正常情況下不同地物具有不同的顏色特征,但也經(jīng)常會出現(xiàn)同物異譜、同譜異物現(xiàn)象[12]。為更加有利于變色松樹專題信息提取,本文綜合考慮了顏色特征和紋理特征。
1.2.1 顏色特征
顏色特征是圖像檢索、識別中應(yīng)用最廣泛的視覺特征,在變色松樹提取試驗中,顏色特征是區(qū)分病害松樹與健康松樹的重要特征,本文顏色特征直接采用影像上的R、G、B三通道特征。
1.2.2 紋理特征
高分辨率影像中紋理結(jié)構(gòu)種類豐富,由不同的紋理基元按照不同規(guī)則和組合方式重復(fù)出現(xiàn)而形成,本文使用的紋理特征為Gabor特征、局部二值模式(LBP)特征和方向梯度直方圖(HOG)特征。
(1) Gabor特征。Gabor變換兼具在空域和頻域中的分辨能力,2-D Gabor濾波器通過調(diào)整濾波器的空間與頻率參數(shù),可以獲得空域和頻域的最優(yōu)聯(lián)合分辨率,以達到空域和頻域的局部最優(yōu)化,表達出能夠充分描述圖像的紋理信息[13]。由于小波變換的窗口大小可以隨著窗口中心頻率的變化而自適應(yīng)地調(diào)節(jié),通常采用Gabor小波濾波器提取紋理圖像[14]。Gabor濾波器提取紋理特征主要是濾波器的設(shè)計,包括濾波函數(shù)、數(shù)目、方向和間隔。
(2) LBP特征。LBP通過統(tǒng)計局部區(qū)域內(nèi)結(jié)構(gòu)出現(xiàn)的頻次來表達圖像特性,主要是對像素點與其局部區(qū)域內(nèi)像素點的灰度級大小對比而產(chǎn)生。LBP特征提取首先將檢測窗口劃分為16×16的小區(qū)域(cell),對單個cell中的每個像素,將其4鄰域或8鄰域內(nèi)點的灰度與該點(也可以是環(huán)形鄰域)進行順時針或逆時針的比較,如果中心點像素值比鄰點大,則鄰點的值為1,反之則為0,這樣每個點都會獲得一個8位二進制數(shù),轉(zhuǎn)換為十進制,得到每個像素的LBP值;然后通過對每個cell中每個數(shù)字出現(xiàn)的頻率進行統(tǒng)計,得到cell的直方圖后,再對該直方圖進行歸一化處理;最后連接所有cell的統(tǒng)計直方圖得到整幅圖的LBP紋理特征。
(3) HOG特征。HOG特征[15]通過計算和統(tǒng)計圖像局部區(qū)域的梯度方向直方圖來表達特征,具有圖像幾何和光學(xué)的形變不變性。HOG特征提取首先將圖像分成小的連通區(qū)域,即細胞單元,然后計算每個細胞單元中所有像素的梯度或邊緣的方向直方圖。由于局部光照的變化及前景和背景對比度的變化,使得梯度強度的變化范圍非常大,采用重疊的局部對比度歸一化技術(shù)對梯度強度作歸一化,最后把這些直方圖組合起來構(gòu)成HOG特征描述器。
1.3.1 CRF原理
CRF模型最早由文獻[2]提出,是一種判別式概率無向圖學(xué)習(xí)模型,CRF通過Gibbs分布直接對后驗概率P(X|Y)建模。
定義y={y1,y2,…,yk}為觀察特征集的隨機變量,x={x1,x2,…,xk)}為標簽集合的隨機變量,對每個隨機變量yi∈y標簽集合中的標簽相對應(yīng),P(x|y)表示給定條件y下的隨機變量x的條件概率。根據(jù)Hammersley-Clifford定理,標記場的后驗概率服從Gibbs分布為
(1)
式中,Z為歸一化函數(shù);Z(y)=∑yexp{-∑c∈C
ψc(xc,y,θ)};θ為模型參數(shù);基團c為一些隨機變量的集合;C為所有基團c的集合;數(shù)據(jù)項ψc(xc,y,θ)為在基團c上定義的勢函數(shù)。相應(yīng)的Gibbs能量函數(shù)為
(2)
以較常見的二階CRF為例,二階CRF能夠考慮像素的空間鄰域信息,只有關(guān)聯(lián)勢能和交互勢能,則其能量函數(shù)包含了關(guān)聯(lián)勢能ψi和交互勢能ψij
(3)
式中,V為由圖像的像素組成的集合;ε為相鄰的像素對,對像素而言一般是4鄰域或8鄰域。
1.3.2CRF建模
CRF關(guān)聯(lián)勢能ψi()通過一個局部判別分類器來表示,通常表達為基于顏色、位置和紋理等多特征的成本函數(shù),表達觀測變量yi與標簽xi之間的關(guān)聯(lián)屬性,反映給定yi和參數(shù)w條件下標記為xi的概率,表示為
ψi(xi,yj,w)=lnP(xi|yj,w)
(4)
由于SVM在高分辨率遙感數(shù)據(jù)中具有較好的分類效果,因此參考文獻[8]定義關(guān)聯(lián)勢能,由SVM訓(xùn)練參數(shù)得到的歸一化概率。交互勢能ψij()通常依據(jù)鄰接觀測變量,以及其標簽變量之間的相關(guān)性關(guān)系來表示,體現(xiàn)了模型對上下文信息利用的能力。一般定義為
ψij(xixjyi,yj,λ)=λTgij(yi,yj)δxi≠xj
(5)
式中,λ為交互勢能中待估計參數(shù);δ為0-1指示函數(shù),若xi≠xj,δ為1,否則為0;gij(yi,yj)為特征相似性描述函數(shù),其定義是描述相鄰變量相關(guān)性的關(guān)鍵,通常定義通過距離衡量特征之間的相似性,表達為
(6)
式中,β幅圖像中鄰接像素對的顏色對比度的均值,β=(2〈‖yi-yj‖2〉)-1。
為了減輕交互項過平滑的問題,在關(guān)聯(lián)項和交互項之間加入權(quán)重λ,則后驗概率最終可表達如下
P(x|y,w,v)∝exp
(7)
無人機影像變色松樹提取過程如圖2所示,主要分為5步:
(1) 數(shù)據(jù)獲取:無人機航攝獲取監(jiān)測區(qū)域0.1 m分辨率的影像數(shù)據(jù)。
(2) 數(shù)據(jù)處理:通過影像匹配、空三加密、正射糾正、影像拼接和圖像增強等處理,制作0.1 m分辨率正射影像圖。
(3) 數(shù)據(jù)準備:制作標記變色樹木、健康樹木的樣本數(shù)據(jù),單個樣本的大小為500×500像素,用于變色松樹提取的訓(xùn)練和測試。
(4) 變色松樹提取:首先進行多種特征提取,增加不同類別地物特征描述的差異;然后利用有效的分類算法將變色樹木與正常樹木區(qū)分開,以完成變色松樹專題信息提取。
(5) 結(jié)果分析:結(jié)合目視解譯,對變色木提取結(jié)果進行分析,以提供疑似遭受病蟲害的松樹,為實地調(diào)查提供有利線索。
標記樣本數(shù)據(jù)如圖3所示。其中,部分暗灰色為松樹枯萎或失葉后剩下枝杈呈現(xiàn)的效果,一般是樹木長期染病枯死所致。另外,由于影像分辨率較高,樹木之間的空隙、陰影明顯,將其分為其他類。綜上,將影像標記為4類:兩種變色木(發(fā)灰木、發(fā)黃木),健康木和其他(陰影、空隙)。
本次試驗標記樣本數(shù)據(jù)集總數(shù)為860個,隨機選取總樣本的70%作為模型訓(xùn)練數(shù)據(jù),剩余的樣本則為測試數(shù)據(jù)。變色松樹提取試驗設(shè)置Gabor紋理的σ=2π,方向數(shù)為4,頻率為5,共20維,HOG特征9維,LBP特征4維。提取的多維特征通過白化、聚類操作形成用于圖像分類的特征向量。
試驗將CRF提取的結(jié)果與幾種常用的分類算法提取結(jié)果進行對比,包括支持向量機(SVM)、boost算法、隨機森林(RF),如圖4所示。從圖4可以看出,前3種不考慮相鄰像元相關(guān)性的分類算法得到的分類結(jié)果的椒鹽現(xiàn)象比較嚴重,分類效果不佳,而CRF的分類結(jié)果更加平滑,視覺效果更好。從影像可以看出,變色樹松樹的數(shù)量較少,前3種方法對變灰松樹與陰影、空隙等紋理的區(qū)分效果不佳,在邊界處變灰樹木與其他的地類產(chǎn)生混淆。相對于前3種試驗結(jié)果,只利用RGB顏色特征的CRF模型整體分類結(jié)果有所改善,說明CRF模型對變色松樹的分類效果較好,但其同樣存在對變灰松樹的提取結(jié)果不太理想的問題。在顏色特征的基礎(chǔ)上,加入多種紋理特征后的CRF模型分類結(jié)果對變灰木區(qū)分能力有所提高。紋理特征的加入增加了類別之間的差異,能夠改善分類器的性能。
對應(yīng)5種分類結(jié)果的定量精度評價見表1,結(jié)合圖4分類結(jié)果,可以看出:定義交互勢能的CRF模型考慮了鄰域像素之間的空間關(guān)系,分類結(jié)果比不考慮交互勢能的普通分類器(SVM、boost、RF)分類精度更好,模型精度總體比其他基于像元的分類器高,多特征的CRF模型精度提高超過5%,基于多特征CRF方法有利于提高變色松樹的提取效果和精度。與考慮顏色特征的CRF模型分類結(jié)果相比,基于多特征CRF方法在分類精度上提高了約3.55%,這表明文中所述紋理特征能夠有效改善模型的分類精度。無論是從分類結(jié)果的視覺效果,還是從分類精度評價來看,基于多特征的CRF模型都能夠獲取較好的變色松樹識別結(jié)果。

表1 松樹林無人機RGB影像的分類精度 (%)
利用無人機航攝獲取森林高分辨率影像,并選用合適的分類方法對影像進行病害變色松樹自動提取,為快速監(jiān)測松材線蟲病提供了有效途徑。其中關(guān)鍵在于尋找適用高分辨率航空影像分類的算法,基于多特征CRF模型能夠客觀準確地對病害松樹進行分類,作為傳統(tǒng)的目視解譯方法的補充,能夠大大減少人工判讀的工作量,有利于提高松樹病蟲害監(jiān)測的效率與精度。