馬曉劍, 趙法舜, 劉艷賓
(1.東北林業大學理學院,哈爾濱 150040; 2.中國地質大學(北京)地球科學與資源學院,北京 100083)
遙感圖像是用來描述地表信息的重要數據源,能否獲取清晰、高質量的遙感圖像直接關系到有用信息的提取、分析和應用。但是在采集、切換和傳送遙感圖像時,常常因為儀器性能、操作手段或者成像環境,導致圖像被脈沖噪聲所沖擊,造成圖像質量下降。因此,在利用遙感圖像解決深層問題之前,選擇合適的方法在去除脈沖噪聲的同時,有效保留遙感圖像原有的有用信息(如邊緣和細節等)就顯得至關重要。
遙感圖像去噪的方法可以基于不同的理論模型,比如概率統計、偏微分方程、稀疏表示以及多尺度分析等[1-6]。DBA算法[5]、NSBMF[6]等非線性方法是在統計的基礎上添加噪聲判斷,而文獻[2]提出了一種基于梯度倒數的自適應開關算法對噪聲進行判斷并消除。此外,為了解決遙感圖像在濾波過程中丟失細節信息的問題,文獻[3]提出使用組合濾波方法,在利用多尺度分析和中值濾波后,提取邊緣信息,將提取結果再融合到消噪后的遙感影像中,以此提升細節信息。以上方法的共同特點是先對隨機脈沖噪聲與信號點進行分類[4],再對噪聲點進行消除,那么分類的準確性會直接影響著濾波的效果。
事實上這種分類問題可以視作是一種不確定性問題,因為被脈沖噪聲沖擊的遙感圖像在某些像素點上會發生不確定性的突變,這種不確定性主要體現在突變像素強度的不確定性、突變位置的不確定性和突變數量的不確定性。D-S證據理論具有表達“不確定”和“不知道”的能力,在沒有先驗信息的情況下它對不確定性和非精確性進行建模有著不錯的靈活性和有效性[7]。因此,它比一般概率理論的適用范圍更加廣泛,作為解決不確定性問題的有力工具,它已經被應用到許多實際領域,如目標識別、遙感分類和圖像分割等[8-10]。D-S證據理論已經成為不確定性信息處理與信息融合領域的重要理論,但是很少有人將該理論與圖像脈沖噪聲和信號點的分類問題結合起來。
直到2018年Zhang等[11]提出了ASMF-DBER算法,同時考慮脈沖噪聲間斷特征和極值特征2種準則進行了不確定性建模,創新性地將D-S證據理論應用到了噪聲與信號的分類上,并取得了不錯的結果。但是在證據高度沖突的情況下,僅使用2個特征和沖突系數無法準確顯示融合的效果。比如,在脈沖噪聲密度較高時,圖像由于受到大量脈沖噪聲的沖擊而遭到嚴重損壞,ASMF-DBER算法中的2個特征準則融合后的結果出現了違背直覺或者難以分類的情況,本文考慮添加第3種特征來降低遙感圖像中出現的證據高度沖突發生的可能性。所謂“高度沖突”的情況在本文中主要表現為以下幾種情況: 一是遙感圖像脈沖噪聲密度過大; 二是待分類的像素處在遙感圖像的邊緣位置或者處在圖像明暗區域的交界處; 三是待分類的像素恰好體現遙感圖像的細節信息。一直以來這些情況下的噪聲消除都是難以解決的。
為了更加有效地刻畫遙感圖像的固有結構、邊緣以及紋理等細節特征,并盡可能地將脈沖噪聲從遙感圖像中去除掉,本文把脈沖噪聲的3個特征準則: 極值性、間斷性和相似性作為證據,提出多特征準則模型,再根據BJS散度和信度熵,構建新的權重分配以解決證據融合出現的高度沖突的問題,然后綜合評估每個像素被判斷為噪聲點的概率大小,即通過概率決策完成分類。另外,在消除噪聲的階段,采用的是自適應中值濾波方法。需要指出的是本文的重點是脈沖噪聲與信號的分類,分類的準確性是本文重點研究的內容。實驗結果證實本文算法在能夠提高圖像濾波后的信噪比的同時,還做到了有效保留遙感圖像原有的邊緣細節等信息,即使是在高度沖突的情況下也有理想的結果。
為了描述脈沖噪聲的不確定性,本文選擇文獻[12]中的噪聲模型,當圖像(以8位灰色圖像為研究對象)被脈沖噪聲破壞后,噪聲隨機出現在像素集合N1={0,1,2,…,l}和N2={255-l,255-(l-1),…,255}中,其概率密度函數如下:
(1)
式中:xi,j和Si,j分別為噪聲圖像和原始圖像中處在第i行,第j列的位置的像素點;p為圖像被脈沖噪聲破壞的概率。被脈沖噪聲污染的遙感圖像的像素明顯偏離正常值,主要集中在0或者255附近,具有一定的不確定性,因此,本文選取l=2進行研究,即噪聲像素強度為0,1,2,253,254或255。與l=0時,脈沖噪聲強度僅為0或者255的椒鹽噪聲相比,本文給出的噪聲模型增大了噪聲強度的不確定性。此外,由脈沖噪聲產生的機制不難發現,噪聲出現位置和數量也具有不確定性。可見,式(1)確定的脈沖噪聲模型更能反映遙感圖像被脈沖噪聲污染的實際情況。

在辨識框架Θ上,設有n個BPA函數m1,m2,…,mn,焦元分別為A1,A2,…,An,并假設這n個BPA函數是相互獨立的,則BPA函數之間的Dempster融合規則定義如下:
(2)
概率轉換函數[13]是指假設m(A)是辨識框架Θ下的BPA函數,Pignistic概率轉換函數將一個BPA轉換為一個概率測度Betp,公式為:
(3)
式中|A|為焦元A的基數;θi為脈沖噪聲N或非脈沖噪聲S。一般地,通過辨識框架Θ中Betp的最高值來進行最終的決策。
與相鄰信號相比,被脈沖噪聲污染的像素有顯著的特征,比如: 極值性、相似性以及間斷性。本文根據這些特征利用區間距離、相似度函數以及像素的相對差異分別構造特征準則證據m1,m2和m3。
2.1.1 極值性特征準則BPA的構造
由噪聲模型可以看出,脈沖噪聲像素的強度主要分布在0或者255附近,接近或者達到極值。為了將噪聲和信號點進行分類,本文利用區間距離來描述像素的強度和極值之間的接近程度,定義為[14]:
(4)
式中a和b為區間,即區間a=(a1,a2)和區間b=(b1,b2),則像素x與圖像之間的區間距離可以表示為:
(5)
這里I=[Imin,Imax]是圖像的強度區間,Imin和Imax分別為圖像的最小強度和最大強度,x∈[Imin,Imax]。
如圖1所示,當x取[0,255]的中值時,d(I,[x,x])達到最小值; 當x接近極值0或255時,區間距離變大。因此,d(I,[x,x])可以用來描述像素強度x與極值Imin和Imax之間的接近程度。根據區間距離的這一性質,本文構造BPA函數m1,公式如下:
(6)
式中:dc為待分類像素的強度和區間I之間的距離;d0為在當前窗口中的像素和I之間的最小距離;dext為I和極值(Imin或Imax)的距離;dmed為I和I的中值的距離。在噪聲密度高的情況下,m1(N)應該接近于1,但是文獻[11]中m1(N)趨近于0,這樣就導致了噪聲點被判斷成信號的錯誤分類結果,本文將文獻[11]的m1函數做了改進,用ε(取ε=0.001)去調整BPA函數,避免了這種情形下的高度沖突結果的發生。

圖1 不同像素的d(I,[x,x])變化圖Fig.1 d(I,[x,x]) of pixels
2.1.2 相似性特征準則BPA的構造
往往圖像的細節信息與周圍信號既有差異性又有相似性,只用極值性特征準則進行分類還不夠準確,本文用待分類像素與窗口內其他信號的差異,作為分類的又一依據來構建相似性特征準則BPA函數。

(7)
式中:rg(xi,j)為像素差,g=1,2,…,WF×WF;xi,j為(i,j)處的待分類像素強度;xi-s,j-t為(i-s,j-t)處的像素強度。令SIMij為xi,j與窗口內像素的相似度[15],公式為:
(8)
式中σμ取當前窗口區域像素的均值。則SIMij表征了xi,j與周圍像素的相似程度。
利用相似度構造特征準則BPA如下:
(9)
式中μ為SIMij的權重,介于0~1之間。從圖2中可以看出: 當rg的絕對值越小時,SIMij越大,說明xi,j的紋理、強度等特征與周圍像素越相似,即它沒有被脈沖破壞的可能性越大,則被判斷成是信號點的概率就越大; 當rg絕對值增大時,SIMij減小,xi,j被判斷成是脈沖噪聲的概率變大。可見用SIMij構造BPA函數來對脈沖噪聲與信號分類是合理的。通過實驗,本文取μ=0.9效果最佳,容易證明m2滿足BPA函數的定義。

圖2 rg與SIMij關系曲線Fig.2 The curve of relation between rg and SIMij
2.1.3 間斷性特征準則BPA的構造
處在明暗交界處的信號往往比其相鄰信號的強度高或低很多,這體現了間斷性的特征,同時也是脈沖噪聲的特點,因此這些信號往往被錯誤地分類成噪聲。本文構建了間斷性特征準則BPA,記作m3函數,以減小分類誤判的概率,公式如下:
(10)
式中:IWmax為當前窗口像素的最大值,IWmin為當前窗口像素的最小值;n為當前窗口WF(i,j)中除去中心像素的像素個數;γ為權重,介于0~1之間。
雖然根據脈沖噪聲的極值性、相似性、間斷性這3個特征進行了不確定性證據建模,但是證據之間的沖突可能還會出現,為了減少證據沖突的可能性,本文提出在利用證據融合規則之前,對特征準則BPA函數進行修正處理,利用BJS散度與信度熵對證據進行重新分配,以校正高度沖突情形下噪聲與信號分類的錯誤結果。
若Ai為信度函數m的假設,m1和m2為在同一辨識框架Θ上的兩個BPA函數,則m1和m2之間的BJS散度[16]可表示為:
(11)

根據BJS散度建立證據之間的差異度量矩陣M,即:
(12)

事實上,BJS散度的顯著特征之一是可以為每種概率分布分配不同的權重,它代表了證據間可靠性的差異大小,2個證據間越相似,BJS散度就越大,尤其在多于2個證據時,它對分類結果會產生至關重要的作用。
此外,當分類的不確定性程度很高時,信度熵越大,得到證據的支持度越少,可以用它來進一步表示信號與噪聲分類的不確定性。所以令Ai為信度函數m的假設,則集合Ai的信息量為:
(13)

綜上,為降低高度沖突發生的可能性,提高分類效果,本文利用BJS散度建立證據可信度Rei,再根據信度熵,給出證據信息量ICi,最后融合兩者作為證據的新權重,實現對證據的重新分配,具體步驟如下:
1)BJS散度計算3個證據的差異度量矩陣Mij,1≤i≤3,1≤j≤3。
2)計算證據可信度Rei,i=1,2,3。
3)由信度熵計算每個證據的信息量ICi,i=1,2,3。
4)由可信度和信息量融合生成新權重Wfi=Rei×ICi,i=1,2,3。
于是再將修改后的證據采用Dempster的融合規則進行自身間的融合,并使用Pignistic概率轉換(式(3))得到概率測度Betp,并將其作為最終脈沖噪聲與信號點分類的依據。如果Betp>0.5,則判斷該像素點為脈沖噪聲,反之則為信號點。本文提出的多特征準則的融合分類算法具體過程見圖3。

圖3 多特征準則的建模與融合Fig.3 Modeling and fusion process of multi-feature criterion
本文算法采用先對脈沖噪聲與信號分類,再進行噪聲消除的思路,提出了基于IBDND[18]的消噪改進方法,步驟如下:
1)將過濾窗口的初始大小WF設置為3,并將最大窗口大小Wmax設置為11。
2)設置當前窗口大小WF×WF,并以(i,j)的目標像素為中心設置濾波窗口WF(i,j)。
4)將過濾窗口的大小擴展為(WF+1)×(WF+1),然后重復2)和3),直到當前過濾窗口大小達到最大窗口11×11。
5)對當前過濾窗口應用近似中值像素替換,輸出像素值為:
(14)
式中:Nu為當前窗口脈沖噪聲像素個數;P為脈沖噪聲密度;Nt為當前窗口像素總數;Zij為在窗口信號點中值Yij的基礎上增添了基于距離索引的調整項;Vu為當前窗口信號點像素;dist(k)為Vu中第k個值的信號與位置(i,j)處的噪聲像素之間的空間距離,公式為:
(15)

為了驗證本文算法的有效性,文章從SIRI-WHU遙感影像中的公園、住宅區、工業區、和河壩等數據庫[19-21]里隨機選取了6幅含有不同類型地物信息的遙感圖像(見圖4)進行實驗。這些圖像具有區域平滑、色調對比明顯或者背景復雜、紋理信息豐富等不同特征。采用的不確定性噪聲模型見式(1)。為說明算法的優勢,本文還與DBA,NSBMF,IBDND,SAMF[22]以及ASMF-DBER這5種算法進行了比較。實驗主要從“高沖突”角度出發,對高噪聲密度、邊緣、紋理細節等情況進行視覺分析和定量分析。定量指標選擇常用的結構相似度(structural similarity index,SSIM)、準確率(accuracy rate,AR)和峰值信噪比(peak signal to noise ratio,PSNR),指標公式如下:
(16)
(17)
(18)


由于本文算法分2步進行,即先將遙感圖像中的脈沖噪聲與信號分類,再消除噪聲,因而先選擇了同為2步消噪的IBDND和ASMF-DBER算法進行對比。由式(16)可以看出AR指標可以衡量分類的準確性,其值越大說明遙感圖像中信號與噪聲的分類越準確;SSIM指標則表示消噪后的遙感圖像與原圖的接近程度。因此,以圖4(a)為例,表1給出這2個指標下的對比結果。

表1 不同算法的AR與SSIMTab.1 AR and SSIM of different algorithms
從表1中可以看出,在低噪聲密度時,2種指標下的IBDND算法稍遜一籌,當噪聲密度達到50%后,即“高度沖突”體現越明顯時,本文算法的分類準確率AR表現就越突出,這意味著更多的噪聲被準確識別出來。另外本文算法的SSIM在“高度沖突”下表現穩定,說明消噪后的遙感圖像結構變化小于其他算法,細節保持更優。
由表1不難發現,在噪聲密度較低時,ASMF-DBER算法的結構相似度略微優于本文算法,但是從定性視覺直觀的角度(圖5)能夠發現,當噪聲密度為50%時,消噪后選定明暗交界處,放大橫跨河水兩岸的建筑物的部分細節(圖5(e)),可以明顯看出ASMF-DBER算法對梯度變化較大的信息保留要稍差,而本文算法符合地理要素的空間自相關性,消噪后遙感圖像中的建筑物仍能保持良好的連續性,失真度小,邊緣更流暢,對比度損失小。為了進一步說明本文算法對圖像邊緣或明暗交替的位置具有較高的還原度,本文對河壩圖的局部信息(20×20的像素區域)進行誤差分析,將未污染噪聲的細節圖與消噪后的細節圖做差,生成像素誤差圖,如果誤差分析圖越接近0附近的顏色,那么消噪后的誤差就會越小。由圖6不難發現相比于ASMF-DBER算法,本文算法誤差波動幅度較小,圖像顏色顯示誤差值分布更接近0附近,說明本文算法處理后的細節結果更接近原圖像,從而再次說明本文算法對遙感圖像的細節保持好,后期應用處理會更具優勢。


為了進一步從視覺角度說明本文算法適合不同地物類型的遙感圖像的去噪,本文將圖4(b),(c),(d),(e)以及(f)添加10%~90%不同密度的脈沖噪聲,考察遙感圖像被不同噪聲密度干擾時的恢復能力。這5幅不同類型的遙感圖像中住宅區和立交橋的遙感圖像背景相對復雜,像素反差小,細節信息較多; 公園和工業區的遙感圖像類型像素強度高低相間,背景相對平滑,圖像的連續性較為復雜; 云層圖像色調反差大,紋理信息明顯。原圖及各算法處理后的效果如表2所示。從中可以看出,SAMF算法由于分類能力最差,明顯有大量噪聲殘留,故僅適用于低噪聲密度的情況; DBA算法處理后的圖像過于模糊,影響后續的地物信息的提取; NSBMF算法對于細節信息多的遙感圖像來說,該方法的弱點就暴露出來,比如邊緣連續性差、細節清晰度低、明暗交界的輪廓位置出現了毛糙; 而本文算法對于“高沖突”處理結果理想,噪聲提取準確,對于遙感圖像中不同類型的地物信息還原性強。同時從表2中還可以發現,公園和云層的遙感圖像中的白色高亮部分經過不同恢復算法后損失嚴重,這是因為白色高亮部分的像素強度接近脈沖噪聲的像素強度,在脈沖噪聲的識別過程中容易產生誤判。本文利用多特征準則融合算法提取脈沖噪聲,有效降低了誤判發生的可能性,白色高亮的細節部分得到更好的保留。

表2 噪聲密度依次為10%,30%,50%,70%和90%的濾波效果對比圖Tab.2 Comparison of filtering effect under 10%,30%,50%,70% and 90% noise density
為驗證不同噪聲密度條件下本文算法均有良好的還原能力,當噪聲密度由10%變化到90%時,圖7為應用5種算法對圖4不同類型遙感圖像分別處理后的定量指標PSNR的結果。很顯然,隨著噪聲密度的升高,PSNR指標普遍下降,IBDND算法下降速度最快,本文算法的濾波優勢明顯,即使噪聲密度達到90%,相比其他算法,本文算法處理過的遙感圖像對噪聲的分類仍然有效。



圖7 遙感圖像的PSNR對比圖
脈沖噪聲的存在極大影響著遙感圖像的信息判讀與分析,為了實現對遙感圖像的高質量復原,擴展遙感圖像的應用范圍和應用價值,本文提出了多特征準則融合的脈沖噪聲識別方法。在文獻[11]的基礎上,本文增加了脈沖噪聲的相似性特征,根據脈沖噪聲的相似性、極值性和間斷性特征進行了新的不確定性建模; 同時利用BJS散度和信度熵對證據進行了新的權重分配,根據D-S證據理論進行了證據融合,避免沖突信息的發生。通過實驗得到以下結論:
1)針對被脈沖噪聲損壞后的SIRI-WHU影像中工業區、公園等不同類別的遙感圖片,本文算法均表現出很強的恢復能力,還原后的遙感影像符合地理要素的空間自相關性,圖像清晰且對比度損失小,說明本文算法可以廣泛適用于不同類型遙感圖像的去噪處理。
2)即使在信息“高沖突”的情況下,本文算法仍然能保證脈沖噪聲被準確的識別,完成圖像的去噪。在脈沖噪聲密度達到90%時,本文算法處理后的遙感圖像仍能保持原有的紋理、邊緣以及明暗交界等細節信息,圖像的連續性仍能保持較佳的水平,說明本文提出的多特征準則信息融合算法適合對細節信息豐富或者被高密度噪聲干擾的圖像進行恢復處理。