張昊,焦瑞莉,喬聰聰,霍娟,宗雪梅
(1.北京信息科技大學 信息與通信工程學院,北京 100101;2.中國科學院大氣物理研究所,北京 100029)
利用云和云陰影區域與其他區域的差別實現氣溶膠參數的反演是一種可行的方法[1],并且由于云陰影檢測通常由云檢測實現,因此在遙感影像中準確的云檢測是后續氣溶膠研究的重要前提。
近年來,國內外在遙感影像的云檢測方面進行了大量的研究,并提出多種不同的方法。云檢測的方法可分為兩大類:光譜閾值方法和深度學習方法。
光譜閾值方法利用衛星遙感影像的若干個光學波段的反射率進行閾值判別,從而進行遙感影像的云檢測。光譜閾值方法可分為單時相方法和多時相方法。單時相方法通過對單幅遙感影像進行光譜反射率的閾值判別得到云檢測結果。Luo等[2]提出使用閾值決策矩陣來識別MODIS衛星影像中的云。Zhu等[3]提出Fmask方法,對Landsat衛星影像采用光譜閾值和概率閾值相結合的兩步閾值法進行云檢測,并結合卷云波段和多種輔助數據提升檢測準確率[4-6]。多時相方法是利用多幅不同時間、相同地點的衛星影像組成時間序列,并結合光譜反射率閾值進行判別得到云檢測結果。文獻[7-8]分別在Fmask方法的云檢測結果基礎上,利用時間序列進一步檢測。然而,單時相光譜閾值方法主要通過光譜特征進行檢測,因此針對某些和云具有相似光譜特征的區域效果較差;多時相光譜閾值方法雖然通過時間序列在一定程度上提高了云檢測的準確率,但是其對數據量需求較大,運算效率較低。
深度學習方法利用龐大的數據集對云檢測模型進行訓練,然后通過訓練完成的模型對被測影像的每一個像素進行預測分類。Wieland等[9]使用U-Net模型進行遙感影像中的云檢測。Li等[10]提出了一種以多個殘差單元為編碼器,以相同結構的多個殘差單元和反卷積為解碼器的多尺度特征融合云檢測方法。Zhang等[11]提出了一種以多個殘差單元和小波變換模塊為編碼器,以ASPP金字塔和空間注意力機制為解碼器的多尺度特征融合模型。Mehdi等[12]提出了一種以不同尺寸的卷積核組成的并聯結構為編碼器,以反卷積為解碼器的多尺度特征融合模型。Qu等[13]提出了一種以條狀殘差網絡為編碼器,以雙線性插值和雙注意力機制為解碼器的多尺度特征融合模型。然而,深度學習方法在具有良好檢測結果的同時,需要龐大的數據量和較高的硬件需求,且對訓練參數的初始化較為敏感。
多特征聯合(multi-feature combined,MFC)是一種針對單幅遙感影像,并結合了光譜特征、幾何特征和紋理特征,應用在高分一號的云檢測方法[14]。由于MFC方法在高分一號數據上表現出良好的性能,因此本文采用波段范圍更加豐富的Landsat 8數據進行MFC方法的性能評價,并提出兩點改進。一是針對幾何特征與云相似的非云區域,利用灰度共生矩陣提取紋理特征,提高云識別正確率。二是針對冰雪檢測的局限性,引入一種光譜特征對冰雪區域進行檢測和濾除。
MFC方法首先通過3個光譜特征的閾值判別生成一個包含大部分厚云的云檢測結果,在最大限度上減小非云像素引起的錯分誤差。
第1個光譜特征是霧霾最優變換(haze optimized transformation,HOT)。其原理是在藍色波段和紅色波段中,云和大部分地表以及薄霧有著不同的光譜特性,前者的HOT值通常大于后者的HOT值。
第2個光譜特征是可見光波段比值(visible band ratio,VBR)。VBR能夠排除具有顯著顏色特征的非云像素。云在可見光波段通常為灰色或白色,其VBR值接近1。
第3個光譜特征是紅色波段反射率,其原理是云在紅色波段的反射率較高。
MFC方法分別將3個光譜特征的閾值設置為0.13、0.7和0.07。如果像素同時滿足上述3個閾值條件,則將其檢測為云。
在得到包含大部分厚云的云檢測結果之后,MFC方法認為薄云通常分布在厚云周圍,即在云邊界周圍存在一個從厚云到薄云的過渡區域。因此在光譜特征檢測的基礎上,采用引導濾波器檢測每個云邊界遺漏的薄云。
引導濾波器包括引導圖像、輸入圖像和輸出圖像。在MFC方法中,引導圖像是藍色波段、綠色波段和紅色波段的合成影像,輸入圖像是光譜特征閾值判別得到的二值云檢測圖像,輸出圖像是引導濾波后的二值云檢測圖像。
引導濾波器描述了引導圖像和輸出圖像之間的局部線性關系,即輸出圖像是引導圖像以某個像素為中心的窗口的線性變換。對于以某個像素為中心的窗口,線性變換的系數包括ak和bk。其中ak與引導圖像在此窗口內的所有像素的總數、均值、方差,以及正則化參數有關;bk與引導圖像和輸入圖像在此窗口內的所有像素的均值,以及ak有關。
對于任意像素i,其包含在多個不同的窗口,因此像素i的輸出應考慮到包含其本身的所有窗口,即系數a和b分別為包含其本身的所有窗口的ak和bk的平均值。
MFC方法分別針對水區域和陸地區域設置了不同的云邊界檢測方法。首先采用歸一化植被指數(normalized difference vegetation index,NDVI)和近紅外波段反射率將水區域和陸地區域進行劃分,原理在于后者的NDVI值通常高于前者的NDVI值,且前者在近紅外波段的反射率較低。MFC方法使用了兩組不同的閾值判別進行水區域的檢測。第1組將NDVI閾值設置為0.15,近紅外波段閾值設置為0.2;第2組將NDVI閾值設置為0.2,近紅外波段閾值設置為0.15。如果滿足其中任意一組閾值條件,則檢測為水區域,否則為陸地區域。
對于水區域,MFC方法采用大津閾值法對引導濾波器輸出的灰度圖像進行閾值分割生成二值云檢測圖像,閾值設置為0.12;對于陸地區域,在對引導濾波器輸出圖像進行閾值分割的基礎上,再次使用HOT進行閾值分割,以防止云周圍非云像素的干擾,閾值設置為0.08。
然而,初步云檢測結果可能包含一些非云區域,如冰雪、建筑物等,它們與云區域具有相似的光譜特征,易與云區域混淆。因此在初步云檢測結果中對這些非云區域進行濾除是十分必要的。
在濾除非云區域之前,MFC方法首先在初步云檢測二值圖像中進行8鄰域連通,形成若干個連通域,以連通域為單位提取多種特征并逐一進行判別。
MFC方法通過利用連通域提取分形維數指數(fractal dimension index,FRAC)和長寬比(length width ratio,LWR)這兩種幾何特征對海岸線、道路、建筑物等具有幾何形狀的區域進行濾除。FRAC由連通域的周長和面積確定,反映了連通域形狀的復雜性。LWR由連通域最小外接矩形的長和寬確定,反映了連通域最小外接矩形的長與寬之間的關系。相比于云區域,這些非云區域的FRAC值和LWR值較大。
然而,其中一些非云區域的FRAC和LWR和云區域較為相似,僅通過幾何特征無法將它們與云進行區分。因此,本文在幾何特征的基礎上采用灰度共生矩陣進一步提取連通域的紋理特征進行判別。
灰度共生矩陣反映了圖像灰度關于方向、距離、變化幅度的綜合信息,它是分析圖像局部模式結構及其排列規則的基礎,其統計了圖像在某一方向上相距一定距離的兩個灰度值同時出現的概率。
作為紋理分析的特征量,往往不是直接應用灰度共生矩陣,而是在灰度共生矩陣的基礎上再提取紋理特征量。均值和[15]是紋理特征量之一,是區域內像素平均灰度值的度量,反映了區域的明暗深淺。對于具有較高灰度值的區域,均值和較大;對于具有較低灰度值的區域,均值和較小。
在可見光波段,云具有較高反射率,即較高灰度值,均值和較大;大部分地表具有較低反射率,即較低灰度值,均值和較小。因此選取藍色波段用于計算灰度共生矩陣的均值和,提取紋理特征。
考慮到方法的效率以及灰度共生矩陣的計算量,本文從4個方向中選取45°方向,相對距離設置為1,灰度級數設置為16,窗口大小設置為11。為了避免個別異常值的影響,采用以連通域為單位的判別方式,即統計每個連通域中灰度共生矩陣均值和大于閾值T的像素總數,并計算其與所在連通域的面積的比值,如果比值小于0.5,則判別為非云區域并進行濾除,否則判別為云區域。對于閾值T的選擇,本文選取了239個誤判為云的非云連通域和276個云連通域,并計算在不同閾值T的選取下分類的正確率。首先在區間[2,3]之間以0.1為間隔對T進行取值,計算分類正確率,結果如圖1所示。可以看出,閾值在區間[2.5,2.6]時,云分類正確率所受影響較小,且非云分類正確率較高。為了得到更加精確的閾值,在區間[2.5,2.6]內以0.01為間隔對閾值T進行取值,計算分類正確率,結果如圖2所示??梢钥闯?若要同時兼顧二者的分類正確率,則將閾值T設置為2.56時最佳。

圖1 閾值區間為[2,3]的分類正確率曲線

圖2 閾值區間為[2.5,2.6]的分類正確率曲線
對于冰雪區域,MFC方法選取了圖像尺寸為100像素×100像素的84個樣本,計算它們的局部二值模式(local binary patterns,LBP)紋理直方圖,并依據卡方距離進行判斷。分析認為此方法具有一定的局限性。一是由于MFC方法針對面積小于40 000個像素點的連通域進行判別,而遙感影像中有可能存在大面積的冰雪區域,因此可能會造成漏判。二是檢測結果取決于樣本的選擇,如果樣本選擇不佳,則可能影響最終的檢測結果。因此,本文以像素點為單位,引入一種光譜特征對冰雪區域進行判別并濾除。
圖3是云和雪從可見光波段到短波紅外波段的反射率折線圖[16],其中藍色波段的波長范圍為0.45~0.52 μm,短波紅外波段的波長范圍為1.56~1.66 μm。由圖3可知,在藍色波段,云和雪的反射率較高,通常大于0.6;在短波紅外波段,云和雪的反射率相對于可見光波段有所降低。不同的是,云的反射率在0.6浮動,下降量較小,而雪的反射率小于0.2,下降量較大。因此,通過藍色波段和短波紅外波段進行光譜特征提取,特征表達式見式(1)。

圖3 云和冰雪的反射率曲線
SI=2×B6-B2
(1)
式中:B6表示短波紅外波段反射率;B2表示藍色波段反射率。如果像素的SI值小于閾值0,則將其檢測為冰雪,否則將其檢測為云。
實驗所采用的數據是Landsat 8 OLI衛星遙感數據。為了驗證改進MFC方法在不同地表類型下的性能,本文選取了涵蓋森林、冰雪、水、城市、瘠地等不同地表類型的遙感影像進行性能評價。
用于計算性能參數的參照結果采用LandsatLook 8-bit質量評估圖像。LandsatLook 8-bit質量評估圖像采用不同顏色標注了遙感影像中每個像素的類別。因此,通過對LandsatLook 8-bit質量評估圖像中的云像素進行標記得到云參照結果,將其作為真實標記,并分別與原始MFC方法和改進MFC方法的云檢測結果進行性能參數的計算。
實驗通過計算總體精度(overall accuracy,OA)、用戶精度(user accuracy,UA)、生產精度(producer accuracy,PA)這3個性能參數對改進MFC方法進行性能評價,并與原始MFC方法進行對比。將所有像素劃分為云類或非云類,通過衡量云檢測結果和云參照結果中像素類別的一致性和差異性進行精度計算,計算方法如式(2)、式(3)、式(4)所示。
(2)
(3)
(4)
式中:MP和MN分別表示參照結果中云的像素數量和參照結果中非云的像素數量;MTP表示參照結果中標記為云且檢測結果標記為云的像素數量;MTN表示參照結果標記為非云且檢測結果標記為非云的像素數量;MFP表示參照結果標記為非云且檢測結果標記為云的像素數量;MFN表示參照結果標記為云且檢測結果標記為非云的像素數量。
總體精度OA衡量了總體分類的正確性;生產精度PA衡量了遺漏分類的程度;用戶精度UA衡量了錯誤分類的程度。
圖4是實驗流程圖,總共分為4個步驟。第1步是數據預處理,將遙感影像的灰度值轉換為反射率;第2步是結合光譜閾值分割和引導濾波器生成初始云檢測結果;第3步是利用幾何特征、灰度共生矩陣的紋理特征,以及本文引入的光譜特征濾除初始云檢測結果中的建筑物、冰雪等非云區域;第4步是進行實驗結果分析與對比。

圖4 實驗流程圖
圖5、圖6、圖7列出了3組同時含有云和建筑物、道路等非云區域的不同地點的結果,從左至右依次為遙感影像、原始MFC方法的云檢測結果以及改進MFC方法的云檢測結果,其中白色表示云區域,黑色表示非云區域。每組圖像中,圖(a)是區域尺寸為1 024像素×1 024像素的影像,其中紅色矩形標記了區域尺寸為256像素×256像素的部分區域。圖(b)是圖(a)中紅色矩形區域的放大圖像,其中黃色矩形標記了其中部分非云區域。

圖5 含有建筑物等非云區域的遙感影像云檢測結果一

圖6 含有建筑物等非云區域的遙感影像云檢測結果二

圖7 含有建筑物等非云區域的遙感影像云檢測結果三
從上述圖中可以看出,原始MFC方法的云檢測結果中仍然存在著一些非云區域,說明僅通過幾何特征并不能有效地從云檢測結果中濾除這些非云區域。而改進MFC方法的云檢測結果中存在著更少的非云區域,說明進一步通過灰度共生矩陣提取紋理特征能夠對這些非云區域進行更加有效的濾除。
本文針對冰雪區域的檢測和濾除所引入的光譜特征也表現出良好的效果。圖8列出了3組不同地點的遙感影像,每組從左至右依次為尺寸1 024像素×1 024像素的遙感影像及對應的改進MFC方法的云檢測結果,其中白色表示云區域,黑色表示非云區域。圖中紅色矩形標記了部分冰雪區域。圖8(a)是一幅含有大面積冰雪區域的遙感影像,可以看出,改進MFC方法濾除了大面積冰雪區域,防止其與云區域混淆。圖8(b)和圖8(c)是兩幅同時含有云和冰雪的遙感影像,可以看出,改進MFC方法有效地區分了云和冰雪,并將冰雪區域進行了濾除。

圖8 含有冰雪的遙感影像云檢測結果
表1和表2分別針對云量少于50%和云量高于50%的遙感影像,列出了原始MFC方法和改進MFC方法的總體精度、用戶精度和生產精度。表3列出了不同云量條件下的改進MFC方法性能參數的增長百分比。

表1 云量>50%的遙感影像云檢測結果的性能參數 %

表2 云量<50%的遙感影像云檢測結果的性能參數 %

表3 改進MFC方法云檢測結果性能參數的增長百分比 %
根據表1和表2可得出,相比于原始方法,改進方法在總體精度、用戶精度和生產精度上都有所提升;且相比于總體精度和生產精度,用戶精度的增長百分比較大,原因在于改進方法能夠濾除更多的建筑物、道路等非云區域,使得云檢測結果中包含更少的非云像素。
根據表3可得出,對于云量大于50%的遙感影像,改進MFC方法的總體精度、用戶精度和生產精度的增長百分比分別為0.46%、0.59%和0.27%,說明在云量較多的情況下改進方法的提升效果不顯著;對于云量小于50%的遙感影像,總體精度、用戶精度和生產精度的增長百分比分別為1.21%、4.37%和1.29%,說明在云量較少的情況下改進方法的提升效果較為顯著。
分析獲得上述結論的原因在于,通常相比于云區域,遙感影像中建筑物、道路等非云區域的面積較小。對于云量較多的遙感影像,這些非云區域所占的像素數量比例較小,其誤檢對云檢測結果的影響較小,即對精度的影響較小,從而改進方法的提升效果不明顯;反之,對于云量較少的遙感影像,這些非云區域所占的像素數量比例較大,其誤檢對云檢測結果的影響較大,即對精度的影響較大,從而改進方法的提升效果較為明顯。
本文驗證了MFC方法在Landsat 8遙感影像數據上的性能,并針對該方法進行了兩點改進。一是采用灰度共生矩陣提取紋理特征,并結合原始方法采用的幾何特征對初始云檢測結果中檢測為云的非云區域進行檢測和濾除。二是引入一種光譜特征,對初始云檢測結果中可能存在的冰雪區域進行檢測和濾除。通過實驗數據的收集和分析,驗證了MFC方法能夠有效檢測Landsat 8遙感影像中的云,并且驗證了改進方法的有效性,在一定程度上彌補了原始方法的缺點。但是改進方法仍存在局限性。一是雖然使用灰度共生矩陣提取紋理特征濾除了更多的非云區域,但是同時也會濾除一些極薄的薄云,原因在于一些薄云區域在藍色波段的反射率較低,與大部分非云區域相似。二是雖然引入的光譜特征能夠有效區分云區域和冰雪區域,但是其無法使用在一些沒有短波紅外波段的衛星遙感影像上。三是對于云量較多或者含有較少易與云區域混淆的非云區域的遙感影像,改進方法對云檢測結果的提升效果有限。在后續的研究中,可以結合時間序列或其他方法,以進一步提高云檢測精度。