臧金霞,劉建強,殷曉斌,曾韜,周磊
(1.航天宏圖信息技術股份有限公司,北京 100195;2.國家衛星海洋應用中心,北京 100081)
海冰一般是指由海水直接凍結而成的咸水冰,是極地海域和某些高緯度地區最突出的海洋災害[1]。我國渤海北部海域緯度較高,每年的11 月末至翌年3 月初出現海冰,主要為一年冰。海冰的凍結和漂移對海上生產、航運及油氣勘探等都有不同程度的影響。近幾十年來的幾次嚴重冰情甚至造成了海冰災害[2],尤其在遼東灣海域,由于緯度高且受到冬季西北風的影響,最易結冰。海冰監測成為海情監測的重點業務。海冰分類是海冰監測的前提,海冰密集度、海冰面積、海冰最大邊緣線等信息都是由海冰分類識別衍生而來[3]。
目前,衛星遙感技術是海冰監測的主要技術手段,相比目測法、器測法等傳統監測方法,利用衛星遙感影像可實現實時、快速、大面積地海冰監測[4]。合成孔徑雷達(Synthetic Aperture Radar,SAR)衛星數據是常見的海冰監測遙感數據,國內外學者基于SAR 衛星數據開展了大量的海冰分類方法研究[4-9]。光學影像雖然易受云霧影響,但其價格低廉,大部分能夠免費獲取,時間分辨率高,也成為海冰監測主要技術手段。目前,國內外光學衛星海冰監測研究多集中在低空間分辨率衛星遙感數據,如MODIS 數據、AVHRR 數據等[10-12]。這些數據覆蓋范圍廣,重訪周期短,可實現大范圍實時海冰監測,但其空間分辨率較低,因此海冰分類精度不高。中高分辨率光學衛星數據具有較高的空間分辨率,在海冰類型判讀等方面具有獨特優勢,可進行精細化海冰分類。王姝力等[13]基于Landsat-8 和Sentinel-1A 數據對渤海灣進行海冰分類,對比分析了兩種數據分別利用不同分類算法分類得到的海冰分類精度。張晰等[14]對Landsat-8 和GF-1 衛星的海冰探測能力進行對比分析,發現在冰水區分能力方面GF-1 數據優于Landsat-8 數據,在海冰類型識別方面,Landsat-8 數據優于GF-1 數據。Barbieux等[15]對Landsat-8數據的紅、近紅外和短波紅外波段進行波段組合,構建了冰湖指數(Icy Lakes Index),有效實現了冰水分離。王志勇等[16]利用Sentinel-2、Landsat-8、Landsat-7 中高分辨率影像對遼東灣海冰進行監測,利用歸一化水指數(NDWI)實現冰水分離,并進行海冰厚度反演和海冰分類研究。以上研究工作雖利用中高分辨率光學數據開展海冰監測研究,但僅利用其光譜信息,對中高分辨率光學數據的紋理信息未有效利用。
為發揮中高分辨率光學遙感影像紋理信息在海冰分類中的作用,本文以遼東灣海域為研究區,基于海洋一號C(HY-1C)衛星海岸帶成像儀(Coastal Zone Imager,CZI)數據開展海冰分類研究。首先提取其光譜信息和紋理信息,然后進行特征提取與篩選,構建最優特征集,最后將最優特征集輸入到支持向量機(Support Vector Machine,SVM)分類器中進行海冰分類,比較分析多特征海冰分類與單一特征海冰分類結果精度的差異。利用海冰分類結果進一步估算海冰總面積與各海冰類型面積。
2.1.1 研究區
選擇遼東灣海域作為研究區,研究區域如圖1 所示。渤海是北半球緯度最低的大面積結冰海域,由于遼河、黃河等沿海大陸河流的淡水注入,使渤海含鹽量較低;另一方面隨河流帶來的泥沙不斷沉積,改變海底和海岸的地貌,造成渤海變淺,使渤海水溫極易受陸地氣溫影響[17]。這些情況都有利于冬季渤海海冰的生成。渤海是典型的一年冰海區,每年11 月末到翌年3 月初總會出現不同程度的結冰現象[18]。遼東灣位于渤海北部,緯度最高,是渤海海冰災害最嚴重的區域。

圖1 遼東灣地理位置Fig.1 Geographical location of Liaodong Bay
2.1.2 數據
本文所用數據為海洋一號C 衛星海岸帶成像儀數據,數據下載地址為https://osdds.nsoas.org.cn/#/。其空間分辨率為50 m,幅寬為1 000 km,設置有藍、綠、紅、近紅外4 個波段,具體信息見表1。選取2020 年12 月19 日、2021 年1 月10 日和2021 年1 月16 日共3 期數據,如圖2 所示。這3 個時期的海冰面積隨著氣溫下降不斷增加,由初冰期向盛冰期過渡,海冰類型有所變化。

圖2 遼東灣海域HY-1C 衛星海岸帶成像儀遙感影像(均為3/2/1 波段真彩色合成)Fig.2 HY-1C satellite coastal zone imager remote sensing images of Liaodong Bay (true color synthesis from band 3/2/1)

表1 HY-1C 衛星海岸帶成像儀數據信息表Table 1 Data information of HY-1C satellite coastal zone imager
本文的總體技術流程如圖3 所示。首先進行海冰類型劃分與數據預處理,對預處理后的CZI 影像提取光譜特征和紋理特征;然后進行特征選擇,得到最優特征集;最后基于最優特征集進行SVM 海冰分類,對分類結果進行對比驗證分析。

圖3 海冰分類技術流程Fig.3 The flow of sea ice classification
2.2.1 海冰類型劃分
國際氣象組織(World Meteorological Organization,WMO)對海冰類型的劃分標準是根據兩極和高緯度區域的海冰情況定義的,包括多種方式,如海冰生長過程、海冰形態、海冰表面特征、海冰運動狀態等[17]。結合海冰劃分標準,根據遙感影像上的海冰表征和海冰生長過程,經專家解譯,本文將實驗海域冰水覆蓋類型分為5 類:固定冰、白冰、灰(白)冰、初生冰、海水。各海冰類型的特征見表2 。圖4 展示了HY-1C CZI 遙感影像中4 種海冰類型的表征。由于海冰形成初期不會形成白冰類型,在進行分類時,將初冰期影像中白冰類型去除,分為固定冰、灰(白)冰、初生冰、海水4 類。

表2 海冰類型特征描述Table 2 The description of sea ice type characteristics

圖4 海冰類型示意圖(以海岸帶成像儀影像3/2/1 波段組合展示)Fig.4 The image of sea ice type (displayed in band 3/2/1 combination of coastal zone imager images)
2.2.2 數據預處理
本文利用PIE-Basic 軟件進行預處理,主要包括圖像裁剪、圖像配準、海陸掩膜等。為減少數據運算量,對影像進行裁剪,裁剪出遼東灣海域影像;對多時相影像進行圖像配準,以2021 年1 月16 日CZI 影像為基準,對2020 年12 月19 日和2021 年1 月10 日的兩景影像進行配準,各選取約500 個配準點,XY 誤差小于1 m;利用海陸掩膜矢量文件對影像進行海陸掩膜處理,去除陸地對海冰提取的影響。
2.2.3 特征提取與選擇
圖像分類的關鍵是圖像特征提取,常用的特征包括光譜特征、紋理特征、形狀特征等。研究表明多特征組合后的分類精度高于單一特征,但特征過多可能會造成信息冗余,降低分類精度[19]。因此需要進行特征選擇,去除冗余信息。本文提取了HY-1C 衛星CZI 影像的光譜特征和紋理特征,對多特征進行特征選擇,得到最優特征集。
光學影像光譜特征豐富,在冰水識別方面,由于海冰反射率比水體反射率高,本文利用水體指數區分海水與海冰。2012 年,Haq 等[20]提出了NDWIH指數,通過實驗得出該指數比NDWI 更適用于冰水識別,因此選擇NDWIH作為光譜特征之一。張晰等[14]分別對GF1 和Landsat8 影像波段計算得到多種光譜特征,其中GF1 影像的B_G、B_R、G_R等光譜特征對海冰分類的效果較好。考慮到HY-1C CZI 波段設置與GF1衛星波段設置相似,本文提取了CZI 影像的B_G、B_R、G_R 3 個光譜特征以及張晰等[14]提取的其他光譜特征。通過對比分析發現B_G、B_R、G_R 3 個光譜特征海冰分類效果較好。本文選用的4 個光譜特征的計算公式見表3。

表3 光譜特征參數定義公式表Table 3 Definition formula of spectral features
紋理特征分析是目標識別、圖像分割和圖像分類中的重要方法[21]。在遙感影像中,海冰類型是粗糙、不規則的,海水相對光滑均勻,因此紋理特征特別適用于海冰類型識別。本文利用灰度共生矩陣方法(GLCM)進行紋理特征提取。GLCM 是一種通過研究灰度的空間相關特性來描述紋理的常用方法,它描述了成對像素的灰度組合分布[22]。利用GLCM 方法對HY-1C 影像的藍、綠、紅、近紅外4 個波段分別進行紋理特征提取。經過多次實驗,紋理特征計算參數設置為:滑動窗口為3×3,步長為1,方向為45°,灰度級為64。每個波段提取的紋理特征包括:均值、方差、熵、對比度、二階矩、同質性、相關性、相異性,共得到32 個紋理特征。過多的特征會引起冗余,影響計算效率,降低分類精度[23],因此需要進行特征選擇以降低特征維數,提高計算效率,改善分類效果。本文利用基于距離可分性的特征選擇判據[24],特征選擇的原則是,使各類地物類間離散度較大而類內離散度較小。
定義類間離散度Sb、類內離散度Sw和判別數J,一般J值越大,攜帶信息量越豐富。其中:

式中,σ為樣本方差;ui為第i類的均值;u為總體均值。
為進一步驗證特征選擇結果,利用LDA(Linear Discriminant Analysis)算法判斷4 個波段紋理特征的分類準確度[25]。LDA 算法是在計算出類內離散度Sw和類間離散度Sb的基礎上,進一步計算出最佳投影方向 ω,將多維特征投影到一個方向上,可直觀看出分類的效果。
當投影為最佳投影時,滿足:

定義拉格朗日函數L(ω,λ),λ為拉格朗日乘子,

對 ω求導并令偏導數為0 可得到,最佳投影方向由對應特征值的特征向量 (φ1,φ2,···,φn)組成,可表示為

2.2.4 海冰分類
選擇SVM 分類方法進行海冰分類,SVM 分類是定義在特征空間上的能夠使間隔最大的線性分類器,通過核函數轉化為求解凸二次規劃問題,其通過類別邊緣的訓練樣本,即支持向量,尋找兩類間最優的分類超平面[26]。在非線性變換空間,通過最小化分類器的泛化誤差和采用基于核函數的公式化,來計算兩類間的線性判別函數。相比神經網絡等分類方法,其具有樣本小、泛化能力強、計算復雜度適中、結構設計簡單等優點,是海冰分類識別領域廣泛使用的一種分類方法。SVM 分類中,核函數選擇至關重要,常用的核函數有線性核函數、多項式核函數、Sigmoid 核函數、徑向基核函數。
線性核函數為

多項式核函數為

Sigmoid 核函數為

徑向基核函數為

式中,b,v,c,γ為核函數參數。
本文選擇徑向基核函數(式(10)),徑向基核函數是SVM 海冰分類中的常用核函數。核函數 γ參數設置為0.25,懲罰參數設置為100。
SVM 屬于監督分類,選取訓練樣本是監督分類必不可少的環節。本文利用PIE-Basic 軟件,以專家解譯圖為參考,在待分類的每景影像中各均勻選取約120 個訓練樣本,50 個驗證樣本。
由于2021 年1 月16 日處于盛冰期,已出現白冰類型,特征選擇以2021 年1 月16 日數據為例進行展示。經過波段運算提取出的NDWIH、B_G、G_R、B_R 共4 個光譜特征如圖5 所示。為直觀判斷4 種光譜特征對5 種海冰類型的區分度,基于選取的訓練樣本,以光譜特征值為橫軸,分類類型為豎軸作散點圖,如圖6 所示。從圖6 可看出,4 種光譜特征中,海水和固定冰光譜特征值差異最大,初生冰與固定冰、白冰之間的光譜特征值差異也較大,能夠較好區分。但海水與初生冰光譜特征值重疊較多,固定冰、白冰與灰(白)冰之間光譜特征值重疊也較多,因此僅依據光譜特征值難以有效區分5 種分類類型。

圖5 光譜特征Fig.5 Spectral features

圖6 4 種光譜特征的類別散點圖Fig.6 Category scatter diagram of four spectral features
利用GLCM 方法提取了CZI 影像4 個波段的共32 個紋理特征,為減少信息冗余,需進行特征選擇。經過計算,得到4 個波段共32 個紋理特征的J值,如表4 所示。

表4 各波段紋理特征J 值信息表Table 4 The J values of texture features of each band
整體來看,波段1 的J值普遍較高,其中均值、同質性、熵、二階矩4 個紋理特征J值最高,按J值大小排列依次為均值、熵、二階矩、同質性。利用LDA 算法將4 個波段中J值最高的4 個紋理特征(均值、同質性、熵、二階矩)分別進行分類投影,如圖7所示。
從圖7 中可看出,4 個波段的紋理特征均能將5 種類型區分開。5 種類型中,4 個波段的白冰分類效果均較差,波段2、波段3 和波段4 的固定冰分類效果較差,波段1 中的固定冰分類效果較好??傮w來看,J值最高的4 個紋理特征可實現海冰分類。綜合分析5 種類型的分類效果,波段1 的分類結果優于其他波段分類結果,與J值分析結果相符。因此,選擇波段1 的4 個紋理特征(圖8)。

圖7 基于紋理特征的LDA 算法分類投影Fig.7 The classified projection images of LDA algorithm based on texture features

圖8 特征選擇后的紋理特征Fig.8 Texture features after feature selection
將NDWIH、B_G、B_R、G_R 4 個光譜特征與均值、同質性、熵、二階矩4 個紋理特征進行組合,得到最優特征集。
基于提取的最優特征集進行SVM 海冰分類實驗,將2021 年1 月16 日的CZI 影像分為固定冰、白冰、灰(白)冰、初生冰、海水共5 種類型。為驗證不同特征對分類精度的影響,分別開展基于光譜特征和紋理特征的海冰分類實驗,與基于最優特征集的海冰分類結果進行對比分析,分類結果如圖9 所示。
采用主觀和客觀評價標準進行結果評價。主觀評價為目視對分類結果進行評價;客觀評價為利用分類評價指標評價分類精度。圖9d 為海冰類型解譯圖,與圖9d 對比來看,3 種分類結果均能將海冰類型大致區分開,但具體到某一類海冰類型,3 種分類結果的精度不同。在基于光譜特征的SVM 海冰分類圖像中(圖9a),沿岸區域的初生冰被錯分類為灰(白)冰,且固定冰和白冰之間出現混淆,部分白冰錯分類為固定冰;在基于紋理特征的SVM 海冰分類圖像中(圖9b),海水和初生冰出現一定程度混淆,固定冰和白冰也不能較好區分,部分白冰誤分類為固定冰。在基于最優特征集的SVM 分類結果中,5 種分類類型均得到較好區分;相比基于光譜特征或者紋理特征的分類結果,白冰和固定冰的區分效果有明顯改善,說明光譜特征和紋理特征之間具有較好的互補性,改善了海冰類型提取精度。以圖9d 海冰類型解譯圖為參考,選取驗證樣本,采用混淆矩陣方法進行客觀評價,分類結果精度見表5。

圖9 2021 年1 月16 日HY-1C 衛星CZI 遙感影像遼東灣海冰分類Fig.9 Sea ice classification of Liaodong Bay from HY-1C satellite CZI remote sensing images on January 16,2021
由表5 可知,本文提出的基于最優特征集的SVM海冰分類總體精度和kappa 系數最高,總體精度為84.89%,kappa 系數為0.80。其次為基于光譜特征的SVM 海冰分類,總體精度為74.58%,kappa 系數為0.66?;诩y理特征的SVM 海冰分類總體精度和kappa 系數最低,總體精度為73.41%,kappa 系數為0.65。通過特征選擇得到的最優特征集包含光譜和紋理兩種特征,最大程度保留了分類有效信息,同時降低了特征冗余,特征之間實現互補,提高了分類精度。在海冰類型方面,3 種分類方法中,白冰的生產者精度均較低,固定冰的用戶精度較低,主要是由于白冰與固定冰的特征相近,導致部分白冰被分類為固定冰,這與主觀評價的結論一致?;诠庾V特征或紋理特征的分類方法中,初生冰的生產者精度較低,結合主觀評價結果,發現在基于光譜特征的分類結果中,沿岸部分的初生冰被誤分為灰(白)冰,基于紋理特征的分類結果中,部分初生冰被誤分為海水。

表5 2021 年1 月16 日HY-1C 衛星CZI 影像海冰分類精度評價Table 5 Sea ice classification accuracy evaluation of HY-1C satellite CZI images on January 16,2021
為驗證本文方法的有效性,排除單景影像的偶然因素影響,分別對2020 年12 月19 日和2021 年1 月10 日的HY-1C CZI 遙感影像進行海冰分類。結合兩個時期的影像表征,考慮到形成白冰的幾率較小,因此海冰分類類型分為固定冰、灰(白)冰、初生冰、海水4 種類型。分類結果如圖10 所示。

圖10 2020 年12 月19 日(a)和2021 年1 月10 日(b)HY-1C 衛星CZI 遙感影像遼東灣海冰分類Fig.10 Sea ice classification of Liaodong Bay from HY-1C satellite CZI remote sensing images on December 19,2020 (a) and January 10,2021 (b)
總體來看,2021 年1 月10 日的海冰面積相較2020 年12 月19 日大幅增加。2020 年12 月19 日的海冰類型中初生冰面積較大,2021 年1 月10 日海冰類型中灰(白)冰海冰類型占比最大。由于1 月份氣溫降低,海水大面積凍結,形成大面積的灰(白)冰類型。從分類圖中可看出,海冰類型中灰(白)冰與固定冰之間存在一定程度地混淆。利用混淆矩陣客觀評價分類精度,精度評價見表6。
由表6可知,2020年12月19日遙感影像分類總體精度為93.67%,kappa系數為0.89,2021年1 月10 日遙感影像海冰分類總體精度為91.75%,kappa系數為0.88。分類精度均較高,能夠達到一般海冰分類精度要求,進一步驗證了本文方法的有效性。對比3 個時期的海冰分類精度,發現精度從高至低依次為:2020 年12 月19 日、2021 年1 月10 日、2021 年1 月16 日。隨著氣溫降低,海冰類型增加白冰類型,易誤分類海冰類型所占比例增大,分類精度逐漸降低。

表6 2020 年12 月19 日和2021 年1 月10 日HY-1C 衛星CZI 遙感影像海冰分類精度評價Table 6 Sea ice classification accuracy evaluation of HY-1C satellite CZI images on December 19,2020 and January 10,2021
利用海冰分類結果估算3 個時期的海冰總面積與各海冰類型面積,計算公式為:海冰面積=海冰像元數×2 500/1 000 000,海冰面積單位為平方千米。為直觀對比3 個時期的海冰面積和類型變化,做海冰面積變化折線圖與海冰類型柱狀圖,如圖11 所示。從圖11a 中可得到3 個時期的海冰面積逐漸增大,分別為2 635.14 km2、10 674.27 km2、11 998.98 km2,國家衛星海洋應用中心通報的3 個日期的海冰面積分別為2 365 km2、10 987 km2、12 078 km2,對比發現本文提取的海冰面積較為準確。從海冰類型來看,2021 年1 月16 日的固定冰、白冰、灰(白)冰3 種類型面積大于另外兩個日期的面積;2021 年1 月10 日的初生冰面積最大,說明隨著氣溫降低,此階段海水結冰迅速,出現大量初生冰;到2021 年1 月16 日,大量初生冰轉為灰(白)冰、白冰或者固定冰,從而初生冰面積減少,其他海冰類型面積增加。

圖11 3 個時期海冰面積變化折線圖(a)與海冰類型柱狀圖(b)Fig.11 The line chart of sea ice area change (a) and the histogram of sea ice types (b) in three periods
本文基于HY-1C CZI 影像,提出了一種有效的海冰分類方法。該方法通過提取HY-1C CZI 影像的光譜特征和紋理特征,對多特征進行特征選擇,得到最優特征集,基于最優特征集開展SVM 海冰分類研究。主要結論如下:
(1)在特征提取與選擇方面,選擇NDWIH、B_G、B_R、G_R 4 個光譜特征與均值、同質性、熵、二階矩4 個紋理特征組成最優特征集,既保留了分類有效信息,實現信息互補,又降低了信息冗余。
(2)在海冰分類方面,本文提出的基于最優特征集的分類方法優于僅基于光譜特征或紋理特征的分類方法。利用本文方法的3 期HY-1C CZI 遙感影像分類精度均在80%以上。對海冰分類圖進一步估算得到海冰總面積,與國家衛星海洋應用中心通報的海冰面積相差較小,進一步驗證了本文方法的有效性。
綜上所述,本文提出的基于最優特征集的SVM海冰分類方法是有效的,同時證明了HY-1C CZI 數據在海冰分類應用中的可行性,但在特征提取方面,本文僅應用了光譜和紋理特征,更多的特征提取方法有待進一步研究。