王志勇,張夢悅*,于亞冉,泥萍
(1.山東科技大學 測繪與空間信息學院,山東 青島 266590)
膠州灣是一個伸入內陸的淺水海灣,每年都有不同程度的冰凍現象。膠州灣冬季的冰凍現象,對沿岸居民的生產生活、工程建設乃至經濟發展都有十分不利的影響。因此,膠州灣海冰的監測及精確識別海冰類型,對于掌握其冰情狀況,保障海上作業以及適應海冰防災減災工作需要等具有重要意義。
近年來,國內外研究人員利用不同類型的遙感影像和分類方法解決海冰分類問題,并取得了一系列的研究成果。Su等[1]利用MODIS影像,結合灰度共生矩陣提取海冰信息;Han等[2]于2020年利用EO-1以及Landsat-8影像,提出了一種基于壓縮和激勵網絡(Squeeze-and-Excitation Networks,SENet)、 卷 積 神 經網絡(Convolutional Neural Networks,CNN)和支持向量機(Support Vector Machine,SVM)的遙感海冰圖像分類方法,實現了小樣本遙感海冰圖像的高分類精度;Zhang等[3]提出了一種將卡爾曼濾波、灰度共生矩 陣 (Gray-level Co-occurrence Matrix, GLCM)和SVM相結合的方法,對合成孔徑雷達(Synthetic Aperture Radar,SAR)數據進行海冰分類,有效提高了海冰分類精度;Lohse等[4]基于決策樹(Classification And Regression Tree,CART)算法,以 SAR 數據為例進行海冰分類;Liu等[5]利用Radarsat-2雙極化數據,采用SVM和決策樹分類方法,結合海冰紋理特征信息處理開闊水和平整冰,得到海冰濃度參數,為海冰分類提供了一種有效的方法;Han等[6]利用深度學習分類器,對高光譜海冰圖像進行分類;李寶輝等[7]運用“北京一號”小衛星影像,建立海冰分類模型,對冬季渤海海冰進行了監測;王姝力等[8]采用CART自動決策樹和融合紋理特征的最大似然(Maximum Likelihood ML)分類算法,分別對Landsat-8數據和Sentinel 1A SAR數據進行海冰分類;韓彥嶺等[9]于2019年利用Landsat-8數據,基于主動學習與半監督技術相結合的方法進行海冰圖像分類;張明等[10]結合紋理特征,采用SVM的算法,對SAR數據進行海冰分類研究屈猛等[11]采用MODIS數據、熱紅外亮溫和Radarsat 2雙極化后向散射等多源數據,建立決策樹,綜合各種參數來判斷海冰類型。
綜合上述國內外研究成果,針對遙感影像海冰分類問題,研究數據源多集中于SAR數據,對其開展的研究也較為深入。但SAR數據存在波段相對單一所含信息有限且數據昂貴的缺點。光學遙感數據具有時效性強、投資少、光譜信息豐富的優勢,但目前針對光學遙感海冰分類研究較少,且研究的數據源多為MODIS數據、北京一號和Landsat-8數據等中高分辨率數據,此類影像分辨率多在10 m級以上,其中高分辨率的Landsat-8分辨率也為30 m。受限于分辨率問題,上述中高分辨率遙感數據均無法實現海冰的精細分類在分類方法上,現有的分類方法大多適用于SAR數據對高分辨率光學遙感海冰分類算法研究較少,常見的分類方法有決策樹、支持向量機以及卷積神經網絡等分類方法。上述分類方法往往只關注影像的光譜信息,未能充分利用海冰的特征信息,影響海冰的分類精度。
因此,本文采用空間分辨率優于1 m的高分二號(GF-2)數據,研究針對亞米級光學遙感數據的海冰分類問題。提出一種融合紋理特征和歸一化差分植被指數(Normalized Difference Vegetation Index,NDVI)的隨機森林海冰分類方法,充分利用高分辨率影像的紋理特征信息對膠州灣海冰進行精細分類,為亞米級光學遙感數據海冰分類提供一種可能的技術手段。
本研究利用高分辨率光學影像構建海冰精細分類的方法,通過主成分變換對影像進行降維和壓縮基于灰度共生矩陣確定紋理特征參數,然后分別與NDVI指數、歸一化水指數(Normalized Difference Water Index,NDWI)相融合,利用隨機森林分類器進行海冰類型的提取。
GLCM是Haralick等[12]于1973年提出的一種描述紋理特征的統計方法。灰度共生矩陣可以反映紋理的微觀信息,因而廣泛應用于遙感圖像分類之中。
NDVI主要反映紅光波段與近紅外波段反射與背景之間的差異[13],具體表達式為

式中,NIR為近紅外波段的反射值;R為紅光波段的反射值。NDVI常用于土地利用分類、作物估產和干旱監測等方面。此外,研究表明海冰生長演化時期,紅光波段和近紅外波段反照率相較于其他波段對海冰更為敏感[14–15]。
NDWI常用于遙感圖像凸顯水體信息[16],具體表達式為

式中,Green為綠光波段的反射值;NIR為近紅外波段的反射值。
主成分變換(Principal Component Analysis,PCA)是一種圖像增強技術,可將多波段的圖像信息壓縮少數幾個轉換波段中,且波段信息更有效[17]。
隨機森林(Random Forest,RF)是用于使用樹型分類器集成方法的總稱,它可以創建多個類似決策樹的樹型,這就比單棵CART的抗干擾能力更強,可以有效避免抗干擾能力低和“過擬合”現象。隨機森林分類多用于處理高維數據,并取得良好的泛化能力[18]。
本文基于融合紋理特征和NDVI的隨機森林方法進行海冰精細分類,流程圖如圖1所示。

圖1 流程圖Fig.1 Flow chart
具體流程過程包括:(1)對遙感影像進行輻射定標、大氣校正、正射校正和數據融合等預處理步驟。(2)將處理后的影像進行水陸分離,確定后續處理范圍。(3)經過大量實驗選取最適合海冰分類的紋理特征參數。本文選取均值、方差和對比度這3個特征值,選擇像素位移值為1,灰度量化級為32,作為最佳參數組合。(4)由于數據本身有4 個波段,故在紋理特征提取之前要先進行主成分分析。本文提取第一主成分進行紋理特征提取,后將紋理特征分別與NDVI和NDWI融合,豐富遙感影像特征信息,增強地物之間的差異,進而提高分類精度。(5)基于隨機森林分類器,利用融合影像進行海冰分類,將分類結果與傳統分類方法進行比較。
青島膠州灣(35°58′~36°18′N,120°04′~120°23′E)位于黃海中部、膠州半島南岸,是一個半封閉的天然海灣。它的北部和西北部為平原,東部毗鄰嶗山山脈,西南和南部是小珠山山脈[19]。膠州灣水域面積廣闊,漁業經濟十分發達,區域位置如圖2所示。

圖2 研究區域位置Fig.2 Location of study area
高分二號(GF-2)衛星是我國在2014年8月19日發射的,搭載有兩臺高分辨率為1 m全色、4 m多光譜相機的光學遙感衛星。其空間分辨率優于1 m,星下點空間分辨率可達0.8 m[20]。據衛星遙感和岸基監測獲取的冰情數據,青島膠州灣海冰嚴重冰期一般出現在1月下旬至2月上旬,本研究采用的是2016年1月27日膠州灣GF-2數據,進行高分辨率光學數據海冰類型提取。
本文利用灰度共生矩陣進行紋理特征提取。在窗口大小參數選取上,本文共試驗3×3到19×19的9種窗口大小,最終選擇最優窗口為13×13。常用的紋理特征參數有均值、方差、均質性、對比度、相異性、熵、角二階矩、相關性等[21]。為獲得更為準確的紋理特征值,本文從遙感影像中每類各選取3幅100×100像素的樣本,共12幅影像,分別統計上述紋理特征參數,統計結果如圖3所示。

圖3 不同海冰類型的灰度共生矩陣特征折線圖Fig.3 The gray-level co-occurrence matrix characteristic line chart of different sea ice types
由圖3可知,對于不同海冰類型,均值、方差和對比度3個特征值相比其他特征值,數值變化較大。因此,本文選擇這3個特征為主要紋理特征值。其他參數參照文獻[22]并考慮時間效率等因素,選擇像素位移值為1,灰度量化級為32。
由于GF-2影像有4個波段,提取紋理特征會產生大量的特征信息,紋理特征較多不利于后續融合處理,因此要進行主成分(PC)分析。本文將GF-2影像進行主成分變換,得到各個主分量所占的信息量百分比,如表1所示。

表1 主成分分析結果Table 1 Results of principal component analysis
由表1可得,第一主分量占了96.22%的信息量,幾乎涵蓋了所有信息。對遙感影像的第一個主分量進行均值、方差和對比度紋理特征提取,得到最后的紋理特征影像。
本研究為膠州灣2016年1月27日GF-2海冰遙感影像圖,訓練樣本數目為海水10處、白冰30處、冰皮50處、灰冰40處。驗證數據為隨機產生的907處隨機點,目視解譯隨機點。采用融合紋理特征和NDVI的隨機森林進行分類,為了驗證算法的有效性,使用融合紋理特征和NDWI指數的隨機森林(RF)以及未融合特征的隨機森林(RF)、支持向量機(SVM)、自動決策樹(CART)和融合紋理特征的最大似然(ML)5種方法進行對照實驗。
圖4為6種分類方法結果對比,由圖可知CART分類算法對海冰識別較為粗糙,部分海冰沒有識別出。SVM和RF分類算法對白冰識別效果較好,但對海水識別效果較差。融合紋理特征的ML分類算法對灰冰和海水的識別都較差,對冰皮識別一般,但對白冰識別較好。融合紋理特征和NDWI的RF分類結果對冰皮識別較好,但對海水識別不佳。融合紋理特征和NDVI的RF分類結果,對海水的識別效果最好。

圖4 6 種分類算法結果對比Fig.4 Comparison results of six classification algorithms
表2為6種海冰分類算法結果對比,其中SVM和CART為研究中常用的分類方法。由表2可知,融合紋理特征和NDVI的RF分類算法總體精度為84.68%,Kappa系數為0.73,顯著高于其他5種分類方法。針對具體的分類類別中,融合紋理特征和NDVI的RF分類算法在海水的制圖精度上遠高于其他分類算法,相較于融合紋理特征和NDWI的RF分類、傳統RF分類、SVM、CART和融合紋理特征的ML分類算法,制圖精度分別提高了22.31%、26.20%、23.88%、27.18%和29.52%,但該算法仍存在對冰皮分類精度較低的問題。對于RF分類算法,其在對白冰的制圖精度上略高于其他幾種分類算法,但對海水的制圖精度較低。此外,對于CART 和SVM常用的兩種分類算法,其對灰冰和冰皮制圖精度高,但在海水制圖精度上較低。針對融合紋理特征的ML分類算法,其對白冰的制圖精度高,但對灰冰和海水制圖精度較低。

表2 不同分類算法精度Table 2 Accuracy of different classification algorithms
圖5為融合紋理特征和NDVI的RF、融合紋理特征和NDWI的RF以及傳統RF的海冰分類局部放大圖。對比圖5可知,融合紋理特征和指數的遙感影像,可以較為精確地識別冰間水道,而傳統RT幾乎無法識別冰間水道。這表明融合紋理特征和指數的遙感影像,可增強海水與海冰之間的差異,識別冰間水道。此外,對比圖5a和圖5b可知,融合紋理特征和NDVI的RF相比融合紋理特征和NDWI的RF,對冰間水道的識別更細致。

圖5 海冰分類局部放大圖Fig.5 Sea ice classification and partial enlargement
綜上所述,融合紋理特征和NDVI的RF分類可得到更好的海冰分類結果,它充分利用高分辨率遙感影像特征,更適用于海冰精細分類。
本文基于GF-2遙感圖像,提出了一種有效的針對高分辨率遙感影像的海冰分類方法。該方法利用GLCM提取特征值,通過選擇樣本實驗得到適于海冰分類的紋理特征組合,并與NDVI相融合。在此基礎上利用隨機森林分類器,構建海冰分類方法,來開展海冰精細分類。可得以下結論:
(1)均值、方差和對比度這3個紋理特征組合可應用于海冰分類中,此特征組合與NDVI相融合可有效提高海冰分類精度;
(2)本文使用的融合紋理特征和NDVI的RF分類模型可實現對海水、白冰、冰皮和灰冰等類型海冰的有效識別,與融合紋理特征和NDWI的RF分類以及傳統的海冰分類隨機森林、支持向量機、自動決策樹和融合紋理特征的最大似然分類方法相比,總體分類精度分別提高 9.67%、13.70%、11.60%、19.22%、29.37%,Kappa系數分別提高 0.09、0.16、0.13、0.22、0.44,表明本文構建的海冰分類方法可有效提高海冰分類精度;
(3)在冰間水道識別中,融合紋理特征和NDVI的RF分類算法大幅度提高了海水的識別精度。因此,該模型可較為精確地識別冰間水道,這表明本研究構建的分類模型充分發揮了高分辨率光學數據的優勢。
因此,針對GF-2高分辨率光學遙感數據,融合紋理特征和NDVI的隨機森林分類器構建海冰分類方法,來開展膠州灣海冰精細分類是可行的。該方法為GF-2等亞米級光學遙感數據的海冰精細分類提供了一種可能的技術手段。同時,本研究也存在不足之處:由于缺乏實際海冰驗證樣本,本文采用隨機選取樣本點,運用目視解譯的方式進行驗證,結果可能存在誤差;由于研究區域冰期短、衛星重訪周期長,僅獲取研究區域的有海冰的1景GF-2遙感數據,采用了多種方法進行對比實驗,以增強結果的可靠性;由于研究僅在膠州灣區域開展,研究方法可能存在一定的局限性,但隨著高分辨率光學遙感衛星的發射升空,會獲取更多的遙感數據,本文的研究方法將為海冰精細分類提供一種選擇。后續研究中,將盡可能獲取多區域的多景高分辨率光學遙感影像數據,對海冰分類方法進行進一步的完善,得到精度更高更可靠的研究成果。