王梓霏,柯長青
(南京大學 地理與海洋科學學院,南京 210023)
在全球變暖的背景下,冰川呈現物質加速虧損趨勢,對全球海平面上升、冰凍圈災害等方面產生深遠影響[1]。研究表明,高亞洲地區山地冰川近期大多處于加速消融狀態[2-3],導致冰川泥石流等災害頻發[4],對居民生命安全產生巨大威脅。因此,冰川變化監測研究對區域可持續發展具有重要意義。
基于光學遙感影像提取冰川邊界具有一定的局限性,主要是表磧部分的巖屑混合物和周圍裸露巖石表現出相似的光譜信息[5]。合成孔徑雷達(synthetic aperture radar,SAR)不受天氣影響,主要根據雷達的干涉和極化特征對冰川進行識別[6-8]。Callegari等[9]通過對Radarsat-2和Sentinel-1影像進行極化分解,基于支持向量機提取冰川邊界。
2012年提出的AlexNet[10]使得卷積神經網絡(convolutional neural networks,CNN)快速發展,此后VGG[11]、GoogLeNet[12]、ResNet[13]等大大提高了圖像的分類精度。2014年提出的全卷積網絡(fully convolutional network,FCN),通過替代卷積神經網絡的全連接層實現影像的像素級分類[14],后續又發展出如UNet[15]、SegNet[16]、DeepLab系列[17]以及輕量型網絡MobileNet[18]等。卷積神經網絡憑借其優良的紋理特征提取能力在冰川識別方面也展現出優勢。Baumhoer等[19]利用Sentinel-1影像的后向散射系數,結合TanDEM-X DEM對UNet網絡進行微調有效提取了南極冰川和冰架前緣;Zhang等[20]結合不同時間、不同傳感器的光學影像和微波影像,評估了UNet和分別以ResNet、DRN、MobileNet為主干網絡(backbone)的DeepLabV3+共4種網絡識別格陵蘭島冰崩前緣的效果;Xie等[21]結合Landsat影像、DEM及其反演的地表參數基于SegNet構建冰川識別網絡GlacierNet,可以較好地識別表磧覆蓋型冰川。
上述研究側重于提取南極冰架前緣或冰崩前緣,較少關注于提取大范圍的山地冰川。大尺度的山地冰川其空間異質性較大,光學遙感易受天氣條件的制約,因此基于遙感影像快速、半自動化地提取冰川邊界仍是一個具有挑戰性的科學問題。深度學習能夠通過卷積神經網絡對輸入的特征影像自動提取不同深度的特征,實現對冰川的自動、快速、高精度的識別,故本文結合Sentinel-1A與地形數據,通過基于不同backbone的UNet和DeepLabV3+卷積神經網絡對喀喇昆侖地區的冰川進行識別,分析并評估VGG16-UNet、VGG16-DeepLabV3+、MobileNetV2-UNet以及MobileNetV2-DeepLabV3+ 4種網絡的優劣性,并比較神經網絡提取的冰川邊界與GLIMS(global land ice measurements from space)邊界在純凈冰川、表磧冰川、冰川湖以及前進冰川的提取效果;同時在保持地形因素不變的情況下,對比分析VH和VV極化通道下模型的識別精度;在VH極化通道下對比分析輸入不同地形特征的冰川識別精度。
喀喇昆侖位于青藏高原西北部,由一系列西北—東南向山脈構成,海拔7 000 m以上的高峰眾多。該區域在冬、春季受西風環流的影響降水豐富,夏季降水則由印度洋西南季風補給,加之高海拔低氣溫,為冰川發育提供良好的自然基礎[22]。該區域雪線海拔5 000 m左右,整個山系冰川面積達到5 800 km2,是世界上山地冰川最發達的地區之一[23]。在過去的20年中,全球冰川普遍處于退縮狀態,然而喀喇昆侖地區冰川出現前進的現象,即喀喇昆侖異常。異常的變化特征使得對該區域的冰川監測有重要的意義,可為區域氣候變化相關研究提供科學支撐??霰ǚ植家钥錾街魃郊篂榉纸缇€,南側多發育規模較大的縱向冰川,如錫亞琴(Siachen)、巴爾托洛(Baltoro)冰川等,北側主要是規模較小的橫向冰川。
1)Sentinel-1A數據。Sentinel-1A是歐空局于2014年發射的C波段合成孔徑雷達衛星,重訪周期12 d,有VV、VH兩種極化方式。采用5景升軌Sentinel-1A的IW(interferometric wide swath)模式GRD數據,包含VV和VH兩種極化方式,分辨率為10 m。由于冬季影像中冰川和周圍地表均被積雪覆蓋,雷達后向散射系數不能較好地區分積雪覆蓋的冰川與巖石,而夏季積雪較少,冰川與周圍地物易于區分,故選擇8月份的影像數據,詳細信息如表1所示。

表1 Sentinel-1A 影像參數
2)DEM數據。ASTER GDEM(advanced spaceborne thermal emission and reflection radiometer global digital elevation model)上搭載先進星載熱發射和反射輻射計,通過垂直向下和后視成像的近紅外波段傳感器獲取立體像對并處理生成DEM。選擇具有高空間分辨率精度和高程精度的V3版本數據,空間分辨率為30 m,標稱高程精度為10~16 m,結合其生成的坡度作為訓練數據的一部分。數據源于美國宇航局的Earthdata網站https://search.earthdata.nasa.gov/。
3)輔助數據。全球陸地冰川監測計劃GLIMS利用光學遙感影像(Landsat、ASTER)結合地形數據并進行手工數字化修正來識別、監測全球冰川,提供全球冰川的分布、面積、數量等信息,較大冰川的面積相對誤差小于5%,邊界數字化的不確定性在3~4個像元(45~60 m)[24],且會進行不定期的數據庫更新,選取2020年6月30日更新的冰川邊界作為卷積神經網絡的標簽并用于后續精度驗證,數據下載地址為http://www.glims.org/download/。
選擇云量少于10%且位于9、10月份的Landsat 8影像,對波段進行假彩色合成作為冰川識別結果的底圖,數據源于美國USGS(United States Geological Survey)網站https://glovis.usgs.gov/。
數據處理流程主要分三部分,即數據預處理、模型訓練和模型精度評價。在雷達信息特征方面,冰川的后向散射系數受到冰川表面濕度、粗糙度的影響,在積雪區,積雪的覆蓋使得冰川表面濕度增大、粗糙度減小,后向散射系數減?。辉诼惚鶇^,冰川冰的碎片產生粗糙的表面,反射、散射大量信號使得后向散射系數增大;表磧部分的表面更為粗糙,后向散射系數相比于積雪區和裸冰區較大,與周圍巖石相似,但表磧在微波影像上存在較為明顯的紋理特征,可通過深度學習提取進而與周圍地物區分。在地形特征方面,冰川發育海拔較高,坡度與周圍地形存在差異,有研究表明,局部入射角有助于提高分類精度,而坡向會混淆不同類別的特征分布進而降低分類精度[25]?;谏鲜鲈?,選取2020年8月喀喇昆侖地區Sentinel-1A的VH極化下的后向散射系數、局部入射角、GDEM和坡度4個參數作為深度學習網絡的樣本部分,將數據重采樣至同樣的10 m分辨率并進行波段組合,然后進行直方圖均衡化處理以使得圖像信息更豐富。選取GLIMS冰川邊界進行二值分割作為網絡的標簽部分。
樣本經過裁剪大小為512像素×512像素,共有4 515個樣本,對樣本和標簽按照6∶2∶2劃分訓練集、驗證集和測試集,對訓練集和驗證集進行數據增強處理,增強模型的泛化性。基于不同深度學習語義分割網絡對訓練集和驗證集進行訓練,得到驗證集精度較高的權重優化模型,將模型應用于測試集得到冰川與非冰川的二分類結果,并進行精度評價,流程圖如圖1所示。

圖1 基于深度學習的Sentinel-1A影像冰川識別處理流程
UNet是語義分割的經典網絡,DeepLabV3+是語義分割的新高峰,VGG16是提取特征的傳統卷積神經網絡,MobileNetV2是輕量型網絡的代表。兩兩組合的4種網絡兼顧參數量少與參數量多、傳統簡單與復雜創新的特性,故選取這4種網絡對冰川進行識別。
1)VGG16-UNet。UNet網絡呈U形結構,主要包括編碼器encoder和解碼器decoder部分。encoder通過卷積和池化對圖像降維并提取特征,decoder采用上采樣且與特征部分相同尺度的圖像進行拼接,將淺層特征和深層特征結合起來,更有利于提取冰川。
VGG16卷積神經網絡模型由13層卷積層和3層全連接層組成,文中將VGG16作為編碼部分用來提取冰川特征,故只選取前13層卷積層,卷積核大小3*3,步長stride為1,采用same方式填充,激活函數為ReLU函數,其具體結構如圖2所示。

圖2 VGG16-UNet網絡結構
2)VGG16-DeepLabV3+。DeepLabV3+是語義分割的新高峰,主要采用ASPP(Atrous spatial pyramid pooling)模塊結合編碼-解碼結構,簡單且有效地提高了模型精度以及運算速度。VGG16-DeepLabV3+即是以VGG16作為backbone,將大小為原始圖像1/4的特征圖像作為低層特征輸出到decoder部分,將大小為原始圖像1/16的特征圖像輸出到ASPP模塊中,再經過上采樣與改變卷積通道數的低層特征進行堆疊,兼顧圖像邊界信息及語義信息,最后經過卷積及上采樣得到冰川識別結果,具體結構如圖3所示。

圖3 VGG16-DeepLabV3+網絡結構
3)MobileNetV2-DeepLabV3+。MobileNetV2網絡是在保持相似精度的同時通過減少參數量來提高網絡效率的輕量型網絡,主要包括兩個模塊,分別是反殘差卷積塊inverted residual block和線性塊linear bottlenecks。反殘差卷積塊是采用先升維后降維來減少信息損失,線性塊是將網絡小維度層輸出后的ReLU激活函數改為線性函數。文中為了減少計算開銷只用到MobileNetV2的前8層,其具體參數如表2所示。

表2 MobileNetV2網絡前8層參數
MobileNetV2-Deeplab V3將第3層輸出的低層特征和第6層輸出的高層特征相結合,改變通道數使得二者通道數一樣,以相同比例影響冰川識別結果,提高了模型精度及運算速度。
4)MobileNetV2-UNet。MobileNetV2和UNet的結合有所不同,其上采樣過程采用轉置卷積使得圖像內容更豐富。選取第2、3、4、6、8層的輸出特征與decoder部分相同尺度的圖像進行拼接,得到最后的冰川識別結果。
為了評估模型的精度,采用交并比(intersection over union,IoU)、均交并比(mean intersection over union,mIoU)、總體精度(overall accuracy,OA)、準確率(precision)、召回率(recall)和F1分數(F1-score)等評價指標。交并比是預測值和真實值之間的交集與并集之比,均交并比是冰川交并比與非冰川交并比的平均值。
網絡損失函數為categorical crossentropy,即交叉熵損失函數;優化器選擇Adam優化算法,適用于大規模數據及參數的場景。訓練開始設置的學習率為0.000 1,訓練過程中損失loss不斷下降直至難以下降,此時以3倍的速度減小學習率,loss進一步下降,說明網絡以較小的步長可以進一步到達極小值點。通過對網絡添加dropout層可有效防止過擬合,batchsize選擇計算機顯存可承受的最大值,batchsize合適則梯度下降方向更準確。
利用上述4種語義分割網絡對訓練集和測試集訓練,其精度結果如表3所示。

表3 VH極化下4種網絡結果精度對比
上表可以看出,以MobileNetV2為backbone的模型精度均低于VGG16,但運行速度快?;谙嗤腷ackbone,DeepLabV3+較UNet識別精度高。對于VGG16-UNet和VGG16-DeepLabV3+,前者準確率高但召回率低,冰川識別更偏向于盡可能全地識別冰川,即保證召回率的前提下提高準確率,再結合F1-score的表現進一步說明VGG16-DeepLabV3+模型精度較高。
4種語義分割模型中,VGG16-DeepLabV3+的識別精度最高,故以該模型對純凈冰川、表磧冰川、冰前湖等進行識別與分類。
1)純凈冰川與表磧冰川。錫亞琴冰川呈南北走向,冰川長約76 km,面積約963 km2,是除極地以外最大的冰川[26],其識別結果如圖4所示。
純凈冰川內部較大的裸露巖石或者地表可以被很好地區分出來(圖4A、B區域),但是對于面積較小的石塊或者地表,深度學習則會將冰川內部全部識別為冰川(圖4C區域)。
表磧冰川是表面被巖屑混合物覆蓋的冰川末端,其在光學上與周圍巖石光譜信息相似,在雷達影像上表現出較為明顯的紋理特征。利用雷達影像VH極化下的后向散射系數作為深度學習特征之一,其能夠較為準確地識別出錫亞琴冰川的表磧中段及末端(圖4D、E、F區域)。
2)冰川湖。當冰川融化加快時,冰川融水以及脫落的冰塊會在冰川的末端、冰面或者冰下形成冰川湖。在喀喇昆侖東南角發育有少量冰川湖,可能是受氣溫升高影響,冰川消融加強使湖水上漲,冰川末端所受浮力增大進而脫落形成浮冰,導致湖水面積擴大,冰川部分退縮[27]。圖5為東南角部分冰川湖的分類結果。
深度學習能夠較為準確地區分冰川湖和表磧(圖5),主要是因為湖泊的地形特征及紋理特征是異于表磧的。而GLIMS邊界是在2011年及之前數據的基礎上進行不斷更新與修改的編目,圖5表明卷積神經網絡較GLIMS邊界有較好的區分表磧與冰川湖的能力。

圖4 基于VGG16-DeepLabV3+網絡(V-D網絡)的Sentinel-1A影像的錫亞琴冰川識別結果

圖5 基于VGG16-DeepLabV3+網絡(V-D網絡)的Sentinel-1A影像的冰川湖識別結果
VGG16是通過不斷加深的卷積層來提取特征,MobileNetV2是通過深度可分離卷積、反殘差卷積塊等來提取特征,其提取的特征深度不及VGG16從而導致識別精度較低,但是其訓練時間少(表3)。
UNet和DeepLabV3+相比,后者識別精度較高,主要前者只是單純地將不同深度的特征堆疊在一起,而后者采用空洞卷積,在保持分辨率的同時增大感受野,且將不同空洞率的空洞卷積疊加在一起,即將不同尺度的影像特征結合,提供更豐富更高級的語義信息,并和提供邊界信息的低層特征相結合,能夠更完整地提取冰川內部及冰川邊界。
VGG16之后還發展了ResNet、DenseNet、Xception等參數量較大的模型,但是參數量越大代表模型越復雜,提取特征越深,不一定適合所有情況。DeepLabV3+提出時是基于Xception和ResNet為backbone,并沒有展示和VGG組合的效果,文中嘗試了這種組合,結果表明比VGG-UNet效果好,表現了DeepLabV3+優越的解碼能力,后續可以更多關注由特征圖恢復至原圖像大小的解碼部分。
表磧一般比周圍地物的粗糙度更高,在交叉極化(VH)通道具有比周圍地物更高的后向散射系數,可以有效區分表磧與非表磧。以VV極化通道下的后向散射系數和相同的地形因素作為原始數據,對4種模型進行訓練,其識別精度如表4所示。

表4 VV極化下4種網絡結果精度對比
由表3和表4可知,不論VH極化還是VV極化,4種模型識別精度由低至高排序不變。除MobileNetV2-UNet模型外,VH極化下的識別精度整體高于VV極化。上述結果再次論證了交叉極化比同極化的冰川識別精度要高。
模型的輸入數據還包括海拔和坡度,在VH極化通道下基于VGG16-DeepLabV3+模型分別以去除海拔、去除坡度、去除海拔和坡度這3種特征組合方式對冰川進行識別,其識別精度如表5所示。結果表明:去除相關地形特征后,冰川的整體精度均有所下降,召回率明顯下降,可見地形特征對于冰川識別是不可缺少的因素。其中去除海拔和坡度的冰川識別精度最低,去除坡度的識別精度略高于去除海拔的識別精度,即DEM對冰川識別精度的影響大于坡度,這主要是由于冰川發育于海拔較高的地方,表磧部分一般坡度較緩,去除海拔信息后較難區分表磧與具有相似坡度的非冰川區。

表5 VH極化VGG16-DeepLabV3+模型下輸入不同地形特征的識別精度對比
喀喇昆侖地區在過去的20年中,冰川呈現穩定或者前進的狀態,冰川物質平衡趨于穩定或略有增加,該異常行為甚至擴展至西昆侖、帕米爾地區。同樣,相對于GLIMS邊界,卷積神經網絡亦能識別出部分前進冰川(圖6)。
深度學習識別出的前進冰川可以分為兩類:一類是兩條冰川經過加速運動于末端匯聚(圖6(a)、圖6(b)),另一類是單條冰川的上部加速運動將物質運送至末端致使末端前進(圖6(c)至圖6(f))。

圖6 基于VGG16-DeepLabV3+網絡(V-D網絡)的Sentinel-1A影像的前進冰川識別結果
基于深度學習的卷積神經網絡,利用Sentinel-1A以及地形數據對冰川進行特征提取與識別,對4種模型進行訓練與比較,結果表明:以MobileNetV2網絡作為backbone的冰川識別精度不如VGG16高,但能夠實現精度相當的同時減少運行時間,提高運行效率;UNet和DeepLabV3+相比,DeepLabV3+識別精度較高,主要是其結合了冰川不同尺度的淺層特征和深層特征來高精度提取語義信息及邊界信息;VH極化較VV極化具有更好的識別精度,地形特征是冰川識別不可缺少的因素,且海拔相較于坡度對冰川識別精度影響更大。卷積神經網絡對純凈冰川、表磧冰川、冰川湖及前進冰川等都有很好的識別效果,且后處理較少,雷達影像不受天氣條件影響,提高冰川識別效率的同時減少人力物力的消耗,達到快速且半自動的提取大范圍冰川的目的。
冰川發育于地形復雜的高山區域,由SAR斜距成像導致的幾何變形現象較為嚴重[28],后續可結合Sentinel-1A的升降軌數據來減少疊掩、陰影等影響進而提高精度。模型的可遷移性不強,對于地形條件相差較大的地方,模型精度不高。未來可以從三方面提高冰川識別精度:添加全極化數據的極化分解特征、光學數據等作為訓練數據,結合多源數據提高冰川識別精度;選取更廣泛區域的數據進行訓練,增加數據量的同時提升數據集的全面性;基于更為先進的卷積神經網絡訓練數據集,提取更高級的語義信息,進一步提高冰川識別精度。