匡子藝,江 輝,趙心如
(南昌工程學院 鄱陽湖流域水工程安全與資源高效利用國家地方聯合工程實驗室,江西 南昌 330099)
中國水資源具有人均占有量少、時空分布不均、水土資源不匹配、人類活動影響顯著等特點,加上經濟社會快速發展造成水資源供需矛盾突出,水資源態勢十分嚴峻[1],因此對水體的研究顯得尤為重要。遙感具有時間跨度大、重返周期短、監測準確度高和信息量充足等優勢,是目前水體信息提取的重要手段。隨著衛星技術的迅速發展,衛星遙感數據量急劇膨脹,遙感數據已具備明顯的大數據特征:遙感數據的空間分辨率不斷提高,由過去的百米、千米級分辨率逐步提高到現在的亞米級[2];衛星重訪周期不斷縮短,從過去幾十天一次提高到現在的幾天、甚至一天內多次重訪的程度。隨著遙感數據分辨率的提高,人們對精度提取有了更高的要求。Jiang等[3]利用Sentinel-2高分辨率衛星,開發了一種SWI新型水指數,結果表明,結合SWI和Otsu能以較高的精確度提取各種水體類別;Zhang等[4]基于ZhuHai-1高光譜(OHS)像素指數,實現了地表水的半自動提取,總體精度在98.8%以上,提取性能優于水指數(WI)、卷積神經網絡(VFCN)或支持向量機(SVM)。但運用高分辨率衛星過程繁瑣,面臨海量數據的處理及預處理、跨尺度的分析、多平臺交替使用等巨大挑戰。
為應對這一挑戰,GEE平臺應運而生。中國傳統遙感大數據平臺,如自然資源衛星遙感云平臺、地理空間數據云、地理國情監測云平臺等,均是采用影像下載,本地處理及存儲的方式,而GEE云平臺提供了預處理及原始影像,且基于云端的處理方式和云盤存儲省去了繁瑣的前期工作和計算機空間,從而節約了成本;國外遙感大數據平臺,如美國地質調查局(USGS)需要安裝Java,并且下載速度受限;歐空局ESA哨兵數據庫僅能下載哨兵影像數據,數據類型不夠全面,而GEE云平臺集成了多種常用遙感數據集以及不透水面積、降水量和數字高程等常見的地理空間數據集。GEE云平臺中的全球水體數據(JRC)、全球降水量數據(GPM)、水體指數算法等也為GEE進行水信息監測提供了大量的數據支持和算法支撐。云平臺中產品、算法的不斷完善,文檔的不斷豐富,用戶量的不斷增多,也使得在將來利用GEE平臺進行多尺度地理及遙感數據的處理和分析成為趨勢[5]。
本文對GEE平臺的架構體系和開發界面進行介紹,在查閱相關文獻的基礎上,分別介紹了GEE平臺在水體提取方法、水域面積監測、水域地物分類、洪水災害監測和水質監測5個方面的研究進展,并以鄱陽湖為例,分別作了實例應用,最后分析和討論了GEE平臺在水信息監測研究中的優勢和不足之處。
用戶在地理云計算平臺提供的在線編輯器以及第三方應用Web Apps上編寫代碼;點擊Run運行后編輯器會將編寫的代碼通過Web REST APIs向系統發送請求;云計算平臺接收到代碼后會根據代碼的邏輯將其分配到不同的服務器上操作;顯示的邏輯經過后臺計算后返回給編輯器地圖界面顯示,同時將結果輸出到輸出窗口;異步導出的邏輯會生成相關導出任務,然后在后臺異步執行直至任務導出結束,相關結果會根據設置導出到云端硬盤中(圖1)。

圖1 系統運行架構
GEE平臺的整個開發界面分為腳本文件存放區、代碼編輯區、輸出控制臺以及地圖展示4大部分(圖2)。

圖2 GEE平臺界面
GEE云平臺是一個基于Google 云服務基礎設施的遙感大數據分析平臺,它結合了Google 強大的云計算能力與美國國家航空航天局(NASA),歐空局(ESA),美國國家海洋和大氣管理局(NOAA)等機構的空間數據。GEE云平臺自2015年公測上線至今,已有超過40 a的Landsat系列衛星影像、Sentinel-1/2/3/5衛星遙感數據、MODIS中分辨率遙感影像數據、高分辨率航空遙感影像(僅覆蓋美國本土)、基礎地理信息數據、地表覆蓋數據、耕地數據、NDVI數據、EVI數據等,共計超過200個公共數據集、500多萬張影像。通過查閱相關文獻,統計了用于水體提取的使用率最高的幾類遙感數據集,見表1。

表1 Google Earth Engine用于水體提取的常用遙感數據集
隨著遙感大數據的發展,海量的遙感影像數據可供研究者使用。初期研究僅以光學數據為主,隨著Sentinel-1的問世,開始出現合成孔徑雷達(SAR)數據以及光學數據與雷達數據結合使用。隨著研究的深入,不再局限于GEE平臺提供的數據,開始上傳更高分辨率數據和數據集,并在GEE平臺中進行后續分析[6]。對比其他云平臺,GEE平臺對全球科研人員、學生等非商用性質用戶提供免費服務,因其擁有40多a的公開遙感數據以及強大的后臺運算處理能力,使得用戶不再局限于本地機器的配置。GEE平臺也因此成為最受歡迎的云計算平臺,在遙感信息提取方面更具優勢。
GEE平臺已被廣泛應用于水體監測的研究,查閱“GEE平臺”“水體監測”等此類文獻,總結得出主要涉及水體提取方法、水域面積監測、水域地物分類、洪水災害監測和水質監測等方面。
遙感水體的提取歷經了幾十年,從目視解譯,到半自動化光譜、紋理等特征提取,再到目前基于深度學習的全自動化水體提取[7],提取方法層層迭代,為了進一步節省研究成本,利用GEE平臺自動提取水體的方法應運而生。表2列舉了近年來利用GEE云平臺進行水體提取研究的代表性文獻。

表2 近年來水體提取研究進展匯總
從表2可以看出,Bi等[8]使用GEE平臺選取3 a的Landsat 8遙感影像,通過計算4種不同水體指數,分析得出提取珠江流域地表水最高精度方法;Wang等[9]將GEE與多尺度卷積神經網絡結合,研究出從陸地衛星影像中提取城市水的新方法,特別適合于城市化背景下大規模、長期的城市水變化檢測研究。Li等[10]利用GEE云平臺結合10 m分辨率光學影像和90 m數字高程模型,有效地提取了黃河上游小型開闊地表河流信息。針對多云、汛期地區,光學衛星如Landsat-8 OLI、Sentinel-2 MSI等難以發揮作用,GEE平臺又提供了高分辨率合成孔徑雷達衛星Sentinel-1,該衛星擁有在惡劣天氣下也能穿過云霧獲取地表信息,以及對水體提取較為敏感等優點,迅速獲得了研究人員的青睞。祝鵬[11]通過GEE平臺中的SAR影像,實現了高頻次、長時間序列的地表水體監測提取;朱秀林等[12]基于GEE平臺,結合多時相和升降軌SAR數據和Sentinel-2A光學影像,采用不透水面快速提取方法獲取了高準確性的不透水面數據集;Zhou等[13]采用基于GEE平臺的SAR影像,自動選擇地表水提取閾值,實現了快速、精準提取水體,但并未將最大類間方差法與監督學習算法進行比較,得出結果較為單一。
湖泊作為區域陸地水循環中的一個重要載體,對區域的水量平衡發揮重要作用。研究湖泊水域動態變化,為區域水資源可持續利用提供依據是必要的。張振國等[14]利用Landsat 8 OLI影像,對合肥市不同地表水體類型進行水域面積計算,并做出精度評價分析;王占玲[15]利用高時空分辨率衛星GF-1和Sentinel-1作為數據來源,對全國湖泊水體面積分別作了年際、年內變化研究,但研究跨度偏小,影像數量偏少。戴志健等[16]使用DVBS極軌氣象衛星和風云三號氣象衛星數據,采用歸一化水體指數NDWI提取鄱陽湖水體信息,對鄱陽湖水域面積年、月變化做了分析。雖然研究結果精度較高,但預處理及數據來源成本太高,耗時太長,不利于水域面積變化長時序研究。2019年,Deng等[17]在GEE平臺上選取34 a長江流域的Landsat影像,通過多指標水質檢測方法(MIWDR)快速提取開放地表水體,得出隨著季節性水體的減少,長江三角洲永久性水體增加的結論;Luo等[18]使用GEE平臺中全球地表水(GSW)數據集,提出了一種重建大型湖泊淹沒區長時序、高頻率時間序列的新方法,大大節省了時間和人力成本;劉垚燚等[19]基于GEE平臺,以JRC全球地表水數據集和Landsat遙感影像為數據源,分析了近34 a太湖水體的動態變化,驗證了平臺開展水體長期變化監測的可行性;周珂等[20]在GEE平臺上,選用Landsat系列多時相影像數據,結合水指數等方法對開封市城區年際水體分布變化情況進行了研究;姬夢飛等[21]以GEE平臺為技術支持,選用30 a鄱陽湖Landsat影像,在幾種水指數方法中選用最適水體指數提取鄱陽湖水體,分析了鄱陽湖面積的時空變化,因受云層影響,僅使用Landsat 5和Landsat 8,所選影像數量過少,實驗結果精度不高。
借助遙感技術對地物進行分類研究是如今的科研手段,但面對處理數據復雜、時間過長、成本太高等問題,如何提高遙感地物判讀效率成為了地物分類工作的重點關注之一。新一代基于云的地球科學數據和分析應用行星尺度平臺GEE優勢逐漸顯現出來,它主要應用于地球科學數據,尤其是遙感影像的可視化計算和分析,目前提供了大概600多種地球科學數據集。Fitton等[22]借助GEE平臺提出了一種通過使用Sentinel-2衛星來繪制潮間帶地圖的方法,為海岸管理及變化提供了可靠的評估;Jia等[23]通過GEE平臺將最大光譜指數合成(MSIC)和大津算法(OA)相結合,實現對Sentinel-2影像的自動化執行,生成了最新10 m分辨率的中國潮灘地圖;Wu等[24]使用Landsat 8 OLI產品,提出了一種克服潮灘濕地復雜環境的影響、對濕地植被物種進行有效分類的方法;張康永[25]利用GEE平臺進行圖像處理,同時通過隨機森林分類法較好地處理了潮間灘與水域的分割,完成了濱海灘涂遙感制圖。目前國內在GEE平臺上對濕地的研究甚少,傳統濕地監測方法對于大尺度范圍長時序數據的獲取較為困難,GEE平臺的出現可有效解決監測數據獲取難、處理復雜等問題,具有廣闊的應用前景。
注重對水文動態情況的實時監測、對往年數據的規避分析、預測洪澇災害的幾率等都十分必要[26]。2021年,呂玉鳳等[27]利用高分雷達衛星遙感影像,對湖南省受洪澇災害影響嚴重的5個市,進行了有效的洪災遙感監測;呂素娜等[28]利用哨兵一號B衛星獲取了鄱陽湖區淹水信息,對鄱陽縣等鄉鎮進行了有效的受災程度分析。隨著研究區范圍擴大、多影像結合、時間跨度長等要求,單一利用圖像處理軟件已不能滿足現今的技術要求,越來越多的人開始合理運用GEE平臺,大大加快分析進程,縮短分析時間。Ben等[29]提出了一種利用SAR影像及Landsat和內置的其他輔助數據源,快速繪制洪水過程中地表淹沒的算法。該算法能夠迅速攝取數百幅平臺上提供的SAR和光學影像,生成受災地區洪水地圖,避免了耗時的數據下載和預處理步驟;Varun等[30]利用GEE平臺內置Sentinel-1數據集和大津算法繪制了洪水淹沒區,通過混淆矩陣評估了2018年8月9日和21日的SAR洪水淹沒圖的總體精度;Meysam等[31]利用Sentinel-1影像結合大津閾值法,通過GEE平臺對伊朗北部洪水進行了監測,結果表明該算法對變異性極高的淹沒區域,也能有效反映洪水變化。針對國內洪澇災害頻發地區,Qiu等[32]選取GEE平臺中66幅Sentinel-1影像,采用Otsu方法對2017~2020年珠江流域的洪水進行調查,為防洪工作提供了有力的支持;李健鋒等[33]構建了基于GEE平臺和Sentinel-1/2影像的洪水淹沒范圍快速提取模型,并對2020年7月鄱陽湖區的特大洪災進行了分析,說明了該模型效率高、可行性強。目前國內利用GEE平臺對洪澇災區的研究還不夠完善,但通過GEE平臺實時進行洪水淹沒范圍分析是可行的,具有廣闊的應用前景。
內陸水體的水質狀況直接關系到人類生活用水安全,因此,對內陸水體進行水質監測意義重大,而采用遙感技術進行水質監測是主要手段之一。但分辨率低、易受天氣和大氣塵埃影響等問題是目前亟需解決的難題。表3列舉了近年來利用GEE云平臺進行水質監測的代表性文獻。

表3 近年來水質監測研究進展匯總
從表3看出,Pereira等[34]在GEE平臺上使用了2002~2017年的陸地衛星Landsat 8 OLI影像,挑選無云影像對巴西淡水湖PH值進行測定,實現了PH預測的相關性超過85%;Ramdani等[35]基于GEE平臺以及Sentinel-3遙感衛星提取了海灣總懸浮物質,結果表明GEE平臺在時間和效率方面均有利于海洋總懸浮物的測定;Khan等[36]利用GEE平臺和Sentinel 2影像,通過歸一化差異水體指數(NDWI)對手指湖區沉積物進行了監測,并得出春季和夏季前期沉積物量較大的結論,有利于及時保護水質。在水質監測中,葉綠素a濃度是表征水體富營養化程度的重要指標,通過遙感方式監測水體富營養化程度是有效途徑[37]。田洪陣等[38]基于GEE平臺的MODIS數據,對中國黃海葉綠素a濃度數據進行了有效的分析,發現葉綠素a濃度(Chl-a)分布呈現由近岸向黃海中部遞減的特征;黃玨等[39]借助GEE平臺,對全國湖泊五大湖區2003~2018年間Chl-a濃度分布特征做了分析。結果表明:在研究日期內,中國90%的湖泊處于中營養狀態,82%的湖泊年均Chl-a變化率較小,溫度和降水是影響Chl-a濃度變化的主要因素。
鄱陽湖是中國第一大淡水湖,其與長江相通,是最重要的生態保護區之一,在維系水生態安全方面發揮著重要的作用,也深刻影響著長江中下游人民生活。近年來,隨著全球氣候變暖、五河流域各種水壩林立、過度捕撈、無序采砂、圍湖造田等自然或人為因素,鄱陽湖“老化”進程加速,湖泊面積縮減,鄱陽湖的及時監測與治理至關重要。
GEE平臺提供了30 m分辨率Landsat 8 TOA衛星遙感影像,篩選出云層覆蓋率較低的幾景影像,計算對比了NDWI,MNDWI,SDWI等多種水體指數法,通過提取效果最好的MNDWI水體指數法結合OTSU分別提取了2019~2021年枯水期和豐水期鄱陽湖流域多年水體,如圖3所示。其中2020年9月水體區域顯著擴大,與當年7,8月暴雨雨情相吻合。

圖3 2019~2021年鄱陽湖區水域范圍
結合以上理論方法,通過GEE平臺及Landsat 8影像集,運用最大類間方差法計算得出鄱陽湖近7 a枯水、平水和豐水期的水體面積柱狀圖(圖4)。可以看出,受超強厄爾尼諾及副熱帶高氣壓帶影響,2016年與2020年水域面積較其他年份顯著增加,2020年突破峰值,為近10 a來最大。

圖4 2015~2021鄱陽湖區水域面積
研究近30 a來,鄱陽湖區濕地作物及水體時空變化情況。通過GEE平臺的Landsat 5-8系列多年影像,采用隨機森林監督分類的方法對鄱陽湖區域進行水體、草洲、泥灘、沙地和其他等5種地物分類,結果如圖5所示。可以看出,湖泊區域在1987年和2016年之間縮減了,大部分處于湖泊的南部和西部。

圖5 1987~2021年鄱陽湖枯水期地物分類
洪水淹沒范圍研究對于防洪減災、風險防范有著重要的意義。2020年鄱陽湖水域7月8日和7月12日短時間內持續擴大,通過GEE平臺及Sentinel-1遙感衛星對鄱陽湖及周邊地區2020年洪災前后進行分析,提取鄱陽湖水域非水部分變成水的部分,通過updatamask分析從非水變成水的情況,提取結果如圖6(c)所示,淹沒面積約為2 117 km2,主要是對周邊農田和草洲的淹沒。
結合以上理論,運用GEE平臺對鄱陽湖水域多年范圍做Chl-a濃度分析。結合Landsat 8無云影像,根據反演模型提取Chl-a,效果如圖7所示,可以看出鄱陽湖水域整體Chl-a濃度不高,在南部、西部以及東部少量地區Chl-a濃度較高,北部湖區相對較低,與實際狀況大致相符,運用GEE對水質進行監測是有效可行的。
對于大部分衛星,如MODIS,Landsat,Sentinel-2等,GEE都集成了天頂反射率(TOA)和經過大氣校正的地表反射率(SR)產品,使用時直接導入即可。通過導入Landsat 8 TOA衛星遙感影像,在編輯區編寫水體指數公式和面積計算代碼,可以得出鄱陽湖流域多年水體圖以及對應的面積數值;導入Landsat 5-8系列多年影像,編寫監督分類代碼,經過調整訓練樣本點,可以得出鄱陽湖湖區地物分類圖;導入GEE內Sentinel-1A遙感影像,對洪災前后的分析可以得到洪水淹沒范圍圖。通過GEE云平臺的Sentinel-2遙感影像,結合實測數據,對鄱陽湖葉綠素濃度進行反演,進而得出水質狀況。整個計算過程都是在谷歌云上運行,處理能力不受空間、時間的限制,利用GEE云平臺對水信息進行監測是有效、可行的。
通過上述分析,本文認為GEE平臺在水體及其他領域有著實際的研究價值,特別是水體研究等以下幾個方面有較好的發展前景:
(1) 提高了科研效率。很大程度上縮短了遙感影像數據源的下載和預處理時間,尤其是SAR影像;讓用戶集中精力解決問題本身,而不需要花大量時間對遙感數據進行下載和處理。
(2) 存儲更加方便。隨著網絡和科技的發展,海量的遙感數據也需要更大的存儲和更高的計算能力,因此對本地服務器的存儲能力有了較大的要求。云端硬盤提供了15 GB的免費容量,GEE下載的影像數據直接保存在云端硬盤中,便于隨時取用。
(3) 地物分類更加精確。GEE云平臺配置了監督和非監督分類算法,由傳統的自動分類向人工智能技術轉變。隨著機器學習和深度學習的迅速發展,未來可提供Python端的深度學習算法來提高分類精度進行改進。
GEE云平臺在大區域、多時相遙感研究領域取得快速發展的同時,也存在一些問題:
(1) GEE云平臺對于使用者的網絡狀態和編程技術有一定的要求,需要使用者對于JavaScript或者Python語言的函數有一定的了解。
(2) 在批量導出影像集合后,GEE云平臺會將大文件自動切片導出,Drive內會出現一景多圖的現象,不便于后期的圖像整理。
(3) 受氣候條件影響,研究區可能存在云層覆蓋量高的問題,僅使用光學遙感產品略顯不足,還需改進光學結合微波遙感的產品集。