999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

梯度提升回歸樹在千島湖水體CDOM反演中的應用

2022-04-20 11:07:26金則澎毛峰程乾李軍張軒豪
遙感信息 2022年1期
關鍵詞:模型

金則澎,毛峰,程乾,李軍,張軒豪

(1.浙江工商大學 旅游與城鄉規劃學院,杭州 310018;2.杭州電子科技大學 管理學院,杭州 310018;3.重慶師范大學 地理與旅游學院,重慶 400047)

0 引言

近幾十年來,由于我國經濟的飛速發展導致湖泊資源開發利用不斷增加,在人為因素和自然因素的影響下,湖泊水環境逐年惡化[1]。淡水湖泊作為人類重要的飲用水源,也面臨著農業、氣候變化和人類活動帶來的污染問題[2]。有色可溶解有機物(colored dissolved organic matter,CDOM)是溶解有機物(dissolved organic matter,DOM)的生物活性成分,CDOM在400~500 nm處吸收高達90%的水下太陽輻射,可以保護水下生態系統免受有害紫外線輻射[3-4]。但是,高濃度的CDOM對太陽光的吸收能力較強,會抑制水下植物的光合作用,這對淡水生態系統的初級生產產生了重大影響[5-6]。而且CDOM在水中具有吸附特性,會影響水污染物的分布與遷移[7]。此外,CDOM對飲用水處理過程也會帶來許多負面影響,例如CDOM會降低氧化劑和消毒劑的效力,并在氧化過程中產生不良的副產物[8]。

了解淡水中CDOM的來源、濃度和循環對于管理水生資源和預測環境變化非常重要。監測湖泊中的CDOM,研究CDOM的時空分布能有效評價水質,并制定出保護水資源的計劃。水質監測分為傳統理化監測、生物監測與遙感監測三類,常規水質監測的效率不高,而且不能顯示湖泊整體的水質情況[9-10]。目前人們已經開發了不同類型的檢索算法來反演水質CDOM,如經驗法、半解析法、矩陣反演法和機器學習法。然而,這些模型并不能很好地適用于復雜水域,特別是低濃度CDOM的內陸水域。最近,Chen等[11]用休倫湖薩吉諾灣的數據對其中15種CDOM檢索方法進行了比較,發現大多數算法在CDOM濃度較高時往往會低估其濃度,在CDOM濃度較低時往往會高估其濃度。因為藍色光譜范圍內的色胺吸收與由葉綠素a(chlorophyll a,Chl-a)和總懸浮物質(total suspended matter,TSM)引起的吸收是重疊的[12]。因此,迫切需要開發一種適用于計算低濃度水域CDOM值的算法。自上個世紀以來,人工神經網絡(artificial neural network,ANN)就被用于CDOM反演,并顯示出處理復雜內陸水域的潛力。同時,基于機器學習的方法也被用于CDOM反演,并獲得了良好的效果[13]。目前已有很多基于機器學習的方法,如隨機森林回歸(random forest regression,RFR)、梯度提升回歸樹(gradient boosting regression tree,GBRT)、支持向量機回歸(support vector regression,SVR)和高斯過程回歸(gaussian process regression,GPR),但哪一種更適合淡水湖泊中的低濃度CDOM檢測尚不得而知。GBRT的優點是它可以擬合復雜的非線性關系,但不需要事先進行數據轉換或消除孤立點掃描[14]。因此,在本研究中,對GBRT模型進行了測試,并將其與其他幾種機器學習方法進行了比較,結果表明GBRT在測試的模型中確實是最好的。

一些面向海洋的海洋水色傳感器,具有粗糙的空間分辨率,不適合在大多數河流、湖泊進行遙感應用。然而面向陸地的衛星傳感器,如Landsat系列,具有很好的空間分辨率(Landsat-8為30 m),一些基于Landsat-8的波段比模型已被提出用于低濃度的CDOM(CDOM在440 nm的吸收系數在0.066~1.242 m-1范圍內)監測。但是Landsat系列衛星的光譜分辨率有限,不能很精確地確定最優波段比。因此,研究人員更加關注GF-5傳感器,GF-5衛星影像涵蓋了可見光至短波紅外(400~2 500 nm)波段,空間分辨率為 30 m,在可見光波段的光譜分辨率可達5 nm,能提供更加精確的波段,有利于確定更加精確的波段比模型。

本文的目標是:探索GBRT模型和GF-5衛星影像反演千島湖低濃度CDOM的能力;描繪2019年每個季度千島湖水質CDOM濃度的時空變化;討論影響千島湖水質CDOM時空格局的環境因子。為實現這些目標,將2018年4月至2019年9月從千島湖收集的實測數據用于GBRT算法。在2019年,利用四個GF-5衛星影像和千島湖水文和氣象數據研究CDOM與降雨量、氣壓、風速等環境因素的耦合關系。

1 數據和方法

1.1 研究區域

千島湖(圖1)位于浙江省西部和安徽省南部,水域面積為580 km2,有1 078個島嶼,面積大于2 500 m2,平均深度34 m,最大容量19 267 m3,如果儲水量處于108 m的正常值,則流域面積為10 480 km2[15]。記錄的年平均氣溫為17 ℃,年平均降水量為1 636.5 mm(1961—2014年)。千島湖水域內的用地類型以林業用地為主,其次是農業和城鎮建設用地(圖2)。千島湖水域水質優良,水體透明度高,是中國長江三角洲地區的主要飲用水源,為周圍至少一千萬人口提供了飲用水。然而,人們對千島湖水域的不合理開發引發了大量的水土流失,隨著降雨流入湖泊的工農業和生活廢水等污染物的增多,千島湖水域的水質情況出現下降的趨勢,湖泊水環境問題越來越突出[16-17]。

根據以往研究的結果,將千島湖劃分為五個次區域,以揭示千島湖不同水生環境中CDOM的時空變化:東北、西北、西南、湖泊的中部和東南部地區。以千島湖水域周邊5 km為緩沖區,進行了土地類型分類(圖2)。

1.2 實地測量

在2018年4月19日、6月18日、2019年9月8日的三次實地取樣活動中,共從千島湖采集了40個水樣(圖1)。使用標準取水瓶在表面(深度約10 cm以下)收集水樣,在環境水溫下保存在琥珀瓶(聚丙烯250 ml)中,24小時內運往實驗室分析,測量濃度等水質參數。在每個采樣位置,使用ASD(analytical spectral devices)測量地表水光譜。FieldSpec地物光譜儀(波長范圍為325~1 075 nm,間隔為1 nm)在觀測點測量了水面輻亮度(Lt)、天空光輻亮度(Li)和水面下行輻照度(Ed)。指向水面的Lt傳感器的觀測角是太陽高度角40°、太陽方位角90°方向。指向天空的Li傳感器采用與Lt傳感器相同的太陽方位角,觀測的太陽天頂角是40°。為了減小不確定度,每個取樣點同時測量了十條光譜,并選擇光譜平均值來計算遙感反射率(Rrs),表達如式(1)所示。

(1)

式中:水表面反射因子ρ的值受風速影響,在風速可忽略的平靜天氣下取值為0.022,風速5 m/s時取值0.025;風速10 m/s時,取值0.026~0.028。本研究考慮到千島湖的地理條件和水文特征,設置ρ=0.024 5。

在實驗室低壓條件下(<5ATM),通過GF/F玻璃微纖維膜(0.45 μm)對地表水樣品進行過濾,以測定表面水樣的色度吸收。通過Cray-60分光輻射度計測量了200~800 nm的CDOM吸光度,測量結果為1 cm長,基線校正為Milli-Q baseline。最終,吸收系數的計算如式(2)所示。

(2)

式中:A(λ)是Cary-60分光輻射度計測量的CDOM吸光度;Path是用過的試管的路徑長度(1 cm)。在這項研究中,CDOM濃度是通過其在440 nm處的吸收系數來參數化的。CDOM濃度如表1所示。

表1 千島湖2018—2019年CDOM(440)野外實測數據統計

為了使GF-5影像導出aCDOM(440),使用其光譜響應函數RSR(relative spectral respone)將研究區實測光譜模擬出各個波段光譜,計算如式(3)所示。

(3)

式中:Rrs(Bk)是GF-5影像的第k(k=2,3,4,…,n)個波段的遙感反射率,第k個波段的Rrs(Bk)是由λm到λn波段范圍的Rrsfield積分得到;Rrsfield是現場測量的光譜。

1.3 水文和氣象數據

分別從屯溪和漁梁兩個水文站以及中國氣象數據網(http://data.cma.cn/)收集了2019年千島湖降雨量、氣壓、風速等氣象數據。

1.4 GF-5影像數據獲取和處理

GF-5衛星以高空間分辨率(30 m),高光譜分辨率(5~10 nm)的方式,對地球表面進行觀測。2019年,共采集了六張無云GF-5衛星影像,開發了CDOM反演算法,并對千島湖的CDOM時空變化進行了分析。使用了一張與野外實測日期相同的2019年9月8日的GF-5衛星影像驗證算法。利用ENVI5.3中的大氣校正模塊(FLAASH)進行大氣校正,得到表面反射率(Rt)。在此基礎上,采用5*5均值濾波,降低了圖像的不確定性。ENVI中執行FLAASH大氣校正如式(4)所示。

(4)

式中:L是傳感器接收的像素輻亮度值;ρe是像素及其周邊像素的平均表面反射率;S是天體反照率;La是被大氣散射進入傳感器的輻亮度;系數A和C分別取決于大氣和地理位置條件,與表面無關;大氣校正后輸出的是表面反射率影像Rt。最后計算遙感反射率(Rrs)如式(5)所示。

(5)

式中:Lr(θ,φ)是天頂角θ和方位角φ觀測角下的水表面輻亮度;Ed是向下輻照度。這兩個參數使用Hydrolight估算。計算這兩個物理量的過程中,需要在Hydrolight軟件中輸入一些參數,如太陽天頂角、影像拍攝時間、地理位置、風速和云覆蓋百分比等。這些參數可從GF-5影像數據的頭文件和國家氣象中心提供的數據中獲取。其他需要輸入的參數(例如水質參數濃度和水深值)對Lr(θ,φ)和Ed的大小無影響而被設置成缺省值或是任意值。

2 算法實現

2.1 算法背景

集成學習算法是一種強大的機器學習技術,已成功地用于各種分類和回歸問題,以提供更準確的響應變量估計[18]。在本研究中選擇GBRT模型,因為它能夠適應復雜的非線性關系,而且不需要事先的數據轉換或消除孤立點掃描。GBRT模型使用CART樹作為弱分類器,需要多次迭代。新生成的回歸樹在每次迭代中都會擬合上一棵樹的誤差,采用梯度下降法在每次迭代中向損失函數的負梯度移動,使損失函數下降。一般來說,GBRT模型的每一次迭代都會產生一個弱分類器,其精度不高,但集成弱分類器可以達到更高的精度。每個回歸樹的預測結果的加權和就是預測值(圖3)。

圖3 GBRT模型構建過程

GBRT模型表達如式(6)所示。

(6)

式中:n是弱學習器的數量;θi是系數(減少過擬合);fi是弱學習器;Fm是最終的一般模型。GBRT模型有幾個重要的參數:每個弱學習器的最大深度(一般不超過五個)、弱學習器的最大數量,以及學習率(更高的學習率意味著更強的修正,使模型更加復雜)。所以需要選擇適合的參數來提高模型的性能。

2.2 算法架構

涉及藍、綠和紅域遙感的波段比算法已被廣泛用于淡水湖的CDOM遙感[19]。此外,與使用單波段反射率相比,波段比模型可以減少大氣校正的更多不確定性[20]。本研究以B25(Rrs493)、B41(Rrs561)和B56(Rrs625)組成的GF-5影像波段比作為GBRT模型的輸入,通過決定系數(R2)、均方根誤差(RMSE)、偏差和平均絕對百分比誤差(MAPE)四個指標確定最佳組合。

現場測量的40個樣本被隨機分成兩個獨立的數據集,它們的樣本比例約為3∶1,這是機器學習中常用的比例。因此,GBRT的訓練和驗證數據集分別包含30個和10個現場測量樣本。基礎學習者的數量為40人,學習率為0.1,每個學習者的最大深度為5,其他參數默認配置。

2.3 與其他CDOM檢索算法的比較

為了驗證GBRT在估算淡水環境中低濃度CDOM方面的優勢,還對以往的兩種傳統模型進行了比較。對數模型,參見式(7),其中aCDOM(440)的范圍為0.51~25.1 m-1[21]。另一個模型是一元二次多項式模型,見式(8),其中aCDOM(440)的范圍為0.644~1.413 m-1[22]。第二個模型在水體類型和CDOM范圍方面與構建模型更具可比性。

(7)

(8)

式中:B25、B41和B56是GF-5影像數據的波段。對于不同的研究地點,參數D、E和F需要重新校準。

3 結果分析

3.1 野外測量的CDOM和地表光譜

在以前的許多研究地點,內陸水域中的CDOM濃度范圍很大。例如,在明尼蘇達州的15個湖泊中,aCDOM(440)的范圍為0.6~19.4 m-1[23]。與這些CDOM濃度變化較大的湖泊相比,2019年千島湖的CDOM濃度變化相對較低。野外實測的aCDOM(440)范圍為0.103~1.366 m-1,平均值為0.53 m-1。野外實測數據顯示出明顯的季節變化,4月份的aCDOM(440)在0.103~0.507 m-1(平均0.253 m-1)范圍內,而9月份的變化范圍為0.196~1.366 m-1(平均0.637 m-1),說明秋季的CDOM濃度高于早春。

千島湖實測的遙感反射率如圖4所示,顯示了復雜內陸淡水的典型光譜特征。浮游植物對葉綠素和胡蘿卜素的低吸收和低散射產生了570 nm的峰值[24]。670 nm處的小反射谷可能是由葉綠素a對紅光波段強烈吸收引起的[25]。在千島湖,由藻類色素和水體自身吸收較小引起的700 nm附近的葉綠素熒光并不顯著。

圖4 千島湖實測地表光譜(Rrs)

3.2 模型評估和比較

為了確定GBRT模型的最佳輸入,對所有可能的波段比組合進行了計算。考慮四個指標(R2、MAPE、RMSE、偏差),最終選擇了B25/B41和B56/B25來反演CDOM濃度。最佳的GBRT模型的R2為0.90和0.93,MAPE為0.34%和15.53%,RMSE為0.35 m-1和0.16 m-1,培訓和驗證數據集的偏差為-0.004和-0.032,測量到的訓練和驗證數據集最佳模型的CDOM濃度散點圖如圖5(a)和圖5(b)所示。結果表明,該算法的性能可以用于反演千島湖的CDOM濃度。

圖5 模型驗證結果

本研究利用在千島湖的實測資料,對前人建立的兩個模型進行了檢驗,研究發現對數模型(R2=0.357 4,RMSE=0.394 5 m-1)(圖6(a))和多項式模型(R2=0.048 4,RMSE=0.414 7 m-1)(圖6(b))。在千島湖不能很好地擬合。將GBRT與RFR、SVR、GPR進行了比較,所有模型均選擇波段比B25/B41和B56/B25作為輸入。表2顯示了統計分析的結果。結果表明,支持向量回歸對訓練數據集(R2=0.44,MAPE=64.5%)和驗證數據集(R2=0.27,MAPE=68.3%)都表現不佳,而高斯過程回歸對驗證數據集產生了過擬合(R2=0.02,MAPE=86.3%)。與隨機森林回歸相比,對于驗證數據集,梯度提升回歸樹的R2增加了20%,而MAPE降低了26.17%。

圖6 檢驗千島湖低濃度CDOM反演的兩個經驗模型

表2 四種典型機器學習算法的比較

3.3 CDOM的時空變化

將訓練好的GBRT模型應用于2019年的四幅GF-5影像,以估計千島湖的CDOM濃度,如圖7所示。為了進一步分析CDOM的時空變化,根據每個區域的有效像素估計了各個子區域每個季度的平均aCDOM(440) 濃度(圖8)。結果表明,2019年千島湖CDOM的季平均濃度較低,為春季0.61 m-1、夏季0.65 m-1、秋季0.75 m-1和冬季0.54 m-1,CDOM濃度季節性差異較為顯著,其中秋季明顯高于其他三季。四幅反演圖像中,CDOM濃度高值區與千島湖流域用地分類圖(圖2)中的建筑/道路、農田用地相契合,表明了人類活動對于水體CDOM濃度影響較大。千島湖西北區和西南區的CDOM含量明顯高于其他地區。西北區的新安江占千島湖總徑流量的60%,西南區的武強溪占千島湖總徑流量的25%。眾所周知,徑流會將陸地腐殖質帶入湖泊,使得大量的CDOM通過武強溪和新安江匯入千島湖,西北和西南區河口的水流流速比中部地區的水流流速大,河口區域的水體充分混合,使得水體分層不明顯,因為紫外光無法輕易穿透表層水體,因此光漂白速率會比那些分層明顯的中部區域低,從而導致西北和西南區的CDOM濃度相對較高。

圖8 千島湖季平均aCDOM(440)濃度

3.4 CDOM與水文氣象因子的關系

以前的一些研究表明,降水量對水中CDOM濃度有重大影響[26]。CDOM濃度與降水量的R2為0.620 8,表明降水量對千島湖CDOM濃度的變化影響顯著。千島湖地區年間降水量不均勻,水位有明顯落差,其平均水深為37 m,最大水深為90 m。豐水期的降水量比枯水期的降水量高得多,高度動態變化的水位會使得湖泊底質變化,而水體底部有機質的釋放是水中CDOM的來源之一。豐水期水流速度大,河流中的CDOM會流入主湖區;而枯水期水域的水位低,水流速度不大,從河流流入的CDOM就會減少。夏季和秋季正是千島湖的豐水期,因此其CDOM濃度高于春季和冬季。然而,在本研究中,千島湖的CDOM濃度峰值出現在秋季,而不是在降雨量最大的夏季(圖9)。

圖9 千島湖季平均降雨量aCDOM(440)之間的相關關系

眾所周知,光化學降解和光漂白是去除CDOM的重要機制。例如,在太湖進行的一項為期12 d的實驗發現,當CDOM暴露在太陽輻射下時,CDOM的吸收量aCDOM(355)和aCDOM(280)分別下降了29.8%和20.8%[27]。2019年,千島湖在夏季(5—7月)經歷了高強度的UV-B輻射,這顯著增加地表水的光漂白強度,從而消除部分降雨和徑流帶來的CDOM。因此,2019年夏季千島湖反演的CDOM濃度并不太高。相比之下,秋季的CDOM濃度較高可能是由于以下三個原因。①經過連續多個月的降雨后,地表徑流和地下水逐漸將豐富的土壤有機質釋放到水中。②秋季太陽輻射減弱,減緩了CDOM的光漂白。③秋季越來越多的落葉腐爛,直接增加了土壤和水中的有機質含量;冬季是一年中降雨量最少的季節,加上溫度下降導致的水面結冰,徑流量大大減少,CDOM濃度處于一年中最低;春季由于降雨量的回升,以及冰雪融化加大了地表徑流,導致外源有機物的輸入加大,CDOM濃度相比較冬季有所上升。

分析衛星獲取的CDOM濃度與水文和氣象因子(氣壓和風速)之間的相關性發現,CDOM濃度與氣壓和風速的R2分別為0.082 5和0.096 4(圖10),表明這些因素對千島湖CDOM濃度的變化沒有顯著影響。

圖10 千島湖季平均氣壓、風速以及與aCDOM(440)之間的相關關系

4 結束語

利用梯度提升回歸樹算法,結合GF-5高光譜衛星影像建立了千島湖低濃度CDOM遙感模型。經比較驗證,模型性能良好,RMSE=0.1 m-1,MAPE=19.0%。然后,應用GBRT模型預測了2019年千島湖CDOM濃度的時空變化。千島湖整體aCDOM(440)較低,最低為0.005 m-1,最高為1.472 m-1,CDOM濃度季節差異較為顯著,秋季>夏季>春季>冬季。各個季節高CDOM濃度部分一般位于湖的邊緣區,主要是入水口以及湖周圍與人類活動密切相關的地方,如西北和西南區的入水口附近的CDOM濃度較高。最后結合水文數據,發現CDOM濃度與氣壓和風速的相關性很低(R2分別為0.082 5和0.096 4),表明這些氣象因素對千島湖CDOM濃度的變化影響不大。

由于現場測量和觀測僅在一年內進行,更多的環境因素或事件可能會改變CDOM和水質,因此GBRT模型仍需進一步改進。本研究表明,GBRT模型和GF-5影像能準確監測低濃度湖泊中CDOM的時空變化,可以更好地了解河流、湖泊系統中可溶解有機質與其環境因子之間的耦合關系。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 成人午夜精品一级毛片| 国产福利小视频高清在线观看| 亚洲女人在线| 五月婷婷丁香综合| 亚洲国产精品无码久久一线| 日本福利视频网站| 国产一区二区三区夜色| 亚洲第一黄色网址| 2022国产无码在线| 国产尹人香蕉综合在线电影 | 久久精品国产999大香线焦| 宅男噜噜噜66国产在线观看| 91免费国产在线观看尤物| 亚州AV秘 一区二区三区| 乱人伦中文视频在线观看免费| 青青草原国产av福利网站| 亚洲综合色在线| 性视频久久| 高清无码一本到东京热| 欧美 国产 人人视频| a天堂视频| 午夜精品久久久久久久无码软件| 萌白酱国产一区二区| 亚洲欧洲日韩久久狠狠爱| 男人天堂伊人网| 国产精品一区二区在线播放| 国产拍在线| 久无码久无码av无码| 狠狠色丁婷婷综合久久| 国产成人超碰无码| 精品久久久久成人码免费动漫| 国产精品永久在线| 91探花国产综合在线精品| 久久福利网| 亚洲精品高清视频| 波多野吉衣一区二区三区av| 亚洲男人在线| 欧美va亚洲va香蕉在线| 国产精品成人AⅤ在线一二三四| 无码久看视频| 国产一级毛片高清完整视频版| 国产精品一区在线麻豆| 91精品国产情侣高潮露脸| 丁香综合在线| 91麻豆精品视频| 亚洲最大福利视频网| 国产午夜精品一区二区三区软件| 成人在线亚洲| 精品久久人人爽人人玩人人妻| 国产欧美日韩精品第二区| 一本久道久久综合多人| 99在线观看视频免费| 久久精品亚洲热综合一区二区| 国产免费黄| 制服丝袜亚洲| 成人精品亚洲| 尤物亚洲最大AV无码网站| 日韩欧美在线观看| 国产成人综合日韩精品无码首页 | 国产成人三级| 色噜噜久久| 中文字幕在线欧美| 国产精品午夜福利麻豆| 亚洲第一中文字幕| 久久精品无码一区二区日韩免费| 亚洲三级色| 亚洲精品成人片在线观看| 久久人妻xunleige无码| 亚洲综合九九| 精品久久综合1区2区3区激情| 久久精品66| 青青草国产免费国产| 国产欧美视频一区二区三区| 亚洲永久精品ww47国产| 亚洲Av综合日韩精品久久久| 99热最新网址| yjizz国产在线视频网| 亚洲欧美日韩动漫| 国产资源免费观看| 国产精品无码一二三视频| 欧美成人日韩| 无码综合天天久久综合网|