孫世舉 徐浩 吳艷蘭 吳鵬海 楊輝



摘要:葉綠素a是反映水生態環境污染狀況的重要指標,定量反演葉綠素a濃度有助于及時監測水體營養狀態變化,對富營養化水體治理具有重要意義。以巢湖及南淝河支流下游為研究區域,利用Sentinel-2衛星遙感數據源,構建其葉綠素a濃度反演模型,探究葉綠素a濃度的時空變化規律。結果顯示,構建的深度神經網絡(DNN)模型反演精度較高(R2=0.96,MRE=31.62%,RMSE=24.4 μg/L)。通過分析減少訓練樣本量對DNN模型精度的影響,發現訓練樣本較少時,模型仍具有較高的精度;根據其精度的敏感模型訓練樣本個數,將訓練集按組等分,模型呈現較好的穩定性并具有一定的適用性。分析表明,研究區葉綠素a濃度在時間上呈現夏秋季上升、春冬季下降的規律,在空間上呈現湖區西高東低、局部近岸區分布較高的特點。
關鍵詞:葉綠素a;衛星遙感;濃度反演;巢湖;南淝河
中圖分類號:X835? ? ? ? 文獻標志碼:A? ? ? ? 文章編號:1674-3075(2023)04-0058-09
近年來,淡水湖泊富營養化造成的藻類水華暴發問題日趨嚴重(錢瑞等,2022)。葉綠素a作為湖泊藻類中含量最多的色素,可直觀反映出湖泊營養狀態,是湖泊水質監測的重要指標之一(高玉蓉等,2012)。水色遙感技術是通過分析遙感反射率與水色要素(如CODMn、Chl-a、Tss等)之間的關系,從而計算研究區域水色參數濃度(馬榮華等,2009)。就水體藻類群落而言,其葉綠素a濃度會隨著季節與水環境等因素的變化呈現出較大差異,但目前葉綠素a濃度反演模型在不同季節及不同水環境的適用性仍有待探討(王波等,2022)。
在數據源方面,常規葉綠素a遙感反演數據源主要包括Landsat-5及Landsat-8系列衛星(Yong et al,2018; Mamun et al,2021)、Sentinel系列衛星(Jiang et al,2017)、高分一號系列衛星(徐鵬飛等,2020)、環境一號系列衛星(徐逸等,2019)、MODIS系列衛星(馬榮華等,2009)、MERIS影像數據(Mishra et al,2011)、Hyperion影像數據(杜聰等,2009)、SeaWiFs系列衛星(Hu et al,2011)及無人機高光譜影像數據(黃宇等,2020)。盡管上述數據源都可以針對區域葉綠素a濃度進行反演,但其時間及空間分辨率存在較大差異。相比之下,Sentinel-2系列衛星除擁有良好的空間分辨率外,還具有5日一次的重放周期,并且其在紅光范圍擁有3個波段數據,是探究水體葉綠素a反演的理想數據源(王行行等,2020;Silveira et al,2020)。
在遙感反演方面,傳統經驗方法是通過建立遙感數據與地面監測水質參數值之間的統計關系外推水質參數,缺少生物光學理論依據,對渾濁水體估算精度較差(安如等,2013;Zhang et al,2017)。半經驗方法是將已知的水質參數光譜特征與統計模型相結合,選擇最佳波段或波段組合作為相關變量估算水質參數值,而半分析方法主要以生物光學模型為基礎,提高模型的反演能力(畢順等,2018)。機器學習算法的引入,為遙感水質反演更深一步的研究提供了參考方向(Motoaki et al,2001;Naeini & Prindle,2018;David et al,2020)。但雨生等(2020)利用BP神經網絡對平寨水庫葉綠素a濃度進行了估算,其BP神經網絡模型精度較高,但仍存在需添加采樣點個數及模型局限性的問題;Jia等(2020)采用多種機器學習共同構建研究區葉綠素a濃度反演模型,采用疊加回歸法,避免了單一模型的不足,證明了基于聚類方法的可行性,但其預測數據與真實值存在一定差距,模型性能仍需進一步提升。Cao等(2020)研究表明,基于高寬波段數據反演湖泊中葉綠素a濃度的機器學習方法,為進一步提高模型反演能力提供了更高的參考價值。
巢湖是中國五大淡水湖之一,目前有關其葉綠素a濃度反演研究存在實地采樣數據時間單一、數據量較少、構建模型精度不夠高、不具備較強普適性等問題(荀尚培等,2011;陶慜等,2015;劉文雅等,2019;羅婕純一等,2021),故針對巢湖需要更多的跨季或跨年實測數據以及更加精準、高效的算法模型對葉綠素a濃度進行反演。本文以巢湖及南淝河支流下游段為研究區域,基于5次不同時期的遙感影像數據和地面準同步實測葉綠素a濃度數據,嘗試采用深度神經網絡(DNN)學習算法,構建葉綠素a濃度反演模型;通過減少訓練樣本,探究其對模型精度的影響以及模型的穩定性和適用性,得到適合其反演的最佳模型,以期為巢湖流域水環境營養狀態的智能化動態監測提供科學依據。
1? ?材料與方法
1.1? ?研究區及數據
1.1.1? ?區域概況? ?巢湖流域位于安徽省中部,處于長江和淮河兩大水系中間,屬于長江下游左岸水系(圖1)。巢湖湖區(30.42°~31.72°N,117.28°~117.86°E)位于合肥市城區以南15 km。南淝河水系位于巢湖西端北部,流域面積1 700 km2,源頭位于肥西縣將軍嶺等丘陵地帶,長70 km,其主要支流有店埠河、四里河等。
1.1.2? ?野外數據采集? ?野外采樣信息如表1所示。分別于2018年8月2號、2019年12月27號、2020年6月25號、2020年11月2號以及2020年11月13號分5次對研究區水體進行采樣,共采集有效點138個(圖1),選擇天氣晴朗、湖面平靜時采樣,2018年7月31號及2020年6月25號兩景影像在巢湖西部有云層遮擋,其余天氣均無云。
采用分光光度法對水體葉綠素a濃度進行測量(Pyo et al,2017)。將一定量樣品用濾膜過濾截留藻類,研磨破碎藻類細胞,用丙酮溶液提取葉綠素,離心分離后分別用于750、664、647、630 nm波長處測定提取液吸光度,根據以下公式計算水中葉綠素a濃度:
P1=11.85(A664-A750)-1.54(A647-A750)-0.08(A630-A750) ①
Chl-a = P1V1/V ②
式中:P1為試樣中葉綠素a濃度,A630、A647、A664、A750分別為試樣在630、647、664、750 nm波長的吸光值度,Chl-a為樣品中葉綠素a濃度,V1為試樣定容體積,V為取樣體積。
1.1.3? ?遙感數據及預處理? ?針對采樣時間跨度較大及南淝河下游河道較窄問題,選擇Sentinel-2系列衛星作為本研究影像數據,該衛星遙感影像數據通過歐空局官網下載(https://scihub.copernicu.eu/),是多光譜成像衛星,攜帶1枚多光譜成像儀(MSI),由同時運作的2A和2B衛星組成,使其重訪周期縮短至5 d,具有較高的時間分辨率。其多光譜成像儀覆蓋了13個譜段(443~2 190 nm),4個可見光譜段和1個近紅外譜段的空間分辨率達到了10 m,6個紅光邊緣譜段和短波紅外譜段的空間分辨率達到了20 m,同時滿足了高空間分辨率衛星影像的需求(刁瑞翔等,2021)。本文所選取的Sentinel-2A衛星遙感影像共24景,均保證天氣條件較好、云層覆蓋率小。將已下載的遙感影像使用SNAP軟件的鄰近像元法進行重采樣至10 m,遙感影像的預處理通過ACOLITE軟件包進行(http://odnature.naturalsciences.be/remsem/acolite/)。ACOLITE軟件包中嵌入了暗光譜擬合算法進行大氣校正,并得出Rrs(水像元的遙感反射率)的算法(Li et al,2019)。為盡量消減鄰近效應對本研究的影響,采用掩膜處理方法對離岸2個像元以內的區域加以裁剪,但不參與后續反演建模(畢順等,2018)。
1.2? ?敏感波段分析
目前的水質參數反演一般選擇Chl-a濃度敏感性較強的波段用于模型構建(Dall'Olmo,2006)。本研究的敏感因子采用代表性的單波段和雙波段組合(孫昊和周林飛,2019;孫宏亮,2020),提取預處理之后影像各采樣點的波段信息并加以組合,與實測葉綠素a濃度進行Pearson相關性分析,結果如圖2。
采用B8A/B4、B6/B4、B8/B4、B7/B2、B8A/B2以及B6/B2共計6個Pearson相關性系數高于0.85的波段組合,作為DNN模型及其他機器學習模型的輸入。
1.3? ?DNN網絡模型
神經網絡是計算機科學領域中人工智能的一個分支。從生物學角度來說,人工神經網絡(Artificial neural network,ANN)是模擬人類大腦中神經網絡的激活和信息傳遞模式,深度神經網絡(Deepneural networks,DNN)是由ANN發展變化而來(Hinton & Salakhutdinov,2006)。本文以DNN為主體構建深度學習網絡模型,將波段組合數據與實測數據合并后導入網絡,最后輸出到樣本標記空間,實現模型的最終分類;該網絡能分析波段數據與葉綠素a實測數據的特征關系,有效提升輸入數據的復雜度,提高模型非線性擬合能力,進一步提升網絡性能。將結果與預測值進行相對誤差分析,作為反演葉綠素a濃度精度的評價標準(逄淑娜等,2019)。
從總樣本中隨機選取80%的采樣點(110個)作為訓練,剩余20%的采樣點(28個)作為測試,提取出采樣點的光譜反射率,采用相關性系數高于0.85的6種波段組合,結合實測水質數據作為模型的訓練樣本。由于網絡層數過少不能很好地捕捉數據特征,因此本文通過增加隱藏層數來容納更多的神經元,通過對每一層的輸出增加一個激活函數來解決復雜的非線性問題,提高模型的特征提取能力。
本文基于Keras框架經過大量實驗并結合具體數據量,搭建4層結構的深度神經網絡,如圖3所示。其中隱藏層的節點數分別為256、128和32,輸出層的節點數為1,圖中Xtrain為DNN網絡的輸入,Xtrain = [x1, x2, x3, …, xn]即n緯的列向量。網絡通過在輸入層對數據進行標準化處理,數據輸入進行層間權重參量與閾值參量的計算既(wn,bn),通過Xtrain及Ytrain計算wn、bn。在本文的DNN網絡中,每個隱藏層從前一層獲得輸入數據,經隱藏層提取特征,并利用Relu激活函數實現非線性表達,逐層依次迭代,確定學習率設置為0.001,損失函數使用mse,優化器使用adam,迭代次數設置為50次,最后導入回歸評價指標,實現模型的訓練。
1.4? ?模型評價指標
本文利用模型相關性系數(Coefficient of determination,R2)、平均相對誤差 (Mean relative error,MRE)和均方根誤差(Root mean square error,RMSE)對水質參數反演模型進行精度評價。R2是判斷回歸模型擬合程度高低最常用的指標,其表達公式如下:
式中:n為數據的總個數,[R'i]為反演模型估測的葉綠素值,[R i]為實測的葉綠素值,[R] 為實測葉綠素平均值。
2? ?結果與分析
2.1? ?DNN模型精度
使用20%的測試數據用于進行模型精度評價,以驗證模型的精度。本次研究采用深度神經網絡(DNN)方法建立葉綠素a反演模型的預測值與實測值對比結果見圖4。
2.2? ?方法對比
為了驗證DNN模型的有效性,分別采用支持向量機(SVM)、隨機森林(Random forest regressor)、梯度提升(Gradient boosting regressor)、極端隨機樹(Extra trees regressor)、XGBoost(eXtreme Gradient boosting)、K近鄰(K Neighbros regressor)、AdaBoost回歸(AdaBoost regressor)、Bagging回歸(Bagging regressor)共8種機器學習算法,構建巢湖及南淝河下游葉綠素a濃度反演模型,并進行上述模型對比與分析。
機器學習模型的構建選取與DNN模型相同的波段組合輸入,采用8種機器學習方法建立葉綠素a反演模型的預測值與實測值對比,每個模型在反復進行參數調整測試后,結果如圖5所示。通過多種不同機器學習模型發現,利用DNN及機器學習算法所構建的模型均擁有較好的性能,而DNN方法所構建的模型,具有最高的模型相關性系數、最低的平均相對誤差及均方根誤差。
綜上,DNN算法應為最優算法。為避免模型存在偶然性的問題,針對DNN模型及各種機器學習模型進行穩定性分析。
2.3? ?訓練樣本量對模型精度影響
樣本量過少會影響深度學習效果(馬崠奡等,2021;王子儒和李振民,2021)。為了驗證DNN模型的穩定性,在保證測試集不變的情況下,分析樣本個數對模型精度的影響,以訓練集中的每5個數據為1個單位,每次減少1個單位,并同時采用上述8種機器學習模型進行共同實驗,結果如圖6所示。
隨著訓練集個數的不斷減少,9種模型的R2均呈現持續下降趨勢,其中DNN模型下降幅度最小,R2始終要高于其他機器學習模型。訓練集數在110~30個時,DNN模型R2保持在0.90以上;訓練集數在25個時,R2下降至0.88;樣本數為15個時,R2為0.81。故DNN模型整體精度較高,具有良好的穩定性。
2.4? ?模型適用性
基于2.3中訓練樣本量對模型精度的影響分析,分別采用30、25、15個采樣點進行訓練時,模型精度下降較大(約8%),確定影響其精度的敏感模型訓練樣本個數并進行實驗。在保證測試集不變的情況下,將訓練集按30個/組、25個/組、15個/組分別分為3組、4組、6組,如圖7所示;且測試點隨機覆蓋研究區,結果如表2所示。
每30個采樣點為一組進行模型構建,R2均值(0.8893)與每25個為一組的R2均值(0.8762)相差不大。每15個采樣點為一組的R2均值(0.7993)相較前2組的下降幅度較大,但仍有較高的精度。故該模型可根據自身實際情況,為今后開展巢湖葉綠素a濃度采樣時,所需人工采樣點個數的把控及巢湖葉綠素a濃度的宏觀觀測提供參考依據。
2.5? ?葉綠素a濃度的時空分布反演
本研究采用2018-2020年春夏秋冬四季成像的Sentinel-2 MSI 影像各一景,共12景,使用DNN模型對巢湖及南淝河下游的葉綠素a進行反演和時空變化分析,結果如圖8所示。
按照顏色由淺綠向深綠過渡,顏色越深,表示反演結果中葉綠素a濃度越高,灰色部分代表水域被云層覆蓋。根據實際反演情況,將葉綠素a濃度分為0、100、150、200、300 μg/L和大于300 μg/L共6個不同的濃度等級。
2.5.1? ?時間變化? ?根據巢湖及南淝河下游葉綠素a濃度3年四季的反演結果,不同葉綠素a的等級分布及濃度均值見圖9。
圖8反演結果表明,2018-2020年春季,研究區大部分的葉綠素a濃度在100~200 μg/L,其濃度較低;2018-2020年夏季,大部分區域葉綠素a濃度在150~300 μg/L,其濃度適中;2018-2020年秋季,大部分區域葉綠素a濃度在100~200 μg/L,其濃度適中;而2019年秋季巢湖流域大面積葉綠素a濃度則處于200~300 μg/L,其濃度較高;2018-2020年冬季,大部分區域葉綠素a濃度在100~150 μg/L,其濃度較低。由圖9可以看出,每年夏秋季巢湖及南淝河下游的葉綠素a濃度要明顯高于春冬季,春、夏、秋、冬四季均值在141~168、175~195、172~218、143~164 μg/L。由上可知,研究區葉綠素a濃度在夏秋季偏高,春冬季偏低,這主要與溫度降低、藻類植物繁殖變慢有關(荀尚培,2011)。
2.5.2? ?空間變化? ?圖8反演結果表明,巢湖葉綠素a濃度在空間上呈現出一定的差異。首先,巢湖西半湖的葉綠素a濃度要高于東半湖,這主要與巢湖西北部的十五里河和南淝河將合肥產生的城市污水導入巢湖西半湖以及巢湖姥山島旅游景點位于西半湖有關(Zhang et al,2020)。本研究對南淝河下游葉綠素a濃度進行反演時發現,其葉綠素a濃度一直處于中等標準,這與河流流速也有一定關系。流速快的水體很少出現富營養化情況,然而其注入巢湖后,由于巢湖閘、裕溪閘等的修建,使巢湖逐漸成為半封閉水域,湖內水流緩慢,導致浮游植物富集,湖區葉綠素a濃度增高(陶慜等,2015);其次,巢湖局部近岸區葉綠素a濃度較高,這與近岸區域的人類、生物活動及陸地環境有關。2019年及2020年冬季,湖心偏東部及偏南部湖區呈現出葉綠素a濃度較高的現象,經查閱天氣信息,得知這兩日風向均屬于偏東南風,是湖面葉綠素隨風向移動所致(李亞春等,2016;胡旻琪等,2018)。
3? ?小結
(1)采用B8A/B4、B6/B4、B8/B4等Pearson相關性系數高的波段組合作為DNN模型的輸入因子,該模型具有較高的相關性系數(R2=0.96)、較低的均方根誤差(RMSE= 24.4 μg/L)及相對平均誤差(MRE=31.62%)。
(2)DNN 模型訓練樣本大于30個時,R2始終大于0.90;訓練樣本為25個時,R2=0.88;訓練樣本為15個時,R2=0.80。DNN模型具有良好的穩定性。將訓練集等分為3組、4組及6組,R2下降約9%。
(3)基于DNN模型對研究區葉綠素a濃度進行反演,夏秋兩季巢湖及南淝河下游葉綠素a濃度較春冬兩季普遍偏高,主要與溫度、藻類代謝有關;巢湖西半湖污染更為嚴重,主要受人文活動影響;巢湖局部靠岸區域的葉綠素a濃度較高,冬季會受到風向影響。
參考文獻
安如,劉影影,曲春梅,等,2013. NDCI法Ⅱ類水體葉綠素a濃度高光譜遙感數據估算[J]. 湖泊科學, 25(3):437-444.
畢順,李云梅,呂恒,等,2018. 基于OLCI數據的洱海葉綠素a濃度估算[J]. 湖泊科學, 30(3):701-712.
但雨生,周忠發,李韶慧,等,2020. 基于Sentinel-2的平寨水庫葉綠素a濃度反演[J]. 環境工程, 38(3):180-185,127.
刁瑞翔, 青松,越亞嫘,等,2021. 北方半干旱區典型湖泊——岱海透明度遙感反演(2013-2020年)[J]. 湖泊科學, 33(4):1072-1087.
杜聰,王世新,周藝,等,2009. 利用Hyperion高光譜數據的三波段法反演太湖葉綠素a濃度[J].環境科學, 30(10):2904-2910.
高玉蓉,劉明亮,吳志旭,等,2012. 應用實測光譜估算千島湖夏季葉綠素a濃度[J]. 湖泊科學, 24(4):553-561.
胡旻琪,張玉超,馬榮華,等,2018. 巢湖2016年藍藻水華時空分布及環境驅動力分析[J]. 環境科學, 39(11):4925-4937.
黃宇,陳興海,劉業林,等,2020. 基于無人機高光譜成像技術的河湖水質參數反演[J]. 人民長江, 51(3):205-212.
李亞春,謝小萍,杭鑫,等,2016. 結合衛星遙感技術的太湖藍藻水華形成風場特征[J]. 中國環境科學, 36(2):525-533.
劉文雅,鄧孺孺,梁業恒,等,2019. 基于輻射傳輸模型的巢湖葉綠素a濃度反演[J]. 國土資源遙感, 31(2):102-110.
羅婕純一,秦龍君,毛鵬,等,2021 . 水質遙感監測的關鍵要素葉綠素a的反演算法研究進展[J].遙感技術與應用, 36(3):473-488.
馬崠奡,唐娉,趙理君,等,2021. 深度學習圖像數據增廣方法研究綜述[J]. 中國圖象圖形學報, 26(3):487-502.
馬榮華,孔維娟,段洪濤,等,2009.基于MODIS影像估測太湖藍藻暴發期藻藍素含量[J]. 中國環境科學, 29(3):254-260.
逄淑娜, 朱渭寧,陳江,等,2019. Landsat-8的舟山近岸海域總懸浮物遙感反演與時空變異研究[J]. 光譜學與光譜分析, 39(12):3826-3832.
錢瑞,彭福利,薛坤,等,2022. 大型湖庫濱岸帶藍藻水華堆積風險評估——以巢湖為例[J]. 湖泊科學, 34(1):49-60.
孫昊,周林飛,2019. 石佛寺水庫葉綠素a濃度高光譜遙感反演[J]. 節水灌溉, 28(3):67-70.
孫宏亮,何宏昌,付波霖,等,2020. 香港近海海域葉綠素a定量反演及時空變化分析[J]. 中國環境科學, 40(5):2222-2229.
陶慜,段洪濤,齊琳,等,2015. 一種基于MODIS影像可業務化運行的巢湖水體葉綠素a估算算法[J]. 湖泊科學, 27(6):1140-1150.
王波,黃津輝,郭宏偉,等,2022. 基于遙感的內陸水體水質監測研究進展[J]. 水資源保護, 38(3):117-124.
王行行, 王杰,崔玉環,2020. 基于Sentinel-2 MSI影像的河湖系統水體懸浮物空間分異遙感監測——以安徽省升金湖與連接長江段為例[J]. 環境科學, 41(3):1207-1216.
王子儒,李振民,2021. 融合數據增強的遷移字典學習[J]. 計算機工程與應用, 27(23):193-199.
徐鵬飛,毛峰,金平斌,等,2020. 基于GF1_WFV的千島湖水體葉綠素a濃度時空變化[J]. 中國環境科學, 40(10):4580-4588.
徐逸,董軒妍,王俊杰,2019. 4種機器學習模型反演太湖葉綠素a濃度的比較[J]. 水生態學雜志, 40(4):48-57.
荀尚培,楊元建,何彬方,等,2011. 春季巢湖水溫和水體葉綠素a濃度的變化關系[J]. 湖泊科學, 23(5):767-772.
Cao Z G, Ma R H, Duan H T, et al, 2020. A machine learning approach to estimate chlorophyll-a from Landsat-8 measurements in inland lakes[J]. Remote Sensing of Environment, 248(10):111974-11989.
Dall'Olmo G, 2006. Isolation of optical signatures of phytoplankton pigments in turbid productive waters Remote assessment of chlorophyll-a[J]. In ProQuest Dissertations and Theses, 34(4):547-559.
David V L, Marisse M, Charlie B, et al, 2020. Machine Learning to Support Hemodynamic Intervention in the Neonatal Intensive Care Unit[J]. Clinics in Perinatology, 47(3):14-28.
Hinton E, Salakhutdinov R R, 2006. Reducing the Dimensionality of Data with Neural Networks[J]. Science, 313(7):504-507.
Hu C, Lee Z, Franz B, 2011. Chlorophyll a algorithms for oligotrophic oceans: A novel approach based on three-band reflectance difference[J]. Journal of Geophysical Research Oceans, 117(11):1011-1026.
Jia W J, Cheng J, Hu H Z, 2020. A Cluster-stacking-based Approach to Forecasting Seasonal Chlorophyll-a Concentration in Coastal Waters[J]. IEEE Access, 99(8):99934-99947.
Jiang C, Zhu W, Tian Y Q, et al, 2017. Remote estimation of colored dissolved organic matter and chlorophyll-a in Lake Huron using Sentinel-2 measurements[J]. Journal of Applied Remote Sensing, 11(3): 36007-36023
Li P, Ke Y, Bai J, et al, 2019. Spatiotemporal dynamics of suspended particulate matter in the Yellow River Estuary, China during the past two decades based on time-series Landsat and Sentinel-2 data[J]. Marine Pollution Bulletin, 149(12):1-15
Mamun M, Ferdous J, An K, 2021. Empirical estimation of nutrient, organic matter and algal chlorophyll in a drinking water reservoir using landsat 5 tm data[J]. Remote Sensing, 13(12):2256-2271.
Mishra S, Mishra D R, 2011. Normalized difference chlorophyll index: A novel model for remote estimation of chlorophyll-a concentration in turbid productive waters[J]. Remote Sensing of Environment, 117(2):394-406.
Motoaki K, Akihiko T, Tomohiko O, et al, 2001. Temporal and spatial variability of chlorophyll a, suspended solids, and yellow substance in the Yellow Sea and East China Sea using ocean color sensor[J]. Physica A: Statistical Mechanics and its Applications, 4154:179-187.
Naeini E Z, Prindle K, 2018. Machine learning and learning from machines[J]. The Leading Edge, 37(12):886-893.
Pyo J C, Pachepsky Y, Baek S S, et al, 2017. Optimizing the bio-optical algorithm for estimating Chlorophyll-a and Phycocyanin concentrations in inland waters in Korea[J]. Remote Sensing, 9(6):542-559.
Silveira K, Thomassim G, Eniuce M, et al, 2020. A Method for Chlorophyll-a and Suspended Solids Prediction through Remote Sensing and Machine Learning[J]. Sensors (Basel, Switzerland), 20(7):2125-2131.
Yong S K, Seung H B, Young K L, et al, 2018. Monitoring Coastal Chlorophyll-a Concentrations in Coastal Areas Using Machine Learning Models[J]. Water, 10(8):1020-1037.
Zhang D, Lavender S, Muller J P, et al, 2017. Determination of phytoplankton abundances (Chlorophyll-a) in the optically complex inland water-The Baltic Sea[J]. Science of The Total Environment, 601/602:1060-1074.
Zhang W, Li H, Xiao Q, et al, 2020. Urban rivers are hotspots of riverine greenhouse gas (N2O, CH4, CO2) emissions in the mixed-landscape Chaohu Lake Basin[J]. Water Research, 20:31159-31177.
(責任編輯? ?萬月華)
Estimation of Chlorophyll-a Concentration in Chaohu Lake and Nanfei River
Based on Sentinel-2 Satellite Remote Sensing Imagery
SUN Shi‐ju1, XU Hao2, WU Yan‐lan1,3,4, WU Peng‐hai1,3, YANG Hui5
(1. School of Resources and Environmental Engineering, Anhui University, Hefei? ?230601, P.R. China;
2. Institute of Spacecraft System Engineering, Beijing? ?100094, P.R. China;
3. Anhui Geographic Information Intelligent Technology Engineering Research Center, Hefei? ?230601, P.R. China;
4. Anhui Laboratory of Information Materials and Intelligent Perception, Hefei? ?230601, P.R. China;
5. Information Materials and Intelligent Sensing Laboratory of Anhui Province, Institutes of Physical Science
and Information Technology, Anhui University, Hefei? ?230601, P.R. China)
Abstract: Chlorophyll-a concentration is an important water quality parameter, reflecting the pollution status of aquatic ecosystems. Quantitative inversion of chlorophyll-a concentration is useful for following water eutrophication status over time and is crucial for developing plans to improve eutrophic water bodies. In this study, Chaohu Lake and the lower reaches of Nanfei River and tributaries were selected for investigation. The temporal and spatial variation of chlorophyll-a concentration in the study area was analyzed using a chlorophyll-a concentration inversion model. It aimed to provide scientific evidence for intelligent and dynamic monitoring of the nutrient status of water in the Chaohu Lake basin. First, a depth neural network (DNN) model was constructed based on Sentinel-2 satellite remote sensing data from August 2 in 2018, December 27 in 2019, June 25 in 2020, November 2 in 2020 and November 13 in 2020, as well as field measurement data of chlorophyll-a concentration. The stability and applicability of the model was tested by reducing the training sets. The depth neural network (DNN) model constructed for this study had high inversion accuracy (R2=0.96, MRE=31.62%, RMSE=24.4 μg/L). Analysis of the impact of reducing the training sample sets on DNN model accuracy shows that the model maintained accuracy with fewer training samples. Based on the number of sensitive model training samples, the training sets were divided into equal parts. To summarize, the model developed in this study displayed good stability and conditional applicability. After developing and testing the model, it was used to estimate chlorophyll-a concentrations in the study area and the average chlorophyll-a concentration ranges for spring, summer, autumn and winter were, respectively, 141-168, 175-195, 172-218 and 143-164 μg/L. The concentration of chlorophyll-a increased in summer and autumn and decreased in spring and winter. Spatially, chlorophyll-a concentrations were higher in the western lake and some nearshore areas, and lower in the eastern lake.
Key words:chlorophyll-a; satellite remote sensing; concentration inversion; Chaohu Lake; Nanfei River
收稿日期:2021-09-17? ? ? 修回日期:2023-02-14
基金項目:國家自然科學基金(43971311);安徽省科技重大專項(201903a07020014)。
作者簡介:孫世舉,1997年生,男,碩士研究生,研究方向為環境生態與資源管理。E-mail:2226093845@qq.com
通信作者:楊輝,1987年生,男,博士研究生,研究方向為深度學習遙感信息提取。E-mail:yanghui@ahu.edu.cn