郭坤 李虎 陳冬花 謝以梅 馮武濤



摘要:沙河集水庫是滁州市重要的水源供應地,關系著市民的飲水安全問題,水質的變化監測受到了政府的高度重視。通過遙感影像實現水質參數反演,對水庫水質監測和保護工作具有非常重要的理論意義。因此,利用2021年6月和7月高分一號影像和同步的實測水質數據,建立了基于多元回歸和BP神經網絡的葉綠素a濃度和濁度模型,并進行精度評價,對研究區定量反演,以探求水庫水質分布情況。結論如下:從模型精度來看,葉綠素和濁度進行多元回歸模擬的RMSE分別為0.745、0.216,R2為0.694、0.844,平均相對誤差為13.19%、7.09%,;BP神經網絡模擬的RMSE分別為0.103、0.19,R2為0.865、0.958,平均相對誤差為2.5%、7.11%,兩者對沙河集水庫水質反演都具有可行性,但BP神經網絡要優于多元回歸;從水質遙感反演來看,2021年6月沙河集水庫的葉綠素a濃度在2.2~5.6ug/l之間,7月葉綠素a濃度在1.8~6.7ug/l之間,均處于中營養狀態,為Ⅱ類水質,6月濁度在0~4NTU之間,均值為1.16NTU,7月濁度值集中0.5~4.6NTU之間,庫區均值為2.46NTU,總體達到了飲用水源標準。
關鍵詞:沙河集水庫; 高分一號;葉綠素a濃度;濁度;遙感反演
中圖分類號:X824文獻標志碼: A文章編號:1001-2443(2023)03-0250-09
引言
近年來,社會經濟的迅猛發展和城市化建設的不斷擴大,內陸水環境所承受的壓力日益加劇,生活和工業廢水的大量排放使水體富營養化日趨嚴重。沙河集水庫作為滁州市重要水源供應地,其水質關乎周邊20多萬市民的飲水安全,與人民的生命健康密切相關[1]。因此,研究水庫水質參數變化,增強對水庫水質的監測與保護,實現對水體水質參數的快速反演尤為關鍵。
傳統的人工監測一般以實地采樣分析為主,雖可以較為準確地測得多種水質參數,但每期都要測量不僅費時、費力,且只能獲得點狀數據,所得數據在時間和空間上都不連續,無法滿足大范圍、實時的水質監測要求[2]。隨著遙感技術的快速發展及應用,給科研者提供了一種新的方法用以進行水質質量的監測研究。遙感方法反演水質參數是通過研究水體反射光譜特征以及水體指標濃度,選擇最佳光譜波段/波段組合與指標濃度進行最大程度的擬合。比起傳統的人工監測,遙感監測具備動態性、周期性和實時性等特性,十分適合光學特性復雜的內陸水體[3]。常規的遙感水質參數反演方法主要有經驗方法、半經驗法和半分析法[4]。侯佳妮[5]等基于 Landsat-5 TM影像數據和實測數據,采用經驗方法對二龍湖水質參數和敏感波段進行了擬合,建立了多元回歸模型。林劍遠[6]等基于航空和水表高光譜遙感數據,利用半經驗法對浙江省嘉興市主城區河網水質進行了監測。Hoogenboom 等[7]基于生物光學模型,運用矩陣反演的方法,對葉綠素和懸浮物濃度進行了反演。
從目前研究的內容、方法以及深度等方面來看,遙感技術應用于水質監測研究較為豐富,但大多數都為大型水庫湖泊或者海洋單因子監測,且多為國外的衛星遙感影像( 美國 Landsat-8、美國 Modis、歐洲 Sential- 2等)[8] 。與國外幾種衛星影像相比,高分一號衛星是國產高分辨率衛星,搭載了2 臺 2m 分辨率全色/8m 分辨率多光譜的高分辨率相機,突破高空間分辨率、多光譜與高時間分辨率結合的光學遙感技術,多載荷圖像拼接融合技術。其較高的空間分辨率在同步影像水體反射率提取時,使影像與實地位置匹配時會產生更小的誤差。此外,國家高分專項實施以來,高分一系列衛星陸續升空,形成了聯合組網,像GF-1BCD、GF-2、GF-6等與GF-1都有相似的光譜響應函數,在遙感反演模型應用時可以替換,這也使得聯合組網后的數據周期大大縮短,在光學條件允許的條件下,平均2天就重訪一次。目前,高分一號遙感影像應用于水庫多參數水質反演研究較少,而且是我國擁有的自主性數據,對我國科研和國土資源監測具有重大意義。
因此,本文以滁州市沙河集水庫為研究對象,利用高分一號影像數據和實測水質數據,進行波段/波段組合與水質指標的相關性分析,建立基于多元回歸和BP神經網絡的葉綠素a濃度和濁度模型,從而對研究區定量反演,得到葉綠素 a濃度和濁度分布圖用做水質分析,以期為滁州市沙河集水庫的水質監測和保護工作提供技術借鑒和決策依據[9]。
1 研究區概況及數據源
1.1 研究區域概況
沙河集水庫(圖1),位于安徽省滁州市沙河鎮,處在清流河的支流——大沙河,屬長江流域滁河水系。水庫以上流域面積300km2,占清流河面積的四分之一。沙河集水庫年均降水量為976mm,年均來水量0.78億m3,最大庫存2.11億m3,與周邊地區民眾的生活用水息息相關。
1.2 野外數據采集
1.2.1 主要儀器簡介? ? EXO2是一臺用于監測水質數據的多參數儀器。主機有7個傳感器接口(當中心接口被清潔刷占用時有6個接口可供使用)來獲取水質參數數據。每個傳感器通過多種的電化學、光學或物理檢測手段來測量各自的參數。使用 EXO2儀器前,已經進行一次精度校準。利用手機GPS軟件對采樣點經緯度坐標進行記錄。
1.2.2 野外水質數據采集 水樣采集時間為2021年6月11日。待船停穩,且湖面無波動時,借助已校正的 EXO2 多參數水質儀測定水面下 50cm 處葉綠素a濃度和濁度,為了避免其他測點水質影響,每次測量前,使用當前測點的水沖洗探頭,每個點的測定時間為 5 分鐘,隔段時間記錄水質參數濃度,每個點記錄五次,取五次記錄平均值代表該點的水質參數濃度,并記錄該點坐標,共記錄 22 個樣點。
1.3 遙感數據源及預處理
1.3.1 遙感數據源 兩期遙感影像來源于中國資源衛星應用中心(http://www.cresda.com/cn/),均為GF-1B PMS影像,衛星過境時間分別為2021年6月11日11點10分和2021年7月30日11點5分,全色波段2m,多光譜8m,云量分別為3%和1%,研究區的影像質量均較好。
1.3.2 遙感數據預處理
1.3.2.1 輻射定標 地物的電磁輻射在傳輸過程中會受到一些外在因素的影響(如太陽高度角、大氣),導致地物的真實輻射亮度值與傳感器所接收到的有差異。為了消除這種誤差,需要對衛星影像進行輻射定標。輻射定標是對地物輻射傳輸過程產生的變形進行校正,將影像的灰度值轉化為輻射亮度值[式(1)]。本次研究中高分影像的輻射定標是根據輻射定標參數在ENVI軟件中完成。
式中:Lλ為輻射亮度值,常用單位為W/(m2 μm sr);DN為像元灰度值,取值范圍在0-255,無量綱;Gain和Offset分別為增益和偏移值,單位和輻射亮度值相同。
1.3.2.2 幾何校正 由于傳感器內部(如自身構造)和外部(如高度、地形)因素共同作用,遙感影像產生幾何變形在所難免,從而使得遙感影像中真實的地理位置產生了偏差,這將導致與實測點位經緯度產生偏差,因此需要進行幾何校正對誤差進行修正。
1.3.2.3 大氣校正 大氣校正的目的是消除大氣和光照等因素對地物反射的影響,獲得地物反射率真實物理模型參數[式(2)]。本文運用 ENVI 的 FLAASH 模塊對研究區影像進行大氣校正。
其中,ρ為表觀反射率,L為表觀輻亮度,d為日地距離,ESUN為太陽平均輻射強度,θ為太陽天頂角。
1.3.2.4 水體提取 為了排除水體外地物的干擾,針對性監測沙河集水庫,需先提取沙河集水庫的水體范圍。在ArcGIS10.2中對水庫范圍進行矢量化提取,再對遙感影像進行裁剪處理,完成對研究區水體的提取。
1.3.2.5 采樣點反射率提取 將記錄的采樣點的 GPS 坐標導入 ENVI 5.3軟件,然后提取高分影像四個波段在采樣點的反射率值,以用于特征波段分析。
2 研究方法
目前,國內外遙感水質參數反演模型主要有經驗模型、半經驗模型和物理模型。經驗模型[10]是目前應用最廣泛的水色遙感反演方法,其是通過直接建立水質參數和遙感反射率之間的統計關系來進行水質參數的反演。半經驗模型[11]是利用高光譜數據在對水體光譜特征進行深入分析的基礎上,先選擇合適的波段或波段組合,再建立水質參數與遙感反射率之間的關系。物理模型[12]是基于輻射傳輸模型描述光在大氣和水體中的傳播過程,基于生物光學模型描述水體光譜與水質參數之間的關系,然后從遙感影像中反演得到水質參數。物理模型雖不需大量實測數據,可移植性強,但物理參數多而復雜,構建困難,應用極少;半經驗模型雖簡單便捷但依托的高光譜數據大多是通過無人機遙感和光譜儀測量所得,數據獲取并不簡單;而本文所使用的經驗模型雖不像物理模型可移植性強,但構建簡單、應用廣泛、技術成熟,在研究區域仍有較高的反演精度,而BP神經網絡作為一種智能算法更能有效提高精度。
2.1 特征波段及波段組合提取
大量研究[13-15]表明遙感影像波段/波段組合與水質指標之間具有較好的相關性,相關性是衡量兩個變量因素的相關密切程度,相關性越高兩者關聯性越高。因此,水質參數反演模型的構建需要先提取特征波段。將22個實測樣本劃分為訓練樣本和驗證樣本兩部分,比例滿足為3∶1,劃分的樣本都應盡量均勻分布于研究區。通過GF-1影像預處理后提取的四個波段反射率,根據顧清[16]提出的59種波段/波段組合,計算訓練樣本實測值與對應位置波段/波段組合的 Pearson 相關系數[17],尋找出與水質指標相關性較高的波段組合,結果如表2如示。
表中記錄了本文中所使用的高分一號四個波段(b1、b2、b3、b4)經過各種組合與葉綠素a濃度和濁度的相關系數,該數值小于0代表負相關,大于0代表正相關,該值的絕對值越接近1表明兩者相關性越高。因此,為了后續遙感反演模型的精度能夠更優,篩選了相關性最高3個波段組合綜合分析,用于回歸擬合,再進一步對擬合函數優選。與葉綠素a濃度和濁度相關性較高的前三個波段組合以及相關系數已在表中著重標識。
2.2 多元回歸模型
2.2.1 葉綠素a濃度反演模型 從2021年6月11日22個實測水質數據中選擇16個訓練樣本,篩選葉綠素a濃度相關性最高的3個波段組合作為自變量,對遙感波段組合與葉綠素a濃度進行回歸擬合,包括線性回歸模型(一元)和非線性模型(如二次多項式、指數等)。模型和決定系數如表3。
2.3 BP神經網絡
BP 神經網絡是一種多層的前饋神經網絡,網絡結構大于等于三層,分為輸入層、隱含層和輸出層,而隱含層通常包含若干層[18]。每層都包含若干個節點。本次實驗輸入層節點為相關性較高的波段,葉綠素的網絡模型輸入節點為b1、b2、b4,濁度的網絡模型輸入節點為b1、b2、b3、b4,輸出層節點為水質參數指標,通過隱含層正向和逆向不斷進行誤差修正,得到期望輸出值。隱含層的取值范圍滿足公式(5),通過不斷實驗選擇最佳隱含層節點。網絡訓練中將樣本按70%訓練樣本、15%驗證樣本、15%測試樣本劃分,還需要設置一些參數,根據前人經驗將學習速率設置為0.001,迭代次數為1000,訓練函數為Levenberg-Marquardt。經過大量實驗分析,確定葉綠素模型結構為3-10-1,濁度模型結構為4-11-1。
式中:p為隱含層節點數,n為輸入層節點數,m為輸出層節點數,a為取值范圍1-10的常數
訓練結果如圖4、圖5所示。得到葉綠素反演值與真實值滿足:反演值=0.71 真實值+1.3;濁度反演值與真實值滿足:反演值=真實值-0.19。
2.4 精度評價
根據葉綠素a濃度和濁度的實測值與反演值,進行精度評價。具體采用均方根誤差和相對誤差的方法。模型計算的數值代表反演值,地面實測水質濃度值代表真實值。均方根誤差計算如式(6),相對誤差計算如式(7):
經式(6)和(7)計算多元回歸模型的葉綠素a濃度和濁度的均方根誤差分別為0.745、0.216,平均相對誤差為13.19%、7.09%;BP神經網絡模型的葉綠素a濃度和濁度的均方根誤差分別為0.103、0.19,平均相對誤差為2.5%、7.11%。
多元回歸模型反演精度雖然還可以,由表7可以看出BP神經網絡的RMSE和R2均優于多元回歸模型;平均相對誤差而言,BP神經網絡中葉綠素a濃度較優,濁度兩種模型差不多。總體來說,BP神經網絡反演精度更高。
3 結果與分析
3.1 結果
基于GF-1衛星影像,通過反演模型定量化反演2021 年 6月、7月沙河集水庫水質參數(葉綠素、濁度),得到葉綠素 a濃度和濁度分布圖,由圖6、7、8、9可以看出:
(1)6月份沙河集水庫葉綠素a濃度值集中在2.2~5.6ug/l之間,均值為4.5ug/l。水庫西南部和東北部葉綠素a濃度較高,約在2.5~5.6ug/l之間,中部葉綠素a濃度較低,約在2.2~2.5ug/l之間,呈現兩端高中間低。濁度值集中0~4NTU之間,庫區均值為1.16NTU。濁度分布與葉綠素a濃度相反,呈現兩端低中間高。
(2)7月份沙河集水庫葉綠素a濃度值集中在1.8~6.7ug/l之間,均值為3.25ug/l。水庫西南部到東北部葉綠素a濃度逐漸降低。濁度值集中0.5~4.6NTU之間,庫區均值為2.46NTU。濁度分布,呈現兩端低中間高。
3.2 分析
(1)6月份水庫葉綠素a濃度呈現兩端高中間低,可能原因是兩端存在較多的學校、工廠等一些公共設施,頻繁的人類活動,生產和生活垃圾的排放,使得流動性較差的水域兩端受到影響較大,中部影響較小。理論上,葉綠素a濃度越大代表浮游生物越多,大量的浮游生物尸體在微生物作用下會產生腐殖質,會影響水體渾濁度。由于水庫本身葉綠素含量就特別低,水質也比較好,對濁度的影響微乎其微,更多的原因可能是兩端區域由于離陸地的距離較近,一些垃圾排放到水庫時,岸邊的水域能得到及時治理,而經過水體流動中心區域越積越多,又不能及時治理導致兩端低中部高。
(2)7月份水庫葉綠素a濃度從西南部到東北部葉綠素a濃度逐漸降低,可能是夏季雷雨天氣增多,水體流動性增加,水庫西南是狹長的入水口,匯聚了生產和生活垃圾隨著水流逐漸降低。濁度呈現兩端低中間高,由于水流攜帶的泥沙、渾濁物等逐漸減緩,中部沉積物較多。
(3)對比6、7月份葉綠素 a 濃度和濁度,7月葉綠素 a 濃度整體較低,濁度較高。主要原因是7月溫度升高,雨水增多,浮游植物還未開始大量繁殖,因此葉綠素 a 濃度較低,而水流夾雜的泥沙、腐殖質等使得濁度偏高。
(4)根據葉綠素 a 的富營養化分級標準[19-20],6、7月份水庫均處于中營養化狀態,Ⅱ類水質標準(表8)。GB5749-1985 《生活飲用水衛生標準》規定水質檢測中濁度不超過3.0NTU,天然水和飲用水特殊情況不超過5.0NTU,所以整體也符合飲用水源標準。
4 結語
本文對多元回歸和BP神經網絡模型進行了對比,并利用高分一號衛星影像對沙河集水庫的葉綠素a濃度和濁度定量反演,結論如下:
(1)模型精度方面,對葉綠素和濁度進行多元回歸模擬的RMSE分別為0.745、0.216,R2為0.694、0.844,平均相對誤差為13.19%、7.09%,BP神經網絡模擬的RMSE分別為0.103、0.19,R2為0.865、0.958,平均相對誤差為2.5%、7.11%。兩者對沙河集水庫水質反演都具有可行性,但BP神經網絡要優于多元回歸。
(2)遙感衛星影像反演方面,沙河集水庫整體水質較好,達到Ⅱ類水質標準。濁度在0~4.6NTU之間,總體達到了飲用水源標準。
總之,模型能夠較好地反演沙河集水庫水質分布情況,滿足一定的精度要求,表明了國產高分衛星影像用于水質參數反演的可行性。同時給滁州市沙河集水庫的水質監測提供了一種可行的方法,可為預防及治理水環境污染提供參考。但因實驗條件限制,采樣點的數量和水質季節性差異對該模型存在一定程度影響,BP神經網絡存在一定“過擬合”,為了使模型更具科學性,未來可考慮提升模型的復雜性,增加多期實測數據,更加客觀地進行水質反演。
參考文獻:
[1] 馬豐魁,姜群鷗,徐藜丹,等.基于BP神經網絡算法的密云水庫水質參數反演研究[J].生態環境學報,2020,29(3):569-579.
[2] 馬方凱,高兆波,葉幫玲.基于高分遙感衛星影像的湯遜湖水質遙感反演[J].水資源開發與管理,2021(5):69-75.
[3] 陶然,彭金嬋,張豪,等.內陸水體葉綠素a濃度遙感反演模型綜述[J].民營科技,2018(12):97-98.
[4] CARDER K L,CHEN F R,LEE Z P,et al. Semianalytic moderate-resolution imaging spectrometer algorithms for Chlorophyll-a and absorption with bio-optical domains based on nitrate-depletion temperatures[J].Journal of Geophysical Research-Oceans,1999,104( C3) : 5403-5421.
[5] 侯佳妮. 二龍湖水質參數特性與遙感反演研究[D].長春:東北師范大學,2013:40-45.
[6] 林劍遠, 張長興, 航空高光譜遙感反演城市河網水質參數[J]. 遙感信息, 2019,34(2): 23-29.
[7] HOOGENBOOM H J,DEKKER A G,DEHAAN J F. Retrieval of chlorophyll and suspended matter from imaging spectrome try data by matrix Inversion[J]. Canadian Journal of Remote Sensing,1998,24(2):144-152.
[8] 鄭炎輝,張園波,何艷虎.基于GF-1 WFV影像與神經網絡模型的水庫水質多參數反演研究[J].人民珠江,2020,41(7):57-62+84.
[9] 劉靜. 鄱陽湖水質參數遙感反演及富營養化評價[D].贛州:江西理工大學,2020:1-9.
[10] 張克,張凱,牛鵬濤,等.遙感水質監測技術研究進展[J].現代礦業,2018,34(11):171-174+202.
[11] 種丹,李浩杰,范碩,等.基于MODIS數據的云南九大高原湖泊葉綠素a濃度反演[J].生態學雜志,2017,36(1):277-286.
[12] GORDON H R,BROWN O B,JACOBS M M. Computed relation ships between the inherent and apparent optical properties of a flat homogeneous ocean[J]. Applied Optics,1975,14(2):417-427.
[13] 肖青,聞建光,柳欽火,等.混合光譜分解模型提取水體葉綠素含量的研究[J].遙感學報,2006(4):559-567.
[14] 曹引,冶運濤,趙紅莉,等.內陸水體水質參數遙感反演集合建模方法[J].中國環境科學,2017,37(10):3940-3951.
[15] 胡輝輝. 基于多源遙感數據的白洋淀水質參數估算研究[D].鄭州:鄭州大學,2020:1-54.
[16] 顧清. 浙江省飲用水水庫水質演變及風險評價研究[D].杭州:浙江大學,2014:33-35.
[17] 李大千. 鄱陽湖葉綠素a濃度遙感反演研究[D].贛州:江西理工大學,2016:36-40.
[18] 張宏建,王冰,周健,等.基于BP神經網絡的內陸河流水質遙感反演[J].華中師范大學學報(自然科學版),2022,56(2):333-341.
[19] 高陽俊, 曹勇, 趙振,等. 基于葉綠素a分級的東部湖區富營養化標準研究[J]. 環境科學與技術, 2011(S2):3.
[20] 梁偉林,白金平,李玉霞,等.基于高分衛星數據的龍泉湖水質富營養化分析與評價[J].地質災害與環境保護,2016,27(2):57-62.
Abstract:Shaheji Reservoir is an important source of water supply in Chuzhou City, and it is related to the safety of drinking water for citizens. The monitoring of water quality changes has received great attention from the government. The inversion of water quality parameters through remote sensing images has very important theoretical significance for the monitoring and protection of reservoir water quality. Therefore, the chl- a concentration and turbidity model based on multiple regression and BP neural network was established using GF-1 images in June and July 2021 and the synchronized measured water quality data, to explore the distribution of water quality in reservoirs. Conclusion: in terms of model accuracy, the RMSE of multiple regression simulation of chl-a and turbidity are 0.745 and 0.216 respectively, and R2 is 0.694 and 0.844 respectively,the average relative error is 13.19%, 7.09%; The RMSE simulated by BP neural network is 0.103 and 0.19 respectively, and the R2 is 0.865 and 0.958,the average relative error is 2.5%, 7.11%. Both of them are feasible for the inversion of water quality of Shaheji Reservoir, but BP neural network is better than multiple regression; from the perspective of water quality remote sensing inversion, the chl-a concentration of Shaheji Reservoir in June 2021 is between 2.2~5.6ug/l, the chl-a concentration in July is between 1.8~6.7ug/l, both of which are in the mesotrophic state, and the water quality is Class II. The turbidity in June is between 0~4NTU, with an average value of 1.16NTU, and the turbidity in July is between 0.5~4.6 NTU, the average value of the reservoir area is 2.46NTU, which generally meets the drinking water source standard.
Key words:Shaheji Reservoir; GF-1; chl- a concentration; turbidity; remote sensing inversion
(責任編輯:鞏 劼)