章佩麗 宋亮楚 王 昱 宋小晴 古兵華
(臺州市污染防治工程技術中心,浙江 臺州 318000)
傳統河道監測手段多樣,但一般監測成本高、耗時長、同步性差[1]。遙感技術因其高效及可大面積觀測等優勢被廣泛應用于水質監測中[2]。最初的遙感水質監測針對的是大型水域,如MERIS、MODIS等中分辨率衛星傳感器廣泛應用于內陸大型水域水質監測[3],隨著衛星產品的不斷發展,目前逐漸使用高分辨率傳感器監測水質,常見的遙感數據包括Landsat、Sentinel-2A等[4]。得益于遙感水質監測研究的不斷深入,可監測水質參數逐漸從水色參數擴展到非水色參數[5]。然而,衛星遙感技術在時間、空間和光譜分辨率之間相互矛盾,對城市河流水質的監測仍具有挑戰[6]。
隨著無人機技術的發展,配備不同類型傳感器的無人機可以獲得豐富的遙感圖像,從而成為水質遙感的新方向[7]。尤其在水質成分復雜的狹窄河道(如城市河流),無人機遙感技術可以實現水質采樣點實測數據的集合,獲得豐富而全面的水質現狀和空間分布信息,促進高效、高質量的城市河道水質監測和保護[8]。水質參數的傳統反演模型基于遙感數據的統計回歸分析[9],通過波段組合尋找敏感波段作為特征變量來預測水質參數,從而獲得更好的反演結果,具體回歸方法包括線性回歸、多項式回歸、主成分分析(PCA)等[10]。劉彥君等[11]1241-1249使用無人機多光譜影像基于線性與非線性回歸模型,對浙江農林大學東湖的總磷(TP)進行反演,決定系數(R2)達到0.782 9;JIANG等[12]利用無人機高光譜數據采用Extra Trees回歸,構建總氮(TN)濃度反演模型,反演得到極低的均方根誤差;CHEN等[13]將無人機多光譜影像應用于城市河流典型河段水質監測,采用遺傳算法極值梯度提升法進行建模,TP、TN反演結果的R2分別為0.699、0.787。目前,針對無人機多光譜水質參數反演的研究多是集中于特定時間且特定研究區的水質參數反演,鮮有報道涉及不同區域且不同時段的模型構建。
鑒于此,本研究選取臺州市水質差異明顯的兩條河道作為研究區域,利用無人機獲得高分辨率多光譜圖像,結合多元線性回歸算法構建高錳酸鹽指數、TP和TN的單河道反演模型和雙河道綜合反演模型,并驗證模型的穩定性和適用性,嘗試構建適用于不同河道的通用模型,研究結果可為實時診斷水體狀況提供理論基礎和關鍵技術。
臺州市水系發達,具體細分為金清河網、椒北河網、椒江水系、三門河流、玉環河流五大水系。據《2020年臺州市水環境質量報告》顯示,椒北河網水質良好,滿足水功能要求,但金清河網存在不能穩定達標情況,因此綜合考慮臺州市水系特征后,分別于椒北河網、金清河網各選取1條河流進行水質監測,分別為椒北干渠和三條河。于2021年1月18日在臺州市椒江區椒北干渠布設53個采樣點采集水體樣品,于2021年4月20日在臺州市路橋區三條河布設63個采樣點采集水體樣品,形成一個水質多樣化的樣本集合。按照《水和廢水監測分析方法(第四版)》規定進行采集、運輸、儲存和分析水樣,隨后進行高錳酸鹽指數、TN和TP參數的測定。
相對衛星遙感,無人機多光譜影像處理過程較為簡單,因此將獲取的多光譜數據導入大疆智圖軟件中進行影像拼接,同時利用黑白板進行輻射校正后即可得到光譜反射率數據[11]1243,將波段1至波段5的光譜反射率分別記為b1~b5。根據每個采樣點的經緯度坐標,使用ArcMap 10.8提取每個采樣點的多光譜反射率數據。
對以往水質遙感反演研究中使用較多的多光譜波段組合公式進行篩選[14],選定對高錳酸鹽指數、TP和TN較為敏感的波段及波段組合進行模型構建,采用PCA去除異常數據后,挑選70%樣本數據作為建模集,30%作為驗證集構建水質參數濃度反演模型,采用平均相對誤差(ARE)、均方根誤差(RMSE)、相對均方根誤差(rRMSE)來評價反演模型精度。
受光照、飛行速度、風速等客觀因素影響,部分光譜數據存在異常,導致整體數據相關性不足,因此采用PCA對每個采樣點的理化特征和光譜數據整體結構進行探索性分析,根據95%的置信橢圓去除異常數據,剩余樣本數為108。
由椒北干渠和三條河水樣的實際監測數據,兩條河流的水質特征具有一定的差異(見圖1),但同一條河流中的高錳酸鹽指數、TP和TN的變化波動相對較小。對兩條河流水質參數進行Person相關性分析,結果表明椒北干渠的高錳酸鹽指數、TP和TN顯著低于三條河(P值均小于0.05)。根據《地表水環境質量標準》(GB 3838—2002),椒北干渠水質總體優于三條河水質,其中椒北干渠高錳酸鹽指數、TP、TN分別集中在Ⅲ類、Ⅲ類和Ⅴ類標準,而三條河高錳酸鹽指數、TP、TN則分別集中在Ⅳ類、Ⅴ類和劣Ⅴ類標準。
椒北干渠和三條河對5個波段的光譜反射率均存在顯著差異(見圖2),P值均小于0.01。鑒于椒北干渠和三條河水樣水質顯著不同,因此原始光譜反射率的顯著差異可能是由于水質空間分布差異較大所致。
2.3.1 相關性計算
高錳酸鹽指數、TP和TN為非水色參數,與單光譜反射率間的相關性一般,無法確定相關性高的敏感波段,可采用波段的和、差、比值等組合方式有效放大這些參數的光譜特征[15],因此本研究對5個波段進行組合運算來篩選與高錳酸鹽指數、TP及TN敏感性高的光譜特征。將水質參數與構建的光譜參數進行Person相關性分析,當P值小于0.05時,表明水質參數與光譜參數顯著相關,據此篩選出符合要求的光譜組合共23組,具體見表1。
水質參數反演模型大多基于統計回歸構建,為減少模型變量并提高模型精度,嘗試將23組光譜參數進行PCA降維得到10個主成分,其中主成分1、2、3、4的方差貢獻率分別為63.2%、33.9%、1.8%、0.6%,合計能反映原始數據99.5%的信息,因此剔除主成分5~10,將主成分1、2、3、4的特征值(分別記為Z1、Z2、Z3和Z4)作為自變量,分別構建高錳酸鹽指數、TP及TN的主成分多元線性回歸(PCA-MLR)模型。為了對比PCA-MLR模型與多元線性回歸(MLR)模型的反演效果,選取原始光譜反射率(b1~b5)作為自變量,分別構建高錳酸鹽指數、TP及TN的MLR模型。
?呂芳上:《蔣介石:一個“繼承性創業者”初期人際網絡的建立》,載汪朝光主編《蔣介石的人際網絡》,社會科學文獻出版社2011年版,第23頁。
2.3.2 基于椒北干渠數據的單河道反演模型
根據2021年1月18日椒北干渠光譜影像和檢測數據,為不同水質參數建立單河道水質參數遙感反演模型,模型反演精度見表2。
由表2可見,采用兩種模型對椒北干渠驗證集數據進行反演時,MLR模型高錳酸鹽指數、TP和TN的ARE、RMSE及rRMSE總體均小于PCA-MLR模型,說明MLR模型的反演精度優于PCA-MLR模型;將兩種模型應用于2021年4月20日三條河遙感影像,對照三條河實際水質參數檢測結果進行反演精度檢驗,僅高錳酸鹽指數的ARE為10%左右,可能兩條河流高錳酸鹽指數的濃度差別不大,但TP和TN的ARE均超過40%,RMSE及rRMSE也大幅上升,因為兩條河流的TP和TN濃度差異明顯。可見,基于椒北干渠單河道數據構建的反演模型無法用于三條河水質預測,缺乏適用性和通用性。
2.3.3 基于雙河道集合數據的綜合反演模型
將基于椒北干渠單河道數據構建的反演模型應用三條河遙感光譜反演時,由于兩條河流的污染物濃度差異明顯模型通用性差。為此,根據2021年1月18日椒北干渠和2021年4月20日三條河采樣數據,建立普遍適用于雙河道水質的綜合反演模型,模型反演精度見表3。

表1 光譜組合與高錳酸鹽指數、TP、TN的相關系數1)Table 1 Correlation coefficients between spectral composition and permanganate index,TP and TN

表2 基于單河道數據反演模型的水質反演精度Table 2 Inversion accuracy of water quality parameters by single-river data based inversion model
總體看來,基于雙河道集合數據構建的兩種綜合反演模型中,MLR綜合模型的反演精度優于PCA-MLR綜合模型,與單河道反演模型結論一致。可能是由于MLR方法能夠保證原始光譜之間的差異最大化,PCA-MLR方法中光譜參數的增加反而提高了數據的冗雜性,導致精度降低。此外,增加三條河樣本集數據后,MLR綜合模型并未大幅降低對椒北干渠驗證集的反演精度,但三條河驗證集各水質參數的ARE、RMSE及rRMSE均大幅降低,說明樣本集的增加總體可提高模型的準確度。

表3 基于雙河道集合數據的綜合反演模型精度Table 3 Inversion accuracy of water quality parameters by double-river set data based comprehensive inversion model
2.4.1 反演精度驗證
選擇基于雙河道集合數據構建的MLR模型作為水質參數的最終反演模型,利用32組驗證集數據進行高錳酸鹽指數、TP、TN實測值與模型估測值的線性擬合,結果見圖3。由圖3可見,高錳酸鹽指數擬合線的斜率為0.572,R2為0.779 2;TP擬合線的斜率為0.693 5,R2為0.788 2;TN擬合線的斜率為0.760 2,R2為0.823 2;3個水質參數驗證集數據點位總體與1∶1趨勢線貼近,說明模型估測水平較為平穩,估測值與實測值接近,可用于對臺州市部分水域的水質參數空間分布狀況進行估算。
2.4.2 模型估測結果分析
根據實際應用需求,采用基于雙河道集合數據構建的MLR模型對椒北干渠和三條河中水質為Ⅲ類及更差水樣數量進行估測,模型反演精度見表4。該模型對高錳酸鹽指數、TN的水質類別反演精度較高,分別為94.4%和83.3%,TP反演精度較低,僅為61.0%,可能是因為TP不僅會受到水中浮游生物的生長繁殖影響,同時會受到懸浮物的吸附、遷移等影響,光學特征不明顯;雖然TN水質類別反演精度高達80%以上,但21個Ⅴ類水樣中僅反演正確3個,說明本次構建的模型具有一定局限性,只在一定TN濃度條件下適用性較強。

表4 水質類別反演精度Table 4 Inversion accuracy for water quality parameters category
(1) 與PCA-MLR模型相比,MLR模型對水質參數反演精度相對更高,可能是由于MLR方法能夠保證原始光譜之間的差異最大化,PCA-MLR方法中光譜參數的增加反而提高了數據的冗雜性,導致精度降低。
(2) 基于椒北干渠的單河道MLR反演模型無法用于三條河水質預測,缺乏適用性和通用性;而基于雙河道集合數據的MLR綜合模型雖并未大幅降低對椒北干渠驗證集的反演精度,但對三條河水質參數的反演精度大幅提高,說明樣本集的增加總體可提高模型的準確度。
(3) 為了提高模型對水質參數的反演精度,未來可以通過對臺州市水質特征明顯的多個河道進行水體采樣,從而構建更大范圍、更多區域的光譜數據樣本集,以期建立更精確、通用性更強的多光譜反演模型。