肖臣稷,王 卿,王 敏,阮俊杰,陳 敏,丁 玲,黃沈發,
(1.東華大學 環境科學與工程學院,上海 201620;2.上海市環境科學研究院,上海 200233;3.中國長江三峽集團有限公司,北京 100038;4.上海勘測設計研究院有限公司,上海 200335)
水體葉綠素a的濃度是表征水體富營養化水平的重要指標之一。隨著衛星遙感技術的發展,基于多光譜或高光譜衛星遙感影像開展水體葉綠素a濃度的遙感反演已取得顯著進展,并發展出標準藍綠比值法[1]、紅外比值法[2]、歸一化葉綠素指數(NDCI)法[3]、三波段模型[4]、四波段模型[5]、正交函數分析[6]等算法。這些反演模型中,半經驗方法占據主導地位,經驗方法次之,分析法在應用中使用得較少[7]。
高光譜遙感技術的快速發展使得高光譜遙感影像在水色反演中得到越來越多的應用。研究表明,基于高光譜遙感影像的水色反演精度比基于多光譜遙感影像的高,這是因為多光譜影像波段少且間距寬,難以準確選擇敏感波段。開展高光譜遙感水色反演則可實現精確選用對反射率敏感的特定波段的算法,如特征峰[8]、生物光學模型[9]等,以及基于連續光譜的一階導數光譜[10]等算法,還可通過迭代優化[11]等方法進行處理。
Kratzer等[12]研究表明,使用衛星遙感進行葉綠素a濃度的反演對傳感器的空間分辨率有著明確的要求。高分五號衛星是我國于2018年5月9日發射的首顆高光譜綜合觀測衛星,運行于太陽同步軌道。其光譜分辨率既高又全,在0.4~2.5 μm內具有330個波段,光譜分辨率最高可達0.03 cm-1,光譜定標精度最高可達0.008 cm-1,還具有30 m的空間分辨率與60 km的幅寬[13]。這些性能足以滿足對葉綠素a濃度進行反演的基本要求,并且韋安娜等[14]已經應用高分五號衛星的遙感數據在內陸水體中對葉綠素a濃度進行反演。
長江河口及其鄰近海域是我國富營養化水平最高的海域,其中長江口的富營養化指數為5~6[15],呈現出中重度的富營養化[16]。這是因為長三角城市群的興起使得人口劇增,導致城市生活污水、工農業污染的排放量不斷增加,大量污染物被排放到長江中,致使生態環境惡化[17]。基于高分五號衛星高光譜影像提取長江河口水體的表面反射率,結合實際采樣數據進行數學建模,遙感監測研究長江河口的水質,旨在為高分五號衛星多光譜遙感的應用找到方法,為高分系列衛星的高光譜遙感在更大時空尺度中的推廣應用提供案例,以及為長江口環境監測與保護提供技術支撐。
長江河口位于上海市北部,起自江蘇江陰鵝鼻嘴,止于入海口的雞骨礁,長約232 km。其經緯度為東經120.2°~122.3°、北緯30.8°~32.2°,包含崇明島、長興島、橫沙島等島嶼與多個沙洲。區域內徑流大、輸沙量多、余流速度較大,物理化學環境受潮汐作用及上游來水等水文條件交匯混合的復雜影響。
由于長江口水動力較強,水色變化相對較快,為保證遙感數據與現場數據的一致性,現場監測在衛星經過時同步開展。通過查詢衛星軌道數據,計算得出衛星過境時間為2019年5月24日13時,衛星過境時刻及其前后5 min各進行一次現場采樣,根據HJ 897—2017《水質 葉綠素a 的測定 分光光度法》進行檢測,并將3組數據的平均值作為測量值。由于長江河口的水域可達性較差,為獲得較多的點位數量,同時選取部分河流、湖泊的點位進行采樣。共獲得9個點位,各點位的經緯度及實測葉綠素a濃度cchl-a如表1所示。

表1 采樣點經緯度及實測葉綠素a濃度
使用的高分五號衛星影像的基本情況如表2所示。其中,影像L1_60372_GF5_2874264同時用于樣點數據選取及后續反演,影像L1_60371_GF5_2874334及L1_60373_GF5_2874323僅用于選取樣點數據。

表2 高分五號衛星影像的基本信息Table 2 Basic information of GF-5 satellite images
影像數據預處理包括地理校正、輻射定標、大氣校正及半手工水體提取。選取5~10個地面控制點(ground control point, GCP),采用亞米級差分GPS現場測量地理坐標,選用polynomial二階校正模型進行幾何精校正。使用ENVI 5.3軟件中Radiometric Correction的子工具Radiometric Calibration將高分五號衛星影像數據包中的輻射定標參數代入影像后即完成輻射定標。采用FLAASH進行大氣校正。圖1為處理前和大氣校正后的長江河口影像。在提取可見-近紅外波段差值的閾值基礎上,手動操作去除易與人工建筑光譜混淆的河流、湖泊,以實現水體的提取。根據實際采樣點的經緯度,在ENVI 5.3軟件中提取各點位的水體光譜數據(見圖2)作為反演模型的輸入參數。

圖1 預處理前后的遙感影像Fig.1 Remote sensing images before and after preprocessing

圖2 各點位的光譜數據Fig.2 Radiation data of each point
基于常規的數學反演方法,采用數種代數模型通過計算機篩選不同波段組合方式中決定系數R2最大的波段組合。根據實測的葉綠素a濃度分布情況,選用指數形式作為代數模型的基本形式,通過改變中間參數X即波段組合方式實現模型的差異化處理。
cchl-a=CeAX+B
式中:X為中間參數,是數個波段經一定方式的組合;A、B、C為待定系數。利用計算機根據窮舉法初步列舉各種波段組合中各項波段組合參數與葉綠素a濃度的相關性,選取各模型中相關性最強的波段組合參數及實測cchl-a推算待定系數A、B、C。
1.3.1 簡單的波段組合參數
所使用的波段組合方式包括任意兩個波段的差值與比值的經驗參數,如式(1)和(2)所示。
X=R1-R2
(1)
X=R1/R2
(2)
為提升反演精度并降低水體其他參數的干擾,在式(1)和(2)的基礎上組合得到如式(3)和(4)所示的組合參數。
(3)
X=(R1-R2)+(R3-R4)
(4)
式中:Rn為在該組合方式中使用的第n個波段的反射率。
1.3.2 基于生物光學模型的波段組合參數
基于生物光學模型構建算法屬于分析或半分析法。相關算法的波段組合參數如下:
Mishra等[3]提出的NDCI法的中間參數如式(5)所示,該算法也可用于監測水體的葉綠素a濃度。
X=(R1-R2)/(R1+R2)
(5)
邢前國等[18]使用的反射谷算法的中間參數如式(6)所示。該算法可在降低其他水體參數的干擾下研究葉綠素a特征吸收峰對整體光譜的影響。
(6)
式中:λn為在該組合方式中使用的第n個波段的波長。
Dall′Olmo等[19]在Gitelson等[4]的基礎上改進得到三波段模型,該模型通過一定假設消去了除色素顆粒物吸收以外的光學參數,得到色素顆粒物對光的吸收率與3個波段反射率的關系,將該關系作為中間參數,如式(7)所示。
(7)
Le等[5]提出四波段模型,其將各種物質的吸收系數和反射系數代入遙感反射率的光學方程得到組合參數,如式(8)所示。陳軍等[20]研究指出,4個波段應在波長660~750 nm內選取。
(8)
反演評價體系包括反演模型的統計學參數分析、反演結果影像分析、誤差穩定性分析等3方面,其中,統計學參數分析作定量分析,后兩者作定性分析。使用SPSS 20.0軟件計算統計學參數。用決定系數R2表征自變量對目標變量的解釋程度;用平均相對誤差與均方根誤差ERMSE表征模型的準確性;用F統計值及其檢驗概率P判斷模型的顯著性,采用的閾值α=0.005。反演結果影像分析包括圖像判讀和云陰影分析。云陰影分析利用部分影像中的陰影區域整體光照強度弱于其他區域,且難以通過其他已知參數進行穩定計算的特征,對西北側距離陳行水庫較近的一處陰影區域(見圖3)進行判讀。若某一模型在該區域內的反演結果與其他區域存在明顯差異,表明該模型受光照條件的影響較大,反之,受不確定因素的影響較小。

圖3 云陰影位置Fig.3 Position of cloud shadow
誤差穩定性分析中,為輸入參數的反射率添加隨機誤差可近似模擬微小隨機擾動對反演模型的影響。隨機生成在[0.95,1.05]內均勻分布的隨機變量作為倍率與實際反射率相乘,得到一個與實際反射率有微小差距的模擬反射率,基于模擬反射率使用各種代數模型進行反演得到模擬反演結果。將全部研究區域的模擬反演結果與實際反演結果的比值輸出為圖像。
利用8種中間參數構建的代數模型如表3所示。

表3 基于8種中間參數構建的代數模型Table 3 Models built by eight intermediate parameters
8種代數模型的反演結果與實際結果如圖4所示。由圖4可知:模型f、g、h的葉綠素a濃度反演結果最接近實測結果;模型a~e中明顯有數個點與直線的偏離程度較大,其中模型a在低葉綠素a濃度下擬合精度較好,但在葉綠素a濃度較高時誤差極大,說明模型a難以應用于葉綠素a濃度較高的環境。

圖4 8種代數模型的葉綠素a濃度反演數值與實測數值對比Fig.4 Comparison of inverse values of chlorophyll-a concentration by eight algebraic models and the test results
遙感反演的葉綠素a濃度的整體分布如圖5所示。由圖5可知:模型b、c、e、g的葉綠素a濃度分布總體處于正常水平,且反演濃度大致為模型b>模型e>模型g>模型c。模型a、d、f在部分水域反演得到的葉綠素a濃度顯著高于其他模型,且與實際認知不符,說明這4種模型還需作進一步檢驗與調整。模型h在九段沙附近反演得到的葉綠素a濃度明顯比其他模型高,說明模型h的反演結果在能觀察到底泥的淺水中會受底泥的干擾。模型b、e的反演結果中有大量較為明顯的噪點,模型h也在一定程度上出現噪點。因這些模型主要是基于比值得到的,可見以比值為基礎的代數模型在應用中還需作進一步調整。但同樣基于比值的模型c未出現噪點。

圖5 利用8種代數模型反演的葉綠素a濃度分布Fig.5 Distribution of chlorophyll-a concentration inversed by eight algebraic models
8種代數模型的統計學參數如表4所示。由表4可知:隨著使用的波段數的增多,模型整體精度逐漸提高。模型a除平均相對誤差外的各項參數均最低,但進一步計算發現,模型a在葉綠素濃度低于20 μg/L時的反演精度為R2=0.975 7,F=201.111,P=3.13×10-5,說明模型a的應用仍有一定可行性。模型b的平均相對誤差明顯較高,這是由該模型在低濃度下有一個點的反演結果相對誤差極高所導致的,表明該模型可能難以在低葉綠素a濃度水體中應用。模型h具有最高的R2與F統計值以及最低的均方根誤差,模型d、f的這兩項指標同樣較高;但模型d、f、h的反演結果圖存在一定缺陷(見第2.1節),這可能是由影像信號的極小誤差以及過擬合所導致的;模型c、e的精度統計結果相對較低,同時反演結果圖的整體分布則更符合實際。因此c、d、e、f、h模型的應用可行性還需進一步判定。模型g的平均相對誤差最低,其他精度評價指標在所有模型中表現良好,整體反演結果也較為理想。

表4 各模型反演結果的統計學參數(n=9)Table 4 Statistical parameters of each model(n=9)
將研究結果與文獻[21-24]進行對比,結果如表5所示。由表5可知,與使用其他數據源的同種模型相比,使用高分五號衛星遙感數據構建的模型具有更高的R2和更低的平均相對誤差(波段比值模型對比結果除外),說明高分五號衛星數據相較于其他數據來源具有明顯優勢。

表5 基于不同數據源的反演精度比較
圖6為各個影像截取的中西北側部分受云陰影影響的區域。由圖6可知:模型a、b、g在陰影區域內的反演數值明顯比其他區域高,即空間光照對這3種模型的影響較為明顯,表明使用模型a、b、g時,每次反演都要重新確定光照條件,且當同一影像包含光照條件不同的區域時也需手動修正,這對實際操作提出更高的要求。模型f在該區域出現反演數值疑似偏低的結果,說明模型f還需進一步優化。模型c、d、e、h受云陰影影響時反演結果未發生顯著變化,說明環境光照變化不大時,這4種模型受環境光照的影響較小,有較高的泛化潛力。但Hu[25]研究發現,模型c也會因受到云量以及太陽耀斑等因素的影響而出現誤差。

圖6 云陰影對8種代數模型反演結果的影響Fig.6 Effect of cloud shadow on inversion results of eight algebraic models
各模型添加隨機數前后的反演結果比值分布如圖7所示,其中,紅色表示隨機噪聲對反演的影響較大,藍色表示隨機噪聲對反演結果的影響較小。由圖7可知:在大多數水域中,小幅度隨機誤差不會明顯影響模型a的反演結果。模型c、e、f、g受小幅度隨機誤差的影響逐漸變大,且模型f在部分區域反演結果受誤差干擾極不穩定。模型b、d、h在反射率有較小的變化時,其反演結果會產生較大幅度的變化,特別是模型b在小幅度隨機誤差影響下的反演結果受誤差干擾極不穩定。說明模型b、d、f、h可能難以應用于復雜的實際環境。總體而言,形式較簡單的反演模型在隨機誤差的影響下較為穩定,而形式復雜的模型容易在結果中放大數據源中的隨機誤差。這可能是因為形式復雜的模型更注重反射率在精細條件下的變化。

圖7 各代數模型的抗噪性能Fig.7 Noise-robust of each algebraic model
基于實測的水體葉綠素a濃度數據以及高分五號衛星的高光譜影像,構建8種反演代數模型并將其應用于長江河口的水質反演。結果表明:
(1)使用高分五號衛星在長江河口進行葉綠素a濃度的反演具有可行性,且相比其他衛星數據源具有明顯優勢。其中模型g的反演精度最高,其在環境光照條件基本穩定時反演精度最好,僅在云陰影下反演數值偏高。
(2)光照條件不明時,模型c、e的反演精度較高,但平均相對誤差仍較大。
(3)復雜模型易受環境中的細微條件干擾,簡單模型又因參數簡單而擬合結果較差。故反演模型的復雜度應適中,且應盡量減少比值算法的使用。
受自然條件限制,本文采樣點數量仍有不足,時間空間范圍有限,未驗證更廣的時空尺度下模型的準確性。高分五號衛星在更廣時空尺度下的應用,如模型在同一空間不同季節下的應用及同一時間更廣空間的應用,尚待進一步研究。