郭云開,錢 佳,雷宇斌,董勝光,吳朝輝,屈偉軍, 章 瓊
(1.廣州城建職業學院,廣東 廣州 510920;2. 長沙理工大學 測繪遙感應用技術研究所,湖南 長沙 410076;3. 湖南省第二測繪院,湖南 長沙 410076)
由于經濟高速發展、城鎮化和工業化不斷推進,水體污染程度也在不斷加劇,水質越來越差,特別是內陸湖泊水體[1]。水體中的葉綠素a是重要的水質參數,其含量大小在一定程度上反映了水體富營養化的程度。因此對于不同營養狀況、不同地區大面積精確檢測葉綠素a濃度十分必要。傳統水質監測方法采用實地水體采集及實驗室內化學檢測,但該方法費事、費力,監測結果難以代表整個水體中水質指標的分布狀況。利用遙感手段監測水體水質具備范圍廣、速度快、成本低等優勢,監測結果可以反映水質參數在空間和時間上的分布情況和變化,便于長期動態監測[2-3]。水體組分中葉綠素a含量的遙感反演取決于葉綠素a的吸收和后向散射特性[4]。目前,國內外研究學者對此做了大量研究,國外有研究者基于多種衛星影像數據分別與葉綠素濃度建立關系并進行定量反演[5-6],Li等探索基于GF-1號影像反演水質參數的可行性,表明GF-1號衛星應用于水質監測的優勢[7];國內有研究者應用環境一號衛星及回歸算法在水質參數及葉綠素a濃度反演研究中取得較好的成果[8-9],周正等應用環境一號影像數據構造針對內陸湖泊二類水體的水質反演經驗模型,模型結果較為穩定[10],朱利等較早進行應用GF-1號衛星WFV數據進行太湖葉綠素a濃度的反演研究,模型精度滿足水域葉綠素a含量的精度需求[11]。黃啟會等基于實測高光譜數據進行百花湖葉綠素a濃度估算,并就模型遷移至其它湖泊的可行性進行探索性分析,其效果一般且并沒有在影像上進行大面積反演及制圖[12]。
目前,對水體葉綠素a敏感波段診斷及遙感影像反演方法研究主要針對某種單一內陸湖泊或近岸海洋等水體。由于不同水體存在區域和物質組成等差異,對水體反射光譜值和葉綠素a敏感波段影響較大,構建的反演模型對其它區域水體參數反演可能不具備普適性。為研究不同區域及不同營養狀況下湖泊葉綠素a的共同敏感波段及構建葉綠素a含量普適性反演模型,本文在現有研究基礎上,選取湖南省3座不同區域、不同污染程度的代表性水庫,在對總樣本對應的實測高光譜及GF-1/WFV影像數據進行預處理基礎上,通過相關性分析篩選特征波段,并構建葉綠素a含量聯合反演模型,估算水體葉綠素a濃度并繪制分布等級圖。
本文選擇湖南省3個具有代表性的水庫,包括黃材水庫、六都寨水庫和柘溪水庫,實驗時間為2019年8月15日至19日,測量內容包括光譜測量、水樣采集及采樣點經緯度坐標,共采集53個樣本,樣本點及控制點分布如圖1所示。在研究區域均勻分布樣點,每點采集約500 mL的水樣,野外光譜測量使用AvaField-3高精度光譜地物波譜儀。為減少水體鏡面反射和船體自身陰影的影響,測量采用二類水體水面以上光譜測量方法,測量的數據有標準灰板(反射率為30%)、水體和天空光的光譜輻射度信息。為后續提取樣點的GF-1/WFV影像數據,使用GPS-RTK獲取樣點中心地理位置。對所有的測試樣點,詳細記錄樣點概略位置、溫度、濁度以及水體氣味等。將采集的樣品放進便捷式冷藏箱中進行保存,送回實驗室化驗獲取葉綠素a濃度。

圖1 水庫實地采集樣點及控制點分布
遙感反射比計算過程中,根據測量當天的天氣狀況及唐軍武等[13]的研究經驗,其算式為:
Rrs=(Sws-rSsky)ρp/πSp.
(1)
其中,Rrs表示遙感反射率,Ssw,Ssky,Sp分別為光譜儀面向水體、天空和標準板時實測的DN值的平均值,根據經驗值,氣-水界面對天空光反射比r取0.022,ρp為標準灰板反射率。
圖2展示了六都寨水庫的實測高光譜處理前后數據,根據已有研究和本次實驗表明350~400 nm與900~1 050 nm噪聲較大[12],部分波段呈現負值,因此對這兩段光譜進行去除處理。如圖2(a)所示,未經處理的原始水體高光譜數據忽略了太陽直射反射與天空光反射的影響,測量的結果偏高,導致實際應用價值不高。經實測光譜計算后水體反射率大小與走勢如圖2(b)所示,與實際情況及相關研究成果相吻合。

圖2 六都寨實測高光譜
本文所用遙感數據為GF-1衛星中16 m分辨率的多光譜寬幅度(View field of view,WFV)傳感器數據,影像波段為4段,藍(波長450~520 nm)、綠(波長520~590 nm)、紅(630~690 nm)、近紅外(770~890 nm)。遙感數據在獲取過程中,由于遙感平臺及地球曲率、大氣反射等各方面原因,引起數據產生偶然或者系統誤差,誤差降低遙感數據的質量,從而影響定量反演的精度。因此在應用前必須對其進行預處理,主要過程包括:正射校正、影像拼接、大氣校正、掩膜剪裁等。影像預處理后,根據實測點位坐標,在影像上采集影像光譜,并建立波譜庫用于后續建模分析。
相關性分析對多個變量具備相關性的元素進行定性分析,在光譜敏感波段的選取方面應用較為廣泛,本研究中Pearson相關系數可用于衡量葉綠素a與光譜波段間的相關性程度和篩選特征波段,算式為:
(2)
式中:Xi表示第i個光譜波段值;Y表示葉綠素a含量;σ表示標準差。

表1為3個研究區的水質參數葉綠素a含量統計分析。不同水庫葉綠素a含量的差異性較大,相同水庫間差異性較小。黃材水庫水質均值最低,約為2.378 μg/L,柘溪水庫均值最高,達到13.399 μg/L,該差異性是由于不同地區水質情況不同所導致。為探究不同污染程度的水域葉綠素a含量GF-1/WFV影像光譜聯合反演建模的可行性,將53個總樣本按照葉綠素a濃度大小排序,應用濃度梯度法將總樣本分成兩組,一組選擇樣本點數的2/3用于建立回歸預測模型,另一組選擇樣本點數的1/3用于驗證模型的可靠性。全部樣本所對應葉綠素a含量的均值分別為8.274 μg/L,變異系數(coefficient of variation,CV)為54.15%,具高等變異特性。

表1 水質指標葉綠素a含量的統計特征值
本項目在六都寨水庫和柘溪水庫進行了實地水面高光譜數據采集。高光譜數據波段更多,地物光譜特性更加豐富,能夠為提取遙感影像敏感波段提供理論參考。因此本項目在進行水質采樣同時采集高光譜數據,篇幅有限,本文以柘溪水庫為例進行光譜特征分析。
通過圖3可知,在450~550 nm波段,水體反射率逐漸增大,在該波段范圍是葉綠素的吸收帶;在520~600 nm波段范圍是波譜的第一反射峰,在580 nm左右峰值達到最大,原因是受到葉綠素反射率影響;受到葉綠素a的熒光效應,在690 nm波段附近形成第2個反射峰;在波段大于725 nm時,由于受到純水系數迅速增大的影響,水體的光譜反射率降低;由于受到懸浮物影響,在波段820 nm附近再次形成一個反射峰。

圖3 柘溪水庫實測高光譜峰值
由圖2(a)及圖3可知,柘溪水庫與六都寨水庫計算后的反射率總體走勢一致。從六都寨和柘溪水庫的葉綠素a含量可以得知(表1),柘溪水庫葉綠素a含量均值高于六都寨水庫,富營養化高,并且柘溪水庫反射率整體上高于六都寨,這也與相關研究結論相符,即葉綠素a含量高、整體反射率高。
應用六都寨水庫與柘溪水庫的35個樣本進行水體實測高光譜數據與葉綠素a濃度相關性分析,結果如圖4所示。在400~460 nm區域,相關性系數走勢較為平緩,在460~570 nm區域,相關系數增大至最大正相關處,在570~900 nm區域相關性系數平緩下降,這是水中葉綠素與懸浮物共同光譜反射的結果,在波段568.16 nm與葉綠素a含量達到最大正相關0.549,且通過0.01檢驗,說明該波段對葉綠素a濃度具有重要的指示意義。

圖4 光譜波段與葉綠素濃度相關性
因此,通過圖4表明葉綠素a敏感波段主要集中在520~620 nm之間,這也與已有研究中敏感波段類似[14],也與水體葉綠素光譜特征相符,為基于GF-1/WFV衛星數據進行水庫葉綠素a含量反演提供理論參考,該特征波段范圍對應于GF-1/WFV衛星數據中Band2即綠波段(520~590 nm),其中心波段為576 nm,后文應用GF-1/WFV衛星數據構建葉綠素a濃度反演模型時特征波段選擇綠波段。
利用GPS-RTK現場測定采樣點坐標,應用Envi5.1軟件依據坐標點在預處理后的GF-1/WFV影像數據上獲取各監測點位的光譜反射率信息,如圖5所示。

圖5 黃材、六都寨、柘溪水體影像反射率
GF-1衛星影像反射率與實測高光譜反射率走勢基本一致,先增后減再緩增,驗證GF-1/WFV影像數據預處理過程正確性及反射率可用性。
依據葉綠素a含量大小對三地區的樣本進行梯度抽樣,訓練集為36個,驗證集為17個。通過2.3節表明葉綠素a特征波段主要位于520~620 nm之間,因此將GF-1/WFV影像數據綠波段反射率和葉綠素a含量以自變量、因變量的形式進行相關性分析,為后續建模反演提供依據,結果如表2所示,并以sig值<0.05和sig值<0.01顯著相關進行判別。綠波段反射率與葉綠素a濃度相關性達到0.794,通過0.01顯著性檢驗。

表2 Band2波段與葉綠素a相關性
2.5.1 葉綠素a回歸模型構建

Y=115.563X-2.925.
(3)
式中:X為對GF-1影像綠波段反射率值;Y為葉綠素a含量。
2.5.2 線性回歸模型驗證
將驗證集代入到反演模型中進行驗證,對葉綠素a濃度實測值與預測值進行線性擬合(見圖6),結果如表3所示,其驗證集擬合精度達到0.78,兩者間均方根誤差為2.11,PRD為2.09,依據精度評價指標,該模型驗證精度較高,滿足基于GF-1/WFV影像數據水庫葉綠素a含量反演精度需求。

表3 葉綠素a含量一元線性回歸建模精度

圖6 葉綠素a實測值與預測值擬合
依據上文模型,將葉綠素a含量反演至基于GF-1/WFV影像數據上,并將葉綠素a含量按照《GB3838-2002地表水環境質量標準》(見表4)進行分級,可得到整個水庫范圍內葉綠素a含量的分級分布圖,見圖7。

表4 湖泊水庫特定項目標準值
通過水質反演結果空間分布等級圖7(a)可知,黃材水庫葉綠素a含量整體在10 μg/L以下。葉綠素a含量空間分布上,兩頭水質較中間部分水質更優,水庫總體水質情況較優,達到水質類別Ⅲ以上,滿足水庫水質供需要求。
通過水質反演結果空間分布等級圖7(b)可知,六都寨水庫葉綠素a含量整體在Ⅲ-Ⅳ區間。葉綠素a含量空間分布上,靠近水庫大壩源頭部分較后面尾部部分高,水庫總體水質一般,處于水質類別Ⅲ-Ⅳ部分,存在較輕微污染,滿足一般工業用水供需要求。
通過水質反演結果空間分布等級圖7(c)可知,柘溪水庫葉綠素a含量整體處在第Ⅲ類、第Ⅳ類分布。葉綠素a含量空間分布上,主要以第Ⅲ類庫區為主,沿著水庫區域貫穿分布。第Ⅳ類在局部地區分布較明顯。水庫水質存在輕度至中度污染,需加強保護措施。

圖7 水庫葉綠素a分級圖
目前水域葉綠素a含量敏感波段和反演模型研究大多針對某種特定區域,在應用遙感影像進行大面積不同污染程度的水庫葉綠素a含量監測時具有一定的局限性[12],由于其理化性質不同導致光譜特征也表現不同,因此不同污染程度的水庫葉綠素a敏感波段也存在差異性。聯合不同污染狀況水庫開展葉綠素a敏感波段提取及構建普適性反演模型是亟需的。
本文對實測光譜進行特征分析,應用相關性方法提取與葉綠素a含量相關性絕對值較高的敏感波段區域,結果表明波段區間主要位于520~620 nm,這與已有文獻探索葉綠素a的敏感波段范圍基本相似[12,14]。表明該特征光譜波段可作為不同污染狀況地區葉綠素a含量聯合反演的共同敏感波段。520~620 nm波段對應GF-1/WFV影像數據中的綠波段。通過對比影像光譜綠波段反射率統計(見圖8)與實測水質參數葉綠素a含量統計特征值(表1)可知,葉綠素a含量均值與GF-1/WFV影像綠波段反射率均值走勢基本一致且總體成正比,葉綠素a含量均值高的水庫,綠波段反射率均值也高,驗證了GF-1/WFV影像數據綠波段作為葉綠素a敏感波段的可靠性。

圖8 各水庫GF-1號衛星Band2 反射率
