喻臻鈺,楊 昆,羅 毅,*,商春雪,趙 磊
1 云南師范大學地理學部,昆明 650500 2 云南師范大學西部資源環境地理信息技術教育部工程研究中心,昆明 650500 3 云南師范大學教務處,昆明 650500 4 云南師范大學信息學院,昆明 650500
湖泊既是重要的生態資源,同時也是一系列社會經濟過程的載體,湖泊水生態環境不僅決定著區域生態環境質量,也是城市的可持續發展的重要自然資源保障[1- 3],湖泊水生態環境能夠反映該地區環境狀況[4- 6]。水體透明度(Secchi depth, SD)是指水體的澄清程度,水體透明度會隨著水體中的懸浮物和膠體濃度增加而降低,在富營養湖泊中,以藻類為主的懸浮物越多,其透明度越低[7]。水體透明度通過微粒和溶解物質的光吸收影響上層水體的傳熱,水體透明度觀測往往是湖泊水質監測的組成部分[7-8]。因此,水體透明度是衡量水質標準的重要組成部分,也是評價水體富營養化和水生態健康的重要指標[8],同時在調節水層和初級生產力方面發揮著重要作用[9]。近年來,由于外來物種入侵、污染物點源排放、不透水面增加、營養物質負荷過重以及由此造成的有害藻類大量繁殖等綜合影響,滇池水體透明度出現了明顯的波動[10-11]。水體透明度與水質關系密切[12-13],常用作度量湖泊總體水質的直觀指標。
原位觀測是掌握湖泊水體透明度常用的方法,具有數據時間尺度連續、精度較高等優點,但存在傳感器布設和維護成本高、數據空間尺度離散等缺點[14- 16]。遙感技術的發展為區域環境監測提供了有效支撐,遙感影像的地表反射率數據為湖泊水體透明度的時空變化檢測提供了基礎[9]。Kloiber等[15]以Landsat 系列影像為數據,提出了Pearson相關系數矩陣和多元逐步回歸的透明度反演經驗模型,Olmanson等[17]以此模型對明尼蘇達州的10000多個湖泊水體透明度進行了反演,并分析了其20年間的時空變化特征,表明Landsat系列影像數據在透明度反演中具有較高精度;Wu等[9]以Landsat和MODIS為數據,以多元線性回歸模型對鄱陽湖的透明度反演結果表明,MODIS效果優于Landsat;馬建行等[18]及Knight等[19]以HJ- 1衛星CCD和MODIS為數據,基于灰色關聯度和多元回歸反演模型,對吉林省中西部湖泊透明度進行反演和對比,結果表明MODIS反演精度高于HJ1A-CCD。MODIS影像雖然空間分辨率不高,但在水體透明度反演中表現較好,且其具有較高時間分辨率,為較大尺度的湖泊水體透明度實時變化監測提供了可能。
在水體透明度反演模型中,半分析方法和經驗方法較為常用,其中半分析方法考慮了透明度與水體光學特性之間的關系,具有較高反演精度,而經驗方法對云污染、大氣影響不敏感,具有更強魯棒性[18]。隨著機器學習領域的發展,深度學習方法的提出,遙感影像反演精度得以大幅提升,現已被用于地表溫度反演[20]、海表溫度反演[21]、葉綠素a濃度反演[22]等,但尚未檢索到有關深度學習理論應用于水體透明度反演的報道。
地表反射率與水體透明度的數據均具有混沌特征,多項式擬合的方法并不能最大限度的挖掘其有效特征。為此,在前期相關工作的基礎上[11,23- 29],以原位監測和MODIS遙感影像為數據,基于深度神經網絡方法,對滇池2001年1月1日—2018年12月31日的水體透明度進行反演,并利用地理空間分析方法對其時空變化特征進行探究,填補了深度學習在水體透明度反演的空白,有效提高了常用水體透明度反演模型的精度,為開展湖泊水質研究提供了新的思路和方法。
滇池位于云貴高原中部,呈南北向分布,是全國第六大淡水湖,湖面海拔約1886 m,面積約330 km2,平均水深約為5 m,屬于半封閉型湖泊,僅有西南部的海口為出水口,處于亞熱帶高原西南季風氣候區,氣候變化主要受西南季風和熱帶大陸氣團交替控制。同時,滇池是昆明地區灌溉、調畜、受納的主要水體,也是城市發展的基礎條件,對滇池流域的氣候調節具有重要作用。研究發現,近30年來,在城鎮化的快速推進和全球氣候變暖雙重脅迫下,以湖泊表面水溫上升、藍藻水華頻繁、富營養化加劇為代表的水質惡化狀況明顯加劇[11,23- 24,26,28],湖泊水環境不容樂觀。另外,隨著國家“一帶一路”戰略的提出,云南省正深度融入國家戰略,作為云南省省會的昆明市,已經成為面向南亞、東南亞重要的輻射中心,控制與改善滇池水生態環境是落實和推進國家“一帶一路”戰略的環境基礎。為此,選擇滇池作為研究區具有區域特色(高原城市型湖泊)與時代特色(“一帶一路”戰略),研究區及監測站點地理位置分布如圖1所示。

圖1 研究區位圖Fig.1 Study area
時間區間為2001年1月1日—2018年12月31日,主要數據包括水體透明度實際觀測數據和MOD09GA遙感影像。其中,實際觀測值為2001—2010年10個站點(白魚口、草海中心、滇池南、斷橋、觀音山東、觀音山西、觀音山中、海口西、暉灣中、羅家營)的日監測值和2018年2個區域(草海、外海)的月監測值,來源于云南省環境科學研究院;MODIS數據來源于NASA LAADS Web (http://ladsweb.nascom.nasa.gov),時間分辨率為每日,空間分辨率為500 m,利用MRT (https://lpdaac.usgs.gov/tools/modis_reprojection_tool)重采樣為500 m分辨率影像,并將其重投影、鑲嵌并替換有云影響的像元值為Null,遙感影像缺失數據的時間分布如圖2所示,對于紅色標注的缺失像元以線性插值法補齊。

圖2 MODIS遙感影像缺失數據的時間分布Fig.2 Time distribution of missing value in MODIS remote sensing images
灰色系統理論利用關聯度度量因素之間的關聯性,不同灰色關聯度方法的計算存在一定局限性[30-31]。本文采用一般關聯度、絕對關聯度、斜率關聯度三種方法得到灰色關聯度的相關系數,考慮到三種關聯度的計算無法體現因素的負相關特性,因此采用Pearson相關系數分析負相關特性。
每個Cell包括輸入門、遺忘門和輸出門(如圖3所示),每個信息進入LSTM的網絡,可以根據規則判斷是否有用,只有符合規則的信息才會留下,不符的信息則通過遺忘門被遺忘,這對于具有長期序列依賴問題的數據非常有效[32]。
it=σ(Wxixt+Whiht-1+bi)
(1)
ft=σ(Wxfxt+Whfht-1+bf)
(2)
ot=σ(Wxoxt+Whoht-1+bo)
(3)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1+bc)
(4)
ht=ot⊙tanh(ct)
(5)
其中:⊙指矩陣逐元素點乘;bγ是各層輸出的偏差向量,例如bi是輸入門限層的偏差向量,bf是遺忘門限層的偏差向量;σ(x)是激活函數;Wαβ是對應層的權重矩陣,例如Wxf是輸入層到遺忘門限層的權重矩陣,Whi是隱藏層到輸入門限層的權重矩陣,Who是隱藏層到輸出門限層的權重矩陣;ct用來更新細胞狀態。由式(4)可知,遺忘門ft控制有多少上一時刻的記憶細胞中的信息ct-1可以傳輸到當前時刻的記憶細胞中;輸入門it控制有多少信息可以流入記憶細胞ct中;而輸出門ot控制有多少當前時刻的記憶細胞ct中的信息可以流入當前隱藏層ht中[33]。
數據包括MOD09GA和透明度的實測數據,其中MOD09GA為2001—2018年的日數據,實測數據為2001—2010年10個站點的日監測數據和2018年2個區域的月監測數據。以2001—2010年的實測數據與對應時間的MOD09GA數據進行建模,并以此模型對滇池2001—2018年的水體透明度進行估算,以2018年的實測數據對估算數據進行測試,技術路線如圖3所示。
(1)相關性分析(Correlation Analysis, C)。以灰色關聯度對MOD09GA的7個波段組合進行分析,得到排名前7的波段,即b5/b6、1/b4、b3/b6、b2/b6、b1/b6、b2/b3、1/b5,并組合為數據集X,其中bi為第i波段。
(2)異常值處理(Outlier Processing, O)。根據數據集的特征,臨近時間點的數據存在較為緊密的線性關系,所以使用線性插值法對缺失值進行插補。

(6)
異常值以3σ準則進行檢驗,并將大于μ+3σ的離群值以99%分位數插補,小于μ-3σ的離群值以1%分位數插補,其中μ為均值,σ為標準差,如式(6)所示,此插補方法即蓋帽法。
(3)去噪處理(Denoising Processing, D)。實際觀測值與遙感影像均不能排除儀器設備及人為因素的干擾,本文使用高斯低通濾波器對數據進行去噪處理。高斯低通濾波器(Gaussian Low Pass Filter)是一類傳遞函數為高斯函數的線性平滑濾波器,其傳遞函數如式(7)。
地理定位信息系統的主要原理是將與地理相關的內容進行電子化的轉換,使其以動態的圖形的形式呈現出來。這種信息系統在旅游管理中的應用主要體現在對游客所在的位置進行實時監控[1]。旅游管理人員通過這樣的方式掌握游客的位置信息,可以為游客提供安全保障。所以,在旅游管理中應用地理定位信息系統,不僅能使游客感受到更加優質和完善的服務,還能為促進旅游管理信息化建設提供推動力。
(7)
其中δ為標準差,x為待濾波數據,G(x)為濾波后的數據。
(4)估算模型構建。經過以上步驟處理的數據作為LSTM模型的輸入,數據總數為36520行(10×365×10+2×1×10),其中80%(29216行)作為訓練集(DataT),20%(7304行)作為驗證集(DataV)。模型參數設置:經過以上3個步驟的7個波段組合數據X作為模型的輸入(輸入維度為7),隱含層為10,學習率為0.0006,每批次大小(Batch size)為7,待估算的水體透明度數據為模型的輸出(輸出維度為1)。
(5)結果與分析。對輸出的水體透明度以Theil-Sen估算進行時序變化特征分析,以反距離加權(Inverse Distance Weight, IDW)空間插值方法進行空間分布特征分析。
Theil-Sen斜率(TSslope)估計是一種非參數估計法,用于估計時間序列數據的變化率,本文用于表征水體透明度的變化趨勢。該估計具有處理刪失回歸模型的能力,并且對異常值不敏感。對于偏斜和異方差數據,可比非魯棒簡單線性回歸更準確,即使對于正態分布的數據也能與非魯棒最小二乘法競爭。尤其對于具有混沌特性的數據,其表達具有明顯優勢。Theil-Sen斜率的表達公式為:
(8)
式中,median為中位數函數,xj、xi為序列數據;tj、ti為序列數據對應的時間數據;序列長度為n、i、j為序號(1≤i≤j≤n)。當TSslope>0,表示上升趨勢,反之為下降趨勢;|TSslope|值越大則趨勢越劇烈。
為了能夠綜合表達不同尺度湖泊水體透明度的變化率,本文提出了綜合變化率,避免了單一維度的局限性。綜合變化率為年均變化率(TS年)、季節(春、夏、秋、冬)變化率(TS季)及月(1—12月)變化率(TS月)的均值,如式(9)所示。
TS綜合=mean(TS年+TS季+TS月)
(9)
其中mean為均值函數。

圖3 技術路線圖Fig.3 Model processing flow chart

圖4 遙感影像MOD09GA波段之間的相關性分析 Fig.4 Correlation analysis among bands of MOD09GA remote sensing imagesGRA: 灰色關聯度分析Grey Relational Analysis
灰色關聯度及Pearson相關系數分析結果如圖4所示。由于波段之間的線性相關性較低,Pearson相關系數均處于較低水平,但可反映出波段間正負相關的性質,作為波段選擇的輔助參考。由灰色關聯度可得,b5/b6、1/b4、b3/b6、b2/b6、b1/b6、b2/b3和1/b5與水體透明度的相關性較高,能夠較好的表達水體透明度的數據特征,所以選用此7個波段組合為模型構建的輸入數據,對水體透明度進行反演。

圖5 模型反演結果對比Fig.5 Comparison of model inversion results
以滇池2001—2010年的實測值與MOD09GA波段篩選后的數據為訓練集與驗證集構建水體透明度反演模型,并將此模型應用于2001—2018年滇池水體透明度的估算,模型評價參數如圖5及表1所示,評價指標選用為均方根誤差(Root Mean Squared Error, RMSE)和平均絕對誤差(Mean Absolute Error, MAE)。對于具有混沌特性的數據而言,機器學習算法對數據特征的學習能力優于多項式模型,神經網絡模型通過多隱含層多節點的學習,能夠充分提取MOD09GA與水體透明度的特征。本文提出的估算方法(COD-LSTM)與其他模型對比結果表示,COD-LSTM模型估算效果最佳,且與實測值的趨勢擬合較好(RMSE=0.1359, MAE=0.1134)。Binding等[34]僅考慮了單波段與水體透明度的對應關系,具有較大局限性;Wu等[9]和Knight等[19]同時考慮了兩個波段與水體透明度的映射關系,擬合效果較優于Binding等[34]提出的方法,但對于水體透明度趨勢的擬合具有較大局限;馬建行等[18]提出的方法相對較優于以上三種方法,但水體透明度具有混沌特性,僅考慮多項式擬合較難挖掘數據特征,此方法仍較難準確估算水體透明度數值。本文基于深度神經網絡提出的COD-LSTM模型,依靠遙感影像大數據的條件,以相關性分析、剔除異常值及去噪等方法充分過濾無效數據的干擾,并在多隱含層多節點的學習下,便于提取更多的數據特征,使得估算準確性得以大幅提高,因此在水體透明度的估算中具有更大優勢。

表1 本文估算方法與其他反演方法及結果的對比

圖6 2001—2018年滇池水體透明度反演結果 Fig.6 The Secchi depth inversion results of Dianchi Lake from 2001 to 2018
2001—2018年滇池水體透明度的反演結果如圖6所示,其中,綜合變化率為年均變化率、季節(春、夏、秋、冬)變化率及月變化率的均值,這一指標能夠綜合表達不同尺度湖泊水體透明度的變化率,避免了單一維度的局限性。總體上看,滇池水體透明度呈下降趨勢,綜合變化率為-0.08 m/10 a,年均變化率為-0.05 m/10 a,季均變化率為-0.09 m/10 a,月均變化率為-0.08 m/10 a。按季節尺度分析,春季變化率最高,為-0.11 m/10 a,其次是秋季,為-0.09 m/10 a,夏季與冬季均為-0.08 m/10 a。按月分析,6月份變化率最高,為-0.15 m/10 a,最低變化率為-0.03 m/10 a,出現于10月份,高于月平均變化率的月份有5個(2—3月、5—6月、9月),低于月平均變化率的月份有6個(1月、4月、7—8月、10—11月),12月與月平均變化率持平。
2006年前后滇池水體透明度出現不同的變化趨勢,2001年1月—2005年12月呈上升趨勢,變化率為0.015 m/10 a;2006年1月—2018年12月呈下降趨勢,變化率為-0.007 m/10 a,這可能與2003年開始實施的“一湖四片、南延北拓”的城鎮化戰略有關[35]。牛欄江-滇池補水工程于2008年12月30日開工建設,2013年底建成并投入試運行[36]。2009年1月—2013年12月呈下降趨勢,變化率為-0.007 m/10 a;2014年1月—2018年12月呈上升趨勢,變化率為0.001 m/10 a。由此表明,引水工程的實施對滇池水質的治理工作取得了一定成效。
2001—2018年滇池水體透明度年均值及綜合變化率的空間分布如圖7所示。水體透明度變化率的空間分布能夠反映水體長時間尺度下透明度變化程度和趨勢,能夠為厘清透明度變化的空間異質性、有效保護治理水環境提供專題數據。研究結果表明,滇池水體透明度均呈下降趨勢,水體透明度相對較高的區域,變化幅度相對較大,表明近18年來滇池水質總體呈不同程度的惡化趨勢。滇池北部沿岸水體透明度較低,草海區域為全湖最低,但變化幅度較小,未表現出明顯惡化趨勢。南部和中部的水體透明度相對較高,但南部和中部的變化速率明顯高于北部。滇池僅東北沿岸出現兩個區域的水體透明度改善趨勢,這可能與此區域建設的多個濕地公園有關。
水體透明度較低的區域分別位于主城區(滇池東部和北部)和海口鎮(滇池西南部),變化速率較快的區域位于晉寧區(滇池南部),近年來,此區域的城鎮化進程加快,可能是導致湖泊水質惡化的主要因素。滇池入水口位于北部,而北部恰好是城鎮化擴張較為嚴重的區域,對流入滇池的水源的污染是巨大的。滇池水體透明度在2006—2013年間呈持續下降趨勢,自2013年開始,昆明市政府投入約83.3億元實施的牛欄江-滇池補水工程,但隨著滇池流域“一湖四片、南延北拓”等城鎮化戰略的實施,滇池南岸和東岸近年來不透水表面擴張顯著[23,27, 29],昆明市城市中心由1個變為了4個,2014年后水體透明度呈現明顯的波動變化,表明高強度的城鎮化過程導致的水質惡化抵消了牛欄江引水工程等水質保護和改善工程的效果,所以滇池水體透明度仍未有實質性的改觀。
總體看來,2001—2018年間,滇池水體透明度呈下降趨勢,從水體透明度時序變化特征能夠反映出滇池水質仍處于惡化狀態,尤其是距離城區較近的區域水體透明度相對較低,表明人類活動是造成水體透明度下降的主要因素;水體透明度較高的區域下降速度相對較快,可能是由于大部分區域的水質長期處于較差狀態,在湖泊水動力過程的作用下導致狀態較好的區域的水質發生了穩態轉變。2014年后湖泊水體透明度下降速度得到了有效抑制,這與近年來政府部門的大力度監管與治理有直接關系。

圖7 2001—2018年滇池水體平均透明度年均值及綜合變化率的空間分布Fig.7 Spatial distribution of annual mean Secchi depth and comprehensive change rate of Dianchi Lake from 2001 to 2018
水體透明度是評價水質標準的重要指標,但對較大空間尺度的監測具有一定困難,且由于研究區內針對湖泊水質原位監測工作起步較晚,導致湖泊水體透明度歷史數據的缺失。為此,以MODIS遙感影像為數據,基于深度神經網絡方法的長短期記憶神經網絡模型(LSTM),對滇池2001年1月1日—2018年12月31日的水體透明度進行反演,并利用地理空間分析方法對其時空變化特征進行探究,填補了深度學習在水體透明度反演的空白,有效地提高了常用反演模型的精度,同時探討了水體透明度的時空變化特征,為開展湖泊水質研究提供了新的思路和方法。
(1)本文基于深度學習方法提出的COD-LSTM模型在水體透明度反演中具有較好的性能(RMSE=0.1359, MAE=0.1134),能夠充分提取遙感影像數據與水體透明度的特征,相對多項式擬合而言,具有較大優勢。
(2)時序變化特征分析結果表明,滇池水體透明度總體呈下降趨勢,綜合變化率為-0.08 m/10 a,年均變化率為-0.05 m/10 a,季均變化率為-0.09 m/10 a,月均變化率為-0.08 m/10 a。2014—2018年間,滇池水體透明度以0.001 m/10 a的速率出現上升趨勢,體現了牛欄江-滇池補水工程的治理成效。城市擴張的負反饋效應和牛欄江引水工程等環境治理工程的正反饋效應的疊加,抑制了水體透明度的下降速率,但水體透明度狀況尚未發生質的改變。
(3)空間變化特征分析結果表明,水體透明度較高的區域下降率較大,水體透明度較低的區域變化趨勢相對穩定,距離城區及居民區較近的水體透明度相對較低。人類活動將成為影響滇池水體透明度變化的重要因素,同時也是造成滇池水體污染的主要因素。隨著中國城鎮化的不斷推進,人類活動對湖泊水體透明度下降的貢獻將越來越大。
致謝:云南省環境科學研究院提供數據支撐,科技部國家遙感中心提供技術支持。