遲凱歌,龐 博,石樹蘭,崔黎壯
(1. 北京師范大學水科學研究院,北京 100875;2. 城市水循環與海綿城市技術北京市重點實驗室,北京 100875)
植被作為陸地生態系統的主要組分,是生態系統存在的基礎,也是聯結土壤、大氣和水分的自然“紐帶”,它在陸地表面的能量交換過程、生物地球化學循環過程和水文循環過程中扮演著重要的角色,在全球變化研究中起著“指示器”的作用[1-3]。NDVI(the Normalized Vegetation Index)是研究植被變化的重要工具,能夠較好地反映出區域下墊面植被動態變化的規律。
近年來,國內外在NDVI預測模型方面開展了大量的研究。例如,IWASAKI利用GSMaP(降水數據種類)降水量和JRA-25/JCDAS(溫度數據種類)溫度對蒙古草原進行NDVI預測,建立了逐步多元線性回歸分析預測模型[4];阿西穆等人基于Markov模型對渭干河和庫車河流域的綠洲地區的植被覆蓋進行動態變化預測研究[5];林楠等人以吉林東部為研究區在進行植被覆蓋動態變化分析的基礎上,利用馬爾柯夫模型和灰色系統G(1,1)模型對研究區植被覆蓋進行動態模擬和預測,分析其演變特點及規律[6]。WANG等人采用多元線性回歸方法對我國南方丘陵地區的降水和溫度進行NDVI模擬[7]。雅魯藏布江流域地形特征復雜,氣候變化敏感,生態系統脆弱,如何綜合考慮氣候要素對流域植被覆蓋的影響,構建機制清晰,精度可靠的植被覆蓋預測模型成為生態水文領域的挑戰[8-10]。隨著機器學習技術的發展,人工神經網絡由于其強大的非線性模擬能力在預測模型領域得到了廣泛的應用。因此,本文綜合采用主成分分析、偏相關分析和人工神經網絡模型,嘗試構建雅魯藏布江流域的NDVI預測模型,探索為氣候地形復雜區域的植被覆蓋研究提供一種新的方法。
本研究采用雅魯藏布江流域及其周圍地區30個地面站點數據和MODIS數據,計算得到流域內NDVI的數值變化的時空規律,對流域內植被動態變化進行了分析,并進一步構建了NDVI預測模型,對進一步探求雅魯藏布江流域下墊面的驅動規律,積極應對氣候變化對下墊面帶來的影響具有十分重要的意義。
雅魯藏布江流域是青藏高原上最大的河流,也是最重要的國際河流之一,發源于西藏自治區南部,喜馬拉雅山北麓的杰瑪央宗冰川[11,12]。雅魯藏布江流域橫貫青藏高原南部,河流總長為2 057 km,流域面積為24.2 萬km2[13,14]。雅魯藏布江流域(圖1)是世界上最高的河流之一,平均海拔在4 500 m以上,流域地勢西高東低,其上較大支流有拉薩河、帕隆藏布、年楚河、多雄藏布和尼洋河等[15]。雅魯藏布江流域的氣候條件主要受高原地理位置和地勢特點支配[16],上游地區屬高原寒溫帶氣候,年平均降水量不足300 mm。中游地區屬高原溫帶氣候,年平均降水量為300~600 mm,河谷地帶年平均氣溫在4.7~8.6 ℃之間[17,18]。下游地區屬熱帶亞熱帶氣候,下游地區的巴昔卡附近年均降雨量在4 000 mm以上。
受特殊地質地貌和水熱因素的影響,流域自然景觀多樣。流域下游水汽條件良好,主要植被類型有熱帶低山半常綠雨林、亞熱帶常綠闊葉林、亞熱帶山地半常綠闊葉林和常綠針葉林;中游地區植被類型為山地與河谷灌叢草原,普遍分布著灌叢草原植被,草本植物為中溫型禾草;上游地區主要植被類型為高寒草原、高寒草甸、高寒灌叢以及高寒墊狀植物。
本文利用2000-2015年雅魯藏布江的NDVI資料,研究時段內的雅魯藏布江的植被覆蓋變化。在神經網絡的模擬模式中,輸入為實測的降雨和氣溫,輸出為模擬的NDVI指數,NDVI數據來自MODIS遙感衛星數據,已經過云處理。雅魯藏布江降雨和氣溫數據收集自國家地球系統科學數據平臺,研究數據跨度時間是2000年2月至2015年12月。其中NDVI數據和氣象數據已經分別應用于雅魯藏布江的植被變化研究[19]和極端氣候事件研究[20],數據在下載前通過了均一性檢驗以及質量控制,具有較高的可靠性。本文用到的雨量站總共有30個,并且根據雅魯藏布江地區自然水系將區域分為5個子區域,一區的雨量站有普蘭、改則、聶拉木、定日、拉孜和申扎;二區的雨量站有日喀則、帕里、江孜、南木林、尼木和浪卡子;三區的雨量站有當雄、拉薩、墨竹工卡和那曲;四區的雨量站有嘉黎、波密、八宿、洛隆和比如;五區的雨量站有林芝、加查、米林、澤當、貢嘎。子流域分區情況見表1。

表1 雅魯藏布江子流域分區表Tab.1 Yarlung Zangbo River Basin Division
主成分分析(Principal Component Analysis, PCA)最早是由Pearson于1901年提出的一種通過對協方差矩陣進行分析,主要目的是在降低數據維數的條件下保持數據集對方差貢獻最大的一種統計分析方法。其原理為通過降維的方法將原來的多個指標轉化為一個或幾個綜合指標,即主成分(PCS),而各主成分之間互不相關。即
(1)
式中:x1,x2,…,xp,為原始變量;Z1,Z2,…,Zm(m≤p)為新變量指標;lmp為先變量權重。
偏相關分析(Partial Correlation Analysis,PAR)是在多要素構成的自然系統中,對其他變量的影響進行控制的條件下,衡量多個變量中某兩個變量之間的線性相關關系的密切程度的分析方法,以偏相關系數來度量偏相關程度。偏相關計算公式的通式為(r為兩個變量之間的相關系數):

(2)
一階偏相關系數計算公式為:
(3)
即消除第3變量影響,分析兩變量的相關關系,二階偏相關系數計算公式為:
(4)
即消除第 3變量和第 4 變量的影響,分析兩變量的相關關系。其他多階偏相關系數計算公式都可以通過N階偏相關系數計算通式推導出來,對求得的相關系數,可以用顯著性檢驗方法進行顯著性檢驗。對相關系數顯著性檢驗方法多選取F檢驗進行檢測,F檢驗又稱方差齊性檢驗,主要通過對比2個變量數據的方差,以確定其吻合度是否有顯著性差異,當數據變量個數充分大時,統計量近似服從F分布。
人工神經網絡是借鑒大腦和神經系統存儲和處理信息的特征抽象出來的一種數學模型。前饋BP(Back Propagation )神經網絡是應用廣泛的靜態網絡。BP網絡以其良好的泛函逼近能力以及自組織、自適應性能和容錯性等優點為水文系統的建模、識別和預測提供了一種有效的研究手段[21]。BP 神經網絡是一種包含輸入層、隱含層和輸出層的前向網絡結構,它的基本特點是信號經輸入層、隱含層逐步處理后向前傳遞直達輸出層,神經網絡每一層神經元的狀態只由上一層決定,如果輸出層得到的輸出結果與期望輸出不在誤差允許范圍內,則信號逆向反饋,調整網絡的權值和各神經元的閾值,使得網絡輸出與期望的輸出無限靠近,直至誤差允許的范圍內[21],具有以非線性適應性為特征的信息處理能力、十分優良的非線性逼近能力以及較好的容錯性,因而能夠對大規模數據進行并行處理,且自組織,自學習與自適應能力突出,被廣泛應用于預測、分類、模式識別和聚類等領域[22]。
BP模型分為訓練與檢驗兩個部分,模型由率定數據集進行訓練,當達到最小誤差限制或者最大迭代次數時,模型訓練結束。模型的數學表達由下式所示:
(5)
式中:xi為節點i的輸入值;Ok為節點k的輸出值;g1為隱含層的激活函數;g2為輸出層的激活函數;M和N分別是輸入層和隱含層中神經元的個數;wj0為隱含層中第j個神經元的偏差;wk0為輸出層中第k個神經元的偏差;wji為輸入節點i與隱含節點j之間的權重;wkj為隱含節點j和輸出節點k之間的權重。
模型計算在MATLAB(2016)環境下進行。ANN模型采用MATLAB中BP神經網絡工具箱,隱含層和輸出層的傳遞函數分別使用Sigmoid函數和線性函數,并且為了避免過度擬合采用了早停函數earlystopping有效避免過度迭代。其中,2000-2009年數據進行模型率定,2010-2015年數據為模型驗證。
2)修改的后64卦卦序(圖8),揭示了64卦序數/陰陽對稱規律,這也許是一個史無前例的、劃時代的發現!呈現出既陰陽對稱又數量平衡,陰中有陽,陽中有陰,陰陽相抱,自然天成。這豈不是精美的“陰陽/數量太極圖”嗎?64卦若采用比干八宮卦序,那么乾為首卦就要改變了,即坤為1,乾為2。
本研究的主要計算過程如下:首先利用2000-2015年的MODIS數據,利用歸一化植被指數的方法得到16年間NDVI逐月的數值大小,以及流域NDVI的多年平均值。其次,使用線性擬合的方法得到流域內5個分區NDVI的增長速率,并計算NDVI在各個分區上的Hurst指數,以分析NDVI變化的持續性。最后,分別采用主成分分析法和偏相關分析法提取得到影響NDVI的主要影響因子,作為輸入因子輸入人工神經網絡模型。模型基于MATLAB計算平臺,其中未采用因子篩選的模型簡稱為ANN,采用主成分分析進行因子篩選的模型簡稱為ANN-PCA, 采用偏相關分析進行因子篩選的模型簡稱為ANN-PAR,最后得到NDVI的預測模型。
本文中選取4種模型評價指標來評價各個模型的表現能力:納西效率系數(NASH)、均方根誤差(RMSE)、平均絕對誤差(MAE)和相關系數(R),其計算公式如下所示:
(6)
(7)
(8)
(9)

雅魯藏布江流域2000-2015的NDVI年均空間分布特征如圖2所示,如圖2所示,流域NDVI呈從西向東,從北向南的增加趨勢。受印度洋暖濕氣流影響,區域5的NDVI顯著高于其他區域。
其中,區域1到區域5的NDVI多年平均值分別為0.13、0.18、0.24、0.23、0.31。5個區域的植被狀況穩定,呈現不顯著的增長趨勢。以區域5為例,對子流域的NDVI的多年平均數值進行線性擬合,從圖中可以看到,在2000-2015年期間,NDVI區域5上呈現出增加的趨勢,其傾向率為0.002/(10 a),變化幅度較小,這與全球氣候變化背景下,中高緯度降水增加的變化趨勢相一致。
本文對雅魯藏布江地區NDVI的變化的持續性也做出了研究。各個區域Hurst指數計算結果如表2所示。如圖,區域1到區域5的Hurst指數呈現上升趨勢。其中區域1呈弱反持續性,當前該區域的趨勢不是很明顯比較穩定,在未來植被有可能會稍微減少。區域2到5都呈現持續性,表明未來NDVI將持續增加,而且從上游到下游的持續性越來越強。

表2 各個子流域區域Hurst指數計算結果Tab.2 Results of Hurst index of each sub-watershed area
各個子流域的NDVI的MK突變檢驗結果如圖4所示。如圖所示,區域突變不明顯,NDVI變化相對穩定。
分別采用主成分分析法和偏相關分析法對影響NDVI變化的主要氣象因子進行分析。其中,主成分分析方法本文選取累計方差貢獻率高于90%的主成分作為主要影響因子,結果如表3所示。偏相關分析的結果如表3所示,且本文選擇偏相關系數大于0.3的變量作為主要影響因子(結果加粗的為偏相關分析中篩選出的影響因子)。
從表3和表4可以看出,氣溫和降水對各區域NDVI的影響分別隨著時間推移逐步衰減。主成分結果統計表明,各區域前3個月的氣溫和降水會對NDVI有主要影響,而偏相關分析中影響因子的范圍縮小主要集中在前兩個月的降雨和氣溫。兩種方法的結果表明,總體上同時期氣溫對NDVI的影響要略高于對降水的影響,利用兩種方法對因子進行篩選,并將篩選出的因子作為輸入輸進人工神經網絡模型進行NDVI模擬可以提升精度。偏相關分析與主成分分析的結果與相關研究的結論較為一致。例如郭兵[23]等提出雅魯藏布江流域植被覆蓋度受降水和氣溫的影響較大,但是作用到植被覆蓋具有一定的滯后性。本文采的影響因子相關分析結果與其結論相似。

表3 主成分累計貢獻率及所選主成分 %

表4 各個成分偏相關計算結果Tab.4 Partial correlation calculation results
輸入數據的選擇是人工神經網絡模型構建的關鍵問題之一[22]。如何有效地利用數據信息,同時避免由于過多的輸入數據導致網絡結構過于復雜,出現過擬合現象,成為研究的熱點[24]。本文分別使用主成分分析和偏相關分析進行人工神經網絡的輸入因子篩選,通過比選構建NDVI預測模型。其中采用主成分分析進行因子篩選的模型簡稱為ANN-PCA, 采用偏相關分析進行因子篩選的模型簡稱為ANN-PAR。為了比較,加入采用全部預報因子作為輸入的人工神經網絡模型,簡稱ANN。表5給出了人工神經網絡模型的率定和驗證結果。

表5 人工神經網絡計算結果Tab.5 Artificial neural network results
結果表明,基于人工神經網絡的NDVI預測模型能夠取得較高的預報精度。其中,ANN-PCA模型在各分區的率定期的NASH系數分別為0.68、0.74、0.79、0.75、0.78,檢驗期分別為0.67、0.73、0.77、0.75、0.72。模型在各區域的率定驗證結果均達到了0.7左右,取得了較高的模擬預測精度。
其次,從不同神經網絡的模型的結果可以看出,ANN-PCA模型和ANN-PAR模型均顯著優于ANN模型。在率定期,ANN-PCA模型比ANN模型在各分區的NASH系數分別高0.17、0.11、0.15、0.11、0.06,在檢驗期,分別高0.11、0.10、0.13、0.10、0.12。兩種篩選方法對比,ANN-PCA模型略優于ANN-PAR模型,在率定期,ANN-PCA模型比ANN-PAR模型在各分區的NASH系數分別高0.03、0.05、0.01、0.04、0.06,在檢驗期,分別高0.04、0.02、0.02、0.08、0.05。結果體現了NDVI預測模型構建時因子篩選的重要性。流域分區在率定期和驗證期NASH效率系數如圖5所示。結果表明,ANN-PCA和ANN-PAR模型由于經過因子篩選,避免了冗余數據的輸入,有效提高了人工神經網絡的訓練效率。兩個模型的精度顯著高于未經過因子篩選的ANN模型。因此,無效或冗余的輸入數據是人工神經網絡誤差產生的重要原因,而因子篩選江有助于人工神經網絡模型精度的提高。
在全球氣候變化的背景下,雅魯藏布江流域的生態系統也隨之發生了變化。本研究基于2000-2015年雅魯藏布江流域的MODIS數據和氣象站點數據,分析雅魯藏布江流域植被的空間分布特征,并通過主成分分析和偏相關分析方法進行影響因子篩選,構建了基于人工神經網絡的NDVI預測模型。主要結論如下:
(1)NDVI在雅魯藏布江流域整體上植被覆蓋比較穩定,呈現不顯著的增長趨勢。Hurst指數的分析結果表明,雅魯藏布江干流上游流域(拉孜站以上)呈反持續性,未來植被覆蓋將可能減少,下游區域呈持續性,未來植被覆蓋將持續增加,且持續性從上游到下游逐漸增強。
(2)采用主成分分析和偏相關分析分別對影響雅魯藏布江各子流域NDVI的因子進行了分析,結果表明對NDVI具有顯著影響的降雨和氣溫主要集中在前3個月,同期氣溫的影響要高于降水的影響。
(3)本文所構建的NDVI預測模型具有較高的模擬與預報精度。其中,影響因子的篩選能夠顯著提高人工神經網絡的預測精度。本研究中,使用主成分分析篩選得到的模擬結果相比于偏相關分析得到的模擬果更接近真實值。
論文所建模型和分析結論能夠為西藏生態環境治理提供技術支持。由于人工神經網絡模型的精度依賴于訓練數據,因此該方法適用于具備較長觀測資料,氣象數據較為完整的區域。同時缺乏物理機制的具體分析是人工神經網絡模型的主要缺點,下一步將結合雅魯藏布江流域的植被類型,將在拉薩河等子流域進行典型研究,深入分析其物理機制,并考慮更多的局地影響因子(如高程等)進行綜合分析評價。
□