李志新,龍云墨
(貴州理工學院土木工程學院,貴州 貴陽 550003)
水資源是維持自然界生態系統不可或缺的基礎性資源之一,同時也是社會經濟發展的重要因素,與水資源有關的水文現象及規律即水文水資源系統。作為水文水資源系統預測的重要部分,徑流預測是水文水資源系統運行方案制定的依據之一,在水電站運行、水庫調度、水資源保護與分配、防洪抗旱等方面有重要的應用價值[1,2,3]。尤其是中長期徑流預測,可對能造成災害損失的水文現象作出提前預報,從而預先采取措施將損失降至最低,對防洪減災具有重要意義;在水庫調度和水電站運行管理中,防洪與抗旱之間,或者蓄水與棄水之間存在一定程度矛盾關系,精度較高的中長期徑流預測,可優化調度措施,使水資源綜合利用效益最大化[4,5,6]。
因此,為實現較高精度的中長期徑流預測,提出了各種方法,傳統常用的有成因分析、水文統計等方法。其中成因分析法預測徑流主要根據歷史大氣環流、海溫分布以及太陽活動信息等因素,影響徑流最重要的因子是降雨,而上述因素與降雨密切相關且通過降雨來影響徑流,因此利用上述關聯關系來對徑流進行預測是研究熱點之一[5];而水文統計方法通過對歷史水文資料進行統計分析進行預測,如利用河川徑流系列自身時變特性規律預測,或對徑流影響因子與徑流相關性進行多元回歸分析。以上方法不足之處是在確定輸入因子以及預測可能出現的極值難度較大[7,,8,9]。水文系統不確定因素眾多,且系統高度復雜、變化隨機,具有高度非線性,故傳統線性方法為主模型的年徑流預測精度和效果還不夠理想[10,11,12]。
人工神經網絡具有并行處理和自學習能力,容錯性能較強,因而廣泛應用于各領域,成效顯著。BP神經網絡作為主流網絡之一,映射能力強、性能好,但也存在一些固有缺陷,其網絡結構屬于靜態性質,對歷史輸入輸出值缺乏記憶聯想,對于時間系列如徑流系列時變特性的適應能力不強,從而影響其年徑流模擬預測效果[13,14,15]。因此,本文采用具有動態反饋性的有外部輸入非線性自回歸神經網絡NARX,構建基于NARX神經網絡的年徑流量預測模型,并以年降雨量及氣溫為影響因子,利用1961—2017年構皮灘站年徑流數據對其年徑流量變化規律進行了實例研究分析,并對NARX和BP網絡模型預測性能進行了對比分析。
NARX是帶有外部輸入的非線性自回歸網絡,因而具有動態反饋性,即其輸出結果是當前外部輸入和歷史輸出結果的非線性函數,由于網絡結構中存在時延以及反饋,因此NARX網絡對歷史信息有記憶和聯想功能,對時間序列的時變規律特性適應能力強[16,17]。NARX網絡模型可表示如下:
y(t)=f(y(t-1),y(t-2),…,y(t-ny),u(t-1),u(t-2),…,u(t-nu))
(1)
式中,f為非線性函數;y(t)為期望目標向量;u(t)為外部輸入向量;y(t-1),y(t-2),…,y(t-ny)為時延后的期望目標向量;u(t-1),u(t-2),…,u(t-nu)為時延后的外部輸入向量。NARX神經網絡拓撲結構圖示如下:

圖1 NARX神經網絡的拓撲結構
圖中u(t)為外部輸入向量;d為時延階數;m為隱層神經元數目;W和b分別為神經網絡的權值及偏置;f1、f2則為各層激活函數,其中隱層的激活函數f1選取tansig函數,輸出層的激活函數f2選取purelin函數,分別表示為下式:
(2)
f(x)=x
(3)
NARX神經網絡訓練采用的是Levenberg-Marquards算法,假設一個最大位移作為區域半徑,然后在該區域內尋找代價函數的極小值點,若目標代價函數值增大,則調整該區域半徑改變范圍,繼續求解;若目標代價函數值減小,則繼續迭代計算[18,19,20]。
為了評價NARX神經網絡模型模擬性能,本文采用以下評價指標:均方誤差MSE、相關系數R、誤差的自相關度及輸入與誤差的互相關度等[21,22,23]。其中均方誤差MSE反映了訓練輸出值與目標值之間的誤差,該值越小,則NARX神經網絡模擬效果就越好,其表達式如下:
(4)
式中,N為訓練樣本總數;y(t)為期望輸出值;y’(t)為網絡訓練輸出值。
相關系數R值范圍在0到1之間,該值越大,則說明模擬數據和實測數據相關度越高,模型的模擬精度也越高;誤差的自相關度表示的是模擬結果與實測數據之間的關聯度,不同時延下,誤差的自相關度值在置信限內越多,則說明模擬效果越好;輸入與誤差的互相關度表示的是,在不同時延下,輸入與誤差之間的互關聯度,其值在置信限內越多,則說明模擬效果越好[24,25]。
根據水量平衡原理,結合物理成因分析,降水、氣溫及下墊面是徑流形成、演變的主要因素,其中降水和氣溫因素變化相對較快,而降水又是最主要的因素。實測資料表明:年降水與年徑流曲線關系密切,一致性較強,有研究采用相關概率法探討降水、氣溫與徑流之間的相關性,結果顯示相關關系顯著,可將其作為預測因子預報徑流[25,26]。因此本文選擇年年降水量及氣溫作為模型輸入因子,以年徑流量作為模型預測對象。
本文采用的是構皮灘站1961—2017年共57年的年徑流量、降雨及氣溫資料系列。該站所在區域地形總體上東北較低,而西南較高,且其在垂直方向上的變化特征較明顯,高差大、切割強。該地屬中亞熱帶季風氣候,季節性較顯著,溫和多雨,濕度較大,日照較少,平均氣溫為13℃~18℃,多年平均降雨為1 159 mm,年降雨量在900~1 400 mm之間。河流受降雨補給,洪水形成主要因素是暴雨,集中時間在5~10月,暴雨量占全年90%左右,尤其是6~7月最為集中,暴雨及匯流迅疾,因而洪水快速漲落且洪量集中。年徑流量等水文特征在下墊面條件變化不大時,其變化主要受降水和蒸發影響,實質上受氣候變化過程等物理原因制約。
NARX神經網絡的拓撲結構關鍵參數為隱含層節點數目以及輸入時延階數,對神經網絡模型的模擬精度效果影響較顯著,本文根據經驗進行初擬,并經過反復試湊確定隱層神經元數目m為10,時延階數d為3,輸入層x(t)以及輸出層y(t)向量維數,取決于本文具體外部輸入向量和預測對象情況,分別為2和1。構建的NARX神經網絡年徑流預測模型拓撲結構如下圖所示:

圖2 NARX神經網絡年徑流預測模型的拓撲結構
同時,在上述構皮灘站1961—2017年共57年的年徑流量、降雨及氣溫資料系列共57組數據樣本中,按照各占總樣本數量55%、20%、25%的比例,選取31組作為訓練集,12組作為驗證集以及14組作為測試集。其中訓練集樣本在訓練過程中輸入到網絡中,神經網絡在完成初始化之后,根據輸出值與標注值之間的誤差不斷進行權值和偏置值的調整;驗證集樣本不直接參與到上述的訓練調整,主要用于測度在訓練過程中網絡泛化能力的表現,在泛化能力停止改進時就停止訓練,從而防止神經網絡訓練中發生過擬合現象,導致泛化能力的下降;測試集樣本對訓練過程不施加影響,而是在訓練期間及訓練后,作為獨立于訓練的樣本數據,對神經網絡的性能進行測試、分析及評價。
NARX神經網絡模型的誤差自相關性、輸入誤差互相關性以及回歸分析分別如下圖3、4、5、6所示:

圖3 誤差自相關圖

圖4 輸入誤差互相關圖

圖5 NARX模型訓練結果的相關性分析
由圖3、圖4以及圖5可以看出,誤差自相關和輸入誤差互相關在初始時,其關聯度較高,而其它大部分都在置信區間范圍內,故能滿足要求。另外,MSE值接近0;NARX模型訓練及測試時,模擬結果與實測值的相關系數R值為0.94、0.89,較接近1,顯示模擬精度效果較好。
模擬結果值與實測數據的比較結果如下圖所示:

圖6 NARX模型預測結果的相關性分析

圖7 NARX模型訓練輸出值與期望值的擬合

圖8 NARX模型預測值與實測值的擬合
從圖7、8中可以看出,預測值和實測值之間的誤差值總體較小,兩者之間擬合性表現良好,其中測試時數據擬合情況如下表1所示,表明利用NARX神經網絡模型對年徑流預測是可行的,其精度效果較好。
為了對傳統常用的逐步線性回歸、BP神經網絡與本文構建的NARX神經網絡年徑流預測模型進行對比分析,本文對上述模型采用完全相同的數據進行學習訓練及測試。下表1反映了上述模型在年徑流預測性能方面的差異。

表1 NARX、BP、及逐步線性回歸模型預測性能對比
從表1比較中可以看出:共14組測試樣本的平均相對誤差、均方根誤差為:NARX模型分別為5.03%、54.81 mm;BP模型分別為7.71%、67.33 mm;而逐步線性回歸模型分別為12.09%、96.78 mm。因此,整體預測效果NARX模型性能表現最佳,以下依次為BP模型和逐步線性回歸模型。上述結果表明,神經網絡模型徑流預測效果整體上優于逐步線性回歸方法,人工智能方法和線性回歸方法原理和特點各異,神經網絡方法更能精確反映和表達復雜系統中動態和非線性的映射關系。在徑流預測分析中,影響因子和預測對象是動態且高度非線性的關系,因此采用基于線性方法為主的模型存在一定局限性,在本文實例研究中,采用人工智能方法用于年徑流預測分析更為合理,預測精度更高,但該結論的普適應仍有待進一步探討。
表1比較分析還顯示:NARX模型預測性能表現優于BP模型。徑流受到降水、氣候及下墊面等重要因素的影響,但徑流變化規律及其預測分析并不僅僅體現于徑流與影響因子的靜態關系,徑流及其影響因素同時具有時變特性規律,有一定的趨勢、周期和突變規律,因此對徑流的變化規律及預測分析研究僅從靜態聯系的角度反映是不夠的,同時也應反映其時變特性規律,才能取得更好的預測分析效果。BP神經網絡屬于靜態神經網絡,輸出僅依賴于當前的輸入,僅根據當前誤差調整權值。NARX神經網絡在結構上增加了承接層,具備動態遞歸的特點,通過承接層保存某一層或者基層結點上一次的輸出,并作用于本次的計算,能充分體現數據的時序性,因而在具有時變特性的年徑流預測分析中,采用如NARX動態遞歸神經網絡比BP靜態網絡更為合理,從而能夠明顯改善年徑流預測效果。
本文針對傳統BP網絡靜態性質在時間系列年徑流預測中的適應性問題,提出基于動態反饋性的NARX神經網絡的年徑流預測方法。將年降雨量及氣溫作為預測輸入因子、以年徑流量為預測對象,構建了基于NARX神經網絡的年徑流預測模型,對構皮灘站年徑流模擬效果較好,可為時間系列年徑流預測實踐起到參考指導作用。另外,對NARX模型與傳統BP及逐步線性回歸模型的性能對比分析顯示:對于年徑流預測,人工智能方法相比基于線性方法的模型,其預測分析精度效果更好。同時,NARX神經網絡的訓練效果及預測精度明顯優于BP網絡,其由于具有動態反饋性質,因而對于時間系列預測具有更好的適應性。