洪美玲 何士華 李秦

【摘要】本文在計算分析四道河子(三)站30年的實測徑流深資料統計參數的基礎上,分別建立自回歸一階和二階模型、BP神經網絡模型,通過MATLAB實現徑流隨機模擬和預測的過程。結果表明,自回歸模型和BP神經網絡模型預測精度均較高。但是自回歸二階模型與其他的模型相比較,其預測結果更接近實測資料,預測誤差最小,精度更高,能夠較好的預測該站點的年徑流。
【關鍵詞】自回歸模型;BP神經網絡;徑流預測
0、引言
水文現象受氣象條件、人類活動、城市化進程等因素影響。所以,水文信息具有不確定性、模糊性、不充分性等特性。水文徑流資料在水利工程設計、水資源的規劃和利用、防洪、治澇、抗旱等方面發揮著重要的作用。因此,中長期年徑流預測是水文水資源研究的一個重要課題。
本文采用四道河子(三)站的實測年徑流進行單因素預測,即分析年徑流本身隨時間的變化規律來進行預測。自回歸模型、人工神經網絡、灰色預測系統等模型已經較為成熟,在年徑流預測的運用中各有其優缺點和適用性。本文采用這三種模型,對四道河子(三)站水文年徑流資料進行預測和結果分析對比。
1、自回歸模型AR(P)
自回歸模型不僅能反映水文序列的統計參數特性,還能從水文現象物理過程的分析建立隨機模型,自回歸模型在水文上運用最為廣泛。
1.3 AR(P)模型的建立
現有四道河子(三)站1981-2010年,共計30年的實測資料。經分析,徑流資料具有代表性、一致性、可靠性。
本文以1981-2005年共25年的實測資料,模擬2006-2010年的年徑流深,并與2006-2010年的實測徑流深進行對比,判定模型的精度。計算1981-2010年實測資料的自回歸系數,發現隨著滯時數的增加,自回歸系數值在0上下波動,逐漸趨向于0,呈“拖尾性”。
本文選用自回歸模型的AR(1)和AR(2)模型來對該站的徑流深進行分析對比。1981-2005年實測徑流深的統計參數,見表1。
1.4 AR(P)序列平穩性驗證與AIC準則
為了使AR(P)序列達到平穩,AR(P)模型中的參數必須滿足平穩性條件。
經過驗證,AR(1)模型和AR(2)模型都滿足平穩條件,均為平穩隨機序列。
根據AIC準側,優先選擇擬合殘差量和參數數量兩項之和的值最小的模型。對AR(P)模型,AIC準則為:
通過計算可知,AIC(2)較小,根據這一準則,可判定AR(2)較好。但是由于AR(1)和AR(2)的計算結果相差不大,說明兩個模型沒有顯著差異,很難判定哪個模型更加接近實際的統計特性,還需進一步分析。
1.5 AR(P)模型的預測結果分析
按照模擬步驟,用已經建立好的AR(1)和AR(2)模型進行2006-2010年的年徑流深預測,將兩個模型的預測結果進行對比,可以看出,AR(1)模擬出的年徑流深與實測值相比誤差范圍在4%以內,AR(2)模擬出的結果與實測值相比誤差范圍在1%以內,AR(2)模型的模擬結果誤差更小,精度更高。
總體而言,AR(1)和AR(2)模型的預測值都能與實測年徑流趨勢保持一致,但是,結合上文中的AIC準則的計算值和預測誤差,AR(2)模型更符合該站點的實際情況。同時,AR(1)模型雖然能用來描述實測年徑流量的統計特性,但是在序列長度相當大并且序列為正態分布的情況下才是完全正確的。本文僅采用30年的實測長度,又屬于偏態分布,因此,兩個模型中選用AR(2)模型。
2 、BP神經網絡模型
BP神經網絡是一種包含輸入層、隱含層和輸出層的前向網絡結構,其流程可分為BP神經網絡模型構建、神經網絡訓練、神經網絡預測三個步驟。現有四道河子(三)站1981-2010年30年的年徑流深資料,將前25年的資料作為訓練學習樣本,后5年作為檢測樣本。經過不斷的試運行,選擇前10年作為輸入樣本,輸入層為10,第11年作為輸出樣本,輸出層為1,隱含層節點數選為5,所建網絡模型為3層,模型結構為10-5-1,采用滾動式預測,模型預測結果,見表2。
從表2可以看出,該模型的預測值與實測值的誤差控制在6%之內,模型有較強的擬合能力和自適應能力,表示出了輸入與輸出之間的非線性關系。
人工神經網絡的建立,需要依靠大量的實測資料為基礎,本文現有的資料年限較短,信息不充分,導致BP神經網絡模型的訓練學習能力降低。同時,對于BP神經網絡模型,僅考慮年徑流這一個變量時,輸入層單元數和隱含層數難以確定,只能通過不斷的試行來確定最佳參數,并且運用該模型預測后續年份的數據時,采用滾動式預測,造成模擬過程繁瑣和預測的數據分布集中的現象。
從模型的運用情況分析,適當增加模型的輸入層變量,例如蒸發,相對濕度、降雨等變量因子,或是先對年徑流深數據進行小波分解分解出來的小波序列作為輸入層,會更好地提高預測精度。
3、結語
本文利用四道河子(三)站1981-2010年30年的實測徑流深的水文資料,通過上述各個模型分析對比可知,在綜合考慮模型的建立、預測精度、實測數據的信息量等方面的基礎上,AR(2)模型能夠較好的反映實測序列,因此,四道河子(三)站的年徑流預測可采用AR(2)模型。
BP神經網絡模型在該站點的預測結果與實際年徑流趨勢基本保持一致,但是模型的建立繁瑣,需要不斷更新信息。在現有的實際資料不充分的情況下,不建議采取傳統的BP神經網絡模型。
自回歸AR(P)模型具有時間相依和非常直觀的表達形式,同時,模型的建立簡單,應用方便,可以通過現有的較短的實測資料模擬預測出更長的水文序列。但是,影響水文序列的因素有很多,例如氣象因素,人類活動的影響等,一般的,在建立AR(P)模型時,完全只依據數據資料來進行模擬,沒有考慮其他影響因素。因此,在進行水文資料的模擬預測時,可以運用其他模型輔助運行,提高模擬水文序列的精確度。
4、參考文獻
[1] 朱聰.徑流中長期預測模型研究[D]. 成都:四川大學,2005.
[2] 王文圣, 丁晶, 金菊良. 隨機水文學[M]. 北京: 中國水利水電出版社, 2008.
[3] 張云輝, 徐敏, 張莉莉. 自回歸模型AR(P)在模擬年徑流系列中的應用[J]. 水土保持應用技術, 2013, (3):14-15.
[4] 鐘明春. 夾江站年徑流自回歸模型的研究[A]. 中國水利學會2006年學術年會[C]. 2006, 313-318.
[5] 崔東文. 多隱層BP神經網絡模型在徑流預測中的應用[J]. 水文, 2013, 33 (1): 68-73.
作者簡介:洪美玲(1993-),女,江蘇南通人,碩士研究生,研究方向:水資源系統分析與可持續利用。