趙 普,谷艷昌,2*,吳云星,2
(1.南京水利科學研究院大壩安全與管理研究所,江蘇 南京 210029;2.水利部大壩安全管理中心,江蘇 南京 210029)
壩體和壩基的滲流監測是土石壩安全運行監控不可或缺的部分,也是大壩整體穩定性分析的重點研究對象。目前,在大壩安全監控領域主要采用的數學模型分為傳統模型和智能模型。傳統模型主要為常規統計模型、確定性模型、混合模型3種[1];而隨著模糊理論、灰色關聯分析、支持向量機和人工神經網絡等的發展,各種智能模型也相繼應用到大壩監測上來,這些智能方法有效地改善了傳統方法非線性泛化能力不足的缺點,成為當下研究的熱點。
人工神經網絡有著自適應、自學習、自組織和高度容錯性的特點[2],能很好地解決傳統回歸分析很難建立多因素非線性分析的缺點。但人工神經網絡在實際應用時也有一定局限性,如傳統的反向傳播(Back Propagation,BP)神經網絡存在網絡收斂速度慢、泛化能力弱、易陷入局部極小值[3],且不能獲取數據序列中的時間信息等缺點。
NARX(Nonlinear Auto-regressive with Exogenous inputs neural network,帶外源輸入的非線性自回歸神經網絡)神經網絡最先由Siegelmann H T在1997年提出,并說明在涉及長期時間序列問題上,NARX具有優秀的表現[4]。NARX是一種動態神經網絡,特點是加入了延時和反饋機制,增強了對歷史數據的記憶能力[5],可被應用于解決多種領域的非線性序列預測問題。傳統神經網絡的輸入變量可以認為是彼此獨立的,時序關系一般不考慮[6],而NARX不僅考慮了歷史值的影響,還將自身預測值作為反饋輸入,在時序預測中更有優勢。
范哲南等[4]將NARX引入到大壩變形預測中,應用結果表明,NARX在預測精度和收斂速度上都優于傳統BP神經網絡。朱新遠等[7]將NARX用于短時交通流量預測,結果表明NARX具有良好泛化能力和較高預測精度。史如新等[8]建立了一種基于NARX的神經網絡—小波分解組合算法,實現了對光伏發電的有效預測,相較于BP網絡收斂速度更快、誤差更小。
在大壩安全監控指標中,土石壩的滲透壓力存在明顯的滯后效應[9],基于這一特點,引入NARX神經網絡,利用其獨特的延時輸入機制來模擬壩體水流滲透的滯后性,分別建立多因子和單因子模型進行滲壓預測,并與傳統回歸模型和傳統BP神經網絡做對比來表明其時序預測的優勢。
NARX神經網絡是一種用于描述非線性離散系統的模型,對時序數據有良好的擬合和預測能力。其函數關系表示為:
y(t)=f{u(t-Du),...,u(t-1),u(t),y(t-Dy),…,y(t-1)}
(1)
式中u(t),y(t)——該網絡在t時刻的輸入和輸出;Du——輸入時延的最大階數;Dy——輸出時延的最大階數;u(t-Du),…,u(t-1)——相對于t時刻的歷史輸入;y(t-Dy),…,y(t-1)——相對于t時刻的歷史輸出;f——網絡擬合得到的非線性函數。
標準NARX網絡是一個雙層前饋網絡,分別為隱藏層和輸出層,其中在隱藏層有1個tanh-sigmoid傳遞函數,在輸出層有一個線性傳遞函數[10]。
隱含層雙曲正切傳遞函數:
(2)
輸出層線性鏈接函數:
linear(x)=x
(3)
NARX是一種較早出現的遞歸神經網絡,遞歸算法涉及多次使用單步模型,即使用前一個時間步的預測值作為下一個時間步預測的輸入。該網絡使用抽頭延遲線來存儲x(t)和y(t)序列的先前值。由式(1)可知,y(t)也是y(t-1),y(t-2),…,y(t-d)的函數,該網絡的輸出y(t)通過延遲反饋給網絡的輸入,可實現更精確的預測。

確定輸入、輸出變量后,選擇一定長度的監測數據序列作為樣本數據。序列過長會導致網絡訓練慢,還會出現過擬合,序列過短則會欠擬合,達不到預期效果。受到環境和儀器本身因素的影響,效應量監測數據往往由真實值和觀測誤差(噪聲)組成[13],因此需要對樣本數據進行降噪處理,以取得穩定的網絡訓練效果。此外,為了消除水位和降雨之間的量級差,還需要用Min-Max函數對數據進行歸一化處理:
(4)
式中x*——歸一化值;xmax、xmin——數據中最大值和最小值。
NARX網絡結構可分為開環(圖1)和閉環(圖2)。在網絡訓練過程中,真實輸出是可用的,因此開環訓練將使用真實輸出而不是反饋輸出。這樣有2個優點:第一,前饋網絡的輸入更準確;第二,生成的網絡為純前饋架構,可以使用更高效的算法進行訓練。訓練完成后,將網絡轉換成閉環連接,此時預測值將反饋到輸入層。

圖1 NARX開環網絡結構

圖2 NARX閉環網絡結構
同時建立NARX多因子和單因子模型、BP多因子和單因子模型以及逐步回歸模型,對同一組數據進行擬合預測,以均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對誤差百分比(MAPE)作為精度指標,在3種模型中比較優劣。同時,在單因子條件下與傳統BP網絡對比,分析其時序預測的能力。NARX網絡預測模型構建及評價流程見圖3。

圖3 模型構建及評價
某水庫位于江蘇省宜興市,是一座大(2)型水庫,水庫正常蓄水位35.00 m,設計洪水位38.75 m,校核洪水位40.36 m。大壩為均質土壩,壩頂高程42.10 m,最大壩高24.10 m。大壩滲流壓力監測采用測壓管與振弦式滲壓計組合形式,共布置8個監測斷面、37個測點。
選取該水庫大壩樁號1+643的6號測壓管,數據采樣頻率為1組/天,從2012年1月1日到2014年8月31日共974組數據作為樣本數據,進行小波降噪后見圖4。由于遞歸算法允許誤差累積,隨著時間長度增加,預測值有可能失真,故劃分前944組數據用于網絡訓練和測試,以后30組數據對訓練完成的網絡進行仿真預測,建立對照組對預測結果進行評價。

圖4 實測數據與降噪處理數據過程線
網絡運行環境為Matlab-R2020b,樣本數據可分為訓練集、驗證集和測試集,其中測試集用來反映模型訓練結果的好壞,而驗證集在模型訓練過程中可以防止過擬合現象。在測試集數量為總數據15%的條件下,通過建立多個對照組,確定驗證集數量為15%,驗證集對測試集的影響變化見圖5。同理,其他參數通過對照試驗確定最優。對于多因子模型,延遲數d設為2,即當前y值取決于前2個x值,隱含層節點數為10;對于單因子模型,由于輸入變量維數減少,應當增加延遲數、適當減少隱含層節點,最終確定d=4、節點數為4;訓練最大迭代次數為1 000。訓練算法采用Levenberg-Marquardt (LM),這種算法收斂速度快,適用于大多數問題的求解。

圖5 驗證集對模型訓練結果影響
給出多因子模型訓練效果見圖6。從圖6中可以看出,所選數據非常契合NARX網絡,擬合效果很好,各個數據集的相關系數R都十分接近1。

a)訓練集:R=0.999 77

b)驗證集:R=0.999 62

c)測試集:R=0.999 53

d)總數據:R=0.999 7
從表1可知,在3種評價指標下,NARX網絡無論是多因子還是單因子模型,泛化能力和預測精度均優于其他2種傳統方法;對比圖7、8,NARX網絡在單因子條件下仍有不錯的表現,而BP網絡欠佳,表明NARX有效獲取了訓練數據中的時間信息,一定程度上模擬了壩體滲透壓力的滯后性,對于大壩滲壓預測有良好應用價值。

表1 評價指標統計

圖7 多因子預測結果對比

圖8 單因子預測結果對比
針對傳統回歸模型和傳統BP神經網絡的不足之處,以及土石壩滲流壓力的滯后性,提出了將具有延時輸入特性的NARX神經網絡引入到大壩安全監控預測,建立了NARX多因子和單因子模型以及對照組。在3種評價指標下,得出以下結論。
a)NARX神經網絡優于傳統逐步回歸方法和BP神經網絡,具有良好的泛化能力和預測精度。
b)NARX的延遲輸入特性,可在一定程度上模擬壩體水流滲透的滯后性,可在輸入變量較少的條件下實現較準確的預測,能為大壩安全監控提供更優的措施。