趙夢薇 蒲笑非 鄭 曉 袁 航 鐘思潔
(核反應堆系統設計技術重點實驗室,四川 成都610213)
經典控制理論三要素包括模型、優化和反饋校正。隨著控制過程復雜性的提高,控制理論的應用日益廣泛,但其實際應用不能脫離被控對象的數學模型,因此,對象模型是優化控制的基礎,利用控制理論去解決實際問題時,首先需要建立被控對象的數學模型。
反應堆控制對象具有多變量、非線性、強耦合的特性,控制難度較大,為了進一步提升系統控制性能,建立精確的動態數學模型顯得尤為重要。反應堆的辨識是指基于試驗或實際運行數據,建立反映反應堆動態特性的數學模型。
人工神經網絡是模擬人腦思維方式的數學模型,反映了人腦功能的基本特征,如并行信息處理、學習、聯想、模式分類、記憶等。理論上神經網絡能逼近任何非線性函數,通過離線和在線學習給不確定系統提供了自適應和自學習的能力,運算快速,且具有強容錯性,可以解決多變量問題。
因此,本文擬采用神經網絡BP算法實現反應堆系統參數的辨識。
反應堆核燃料裂變反應產生熱量,通過一回路冷卻劑將熱量帶出堆芯,并在蒸汽發生器的傳熱管中與二回路介質進行熱交換,實現一、二回路的能量傳遞,在二回路產生蒸汽驅動汽輪機發電。
反應堆冷卻劑系統是核動力裝置的主要系統,反應堆核裂變過程產生能量,在一回路循環的冷卻劑將堆芯熱量傳遞給蒸汽發生器二次側給水,二次側加熱產生蒸汽,推動汽輪機做功。被二次側給水冷卻了的反應堆冷卻劑再返回堆芯,形成閉環。當二回路負荷發生變化時,一、二回路能量失去平衡,在控制系統的協同作用下,核功率、冷卻劑平均溫度、給水流量等相關參數逐漸恢復穩定,最終反應堆到達新的穩態運行點[1]。
RELAP5是輕水反應堆系統瞬態分析最佳估算程序,是一個通用性非常高且得到行業認可的反應堆系統瞬態分析程序。本文采用基于RELAP5程序的反應堆瞬態仿真模型作為研究對象,包括了點堆、反應堆及一回路主要設備、直流蒸汽發生器及其二次側邊界等。基于此,本文選取核功率N、二回路負荷Qw、反應堆冷卻劑平均溫度Tavg、給水流量Fw、蒸汽流量Fs、穩壓器壓力P及主蒸汽壓力Ps為主要辨識參數。
一般地,系統的輸出通常用過去輸出、過去輸入和現在輸入信息進行描述:

本文中,f(.)為BP神經網絡函數輸入輸出數學關系。d表示延遲步數,若延遲步數過小,可能導致數據信息覆蓋不全面,若延遲步數過大,則導致計算成本較高,計算速度較慢。因此,本文選取d=2。
因此,BP神經網絡輸入輸出模型可表示為:

BP神經網絡的基本原理是最速下降法,它的中心思想是調整權值使網絡總誤差最小。網絡學習過程是誤差邊向后傳播邊修正系數的過程。具體原理如下。
假設在訓練三層網絡的學習階段,輸入層、隱含層、輸出層節點數分別為M、N、L。一個樣本p的輸入輸出為{Xp}和{Tp},隱含層的第i個神經元在樣本p的作用下輸入為:

式中,是輸入節點j在樣本p作用時的輸入;wij為輸入層神經元j與隱含層神經元i之間的連接權值;θi為隱含層神經元i的閾值。
隱含層第i個神經元的輸出為:

g(.)表示激活函數。
隱含層第i個神經元的輸出將通過權系數向前傳播到輸出層第k個神經元,而輸出層第k個神經元的總輸入為:

式中,wki為隱含層i與輸出層k之間的連接權值;θk為輸出層神經元k的閾值。
輸出層第k個神經元的輸出為:

對于每一樣本p的二次型誤差函數為:

其中,表示樣本p對應的期望輸出。
則系統對所有N個訓練樣本的總誤差函數為:

權系數將按照誤差函數梯度變化的方向反向調整,使網絡逐漸收斂。
綜上所述,若神經網絡輸出與期望輸出不一致,則將誤差信號從輸出端反向傳播回來,并在傳播過程中不斷修正加權系數,直到輸出端輸出與期望值逼近到一定程度為止。對樣本p完成網絡權系數的調整后,再送入另一樣本模式進行類似學習,直到完成所有樣本的訓練學習為止[2]。
選取小范圍正常功率運行區間[100%FP,90%FP]進行線性變負荷工況仿真。采集每個時刻的核功率、反應堆平均溫度、給水流量、蒸汽流量、需求負荷、穩壓器壓力及主蒸汽壓力相關參數,構成所需的訓練樣本。用于辨識模型的各個分量處在彼此相差很大的數據范圍內,比如冷卻劑平均溫度和一回路核功率,處在小范圍內的分量其變化幅度也小,而處在大范圍內的分量其變化幅度可能很大。因此,為了消除指標之間的量綱影響,有必要采取離差標準化的方法,進行輸入輸出數據的歸一化處理[3]。
(1)隱含層數:綜合考慮辨識及數據的復雜程度,本文選取2層隱含層;
(2)輸入層神經元:輸入參數的維數為7;
(3)輸出層神經元:輸出參數的維數為1;
(4)隱含層神經元:在實際設計中,確定隱含層神經元個數的辦法是:對于給定的輸入輸出模式,通過反復調試和對不同神經元數進行訓練對比得到合適的值。在實際設計中,可以采用隱含層神經元個數選擇的經驗公式:

其中,m為輸入層神經元數,n為輸出層神經元數,s為隱含層神經元個數,a為1~10之間的常數[4]。一般在滿足最低神經元數目的條件的情況下,再多加一到兩個神經元用來加速誤差的下降速度即可。因此,設計隱含層有6個神經元。
(5)訓練函數:選取Levenberg-Marquardt優化算法。該方法學習速度很快,對于中小模的網絡來說,是相對較好的一種訓練算法;
(6)傳遞函數:采用tansig函數,即雙極sigmoid。表示隱含層輸出為[-1,1]之間的實數[5];
(7)辨識準確度:辨識準確度通過普遍采用的均方根誤差(RMSE)來估計[6]。
采集[100%FP,90%FP]工況變化范圍內的數據,隨機排列所有離線訓練樣本,使所需工況范圍均能得到有效覆蓋,讓辨識模型能夠得到充分訓練,從而進一步提高辨識的完備性和可靠性。在訓練過程中,選取75%的數據用于訓練,15%的數據用于驗證,15%的數據用于測試[7]。辨識誤差精度如圖2所示。

圖2 訓練誤差
訓練后輸入層到隱含層1的權重和偏置分別為:

隱含層1到隱含層2的權重和偏置分別為:

隱含層2到輸出層的權重和偏置分別為:

對100%FP~95%FP線性降負荷工況進行仿真。瞬態初期,二回路負荷降低,一、二回路熱能失去平衡,在燃料與慢化劑反饋作用下,反應堆功率下降,一段時間后,重新達到新的穩態。神經網絡輸出與實際仿真輸出對比曲線如圖3所示。精度誤差如圖4所示。

圖3 輸出對比

圖4 測試誤差
從圖中可知,在100%FP~95%FP線性降負荷的辨識過程中,最大精度誤差小于1.2%FP,因此,辨識精度能夠滿足較基礎的控制需求。
對象模型是優化控制的基礎,利用控制理論去解決實際問題時,首先需要建立被控對象的數學模型,模型的準確度將直接影響控制效果,因此,針對反應堆相關系統參數,建立較為準確的模型十分重要。本文基于RELAP5程序的反應堆瞬態仿真模型,采集[100%FP~90%FP]工況下反應堆系統相關參數,通過BP神經網絡實現模型的訓練和測試,針對訓練好的模型進行100%FP~95%FP小范圍線性降負荷的仿真,結果表明,基于BP神經網絡訓練的模型具有較高的精度,能滿足基本控制需求。另外,本文的方法還需進一步深化研究,數據量的大小、數據的選取以及神經網絡的優化是下一步研究方向。