肖 盾,曾文杰,于 濤,*,李松發(fā),雷 鳴,鄧云李,蔡文超,趙 鵬,潘瑞安
(1. 中國(guó)核動(dòng)力研究設(shè)計(jì)院第一研究所,四川 成都,610005;2. 南華大學(xué)核科學(xué)技術(shù)學(xué)院,湖南 衡陽(yáng),421001)
研究堆是核能技術(shù)及應(yīng)用領(lǐng)域中的重要設(shè)施,有效實(shí)現(xiàn)堆芯功率控制是確保研究堆安全運(yùn)行的保障。傳統(tǒng)PID 控制器雖結(jié)構(gòu)簡(jiǎn)單、易操作,但實(shí)際的控制效果取決于控制器參數(shù)整定優(yōu)劣與否,控制器參數(shù)無(wú)法在線調(diào)節(jié)。以一組單一的控制器參數(shù)控制反應(yīng)堆堆芯系統(tǒng),無(wú)法兼顧目標(biāo)跟蹤和外擾抑制,控制效果不佳[1]。為解決PID 控制器參數(shù)的在線調(diào)節(jié)問(wèn)題,將神經(jīng)網(wǎng)絡(luò)自適應(yīng)、自學(xué)習(xí)能力,與PID 控制相結(jié)合,實(shí)現(xiàn)對(duì)PID 參數(shù)的實(shí)時(shí)整定,彌補(bǔ)傳統(tǒng)PID控制復(fù)雜非線性系統(tǒng)的不穩(wěn)定性問(wèn)題,提高控制系統(tǒng)性能。以文獻(xiàn)[2]中的研究堆為對(duì)象,設(shè)計(jì)基于BP 神經(jīng)網(wǎng)絡(luò)PID 控制的堆芯功率控制系統(tǒng),開(kāi)展堆芯功率控制系統(tǒng)在反應(yīng)性擾動(dòng)以及冷卻劑進(jìn)口溫度擾動(dòng)下的仿真,研究對(duì)比傳統(tǒng)PID、BP 神經(jīng)網(wǎng)絡(luò)PID 的控制效果。
采用帶有3 組緩發(fā)中子效應(yīng)的點(diǎn)堆中子動(dòng)力學(xué)模型,結(jié)合堆芯熱工水力模型,考慮到堆芯冷卻劑、燃料等溫度變化引起的反應(yīng)性反饋,建立堆芯非線性模型[2]。
式中:t——時(shí)刻;
T——溫度;
nr——相對(duì)中子密度;
Cr——緩發(fā)中子先驅(qū)核相對(duì)密度;
P——堆芯功率;
β——緩發(fā)中子份額;
λ——緩發(fā)中子先驅(qū)核衰減常數(shù);
ρ——堆芯反應(yīng)性;
Λ——堆內(nèi)瞬發(fā)中子平均壽命;
M——質(zhì)量流量熱容量;
μ——總熱容量;
ff——燃料產(chǎn)熱總份額;
Gr——控制棒移動(dòng)單位長(zhǎng)度引入的反應(yīng)性;
Zr——控制棒位移;
Ω ——堆芯燃料和冷卻劑間的換熱系數(shù);
α——反應(yīng)性溫度系數(shù)。
下標(biāo)f、c、e、l、0 分別表示燃料、冷卻劑、進(jìn)口、出口、初始時(shí)刻。
建立堆芯狀態(tài)空間模型可以分為以下幾步:
(1) 選取堆芯輸出量、狀態(tài)量、輸出量。定義堆芯狀態(tài)空間模型狀態(tài)變量、輸入變量、輸出變量分別為:
(2) 堆芯非線性模型利用微擾理論[7,8]進(jìn)行線性化處理,建立堆芯狀態(tài)空間模型,
BP 神經(jīng)網(wǎng)絡(luò)PID 控制器主要由BP 神經(jīng)網(wǎng)絡(luò)與PID 控制器組成,控制結(jié)構(gòu)如圖1 所示[3]。其中,BP 神經(jīng)網(wǎng)絡(luò)是將系統(tǒng)狀態(tài)反饋到輸入網(wǎng)絡(luò),通過(guò)BP 神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí),不斷對(duì)隱含層權(quán)系數(shù)矩陣進(jìn)行修正,從而實(shí)現(xiàn)PID 控制器參數(shù)的實(shí)時(shí)調(diào)節(jié)。在BP 神經(jīng)網(wǎng)絡(luò)得到PID 控制器參數(shù)Ki,Kp,Kd后,PID 控制器對(duì)被控對(duì)象進(jìn)行閉環(huán)控制,使誤差信號(hào)逐漸減小,最終使系統(tǒng)趨于穩(wěn)定。
誤差反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)有良好的自適應(yīng)自學(xué)習(xí)能力和逼近非線性映射能力[4],并且具有較強(qiáng)的魯棒性和容錯(cuò)性[3],本文采用帶有3 層前饋的BP 神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)如圖2 所示[5],包括輸入層、隱含層和輸出層。每層均有一個(gè)或多個(gè)神經(jīng)元結(jié)點(diǎn),各層節(jié)點(diǎn)之間的連接關(guān)系強(qiáng)弱由權(quán)重系數(shù)來(lái)表征,信息由輸入層經(jīng)隱含層向輸出層傳遞。
BP 神經(jīng)網(wǎng)絡(luò)輸入層的輸入為:
BP 神經(jīng)網(wǎng)絡(luò)隱含層、輸出層的輸入、輸出計(jì)算公式分別如公式(6)、(7)所示。
在獲得PID 控制器3 個(gè)參數(shù)后,由PID 控制器對(duì)被控對(duì)象進(jìn)行閉環(huán)控制,采用如公式(8)對(duì)PID 控制器輸出進(jìn)行計(jì)算。其中,N取100,Ts為神經(jīng)網(wǎng)絡(luò)取樣時(shí)間,取為0.01 s,Ki,Kp,Kd的初始值均取為0.5。
因而,將BP 神經(jīng)網(wǎng)絡(luò)PID 控制流程用圖3表示。在確定BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、設(shè)定神經(jīng)網(wǎng)絡(luò)各初始參數(shù)后,對(duì)系統(tǒng)進(jìn)行采樣并計(jì)算得到誤差函數(shù)E(k),運(yùn)用梯度下降法修正連接權(quán)重系數(shù),以使神經(jīng)網(wǎng)絡(luò)的實(shí)際值和期望值的誤差最小。再根據(jù)公式(5)~(7)計(jì)算神經(jīng)網(wǎng)絡(luò)輸出值,即Ki,Kp,Kd,后將整定后的控制器參數(shù)代入公式(8)中,確定PID 控制器的輸出。
利用堆芯狀態(tài)空間模型,依據(jù)文獻(xiàn)[2]中的研究堆堆芯設(shè)計(jì)參數(shù),基于BP 神經(jīng)網(wǎng)絡(luò)PID 控制器建立研究堆堆芯功率控制系統(tǒng),如圖4 所示。
為研究BP 神經(jīng)網(wǎng)絡(luò)PID 控制器控制性能,開(kāi)展堆芯反應(yīng)性擾動(dòng)、冷卻劑進(jìn)口溫度擾動(dòng)的仿真,并與PID 控制器的仿真結(jié)果進(jìn)行對(duì)比。
在100%FP 初始滿功率水平下,引入50 pcm階躍反應(yīng)性擾動(dòng)時(shí),得到如圖5 所示的響應(yīng)曲線。不論是PID 控制器還是BP 神經(jīng)網(wǎng)絡(luò)PID控制器都能使系統(tǒng)達(dá)到穩(wěn)定。而在BP 神經(jīng)網(wǎng)絡(luò)PID 控制器控制下,堆芯相對(duì)功率偏差和冷卻劑出口溫度偏差超調(diào)量小、穩(wěn)定速度快,控制效果明顯優(yōu)于PID 控制器。而從各堆芯反應(yīng)性偏差響應(yīng)曲線可知,在25 s 時(shí)BP 神經(jīng)網(wǎng)絡(luò)PID控制器下的曲線已達(dá)到穩(wěn)定,而使用PID 控制器下的曲線需要150 s 才能回到穩(wěn)態(tài),綜上所述,由于BP 神經(jīng)網(wǎng)絡(luò)能迅速對(duì)PID 參數(shù)進(jìn)行調(diào)節(jié),BP 神經(jīng)網(wǎng)絡(luò)PID 控制器的控制效果更佳,Kp、Ki、Kd參數(shù)變化曲線如圖6 所示。
在100%FP 功率下,階躍引入冷卻劑進(jìn)口溫度2 ℃時(shí),得到如圖7 所示的響應(yīng)曲線。觀察堆芯相對(duì)功率偏差響應(yīng)曲線可知,受到擾動(dòng)初始時(shí)刻,堆芯相對(duì)功率偏差迅速變化,在40 s時(shí),BP 神經(jīng)網(wǎng)絡(luò)PID 控制器控制下的曲線已經(jīng)達(dá)到穩(wěn)定,超調(diào)量和振幅也明顯小于PID 控制器。由圖7(b)可知,兩條冷卻劑出口溫度偏差曲線幾乎重合,且由于冷卻劑進(jìn)口溫度改變,最終出口溫度的穩(wěn)態(tài)值也發(fā)生了相應(yīng)的變化。此外,對(duì)比兩種控制器控制下的堆芯反應(yīng)性偏差曲線可知,BP 神經(jīng)網(wǎng)絡(luò)PID 控制器和PID 控制器作用下系統(tǒng)達(dá)到穩(wěn)定的時(shí)間分別為28 s 和160 s,前者控制效果明顯優(yōu)于后者,由此可見(jiàn),BP 神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)調(diào)參的能力可以優(yōu)化控制性能,Kp、Ki、Kd參數(shù)變化曲線如圖8 所示。
研究堆可用于同位素生產(chǎn)、材料輻照等方面,是核能領(lǐng)域中的一種重要堆型。為了研究堆堆芯功率控制,分別采用傳統(tǒng)PID 控制和BP神經(jīng)網(wǎng)絡(luò)PID 控制,設(shè)計(jì)堆芯功率控制系統(tǒng),開(kāi)展動(dòng)態(tài)仿真研究。結(jié)果表明,傳統(tǒng)PID 控制器在單一的控制器參數(shù)下,系統(tǒng)階躍響應(yīng)會(huì)產(chǎn)生較大幅度的超調(diào),需要更長(zhǎng)的時(shí)間才能穩(wěn)定。而B(niǎo)P 神經(jīng)網(wǎng)絡(luò)PID 控制器能夠利用神經(jīng)網(wǎng)絡(luò)的自適應(yīng)自學(xué)習(xí)能力,實(shí)時(shí)整定PID 控制器的控制參數(shù),在研究堆堆芯反應(yīng)性擾動(dòng)、堆芯入口溫度擾動(dòng)下,BP 神經(jīng)網(wǎng)絡(luò)PID 控制效果優(yōu)于傳統(tǒng)PID 控制。