蘇嶺東,趙 成,馬祥林
(1.國(guó)網(wǎng)徐州供電公司,江蘇 徐州 221000;2.杭州邦友安派智能科技有限公司,浙江 杭州 310012;3.常州致科自動(dòng)化科技有限公司,江蘇 常州 213001)
在實(shí)際工業(yè)生產(chǎn)過(guò)程中,控制對(duì)象往往具有非線(xiàn)性、時(shí)變不確定性以及控制過(guò)程中各種非線(xiàn)性非高斯噪聲的干擾,難以建立精確的數(shù)學(xué)模型,參數(shù)自整定方法繁雜,因此常規(guī)的PID 控制器往往難以達(dá)到良好的控制效果[1-2]。近年來(lái),在工業(yè)控制領(lǐng)域也出現(xiàn)了神經(jīng)網(wǎng)絡(luò)PID 控制,大大提升了PID 控制器的性能。文獻(xiàn)[3]提出了神經(jīng)網(wǎng)絡(luò)PID 控制的智能算法。文獻(xiàn)[4-5]討論了RBF 網(wǎng)絡(luò)在PID 參數(shù)整定中的應(yīng)用,取得了一定效果。但是在實(shí)際生產(chǎn)過(guò)程中存在大量噪聲,由于噪聲的干擾使得目標(biāo)信噪比很低,在噪聲的干擾下,會(huì)導(dǎo)致Jacobian 值出現(xiàn)波動(dòng),RBF 學(xué)習(xí)過(guò)程出現(xiàn)偏差,系統(tǒng)魯棒性下降。
此外,在實(shí)際設(shè)定值跟蹤系統(tǒng)中,控制對(duì)象具有非線(xiàn)性,噪聲具有非高斯、非線(xiàn)性特點(diǎn)。常用的擴(kuò)展卡爾曼濾波要求噪聲獨(dú)立或相關(guān)的高斯噪聲,無(wú)法適用于非線(xiàn)性、非高斯環(huán)境。
近年來(lái),粒子濾波算法(Particle Filter,PF)在非高斯、非線(xiàn)性系統(tǒng)中得到了廣泛應(yīng)用。PF 粒子濾波算法是基于Monte.Carlo 思想發(fā)展而來(lái)的一種濾波方法,擺脫了擴(kuò)展卡爾曼濾波時(shí)隨機(jī)量必須滿(mǎn)足高斯分布的制約條件[6-10],為解決非線(xiàn)性、非高斯干擾問(wèn)題提供了新的思路,并廣泛應(yīng)用于工業(yè)控制系統(tǒng)[11-12]。文獻(xiàn)[13]在假設(shè)模型已知情況下提出了一種基于粒子濾波的復(fù)合控制系統(tǒng),取得了較好的效果。
針對(duì)以上問(wèn)題,本文提出了一種基于粒子濾波和RBF 辨識(shí)(PF-RBF)的單神經(jīng)元PID 控制系統(tǒng)。利用RBF 神經(jīng)網(wǎng)絡(luò)對(duì)非線(xiàn)性函數(shù)的高精度逼近以及自學(xué)習(xí)的快速性,將PF 和RBF 神經(jīng)網(wǎng)絡(luò)結(jié)合,對(duì)被控對(duì)象過(guò)程實(shí)時(shí)建模,為系統(tǒng)提供精確的 信息(即控制對(duì)象輸出對(duì)控制輸入的靈敏度信息),取代常規(guī)的近似算法,在保留PID 控制魯棒性高和可靠性好等特點(diǎn)的同時(shí),提高控制系統(tǒng)的動(dòng)態(tài)響應(yīng)性能和抗干擾能力。
粒子濾波(PF)算法是在序貫重要性采樣基礎(chǔ)上發(fā)展起來(lái)的一種非線(xiàn)性、非高斯濾波方法,其基本思想是:通過(guò)尋找一組在狀態(tài)空間中傳播的隨機(jī)樣本對(duì)概率密度函數(shù)p(xk|zk)進(jìn)行近似,以樣本均值代替積分運(yùn)算,從而獲得狀態(tài)最小方差估計(jì),而這些樣本即稱(chēng)為“粒子”。采用數(shù)學(xué)語(yǔ)言描述如下:對(duì)于平穩(wěn)的隨機(jī)過(guò)程,假定k-1 時(shí)刻系統(tǒng)的后驗(yàn)概率密度為p(xk-1|zk-1),依據(jù)一定原則選取n個(gè)隨機(jī)樣本點(diǎn),k時(shí)刻獲得測(cè)量信息后,經(jīng)過(guò)狀態(tài)和時(shí)間更新,n個(gè)粒子的后驗(yàn)概率密度可近似為p(xk|zk)[14-16]。隨著粒子濾波數(shù)目的增加,粒子的概率密度函數(shù)逐漸逼近狀態(tài)的概率密度函數(shù),粒子濾波估計(jì)即達(dá)到了最優(yōu)貝葉斯估計(jì)的效果。
具體實(shí)現(xiàn)可按如下步驟進(jìn)行[17-18]:
步驟1:初始化,設(shè)k=0 時(shí),i=1,2,…,N;從p(xk|xk-1,yk)中隨機(jī)抽取n個(gè)樣本;
步驟2:逐點(diǎn)計(jì)算對(duì)應(yīng)的p(xk|yk-1)和p(xk|yk);
譯文:…Lusang King kowtowed and died in a sitting posture…

步驟6:k→k+1,返回步驟3。
通常情況下,系統(tǒng)的Jacobian 信息由常規(guī)方法構(gòu)造,即,或用符號(hào)函數(shù)替代計(jì)算,然而在近似計(jì)算Jacobian 信息的過(guò)程中,難免會(huì)降低自整定的精度和抗干擾能力。
為了保證Jacobian 信息的精度,利用PF 和RBF 神經(jīng)網(wǎng)絡(luò)具有結(jié)構(gòu)簡(jiǎn)單,訓(xùn)練過(guò)程快速易行的特點(diǎn),對(duì)被控對(duì)象過(guò)程實(shí)時(shí)辨識(shí),為系統(tǒng)提供精確的Jacobian 信息。相比傳統(tǒng)的辨識(shí)方法,PF 和RBF 神經(jīng)網(wǎng)絡(luò)對(duì)時(shí)變非線(xiàn)性自校正模型不僅結(jié)構(gòu)簡(jiǎn)單,而且具有更高的精度和自適應(yīng)能力。如圖1所示,由于在系統(tǒng)辨識(shí)的過(guò)程中存在非線(xiàn)性、非高斯噪聲,利用PF 對(duì)系統(tǒng)輸出yout進(jìn)行濾波,用e2=ye-ym作為目標(biāo)函數(shù)訓(xùn)練RBF 神經(jīng)網(wǎng)絡(luò),來(lái)保證辨識(shí)的精度,進(jìn)而提高Jacobian 值精度和抗干擾能力。

圖1 基于PF&RBF 的PID 參數(shù)自整定結(jié)構(gòu)圖
PF 和RBF 系統(tǒng)辨識(shí)算法如下[1-3,5,8]:
在系統(tǒng)辨識(shí)結(jié)構(gòu)中,X=[x1,x2,…,xn]T為網(wǎng)絡(luò)的輸入向量。設(shè)RBF 網(wǎng)絡(luò)的徑向基H=[h1,h2,…,hj,…,hm]T,其中徑向基hj選擇高斯基函數(shù):

網(wǎng)絡(luò)的第j個(gè)節(jié)點(diǎn)的中心矢量為:

設(shè)網(wǎng)絡(luò)的基寬向量為:

式中,b1為節(jié)點(diǎn)j的基寬度參數(shù),且為大于零的數(shù)。網(wǎng)絡(luò)的權(quán)重為:

系統(tǒng)辨識(shí)器的性能指標(biāo)函數(shù)設(shè)計(jì)為:


辨識(shí)網(wǎng)絡(luò)的輸出為:

式中,η為學(xué)習(xí)速率,α為動(dòng)量因子,yout為系統(tǒng)輸出,ym為系統(tǒng)辨識(shí)輸出,ye為粒子濾波輸出,根據(jù)前文的算法步驟計(jì)算得出。
關(guān)鍵的Jacobian 信息可由如下算法得到:

式中,x1=u(k)。
人工神經(jīng)網(wǎng)絡(luò)PID(Artificial Neural Network PID,ANNPID)控制器通過(guò)學(xué)習(xí)算法進(jìn)行權(quán)系數(shù)調(diào)整,實(shí)現(xiàn)自適應(yīng)、自組織功能,具有結(jié)構(gòu)簡(jiǎn)單,反應(yīng)快,信號(hào)變化適應(yīng)性好,魯棒性強(qiáng)等特點(diǎn)。典型的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法包括有監(jiān)督的Hebb 算法、無(wú)監(jiān)督的Hebb 算法、有監(jiān)督的Delta 算法等,其中Delta 算法速度快、精度高,故本文選用Delta 算法,基本算法如下[13]:

圖2 表明RBF 神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)階段出現(xiàn)了偏差,隨后能夠較好地跟蹤PF 濾波輸出,表明系統(tǒng)辨識(shí)效果良好,反應(yīng)速度快,辨識(shí)時(shí)間約為0.006 s。

圖2 有PF 濾波時(shí)系統(tǒng)的階躍響應(yīng)
圖3 表明在遇到非高斯噪聲時(shí),PF 和RBF 神經(jīng)網(wǎng)絡(luò)辨識(shí)輸出波動(dòng)幅度小,魯棒性強(qiáng),能夠較好地跟蹤目標(biāo)輸入,保證了系統(tǒng)辨識(shí)的精度。
圖4 顯示了Jacobian 值在噪聲干擾下有濾波和無(wú)濾波情況下的數(shù)據(jù),可以看出,在無(wú)濾波情況下噪聲干擾使得Jacobian 值出現(xiàn)了波動(dòng),產(chǎn)生了誤差,無(wú)濾波時(shí)Jacobian 信息為-0.020 5,有PF 濾波時(shí)Jacobian 信息為-0.0 101,雖然穩(wěn)定后相差不大,但這將對(duì)系統(tǒng)的動(dòng)態(tài)性能產(chǎn)生不利的影響。并且在系統(tǒng)響應(yīng)曲線(xiàn)第一次達(dá)到期望值和有噪聲干擾時(shí),無(wú)PF 濾波時(shí)Jacobian 值會(huì)出現(xiàn)嚴(yán)重的跳躍,造成網(wǎng)絡(luò)參數(shù)需要多次訓(xùn)練來(lái)重新調(diào)整,使響應(yīng)曲線(xiàn)出現(xiàn)較大超調(diào)。而有PF 濾波時(shí)Jacobian 值波動(dòng)明顯減小,系統(tǒng)輸出曲線(xiàn)平穩(wěn)上升,超調(diào)量較小。

圖3 有噪聲干擾時(shí)的系統(tǒng)輸出響應(yīng)

圖4 神經(jīng)網(wǎng)絡(luò)辨識(shí)輸出的Jacobian 值
圖5 表明系統(tǒng)在有PF 時(shí)和無(wú)PF 時(shí)動(dòng)態(tài)性能的比較,可以看出系統(tǒng)的控制性能得到了提高,具體動(dòng)態(tài)性能指標(biāo)如表1 所示。由此可見(jiàn),基于PF 和RBF 辨識(shí)的PID 控制可以明顯減小2 階系統(tǒng)的調(diào)節(jié)時(shí)間和超調(diào)量,并且可以預(yù)見(jiàn)粒子數(shù)越多,系統(tǒng)響應(yīng)的動(dòng)態(tài)特性會(huì)越好。最后PID 參數(shù)自整定的結(jié)果分別為80.011 1、50.007 6、6.578 2。

圖5 單位階躍輸入時(shí)2 階系統(tǒng)輸出響應(yīng)

表1 單位階躍輸入時(shí)二階系統(tǒng)動(dòng)態(tài)性能指標(biāo)
圖6 表明3 階加純延時(shí)控制系統(tǒng)在有粒子濾波時(shí)的抗干擾能力和超調(diào)量比無(wú)粒子濾波時(shí)系統(tǒng)響應(yīng)有顯著提高。但PF 作為一種采樣貝葉斯算法,一方面,隨著粒子數(shù)的增加,更加趨近狀態(tài)的真實(shí)后驗(yàn)概率密度,使得系統(tǒng)抗干擾能力提高,對(duì)抑制非線(xiàn)性非高斯干擾時(shí)具有明顯優(yōu)勢(shì)。另一方面,隨著系統(tǒng)階數(shù)和粒子數(shù)的增加,算法計(jì)算量隨之增大,使得系統(tǒng)上升時(shí)間明顯變大,系統(tǒng)響應(yīng)速度變慢。

圖6 單位階躍輸入時(shí)3 階系統(tǒng)輸出響應(yīng)
長(zhǎng)期以來(lái),工業(yè)過(guò)程控制中對(duì)不精確模型和非線(xiàn)性非高斯干擾較難控制,本文采用PF 和RBF 神經(jīng)網(wǎng)絡(luò)辨識(shí)的方法消除非線(xiàn)性、非高斯噪聲對(duì)控制系統(tǒng)的影響,提高了神經(jīng)網(wǎng)絡(luò)辨識(shí)的精度,從而輸出精確的Jacobian 信息。仿真實(shí)例表明,相對(duì)于無(wú)PF 濾波的RBF 辨識(shí)的控制系統(tǒng),本文提出的方法能改善控制系統(tǒng)的性能指標(biāo)和抗干擾能力。但PF屬于一種數(shù)值仿真技術(shù),采用大量粒子模擬概率分布,故計(jì)算量大,如何提高系統(tǒng)實(shí)時(shí)性和計(jì)算效率有待近一步改進(jìn)。