摘要:本文首先介紹了智能控制的發(fā)展和智能控制系統(tǒng)與傳統(tǒng)控制系統(tǒng)的比較,然后綜述了幾種智能控制的主要實現(xiàn)技術(shù),并著重討論了基于人工神經(jīng)網(wǎng)絡(luò)的智能控制。
關(guān)鍵詞:智能控制 人工神經(jīng)網(wǎng)絡(luò)
1 智能控制概述
智能控制是一門將控制論和人工智能結(jié)合起來的多學(xué)科所形成的交叉學(xué)科。總體來說,智能控制是經(jīng)典自動控制技術(shù)的一個新的方法,它通過對現(xiàn)場各種實時情況的分析,可以在無人操作的情況自動完成對控制對象的控制。根據(jù)目前的研究成果,智能控制系統(tǒng)有二元結(jié)構(gòu)、三元結(jié)構(gòu)及四元結(jié)構(gòu)等三種結(jié)構(gòu)特點。
2 多層前向網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是由一個個基本非線性單元,即神經(jīng)元組成的。多層前向網(wǎng)絡(luò)的典型結(jié)構(gòu)如圖1所示。
個神經(jīng)元的閥值,{}則為網(wǎng)絡(luò)的外部輸入。
式(1)和(2)表明,多層前向網(wǎng)絡(luò)對同一層次中的信息是通過并行方式來處理的,正是有這樣的特點,使網(wǎng)絡(luò)輸入至輸出可以十分快速進(jìn)行傳播。
神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程是多種多樣的。這個學(xué)習(xí)過程是自學(xué)習(xí)過程。它使用測試獲得的數(shù)據(jù)或者原有的歷史數(shù)據(jù),學(xué)習(xí)并且建立神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)模型。再通過已有的成熟模型對實際運行過程中新出現(xiàn)的運行工況自動“推斷”出最優(yōu)的運行參數(shù),即自學(xué)習(xí)、自適應(yīng)過程。而目前反向傳播算法(Backpropagation,BP),即BP算法,是使用最多的算法。所謂反向傳播算法是反復(fù)交替地進(jìn)行如下兩個過程(為敘述簡便計,考慮單輸出情況):
第一步:正向過程
由輸入xs驅(qū)動({}={}),逐層計算式(1)、(2),一直求
出網(wǎng)絡(luò)的輸出{ ym ( xs )={ ok },其中,k為網(wǎng)絡(luò)總層數(shù)。
第二步:反向過程
由輸出層(6)式開始反向逐層計算(5),(7),(8),直至第一層。最后作權(quán)值調(diào)整
其中,η>0是步長。之后,針對下一個樣本數(shù)據(jù)開始新一輪的正、反向傳播過程,逐步學(xué)習(xí)修改網(wǎng)絡(luò)權(quán)值。
通過以上的介紹我們可以得出,BP學(xué)習(xí)算法充分利用的是多層前向網(wǎng)絡(luò)的結(jié)構(gòu)優(yōu)勢。同時,該算法的一個突出優(yōu)點是在正、反向傳播過程中,每一層計算都是并行的。
當(dāng)然,BP算法也有它的缺點。由學(xué)習(xí)過程可以知道,當(dāng)輸入一個新輸入時,BP算法會不斷調(diào)整權(quán)值,試圖使網(wǎng)絡(luò)輸出盡可能的符合理想輸出,在這樣不斷的調(diào)整過程中會有極大的可能會破壞原先已“學(xué)習(xí)”過的情況,造成混亂,會“忘記”之前的學(xué)習(xí)“成果”,這就是BP算法的健忘性。因此,至于通過反復(fù)的學(xué)習(xí)才能客服這樣的缺點。實際上,數(shù)據(jù)學(xué)習(xí)的先后是有序的,我們也可以通過打破固定次序造成的局限,隨機的選擇數(shù)據(jù),能讓BP算法“學(xué)習(xí)”得更快。但最佳方法是通過修正目標(biāo)函數(shù)來實現(xiàn)。我們將目標(biāo)函數(shù)修改為
minE=∑ES (10)
對應(yīng)的權(quán)值調(diào)整公式為(11)
式中對每個數(shù)據(jù)進(jìn)行一次正反向的計算,累積所有的梯度。根據(jù)
,最后才作一次權(quán)值修正,逐步學(xué)習(xí)修正網(wǎng)絡(luò)權(quán)值。
3 模型參考自適應(yīng)控制
模型參考自適應(yīng)控制與常規(guī)的系統(tǒng)的模型是相同的,區(qū)別在于采用神經(jīng)網(wǎng)絡(luò)模型NNI來用作對象的辨識。在模型參考自適應(yīng)控制中,用一個穩(wěn)定的參考模型M來表達(dá)所期望的閉環(huán)系統(tǒng)性能指標(biāo),而控制目標(biāo)是使對象的實際輸出yp(t)漸進(jìn)的匹配參考模型的輸出yr(t),即
(12)
該模型中還引入了一個誤差函數(shù),使控制器可以分別由辨識模型和神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)仿射系統(tǒng)和非仿射系統(tǒng)。實際上,學(xué)習(xí)的誤差函數(shù)就是實際對象的輸出yp(t)與參考模型的輸出yr(t)之差。仿真表明這種方法是非常有效的。
4 預(yù)測控制
圖2是一種基于神經(jīng)網(wǎng)絡(luò)模型的預(yù)測控制實現(xiàn)結(jié)構(gòu),該控制方法采用神經(jīng)網(wǎng)絡(luò)作為預(yù)測模型實現(xiàn)對非線性系統(tǒng)的預(yù)測控制,其中的預(yù)測模型是一個NARMAX模型,即:
y(k+1)=f[y(k),y(k-1),…,y(k-ny+1),
u(k),u(k-1),…,u(k-nu+1)](13)
其中,y(k)和u(k)是對象的輸入和輸出,ny和nu是系統(tǒng)的階次。該模型可采用BP網(wǎng)絡(luò)實現(xiàn)學(xué)習(xí)。在預(yù)測控制中,優(yōu)化控制信號的選擇是使目標(biāo)函數(shù)取極值,即:
其中的Sp為設(shè)定值;y(k+i)為輸出預(yù)測值;u(k+i)為控制輸入qi; ,ri為加權(quán)系數(shù);p為預(yù)測長度;M為優(yōu)化長度。根據(jù)上式進(jìn)行優(yōu)化計算,求得最優(yōu)控制u*(k),即
由神經(jīng)網(wǎng)絡(luò)預(yù)測模型可獲得上式的預(yù)測輸出值y(k+j)和梯度值dy(k+j)/du(k+j),因求預(yù)測控制的最優(yōu)控制序列u*(k),u*(k+1),…,u*(k+M)就變得很容易了。然后將u*(k)施加于實際系統(tǒng)進(jìn)行控制,可得到系統(tǒng)輸出y(k+1),再用這些值對神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行修正,就可實現(xiàn)預(yù)測控制中的“反饋校正”。
參考文獻(xiàn):
[1]金西岳,付信鑒.智能控制的進(jìn)展與應(yīng)用.工業(yè)控制計算機.1992.
[2]厲雋懌.許曉鳴.楊煜普.基于神經(jīng)網(wǎng)絡(luò)的智能控制.化工自動化儀表. 1995.
[3]袁曾任.智能控制研究的新進(jìn)展.信息與控制.1994.