王永濤,肖俊辰
(1.重慶安全技術職業學院, 重慶 404020; 2.武漢理工大學計算機科學與技術學院, 武漢 421000)
隨著科技水平和人工智能的發展,各國對無人車的研究水平也不斷地深化。目前,無人偵察車不僅僅在軍事方面還在很多民用行業得到廣泛的應用[1]。對于無人化平臺西方發達國家研究較早技術也更成熟先進,如美國的Mini-Flail無人掃雷車、德國的Minebreaker2000型無人掃雷車等,而我國技術與其存在較大差距,特別是無人偵察車[2]。針對目前無人偵察車伺服控制系統控制誤差大、精度低等問題,傳統的PID控制在無人偵察車伺服控制系統中具有很多的局限性:控制效果、抗干擾能力等,很難達到預期的控制效果。
為此,本研究針對無人偵察車伺服控制系統設計了一種改進灰色預測單神經元PID控制器控制器。并針對單神經元PID控制器輸出增益調整的困難,引入模糊控制實現在線調整,進而提高系統的控制品質。通過序列-殘差聯合灰色預測單神經元PID控制的無人偵察車系統獲得優良的動、靜態性能及抗擾動能力。
無人偵察車(unmanned reconnaissance vehicle,URV)目前在軍事上扮演著非常重要的角色,是一個智能水平很高的武器裝備。其實際的運行效果通常采用直流伺服電機伺服控制來完成,這也是伺服控制的關鍵,伺服系統一般由控制器、驅動器、伺服電機等環節組成[3]。一般伺服控制器的控制對象為伺服驅動器,驅動器來驅動伺服電機的運轉進而完成對電機轉速的控制;此外,伺服電機與無人偵察車車輪之間通過減速器實現伺服控制,同時伺服電機的轉速與姿態反饋機構將相應信息反饋給控制器,并與設定值之間產生的差值進行對比,最終實現無人偵察車的優良控制[4],控制原理如圖1所示。

圖1 無人偵察車控制原理框圖
通過圖1的無人偵察車伺服控制的原理圖能夠得到其伺服控制系統,各個環節用傳遞函數表示,如圖2所示。其中伺服控制器由兩個單元組成G1(s)和G2(s),其中G1(s)為伺服電機的姿態控制單元,G2(s)為速度控制單元;G3(s)為伺服驅動器單元;G4(s)為伺服電機單元;G5(s)為減速裝置單元;G6(s)為被控對象;此外還有3個反饋環節,分別是電流反饋H3(s),速度反饋H2(s)和姿態反饋H1(s)。

圖2 伺服系統框圖
由伺服控制器內部結構特點可知,其數學模型可以類比于晶閘管相控整流電源,即該環節可以等效為一個帶比例的滯后環節[5],通過信號調理電路將相應PWM信號輸出到伺服電機,其一階慣性環節為:
(1)
式中:K1為輸出增益;T1為時間常數,即控制器調理PWM信號周期。
G3(s)為伺服驅動器單元,該環節的作用是將輸出信號進行功率放大,實際上為放大器[6-7]。為了能夠實現對伺服電機轉速的穩定控制,驅動器需要將放大后的信號進行積分調理,經過一系列處理好來控制伺服電機。由驅動器可知,其本身頻率要遠大于電機頻率,該環節可以等效為比例環節,即:
(2)
式中:Ka為伺服驅動器信號放大增益比例系數。
G4(s)為直流伺服電機環節,其傳遞函數為:

(3)
式中:Kt為伺服電機轉矩系數;J為轉動慣量;Ra為電樞電阻;B為黏性阻尼系數;Ke為反電動勢系數。
G5(s)為伺服電機減速裝置單元,該裝置安裝在伺服電機上,其作用用來降低電機轉速,提高轉矩。本研究采用的是星齒輪減速器,通過一定減速比轉化成低速來提高轉矩[8],進而驅動無人偵察車車輪轉動,其傳遞函數為:
(4)
式中,i為減速比。
綜上所述,無人偵察車伺服控制系統傳遞函數為:
(5)
某無人偵察車伺服電機的各環節參數為[6]:m=500 kg;vmax=7.2 km/h;L=0.7 m;R=0.25 Ω;P=0.2 kW;B=0.000 1 N·ms;n=3 600 r/min;Ra=1.05 Ω;kt=ke=0.028 N·m;將以上參數代入可得:
(6)
灰色預測主要是通過對原始數據的處理及相關灰色理論的建立,對系統未來輸出做出相應的預測,這是一種超前控制,該控制具有優良的自適應性和實時性[9]。
本文利用GM(1,1)模型相關理論對系統k+M時刻的值進行預測,設系統輸出時間序列為y(1),y(2),…,y(n0),n0>3;針對輸出數據進行指數化處理可得:
y(0)(k)=ey(k),k=1,2,…,n0
(7)
針對式(7)得到的灰色序列進行累加可得:
(8)
根據式(7)和式(8),可得到GM(1,1)模型的微分方程:
y(0)(k)+ay(1)(k)=b
(9)
式中:a、b為發展系數和灰色輸入。
依據式(9)得其白化方程為:
(10)
發展系數和灰色輸入通過最小二乘法估計為:
(11)

(12)
Y=[y(0)(2),y(0)(3),…,y(0)(n0)]
(13)
通過以上可以得到y(1)(t)在k的解為:
(14)

因此,k+M時刻的值進行預測值為:
(15)
對式(15)得到預測值進行指數和累加逆還原,得到常規灰色預測值為:

(16)
在傳統的灰色預測基礎上,提出了改進的灰色預測模型,即:序列-殘差聯合灰色預測模型。其目的是為了減小預測值的誤差,在常規灰色預測模型預測結果的基礎上對預測值的誤差進行二次灰色模型預測修正。設二次預測初始殘差序列為:
e(0)(k)=y(k)-ypc(k+M)
(17)
對式(17)重新進行常規灰色模型預測,得到殘差修正值的預測值為:

(18)
通過常規灰色預測和殘差修正值預測,序列-殘差聯合灰色預測模型輸出為:
yp(k+M)=ypc(k+M)+ep(k+M)
(19)
在灰色預測控制理論中,建模維數以及預測步數對預測結果有較大的影響,因此,選擇合適的參數才能使序列-殘差聯合灰色預測模型起到超前控制的作用。通常系統滯后或者慣性與預測步數成正比,滯后越大則步數大,反之越小[10]。
隨著人工智能的快速發展,傳統PID控制器的參數已能夠實現在線調整,本研究將采用人工神經網絡與傳統的PID控制器的結合,即單神經元PID控制。該控制器是一個多輸入單輸出,結構簡單,魯棒性與自適應性強[11],其控制結構如圖3所示。

圖3 單神經元自適應PID控制結構示意圖
圖3中,x1(k)、x2(k)、x3(k)分別為單神經元PID控制器的輸入。該控制器主要利用權值的調整改變實現傳統PID控制參數的調整,具有一定的自學習和自組織能力。因此,權值的調整對整個控制器的性能影響很大,直接決定著無人偵察車的控制好壞。目前,對于其調整主要由無監督的Hebb學習規則、有監督的Hebb學習規則等[12],本文將采用有監督的Hebb學習規則來改變權值的大小。
由圖3可知,單神經元PID控制由3個輸入,分別為:

(20)
因此,有監督的Hebb學習規則的單神經元PID控制算法如下:
(21)
(22)
w1(k)=w1(k-1)+ηIz(k)u(k)x1(k)
(23)
w2(k)=w2(k-1)+ηPz(k)u(k)x2(k)
(24)
w3(k)=w3(k-1)+ηDz(k)u(k)x3(k)
(25)
z(k)=e(k)
(26)
式中:ηI為積分學習速率;ηP為比例學習速率;ηD為微分學習速率;K為神經元比例系數。
在單神經元PID控制中,神經元比例系數K值對控制器快速性和調節時間都有著密切的聯系,與快速性成正相關,與調節時間負相關,其值太大,系統的快速性將越好、調節時間越短,反之,快速性變差、調節時間變長。同時其值太大也會造成系統過大的超調量甚至不穩定,反之,系統的穩定性更好。
為了提高無人偵察車系統快速、準確地跟蹤系統設定值,采用改進的單神經元PID控制,即將xi(k)變成e(k)+Δe(k),即具體算法如下:
(27)
(28)
(29)
針對神經元比例系數K值的選擇一般按照經驗取值,該參數既影響系統的快速性也影響系統的穩定性,過大過小都會造成系統不良影響,參數值太大系統快速性將越好、調節時間越短,超調量變大;過小將造成系統穩定性好,但快速性變差。為了避免參數選擇的隨意性和盲目性,實現參數的在線調整,為此引入了模糊控制來改變單神經元PID控制中的神經元比例系數K值[13]。其中,模糊控制控制不需要精確的數學模型,能用不精確的輸入處理非線性問題,并且能比大多數非線性控制器可以獲得良好的控制性能。
通過MATLAB軟件設計模糊控制器,本研究以系統誤差變量e和誤差變化率ec作為二維模糊控制器的輸入,K值作為模糊控制器的輸出,其中,將系統誤差變量e和誤差變化率ec的基本論域為[-6,6],輸出變量為增益K的基本論域為[-3,3]。對上面的輸入、輸出變量,將模糊子集定義為{NB、NM、NS、ZO、PS、PM、PB},分別對應{負大、負中、負小、零、正小、正中、正大}。針對以上輸入輸出的模糊變量的隸屬度函數均選擇為三角形類型,同時模糊控制中模糊規則的一般是在總結工程技術人員的技術知識和實際經驗而建立的,其中切換增益模糊參數規則如表1所示。

表1 模糊控制規則
傳統模糊控制的模糊規則在最初設定好以后將不再隨著模糊控制器的輸入的變化而變化,其控制精度將會大大降低,為此,本文提出了一種變論域模糊控制。變論域模糊控制是在傳統模糊控制的基礎上引入伸縮因子時刻跟著誤差及誤差變化率的變化來調整伸縮因子,進而改變模糊規則,此時模糊規則只是進行相應的伸縮,同時保持規則不變,解決了控制性能與規則數量之間的矛盾[14]。
由于模糊規則的數量也會影響模糊控制的性能,隨著數量的增加將會大大提高系統控制精度,但也會伴隨著推理難度、耗時等的增加,因此不能靠增加模糊規則數量來提高控制精度,通常傳統的模糊控制的響應速度不夠快、控制精度差,為此本文引入伸縮因子來調整模糊規則,論域的伸縮變換如圖4所示。由圖4可知,在模糊規則不變的情況下,通過系統誤差進行伸縮或膨脹模糊論域,當誤差較大時,通過膨脹論域進而使模糊控制器能夠調節的更快,相反,若誤差減小,則壓縮論域,使模糊控制器的精度更加準確。因此,變論域模糊控制能夠在不改變控制規則數量的情況下,根據系統誤差在伸縮因子作用下使論域伸縮變化來提高模糊控制的響應速度和精度。

圖4 論域的伸縮變換示意圖
本文以模糊單神經元PID控制器為例,設無人偵察車系統誤差的基本論域為[-Ee,Ee],誤差變化率的基本論域為[-Eec,Eec],輸出增益變量的基本論域為[-K,K]。模糊控制在引入伸縮因子后,其論域調整的表達式為:

(30)
式中:αe、αec為輸入變量的伸縮因子;βk為輸出變量的伸縮因子。
模糊單神經元PID控制引入伸縮因子后,其結構如圖5所示,該控制器以無人偵察車伺服控制系統的速度設定值,本文為1 m/s,輸出則為無人偵察車伺服控制系統的實際運行速度。對于輸入變量和輸出變量的伸縮因子受系統誤差及誤差變化率的影響,誤差增大,論域膨脹,誤差減小,論域壓縮。因此,選擇合適的伸縮因子方法將大大決定變論域模糊的控制控制的精度。

圖5 變論域模糊單神經元PID控制結構框圖
針對變論域伸縮因子的選擇,本文選擇基于誤差分級選擇變論域模糊控制器的伸縮因子。對無人偵察車伺服系統的誤差進行分級處理,將誤差劃分為如下幾個區域,區間1:[-emax,-0.6emax]∪[0.6emax,emax],區間2:[-0.6emax,-0.4emax]∪[0.4emax,0.6emax],區間3:[-0.4emax,-0.2emax]∪[0.2emax,0.4emax],區間4:[-0.2emax,0.2emax],為了克服模糊推理法選擇的伸縮因子帶來的困難,將系統誤差劃分以上4個區域,對于每個區域選擇一組固定的αe、αec、βk值。其中,emax=r。對于在各個誤差區間的伸縮因子如表2所示[15]。

表2 誤差分級選擇伸縮因子
利用式(6)建立的無人偵察車伺服控制系統傳遞函數分別進行改進灰色預測單神經元PID控制器和傳統PID控制器進行仿真,設定無人偵察車的設定速度為1 m/s,其不同算法下的無人偵察車速度控制曲線如圖6,其中,傳統PID控制算法的比例、積分、微分系數通過專家經驗多次調節、試湊得來,并選取較理想的參數。由圖6仿真結果可知,傳統的PID控制響應速度慢,并且是多次調節而來,由此可見傳統PID控制的弊端和不足;而本文方法(改進灰色預測單神經元PID控制器)控制響應速度快,且上升時間、峰值時間等大大減小,穩態誤差減小,其具體數值如表3所示。由于單神經元PID算法具有一定的自學習能力,能夠實現參數的在線調整,無需人工干預,且控制性能得到大大提高。

圖6 不同算法無人偵察車速度控制曲線

表3 控制器的動態性能指標
為了驗正2種算法下的控制系統抗干擾能力,本文在時間0.7 s加入幅值為0.1的且具代表性階躍擾動,模擬無人偵察車控制系統受在實際運行過程中受到的不確定干擾,仿真結果如圖7所示。由圖7仿真結果可知,本文方法(改進灰色預測單神經元PID控制器)在受到擾動時能夠更快的速度恢復到設定值狀態,其抗擾動能力大大提高。

圖7 不同算法無人偵察車速度干擾曲線
為了提高無人偵察車伺服系統的控制精度,建立了一種改進的灰色預測變論域單神經元PID控制算法,實現單神經元PID控制器參數在線調整,與傳統的PID控制對比,有效地解決了無人偵察車精度低、穩定性差等問題。仿真結果表明,本文方法明顯優于傳統PID控制,調節時間短、超調量小、響應速度快、控制精度高。