張通彤,姜湖海,岳巍,司晨,袁滿
(1.西南技術物理研究所,四川 成都 610041;2.空裝駐成都地區第五軍事代表室,四川 成都 610041)
光電跟蹤系統在軍用及民用領域中實現對感興趣目標的捕獲、識別以及穩定跟蹤,其組成主要包括光電傳感組件、跟蹤信息處理組件、伺服控制組件,衡量系統性能優劣的指標之一為伺服控制回路的閉環跟蹤精度(簡稱跟蹤精度)。跟蹤精度通常定義為在給定的輸入指令下,系統跟蹤目標的偏差距離原點的大小。影響跟蹤精度的因素主要包括:系統延遲、跟蹤偏差計算精度、伺服控制精度等。伺服控制算法作為系統的最終串行環節,其控制效果直接影響跟蹤精度,制約伺服控制系統性能的主要指標包括控制系統自身的系統精度、穩定性、響應特性、工作頻率等。
光電跟蹤系統是一個具有多變量、高階、高度非線性和強耦合等特征的復雜系統。系統在跟蹤目標時,由于受到負載特性變化、外界擾動等不確定因素影響,導致系統的參數描述不完全準確,通常情況下很難建立精準的動力學模型。因此,必須提出合理的控制技術來改善系統的動靜態性能。針對上述需求,大量研究工作集中在PID控制及其衍生算法,核心是如何合理地給出控制器的3個參數,使控制達到所期望的效果。針對特定系統設計的自整定PID控制器控制效果良好,但仍存在一些問題需要解決。
隨著對光電跟蹤控制系統模型認識的加深和控制理論與控制方法的發展,科研工作者提出了自適應控制、滑模變結構控制等方法來解決模型的不確定性或干擾有界的問題。這些方法在系統不確定性滿足假設條件情況下保證了控制系統的收斂,但實際系統仍然會有某些尚未認識到的不確定性因素存在,并影響控制系統的控制效果。基于當前人工智能的發展,機器學習算法廣泛應用于數據挖掘、模型辨識等領域。韓宇萌等提出一種基于反向傳播(BP)神經網絡的滾仰式捷聯導引頭位置回路PID控制器,仿真結果表明控制器的動態性能優于傳統PID控制器,能夠對機動目標實現快速穩定跟蹤。殷建國等設計一個基于遺傳算法的PID控制系統,與傳統PID做對比,驗證了該方法的可行性。針對姿態控制的需求,鐘山等應用遺傳編程的交叉變異等方法讓計算機自動進化姿態控制律,仿真結果表明進化后的控制律響應快、無超調、控制精度高。針對傳統PID難以適應電機負載特性以及其他非線性因素影響的問題,閆峰等提出一種基于神經網絡的電機控制算法,仿真和實驗結果表明算法能夠有效抑制超調、縮短調整時間、提高系統響應速度。
神經網絡在控制系統中的應用可以提高控制系統的智能水平和適應能力,且神經網絡可以逼近任意的非線性映射關系,能夠對非線性系統及不確定系統的控制提供一種有效方法。本文針對特定的光電跟蹤系統對感興趣目標的快速與準確跟蹤的需求,而常規PID控制方法難以滿足要求的問題,提出一種基于徑向基函數(RBF)神經網絡的自適應控制策略,該方法結合了神經網絡控制的優點,使伺服穩定平臺控制系統具有更高的跟蹤精度和更好的魯棒性。
光電跟蹤系統通常配置可見光探測器、紅外探測器等光電探測設備,其主要功能是實時響應圖像信息處理器目標偏差并隔離運動載體對光電跟蹤系統的擾動,使光電跟蹤系統視軸能夠穩定、準確和迅速地指向并跟蹤目標,其組成如圖1所示。

圖1 典型光電系統組成示意圖Fig.1 Composition of typical electro-optical system
光電系統跟蹤目標時,目前通常采用面陣成像器件對目標實施探測,以探測器件的對稱中心為坐標原點,測量并解算目標距離中心的偏離量,并根據光學系統的設計參數換算為角度表示,又稱脫靶量(Δ,Δ),其中Δ為坐標軸軸方向上的脫靶量,Δ為坐標軸軸方向上的脫靶量。以獲取的脫靶量為輸入,驅動穩定平臺將脫靶量控制在原點附近,即可實現對目標的實時動態跟蹤。圖2所示為目標脫靶量示意圖。

圖2 目標脫靶量示意圖Fig.2 Illustration of target miss distance
典型的光電跟蹤系統采用力矩電機直接驅動或者小減速比傳動的方式,載體的運動擾動通過平臺和負載間的摩擦傳遞,從而影響跟蹤目標的精度。按照影響因素的來源,將跟蹤精度的影響要素分為外部干擾和內部干擾兩類,如表1所示。

表1 影響光電跟蹤系統的要素Tab.1 Factors affecting on tracking accuarcy of electro-optical system
外部干擾是指系統外部輸入的影響, 主要包括目標和場景隨著時間以及空間的變化,以及光電跟蹤系統載體在地面、空間運動產生的抖動。內部干擾主要包含軸系摩擦、傳感器測量誤差和控制算法誤差等,其中軸系摩擦與光電伺服平臺的軸系設計及裝配、器件選型等直接相關;傳感器測量誤差包含傳感器的噪聲、時延和計算誤差等。光電跟蹤系統通常通過合理的電氣布線、動平衡配平方式解決導線擾動和不平衡力矩,本文暫不考慮兩項誤差的影響。光電跟蹤系統的誤差源之間并非互相獨立,存在一定的耦合關系,如圖3所示,當光電系統的結構特征、傳感器選型確定后,控制系統作為光電系統的一個子系統,其控制算法的持續優化成為改善系統跟蹤性能的重要途徑。
跟蹤精度定義為光電系統經圖像解算和伺服控制閉環跟蹤目標時,跟蹤偏差距離跟蹤坐標原點的殘差大小,用偏差像素數或者等效偏差角度描述,通常,∝,且∝1。其中,為控制器的控制增益,決定了控制系統的系統誤差,為跟蹤偏差輸入量(即上文所提脫靶量),決定了控制系統的隨機誤差。用(1)式表示跟蹤精度與跟蹤偏差、控制增益之間的關系,

由圖3可以得出,跟蹤精度誤差模型如下:

圖3 光電系統跟蹤精度指標誤差模型Fig.3 Tracking error model of electro-optical system

式中:σ表示跟蹤精度指標的標準差;σ表示由跟蹤器測量誤差的標準差;σ表示控制算法產生誤差的標準差
因此,跟蹤精度誤差可以表示為

現代光電跟蹤平臺多采用數字圖像處理以及離散控制方法,σ的數值通常可以實現3像素,σ的數值等效折算為像素數,通常可以實現1像素,于是(3)式可以表示為

結合(1)式可以得出,當跟蹤精度一定時,跟蹤精度的誤差與以及的關系分別為

由(5)式、(6)式可以看出,控制算法中的增益控制對光電跟蹤系統的跟蹤精度影響至關重要。
光電跟蹤系統中,跟蹤目標時通常會產生視線角速度信號用于配合其他系統使用或者報送載體與目標的相對運動關系,如圖1的光電系統組成所示,目標的能量輻射,經過光學鏡片組和探測器、圖像信息處理器、伺服控制器以后,形成視線角速度信號。
典型的光電系統跟蹤目標后測量的視線角速度數據示例如圖4所示。圖4中數據在均值附近的波動情況反映了系統的跟蹤精度。

圖4 跟蹤誤差示例圖Fig.4 Sample graph of tracking error
根據實際光電跟蹤系統的精度要求,對(5)式、(6)式中的跟蹤精度取值0.1s、0.2s、0.3s,控制增益取值范圍2~20,跟蹤偏差取值0.03~0.30,經數值計算仿真,得到跟蹤精度誤差隨跟蹤偏差與控制器增益的變化趨勢如圖5和圖6所示。
圖5和圖6所示的數值仿真結果表明,通過改善控制增益,能夠有效提升跟蹤精度。

圖5 跟蹤精度誤差與控制增益關系Fig.5 Relationship between tracking accuracy and control gain

圖6 跟蹤精度誤差與跟蹤偏差關系Fig.6 Relationship between tracking accuracy and tracking error
從神經網絡開始研究以來,先后發展了單神經元、BP網絡、RBF網絡和正交函數網絡模型等。其中,RBF網絡以其擁有函數全局逼近能力的特點,在信號處理、模式識別和非線性系統的建模和控制等領域得到了大量應用。
RBF神經網絡能以任意精度逼近任意連續函數。RBF神經網絡輸入到隱含層的映射是非線性的,隱含層到輸出的映射是線性的,這種結構形式在提高學習速度的同時避免了局部極小問題。RBF神經網絡結構如圖7所示。圖7中,、、…、x分別為輸入節點上的輸入值,為輸入節點的個數,、、…、h分別為隱層節點的高斯基函數,為隱層節點個數,y為網絡的輸出,Σ為對隱層輸出的加權求和。

圖7 基于控制系統調節的RBF神經網絡結構Fig.7 RBF neural network for control system
令為RBF神經網絡的輸入向量,=[,,…,x],為 其 徑 向 基 向 量,=[,,…,h,…,h],h為高斯基函數,

式中:C 為第個節點的中心矢量,

b為神經網絡基寬向量的第個元素,=[,,…,b]。設網絡的權向量為=[,,…,w],辨識網絡的輸出為y()=++…+wh,為輸出的場數,辨識器的性能指標函數為

根據梯度下降法,輸出權向量元素w()、節點基寬元素b()及節點中心向量元素c()的迭代算法分別如(10)式、(11)式、(12)式所示。其中:輸出權向量元素w()的迭代算法為

式中:為學習速率;為動量因子。
節點基寬元素b()的迭代算法如(11)式所示:

節點中心向量元素c()的迭代算法如(12)式所示:

式中:∈[1,2,…,]。在模型辨識過程中(10)式、(11)式、(12)式中的輸出權向量元素w()、節點基寬元素b()、節點中心向量元素c()不斷迭代更新,停止迭代時得到最優解,網絡訓練結束。
本文用于光電伺服系統控制的RBF神經網絡中,輸入包括控制器的控制律及平臺的輸出量,即=[,],隱層取3個節點,即=[,,],其結構如圖8所示。

圖8 基于控制系統調節的RBF神經網絡結構Fig.8 RBF neural network for control system
基于RBF神經網絡的光電跟蹤平臺伺服控制回路結構如圖9所示。圖9中,、分別為系統的輸入和輸出。

圖9 RBF神經網絡自適應控制框圖Fig.9 Block diagram of RBF neural network adaptive control
基于RBF神經網絡的光電跟蹤平臺伺服控制系統的Jacobian算法為式中


由(10)式、(11)式、(12)式得到神經網絡的參數更新值,代入(13)式便可得到模型的Jacobian信息。
跟蹤精度用誤差表示為

根據控制器的原理,控制器的3項輸入分別為

控制器的算法為

式中:為比例增益;為積分增益;為微分增益。
神經網絡整定指標可由(17)式計算:

采用梯度下降法調整、、,調整量如下:

根據梯度下降法原理,當整定指標()達到最小時得到、、的最優解,即為使跟蹤精度最高的控制系統最優參數。
為充分驗證算法的有效性,結合實際工程項目的研制需求,在實物光電跟蹤平臺的控制回路中,采用基于RBF神經網絡的自適應控制器,利用MATLAB/Simulink軟件建立仿真模型如圖10所示,對跟蹤平臺的穩定跟蹤性能進行驗證。圖10中,為拉普拉斯算子。

圖10 RBF神經網絡仿真模型Fig.10 Simulation model of RBF neural network
3.1.1 階躍輸入仿真
為驗證RBF神經網絡控制器的性能,取采樣時間=0.001 s,學習速率=0.25,動量因子=0.05。
如1.2節所述,跟蹤精度經過光電系統測量后,轉換為跟蹤目標時的視線角速度信息。對于光電跟蹤平臺的視線角速度信息的衡量評價,通常會選用階躍信號、正弦信號作為輸入,比較系統跟隨兩種輸入的幅值和時滯誤差。光電跟蹤平臺跟蹤誤差給定階躍信號時,跟蹤系統的階躍響應曲線如圖11所示。
由圖11可見,與傳統PID控制器、積分分離PID控制器、單神經元PID控制器相比,基于RBF神經網絡自適應控制器的上升時間最短約為18 ms,階躍響應無超調,具體數據如表2所示。由此可知控制系統采用基于RBF神經網絡自適應控制器后,其動態性能比采用常規PID控制器的動態性能優異。

表2 不同算法仿真對比Tab.2 Comparison of simulated results of several control algorithms

圖11 不同算法階躍響應對比Fig.11 Comparison of step responses of several control algorithms
3.1.2 正弦輸入仿真
對光電系統跟蹤性能評價時,通常也會采用對正弦信號跟隨性能進行考核的方式,在仿真模型中輸入典型值為幅值1°、頻率為1 Hz的正弦信號,經數值計算,截取前半周期對局部數據進行放大,得到仿真結果如圖12所示。由圖12可以看出,傳統PID、積分分離PID、單神經元PID以及RBF神經網絡PID的滯后時間分別為8 ms、8 ms、24 ms、1 ms;幅值誤差分別為0.4%、2%、1%、1%。仿真數據表明,RBF神經網絡綜合快速性與準確性的效果較好,能夠在較小滯后的條件下獲取小誤差的跟蹤結果。

圖12 不同算法正弦信號響應對比(頻率1 Hz、幅值1°)Fig.12 Comparison of sinusoidal signal responses of several control algorithms at 1 Hz and 1°
受到系統的成像探測器件采樣傳輸延時、穩定平臺慣性延時等環節的約束,光電跟蹤系統的帶寬通常在3 Hz以內,為充分驗證算法在帶寬范圍內的跟隨性能,選取0.5 Hz、2.0 Hz、3.0 Hz,幅值均為1°的信號進行數字仿真,其中頻率0.5 Hz、幅值1°的仿真曲線如圖13所示。

圖13 不同算法正弦信號響應對比(頻率0.5 Hz、幅值1°)Fig.13 Comparison of sinusoidal signal responses of several control algorithms at 0.5 Hz and 1°
頻率分別為0.5 Hz、1.0 Hz、2.0 Hz、3.0 Hz的正弦響應的時滯以及幅值誤差統計結果如表3和表4所示。
由表3和表4可以看出,相比于另外3種算法,基于RBF神經網絡的PID算法在3.0 Hz帶寬內時滯最小,約為1 ms,同時在帶寬范圍內的幅值誤差同樣較小,在3 Hz處約為4%,可以滿足光電跟蹤系統的通用要求。

表3 不同頻率下正弦信號響應的時滯仿真結果Tab.3 Time-delay results for sinusoidal signal responses at different frequencies

表4 不同頻率下正弦信號響應的幅值誤差仿真結果Tab.4 Simulated amplitude errors of sinusoidal signal responses at different frequencies
為進一步充分驗證RBF神經網絡自適應控制器的效果,搭建圖14所示半實物仿真驗證系統,并在模擬載體運動的平臺中加入頻率1 Hz、幅值1°的正弦擾動,將仿真模型下載到實時仿真機中進行驗證。

圖14 半實物仿真系統Fig.14 Hardware-in-the-loop simulation system
3.2.1 階躍響應半實物仿真實驗
圖15所示為不同算法階躍響應實測數據對比結果。由圖15可知:與傳統PID控制器、積分分離PID控制器、單神經元PID控制器相比,基于RBF神經網絡自適應控制器的實測上升時間為19 ms(測試用光電系統的跟蹤信息處理純延時60 ms,在對此統計上升時間以及后文的時滯時,均未包含信息處理純延時數據),階躍響應的超調量0%,具體如表5所示。

圖15 不同算法階躍響應實測數據對比Fig.15 Test results of step responses from several control algorithms

表5 不同算法實測數據對比Tab.5 Test results of several control algorithms
對比可知控制系統采用基于RBF神經網絡自適應控制器后,其動態性能比采用常規PID控制器的動態性能優異。
3.2.2 正弦信號半實物仿真實驗
與數字仿真的條件類似,為充分驗證算法在帶寬范圍內的跟隨性能,選取頻率分別為0.5 Hz、2.0 Hz、3.0 Hz以及幅值均為1°的信號,進行半實物仿真測試。0.5 Hz、1.0 Hz、2.0 Hz、3.0 Hz的正弦響應時滯以及幅值誤差統計結果如表6和表7所示。

表6 不同頻率下正弦響應時滯實測對比Tab.6 Measured comparison of time-delay of sinusoidal signal response at different frequencies

表7 不同頻率下正弦響應幅值誤差實測對比Tab.7 Comparison of measured sinusoidal signal response amplitude errors at different frequencies
由表6和表7可以看出,相比于另外3種算法,基于RBF神經網絡的PID算法在3.0 Hz帶寬內時滯最小,約為28 ms,同時在帶寬范圍內的幅值誤差同樣較小,在3.0 Hz處約為4%,實測數據同樣滿足光電跟蹤系統的通用要求。
本文針對光電跟蹤平臺控制回路設計了一種基于RBF神經網絡自適應控制器,建立了穩定跟蹤的仿真模型。根據跟蹤誤差信號,通過學習在線調整控制參數,實現具有最佳組合的PID控制。得出主要結論如下:
1)通過不同算法的數字仿真與半實物仿真實驗驗證,基于RBF神經網絡自適應控制器可以提高光電跟蹤平臺控制系統的響應速度,減小系統的超調量,使控制回路的自適應能力得到提高,在不同運動狀態條件下能滿足系統的快速機動響應。
2)在自適應響應的同時能夠實現對目標的快速穩定跟蹤,使目標持續有效地穩定在視場內,滿足系統高跟蹤精度的要求。
3)對控制系統智能化的研究在實際工程應用中能夠為光電跟蹤系統的控制提供有益的參考。