周 勇
(荊州學院 信息工程學院,湖北 荊州 434020)
倒立擺是一個高階次、多變量、非線性、自然不穩定的快速系統,其控制目的是實現各擺桿之間的穩定平衡,它是檢驗各種新的控制理論和方法的理想模型。RBF(徑向基函數)神經網絡是具有單隱層的一種三層前向神經網絡,其網絡結構簡單、學習速度快、逼近能力強,在系統辨識、模式識別等領域得到了廣泛應用。RBF神經網絡在學習過程中,其性能主要取決于隱層神經元基函數中心、寬度和隱層節點到輸出層之間連接權值的整定,許多學者對其優化整定方法進行了研究,如Bishop[1]提出的期望最大法、Chen等[2]提出的正交最小二乘法、基于敏感度分析和混合優化策略的RBF神經網絡訓練方法、粒子群算法[3]、蟻群算法和遺傳算法等優化算法。其中遺傳算法是一種高度并行的隨機優化方法,具有很好的全局搜索能力和魯棒性,非常適用于RBF神經網絡參數的優化,也能較好地應用于RBF參數優化中[4]。但是,傳統遺傳算法在RBF神經網絡參數優化時,由于其隨機搜索的特點,常容易產生早熟(局部收斂),存在進化速度慢和局部收斂等問題。本文設計了一種基于改進遺傳算法的RBF神經網絡控制器,并結合單級倒立擺系統進行仿真實驗,以驗證其有效性。
單級(一級)倒立擺系統在忽略空氣阻力和各種摩擦之后,可將其抽象成由一個小車和勻質桿組成,其系統結構如圖1所示,參數如表1所示。

圖1 單級倒立擺系統

表1 單級倒立擺參數
倒立擺系統建模主要有拉格朗日和牛頓-歐拉兩種方法。由于單級倒立擺系統模型比較簡單,故本文采用牛頓-歐拉方法建模。
對小車水平方向所受的合力以及擺桿水平方向的受力進行分析,系統線性化后的動力學方程組為:
(1)
其中:x為小車相對初始位置的位移;θ為擺桿與垂直方向的夾角;u為系統輸入。


(2)
其中:F(t)為輸入外力;Y為系統輸出;A為系統的狀態矩陣;B為系統的控制矩陣;C為系統的輸出矩陣。
取平衡位置,進行泰勒級數展開,線性化處理后得到的系統狀態方程為:

(3)

(4)
RBF神經網絡一般由三層構成,即輸入層、隱含層和輸出層,如圖2所示。RBF神經網絡的學習包括兩部分:一是高斯函數中心和寬度的確定;另一個是輸出層權值的確定。給定網絡輸入X=(x1,x2,…,xn)T為n維向量,RBF神經網絡的輸入層到隱含層實現x→h(x)的非線性映射,即隱含層的變換函數h(x)為一個徑向基函數,其徑向基函數最常采用高斯函數,則RBF神經網絡隱含層第j個節點的輸出為:
(5)
其中:cj和bj分別為第j個隱含層節點的高斯函數中心和基寬參數,bj為大于零的數,它決定了該基函數曲線圍繞中心點的寬度;q為隱含層節點的個數。

圖2 RBF神經網絡結構
假設wj為第j個隱含層節點到輸出層的加權系數(權值),則RBF神經網絡的隱含層到輸出層實現h(x)→yk的線性映射,即:
(6)
其中:p為輸出層的節點數;yk為第k個節點的輸出。
RBF神經網絡的學習過程是將采集到的數據樣本對神經網絡進行訓練,不斷調整基函數中心c、寬度b和權值w使網絡總均方誤差為最小,即對于N個訓練樣本,RBF神經網絡的希望輸出為d,則總均方誤差函數為:
(7)
其中:dlk為第k個輸出節點在第l個樣本的希望輸出;ylk為第k個輸出節點在第l個樣本的實際輸出。
遺傳算法(Genetic Algorithm,GA)是美國Holland教授于1975年首先提出來的一種借鑒生物進化理論和門德爾基因遺傳理論的高度并行、隨機的優化方法[5]。遺傳算法雖然應用廣泛,但在解決復雜問題時由于其自身的隨機搜索特點也帶來了收斂速度慢和算法局部收斂(早熟)等問題[6]。結合文獻[7]和文獻[8],本文引入一種改進的遺傳算法,使算法的適應度值、交叉率Pc和變異率Pm分別按平均適應度、Sigmoid函數和進化代數變化,增加算法種群的多樣性,提高算法的全局搜索能力和收斂速度。
改進遺傳算法實現步驟如下:
(1) 參數編碼及初始化群體生成。由式(5)和式(6)可知,優化參數分別為c、b和w。根據工程實際,優化參數的初始范圍均設為[-2,2],采用實數編碼,進化代數為G,種群規模為n,并根據種群規模隨機產生初始種群。
(2) 解碼,計算種群個體適應度,確定適應度函數F,評價是否滿足收斂條件。個體適應度反映了個體在不同環境下的生存能力,為防止種群中個體適應度過于偏大或偏小導致算法陷入局部收斂,改進遺傳算法采用自適應個體適應度值改善算法性能。改進的個體適應度值調節公式為:
(8)

改進遺傳算法的適應度函數為f=1/J,J為均方誤差函數E,即f=1/E。
(3) 如果滿足要求(精度10-5或進化代數T),輸出結果;否則繼續步驟(4)。
(4) 設計遺傳算子。本設計采用輪盤賭選擇、算術交叉和均勻變異的遺傳算子。遺傳算法中,交叉和變異算子是算法進化的核心,其交叉率和變異率是算法收斂和穩定的關鍵參數。為了防止遺傳算法的早熟和收斂較差的問題出現,采用改進的自適應交叉概率和變異概率,將S曲線變化模式和進化代數用于交叉概率和變異概率,使個體的變異和交叉分別受進化代數和適應度的約束。改進的交叉率和變異率自適應調節公式為:
(9)
(10)
其中:fmax為種群中最大的個體適應度值;f′為要交叉的兩個個體中較大的適應度值;k1為曲線平滑參數,用來調節曲線的光滑程度;Pc max、Pc min分別為交叉率的最大和最小值;Gmax為最大進化代數;Pm1、Pm2和Pm3均為正實數。
(5) 根據favg、個體適應度和進化代數,結合自適應調節公式進行交叉和變異操作。
(6) 返回步驟(2),如達到指定要求,算法結束;否則繼續執行操作。
為研究單級倒立擺改進遺傳算法RBF神經網絡控制系統性能,本文分別用線性二次型控制器(LQR)和改進遺傳RBF神經網絡對單級倒立擺系統進行仿真分析。

搭建Simulink模塊,結合神經網絡工具箱,將改進遺傳算法得到的RBF神經網絡基函數中心、寬度和權值加入到RBF神經網絡模塊中,與單級倒立擺系統相結合進行仿真,繪制曲線,并與LQR控制器設計的參數矩陣進行對比,其階躍響應曲線如圖3和圖4所示。從仿真結果可知:LQR方法在前2.7 s內,倒立擺擺桿在初始位置0 rad發生較大幅度的振蕩,2.7 s后達到穩定;改進遺傳算法優化后的RBF神經網絡控制,擺桿的穩定時間為2.5 s,但超調更小,其超調和穩態誤差都小于LQR方法,穩定性能得到了較大的提高。

圖3 兩種控制方法的小車位置響應曲線

圖4 兩種控制方法的擺桿角度響應曲線
本文依據單級倒立擺的數學模型和RBF神經網絡理論,在對一般RBF神經網絡進行分析的基礎上設計了基于改進遺傳算法的RBF神經網絡控制器,利用改進遺傳算法實現高斯函數的中心、基寬參數和連接權值的優化選擇。通過仿真分析,基于單級倒立擺的改進遺傳RBF神經網絡控制系統能更有效地減小系統超調和穩定時間,較好地提高了單級倒立擺性能。