周 勇
(長江大學工程技術學院 信息工程學院,湖北 荊州 434020)
倒立擺系統是一個典型的非線性、不確定、高階次和快速運動的自然不穩定系統,它是檢驗各種新的控制理論和控制策略的理想模型。線性二次型控制器(LQR)由于具有價格低、性能穩定等優點,成為倒立擺系統常用的控制方式,許多學者對其控制策略進行了研究。陳健等[1]證明了加權矩陣Q中各權系數對系統穩定性的作用,張永立等[2]采用變增益LQR方法,實現了直線一級和二級倒立擺的穩定控制。LQR的控制性能主要取決于加權矩陣Q和R的整定,目前Q和R的參數整定大多采用試湊法,但此方法具有較強的主觀性,而且實時性較差,使其在工程應用中受到了一定的限制[3-4]。遺傳算法(Genetic Algorithm, GA)是一種高度并行的隨機優化方法,具有很好的全局搜索能力和魯棒性,非常適用于LQR參數的優化整定。然而,遺傳算法在參數整定過程中,在解決一些復雜問題時存在著早熟和收斂速度慢等缺陷。針對環形倒立擺的穩定控制問題,本文設計了一種基于改進遺傳算法的LQR控制器,結合改進遺傳算法優化LQR的加權矩陣Q和R參數,通過系統仿真分析,采用改進遺傳算法優化一級環形倒立擺系統,可在一定程度上改善LQR參數選取的不足,實現倒立擺系統的最優控制。
忽略各種空氣阻力、摩擦力和擺桿連接處等不均勻因素后,可將環形一級倒立擺系統抽象為由一個連桿、一個擺桿和一個質量塊組成,其坐標系如圖1所示,參數設置及含義見表1。表1中,連桿與y軸的夾角為θ1;擺桿與垂直方向的夾角為θ2。

圖1 一級環形倒立擺坐標系

表1 環形一級倒立擺參數及含義
倒立擺系統運動模型的建立和分析方法主要有拉格朗日法和牛頓-歐拉法兩種方法。根據文獻[5]、文獻[6]和一些學者的研究,本文采用拉格朗日法建立一級環形倒立擺運動模型如下:

(1)

取平衡位置時,各變量的初始值為0,進行泰勒級數展開,線性化后得到系統狀態方程如式(2)和式(3)所示:
(3)
LQR控制器是現代控制理論最重要的成果之一,其原理是選擇一個狀態反饋控制矩陣K,使得目標性能函數J達到最小,從而實現系統的最優控制。
具體過程如下:①選擇二次型目標函數J;②選定Q和R,結合系數矩陣A和B,求解Riccati代數方程PA+ATP-PBR-1BTP+Q=0,得正定矩陣P;③求最優狀態反饋控制矩陣K=R-1BTP,得控制信號u=-Kx。
LQR控制器設計的關鍵問題在于如何選取合適的加權矩陣Q和R,求出反饋控制矩陣K。目前對于加權矩陣的選取主要采用試湊法。遺傳算法(Genetic Algorithm, GA)是美國Holland教授于1975年首先提出來的一種借鑒生物進化理論和門德爾基因遺傳理論的高度并行、隨機的優化方法[7]。標準遺傳算法因為隨機搜索的特點,在運算過程中,其交叉率和變異率恒定不變,收斂性能較差。結合文獻[8],本文引入一種改進的遺傳算法,使算法的交叉率Pc和變異率Pm按Sigmoid函數和高斯分布函數自適應調整,滿足算法在不同進化階段的側重,提高算法的全局搜索能力。具體步驟如下:
(1) 選擇優化參數及約束條件。本文選取Q對角線元素Q11、Q33和R參數作為優化參數,根據實際要求,取Q∈[0,2 000],R∈[0,10]。
(2) 編碼及種群初始化。采用實數編碼,并根據種群規模隨機生成初始種群。
(3) 解碼,適應度函數確定。在遺傳算法優化過程中,適應度函數的確定非常重要,它是判斷最優參數的關鍵。改進遺傳算法的適應度函數f=1/J。
(4) 設計遺傳算子。本設計采用輪盤賭的選擇方法,并對遺傳算子進行多點交叉和均勻變異。為了防止遺傳算法的早熟和收斂較差的問題出現,采用改進的自適應交叉概率和變異概率,將S曲線和高斯分布曲線的變化模式用于交叉概率和變異概率。改進的交叉率和變異率的自適應調節公式如式(4)、式(5)所示:
(4)
(5)
其中:Pcmax、Pcmin分別為交叉率的最大值和最小值;Pmmax、Pmmin分別為變異率的最大值和最小值;favg為種群的平均個體適應度值;fmax為種群中最大的個體適應度值;f′為要交叉的兩個個體中較大的適應度值;k1為曲線平滑參數,用來調節曲線的光滑程度;k2為曲線高度參數。
(5) 終止判斷。如達到指標要求(精度10-5或進化代數),算法結束,否則重新返回步驟(3)。
為研究一級環形倒立擺系統性能,本文分別采用試湊法和改進遺傳算法對LQR參數進行優化仿真分析。
所有算法程序均采用MATLAB語言編制,改進遺傳算法參數設置如下:種群規模為50,進化代數為100代,最大交叉率為0.8,最小交叉率為0.6,最大變異率為0.1,最小變異率為0.05,曲線平滑參數為0.990 3,曲線高度參數為0.4。試湊法采用文獻[9]參數設置。
基于MATLAB平臺,應用MATLAB語句K=lqr(A,B,Q,R)得到一組K值,在經過改進遺傳算法優化后,Q與R值分別為Q=diag([1 581.6,0,476,0]),R=0.97。相應的反饋控制矩陣K=[-40.379 6,-22.300 4,317.163 7,51.860 2],將其應用于一級環形倒立擺系統的仿真,并繪制曲線,與LQR控制器試湊法設計的參數矩陣進行對比,階躍響應曲線如圖2和圖3所示。從仿真結果可知:系統自零初始狀態,試湊法在前3.5 s內,倒立擺連桿由初始位置0 rad小幅度均勻振蕩,擺桿發生較大幅度的振蕩后,穩定時間為3.5 s;改進遺傳算法優化后,連桿和擺桿的穩定時間分別比試湊法減少了2 s和1.5 s,且超調更小,系統穩定性能得到了較大的提高。

圖2 兩種優化方法的連桿擺角響應曲線 圖3 兩種優化方法的擺桿擺角響應曲線
本文依據環形一級倒立擺的數學模型和LQR理論,針對LQR存在的問題,設計了基于改進遺傳算法的LQR控制器,利用改進遺傳算法實現了Q和R的優化選擇。通過仿真分析,改進遺傳算法優化LQR參數能更有效地減小系統超調和穩定時間,較好地提高了一級環形倒立擺的性能。