汪立新,單鈞麟,秦偉偉,沈 強,段志強
(火箭軍工程大學 控制工程系,西安 710025)
兩輪前后布局的單軌式陀螺平衡車采用控制力矩陀螺作為平衡控制執行機構,具有節能環保、重量輕、行動靈活等優點,是一種適應性強、應用范圍廣闊的新型平衡車輛,引起了國內外公司和科研團隊的廣泛關注[1-2]。由于缺少車輪轉動的陀螺效應及車把轉向的離心力作用,陀螺平衡車的靜態平衡控制實現難度較 大[3],對控制器性能要求嚴苛,同時它又是自主駕駛等相關應用的研究基礎,因此提升陀螺平衡車靜態平衡控制性能具有重要意義。
文獻[4]采用極點配置方法控制平衡車靜態穩定,控制器設計簡潔,但對于系統極點的設計過于依賴經驗,且無法對性能指標進行量化;文獻[5]設計了一種滑模變結構控制器,使得穩定控制的調節時間和超調量得到改善,同時也出現了系統在平衡點附近抖動嚴重的問題;文獻[6]闡述了基于級聯擴展狀態觀測器的雙回路自抗擾控制原理,仿真實驗表明將其應用于陀螺平衡車控制能夠有效提升系統穩定裕度和抗干擾能力,然而控制器復雜度和能量消耗較高,在實際應用中存在困難。
對比以上控制方法,線性二次型調節器(Linear Quadratic Regulator,LQR)作為一種多變量最優反饋控制方法,能夠同時最小化系統狀態量誤差和控制器輸出,此外還具有穩定性高、設計簡單、實用性強等優點。實際應用中狀態加權矩陣Q和控制加權矩陣R是設計人員要選擇的主要參數,通常由專家經驗和試錯法相結合進行確定,需要耗費大量時間且難以保證控制效果。文獻[7]采用搜索能力較強的粒子群優化(Particle Swarm Optimization,PSO)算法選取加權矩陣,設計了垂直起降微型飛行器的懸停穩定LQR 控制器,在較好滿足控制需求的同時增強了系統魯棒性,但它存在兩個陷阱:易陷入局部最優和收斂速度慢。
量子粒子群優化(Quantum Particle Swarm Opti- mization,QPSO)算法是基于粒子群模型,從量子力學角度出發提出的一種新型全局優化算法。它將粒子運動狀態以波函數的形式進行描述,取代傳統PSO 算法中速度和位置的表示方式,使得粒子能夠以一定概率出現在空間任何位置,對全局搜索性能有了很大的改進。此外,QPSO 算法模型更加簡單,控制參數更少,對復雜優化問題的處理具有更好的效果[8]。
本文針對陀螺平衡車靜態平衡控制問題設計LQR 控制器,使用QPSO 算法智能地搜索出使系統性能良好的最優Q、R權值矩陣參數,通過與PSO 優化和經驗法得到的結果進行仿真對比和試驗驗證,證明QPSO 方法對陀螺平衡車LQR 參數優化的有效性。
陀螺平衡車系統主要由兩輪前后布局單軌式車體、控制力矩陀螺、嵌入式系統開發平臺、姿態傳感器、電源驅動裝置,以及安全隔離架等部分組成,具體結構如圖1所示。其中控制力矩陀螺是一種基于角動量交換原理實現力矩平衡控制的慣性執行機構,廣泛應用于航天器姿態控制等領域[9]。
陀螺平衡車運動狀態下的平衡原理同自行車較為相似,但當其處于靜止狀態時,車輪旋轉產生的陀螺效應和車把轉向引起的離心力作用等均無法產生,僅依靠控制力矩陀螺進動產生的陀螺力矩抵消重力矩分量和外界干擾力矩。其平衡控制過程為:當平衡車偏離平衡位置時,姿態傳感器將敏感到的角度信號傳遞給嵌入式平臺中的微處理器,由微處理器控制直流電機驅動控制力矩陀螺的飛輪轉子在高速自轉的同時和陀螺框架一起相對車體進動,根據陀螺力矩效應會對車體產生一個反作用力矩使系統回到平衡狀態。

圖1 陀螺平衡車結構圖 Fig.1 Structure of gyroscopic balancing vehicle
由陀螺平衡車靜止狀態下的平衡原理,結合拉格朗日方程可以推導出其靜態平衡動力學方程。將平衡車系統視為由車體、高速旋轉的飛輪和陀螺框架組成的剛體系,參考坐標系建立和相關參數定義分別如圖2和表1所示。
n維廣義坐標下包含有勢力的拉格朗日方程為


圖2 模型參考坐標系 Fig.2 Reference frame of the vehicle system model

表1 陀螺平衡車參數 Tab.1 Parameters of gyroscopic balancing vehicle
式中,T為系統動能,V為系統勢能,q i為第i維廣義坐標,Qi為第i維廣義坐標對應的廣義力。
對陀螺平衡車系統有:

對廣義坐標q1=θ,其廣義力

聯立式(1)(2)(3)(4)可得關于傾角θ的動力學方程為

式中,Ir=Irf+Irg,Ip=Ipf+Ipg。
對廣義坐標q2=α,其廣義力

同理,可得關于進動角α的動力學方程為

粒子群優化算法由鳥群遷徙過程中的飛行特征抽象而來,算法中的每個粒子與生物個體相對應,由具體的位置和速度向量進行描述,通過對解空間進行搜索獲得最優的適應個體和參數值,但由于每個粒子只能在確定的軌道上搜索和更新,因此無法充滿全部可行域而容易陷入局部最優解。孫俊等人[10]提出用具有高度隨機性的人類智能行為代替鳥群飛行運動,并通過類比將量子力學理論中的不確定性引入基本粒子群模型,建立了能夠實現全局優化的量子行為模型。
假定每個粒子被束縛在以點P= (p,0)為中心的一維δ勢阱中運動,并處于一定的能量狀態,其量子態概率分布可由定態波函數ψ(X)進行描述:

式中,X為粒子在空間中位置,L為δ勢阱特征長度。 結合蒙特卡洛法模擬出單個粒子精確位置表達式[10]

將上述結果擴展到包含M個粒子的N維搜索空間,并考慮粒子位置隨時間的變化。為保證算法收斂性,對于粒子i在t時刻的第j維δ勢阱特征長度Li,j(t) 需滿足條件通常情況下由式(10)確定:

式中,α為收縮-擴張因子,控制粒子位置坐標的收斂性能,pbesti,j(t)為t時刻粒子i歷史最優位置的第j維坐標,X i,j(t)為粒子i在t時刻的第j維坐標。則具有量子行為的一般粒子進化方程可表述為:

式中,i=1,2,…,M;j=1,2,…,N;pi,j(t)為粒子i在t時刻的第j維δ勢阱中心隨機坐標;gbest j(t)為t時刻M個粒子中最優位置的第j維坐標;為第j維坐標隨機系數。
對陀螺平衡車靜態平衡動力學方程在平衡位置附近進行線性化處理可得:


式中:

LQR 控制器設計關鍵是確定最優反饋控制量u(t) =-Kx(t),使得式(14)二次型指標取得最小值:

式中,K=-R-1BTP為狀態反饋矩陣,Q、R為權值矩陣,矩陣P由黎卡提方程 -PA-ATP+PBR-1BTP-Q=0 確定。
可以看出:Q、R權值矩陣為待設定參數,只有適當取值才能獲得較好的控制效果;傳統的經驗試錯法耗時長且效果并不理想;隨著智能算法研究的深入和完善,考慮采用量子粒子群算法進行參數優化,在Simulink 環境下搭建QPSO 優化的LQR 控制器模型,如圖3所示。

圖3 QPSO 優化的LQR 控制器Simulimk 模型 Fig.3 Simulimk model of LQR controller based on quantum particle swarm optimization
由式(11)可知,粒子每一步進化需要得到當前全體粒子最優位置和個體粒子歷史最優位置坐標,因此通過建立適應度函數對粒子優劣進行評價[11],經過多次迭代提高粒子適應度函數值,最終使所有粒子收斂到全局最優位置得到相應優化參數??紤]到實際情況下系統受擾動偏離平衡位置時,應在盡量短的時間內以較小的擺動準確回復到平衡狀態,把LQR 二次型性能指標、系統調節時間和響應峰值作為重要參考標準,同時為了避免框架進動飽和造成系統失穩,將最大控制量也作為一項適應度指標。由于各項指標的單位不同,絕對數值相差較大,進行對數和比值變換后定義混合指標適應度函數f為:

設權值矩陣Q=diag(q1,q2,q3,q4),R=r均為正定的,則待優化參數向量為x=(q1,q2,q3,q4,r)。將粒子位置坐標賦值給Q、R矩陣參數,并傳遞到LQR 控制器的Simulink 模型中進行系統仿真,根據仿真輸出計算粒子適應度函數值,當適應度函數值收斂或迭代達到設定次數時停止更新,輸出適應度函數f和Q、R矩陣參數變化曲線,QPSO 算法優化陀螺平衡車LQR 參數的具體流程如圖4所示。

圖4 QPSO 算法優化陀螺平衡車LQR 參數流程圖 Fig.4 Flowchart of LQR parameters optimization of gyroscopic balancing vehicle by QPSO algorithm
參數設置主要由陀螺平衡車結構參數和QPSO 優化算法參數兩部分組成,其中平衡車參數經對實物進行測量后計算得到:

根據以上參數求取模型狀態空間方程系數矩陣:

QPSO 算法參數設置中,種群規模數為50,最大 迭代次數為100,Q矩陣參數范圍為[10,500],R矩陣參數范圍為[0,1],加權系數λ1= 0.05,λ2= 0.35,λ3= 0.35,λ4= 0.25,收縮-擴張因子α的一種對收斂速度提升較為有效的取值方式為[12]

式中,α1=1.78 和α2=0.5 分別是α的初始值和最終值,k是當前迭代次數,K是最大允許迭代次數。
根據4.1 節中的參數設置進行仿真,Q、R矩陣參數和適應度函數f的尋優曲線如圖5和圖6所示。圖5中,縱坐標q1、q2、q3、q4 為權值矩陣Q的參數值,r為權值矩陣R的參數值。從圖5~6 中可以看出,算法經過30 次左右迭代后達到收斂狀態,具體尋優參數值為:


圖5 Q、R 矩陣參數優化曲線 Fig.5 Optimization curves of Q and R matrix parameters

圖6 適應度函數變化曲線 Fig.6 Variation curve of the fitness function
初步考察采用QPSO 進行陀螺平衡車LQR 參數優化的可行性,分別由經驗法、PSO 優化和本文方法優化得到的參數在陀螺車初始傾角θ0= 0.1 rad 條件下基于Simulink 模型進行陀螺平衡車LQR 控制零輸入響應仿真,結果如圖7和圖8所示。其中經驗法選取的一組控制參數為

PSO 優化參數為

由以下條件實驗得到:學習因子c1=2.5,c2=2.5,速度邊界vmin= -1.0,vmax=1.0,慣性權重w=2,種群規模為50,最大迭代次數為100。
由圖7和圖8可以看出,3 種方法所設計的LQR控制器都能滿足靜態平衡控制要求,但PSO 算法和QPSO 算法優化后的控制性能明顯優于經驗法,同時QPSO 算法與PSO 算法相比調節時間相近,超調量更小,響應速度更快,能夠滿足陀螺車平衡控制的快速性和穩定性要求,同時避免因進動角超調量過大造成控制力矩陀螺自鎖現象的發生。

圖7 傾角θ 仿真曲線 Fig.7 Simulation curve of tilt angle θ

圖8 進動角α 仿真曲線 Fig.8 Simulation curve of precession angle α
為了進一步驗證QPSO 優化后的陀螺平衡車控制效果,搭建實物平臺進行實時平衡控制試驗。實物平臺結構如圖1所示,其中嵌入式系統開發平臺使用NI公司的myRIO-1900,內嵌ARM Cortex-A9 微處理器和Xilinx FPGA 定制化I/O,基于Labview Real-Time/ myRIO Module 實現控制程序設計??刂屏赝勇莶捎脝慰蚣軜嬓?,飛輪自轉由Maxon RE35 直流電機驅動,框架進動由另一個Maxon RE40 直流電機驅動,配套的編碼器可反饋進動角度信號,轉速均由Copley驅動器實現精確控制,姿態傳感器為Xsens Mti-300型慣性組件,用于輸出平衡車傾角。myRIO-1900 可通過內置WIFI 模塊與PC 端進行通信,實現控制參數調整和上位機界面實時姿態信息顯示。一塊12V Li電池為myRIO-1900 供電,兩塊24V Li 電池分別為兩個Maxon 電機供電。
設置陀螺車初始傾角θ0= 0.1 rad,分別將三種方法對應的控制參數載入myRIO 1900 開發平臺,試驗采集從起控到平衡過程中陀螺車傾角、陀螺框架進動角和控制量信號各1000 個數據點,采樣頻率100 Hz,得到陀螺車傾角、框架進動角和控制量試驗曲線如圖9~11 所示。
可以看出,試驗曲線與仿真結果基本吻合,圖9中QPSO 優化下的傾角到達峰值較慢是因為實際控制中要考慮到控制量指標,而仿真時沒有這一限制,試驗曲線存在波動是因為實際模型中存在的未建模動態被激發所導致的。

圖9 傾角θ 試驗曲線 Fig.9 Experimental curve of tilt angle θ

圖10 進動角α 試驗曲線 Fig.10 Experimental curves of precession angle α

圖11 控制量試驗曲線 Fig.11 Experimental curves of controlled variable
表2為三種方法對應的具體控制性能指標值。相 較于PSO 優化和經驗法,QPSO 優化下的傾角響應峰值分別降低了17.07%和38.18%,調節時間縮短了24.32%和56.64%,進動角響應峰值分別降低了16.47%和36.61%,調節時間縮短了18.03%和38.74%,最大控制量分別降低了10.78%和35.88%。

表2 陀螺平衡車控制性能指標試驗值 Tab.2 Test value of gyroscopic balancing vehicle control index
針對陀螺平衡車線性二次型調節器Q、R矩陣參數通常依靠經驗選取,需要耗費較大時間精力且無法保證得到理想控制效果的問題,本文將Q、R矩陣參數刻畫為具有量子行為的粒子位置坐標,建立混合指標適應度函數評價粒子優劣,結合量子粒子群算法優化流程進行Simulink 仿真得到優化參數,并在實物平臺上對優化效果加以試驗驗證。結果表明,量子粒子群優化參數相較于粒子群優化和經驗法參數使得系統控制性能明顯提升:傾角響應峰值分別降低了17.07%和38.18%,調節時間縮短了24.32%和56.64%;進動角響應峰值分別降低了16.47%和36.61%,調節時間縮短了18.03%和38.74%;最大控制量分別降低了10.78%和35.88%。