摘 要:本文針對“最優控制理論”課程對數學基礎要求高、推導多的特點和理論與應用聯系不緊密的問題,建設教學案例,將工程應用中的實踐問題引入課堂,提升學生的學習興趣,改善教學效果。研究主要圍繞變分法、最小值原理、線性二次型調節器、動態規劃等重點內容建設教學案例,并將最優控制理論的新方法、新問題和新趨勢融入課堂教學,利用仿真軟件進行關鍵方法或技術的檢驗。教學案例有效銜接課程與專業實踐,鍛煉研究生的創新能力和學習主動性,體現了課程的高階性、創新性和挑戰度。
關鍵詞:工程應用;最優控制理論;教學案例
中圖分類號:O23;G642" 文獻標識碼:A
“最優控制理論”是現代控制理論的重要組成部分,作為控制專業碩士研究生的一門專業基礎課程,它可以使學生掌握實踐問題的最優控制描述與最優控制器設計方法,建立最優控制思想,為解決較為復雜的控制系統設計問題提供理論支撐。
一、“最優控制理論”課程特點
最優控制理論經典內容包含變分法、極小值原理和動態規劃等,回顧這些關鍵理論方法的發展史可以發現,最優控制理論與數學緊密結合。因此,其突出的特點是邏輯性和理論性強,尤其是變分法部分涉及泛函、微積分、矩陣論等數學基礎,學生的學習效果直接與其數學基礎相關。同時,最優控制理論因其具有性能最優的優勢,被廣泛應用于各個領域的工程實踐。
二、教學存在的困難
當前教學過程中存在的主要困難是課堂涉及的理論推導和證明較多,數學基礎要求較高,同時又以“自動控制原理”為先導課程,對學生的綜合能力要求全面,導致教師不易把握教學的深度和廣度。同時,理論與應用之間缺乏實現的橋梁,導致課程與專業實踐缺乏有效銜接,學生在知識的轉化應用上存在困難,課堂上難以跟上教師的授課節奏,聽課效果一般[1]。這些問題和困難直接影響本門課程教學目標的達成。
三、教學案例建設
為了解決以上問題,選擇案例教學法開展教學,把具體的實際案例引入課堂,把問題引入、理論的建立、研究思路與方法作為課堂講授的重點,將相關的新理論、新方法、新思路、新問題融入教學內容[2]。
案例建設便于提高研究生對理論知識進行應用研究的能力,拓寬研究生的專業視野,提升研究生的應用創新能力[3]。案例建設從實際應用出發,突出“真實需求、真實項目、真實流程”[4]。針對“最優控制理論”課程主體內容變分法、最小值原理、線性二次型調節器、動態規劃等,對應建設最速降線問題、飛行器姿態最短時間控制、倒立擺姿態控制和月球表面最優探測路徑等教學案例,通過工程實踐案例驗證理論方法的有效性,同時展示理論方法的應用技巧。
(一)最速降線問題
問題描述:如圖1所示,在忽略摩擦的情況下,物體僅在重力作用下從較高的一點(0,0)下滑到較低的一點(x1,y1),請問路徑y=y(x)如何選擇可使所用時間最短?
問題分析:設物體速度為v,則v=dsdt=1+y·2dtdx,根據能量守恒定律,得mgy(x)=12mv2v=2gy(x),綜合以上得dt=1+y·22gy(x)dx,所以總耗時為:T=∫x101+y·22gy(x)dx,則問題為求取minyT=miny∫x101+y·22gy(x)dx。
問題求解:對于歐拉方程,根據問題的物理背景可知,y=k(常數)不是歐拉方程的最優解,則對歐拉方程同乘y·,得[5]y·Fy-ddx(Fy·)=ddxF-Fy·y·=0,則F-Fy·y·=c,即1+y·22gy-12gyy·21+y·2=c,有y1+y·2=k2,其中k2=12gc2,選擇y·=cotα,則y=k21+cot2α=k2sin2α=k22(1-cos2α)。又因為dx=dyy·=2k2sinαcosαcotαdα=k21-cos2αdα,則x=k2α-sin2α2+c1=k22(2α-sin2α)+c1。利用初值條件(x,y)|α=0=(0,0),得c1=0,則x=k22(2α-sin2α)
y=k22(1-cos2α)。取r=14gc2
θ=2α,則x=rθ-sinθ
y=r(1-cosθ)為旋輪線方程,其半徑r由終值條件(x1,y1)確定。
(二)飛行器姿態最短時間控制
問題描述:飛行器姿態控制決定飛行器控制效果,影響其功能的發揮。例如,空間探測衛星需要實時調整自己的姿態,使傳感器對準待探測區域;為了實現打擊最大效能,導彈需要以預定姿態撞擊目標,這些都需要飛行器的姿態控制。
以空間探測衛星為例,假設其滿足軸對稱,則其單軸的姿態動力學模型為θ·=ωx
ω·x=Tx/Ix,其中θ,ωx分別是衛星沿本體坐標系中主軸的姿態角、旋轉角速度;Ix,Tx分別是衛星繞主軸的轉動慣量、控制力矩。設x1(t)=θ(t),x2(t)=ωx(t),u(t)=Tx/Ix,則x·1(t)=x2(t)
x·2(t)=u(t)。衛星初始姿態x1(t0),x2(t0)非零,控制量受約束u(t)≤1,求取控制量u(t),使衛星在最短時間內回到預定位置x1(tf)=x2(tf)=0,則對應的性能指標為minuJ=∫tf0dt。
問題求解:
(1)最優控制函數的確定。
由Hamilton函數H=1+λ1x2+λ2u,得u=+1λ2lt;0
-1λ2gt;0。由伴隨方程λ·1=-Hx1
λ·2=-Hx2,得λ1=c1
λ2=-c1t+c2。由于終端狀態固定、終時不指定,所以不能由橫截條件確定c1,c2,選擇從假定控制作用下的狀態軌跡入手研究,采用圖形法輔助求取最優控制量。
(2)狀態軌跡方程的建立。
u=+1時,x·1=x2,x·2=1,解得x1(t)=12t2+x20t+x10
x2(t)=t+x20,消去t得x1(t)=12x22(t)+x10-12x220,對應的圖象是開口向右的拋物線簇,如圖2所示,圖中箭頭表示t增大時x2增大。u=-1時,x·1=x2,x·2=-1,解得x1(t)=-12t2+x′20t+x′10
x2(t)=-t+x′20,消去t得x1(t)=-12x22(t)+x′10-12x′220,對應的圖象是開口向左的拋物線簇,如圖3所示,圖中箭頭表示t增大時x2減小。將圖2、圖3的運動軌線合并,如圖4所示,兩簇拋物線中各有一條通過原點O的軌跡:其中,施加u=-1,可沿AO分支回到原點,施加u=+1,可沿BO分支回到原點,稱AOB為開關線。且兩簇拋物線均在其與開關線相交處變換控制量,而后沿開關線運動至原點。
開關線方程為:h(x1,x2)=x1(t)+12x2(t)x2(t)=0。在開關線以上,有h(x1,x2)gt;0;在開關線以下,有h(x1,x2)lt;0。因此,最優控制可表達為:
u(t)=-1h(x1,x2)gt;0
-sgn[x2(t)]h(x1,x2)=0
+1h(x1,x2)lt;0
在Simulink下進行仿真驗證,選擇x1(t0)=x2(t0)=1,仿真結果如圖5所示。由仿真可見,衛星在最短時間J=∫tf0dt=3.489s內回到預定平衡位置,控制過程中,控制量在u=-1和u=+1之間切換,而系統狀態量平滑變化。
(三)倒立擺姿態控制
問題描述:倒立擺系統是一個典型的非線性系統,可用來驗證多種控制算法。對于一級倒立擺,采用機理建模和近似線性化處理后,建立系統在平衡點附近的狀態空間模型。選擇性能指標為J=12∫∞0[xT(t)Qx(t)+uT(t)Ru(t)]dt,求控制量u(t)。
問題求解:針對此線性二次型調節器(Linear Quadratic Regulator,LQR)問題,最優控制量u=-R-1BTPx=-Kx,其中P通過Riccati方程-PA-ATP+PBR-1BTP-Q=0求解。利用MATLAB的LQR函數K=lqr(A,B,Q,R)可以求出LQR對應的K陣。
選取R=1,Q=1 0 0 0
0 0 0 0
0 0 1 0
0 0 0 0,其中,Q1,1代表小車位置的權重,而Q3,3是擺桿角度的權重,求得K=[-1.0000 -1.6567 18.6854 3.4594]。LQR控制的階躍響應如圖6所示。其中,實線代表擺桿的角度,虛線代表小車位置。從圖中可以看出,響應的超調量很小,但穩定時間和上升時間偏大。增加Q1,1使穩定時間和上升時間變短,且使擺桿的角度變化減小。取Q1,1=5000,Q3,3=100,得K=[-70.7107 -37.8345 105.5298 20.9238]。對應的階躍響應如圖7所示,可見響應的穩定時間和上升時間減小,系統響應速度提升。
(四)月球表面最優探測路徑
問題描述:月球車從初始位置開始,經過各分區域到達目標點,在各分區域存在多個可選過渡點,各點之間的能量消耗已知,如何選擇一條最優路徑,使月球車從初始點A到目標點E所消耗的能量最小。
問題求解:該問題可表述為最短路徑問題,求A到E的最短路徑,兩點之間的數字表示從起點到終點之間的距離。
如果采用窮舉法,需要進行3×3×3×2=54次加法計算,總共要進行3×3×2-1=17次比較。
采用動態規劃方法逆序求解,從最后一級反向計算,將一個N級決策問題化為N個單級決策問題,即將一個復雜問題化為多個簡單問題進行求解。此最短路徑問題為4級決策。首先,從最遠端D點N=4級決策開始計算:S(D1)=5,S(D2)=2。其次,計算C點N=3級決策:S(C1)=min{3+S(D1),9+S(D2)}=8,S(C2)=7,S(C3)=12。再次,計算B點N=2級決策,S(B1)=min{12+S(C1),14+S(C2),10+S(C3)}=20,S(B2)=14,S(B3)=19。最后,計算A點N=1級決策:S(A)=min{AB1+S(B1),AB2+S(B2),AB3+S(B3)}=19。所以,A到E的最短路徑為A→B2→C1→D1→E,共進行18次加法計算、11次比較,計算量減少。
結語
本文針對碩士生課程“最優控制理論”教學問題,分別對變分法、最小值原理、線性二次型調節器、動態規劃等關鍵理論方法建設基于工程應用的教學案例。通過工程實踐案例的問題引入、問題分析、問題求解環節開展課堂講授,將枯燥的理論與生動形象的現實應用結合起來,并適時融入最優控制理論的新方法、新問題和新趨勢,提升學生的創新能力和學習主動性,提升課程的高階性、創新性和挑戰度。
參考文獻:
[1]嚴曉飛,楊翔宇,祁玥.基于案例教學法的“環境影響評價”教學模式改革策略[J].大學,2024(1):101104.
[2]張啟敏,馬婧英,王站平.案例教學法在現代控制理論課程教學中的應用[J].科教導刊,2020(6):113114.
[3]韓耀振,王常順,侯明冬,等.專業碩士計算機控制教學案例庫建設[J].高教學刊,2024,10(34):8488.
[4]陳穎璐,李晶,李小峰,等.面向深度學習的個性化教學探索:以“機器學習”課程為例[J].大學,2024(S1):7779.
[5]曾祥遠.最優控制[M].北京:清華大學出版社,2022.
基金項目:火箭軍工程大學教學成果立項培育項目“夯實專業基礎、提升科研素養——《線性系統與最優控制》課程教學創新與實踐”(編號:JXCG202410)
作者簡介:宋海濤(1983— ),男,漢族,河南鄧州人,博士研究生,副教授,研究方向為控制理論與應用。