黎海青,苗昊春,張健松,張一杰
(1.西安現代控制技術研究所,陜西 西安 710065;2.華中科技大學 人工智能與自動化學院,湖北 武漢 430074)
近年來,四旋翼飛行器因其體積小、可垂直起降和機動靈活等優點受到了廣泛關注。與單架飛行器相比,多架飛行器組成編隊協同執行任務能提高工作效率并提高系統容錯率,可以完成更復雜的任務,在通信中繼、搜救及偵察等方面有著廣泛的應用[1-3]。
在多架飛行器協同工作時,機群需要組成合適的隊形。一方面,飛行器之間需要保持適當的間距以避免發生碰撞和離群等情況,另一方面,許多特定的任務,如通訊中繼、搜索救援等,需要飛行器組成特定的隊形。目前,已有許多飛行器編隊方法,如領導者-跟隨者方法[4]、行為策略方法[5]和虛擬結構方法[6]等。文獻[7]研究了針對智能體的編隊控制,提出一種基于虛擬結構的分布式編隊控制算法,并對該算法的穩定性進行了理論分析。文獻[8]針對多無人機系統建立虛擬剛體模型,實現了實時的人機交互,并在虛擬剛體坐標系下研究了無人機的隊形變換和避障問題[9]。這些方法既有其自身的優勢,但也存在一些不足。領導者-跟隨者方法易于實現,但沒有跟隨者的信息反饋。因此,整個編隊的自主性不足,而且領導者的故障將可能導致整個編隊的失控。行為策略方法是一種基于仿生學的方法,其優點是可以分布式實現,并可以擴展到很大的集群,缺點則在于編隊的穩定性無法保證,并且很難分析編隊的特征。虛擬結構方法物理意義明確,具有良好的魯棒性,但該方法需要大量的計算能力和較寬的通訊帶寬,難以在工程中應用。
一致性理論已被大量用于地面無人車和多衛星系統在固定拓撲、時變拓撲以及通信延時等情況下的編隊控制。文獻[10-12]提出了一種基于一致性編隊控制方法,其基本思想是每個個體根據其相鄰個體的狀態更新其自身狀態,最終使所有個體的狀態收斂到共同的值。但是,上述文獻都將智能體描述成一階模型,系統較為簡單。
針對以上研究存在的對象模型過于簡單和穩定性不足等問題,將四旋翼飛行器描述為二階系統,擬提出基于二階一致性算法的多旋翼飛行器編隊控制方法?;谝恢滦缘木庩牪呗裕ㄟ^圖論的方法構建了飛行器編隊的通訊拓撲結構,并利用有向圖表示集群中個體和個體之間的作用關系,設計了一種分布式編隊控制器。其中,位置控制器用于實現期望編隊軌跡的跟蹤并保持指定的編隊隊形,姿態控制器用于穩定每架飛行器的姿態。最后,通過仿真驗證了所設計的編隊控制方法的有效性和優越性。
考慮N架同構的飛行器組成編隊,在編隊飛行中,每架飛行器除了完成自身的閉環控制外,還需與其他飛行器保持指定的距離。為了便于描述編隊中個體之間的通訊關系,用有向圖描述飛行器編隊的通訊拓撲結構。
將編隊中所有飛行器用一組節點集合V={v1,v2,…,vN}表示,節點vi表示飛行器i。飛行器j對飛行器i的影響,用有向圖中的一條邊(vi,vj)表示,編隊中所有的影響關系用一組邊集合E?{(vi,vj∶vi,vj∈V)}描述。令π={1,2,…,N}表示飛行器編號,各架飛行器之間的影響強度由加權矩陣W=[wij]∈RNN表示,若(vi,vj)∈E,則wij>0,表示飛行器j對飛行器i存在通訊關系。而當飛行器j對飛行器i無通訊關系時,則wij=0。此外,對于任意i∈∏,wii=0。使用有向圖G=(V,E,W)描述飛行器編隊的通訊拓撲結構。在有向圖G中,如果存在一個邊的子集,且可連接有向圖中所有節點,那么稱該圖包含一個有向生成樹。由文獻[13]可知,在時不變固定通信拓撲條件下,當且僅當通信拓撲結構存在一簇有向生成樹時,飛行器編隊可達到漸近一致。
考慮所研究的飛行器是同構的,以其中一架飛行器i為例,建立其平移和旋轉動力學模型。
在四旋翼無人飛行器的模型當中,假設定義α={Eαx,Eαy,Eαz}表示地球慣性的坐標系,β={Eβx,Eβy,Eβz}表示原點在四旋翼質心上的載體坐標系,四旋翼飛行器模型如圖1所示。

圖1 四旋翼飛行器模型
令pi=[pxi,pyi,pzi]T∈R3×1和Θ=[φi,θi,ψi]T∈R3×1分別表示飛行器i的位置和姿態角。其中,φi、θi和ψi分別為滾轉角、俯仰角和偏航角。Rbi表示坐標轉換矩陣,其表達式為

那么,飛行器i的平移和旋轉動力學模型的表達式分別為
(1)



4個電機的控制輸入指令的表達式分別為
由于飛行器i具有6個自由度即高度、橫向和縱向位置以及3個姿態角和4個控制輸入即uzi,uΘ1,i,uΘ2,i,uΘ3,i,其是一種多輸入多輸出的欠驅動系統。此外,可以看出,式(1)中描述的飛行器i的動力學模型是高度非線性和耦合的。




(2)

(3)
位置控制器用于實現期望編隊軌跡的跟蹤,并保持指定的編隊隊形。位置線性二次型調節器(Linear Quadratic Regulator,LQR)控制upi可以設計為

(4)
式中:N為飛行器個數;μP為耦合參數;對角矩陣Kp∈R3×3和Kv∈R3×3為位置LQR控制參數;αi是常數,取值范圍為0~2,表示虛擬編隊領導者和飛行器i之間的通訊權重,若αi>0,那么虛擬編隊領導者可以向飛行器i發送信息,否則αi=0。定義KL=[Kp,Kv]為位置LQR控制參數矩陣,令
其中,PL是Riccati方程的正定解,則有

姿態LQR控制器輸出uΘi可以設計為
(5)
式中,KΘ,Kω∈R3×3是姿態LQR控制參數矩陣。KF=[KΘ,Kω]表示姿態LQR控制器參數。定義矩陣

式中,PF是Riccati方程的正定解,則有
通過基于圖論構建的通信有向圖和上述編隊控制器設計方法可知,編隊軌跡的參考信號由虛擬領導者提供,只有部分的飛行器個體可以獲得參考信號。因此,整個位置控制器是分布式的和時不變的,意味著飛行器i的控制器設計僅取決于自身及其鄰居的位置和速度信息。
基于小增益理論[15]可以證明,整個閉環控制系統是漸進穩定的。
在數字仿真中,3架四旋翼的模型參數選擇為mi=2 kg,lbi=0.5,kσi=2.0,kτi=0.96,gi=9.81 m/s2及Ji=diag{0.1,0.1,0.06}kg·m2(i=1,2,3),參數矩陣Bpi和BΘi的表達式分別為Bpi=diag(1,1,)和BΘi=diag{10.0,10.0,16.0}。
有向圖G=(V,E,W)用于描述3架四旋翼編隊的通訊拓撲結構。其中:V={v1,v2,v3},E={(v1,v2),(v2,v3)},W=[wij]。w12=0.8,w23=0.7,若(vi,vj)?E,那么wij=0。只有第1架四旋翼可以從虛擬編隊領導者獲得信息。因此,α1=1.5,α2=0,α3=0,α4=0。四旋翼編隊的通訊拓撲結構及編隊隊形如圖2所示。

圖2 四旋翼編隊的通訊拓撲結構及編隊隊形

需要跟蹤的虛擬編隊領導者的期望軌跡為pr(t)=[3t,3t,4t]T,并且3個四旋翼需要保持一個恒定的三角形隊形,3個四旋翼之間的距離分別為δ1=[1,1,0]T,δ2=[-1,1,0]T,δ3=[-1,-1,0]T。此外,每架四旋翼的偏航角需要穩定在0°。
位置和姿態的LQR控制參數選擇分別表示為QL=diag{8,8,8,1,1,1},ΓL=I3,ΓR=I3,QR=1 000×diag{2.3,2.3,2.3,1,1,1},μp=3.5。
四旋翼編隊三維軌跡、X-Z視圖、X-Y視圖、位置跟蹤誤差、編隊速度曲線、編隊姿態曲線、位置控制器輸出、姿態控制器輸出如圖3至圖10所示。其中:圖3至圖5為四旋翼編隊位置軌跡圖,所采用的編隊控方法可以實現期望的編隊軌跡參考信號的跟蹤,全程保持指定的三角編隊隊形;圖6至圖7為位置跟蹤誤差及速度曲線,四旋翼編隊位置跟蹤速度較快,在2 s左右達到收斂,穩態誤差小于0.2 m;圖8為編隊姿態曲線,在俯仰角和滾轉角在2 s左右收斂,偏航角穩定保持在0°,跟蹤效果較好;圖9至圖10為位置控制器和姿態控制器輸出曲線,可見控制器輸出滿足要求。

圖3 四旋翼編隊三維軌跡

圖4 四旋翼編隊X-Z視圖

圖5 四旋翼編隊X-Y視圖

圖6 四旋翼編隊位置跟蹤誤差

圖7 四旋翼編隊速度曲線

圖8 四旋翼編隊姿態曲線

圖9 四旋翼位置控制器輸出

圖10 四旋翼姿態控制器輸出
針對多架飛行器的編隊控制問題,提出一種基于一致性理論的編隊控制算方法。利用圖論方法對整個系統進行了建模,構建了飛行器編隊的通訊拓撲結構,并以3架飛行器為例,設計了由位置LQR控制器和姿態LQR控制器組成的分布式控制器,實現了編隊飛行軌跡跟蹤與隊形保持任務。仿真結果表明,該控制方法能夠實現多架四旋翼飛行器的編隊控制,清晰描述指定編隊狀態,飛行軌跡跟蹤和隊形保持精度較高,編隊控制算法有效。