王 建,盧一相,高清維,余 益
(安徽大學 電氣與自動化學院,安徽 合肥 230601)
隨著物聯網范式的廣泛應用,網絡化多智能體控制技術在許多實際系統中都扮演著關鍵的角色,例如智能電網[1]、衛星編隊、自動駕駛系統[2]、飛行編隊[3]、機械臂[4]和移動機器人[5]等。因此,通過通信網絡連接所有個體或者子系統形成的分布式控制系統(網絡化多智能體系統)成為近年來的熱門研究領域[6-7]。對網絡化多智能體系統的分析,主要是研究網絡結構和個體之間的交互對系統全局目標的影響。一般而言,分布式控制器在使用共享局部信息的情況下,將擁有和使用與全局信息同樣的性能,這也是分布式控制廣受關注的一大原因。文獻[8]針對具有不確定性和定向通信拓撲的網絡拉格朗日系統的協調跟蹤控制,提出了一種自適應容錯協同控制方案。文獻[9]研究了具有通信延遲的網絡化多主體系統的平均一致性,并獲得了用于平均一致性的充分條件,得出在有界通信延遲下系統仍存在平均共識的結論。文獻[10]提出了設計分布控制律的統一框架,而且證明了后向水平動態優化方法可以用來實現非線性多主體系統的預測次優共識。
在分布式系統中,聯網的多主體之間不可避免地存在通信約束,例如網絡延遲、數據包丟失和數據攻擊。顯然,這些通信約束會降低所設計控制器的性能。為了克服這些不利因素,基于網絡傳輸矢量數據流的特性和模型預測控制策略,文獻[11]提出了一種網絡預測控制方案。文獻[12-14]將這些網絡化的多主體預測控制方法應用于不同類型的多主體系統。對于具有不變網絡時延的同構網絡多主體系統,文獻[12]設計了一種基于網絡預測控制的分布式協議。對于具有網絡延遲和狀態不可測的異構網絡多主體系統,文獻[13]提出了使用網絡預測控制方案的分布式控制協議,這使得共識的充分必要條件與網絡延遲無關。文獻[14]通過引入同時穩定性和共識性的概念,建立了一種主動補償網絡延遲和分組數據丟失的預測性控制器設計方法,實現了網絡化多主體控制系統的穩定性和共識性。文獻[15]研究了具有可變網絡拓撲的通信延遲多智能體系統,并提供了共識機制。
文獻[16-17]將智能電網系統建模為網絡化多智能體系統,然后借助一致性理論設計分布式控制器,以解決其電壓、頻率同步及功率分配等問題。文獻[18]將物聯網技術和混成控制理論引入微電網中, 形成了多目標控制問題,改進了混成控制原有的系統層級模型,并基于電壓控制約束條件實現了微電網電能質量的實時控制。不同于主從和對等控制[19],文獻[20]基于多智能體一致性理論提出了一種分布式無功功率控制策略,應用動態一致性算法對無功功率的差值進行迭代求和,借助積分控制器對下垂特性曲線的參考電壓幅值進行自適應地補償,從而實現無功功率的合理分配。
現有的關于分布式預測控制解決通信約束下系統輸出一致性問題的文獻中,基本上都是假設其系統模型為線性的。而在實際應用中,如智能電網,由于濾波電路和耦合連接器的存在,系統往往是非線性的。這使得已有的分布式預測控制算法并不能很好地適應于這些場景,因此,如何設計協調控制協議,實現多智能體之間的協調,并主動補償通信約束,是一個重要問題。本文將針對具有異質通信約束的非線性網絡化多智能體系統,提出一種分布式協調預測控制算法,實現多智能體的輸出一致性。在四節點微電網系統上執行了一系列的仿真,用來驗證所提出的控制策略的有效性和魯棒性。
將一個具有N個智能體的多智能體系統描述為一個具有N個頂點的無向圖G={V,E,A}。V是圖G的頂點集,滿足V={1,…,N},1,…,N是頂點的序號。E是圖G的邊集,滿足E?V×V。圖G的一條邊(i,j)∈E表示一對頂點i和j互為鄰居,鄰居之間可以彼此接收到對方發送的信息。頂點i的鄰居集可表示為Ni={j∈V|(i,j)∈E}。圖G的鄰接矩陣表示為A=(aij)N×N,當頂點i與頂點j之間存在連接時,aij=1,否則,aij=0。假設圖G沒有自環,即(i,i)?E,且令鄰接矩陣A的主對角元素為aii=0。如果圖G中任意兩個頂點都互為鄰居,則圖G為完全圖。如果從頂點i到另一個頂點j有一條路徑,那么頂點i和j是連通的。若圖G中任意一對頂點都是連通的,則圖G稱為連通圖。對于非平衡圖,可以定義出度為dout(i)=∑j∈Niaij,入度為din(i)=∑j∈Niaji,當出度等于入度時,稱G為平衡圖,否則,為非平衡圖。d=diag{d(i)}定義為平衡圖G的度矩陣,其中d(i)=∑j∈Niaij。相應地,圖G的拉普拉斯矩陣L定義為L=D-A。
考慮以下具有N個智能體的非線性網絡化系統[11]:
(1)
其中:xi為系統的狀態變量;u′i為控制輸入;f′i和g′i為已知的非線性函數;Di為外部干擾。
在非線性多智能體系統中,存在多個控制器,并且各個代理控制器之間必須考慮多智能體之間的交互。在單個智能體系統中,代理控制器單獨采用控制策略,例如,網絡預測控制[14]。現在,不僅要考慮動態性能和控制目標,而且還需考慮智能體通信過程中的限制。在這種情況下,由于網絡化多智能體系統中的所有代理都通過網絡與多智能體系統進行通信,每個代理控制器基于自身的信息以及與其他代理控制器共享的信息來解決控制問題,以提高整體性能。隨著系統規模的增加,非線性多智能體系統所捕獲的實時數據和實時計算的密度和大小都將急劇增加。因此,引出了許多挑戰,包括數據的捕獲、存儲、可視化、共享、傳輸、搜索和分析,以及計算任務的分配和協調等。
關鍵的通信約束是網絡延遲和數據丟失。這些通信約束會嚴重影響網絡化多智能體系統的性能。因此,接下來將在控制器的設計中考慮如何消除這些通信約束對系統帶來的不利影響。假設第i個代理的網絡延遲為ρi,數據丟包為si,令通信約束τi=ρi+si,i∈{1,2,…,N}。為了解決這些約束,需要開發一種新的網絡化控制結構。通信網絡的關鍵特性之一是每次可以傳輸一個數據包,而不是單個數據,這在非網絡控制系統中是無法做到的。充分利用這一網絡特性,為網絡化多智能體系統引入網絡化預測控制策略,克服網絡隨機時延和數據丟失的影響。該策略由控制預測發生器和網絡約束補償器組成。基于動力學模型和待優化的性能函數,預測控制器將利用直到時間t的所有可用信息生成控制預測序列,該信息包含從時間t開始向前幾步的控制預測。所生成的預測控制序列將被打包并通過網絡傳輸到被控代理端。被控代理端的網絡約束補償器根據通信約束的類型,從所有可用的控制預測序列中選擇時間t的最新預測控制,并將其應用于被控智能體的執行器。這樣,通信約束,尤其是網絡延遲和數據丟失將被預測項主動補償,同時預測控制器將提供與沒有通信約束的網絡化多智能體系統相同或漸近的控制性能。對網絡化多智能體進行以下假設和約定:
(Ⅰ)控制器與第i個智能體傳感器之間存在通信約束τi。
(Ⅱ)控制器與第i個智能體執行器之間存在的延遲遠小于網絡延遲,此通道延時將被忽略。
(Ⅲ)通信約束τi是系統采樣周期的整數倍,為已知整數。
對于式(1)中表示的非線性多智能體系統的動力學,假設其輸出和輸入之間的直接關系可以由輸出的二階導數生成,則非線性系統(1)可以寫成如下二階系統[21]:
(2)

?(?hi/?xi·f′i)/?xi≠0的假設成立。

(3)
其中:
為得到離散化系統,對系統(3)施加歐拉離散化,有:
(4)

為了設計分布式控制器的預測項,對于第i個代理考慮如下成本函數Ji(t):

(5)
其中:Ny,Nu分別為輸出預測窗口和輸入預測窗口的大小;bi和ci分別為協同和控制成本增益;gi為牽制增益;
系統的狀態量可測,但是在實際系統中,高頻振蕩及測量誤差噪聲的存在,往往使得傳感器的測量值并不準確。因此,對于分布式發電單元i的各狀態變量值,將采用如下狀態觀測器的估計值:

(6)
接下來,將第i個分布式單元的狀態預測分為以下3個階段:
(Ⅰ)狀態預測,從t-τi+2到t:
循環代入式(6),有:
其中:k=2,…,τi。
(Ⅱ)狀態預測,從t+1到t+Nu:
(7)
其中:k=1,…,Nu。
(Ⅲ)狀態預測,從t+Nu+1到t+Ny:
其中:k=1,…,Nu+2,…,Ny,…,Ny+τj。
因此,根據式(6)和式(7)可以得到如下預測輸出方程:
(8)

即
將輸出方程(8)代入上式,有:
整理有:
因此,網絡預測發生器的輸出為:
(9)
其中:
以上完成了網絡預測發生器部分的設計,接下來網絡約束補償器將發揮作用,將在預測序列中選擇合適的預測量用于實際系統中。在分布式單元i的控制側,執行器中的網絡約束補償器會根據當前的時延情況選擇需要的控制輸入。基于式(9),t時刻網絡約束補償器輸出的最優預測控制計算如下:
其中:Hv,i是第i個元素為1,其余均為0的N維數列向量。
為驗證網絡化分布式預測控制算法的有效性,將其應用于一個具有4個分布式發電單元的交流微電網系統的電壓恢復問題。其大信號模型如下:
其中:xi(t)=[PiQiiLdiiLqivodivoqiiodiioqi]T;Di=[vbdivbqi]T;fi,ki,gi的具體形式見文獻[22]。
通過MATLAB/Simulink仿真軟件搭建微電網仿真模型,其中,濾波電路參數、下垂系數和耦合連接器的參數均參見文獻[21]。考慮有向拓撲,其中拓撲矩陣為a12=1,a23=1,a34=1,a41=1,其余元素為0,且分布式發電單元之間的時延為τ1=2,τ2=3,τ3=2,τ4=4。控制器各系數為Ny=14,Nu=12,對于i=1,…,4,選擇觀測器參數為Li=[0.3,-2.5], 選擇bi=5,ci=0.2,且g1=0.3,其他元素的牽制增益為g=0。接下來所有仿真中出現的變量值都采用標幺值。特別值得注意的是,仿真圖中的DG表示分布式發電單元,給定值表示設定的參考輸入。為驗證本文所提出的控制策略在微電網電壓恢復方面的有效性,設計了不同工況,對所提出的控制策略的性能進行分析。一種是使用含有和不含協調項的分布式預測控制器進行電壓控調節。不具有協調項控制器作用下的微電網電壓輸出幅值如圖1所示,含有協調項的電壓輸出幅值如圖2所示。另一種是使用含有協調項的分布式預測控制器在不同權重因子下進行電壓調節,其不同的電壓輸出幅值見圖3。

圖1 控制器中無協同控制項的電壓輸出幅值

圖2 控制器中含協同控制項的電壓輸出幅值

圖3 不同協調增益和跟蹤增益的電壓輸出幅值
由圖1可知:由于控制器中沒有引入協調項,只有牽制節點,第1個發電單元可以完成給定電壓值的跟蹤,而其他發電單元則不能完成跟蹤任務。圖2則顯示了施加協調項結果,從圖2中可以看出:分布式預測控制器可以很好地實現微電網輸出電壓幅值的跟蹤,而且系統能夠很快地恢復到期望值。綜合比較圖1和圖2可以得出結論:在牽制控制的框架下,網絡中的發電單元必須直接或間接地獲得參考值,否則將無法完成跟蹤;對于并非所有發電單元均可獲得參考值的情況,預測控制器中的協調項是不可或缺的。圖3為不同協調增益和跟蹤增益的輸出電壓幅值圖,其中增益取bi=9,ci=0.2,且g1=0.2。從圖3中可以看出:控制器可以很好地實現微電網輸出電壓的跟蹤,從而恢復到期望值。為進一步說明協調增益、跟蹤增益和控制增益對控制性能的影響,給出了4組不同控制增益下的控制成本、跟蹤成本和總成本,如表1所示。從表1中可以看出:控制器增益的選取會影響閉環系統的性能,具體而言,隨著協調增益與控制增益比值的增大,跟蹤效果會更好。

表1 不同控制增益下的控制成本、跟蹤成本及總成本
本文提出了一種針對網絡化非線性多智能體系統的分布式預測控制方法,利用分布式預測控制策略解決了一類可輸入、輸出線性化的非線性多智能體系統在遭受通信約束時的輸出一致性問題。該方法能夠同時實現一致性和穩定性,并能主動補償系統所遇到的異質通信約束,如時延和數據丟包。介紹了分布式預測控制的體系結構,給出了非線性系統的分布式預測控制器的設計過程,并在微電網系統的電壓恢復問題上對所提出的控制器進行了仿真驗證。微電網系統上的仿真驗證了所提出的針對非線性多智能體系統的分布式預測控制策略的有效性、實用性及穩定性。值得一提的是,在現實生產過程中,部分高維的非線性系統并不滿足輸入輸出線性化所需的對合條件。因此,對于這樣的高維非線性多智能體系統,如何設計網絡化預測控制器以解決其狀態、輸出一致性等問題將是未來值得研究的方向。