王志文,劉 偉
(蘭州理工大學 電氣工程與信息工程學院;甘肅省工業過程先進控制重點實驗室;電氣與控制工程國家級實驗教學示范中心,蘭州 730050)
隨著計算機技術和數據通信技術的不斷發展與融合,信息物理系統(CPS)技術應運而生.CPS是由多維異構計算單元和物理系統在網絡環境中高度集成與交互而構成的一類新型智能復雜系統[1].該系統將計算資源與物理資源緊密結合、協調分配,實現了系統對物理環境的實時感知和動態分布式控制.CPS因具有結構靈活、低成本和高效性等諸多優點而被廣泛應用于工業過程控制等領域,但是其設備智能化、通信網絡化等特性,也使得CPS易成為網絡攻擊的目標.拒絕服務(DoS)攻擊出現的頻率最高,也最難以防范,其本質是阻止物理系統量測或控制信號的實時傳輸,致使控制信號更新不及時以及不完整,進而導致控制品質下降甚至失穩.隨著網絡規模的擴大,用戶對系統安全性和穩定性的要求也隨之上升,信息物理系統的安全問題受到學者的廣泛關注.
關于DoS攻擊引發的安全問題和DoS攻擊建模問題已被廣泛研究.與一般的數據丟包問題不同,由DoS攻擊帶來的通信故障問題通常不服從某一類概率分布[4],這給控制系統的分析和設計帶來了新的挑戰.文獻[2]研究了一類單輸入系統下周期DoS攻擊問題,并給出了應對已知攻擊周期上界DoS攻擊的極點配置方法.進一步,文獻[3]針對多輸入連續控制系統下DoS攻擊問題,給出了已知DoS攻擊周期上界時系統的穩定性條件.文獻[4-6]研究了幾類具有特定隨機過程的DoS攻擊下系統的安全控制問題:文獻[4]研究了伯努利模型DoS攻擊下離散系統的LQG最優控制問題;文獻[5-6]則研究了馬爾可夫模型DoS攻擊下系統的風險敏感控制問題和彈性控制問題.在實際情況下DoS攻擊通常不會遵循某種特定的規律.為了更簡潔地描述DoS攻擊的行為,文獻[7-8]從攻擊頻率和持續時間對隨機DoS攻擊來進行約束:文獻[7]提出了一種保證網絡化控制系統輸入狀態穩定的彈性控制策略;文獻[8]提出了一種動態的事件觸發策略,并證明了其有效性.在文獻[9-10]中,作者從攻擊者的角度研究DoS攻擊,并描述了使得攻擊收益最大化的DoS攻擊調度策略.為了進一步描述DoS攻擊者與CPS控制策略的交互性,許多學者從博弈論的角度進行了相關研究:文獻[11]中,二者的交互被看作零和博弈,考慮了二者的納什均衡策略;文獻[12]分別從攻擊者和防御者兩個角度分析了帶有未知策略的不完全信息博弈均衡解,并比較完全信息情況,設計了基于卡爾曼濾波的預測控制器.現有文獻主要對特定攻擊類型的DoS攻擊進行了一定的研究,但對CPS自身特性和DoS攻擊與控制策略交互性的研究存在一定的局限性.
綜合上述文獻中的相關研究成果和不足,本文建立了基于事件觸發預測控制的離散時間線性網絡控制系統.對于表征DoS攻擊信號的問題,現有研究中通常假設DoS攻擊服從一類概率分布.然而,在存在智能干擾器的情況下,DoS攻擊難以滿足相應的統計特性,并且防御者也難以獲取準確的統計信息.為了縮短理論研究與工程應用之間的差距,本文選取隨機DoS攻擊模型,從能量受限的角度去設計DoS攻擊模型,得到了攻擊的最大步長.在系統受到攻擊時,為了避免因數據無法傳輸而造成的系統性能下降,設計了一種基于廣義預測控制的數據補償策略,并同時結合事件觸發機制,減少網絡信道上數據傳輸量,降低通信網絡負荷.在對受攻擊的系統狀態進行分析時,將系統描述為一個切換系統,并建立了系統閉環穩定性條件.
如圖1所示為離散時間線性不變系統,在其控制系統中,傳感器到控制器之間的通信線路為網絡通信線路,而網絡攻擊即發生在此網絡信道中.攻擊發生時,網絡通道上被視為系統狀態信號完全無法傳輸.

圖1 系統結構示意圖Fig.1 Diagram of system structure
在系統傳感器節點處采用定周期采樣策略,結合事件觸發機制來減少網絡帶寬的占用,并通過廣義預測控制算法,在DoS攻擊發生時,控制器基于歷史狀態信息來得出丟失狀態信號的預測值,從而主動補償網絡攻擊對系統造成的影響.
系統被控對象可被描述為:
x(k+1)=Ax(k)+Bu(k)
(1)
式中:x(k)∈Rn×1為控制系統的狀態變量;u(k)∈Rm×1為系統的控制輸入;A∈Rn×n,B∈Rn×m.假定系統(A,B) 可控,DoS攻擊最長步長為d.
為了減少控制信號在網絡信道上的傳輸量,從而降低通信網絡負荷,狀態信號只有在滿足特定的事件觸發條件時才被傳輸.假定事件觸發時刻為ki(i=0,1,2,…),當系統狀態x(ki)在事件觸發時刻ki被傳輸時,下一事件觸發時刻ki+1由以下方程確定[13]:

(2)
r∈N+,μ∈(0,1)

網絡信道中存在DoS攻擊,可能造成部分通信數據未能成功傳輸的情況.綜合事件觸發機制和DoS攻擊對系統造成的影響,將不同情況下的系統狀態進行劃分.系統中狀態數據的傳輸示意圖如圖2所示.

圖2 數據傳輸狀態示意圖Fig.2 Status of data during transmission
將系統事件觸發時刻記為ki.ki時刻時,如果系統未受到DoS攻擊,則狀態x(ki)被成功傳輸,將該時刻記為tj(j=0,1,2,…)可得{t0,t1,t2,…}?{k0,k1,k2,…}?{0,1,2,…}.Δ則為系統采樣周期.
一般在網絡系統的預測控制方案中,狀態數據x(k)在每個采樣周期均被發送,并且周期性地更新控制律.然而,在事件觸發控制策略下,只有當滿足事件觸發條件式(2)時才將狀態信息發送到控制器,減少信道資源占用.此外,對于由DoS攻擊所造成的數據傳輸失敗從而導致系統性能降低甚至失穩的情況,將介紹一種預測控制算法,對傳輸失敗的數據進行補償.
當tj時刻時,數據被成功傳輸,預測控制的最優性能指標為[14]
(3)
式中:Q和R為正定對稱的加權矩陣;Np和Nu分別為預測范和控制范圍,Np≥Nu≥d;x(tj+l|tj)和u(tj+l|tj)分別為基于tj時刻的狀態變量和控制輸入的測量值而得出的tj+l時刻的狀態變量和控制輸入的預測值.
由式(1)可得
x(tj+l+1|tj)=Ax(tj+l|tj)+
Bu(tj+l|tj)
(4)
則系統的預測控制方程可寫為
X(tj+1)=Apx(tj)+BpU(tj)
(5)
式中:
X(tj+1)=

Bp=

進一步,系統的性能指標函數式(3)可化為
UT(tj)RU(tj)
(6)
式中:

系統的預測控制優化問題可以根據式(3)和(4)化為

(7)
?J(tj)/?U(tj)=0時,最優控制輸入解為
(8)
從而,在事件觸發時刻tj的控制輸入為
u(tj)=u(tj|tj)=Fx(tj)
(9)
式中:預測控制反饋增益為
假設在事件觸發時刻ki,狀態x(ki)被成功傳輸,則有ki=tj,如圖3所示,在區間[tj,tj+1)內,控制反饋增益為F,即在事件觸發時刻ki+s(s=1,2,…,d),有

圖3 相鄰成功傳輸時刻間數據傳輸狀態示意圖Fig.3 Data status between two successfully transmitted moments

(10)
并且在區間[ki+s,ki+s+1)內,控制律保持不變.
tj和tj+1為兩次相鄰的數據信號成功傳輸時刻,事件觸發時刻ki+1等則由于DoS攻擊的存在而使信號無法傳輸.在兩次相鄰的成功傳輸時刻 [tj,tj+1) 之間,基于上一次成功傳輸的狀態信息,對未能傳輸成功的狀態進行預測:
x(ki)=x(tj)
(11)

(12)
(13)
j=1,2,…,ki+1-ki-1


(14)
j=0,1,2,…,ki+s+1-ki+s-1
在反饋控制律式(10)的作用下,控制系統(1)可寫為
x(k+1)=Ax(k)+Bu(ki+s)=

(15)
根據式(11)~(14)對預測狀態的推導,可得

(16)
因此,閉環控制系統的方程可以寫為
x(k+1)=Ax(k)+

(17)
x(k+1)=Πσsx(k)-Ξσse(k)
(18)
式中:

本節在閉環系統式(18)的基礎上,討論了事件觸發器參數Φ的設計,并分析了系統的李雅普諾夫(Lyapunov)穩定性,給出了系統穩定性條件.
定理1考慮上文所給出的事件觸發預測控制系統,對于給定的系統矩陣A和B,常數參數μ∈(0,1),預測控制反饋增益F,如果存在適當維數的矩陣P>0和Φ>0,使得對于所有σs∈S,都有如下矩陣不等式成立:
(19)
則閉環系統式(18)是漸進穩定的.式中:“*”為矩陣對稱項的省略.
證明選取閉環系統的Lyapunov方程為
V(x)=xT(k)Px(k)
(20)
式中:矩陣P為對稱正定矩陣.根據事件觸發條件式(2)可得,在沒有發生事件觸發的時間段內,有
eT(k)Φe(k)≤μxT(k)Φx(k)
(21)
結合式(20)和(21),可得
ΔV=V(x(k+1))-V(x(k))=
xT(k+1)Px(k+1)-xT(k)Px(k)≤
xT(k+1)Px(k+1)-xT(k)Px(k)-
eT(k)Φe(k)+μxT(k)Φx(k)=

P[Πσsx(k)-Ξσse(k)]-
xT(k)Px(k)-eT(k)Φe(k)+
μxT(k)Φx(k)=
(22)
式中:

根據舒爾(Schur)補定理,如果Ω<0,則線性矩陣不等式(19)成立,同時有ΔV<0.根據Lyapunov穩定性定理,閉環系統是漸進穩定的.
考慮如下的離散時間控制系統:
x(k+1)=Ax(k)+Bu(k)


通過LMI工具箱求解線性矩陣不等式(19)可得


則在DoS攻擊下,具有事件觸發預測控制的系統仿真結果如圖4所示.紅色曲線x′為無預測控制下系統受DoS攻擊時的狀態曲線,在該情況下系統受到DoS攻擊時,系統狀態信號視為丟失.藍色曲線x為具有預測控制的控制系統受DoS攻擊時的狀態曲線,該情況下系統受到攻擊時,則采用預測控制信號實施控制作用.陰影部分表示系統受到DoS攻擊的時間段.在給定的DoS攻擊下,未采用控制算法的系統已經處于失穩狀態.而預測控制算法能明顯改善系統狀態,使之能抵御一定強度的DoS攻擊,增強系統安全性能.

圖4 系統狀態響應曲線Fig.4 Simulation result of response of system status
系統受攻擊狀態下的時間觸發示意圖如圖5所示,其中:數值1為事件觸發狀態,數值0為事件未觸發狀態.結合圖4可得,在系統狀態變化較快的時間段內,事件觸發次數也明顯較多,從而使系統能夠迅速恢復穩定狀態,而在系統狀態較為平緩的時間段內,事件觸發次數較少,從而減少了通信信道上的數據傳輸量,降低了網絡系統的負荷,增加了系統的安全裕度.

圖5 事件觸發狀態示意圖Fig.5 Status of event-triggered generator
根據仿真結果可以看出,在系統受到有限強度DoS攻擊的情況下,文中所設計的預測控制算法對系統狀態有良好的優化作用,能在一定程度上實現對系統的安全控制.
本文針對CPS在傳感器到控制器的網絡線路上受到DoS攻擊時如何確保系統性能的安全問題,并結合已有相關建模方式及實際情況,設計了一種事件觸發廣義預測控制算法,使得在減少網絡信道數據傳輸量的同時,基于歷史狀態信息得到了缺失狀態數據的預測值,從而補償了丟失的狀態信號,降低了攻擊對系統造成的不良影響,并分析了系統的穩定性.最后,本文通過一個CPS仿真實例驗證了該方法的有效性.