李笑宇,馮肖雪,*,潘峰,2,蒲寧
1.北京理工大學 自動化學院,北京 100081 2.北京理工大學 昆明產業技術研究院,昆明 650106 3.云南省遙感中心,昆明 650034
無人機是一種依賴地面通信和飛行控制系統實現自主飛行的智能信息物理系統,信息物理系統(Cyber Physical Systems, CPS) 這一概念最初于1992年由美國國家航空航天局(NASA)作為一種新型智能系統提出,并得到廣泛應用,這是一類計算、網絡和物理實體有機融合與深度協作的復雜系統,從而達到對大型物理系統與信息系統的實時感知、動態控制和信息服務。但由于通信網絡的開放性,信息物理系統相比于電力網絡、物聯網、智能交通等物理系統更容易受到數據傳輸中的錯誤或惡意攻擊影響,進而造成損失或重大破壞,因此隨著近年網絡攻擊事件不斷增加,信息物理系統的安全研究已成為一個不可忽視的重要問題,例如美國國安部牽頭提出“航空電子網絡安全計劃”以抵御黑客攻擊。圍繞信息物理系統的網絡攻擊、狀態估計和安全保護問題, 國內外針對網絡攻擊開展了相應的研究工作,而有效應對并解決系統中網絡攻擊的前提是基于傳感器數據構建有效的狀態估計方法。Lee等針對傳感器攻擊提出了一種用于線性動力學系統的全分布式彈性狀態估計方案,設計了能有效排除受攻擊數據的分布式中位數求解器。Lu和Yang提出了一種切換投影梯度下降算法,可以根據損壞的量測數據估計狀態。
考慮將無人機信息物理系統遭受的網絡攻擊信號視作系統中的不確定因素,并采用未知干擾輸入項建模不確定因素,借鑒隨機不確定系統狀態估計理論解決無人機信息物理系統受網絡攻擊下的狀態估計問題,是一全新的嘗試。目前含未知干擾輸入項的隨機不確定系統狀態估計算法研究已相當成熟,有望為無人機信息物理系統的安全狀態估計研究提供新的思路和解決辦法。在含未知干擾輸入項的系統狀態估計問題研究中,針對含有狀態未知干擾的隨機不確定系統,文獻[8]提出最小上界濾波器引入自適應調整因子刻畫狀態未知干擾,文獻[9-11]分別基于方程式、典范性分解、受限系統模型給出了狀態濾波器。而針對含有量測未知干擾的隨機不確定系統,文獻[12-13]均使用了基于魯棒估計準則的上界濾波器解決估計問題,文獻[14]基于線性無偏最小方差估計準則提出了濾波器。但以上設計存在估計結果非傳統最小均方誤差意義下最優或未知干擾模型需要滿足一定條件的局限。此外,實際信息物理系統中不可避免地存在多種形式的網絡攻擊,因此含有單一類型網絡攻擊的系統模型難以精確地描述實際無人機信息物理系統,在此需要對同時存在于狀態及量測模型中的多種網絡攻擊信號進行建模研究。
當狀態及量測模型同時存在網絡攻擊信號時,可以采用雙重未知干擾輸入對狀態和量測模型中的不確定性進行建模,迄今為止各個領域已經對含有雙重未知干擾系統的狀態估計問題進行了廣泛研究。文獻[15]研究了同時估計狀態變量和未知干擾的觀測器設計問題。文獻[16]給出了基于線性無偏最小方差估計準則的未知輸入模糊推理S觀測器。文獻[17]采用自校正外部模型,給出了基于加權最小二乘遞推算法和卡爾曼濾波器的2種新算法。文獻[18]提出了兩階期望最大化算法來辨識未知干擾。文獻[19]對含有未知干擾的線性時變離散隨機系統設計了同時估計狀態變量和故障的擴維卡爾曼濾波器。但是,文獻[15,17-19]都設定未知干擾的分布或建模已知,而面向雙重未知干擾的文獻[16]也設定狀態干擾與量測干擾相同。文獻[20]針對一類雙重未知干擾系統,提出了一種兩步未知干擾解耦的策略,但對未知干擾矩陣要求比較苛刻,以保證系統具有足夠的自由度實現最小均方誤差估計。可見對無任何先驗可言的網絡攻擊信號而言,直接將上述面向雙重未知干擾的狀態估計算法應用到無人機信息物理系統上尚有一定的局限性。
此外,長期不間斷且高頻刷新率的傳送導致海量的狀態和控制信息等在通信網絡上傳送,可能會產生網絡擁塞,影響數據實時傳送。目前學者常用的方法是在信息物理系統中引入事件觸發機制。例如文獻[21-22]研究了在拒絕服務(DoS)攻擊下信息物理系統的控制問題,均采用了分散事件觸發方案以節省網絡資源。文獻[23]為保護信息網絡系統免受傳感器量測攻擊設計了2種狀態重建算法,并引入事件觸發來提高算法性能。
本文考慮研究受多種網絡攻擊下無人機信息物理系統的安全狀態估計問題,并引入事件觸發機制以大幅度降低系統能耗。通過將針對控制輸入的惡意攻擊建模為狀態方程中的未知干擾項,將針對傳感器數據的惡意攻擊建模為量測方程中的未知干擾項,針對狀態方程和量測方程含有雙重未知干擾的隨機不確定系統,提出基于事件觸發的自適應遞推狀態估計器。建立狀態估計遞推模型解耦濾波誤差中的量測未知干擾,利用濾波殘差引入自適應調整因子解除狀態未知干擾的影響,最后應用最小方差估計準則設計濾波器中的參數矩陣,證明濾波誤差的指數有界性。
考慮受到多種網絡攻擊的無人機信息物理系統狀態估計問題:
+1=+++
(1)
+1=+1+1++1++1+1
(2)
式中:+1∈為無人機狀態向量;+1∈為量測向量;為已知的控制向量;∈為系統噪聲,+1∈為量測噪聲,二者均為零均值,方差分別為、+1且滿足假設1的高斯白噪聲;∈、+1∈分別為控制輸入攻擊信號和傳感器量測攻擊信號;、、+1、+1為數值已知且維數適當的矩陣。
考慮無人機信息物理系統架構如圖1所示,飛行控制器根據任務需求接受地面指令完成任務計算和軌跡規劃,執行器執行飛行指令。無人機在執行器作用下完成既定飛行,事件觸發器決定是否將傳感器數據傳輸至網絡空間,傳感器和狀態估計得到位置和姿態信息并反饋給控制器不斷修正控制量和軌跡,完成既定任務。針對無人機信息物理系統的數據攻擊一般發生在傳感器網絡和地面指令信道中。
本文考慮無人機信息物理系統的數據攻擊發生在地面指令信道和傳感器網絡中,通過控制或者改變控制指令和傳感器讀數來對無人機信息物理系統進行攻擊。具體采用隨機攻擊模式實現控制指令攻擊,攻擊者通過隨機發送數據包企圖試錯繞過中控系統的檢測機制從而對控制指令發起攻擊,即狀態方程中的。具體采用惡意數據植入攻擊模式實現對傳感器讀數攻擊,攻擊者已經認知了系統模型,包括系統的狀態方程和量測方程中的參數矩陣,攻擊者控制傳感器的特定部分,從而對控制系統進行特定功能的欺騙,即量測方程中的+1+1,+1即為攻擊者已知的傳感器選擇攻擊矩陣。

圖1 無人機信息物理系統架構Fig.1 Framework of UAV flight cyber-physical system
對于網絡攻擊信號的干擾建模,當=且+1+1≠時,式(1)和式(2)可描述只受到傳感器量測攻擊的系統。而當≠且+1+1=時,式(1)和式(2)等同于只受到控制指令攻擊的系統。此外,若控制輸入攻擊信號建模為=?,其中,為已知的攻擊干擾分布矩陣;?為攻擊干擾信號,則系統模型等同于控制指令攻擊分布矩陣已知的模型;若=+1,則等同于控制指令攻擊與傳感器量測攻擊相同的系統模型。由此可見,式(1)和式(2) 可以描述狀態與量測方程含有不同網絡攻擊信號的信息物理系統。
針對隨機線性系統式(1)和式(2), 給出如下假設。
初始狀態與過程噪聲、量測噪聲相互獨立。控制輸入攻擊信號與量測攻擊信號+1+1相互獨立,且都與過程噪聲、量測噪聲相互獨立。過程噪聲和量測噪聲+1不相關且均值為零。
如果rank(+1)=(=1,2,…,-1), rank(*)為矩陣*的秩,若>,+1為列滿秩矩陣;如果不是,將+1進行秩分解:
+1+1=1,+12,+1+1
(3)
式中:1,+1為列滿秩矩陣。此時將2,+1+1作為一個新的未知輸入,這樣假設2可應用于一般性系統。
本文引入的事件觸發機制滿足以下條件:

(4)

+1=+-(-)(-)
(5)
動態觸發機制相較靜態觸發能降低通信率、提高資源效率的關鍵在于動態偏移變量。該變量與歷史時刻取值正相關,為漸消比例因子(0<<1),取值越高,動態偏移變量更依賴于歷史時刻取值,即動態閾值變化不大,傳感器量測數據通信率較為穩定;若取值越低,則動態偏移變量對最新量測數據更為敏感,即動態閾值發生較大變化,傳感器量測數據通信率易發生突變。此外,動態偏移變量還可以根據傳感器當前量測及最新發送量測的差值進行實時計算,以實現動態調整無人機的數據傳輸。
式(4)和式(5)聯立可得+1的迭代不等式

(6)
已知式中參數0<<1,≥1,遞推可得

(7)


(8)
由式(4)確定的第個觸發時刻為

(9)
式中:為正整數。+1為下一個滿足觸發條件的時刻,默認+1次觸發時間大于次觸發時間。此時,時刻狀態估計器收到的實際量測值為

(10)

動態事件觸發機制更為一般化,靜態事件觸發為其中的一種特殊情況。如文獻[28]中所述,如果動態變量滿足式(4),則動態機制下的觸發瞬間小于靜態機制。若無人機傳感器量測數據在連續時刻內僅發生微小波動,即上述差值較小,則動態偏移變量調高,動態觸發閾值同步變大,滿足觸發機制的時刻有所減少,無人機傳感器數據通信率降低。反之,若無人機傳感器量測出現較大波動時,量測差值增大,動態偏移變量和動態觸發閾值減少,滿足觸發機制的時刻有所增多,即無人機傳感器數據通信率有所提高以便保證狀態估計精度。通過上述自適應調節過程,減少“不必要”的數據傳輸,完成動態事件觸發機制下通信率與估計精度的折衷。
同時,考慮到估計器遞推過程需要從傳感器傳輸每時刻動態閾值導致通信量增加,本文使用動態閾值上界代替動態閾值以規避該問題,估計器只需利用動態閾值上界進行計算,無需進行數據傳輸。
將控制指令攻擊和傳感器量測攻擊建模為雙重未知干擾,解決雙重干擾最直觀的辦法是進行雙重解耦以獲取自適應方差極小化意義下的最優估計,但采用經典的干擾解耦方法存在以下2個問題:一是解耦的根本條件即狀態未知干擾的分布矩陣在本文考慮的系統中未進行單獨建模;二是采用干擾解耦的辦法對量測干擾實施解耦會犧牲待設計矩陣參數的部分自由度,而剩余的自由度能否對狀態干擾實施二次解耦值得商榷。因此,本文首先利用遞推濾波器實現濾波誤差中的傳感器量測攻擊信號解耦;之后引入自適應調整因子推導最小上界濾波誤差協方差矩陣;最后利用最小方差估計準則設計濾波器中的量測增益反饋矩陣。
對系統式(1)和式(2),設計遞推狀態濾波器:

(11)

系統的濾波誤差可以表示為

(12)
將式(2)和式(12)代入式(11)得狀態估計值為

)+++1(+1+1++1+

+1+1(+++)++1+1+

+(++1+1)++1+1(+

(13)
將式(1)、式(13)代入式(12)得


(-+1+1-)+(-+1+1)·

(14)
本文適用于含有多類型網絡攻擊的不確定信息物理系統,即、+1均為無先驗信息的網絡攻擊信號。由式(14)可看出濾波誤差中含有前一時刻的系統狀態變量、控制輸入和未知量測干擾+1。為了實現濾波誤差與上述3項的解耦,設計解耦約束條件

(15)
代入量測攻擊信號的解耦條件,將式(14)化簡為

(16)
根據濾波誤差方程式(16),且結合假設1中過程噪聲、量測噪聲都分別與初始狀態及未知干擾相互獨立,則+項與過程噪聲、量測噪聲均無關,交叉項為零。計算求得濾波誤差方差陣,并整理化簡得




(17)
式中:E{*}表示求期望值;sym{*}表達式為:sym{}=+。

已知存在不等式關系
+≤ω+>0
(18)
式中:為滿足不等式的常數。則存在如下關系式:



(19)


(20)
式中:和為滿足不等式且實現上界極小的參數。
又由觸發條件式(4)和式(8)可知


(21)
將式(19)和式(20)代入濾波誤差協方差陣式(17),結合式(21)可得協方差上界為
+1≤(1+)E{(+)(+)·


(22)




(23)
自適應調整因子可以通過濾波殘差協方差矩陣求取。首先計算濾波殘差





(24)
式(24)左乘得到+1,結合解耦條件式(15)得到濾波殘差協方差+1:





(25)
將式(21)代入式(25),結合式(18),可得不等式



(26)
結合式(20)、式(21)、式(25)和式(26),可得



(27)




(28)
定理1給出自適應調整因子的求解方法。
如果滿足以下3個條件:

2)+1是滿秩的,即rank{+1}=。



(29)

(30)
定義集合+1為


(31)


(32)
首先證明最優自適應調整因子的存在性,定義中間變量Δ為

(33)
根據式(27)和式(28),計算濾波殘差協方差及其上界的差值:


(34)
由>0和+1+1滿秩,可得

(+1+1)≥Δ≥0
(35)
同理根據式(22)和式(23),結合>0和+1滿秩,可得

(36)
因此證明得到以下關系式:

(37)

(38)




(39)



(40)


(41)
由式(29)和式(30),有

(42)

(43)
結合式(37)和式(38)可得式(29)和式(30),定理1證畢。



(44)


(45)




(46)



(47)
式中:、、為中間變量,計算公式分別為



(48)

(49)

(50)
應用最小方差估計準則,并結合約束條件式(15),構造輔助方程

(51)
將式(46)代入式(51),得









2tr{+1+1}
(52)








(53)
為了表述方便,定義中間變量和如式(48)和式(49),可知為對稱非奇異矩陣,因此可逆。將式(48)和式(49)代入式(53)得到簡化形式

(54)
聯立式(54)和約束條件式(15),分別求轉置后得到矩陣方程組:

(55)
將式(55)寫為分塊矩陣形式,可得

(56)
根據假設2可知,量測向量維數大于未知量測干擾維數時,分塊矩陣方程的系數矩陣的逆存在,式(56)的解為

(57)

(58)
即式(47)和式(50)成立。

接下來對所設計估計算法的性能進行分析,并對濾波誤差在均方意義上的指數有界性進行充分證明。
在進行算法性能分析之前,先引入隨機過程有界性的定義。


(59)

在引理1的基礎上,定理3給出了濾波誤差在均方意義下指數有界的充分條件。


(60)
則系統的濾波誤差在均方意義下指數有界。
將濾波誤差式(14)重新表示為
+1=++1++1
(61)
其中:
+1=+-+1+1
(62)

(63)
由式(48)~式(50),有如下不等式成立:

(64)


(65)

(66)
代入式(47)和約束條件式(15)可推導出


(67)

(68)
將式(66)和式(67)代入式(61),可得



(69)
同理,將式(66)代入式(62)得

(70)
為獲任意界值,定義迭代關系式:

(71)
則有

(72)
重復以上操作,可得到

(73)


(74)











(75)
式中:、為滿足不等式且實現上界極小的參數。根據定義式(70)和矩陣求逆引理有




(76)
將式(75)代入式(74),可得
Ε{+1(+1)|}-(1+)()≤-(1+)


(77)
對式(76)移項可得
Ε{+1(+1)|}≤()+
(78)

將的定義代入式(77),可以進一步得到

(79)
根據引理1和定理3,可得隨機過程的濾波誤差在均方意義上是指數有界的。
基于2.1~2.4節的推導和證明,針對動態事件觸發機制下受到多種網絡攻擊的無人機信息物理系統,本文所提的基于自適應方差極小化的遞推狀態估計器的計算步驟如下:

由式(24)計算殘差+1。



將參數代入式(48)和式(49)計算中間變量、;
和代入式(50)計算+1。



加1,返回步驟2。


(80)

為了驗證算法的優越性,將所提出的基于自適應方差極小化的遞推狀態估計器(AVMRE)與雙重解耦無偏估計器(DDUE)、無偏最小方差估計濾波器(MD-UMVE)、三級卡爾曼濾波器(TSKF)、魯棒三級卡爾曼濾波器(RTSKF)進行對比。同時,為了量化事件觸發降低通信率的效果,定義通信率為

(81)
式中:為網絡中傳感器數量,本文取1;為總的仿真步數;,=1為采樣數據被傳輸,,=0為采樣數據未被傳輸。
圖2(a)~圖2(c)給出了對第1狀態分量至第3狀態分量的估計效果對比。第1狀態分量和第2狀態分量同時受到控制輸入攻擊信號和傳感器量測攻擊信號的影響,從圖2(a)、圖2(b)中可以看出,本文所設計的遞推狀態估計器AVMRE具有最優的估計效果。而DDUE在實現控制輸入攻擊信號和傳感器量測攻擊信號雙重干擾解耦后,系統剩余設計自由度不足,無法保證估計性能;MD-UMVE僅對量測干擾進行解耦未對控制輸入攻擊信號進行處理;TSKF與RTSKF僅對控制攻擊信號進行處理,將控制輸入攻擊信號與狀態擴維通過UV變換實現聯合估計,而未對量測干擾進行任何處理,因此估計效果均不佳。
圖2(c)則表明了第3狀態分量只受到幅度不大的控制輸入攻擊信號影響時,由于TSKF算法將時變的控制輸入攻擊信號近似為恒定不變的常值,在最小均方誤差估計準則下獲得狀態估計;RSTKF算法在未知干擾項為常值,即無未知干擾演變方程時,等同于TSKF算法;而本文算法通過引入自適應因子來刻畫控制輸入信號,利用最小上界估計誤差協方差也是在最小方差估計準則下獲得狀態估計,所以本文算法、TSKF算法、RSTKF算法的估計效果相差不大。而DDUE算法在實現雙重干擾信號解耦后,系統剩余設計自由度不足,導致無法獲得最優的估計性能; MD-UMVE由于僅對量測干擾進行解耦處理,對狀態干擾項不采取任何措施,所以估計效果最差。以上體現出當狀態和量測方程同時受到攻擊時,本文所提狀態估計算法對雙重攻擊信號處理的有效性和優越性。

圖2 各分量狀態估計結果比較Fig.2 Comparison of state estimates of three state components
為了進一步比較5種算法的估計性能,圖3(a)~圖3(c)分別給出了第1~3狀態分量經過100次Monte Carlo 實驗的均方根誤差(RMSE)比較。從圖中可以看出, MD-UMVE算法僅對傳感器量測攻擊信號進行處理,TSKF和RTSKF算法僅對控制輸入攻擊信號進行處理,因而估計誤差較大。DDUE算法在完成雙重干擾解耦后系統自由度不足導致估計性能欠佳,而本文設計算法對于含有控制輸入攻擊信號和量測攻擊信號的無人機信息物理系統的狀態估計效果令人滿意。

圖3 各分量狀態估計100次RMSE比較Fig.3 Comparison of state estimates RMSE of three state components
為了描述事件觸發情況,給出其觸發時刻示意如圖4所示。根據文獻[7]中的定義,由50次仿真實驗中本文觸發機制得到300個節拍下的觸發時刻數量計算得到平均通信率為17.6%。為了對比分析引入事件觸發機制后對算法估計性能的影響,圖5給出了周期傳輸方案和事件觸發機制下算法的狀態估計RMSE,表1給出了相應的平均RMSE,可看出引入事件觸發機制算法的估計性能相比周期傳輸而言在3個狀態分量上依次有13.1%、6.6%、61.1%的下降。需要指出的是本文遞推狀態濾波器設計過程中引入了實際接收量測數據和真實量測的誤差項,通過量測未知干擾項解耦間接實現了量測誤差項的補償,所以對于受量測信號攻擊的第1、2狀態分量在引入事件觸發機制后估計性能的損失不明顯,而對于僅受控制輸入攻擊的第3狀態分量,在引入事件觸發機制后算法的估計性能相比周期傳輸下降較多。總結來說,相比于周期傳輸機制的估計算法,本文所設計動態事件觸發機制下的狀態估計算法在犧牲一定估計性能的前提下,能夠降低82.4%的數據通信率,系統信息傳輸效率有較大提高。

圖4 事件觸發示意圖Fig.4 Diagram of event-trigger

圖5 周期傳輸與事件觸發下算法RMSE對比Fig.5 Comparison of RMSE of periodic transmission scheme and event-triggered algorithm

表1 周期傳輸與事件觸發下平均RMSE對比
需要說明的是,仿真場景中給出的飛行控制系統動力學模型參數是不穩定的,即飛控系統開環不穩定。由于系統可控可觀,所以通過施加控制輸入可控制實現無人機穩定飛行。需要指出的是控制輸入攻擊信號不僅可以刻畫對控制輸入信號的電磁干擾,還可以表征動力學模型中參數的變動,即未知干擾項的取值不同,真實飛控系統的動力學模型參數的穩定性是時變未知的。因此本文所提算法對系統的穩定性沒有限制要求,對于穩定系統或不穩定性系統均適用。此外,本文使用的雙重未知干擾建模也適用于其他攻擊或干擾情況下的系統,且引入的動態事件觸發算法涵蓋了靜態事件觸發,因此本文所提算法對事件觸發機制下的不確定系統狀態估計具有一定普適性。
1) 針對無人機信息物理系統在多種網絡攻擊下的自適應遞推狀態估計問題,通過將針對控制輸入的隨機攻擊建模為狀態方程中的未知干擾項,將針對傳感器數據的惡意數據植入攻擊建模為量測方程中的未知干擾項,上述問題轉化為等效的包含雙重未知干擾的隨機不確定性系統狀態估計問題進行研究。
2) 利用狀態估計遞推濾波器和自適應調整因子解決了實現狀態濾波誤差中傳感器量測攻擊信號和控制輸入攻擊信號解耦的問題,得到濾波誤差協方差的最小上界。并利用最小方差估計準則對量測增益反饋矩陣進行求解,實現了自適應方差極小化意義下的狀態估計。
3) 引入事件觸發機制以減少通信消耗,并嚴格證明了濾波誤差均方意義下的指數有界。無人機飛行控制系統的仿真實例驗證了本文所提算法的有效性和優越性。引入動態事件觸發后,在保證估計性能的前提下系統信息傳輸效率有較大提高。研究適用于量測維度小于系統狀態維度場景下的控制輸入和傳感器量測兩類攻擊信號下的安全狀態估計是值得研究的課題,將是下一步研究方向。