李聞白, 林飛龍, 潘竹生
(浙江師范大學 數學與計算機科學學院,浙江 金華 321004)
卡爾曼濾波(Kalman filter,KF)及其擴展形式(extended Kalman filter,EKF)已廣泛應用于系統控制[1-2]、信號處理[3-4]、目標跟蹤[5]等工程領域.進入21世紀,隨著低成本傳感、快速計算和無線通信技術的發展,無線網絡化控制技術應運而生,并迅速成為研究熱點[6].在網絡化控制系統中,執行器、傳感器、中央控制器和過程監測終端通過無線網絡連接,系統的不同組成單元通過無線網絡相互交換和傳遞信息,控制器與過程終端可以實現遠程控制與監控.與傳統的控制方式相比,無線網絡化控制系統具有空間約束少、布設靈活、運行維護成本低等諸多優勢,并被公認為是現代控制中最有前途的產業化方向之一[7].在此背景下,針對無線網絡化控制系統,通過獲取系統的輸入、輸出觀測數據,對系統狀態進行最優估計的卡爾曼濾波問題,受到了學術界和工程領域的普遍關注[8-9].
在網絡化控制系統中,各個組成單元之間的信息傳輸、交互依賴于無線網絡,數據通過網絡傳輸時將會產生恒定或隨機的通信時延,而時延會使控制系統的性能惡化.網絡化控制系統中存在的另一個問題是數據丟包.因為通信網絡是一種非可靠的傳輸通道,當受到外界干擾或發生網絡擁塞時,網絡上的數據在傳輸時不但存在傳輸延遲,還可能出現數據包丟失,從而嚴重影響控制系統的性能,甚至使系統變得不穩定.因此,相比于傳統的濾波方法,網絡環境下的卡爾曼濾波器分析與設計變得更為復雜,深入研究通信時延、數據丟包對濾波器性能的影響,成為網絡化控制領域的重要課題[6-9].
對于網絡化控制系統中卡爾曼濾波器的性能問題,Sinopoli等[10]研究了數據丟包對線性卡爾曼濾波狀態估計的影響,指出當數據丟包率大于某一閾值時,系統的濾波方差將隨時間趨于發散;Liu等[11]分析了存在多組觀測值獨立丟包的線性卡爾曼濾波模型,并給出了與狀態估計穩定性相關的濾波觀測值的接收率閾值;文獻[12-13]針對網絡丟包情形下,基于概率模型分析了線性卡爾曼濾波的狀態估計性能,建立了濾波方差小于某個給定常值矩陣的概率上下界;Huang等[14]將通信網絡的丟包特性描述為二狀態的馬爾可夫鏈,給出了確保線性卡爾曼濾波器穩定的數據恢復率下界;Kluge等[15]面向非線性系統的擴展卡爾曼濾波方法,研究了存在數據丟包情形下系統狀態估計的誤差特性,并給出了一些確保濾波器滿足均方指數穩定性的充分條件.
總的來說,以上研究工作對網絡化控制系統中卡爾曼濾波器的性能問題進行了有益的理論和實踐探索,但仍有一些問題值得考慮.例如,文獻[10-14]中討論的均是線性卡爾曼濾波模型的狀態估計性能,并未涉及在工程實際中應用更加廣泛的非線性擴展卡爾曼濾波模型;文獻[15]雖然給出了擴展卡爾曼濾波器方差的均方指數穩定性條件,然而其要求系統的量測矩陣可逆,并且與系統矩陣具有相同的維數.這些條件顯然過于苛刻,且不符合實際中的大多數擴展卡爾曼濾波模型.本文針對這些問題,進一步發展了文獻[14]中的方法和技術手段,通過建立隨機系統的峰值方差穩定性指標,深入分析了網絡數據丟包對非線性擴展卡爾曼濾波器性能的影響,并在不依賴文獻[15]中對系統參數的假設條件下,給出了擴展卡爾曼濾波器滿足峰值方差穩定性的充分條件.
考慮如下的非線性時變系統:
xt+1=f(xt,ut)+Gtwt,t≥0.
(1)
式(1)中:t∈Ν是離散時間;xt∈Rn是系統的狀態向量;ut∈Rd是系統的輸入向量;在初始時刻t=0時,系統的狀態初值為x0.系統的量測方程為
(2)
由于在無線網絡環境下,系統量測數據的傳輸可能存在數據丟包,因此量測方程(2)具有下列形式(t≥1):
(3)
為此,可引入隨機變量γt∈{0,1}來描述t時刻量測數據包的到達或丟失.若γt=1,則表示t時刻的量測數據被成功接收;反之,若γt=0,則表示t時刻的量測數據未被成功接收,即傳輸信道發生了數據丟包.通常情況下,γt的取值0和1分別被稱為信道的失敗狀態和正常狀態.為進一步描述網絡傳輸信道的變化情況,設隨機序列γt服從二狀態的馬爾可夫鏈,其狀態轉移矩陣為

(4)
式(4)中,p>0,q>0分別稱為數據傳輸的失敗率和恢復率.例如,1-p表示從正常狀態1開始,經過一步轉移后信道的傳輸狀態仍為正常狀態1的概率.通常稱服從上述變化規律的通信信道為Gilbert-Elliott信道模型[14],若p的取值越小(接近于0)及q的取值越大(接近于1),則表示網絡信道具有更高的傳輸可靠性.
在此基礎上,利用系統的量測方程(3)和信道傳輸特征γt,并適當修改傳統的擴展卡爾曼濾波狀態更新方程的推演步驟,可以得到當量測數據傳輸服從Gilbert-Elliott信道模型時,其擴展卡爾曼濾波的狀態預測和量測更新方程分別為:
(5)

(6)
式(5)和式(6)中:Kt+1是卡爾曼濾波增益;下標t+1|t表示t時刻的狀態預測,t+1|t+1表示t+1時刻的狀態更新.此外,由于f,h具有一階連續偏導數,所以可得其雅可比矩陣為
(7)
進一步采用與文獻[10]類似的推導方法,可得到擴展卡爾曼濾波的均方誤差及濾波增益公式為:
(8)
Pt+1|t+1=Pt+1|t-γt+1Kt+1Ct+1Pt+1|t;
(9)
(10)
其中,方程(8)和方程(10)中的噪聲項為
(11)
給出上述帶有隨機丟包的擴展卡爾曼濾波公式后,下文將重點研究系統狀態估計誤差的均方誤差序列{Pt+1|t}t≥0的演化情況,通過建立系統的峰值方差穩定性,進而導出濾波系統滿足該穩定性的充分條件.
本節的主要目標是給出具有隨機丟包的網絡信道下,擴展卡爾曼濾波的均方誤差的方差的演化規律,并以此建立濾波系統的峰值方差穩定性.為了確保文中的非線性濾波系統是有意義的,對其中部分參數作如下假設:
(H1)狀態轉移矩陣(4)中的數據傳輸失敗率和恢復率p,q∈(0,1).

(12)
式(12)中,Mt+k,t為可觀測性格拉姆矩陣,即
(13)
并且Φt,t=I,Φi,t=Ai-1Ai…At.

(14)
此外,不失一般性,選取二狀態馬爾可夫鏈γt的初值γ0=1.因此,結合非線性系統式(1)、式(3)及γt的取值,系統的濾波方差可以表示為
(15)
式(15)表明,濾波方差序列Pt+1|t在二狀態馬爾可夫鏈γt的驅動下,按照γt=0或γt=1兩種狀態隨機地進行跳躍性演化.
下面針對馬爾可夫鏈γt的初始狀態γ0=1,遞推地引入2組停時(stopping time)序列{τi}i≥1和{βi}i≥1,用來描述γt的跳躍時間:
(16)
由γt的定義可知
(17)
以及下列順序關系成立:
1<τ1<β1<…<τi<βi<τi+1<….
(18)
引理1在假設(H1)下,停時序列{τi}i≥1和{βi}i≥1中每個元素的取值均為有限值.
證明 由p,q∈(0,1)可知,馬爾可夫鏈{γt}t≥1是遍歷的,且具有強馬爾可夫性[18].因此,容易驗證Pr(τ1=∞)=0,即τ1<∞.注意到γt的強馬爾可夫性,則{γτ1+t}t≥1仍為馬爾可夫過程,從而Pr(β1=∞|τ1<∞)=Pr(γτ1+t=0,t≥1|τ1<∞)=0.由于τ1<∞,故β1<∞.最后,利用數學歸納法可知,對于每個i≥1都有τi<βi<∞.引理1證畢.
引理2在假設(H1)下,關于駐留時間序列有以下性質:
證明 參見文獻[14,18].
具備上述結論后,定義
(19)

下面給出本文的核心概念,即非線性隨機系統的峰值方差穩定性.

(20)
則稱系統具有峰值方差穩定性.式(20)中:‖·‖表示矩陣的譜范數[19];E{·}為隨機變量的數學期望.
本文的主要結論以定理1的形式給出,從而獲得帶有隨機丟包的非線性擴展卡爾曼濾波系統具有峰值方差穩定性的充分條件.
定理1考慮網絡信道下帶有隨機丟包的擴展卡爾曼濾波系統,其狀態方程和量測方程分別由式(1)和式(3)確定.若系統參數滿足下列條件:

(21)
(C2)網絡信道的恢復率q有下界qc,并滿足
q>qc
(22)
證明 利用系統濾波方差演化的黎卡提方程(15),定義映射
(23)
式(23)中:F0(Pk|k-1)=Pk|k-1;γk+i=1;i=1,2,…,n-1.由假設條件(H2),(H3)和文獻[16-17]中類似的推演方法可知,存在正常數L>0,使得對每個n≥0有
Fn(Pk|k-1)≤LI.
(24)
下面證明滿足定理條件(C1)和(C2)的濾波系統具有峰值方差穩定性.




(1-p)i-1p(1-q)j-1qΓ1+Γ2.
(25)
式(25)中:χ{τk+1-βk=i,βk+1-τk+1=j}是示性函數,表達式為
(26)

聯立定理1的條件(C1)、(C2),并結合式(14)和式(24)可得
(27)

(28)
式(27)和式(28)中,L1>0,L2>0是與k無關的常數.因此,
(29)
式(29)進一步表明:對每個k≥0,有
(30)


本文基于Gilbert-Elliott網絡信道模型,研究了帶有隨機丟包的擴展卡爾曼濾波器的狀態估計性能.通過分析濾波方差序列演化的黎卡提方程,建立了非線性隨機系統的峰值方差穩定性,并給出了確保濾波系統穩定的充分條件,具有較好的實用性.在后續工作中,擬面向更一般的網絡信道,考慮同時具有通信時延、量化失真及多丟包網絡環境下的最優狀態估計問題.