李 倩,聶 簡,黃鴻殿,孔慶宇,奔粵陽
(哈爾濱工程大學 智能科學與工程學院,哈爾濱 150001)
在海洋科學研究與軍事打擊任務中,單體自主水下航行器(Autonomous Underwater Vehicle,AUV)受限于搭載傳感器的種類、感知范圍以及信息處理能力,往往難以滿足復雜任務需求。與單體AUV 不同,AUV 集群協(xié)同作業(yè)能夠以更高的效率執(zhí)行更加復雜的分布式任務,而且更適應復雜動態(tài)環(huán)境,因而受到廣泛關注[1]。針對AUV 集群編隊,基于艇間信息交換與共享實現(xiàn)AUV 協(xié)同定位是提高編隊整體導航定位性能的主要技術途徑。在主從式協(xié)同定位系統(tǒng)中,部分主AUV 搭載高精度慣性導航系統(tǒng)或慣性基組合導航系統(tǒng),其余從AUV 裝備低精度航位推算系統(tǒng)。主從AUV 通過水聲通信設備共享定位信息并獲取艇間相對距離量測信息,從而利用數(shù)據(jù)融合技術估計并校正從AUV 定位誤差。通常情況下,水下復雜環(huán)境會導致艇間水聲測距量測信息含有大量野值[2],進而導致AUV 協(xié)同定位系統(tǒng)量測噪聲一般不滿足高斯分布假設,從而對AUV 協(xié)同定位算法的魯棒性提出了更高需求。
目前,AUV 協(xié)同定位主流核心算法大都基于貝葉斯估計框架,而這其中卡爾曼濾波(Kalman Filter,KF)是協(xié)同定位算法中最常見也是工程上最易實現(xiàn)的方法之一。由于AUV 協(xié)同定位系統(tǒng)量測模型具有非線性,所以協(xié)同定位算法中KF 通常以其非線性擴展形式出現(xiàn),即擴展卡爾曼濾波(Extended Kalman Filter,EKF)[3]。除此之外,無跡卡爾曼濾波(Unscented Kalman Filter,UKF)、容積卡爾曼濾波(Cubature Kalman Filter,CKF)也被應用于協(xié)同定位從而達到減小非線性量測模型線性化誤差的目的[4,5]。但是,上述協(xié)同定位算法在面對非高斯噪聲時,存在導航狀態(tài)估計精度下降、甚至濾波失效等問題[6]。粒子濾波(Particle Filter,PF)雖然能夠解決非高斯噪聲估計問題,但需要大量粒子才能較好地近似系統(tǒng)后驗概率密度,因此其巨大的計算量限制了該算法在實際工程中的應用[7-9]。針對AUV 協(xié)同定位非高斯噪聲問題,文獻[10]提出一種基于泰勒級數(shù)展開的擴展Student'st魯棒卡爾曼濾波算法(Student’s t Extended Kalman Filter,SEKF),解決AUV 協(xié)同定位過程中水聲測距噪聲非高斯分布問題。文獻[11]將基于改進廣義最大似然估計的卡爾曼濾波與交互式多模型算法結合,解決AUV 協(xié)同導航過程中量測噪聲非高斯分布與時變問題。文獻[12]采用統(tǒng)計方法對磁羅盤、GPS、水聲定位與通信設備的輸出進行野值判別與剔除。當輸出被判定為野值時,EKF只進行時間更新而不進行量測更新。值得注意的是,上述方法都是在傳統(tǒng)卡爾曼濾波框架下進行算法魯棒優(yōu)化設計。
在探索更加高效導航方法的過程中,研究人員發(fā)現(xiàn)哺乳動物不需要高精度的感官信息就能確定自身在復雜環(huán)境中所處的位置[13]。通過模仿哺乳動物大腦海馬體空間細胞導航機理,研究人員提出了模仿生物大腦的類腦導航方法,并將類腦導航機理應用于視覺SLAM 領域[14]。通過建立空間表征細胞模型,編碼多種定位信息模擬神經細胞放電表征環(huán)境位置變化,進而完成導航定位[15]。昆士蘭科技大學Milford 教授團隊建立的RatSLAM[16]系統(tǒng)利用局部視圖細胞和位姿細胞,使用吸引子網絡建立細胞模型,通過視覺模板信息對視覺里程計誤差進行校正,從而準確表達機器人位置信息。但是,RatSLAM 主要基于純視覺信息用于導航定位。近年來,研究人員逐漸開始利用多種大腦導航細胞模型實現(xiàn)多源導航信息融合。文獻[17]提出的NeuroBayes-SLAM 使用頭朝向細胞和網格細胞實現(xiàn)角度編碼與位置編碼,并基于貝葉斯理論將視覺信息與運動信息融合到細胞模型編碼中。北京工業(yè)大學于乃功團隊提出了一種包含頭朝向細胞、條紋細胞、網格細胞、位置細胞的機器人建圖方法[18,19]。利用視覺信息對路徑積分誤差進行校正,并驗證了網格細胞積分對于不合法或者突變數(shù)據(jù)具有一定的濾波整合效果,相比于純路徑積分擁有更高的定位精度。
受大腦海馬體不同種類細胞模型之間信息交互機制的啟發(fā),本文提出一種基于海馬體細胞模型的主從式AUV 協(xié)同定位方法。首先,基于二維吸引子網絡模型構建網格細胞模型,并利用其對航向信息與速度信息進行路徑積分。在此基礎上,利用競爭性Hebb學習使多尺度的網格細胞生成具有單個放電活動包的位置細胞。最后,將AUV 主從艇之間的水聲測距量測信息轉化為位置細胞放電變化,并通過位置細胞多次放電更新后的累積變化逐漸逼近真實位置,降低量測野值對AUV 位置更新的影響,從而實現(xiàn)對從艇航位推算累積誤差的抑制。
本文采用雙領航艇主從式AUV 協(xié)同定位配置方式。考慮到AUV 普遍配備高精度深度傳感器,且其深度誤差不隨時間累積,因此將AUV 三維定位問題簡化為二維定位問題。選取東-北-天地理坐標系作為導航坐標系,從AUV 在x-y水平面上的離散運動學方程如式(1)所示:
其中,Xk=[xk,yk]T表示k時刻AUV 東向與北向位置,控制輸入可以通過AUV 所搭載的多普勒計程儀或電磁計程儀與羅經系統(tǒng)測量得到。實際工程中,傳感器輸出均受到噪聲干擾,因此可以表示為:
其中,wk=[wv,k,wθ,k]T表示系統(tǒng)噪聲。
系統(tǒng)量測信息Zk=[z1,k,z2,k]T是AUV主從艇之間的距離,可以表示為:
其中,z1,k,z2,k分別表示從AUV 與主AUV1、主AUV2 之間的距離量側信息,可由水聲設備獲得。X1,k=[x1,k,y1,k]T、X2,k=[x2,k,y2,k]T分別表示主AUV1 與主AUV2 的位置信息,vk=[ν1,k,ν2,k]T表示水聲測距量測噪聲。
根據(jù)式(1)~式(3),基于水聲測距量測信息的AUV 協(xié)同定位系統(tǒng)模型可以表示為:
其中,f(·) 表示非線性狀態(tài)方程函數(shù),h(·) 表示非線性量測方程函數(shù)。
在基于海馬體細胞模型的AUV 協(xié)同定位算法中,首先利用網格細胞完成路徑積分,即實現(xiàn)如式(1)所示的Xk時間更新。進一步,將路徑整合信息傳遞給位置細胞,通過位置細胞放電獲得AUV 實際位置。為校正從AUV 航位推算誤差,獲取AUV 艇間測距信息Zk并將其轉換為位置細胞放電輸入,從而對位置細胞進行校正,即實現(xiàn)如式(3)所示的量測更新。同時,為維持位置細胞穩(wěn)定放電過程,通過全局興奮與全局抑制將放電活動包限制在有效范圍內。最后,從AUV 經協(xié)同校正后的位置信息可以根據(jù)校正后的位置細胞放電活動計算得出。基于海馬體細胞模型的AUV 協(xié)同定位算法具體原理框圖如圖1 所示。

圖1 基于海馬體的AUV 協(xié)同定位原理Fig.1 Principle of cooperative localization for multiple AUVs based on hippocampal formation
2005 年,Hafting 等在大鼠腦海馬體中發(fā)現(xiàn)網格細胞,研究表明其在生物活動時主要起路徑積分作用[20]。通過構建合適的數(shù)學模型模擬動物大腦網格細胞作用機理,可以實現(xiàn)基于子艇航向與速度信息的路徑積分。本文采用Bruak 提出的二維吸引子模型對網格細胞進行建模[21]。吸引子模型中的細胞相互連接,通過合理的激勵、抑制與連接機制,可以驅動細胞網絡狀態(tài)向偏移方向連續(xù)移動,形成穩(wěn)定的六邊形放電活動包,從而實現(xiàn)路徑積分。
采用二維吸引子網絡模型進行建模,網格細胞在x-y水平面上排列形成Nx×Ny的二維細胞板。其中,Nx、Ny分別表示細胞板x、y軸向排列的細胞數(shù)量,如圖2(a)所示。由于細胞板的長度與寬度有限,為解決吸引子邊界問題,將細胞板上下兩側的細胞與左右兩側的細胞相連接,從而組成如圖2(b)所示的二維環(huán)狀模型結構。

圖2 二維連續(xù)吸引子網絡模型Fig.2 2D continuous attractor network model
網格細胞的放電由吸引子動力學等式給出,即:
其中,τ表示網格細胞神經元相應的時間常量;si表示Nx×Ny個吸引子細胞中第i個網格細胞的放電率;神經元傳遞函數(shù)f[·] 是一個簡單的非線性整流函數(shù),即當x>0 時,f(x)=x;當x≤ 0時,f(x)=0。
Bi用于輸入優(yōu)先方向的速度信息,即:
其中,eθi表示指向網格細胞i優(yōu)先朝向的單位向量,v表示速度向量,可由AUV 控制輸入中的速度經由航向分解獲得。實際應用中網格細胞的優(yōu)先朝向是任意值,為方便程序編碼,將網格細胞優(yōu)先方向設定為北、南、東、西四個方向,分別對應0、π/2、π、3/2π,在網格細胞板中2×2 的區(qū)域內均勻排布,如圖3 所示。

圖3 網格細胞的優(yōu)先朝向Fig.3 Preferred direction of grid cells
根據(jù)圖3 可知,每個網格細胞都與周圍其它網格細胞相互連接,從而接收其它網格細胞的信息輸入。權值Wij表示網格細胞j到網格細胞i之間的連接權值,具體表達式為:
式(8)中,a、γ、β均為權值調節(jié)參數(shù),由經驗值設定,一般取表示網格周期,可以用來調節(jié)生成網格圖案的大小。表示編號為i的網格細胞在細胞板上的橫縱坐標位置向量。式(7)中的l與式(6)中的α決定了速度輸入的驅動強度。根據(jù)式(7)可知,權值矩陣分布呈以為中心的墨西哥帽形狀分布,如圖4(a)所示,通過調節(jié)a可以調節(jié)細胞網絡中單個網格細胞激勵或抑制周圍網格細胞放電。特別地,當a=1時,權值都為負,即網格細胞之間的連接都是抑制性的,如圖4(b)所示。
通過上述網格細胞神經元網絡的激勵與抑制作用,可以促使網格細胞放電圖形向真實方向移動,從而表達AUV 的位移信息,如圖5 所示。
需要注意的是,單一網格細胞板放電對位置信息的表達具有歧義。因此,需要通過改變λnet生成具有不同尺度的網格細胞板,從而使用多個網格細胞板聯(lián)合解碼得到精確位置信息,不同尺度網格細胞如圖6所示。

圖6 不同尺度網格細胞Fig.6 Grid cells with different scales
在獲得多尺度網格細胞的基礎上,進一步通過由網格細胞到位置細胞的放電即可實現(xiàn)對真實位置的表達。位置細胞于1971 年被O’ Keefe 等人在對鼠腦海馬體研究的過程中發(fā)現(xiàn)[13],該細胞主要起到環(huán)境認知的作用,一個位置細胞神經元和物理空間中某一具體位置有著對應關系。生物學上位置細胞的放電受到多種感官信息的影響,而網格細胞放電就是位置細胞的信息輸入來源之一。多個不同尺度的網格細胞板放電作為前向輸入,使位置細胞生成單一的放電活動包,從而表征AUV 位置信息。
為了處理不同尺度網格細胞的輸入,使用競爭性Hebb 網絡更新不同尺度網格細胞到位置細胞的權值,即:
其中,wn表示第n層網格細胞板到位置細胞板的連接權值,K表示學習率,pi表示位置細胞放電率,表示第n層網格細胞板中第i個網格細胞的放電率,Ig表示學習閾值,一般由的平均值確定。位置細胞的放電率可以進一步表示為:
其中,A表示增益系數(shù),位置細胞放電抑制量Ip=B× max(pi)用來控制位置細胞放電活動包的個數(shù),參數(shù)B越大,位置細胞放電范圍越大,M表示網格細胞神經板的層數(shù)。
為了保證Hebb 競爭性網絡穩(wěn)定的學習與后續(xù)位置信息解碼,每次時間更新都對位置細胞放電進行歸一化處理,即:
通過上述Hebb 競爭性算法可以確保只有少量網格細胞族的子集被選擇形成位置細胞,從而避免網格細胞位置表達的歧義性。由含有多個放電活動包的網格細胞生成具有單一放電活動包的位置細胞,如圖7所示。

圖7 位置細胞放電活動Fig.7 Firing activity of place cells
需要注意的是,此時得到的位置細胞板同網格細胞板一樣,具有二維環(huán)狀模型結構,即上下兩邊、左右兩邊分別連通。當位置細胞放電活動包跨過邊界時,需要根據(jù)環(huán)狀連接結構進行循環(huán)。利用網格細胞放電對位置細胞放電更新,再對位置細胞放電進行解碼,進而得到位置細胞板放電中心位置,即:
其中,xi
p
,k是k時刻位置細胞i在位置細胞板上的位置向量,pi,k是k時刻位置細胞i的放電率。
進一步,經過邊界修正與坐標系轉換以后可以得到k時刻位置細胞所對應的物理空間具體位置,即:
其中,Xk表示AUV 位置,C表示位置細胞坐標板坐標系到導航坐標系的轉換矩陣;Dk=[εxNx,εyNy]T+d,其中εx,εy表示位置細胞經過邊界的次數(shù),d用來校正初始位置。當位置細胞經過細胞板邊界時,則重新分割二維環(huán)狀細胞板模型,從而使位置細胞放電包處于細胞板中心,并基于分割位置重新計算AUV 位置。
利用艇間測距信息作為量測信息,可以實現(xiàn)從AUV 航位推算累積誤差的協(xié)同校正。在基于大腦海馬認知機理的SLAM系統(tǒng)中,大多利用視覺模板匹配得到的位置信息對位置細胞放電直接進行校正,從而獲得更加精確的位置信息。考慮到AUV 協(xié)同定位系統(tǒng)中的艇間測距量測信息并不是對從艇位置的直接觀測,本文利用主從艇的位置信息與距離量測信息構建“新息”,進一步將該“新息”轉化為位置細胞的放電活動,從而通過放電更新不斷逼近位置細胞準確位置,獲得更精確的AUV 位置信息。
首先,選擇以位置細胞放電活動包為中心的位置細胞板周圍區(qū)域組成一個新的Mx×My的校正位置細胞板。校正位置細胞板初始均勻放電,即放電率為:
其中,pm表示第m個細胞的放電率,m=1,2…Mx×My。
當從AUV 接收到與兩個主AUV 之間的距離量測信息z1、z2以及主AUV 位置信息以后,更新位置細胞放電率為:
其中,δ表示控制放電范圍的參數(shù),通常設置為常數(shù);Ic表示校正位置細胞板放電抑制常量,l1、l2表示新息,其表達式為:
其中,xm、ym表示第m個位置細胞對應的導航坐標系位置,可基于式(13)由位置細胞坐標系到導航坐標系轉換得出;x1、y1與x2、y2分別表示主AUV1 與主AUV2 的位置。
每次獲取量測信息以后,校正位置細胞板放電也隨之更新,并逐漸匯聚到真實位置附近。因此,位置細胞的放電包含多次量測信息,從而可以有效降低單次量測野值對于位置細胞放電的負面影響。需要注意的是,隨著多次放電更新,位置細胞的放電變化會逐漸減小甚至停止,如圖8 所示為第1、4、7 次校正位置細胞板的放電活動。

圖8 校正位置細胞板放電活動Fig.8 Firing activity of correction place cells
為了維持細胞板穩(wěn)定放電,當細胞放電集中在小范圍以后,本文采用一種全局興奮與全局抑制放電規(guī)則將放電活動包限制在有效范圍內。位置細胞間的興奮性權值連接矩陣由一個二維高斯分布表示:
同理,位置細胞的抑制性權值連接矩陣可以表示為:
其中,kr2與ar2< 0為常量。
通過全局興奮與全局抑制,校正位置細胞板上的放電活動范圍在不斷接收新量測信息的情況下仍能處于穩(wěn)定狀態(tài)。校正位置細胞板更新后,利用高斯分布重新建立位置細胞模型表示為:
其中,pi表示校正后的位置細胞放電,是第i個位置細胞在位置細胞板坐標系的橫縱位置坐標,x'=[x',y']T是更新后的位置細胞中心,δp控制位置細胞放電范圍的大小。
為驗證本文所提出的基于大腦海馬認知機理的AUV 協(xié)同定位算法性能,將其與基于擴展卡爾曼濾波的協(xié)同定位算法[3]進行對比。仿真實驗中設置參數(shù)如下:網格細胞板與位置細胞板的橫縱細胞數(shù)量Nx=Ny=32;使用40 個不同的網格細胞板,為了生成不同尺度的網格細胞,網格周期從12 到32 之間間隔為0.5 均勻分布采樣;W0調節(jié)參數(shù)a=1.0315,學習率k為0.005,抑制性系數(shù)B=0.5;在更新的位置細胞板中,選擇位置細胞放電活動包中心周圍16 m×16 m 作為校正區(qū)域,劃分成32×32 的細胞板,位置細胞放電更新的閾值設定為0.9。
仿真實驗過程中,系統(tǒng)噪聲滿足高斯白噪聲分布,即ωk~ N (0,Q)。為模擬水聲測距數(shù)據(jù)中的異常野值,將量測噪聲設置為Student’st分布,根據(jù)式(20)生成:
其中,Q=diag([0.1 m/s,1 °]2) 表示系統(tǒng)噪聲協(xié)方差矩陣,R=diag([2 m,2 m]2)表示量測噪聲協(xié)方差矩陣。根據(jù)式(20)產生的量測噪聲如圖9 所示。圖9中,黑色菱形標記了測量噪聲中存在的野值。

圖9 主從AUV 距離測量噪聲Fig.9 Range measurement noise between leader AUV and slave AUV
為提高系統(tǒng)可觀測性,令從AUV 航向角按照模型θ=π/9 · sin(3π ·k/1000)+π/4變化,從而進行‘S’形機動航行,首尾向速度v=0.5m/s,仿真時間1000 s。考慮到量測噪聲含有隨機野值,同時與帶有閾值判斷的EKF 協(xié)同定位算法進行對比,主、從AUV 航行軌跡以及從AUV 估計軌跡如圖10 所示。

圖10 AUV 軌跡示意圖Fig.10 Trajectory of AUVs
為進一步定量評估算法性能,定義協(xié)同定位誤差LE、平均定位誤差ALE 與均方根誤差RMSE 如下:

圖11 從AUV 定位誤差Fig.11 Localization errors of slave AUV
不同協(xié)同定位算法位置誤差如表1 所示。

表1 不同協(xié)同定位算法位置誤差Tab.1 Localization errors with different cooperative localization algorithms
根據(jù)表1 可以看出,在量測噪聲含有野值的情況下,類腦協(xié)同定位算法的最大定位誤差(ME)與均方根誤差(RMSE)都遠小于EKF 類協(xié)同定位算法。這是由于類腦協(xié)同定位算法量測更新并非通過對新息逐個加權直接實現(xiàn),而是經過多次細胞放電更新逐漸逼近真實位置,從而在一定程度上避免單一量測野值對細胞放電產生影響。與帶有閾值判斷的EKF 協(xié)同定位算法相比,類腦協(xié)同定位算法定位誤差最大值可以降低34%,平均定位誤差可以降低28%。
本文基于哺乳動物大腦海馬體空間細胞導航機理,提出一種主從式AUV 協(xié)同定位算法。通過構建二維吸引子網格細胞模型實現(xiàn)從AUV 速度與航向信息的積分推算,同時,利用主從艇位置信息與距離量測信息構建“新息”,并將該“新息”轉化為位置細胞的放電活動,從而通過放電更新不斷逼近位置細胞準確位置,獲得更為精確的AUV 位置信息。本文所提協(xié)同定位算法可以在非高斯量測噪聲條件下有效降低艇間測距噪聲中所含有的大量野值對于系統(tǒng)定位精度的影響,從而提高AUV 協(xié)同定位系統(tǒng)在水下復雜環(huán)境中的適應能力。