摘 要:隨著無人系統的應用越發廣泛,傳統導航技術很難滿足無人系統在面對復雜任務和未知環境時對自主智能導航性能的要求。哺乳動物能夠在興趣驅動下實現高效智能且自適應環境的導航行為,受此啟發的基于興趣驅動的類腦自主導航技術有潛力克服傳統導航實時、準確和低功耗不能同時滿足的缺點。本文首先闡述了哺乳動物大腦導航機理;其次,總結概括出基于興趣驅動的類腦自主導航技術框架;再次,從自身感知、環境認知、記憶推理和興趣決策4個方面梳理了類腦自主導航的關鍵技術和實現途徑,指出了相關研究的缺陷;最后,分析了現階段類腦自主導航技術的不足,并對未來一體化發展做出展望。
關鍵詞:類腦自主導航; 興趣驅動; 連續吸引子神經網絡; 類腦多源融合; 脈沖神經網絡; 類腦芯片
中圖分類號:V249.32 文獻標識碼:A DOI:10.19452/j.issn1007-5453.2024.02.001
基金項目: 航空科學基金(2020Z071052001)
在進行地下勘探、消防救援、敵軍監察等復雜任務時,無人系統會遇到衛星拒止、環境狀況未知,以及對變化環境要求迅速做出決策等未知復雜環境,這對無人系統的智能自主導航性能提出了更高的要求。傳統的導航方法多是預先建立精確的數學模型[1],在幾何化、結構化的測量基礎上實現全局先驗最優[2-3],但由于數據處理缺乏興趣驅動性,海量的傳感信息處理和算法矩陣運算使得無人系統很難實時獲取準確的導航數據,導航算法對使用場景也有著很大的限制。
隨著腦與神經科學的深入研究,科學家發現哺乳動物處在擁有海量空間信息的環境時,往往只對感興趣的部分進行處理和決策,以興趣驅動的形式實現點到點的導航行為,具有環境適應性強、實時性和效率高等特點。受哺乳動物腦啟發的類腦自主導航技術就是利用類腦傳感器和搭載到類腦神態芯片的類腦智能算法,無須預先精確建模,使無人系統主動感知環境獲得高維環境認知信息,并建立認知與決策地圖,以此來模擬動物大腦執行自身感知、環境感知、記憶推理以及興趣決策等行為。由于信息在系統中以異步脈沖信號形式運算處理并采用并行計算的架構,同時利用事件驅動的感知方式及神經網絡對不同環境的自適應自主學習,與傳統導航方法相比,類腦自主導航技術不依賴衛星,具有能耗低、魯棒性強、自主學習等特點,在抗災救援、軍事監察等方面有著重要的應用價值。

當前,類腦導航算法的研究還處于起步階段,國內外對類腦導航還沒有統一的概念。昆士蘭科技大學的M.J. Milford團隊[4]建立了利用海馬體空間編碼與視覺感知編碼聯合表征的基于鼠類定位與構圖(RatSLAM)的導航算法,使用連續吸引子神經網絡模型跟蹤移動機器人的位姿,構建室內環境的拓撲地圖,該系統框架側重于認知地圖的構建;A.Finkelstein等[5]認為動物大腦能夠像航空器一樣通過融合自運動信息和量測信息獲得更為精確的導航信息,并分析了生物空間感知與神經編碼之間的關系,從卡爾曼濾波的角度提出了3D類腦組合導航架構;武漢大學郭遲團隊[6]通過給出定義將類腦導航問題描述為馬爾可夫決策過程(MDP),總結出了基于深度強化學習的類腦路徑決策架構,該框架科學定義了算法不同部分的職能,從而能夠解構具體的算法,完成細粒度的分類和對比;空軍工程大學吳德偉等[7]認為認知導航的區別于傳統導航最重要的特征在于對環境和目標的“認知”能力,并給出了在這一基本內涵下的認知導航框架結構,同時從作戰的角度分析了認知導航所具備的新質導航能力;清華大學余芳文等[8]通過建立類腦形態芯片實現類腦自主導航架構,設計出了多模態混合神經網絡并成功應用于天璣芯片,該算法通過實現機器人多模態感知以及神經編碼和計算的方式識別位置,試驗結果表明該算法在感知混聯、運動模糊、光線或天氣變化等復雜環境下表現出較高的魯棒性。本文聚焦類腦自主導航技術研究的最新進展,通過分析其中的關鍵技術和硬件實現方法,總結出類腦自主導航技術框架更側重興趣驅動的感知、導航與決策一體化及其類腦計算硬件實現,并展望了未來類腦自主導航技術一體化的發展趨勢。
1 哺乳動物大腦導航機理
自1948年E.C.Tolman[9]提出認知地圖理論后,越來越多的學者開始關注生物體導航機理的研究,而與空間認知和導航相關的發現大都源于海馬結構。海馬結構主要包括海馬體和內嗅皮層(EC),其中海馬體主要負責與學習記憶相關的生理活動,而內嗅皮層則主要負責對大腦新皮層接受到的環境等信息進行編碼映射,和海馬體共同形成對外界環境的內部表征[4]。而參與導航的海馬體又可以分為齒狀回(DG)、海馬區、腦下托(S)、前下托(PRS)、旁下拖(PAS)等,海馬區進一步細化為海馬角CA1區、海馬角CA3區。導航神經信息回路如圖1所示。
動物所感受的信息分成內源信息和外源信息,其中感受到的自運動信息為內源信息,而感官接收到的圖像、聲音等受到外界刺激的信息為外源信息。哺乳動物可以通過內源信息進行導航。大腦前庭可以接收頭部運動的角速度等自身感知的信息,經過神經編碼后傳遞給海馬區的背側前下托,此時前下托中某些細胞會被特定的方向激活,即頭朝向細胞,可以編碼動物的方位信息。而位于內嗅皮層的網格細胞則在接收到大腦前庭感受到的自身的加速度和方位信息后進行路徑積分,并總體呈現出六邊形網格狀放電結構,具有全局空間度量與表征能力。海馬體中位置細胞收到網格細胞提供的路徑積分信息和頭朝向細胞提供的方向信息后,以細胞群共同放電為基礎,逐漸形成編碼穩定的位置野,呈現特異性位置放電現象。
此外,哺乳動物也可以通過外源信息進行導航。在復雜未知環境中時,感覺器官在受到外源信息的刺激后會以脈沖的形式傳送到海馬—內嗅皮層神經回路進行神經計算,由網格細胞和頭朝向細胞將外界的刺激與內源信息融合后,轉換成精度更高的運動信息,并結合環境興趣點存儲在位置細胞中,在接收類似刺激時又能根據記憶快速推理出對環境原有的認知。
然而,只靠海馬體和內嗅皮層神經回路并不能控制動物到達興趣目標位置,同時還需要與前額葉皮層和伏隔核構建特定的神經連接[11]。興趣目標和環境信息經過動物大腦感知后,伏隔核一方面接收海馬體產生的認知地圖,另一方面會接收由腹側被蓋區由多巴胺產生的獎懲調節信息。兩者通過伏隔核神經元形成前饋通路,從而影響前額葉皮層動作細胞集群放電,丘腦受到動作細胞群放電影響后就會產生一組動作指令,位于大腦皮層的運動中樞在接收到指令后控制機體運動,從而到達興趣目標的位置。哺乳動物導航行為模型如圖2所示。
哺乳動物大腦里的導航神經信息回路利用大量神經元集群放電共同表征編碼信息,具有吸引子動力學的抗隨機噪聲、抗野值等特性。與此同時,由于大腦中神經網絡在經歷各種復雜未知環境的同時也進行記憶學習面對不同環境的導航方法,且信息都是以脈沖信號的形式進行異步計算處理,因此哺乳動物大腦導航具有高容錯能力、強學習能力以及超低功耗等特點。
2 基于興趣驅動的類腦自主導航技術框架
隨著對哺乳動物大腦導航機理的深入研究,開展類腦自主導航關鍵技術研究具有重要意義。本文在已有研究成果的基礎上,總結概括了基于興趣驅動的類腦自主導航技術框架,主要包括自身感知、環境認知、記憶推理和興趣決策四大模塊,如圖3所示。
(1)自身感知模塊
自身感知模塊利用慣性感受器獲得自身加速度、角加速度等內源信息,這些信息通過學習經驗所得出的神經網絡模型以脈沖神經運算的形式進行路徑積分,為生物體提供感知自身運動的信息。自身感知模塊不依靠外源信息獨立進行路徑積分,但是誤差會隨時間的增長而積累。

(2)環境認知模塊
環境認知模塊通過視覺、聽覺、嗅覺、觸覺等感受器感知外界環境的光線、聲音、氣味、感覺等外源信息,這些外源信息經過神經編碼后刺激位置細胞及頭朝向細胞放電更新,以此來獲得自身的位置信息。同時,位置細胞還能將環境興趣信息以信標的形式與即刻位置相結合,以便于后續進行回環檢測。
(3)記憶推理模塊
記憶推理利用具有吸引子動力學特性的神經網絡將內源信息得出的自身感知信息與外源信息得出的環境感知信息進行自適應融合,獲得更加精確的認知信息并以認知地圖的形式進行記憶,如遇見相似場景,便可以與其進行回環檢測,并推理出對應狀態信息。
(4)興趣決策模塊
興趣決策模塊在獲得興趣目標并在認知地圖中表達后,通過計算自身信息與興趣目標的信息矢量,釋放獎勵調節因子刺激動作細胞集群特異性放電來獲得一系列動作指令,從而指導機體完成基于興趣目標的導航行為。
類腦自主導航技術既能使無人系統利用神經網絡融合內、外源信息進行導航行為,同時又學習并訓練了進行該環境導航的神經網絡,還能夠在感知環境的同時形成對外源信息的認知,采用事件驅動且所有信息處理都是以脈沖形式在神經元間傳遞異步運算。與傳統導航技術相比,其具有智能性高、學習能力強、功耗低等優勢。
3 類腦自主導航關鍵技術
1971年,J. O’Keefe等[12]在大鼠海馬體中觀察到具有空間特異性放電的位置細胞,自此以后,神經學、生理學以及人工智能等領域的科學家開始研究哺乳動物大腦的導航行為。實現類腦自主導航,首先要對關鍵導航細胞進行建模,通過建立學習模型來模擬哺乳動物在未知復雜空間下以興趣驅動的方式進行類腦感知定位,最后完成面向興趣目標的路徑決策及規劃。
3.1 關鍵導航細胞建模
如何建立導航細胞空間認知神經計算模型一直是類腦自主導航的重點問題。哥倫比亞大學G. J. Cueva [13]利用深度循環網絡完成了以速度和航向為輸入的二維導航模擬,并呈現出和神經生理學觀察一致的放電樣式;Tang等[14]利用脈沖神經網絡實現了在未知環境下的繪圖和探索,并在一定程度上補償了如視覺丟失等自身存在的硬件缺陷。Milford團隊[15]利用連續吸引子神經網絡(CANN)建立了三維網格細胞和多層頭朝向細胞模型,提出了四自由度(三維位置和一維航向信息)的同步地圖構建和定位系統。CANN具有系統設計簡單、無須對參數進行訓練、模型適用性強等優勢,因此本文選用CANN對頭朝向細胞、網格細胞和位置細胞進行建模分析。
CANN以吸引子動力學及循環神經網絡為基礎,在沒有外部輸入的情況下通過局部神經元之間的興奮性遞歸連接和全局抑制作用維持穩態。由于利用神經元集群的穩態進行編碼信息,因此對外部輸入信息具有較強的抗隨機噪聲、魯棒性高、自行加權融合輸入信息等特點[16],是一種當前為數不多的得到了試驗驗證和廣泛應用的正則化神經計算模型,常用來模擬大腦編碼、儲存、運算及交流信息。從早期對海馬結構的研究開始,CANN就成為模擬導航細胞局部放電的重要建模方法[17]。
3.1.1 頭朝向細胞
頭朝向細胞是哺乳動物感知頭部朝向的重要導航細胞。當哺乳動物面對一個方向時,對特定方向敏感的頭朝向細胞會產生最高的發射率,發射形態為高斯活動包,在大腦導航中充當“指南針”的角色。20世紀70年代,S.Amari等[18]提出神經元如果排列成墨西哥帽狀的圓環,網絡中神經元就可以維持局部放電,從理論上證實了CANN建模頭朝向細胞的合理性。2002年,S. M. Stringer等[19]通過編碼自運動輸入,提出了一種頭朝向細胞的自組織CANN。該模型將放電行為與頭部當前朝向的變化聯系起來。Xie Xiaohui等[20]設計了一套頭朝向系統,通過將兩群神經元組織成環狀網絡結構來模擬頭朝向細胞,該系統被證明可以整合大范圍的前庭輸入。本文作者團隊[21]建立了一個基于頭朝向細胞模型的視覺和慣性信息整合架構,如圖4所示,每個頭朝向細胞都預設一個首選的發射方向,并將由視覺線索所計算的角度和慣性測量單元(IMU)所計算的角速度進行了融合。
除此之外,還可以利用多維CANN對頭朝向細胞進行建模,能夠高度模擬哺乳動物的三維方向認知機理。如圖5所示,在CANN中用二維矩陣來表示多層頭朝向細胞,模型中的上下和左右側的神經元之間為環狀包絡連接,可以周期表示頭部方向和高度。為了更有效地表示四自由度的位姿信息,可以利用多層頭朝向細胞模型表示三維空間中的航向角信息。另外,頭朝向細胞與位置細胞相結合還可以進行回環校正以提高導航精度。
3.1.2 網格細胞
生物學研究發現大鼠的網格細胞在探索環境中六邊形網格頂點區域時會發生放電效應, T. Hafting等[23]發現網格細胞在動物身處黑暗環境下仍能在一段時間內保持穩定,由此科學家們猜想網格細胞可以看成局部環境分辨率的度量工具,且對內源信息具有路徑積分作用。2006年,B.L. McNaughton等[24]通過將一維CANN擴展到二維來建立網格細胞模型,該模型實現了二維空間路徑積分的功能,也表現出了六邊形網格頂點放電的現象。2022年,挪威科技大學R. J. Gardner[25]用電生理方法在鼠腦中觀察到了網格細胞的二維環球狀空間選擇性放電現象,證明了網格神經元網絡和吸引子動力學拓撲結構一致。余芳文等[26]提出了一種基于三維網格細胞、頭朝向細胞和局部視圖細胞的仿生SLAM系統(NeuroSLAM),通過利用三維CANN對三維網格細胞進行建模,模擬了哺乳動物大腦中的三維空間神經表示。該神經網絡模型展示了三維路徑積分所需的三維位置、方向和度量信息的規律性三維網格放電模式,并且在無外部傳感信息輸入的情況下能夠維持動物的四自由度位姿信息。網絡中神經元對三維環境中特定的區域進行編碼表征,同時該模型還能夠對動物的自身信息進行三維路徑積分,其中局部場景細胞可以和特定的三維網格細胞相結合,當出現熟悉場景時,三維CANN模型可以實現三維位置回環校準。然而,構建的三維網格細胞僅在一定范圍內進行短程路徑積分,而無法獨立進行大范圍路徑積分。為了彌補這一不足,本文作者團隊[27]對這一模型進行改善,提出了一種新的基于指數型增益CANN的多尺度三維網格細胞類腦路徑積分模型,如圖6所示。通過建立多尺度網格細胞可以減少網格細胞編碼大尺度空間范圍所需網格細胞數量,提升了空間表征魯棒性和位置解算精度。 隨著以色列魏茨曼研究所D. B. Omer等[28]首次在蝙蝠大腦中發現了敏感同伴距離的社交位置細胞,受此啟發,本文作者團隊[29]提出了基于社交位置細胞/網格細胞的類腦相對導航方法,利用各向同性高斯函數構建了社交位置細胞網絡模型,和構建的網格細胞共同處理融合內源性和外源性相對位置信息后得到無人機之間的相對距離,如圖7所示。
3.1.3 位置細胞
位置細胞是動物在空間中被位置特異性激活的關鍵導航細胞,位置細胞的輸入有兩類:一類是已知環境的位置信息,另一類是來自網格細胞路徑積分系統。A. Samsonovich等[30]利用二維CANN對位置細胞進行建模,該模型通過神經元之間的興奮性循環側枝連接來反映狀態空間中神經元之間的距離,可以在連續二維物理空間的任何位置保持神經元的放電,然而尚不清楚神經元之間怎樣建立必要的突觸連接。而后,S. M. Stringer等[31]受一維頭朝向細胞自組織連接的啟發,設計出二維自組織連接的位置細胞模型,并解決了CANN建模如何在黑暗中通過頭部方向和自運動信號進行更新。總之,位置細胞建模充分利用了CANN的神經元群信息編碼和多模態信息融合的特點,同時也擁有充分的生理學依據。
3.2 基于興趣驅動的類腦感知定位技術
傳統導航算法在處理海量傳感器的數據時往往會因其冗余而大大增大系統的負擔。為了高效、迅速、準確地處理外界環境信息,哺乳動物往往會把注意力放在比較顯著的部分,即興趣點。興趣點對認知場景起著重要的導引作用,基于興趣驅動的類腦感知定位技術就模仿了這一機制。

類腦自主導航系統在感知環境時,會提取環境中的興趣點并和歷史記憶的興趣點進行對比,常見的興趣點檢測方法有Harris的角檢測器等,但在移動的場景中檢測到的位置非常不穩定,難以作為穩定的路標。為了減少圖像中提取興趣點的時間,提高識別算法的實時性,E. Rosten等[32]利用分割提取設計出FAST特征點提取算法,加快了識別速度。而后,E. Rublee[33]結合FAST特征提取和BRIEF特征描述設計出了ORB圖像特征提取算法,由于處理迅速以及具有旋轉不變性和一定的尺度不變性等特點,該算法被廣泛應用在即時定位與地圖構建(SLAM)及視覺處理領域。然而,這種提取方法往往會提取過多的冗余信息,造成進行視覺回環時大量時間和資源的浪費。陳孟元等[34]在提取視覺模板時,先利用卷積神經網絡(CNN)提取圖像中的顯著性區域,然后通過興趣傾向函數對提取的信息進行興趣賦值,興趣值越大的顯著性區域匹配時所占的權重就越高,如圖8所示。在公開TUM數據集中與RatSLAM和ORB-SLAM算法對比,在時間和準確率上有著明顯的提升。

為了在復雜未知環境下獲得較為精確的導航信息,多源融合系統對各類導航源提供的興趣信息進行融合。以卡爾曼濾波器(KF)及其延伸算法為代表的集中式傳統融合算法在觀測維數逐漸增大時,會出現系統運算急劇增大、融合效率下降等問題[35]。哺乳動物通過將視覺、聽覺、嗅覺和觸覺等多感官提取的興趣信息與多尺度、同質的環境神經地圖相結合來進行實時、高效的融合,擺脫了傳統集中式的限制。2004年,Milford及其團隊[36]研發了RatSLAM模型,利用車輪編碼信息來執行路徑整合,然后與視覺信息通過回環校正來融合自運動信息和視覺信息。除了通過回環校正以外,2014年陳澤濤等[37]提出了模仿嚙齒動物啟發的多尺度映射系統,將傳感器采集的興趣信息映射到用支持向量機訓練成的不同尺度的地圖上,然后結合不同尺度的位置假設來進行對位置的識別。而后,A. Jacobson等[38]將這種方法擴展到多傳感器、多尺度,將相機、Wi-Fi和氣壓傳感器集成在一起,在多尺度同質制圖框架下產生不同空間分辨率的定位結果,然后在這多個尺度上進行識別,最后將單個尺度的地點匹配假設結合起來,形成一個全局的地點匹配假設,以此來獲得比較精確的位置識別結果。余芳文等[8]設計出多模態混合神經網絡(MHNN)模型,這種混合神經網絡模型在興趣信息的激勵下實現了IMU、RGB-D和事件相機信息的異步融合,同時在部分模態信息缺失或變化的情況下也能魯棒工作。其系統結構圖如圖9所示。

3.3 面對興趣目標的類腦決策方法
在未知復雜環境中實現到興趣位置的最優無碰撞路徑決策和規劃,特別是要滿足針對執行消防救援、敵軍監察、地下勘探等復雜任務的低功耗、高實時、裝備輕量化等要求。傳統方法在解決面對興趣目標導航的問題時往往忽視了興趣目標的驅動作用,在未知復雜環境中容易陷入局部最小值等問題[39-41]。基于優化深度Q網絡算法[42]的全局路徑規劃模型雖然可以解決傳統方法的路徑冗余問題,但是會出現可移植性差、訓練過程復雜等問題。哺乳動物在未知復雜環境執行復雜任務時能夠做到迅速、準確地執行決策行為,這種決策機制為無人系統自主導航方法提供了很好的借鑒。A. A. Saputra等[43]通過模擬大腦中神經元發育過程,利用模擬神經元的神經信息傳遞技術開發了基于類腦脈沖神經網絡(SNN)的動態路徑決策規劃模型,該模型利用前向傳遞構造神經元連接以找到興趣目標導航的可能決策規劃路徑,而后向傳遞活動對效率低下的神經元進行優化,并分別在網格地圖模型和拓撲地圖模型中實現無人系統的路徑決策規劃。德國L. G?nner等[44]利用LIF神經元模型的SNN生成海馬結構中的位置細胞和前額葉皮層的動作細胞,通過學習獎勵和突觸可塑性機制生成以興趣目標為導向的位置細胞序列,并通過動作啟發層生成動作指令,實現簡單無障礙仿真環境中老鼠覓食的路徑決策規劃任務。針對利用類腦脈沖神經元建模的面向興趣目標的無人系統路徑決策規劃任務,大多數只是采用高度仿生的基于突觸可塑性方式進行離散權值更新。為解決無地圖下連續導航問題,戴嘉偉等[45]將深度強化學習引入SNN權值訓練,提出了位置細胞前饋連接和動作細胞橫向連接機制的無人系統類腦決策規劃算法,該模型能夠在無地圖環境下記憶障礙物以及興趣目標的位置,通過建立動作細胞群來實現面對興趣目標的路徑決策與規劃,并對多種復雜陌生的環境具有一定的模型泛化能力。
3.4 基于興趣驅動的類腦自主導航實現途徑
中央處理單元(CPU)和圖形處理單元(GPU)等通用處理器具有高度的靈活性,然而由于其具有能耗高、計算量大、效率低等弊端[46],無法將類腦自主導航算法優勢發揮出來。大自然中動物普遍擁有包含視覺、觸覺、聽覺等敏銳的知覺,在興趣驅動下能夠做到對自身運動和環境感知產生的海量信息進行實時、準確的處理。受此啟發,研究人員發明了能夠對生物能量轉換和信息處理過程進行模擬的類腦傳感器和神經形態芯片,在硬件結構基礎上充分發揮類腦自主導航算法的優勢。未來,利用感知自運動信息的類腦傳感器測量的內源信息激勵構建的CANN實現自身感知,其他感知光線、聲音、圖像等環境信息的類腦傳感器將興趣信息進行脈沖編碼,利用搭建的SNN實現對外源信息的環境感知,并建立認知地圖數據庫,使無人系統具有記憶推理能力。最后,認知地圖庫中興趣目標信息及當前認知地圖的自身信息輸入類腦決策模塊后獲得運動指令,通過傳達運動指令給機械控制系統實現無人系統的興趣決策,并實時更新興趣目標。同時,實時響應使無人系統擁有更好的環境適應性,其實現框架如圖10所示。
3.4.1 類腦傳感器
生物通過長期演變逐漸形成與環境相適應的優秀感官能力,類腦傳感器就是借鑒了動物大腦感知自然環境以及對感知信息進行處理的機制,能夠像生物一樣在興趣驅動下進行環境信息采集,類腦傳感器及其借鑒的生物結構如圖11所示。
慣性傳感陣列是測量自運動信息的類腦傳感器,通過單片機利用并行數據總線對多個IMU的信息進行采集融合,相較于傳統的IMU,慣性傳感陣列因其提供多個IMU的信息,能夠更有效地模擬哺乳動物內耳前庭系統對高維度自運動信息實時與準確的感知能力。通過將慣性傳感陣列的輸出進行脈沖時序編碼,類腦自主系統可以像大腦處理內耳前庭系統信息一樣處理這些信息,從而為無人系統提供實時準確的內源信息。事件相機又被稱為“硅視網膜”,借鑒了人視網膜接收信息及初步編碼部分原理,通過異步方式測量每個像素變化實現對事件、位置以及符號的編碼,從而使無人系統能像人一樣高效捕捉視覺信息,以實現無人系統的感知、導航以及避障,與傳統相機相比,其具有高動態范圍、高時間分辨率以及低功耗等特點[47]。類腦聲傳則是在電路層面上借鑒動物聽覺系統的功能,實現從真實聽覺聲音激勵變成電脈沖信號的過程,使無人系統能夠從聲音事件中獲得激勵進行對環境及自運動信息的感知。與事件相機類似,類腦聲傳所采集到的信息并不是完整的音頻聲音,而是包含發生事件的通道、時間戳以及能量的極性的事件信號。與傳統音頻傳感器相比,其事件觸發的特性使其具有高動態范圍、超低功耗等特性[48]。仿生復眼相機則是基于昆蟲復眼的結構和原理,利用多個不同朝向的子眼對大視角的環境進行信息采集,然后集成到一張圖片上進行輸出,并利用眾多子眼形成的視差及方向感知能力實現目標的三維定位,與傳統的單孔徑相比,其具有視野廣、畸變小、靈敏度高等優勢。此外,通過融合使用上述傳感方法設計出的多模態仿生導航傳感器還可以感知不同尺度層級的內源信息和外源信息[49]。
當前,類腦傳感器技術尚未成熟。為滿足類腦自主導航模型的激勵需求,可將部分傳統傳感器輸出數據進行脈沖編碼,模擬相應脈沖體制傳感器的功能,實現類腦傳感器與神經形態芯片的有機結合。同時,類腦傳感器在信息獲取方式、數據處理方式、系統自適應性以及應用領域的擴展等方面逐步接近生物對環境的感知能力。類腦傳感器和算法正在不斷發展與進步,逐步實現更加智能、高效的自主導航。
3.4.2 類腦計算
面對大規模神經網絡的學習模型,傳統計算芯片常常更注重其通用性而導致在訓練某種具體網絡時存在低能效等缺點。人的大腦能夠實時、準確、魯棒地處理各種感覺器官接收的環境信息,而功耗平均只有約為15W。通過借鑒大腦神經元信息處理機制,利用脈沖的形式對信息進行編碼,并采用存算一體、眾核并行的架構設計出來的類腦計算芯片,具有處理速度快、體積小、能耗低等特點。


結合類腦傳感器的優勢,目前基于興趣驅動的類腦自主導航實現途徑有兩種:第一種是首先根據傳感器的特點,設計出不同的神經網絡并搭載到異構融合類腦芯片上,用于處理類腦傳感器采集的環境信息;然后利用設計出的多模態混合神經網絡將各種神經網絡輸出不同類型的信息進行算法層面的融合[8],在類腦自主導航算法的處理下進而得到導航信息并輸出下一步運動指令,以實現類腦自主導航。這種方法很好地利用了各種類腦傳感器以及人工神經網絡的特性,具有誤差小、魯棒性高等優勢,然而與動物大腦以脈沖編碼的處理機制相比,這種方法仍然存在效率低、能耗高等問題。第二種方法是先將類腦傳感器接收的環境信息以脈沖的形式進行編碼,然后根據學習模型原理將其他訓練好的神經網絡轉換成脈沖神經網絡[50],通過這種類型的轉化來實現從信息編碼到硬件結構層面高度模擬大腦的信息處理機制。本文作者團隊通過搭載DAVIS346事件相機和DYNAP-CNN類腦芯片,將訓練好的CNN轉換成SNN并實現了手勢識別功能,如圖12所示。該方法具有能耗低、速度快等優勢,然而由于類腦傳感器采集的連續信號被編碼成脈沖信號后會損失一部分精度,如今還沒有形成比較完備的SNN體系,仍需進行大量的探索研究。

4 結論和展望
本文首先介紹了哺乳動物的大腦導航機理,通過對哺乳動物大腦導航機理的認識,總結概括出了基于興趣驅動的類腦自主導航技術框架,引出了基于興趣驅動的類腦自主導航的關鍵技術,從模型構建到途徑實現,從軟件算法到硬件分析,最后進行了總結和展望。總之,類腦自主導航技術的特點在于能夠在使用低成本、低精度傳感器的同時擁有比較高的環境認知能力,并實現到興趣目標點的路徑決策與規劃。
目前,類腦自主導航技術已經建立了一個綜合的研究體系,包括機理分析、建模仿真和試驗驗證,展示了一定的自主智能特性。然而,這種技術目前只是對動物大腦導航機制的部分發現進行了借鑒,尚未能從整個系統的層面模擬這種機制。盡管在實現過程中還存在許多挑戰,但類腦自主導航技術通過環境感知、空間認知和路徑決策的一體化設計[51],為導航制導技術在無人系統中的應用提供了巨大的潛力。隨著腦與神經科學、人工智能和神經形態計算等技術的不斷發展,類腦自主導航系統有望在智能無人系統中發揮出更強大的作用。
參考文獻
[1]劉莎,張碩,劉祿. 基于動態非零和博弈的無人機集群協同對抗方法研究[J]. 航空科學技術,2022,33(2):75-83. Liu Sha, Zhang Shuo, Liu Lu. Research on cooperative confrontation of UAV cluster based on dynamic non-zero-sum game[J]. Aeronautical Science Technology, 2022,33(2):75-83. (in Chinese)
[2]張炯,牛歡,陳雪. 基于多傳感器融合的無人機應急著陸功能研究[J]. 航空科學技術,2022, 33(11):11-20. Zhang Jiong, Niu Huan, Chen Xue. Research on UAV emergency landing function based on multi-sensor fusion[J]. Aeronautical Science Technology, 2022, 33(11): 11-20. (in Chinese)
[3]陳宇恒,陳進朝,陳雪聰. 基于改進貪心算法的無人機集群協同任務分配[J]. 航空科學技術,2022,33(4):13-18. Chen Yuheng, Chen Jinchao, Chen Xuecong. Cooperative task allocation of UAV cluster based on improved greedy algorithm[J]. Aeronautical Science Technology, 2022, 33(4):13-18. (in Chinese)
[4]Milford M J, Wyeth G F, Prasser D. RatSLAM: A hippocampal model for simultaneous localization and mapping[C]. IEEE International Conference on Robotics and Automation, 2004: 403-408.
[5]Finkelstein A, Las L, Ulanovsky N. 3D maps and compasses in the brain[J]. Annual Review of Neuroscience, 2016, 39: 171-196.
[6]郭遲,羅賓漢,李飛,等. 類腦導航算法:綜述與驗證[J]. 武漢大學學報(信息科學版),2021, 46(12): 1819-1831. Guo Chi, Luo Binhan, Li Fei, et al. Review and verification for brain- like navigation algorithm[J]. Geomatics and Information Science of Wuhan University, 2021, 46(12): 1819-1831. (in Chinese)
[7]吳德偉,何晶,韓昆,等. 無人作戰平臺認知導航及其類腦實現思想[J]. 空軍工程大學學報(自然科學版),2018,19(6): 33-38. Wu Dewei, He Jing, Han Kun, et al. Cognitive navigation and its thought of brain-inspired realization in unmanned combat platform[J]. Journal of Air Force Engineering University(Natural Science Edition), 2018, 19(6): 33-38. (in Chinese)
[8]Yu Fangwen, Wu Yujie, Ma Songchen, et al. Brain-inspired multimodal hybrid neural network for robot place recognition[J]. Science Robotics, 2023, 8(78): 6996.
[9]Tolman E C. Cognitive maps in rats and men[J]. Psychological Review, 1948, 55(4): 189.
[10]David A, Pierre L. Hippocampal neuroanatomy[M]. Oxford: Oxford University Press, 2009.
[11]Hyman J M, Zilli E A, Paley A M, et al. Working memory performance correlates with prefrontal-hippocampal theta interactions but not with prefrontal neuron firing rates[J]. Frontiers in Integrative Neuroscience, 2010, 4:1162.
[12]O’Keefe J , Dostrovsky J.The hippocampus as a spatial map: Preliminary evidence from unit activity in the freely-moving rat[J].Brain Research, 1971, 34(1):171-175.
[13]Cueva C J, Wei Xuexin. Emergence of grid-like representations by training recurrent neural networks to perform spatial localization[EB/OL]. (2018-03-21). https://arxiv. org/abs/1803. 07770.
[14]Tang G, Michmizos K P. Gridbot: An autonomous robot controlled by a spiking neural network mimicking the brain’s navigational system[C]//Proceedings of the International Conference on Neuromorphic Systems, 2018: 1-8.
[15]Ball D, Heath S, Wiles J, et al. OpenRatSLAM: An open source brain-based SLAM system[J]. Autonomous Robots, 2013, 34(3): 149-176.
[16]劉建業,楊闖,熊智,等. 無人機類腦吸引子神經網絡導航技術[J]. 導航定位與授時,2019, 6(5):9. Liu Jianye, Yang Chuang, Xiong Zhi, et al. Attractor neural network-based brain-inspired navigation technology for UAV[J]. Navigation Positioning and Timing, 2019, 6(5): 9. (in Chinese)
[17]Marr D, Brindley G S. Simple memory: A theory for archicortex[J]. Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences, 1971, 262(841): 23-81.
[18]Amari S. Dynamics of pattern formation in lateral-inhibition type neural fields[J].Biological Cybernetics, 1977, 27(2):77-87.
[19]Stringer S M, Thomas T, Edmund T R. Self-organizing continuous attractor networks and path integration: Onedimensional models of head direction cells[J]. Network: Computation in Neural Systems, 2002, 13(2):217-242.
[20]Xie Xiaohui, Hahnloser R H R, Seung H S. Double-ring network model of the head-direction system[J]. Physical Review E, 2002, 66(4): 41902.
[21]Chen Yudi, Xiong Zhi, Liu Jianye, et al. A positioning method based on place cells and head-direction cells for inertial/visual brain-inspired navigation system[J]. Sensors, 2021, 21(23): 7988.
[22]王雅婷,劉建業,熊智,等. 基于雙目視覺的類腦三維認知地圖構建方法[J]. 導航定位與授時,2021,8(5): 9-17. Wang Yating, Liu Jianye, Xiong Zhi, et al. A method of constructing brain-inspired 3D cognitive maps based on binocular vision[J]. Navigation Positioning and Timing, 2021, 8(5): 9-17. (in Chinese)
[23]Hafting T, Fyhn M, Molden S, et al. Microstructure of a spatial map in the entorhinal cortex[J]. Nature, 2005, 436(7052): 801-806.
[24]McNaughton B L, Battaglia F P, Jensen O, et al. Path integration and the neural basis of the cognitive map[J].Nature Reviews Neuroscience, 2006, 7(8): 663-678.
[25]Gardner R J, Hermansen E, Pachitariu M, et al. Toroidal topology of population activity in grid cells[J]. Nature, 2022, 602(7895): 123-128.
[26]Yu Fangwen, Shang Jianga, Hu Youjian, et al. NeuroSLAM: A brain-inspired SLAM system for 3D environments[J]. Biological Cybernetics, 2019, 113: 515-545.
[27]Yang Chuang, Xiong Zhi, Liu Jianye, et al. A path integration approach based on multi-scale grid cells for large-scale navigation[J]. IEEE Transactions on Cognitive and Developmental Systems, 2022, 14(3): 1009-1020.
[28]Omer D B, Maimon S R, Las L, et al. Social place-cells in the bat hippocampus[J]. Science, 2018, 359(6372): 218-224.
[29]楊闖,熊智,劉建業,等. 一種基于社交位置細胞/網格細胞的類腦相對導航方法:中國, CN113297506A[P]. 2021-08-24. Yang Chuang, Xiong Zhi, Liu Jianye, et al. A brain-like relative navigation method based on social place cells/grid cells: China, CN113297506A[P]. 2021-08-24.(in Chinese)
[30]Samsonovich A, McNaughton B L. Path integration and cognitive mapping in a continuous attractor neural network model[J]. Journal of Neuroscience, 1997, 17(15): 5900-5920.
[31]Stringer S M, Rolls E T, Trappenberg T P, et al. Self-organizing continuous attractor networks and path integration: Twodimensional models of place cells[J]. Network: Computation in Neural Systems, 2002, 13(4): 429-446.
[32]Rosten E, Drummond T. Machine learning for high-speed cor‐ner detection[C].Computer Vision ECCV 2006: 9th European Conference on Computer Vision, 2006: 430-443.
[33]Rublee E, Rabaud V, Konolige K, et al. ORB: An efficient alternative to SIFT or SURF[C].2011 International Conference on Computer Vision. IEEE, 2011: 2564-2571.
[34]陳孟元,張玉坤,田德紅,等. 基于興趣傾向機制的仿生SLAM 算法[J]. 電子與信息學報, 2022,44(5): 1743-1753. Chen Mengyuan, Zhang Yukun, Tian Dehong, et al. Bionic SLAM algorithm based on interest tendency mechanism[J]. Journal of Electronics Information Technology, 2022, 44(5): 1743-1753. (in Chinese)
[35]唐璐楊,唐小妹,李柏渝,等. 多源融合導航系統的融合算法綜述[J]. 全球定位系統,2018,43(3): 39-44. Tang Luyang, Tang Xiaomei, Li Boyu, et al. A survey of fusion algorithms for multi-source navigation fusion system[J]. GNSS World of China, 2018, 43(3): 39-44. (in Chinese)
[36]Milford M J, Wyeth G F, Prasser D. RatSLAM: A hippocampal model for simultaneous localization and mapping[C]. IEEE International Conference on Robotics and Automation, 2004: 403-408.
[37]Chen Zetao, Jacobson A, Erdem U M, et al. Multi-scale bio-in‐spired place recognition[C]. 2014 IEEE International Confer‐ence on Robotics and Automation (ICRA). IEEE, 2014: 1895-1901.
[38]Jacobson A, Chen Z, Milford M. Leveraging variable sensor spatial acuity with a homogeneous, multi-scale place recogni‐tion framework[J]. Biological Cybernetics, 2018, 112: 209-225.
[39]Li Junyi, Huang Yanwei, Huang Wenchao, et al. Path planning for USV with FG-DA-RRT algorithm[C].2019 Chinese Auto‐mation Congress (CAC). IEEE, 2019: 3211-3215.
[40]Hu Biao, Cao Zhengcai, Zhou Mengchu. An efficient RRTbased framework for planning short and smooth wheeled robot motion under kinodynamic constraints[J]. IEEE Transactions on Industrial Electronics, 2021, 68(4): 3292-3302.
[41]Tang Biwei, Xiang Kui, Pang Muye, et al. Multi-robot path planning using an improved self-adaptive particle swarm optimization[J]. International Journal of Advanced Robotic Systems, 2020, 17(5): 1729881420936154.
[42]Guo Siyu, Zhang Xiuguo, Du Yiquan, et al. Path planning of coastal ships based on optimized DQN reward function[J]. Journal of Marine Science and Engineering, 2021, 9(2): 210.
[43]Saputra A A, Toda Y, Botzheim J, et al. Neuro-activity-based dynamic path planner for 3D rough terrain[J]. IEEE Transac‐tions on Cognitive and Developmental Systems, 2017, 10(2): 138-150.
[44]G?nner L, Vitay J, Hamker F H. Predictive place-cell sequences for goal-finding emerge from goal memory and the cognitive map: A computational model[J]. Frontiers in Computational Neuroscience, 2017, 11: 84.
[45]戴嘉偉,熊智,晁麗君,等.基于STDP獎勵調節的類腦面向目標導航[J].導航定位與授時, 2023,10(2):47-56. Dai Jiawei, Xiong Zhi, Chao Lijun, et al. Brain-inspired targetdriven navigation based on STDP reward modulation[J]. Navigation Positioning and Timing, 2023, 10(2): 47-56. (in Chinese)
[46]Yuan Miaolong, Tian Bo, Shim V A, et al. An entorhinalhippocampal model for simultaneous cognitive map building[C].National Conference on Artificial Intelligence, 2015.
[47]Brandli C, Muller L, Delbruck T. Real-time, high-speed video decompression using a frame-and event-based DAVIS sensor[C]. 2014 IEEE International Symposium on Circuits and Systems (ISCAS). IEEE, 2014: 686-689.
[48]Liu S C, Rueckauer B, Ceolini E, et al. Event-driven sensing for efficient perception: Vision and audition algorithms[J]. IEEE Signal Processing Magazine, 2019, 36(6): 29-37.
[49]郝運達,陳國良,蔣新元.仿生導航研究綜述[J].現代測繪,2022,45(2): 1-4+9. Hao Yunda, Chen Guoliang, Jiang Xinyuan. Review of bionic navigation[J]. Modern Surveying and Mapping, 2022, 45(2): 1-4+9.(in Chinese)
[50]Cao Yongqiang, Chen Yang, Khosla D. Spiking deep convolutional neural networks for energy-efficient object recognition[J]. International Journal of Computer Vision, 2015, 113: 54-66.
[51]楊闖,劉建業,熊智,等. 由感知到動作決策一體化的類腦導航技術研究現狀與未來發展[J]. 航空學報,2020,41(1): 35-49. Yang Chuang, Liu Jianye, Xiong Zhi, et al. Brain-inspired navigation technology integrating perception and action decision: A review and outlook[J]. Acta Aeronautica et Astronautica Sinica, 2020, 41(1): 35-49. (in Chinese)
Interest-driven Brain-inspired Autonomous Navigation Technology in Unknown Complex Environments
Wang Chenxu1, Xiong Zhi1,2, Yang Chuang1
1. Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China
2. Key Laboratory of Navigation, Guidance and Health-management Technologies of Advanced Aerocraft, Ministry of Industry and Information Technology, Nanjing 211106, China
Abstract: As unmanned systems become more widely used, traditional navigation technology is difficult to meet the autonomous intelligent navigation performance requirements of unmanned systems when facing complex tasks and unknown environments. Mammals can achieve efficient, intelligent and environment-adaptive navigation behavior driven by interest. The interest-driven brain-inspired autonomous navigation technology inspired by this has the potential to solve the shortcomings of traditional navigation that cannot meet the requirements of real-time, accuracy and low power consumption at the same time. First, the mechanism of mammalian brain navigation is expounded; Second,the technical framework of interest-driven brain-inspired autonomous navigation is summarized; Then,the key technologies and implementation approaches of brain-inspired autonomous navigation are sorted out from four aspects: Self-perception, environmental cognition, memory reasoning and interest decision-making and the shortcomings of related research were pointed out; Finally, the shortcomings of the current brain-inspired autonomous navigation technology were analyzed and prospects for future integrated development were made.
Key Words: brain-inspired autonomous navigation; interest-driven; continuous attractor neural network; braininspired multi-source fusion; spiking neural network; brain-inspired chip