










摘 要:近年來,無人機、無人汽車、無人艇等智能無人系統在軍事、工農業生產、物流運輸等各個領域起到了重要的作用。由于單個無人系統資源與能力的局限性,無法滿足愈加復雜的現實需求,因此,將多個智能無人系統組成集群實現協同工作和群體智能成為一種趨勢,其中群體導航定位是群體智能的重要基礎。傳統的衛星導航無法滿足無人集群系統在復雜環境下的導航需求,其自主導航成為亟待解決的問題。類腦群體導航是受動物導航系統與群體協同神經機制和原理的啟發而產生的一個有前景的研究領域,旨在實現復雜和未知環境中高效智能導航,可以滿足無人集群系統的導航需求。本文綜述了類腦群體導航的概念、機制,探討了實現類腦群體導航的空間神經機理、相關的仿真模型,以及基于群體智能的類腦群體決策相關算法,最后討論了類腦群體導航的發展方向。
關鍵詞:類腦智能; 群體協同; 自主導航; 群體導航; 類腦導航
中圖分類號:TJ760; V249.3
文獻標識碼: A
文章編號:1673-5048(2023)05-0092-12
DOI: 10.12132/ISSN.1673-5048.2023.0118
0 引" 言
在自然界中,為了更好的生存與繁衍生息,一些生物演化出了抱團合作、相互取暖的生存模式,如蟻群可以用群體的力量建造復雜精美的蟻巢; 狼群可以通過合作,以更高的效率圍捕獵物; 候鳥可以通過編隊提高飛行效率,減少遷徙途中的力量消耗。受此啟發,研究人員也開始研究聯合統一、協作配合的無人集群系統。無人集群系統是由多個相互聯系、協同控制的個體智能無人系統組成的具有統一調配、群體決策能力的智能群體,具有并行感知與計算的能力。相比于個體智能無人系統其攜帶設備及資源有限的缺點,無人集群系統具有通過協同合作實現資源信息共享、以更小的成本和更高的魯棒性適應復雜外界環境,執行較為困難任務的能力。
導航是指確定和控制物體或人員在空間中的位置和移動方向,以便實現特定目標的過程,包括信息感知、建圖定位及決策等3個步驟,信息感知和建圖定位是基礎,決策例如路徑規劃、方向控制等是實現智能化的關鍵。精確導航是實現無人集群系統的前提之一,這要求有穩定精確的導航系統。現有的導航系統大多是基于衛星導航,可以用較小的成本實現較為精準的導航效果,然而該類導航系統無法適應復雜的外界環境,如衛星拒止環境,或者電磁較為紊亂的復雜環境。在這些環境中,智能無人系統很難從衛星獲取穩定且正確的位置信息,到目前雖然已經研究了許多方法來克服這些問題,但是由于效果和成本問題,仍需要新的導航方式以解決這些問題。
類腦智能是通過模仿自然界生物大腦工作機理來進行智能研究的技術。由于生物大腦通過漫長的自然演化,集感知、決策、記憶及學習等能力于一身,通過借鑒大腦的神經機制、組織結構等,可以實現具有優秀適應和學習能力的人工智能系統。因此,通過學習大腦的空間神經結構,獲得類似于生物的空間認知能力,借此可以實現機器人的自主導航。隨著類腦智能的研究深入,類腦導航為智能無人系統適應復雜多變的環境提供了新的思
路。類腦導航可以借助自身傳感器構建實時環境地圖并實現自主定位與決策,提高智能無人系統的內在“智力”,實現缺失衛星信號的情況下自主導航。
傳統的衛星導航需要一組在軌道上運行的衛星,通過接收來自多個衛星的信號,并計算這些信號的時間差來確定接收設備的位置。接收設備會收集到4顆以上衛星的信號,來計算自身的位置坐標,是現有應用最廣泛的導航系統。相較于衛星導航,類腦導航具有以下優勢:
航空兵器 2023年第30卷第5期
李衛斌,等: 類腦群體導航的機理與發展
(1) 獨立性: 類腦導航系統無需借助外源性設備如地面基站或衛星等,僅借助自身傳感設備實現自主導航定位功能,因此可以在地下、隧道或山區等信號遮蔽環境下工作,但在該種環境下衛星導航系統會出現精度下降甚至無法使用的情況。
(2) 實時性: 類腦導航系統通過感知環境并結合自運動信息獲取實時的位置信息,相較于衛星導航,具有更快的響應與定位速度。
(3) 高精度: 傳統的衛星導航精度一般在幾米到十幾米之內,而類腦導航通過處理大量的傳感器信息并進行數據分析與優化,可以將定位誤差縮小至米級之內,具有更高的精度。
(4) 健壯性: 類腦導航具有多模態感知能力,通過耦合不同感知信息獲取精準的環境信息與位置信息。即使部分傳感器失效,其余也可以正常運作,不會過多影響導航性能。
同時,從昆蟲的群體行為到鳥類的遷徙,生物群體展現了出色的路徑規劃和協作能力。通過借鑒生物群體的行為模式,并模擬生物群體協作機理,可以實現無人集群系統高智能化的合作、協調和配合能力,使集群表現出更高水平的智能和效能。因此結合類腦導航與基于群體智能的類腦群體協作,實現群體層面的類腦導航,將成員之間的信息交換、任務分配、資源共享和行動協調等機制結合在一起,實現高效、魯棒和智能的協同行動,實現無人集群導航的智能化、自主化,實現更高層次的群體導航效果。
1 類腦群體導航基本概念
1.1 類腦群體導航概要
自然界生物展示了驚人的導航能力,其能在復雜的環境中實現精確的自主導航。通過感知環境、記憶地標和路徑、決策和規劃行動,高效地完成自主導航任務。類腦導航是一種借鑒生物大腦的工作原理和機制,將其應用于導航系統,不借助外源性信息實現自主導航的能力。
當生物或者無人系統處于陌生環境時,需要解答2個基本問題,“身處什么地方?”和“身處于什么環境?”。為了求得兩個問題的解,需要達成兩個目標,一個是自定位,即不借助外源性信息的情況下,依靠自身傳感器實現自身的相對定位; 另一個是構建實時環境地圖,即在行進中使用傳感器的信息構建地圖。自定位需要有實時環境地圖以確定位置,構建實時環境地圖也需要有實時定位信息才可以將傳感器信息融入進地圖,兩者互為條件。因此,這2個問題需要同時進行解答,這本質是解決同步建圖與定位(Simultaneous Localization and Mapping,SLAM)問題。在此之后,還需要解決“去哪個地方?”的問題,這代表的是導航決策的能力。如何更好地解決這3個問題,是提高自主導航能力的關鍵。
類腦導航技術通過將生物導航機制與計算機科學相結合,通過研究生物導航機制,從中獲得啟發,將生物大腦中的神經網絡結構與信息編碼機理轉化為計算機算法模型或硬件結構,融入導航系統中,提高自主導航的健壯性、自主性與自適應性。
由于自然界中許多生物具有通過群體行為實現復雜的導航和協同行動的能力,如鳥群、魚群和蟻群等具有高度協調和合作的行為,通過研究生物群體行為,模仿生物協同機制,結合類腦導航方法,可以實現群體層面的高級導航決策能力。因此,類腦群體導航是通過借鑒生物大腦的神經結構與網格細胞、位置細胞等空間認知細胞,基于多模態傳感器融合信息,實現類似于自然界生物的空間認知與自主導航能力; 并模擬自然界生物群體協同行為模式,具備群體定位與整體環境地圖構建、多智能體協同能力的高性能群體導航算法。將其用于無人集群系統的導航與協作中,可以實現具備高魯棒性與自主性的群體導航效果。
1.2 類腦導航與類腦群體導航的關系
類腦導航借鑒了大腦中與空間認知相關的結構和神經機制,如海馬體、頭朝向細胞、網格細胞等,研究個體動物在空間中的導航能力和行為機制。類腦導航關注的是個體動物在環境中的定位、路徑規劃和空間記憶等問題。通過理解和模擬大腦的導航機制,為人工智能領域中的導航算法提供啟示和改進。
類腦群體導航將重點放在群體中多個個體的協作和合作行為上,主要研究群體中個體之間的信息交流、合作決策和群體行為的組織規律。類腦群體導航不僅關注個體的導航能力,更注重如何通過群體智能來實現更高效、靈活和智能的導航和決策。因此,類腦導航是研究個體動物的導航能力和神經機制,而類腦群體導航則是在類腦導航的基礎上,進一步研究群體協作和合作行為,實現群體層面導航的優化和智能化。
1.3 類腦群體導航框架
類腦群體導航算法可以分為個體與群體兩個層次,以及3個步驟: 類腦信息感知、類腦建圖定位與類腦群體決策。類腦信息感知模塊中,利用多種感知模態,如視覺、聽覺、觸覺等,以獲取充足的環境信息,模仿生物神經系統中的并行處理機制,從原始的感知數據中提取出更高級的語義和特征信息,從而實現更高效的感知和響應; 類腦建圖定位模塊借鑒生物大腦空間認知神經結構與相關空間神經細胞,對自身的位置進行估計和定位以及同步個體環境地圖更新,并將個體地圖集成至群體地圖,實現具有環境信息與群體信息的群體認知地圖; 類腦群體決策模塊通過模仿生物群體的決策機制和協同行為,類腦群體決策使得多個個體或機器人能夠在群體中相互協作、相互影響,并實現集體智慧的發揮,從而提高整個群體的決策能力和適應性,實現群體智能和協作效能的最大化。類腦群體導航的整體架構如圖1所示。
2 哺乳動物空間認知機理
動物的空間認知能力對于幫助動物建立環境地圖和空間記憶以尋找生存資源或躲避敵害具有重要的意義,在動物的生存、繁衍和適應環境方面發揮著關鍵的作用。哺乳動物作為目前智力最高的動物類別,對于研究人員研究大腦空間認知機理具有重要作用。
對于個體而言,哺乳動物的海馬體與內嗅皮層被認為是大腦中產生動物空間認知能力的重要區域,其中的空間神經細胞,如位置細胞、網格細胞、頭朝向細胞、邊界細胞、速度細胞等是動物可以自主尋路的內在保證。通過不同空間神經細胞的相互交互,并對外部信息與自我運動信息的編碼,在大腦中構建認知地圖,實現個體的空間認知與導航。
在群體層面,現已被證明海馬體內也存在具有群體空間認知能力的群體位置細胞[1],能夠對群體內其余個體的行為與位置進行編碼,這是實現群體智能與自組織行為的生物基礎。
本章重點介紹位置細胞、頭朝向細胞、網格細胞、群體位置細胞的生物機理及交互模式。
2.1 位置細胞
1971年,O’Keefe等在自由活動且清醒大鼠的海馬體中具有位置特異性放電的特殊錐體型細胞[2]。使用大鼠進行實驗時,研究人員發現當大鼠經過某個特殊地方時,對應的位置細胞會開始放電,位置細胞放電所對應的位置被稱為位置細胞的放電野(又名位置野),如圖2(a)所示,黑色曲線為大鼠的運動曲線,紅色區域為大鼠位置細胞放電時大鼠所處的位置。圖2(b)為位置細胞的放電強度圖,紅色代表放電最強烈,藍色代表放電強度最低。
位置細胞要對外界環境信息進行編碼,需要接入多種的信息輸入,如外源性信息(視覺、聽覺、嗅覺等感受信息),內源性信息(大腦前庭的感覺信息、身體的自運動線索),還要接受來自海馬體內部的循環信息。當動物進入陌生環境時,位置細胞會使用外源性信息進行編碼,以生成新的穩定的放電野,該放電野會持續很長時間且在黑暗中也可以穩定存在[3]; 當動物離開該環境很長時間后,再次返回時,位置細胞對應該環境的放電野依舊穩定的存在。位置細胞是動物空間記憶,自主尋路的神經基礎,且同一位置細胞可以參與不同環境的表示[4]; 當動物進入全新的環境時,位置細胞的放電野會發生改變,重構為對應的放電野[5]。幾十個位置細胞的集體放電足以形成動物當前位置的準確表示[6]。近年來,三維位置細胞也在人類的相應腦區中發現,該類細胞可以根據動物的運動模式靈活的在二維與三維之間切換[7]。
2.2 頭朝向細胞
1984年,Rank在記錄大鼠海馬區下托的神經元時,偶然發現了前下托的許多細胞放電僅與大鼠的頭部水平方向有關,而與其位置和正在進行的行為無關。如當老鼠把頭指向東北方向時,一個細胞可能會放電; 當老鼠把頭向西時,另一個細胞就會放電。這些細胞被稱為頭朝向細胞[8]。
頭朝向細胞存在于整個邊緣系統中,包括前下托、丘腦前背側核、背紋狀體等區域。其放電方向受頭部朝向的影響。每個細胞的最大放電速率只發生在一個頭部方向上,在首選方向兩側的頭部方向上的速率隨與首選方向的角偏差呈線性下降[9]。因此,每個頭朝向細胞都有獨自的最佳放電方向,當頭部向某方向轉動時,離該方向的夾角越小,對應的頭朝向細胞的放電就會越強烈。生物在運動時,頭朝向細胞不斷被激活,這些頭朝向細胞的放電信息整合到一起就會形成一個連續的方向信號。頭朝向細胞的方向編碼會隨著某個視覺標志的旋轉而改變,這代表著頭朝向細胞對于方向的認知來自于外界信息。根據研究,三維頭朝向細胞可以對動物的俯仰、偏航、滾轉進行編碼,能夠表征環境的各個方向。頭朝向細胞是生物“導航系統”的重要組成。
2.3 網格細胞
2005年,Hafting夫婦在研究大鼠海馬區以及相關腦區的神經活動時,發現了一類新的細胞類型,這些細胞在大鼠在環境中移動時表現出特殊的活動模式: 在大鼠的運動軌跡上形成了一種網格狀的活動模式[10]。網格細胞位于大腦內側的內嗅皮層中,可以在大腦中構建出整個的環境地圖,指明所處的位置。每個細胞都具有多個放電野[11],排列起來形成周期性的等邊三角形,各個網格細胞的放電野依次鋪疊在大鼠的活動空間內,就像是地圖上的網格,這也是網格細胞名字的由來,如圖3(a)。這些網格細胞共同形成動物位置細胞變化的信號。可以使用朝向、間距、相位這3個屬性來對網格細胞進行描述。如圖3(b)所示,其中,相鄰放電野的距離被稱為間距(實線箭頭),距離參考點最近的放電野相對參考點的偏移被稱為相位(放電場中心x與其余放電場中心的相對位置),網格細胞放電野連接而成的平行線與參考方向的最小夾角則為朝向(虛線箭頭)。網格細胞可以在不借助外界標志物的情況下,僅依靠自身的速度、方向實現路徑積分而確定位置。且其間距會受到外界環境大小的影響,當外界區域大的時候,間距會變小; 外界區域小的時候,間距會變大[12]。這意味這網格細胞會在熟悉環境時不斷學習新的度量關系。三維網格細胞也在近年被發現[13]。
2.4 海馬體社交功能與群體位置細胞
隨著對生物個體的空間導航機理的研究不斷加深,研究人員也逐漸開始思考生物群體導航的神經結構基礎,群體導航相較于個體導航,最大區別是耦合了群體內部的信息,如其他個體氣味、位置、甚至種群地位等信息,結合這些信息,可以實現更符合實際的定位與決策。
雖然海馬體的具體神經機制目前還不明確,但是現有研究表明,海馬體在社會記憶的形成和維持中起到一定的作用,并參與了群體行為的協調[14]。社會記憶是指個體對他人身份、特征和關系的記憶能力。海馬體可能參與了對社會情境中他人身份和交互關系的編碼和存儲,幫助個體識別和記憶與他人相關的信息。
2018年,研究人員在研究蝙蝠的群體導航能力時,在海馬體中發現了一類“群體位置細胞”,能夠對動物周邊無生命或有生命的運動個體的位置進行編碼,這代表著該類細胞在群體的空間認知中起到作用,并且可以迅速的切換表達模式,能夠從表達自身坐標到表達蝙蝠之間的距離,切換時間不超過100 ms[15],這是實現高靈活的自組織行為的基礎。
2.5 哺乳動物自定位框架
位置細胞、網格細胞、頭朝向細胞等空間神經細胞組成了生物體內最可靠的“定位系統”。動物通過眼睛、耳朵等感知器官獲取外界信息,信息經過大腦其他部位編碼后輸入至位置細胞群中,激活相對應位置細胞; 且群體位置細胞可以通過群體其他個體的位置信息、動作信息等計算自身位置,并與頭朝向細胞、激活后的位置細胞對網格細胞整合路徑進行修正,生成大腦中的認知地圖并確定自身位置,如圖4所示。
3 類腦仿真模型
目前為止,研究人員主要利用連續吸引子神經網絡(Continous Attractor Neural Network,CANN)、脈沖神經網絡(Spiking Neural Network,SNN)、深度神經網絡(Deep Neural Network,DNN)等以及震蕩干擾模型(Oscillatory Interference,OI)對不同的空間感知細胞(包括將頭朝向細胞與位置細胞等結合為位姿細胞)進行仿真研究。
3.1 連續吸引子神經網絡
吸引子神經網絡是一種循環網絡,由許多節點組成,并且可以最終趨于穩定。每個節點可以看作為一個神經元,接受來自周邊神經元的興奮信號與較遠神經元的全局抑制信號,可以實現在不接受外界輸入時的穩定狀態。其中吸引子是系統趨于演化至的一組中性穩定的狀態,本質上為狀態空間(系統中所有狀態的集合)的一組點。
在系統演化過程中,給定吸引域中的初始狀態會逐漸逼近這些狀態。連續吸引子神經網絡(Continuous Attractor Neural Network,CANN)是一種特殊的吸引子神經網絡,也是一種特殊的非線性動力學系統。CANN中的吸引子是連續的且每一個吸引子對編碼一個激活值,當吸引子被激活時,呈現的是“凸起”的狀態。如圖5所示,一組連續的吸引子在狀態空間中會逐漸構成連續的狀態子空間,且在CANN中神經元之間連接是平移不變的,也就是說,兩個神經元之間的連接強度只取決于其首選刺激之間的差異,而不是首選刺激值。
CANN已應用于描述神經系統中簡單連續特征的編碼,如運動方向、頭部方向和目標的空間位置等。CANN的特性同空間神經細胞的性質非常貼切,1997年,有研究人員在研究大鼠海馬體神經元時發現大鼠的位置細胞排列形成一個狀態場,狀態場中的每個單元與現實環境是一一映射關系,隨著大鼠的運動,不同位置細胞放電強度發生改變,狀態場中會產生移動且形狀不變的“凸起”,如圖6所示。這與連續吸引子網絡的性質是幾乎相同的[16]。甚至可以用CANN解釋海馬體神經元中的“相位進動”現象[17],因此其可以作為神經信息編碼的標準模型,且由于CANN使用大量神經元放電進行信息表征,因此對具有較強魯棒性,即便一些輸入信息存在問題,依舊不會影響整體。近年來成功應用于位置細胞、網格細胞、頭朝向細胞等空間神經細胞的建模。
2004年,澳大利亞昆士蘭大學的研究團隊受嚙齒類動物海馬體模型的啟發,提出了名為RatSLAM的同步定位與地圖構建算法[18],該算法使用位姿細胞中的活動包來表示機器人的位置與方向,位姿細胞使用CANN進行建模,活動包使用外部的視覺傳感器輸入和通過自身運動線索實現的路徑整合進行更新。輸入新的活動,移動活動包(在初始節點中得到激活的節點稱為活動包,活動包也會提供遠程抑制),該方法可在較大區域建立度量拓撲地圖實現導航定位功能。由于RatSLAM的最關
鍵信息來自于視覺里程計,因此其會受到外部線索的劇烈影響。
之后研究人員在RatSLAM的基礎上進行了探索,提出了一些擴展成果,如Steckel等研究人員使用聲納傳感器代替了RatSLAM中的視覺傳感器,獲取聲音感知線索,研發出了名為BatSLAM的算法[19]。Milford等使用了三維的位置細胞對RatSLAM進行了擴展,實現了在三維環境的SLAM系統- DolphinSLAM[20]。該算法可以在極端情況的環境變化下,如一天的白天夜晚、一年四季、天氣變化等復雜情況,使機器人識別出曾經走過的路線。
文獻[21]提出了名為NeuroSLAM,基于四自由度(Degree of Freedom,DoF)的SLAM系統。該系統由聯合位姿細胞、多層經驗地圖與視覺模塊構成,如圖7所示。可以創建實時多層次的經驗地圖,通過視覺線索與自身動作信息實現誤差更新,重新定位與閉環檢測。該研究中使用三維網格細胞和三維頭朝向細胞構建了聯合位姿細胞模型,用于表示四自由度位姿,使用自運動信息執行路徑整合,并基于局部視覺線索執行校準。使用局部視圖單元、位姿細胞和三維視覺里程計創建多層圖形經驗地圖。
NeuroSLAM算法框架中使用了CANN模型對空間導航神經細胞進行建模,分別用三維的CANN與二維的CANN構建三維網格細胞與三維頭朝向細胞。NeuroSLAM系統可以在機器人訪問新環境時同步創建多層圖形經驗地圖并且隨著運動不斷更新,可以在大型的真實三維環境中實現自主導航與定位。2021年,研究人員使用吸引子神經網絡建立了具有應用潛力的頭部方向細胞模型和位置細胞模型[22],對視覺和慣性輸入信息進行編碼,其中頭朝向細胞融合慣性測量裝置提供的角速度和視覺里程計提供的偏航角以獲得航向,位置細胞模型融合慣性測量裝置提供的水平速度和視覺里程計提供的相對于初始點的位置,然后根據群體神經元的放電響應對方向和位置進行解碼。該導航模型實現了融合各傳感器信息,獲得了較高的導航精度。2023年,基于NeuroSLAM,有研究人員通過對三維頭朝向細胞與三維網格細胞的建模,結合ORB圖像特征提取的方法,建立了具有閉環檢測與重定位功能的經驗地圖[23]。
基于CANN的類腦導航方法主要實現的是機器人的同步建圖與定位功能,屬于SLAM算法范疇之內。且這一系列方法都是基于RatSLAM算法框架,后續所有研究的改進只是在該框架的基礎上進行修改,該系列方法是空間神經細胞仿真數量由一個到多個,維度由二維至三維空間發展。如2004年,RatSLAM僅實現了二維的位姿細胞,而到了2019年,NeuroSLAM則實現的是三維的網格細胞與三維頭朝向細胞。且目前該類方法依舊存在精度不足的問題,亟待后續改進。
3.2 震蕩干擾模型
1993年,O’Keefe發現大鼠在空間環境中運動時,其海馬體的腦電波呈現8~12 Hz的θ波震蕩,這一過程被稱為θ相位進動。振蕩干擾模型最初用于解釋在海馬位置細胞中觀察到的θ相位進動效應。2005年,O’Keefe等證明位置細胞的相位進動效應是網格細胞放電模式的基礎(如圖8所示),并提出了將網格細胞、頭朝向細胞、位置細胞相結合的路徑整合框架[24]。
之后研究人員也使用振動干擾模型來解釋網格細胞的穩定、規則的放電模式[25],該模型預測了固有放電頻率與網格細胞放電的空間尺度、腦電波θ頻率和運行速度之間的特定關系[26]。同時其也允許使用網格單元之間的對稱循環連接,以提供相對穩定性和連續的吸引子動力學。根據位置細胞相位進動的理論,假設速度控制振蕩器的脈沖頻率隨運動方向和速度而變化,從而使其發射相位沿著特定的首選方向跟蹤位移。其中相位進動指動物在靠近并經過位置野的移動過程中,位置細胞的放電脈沖在時間上對應于θ波的相位逐漸提前的現象[27]。然而,2011年,Yartsev等在蝙蝠的海馬體中并未觀測θ波震蕩[28],這代表著震蕩干擾模型并不是通用的生物學機理。振動干擾模型如今依舊受到諸多質疑,大多數研究仍停留在實驗,未應用到真實環境的認知地圖構建。
3.3 深度學習網絡
深度學習網絡已成功應用于目標識別、目標追蹤、圖像修復、語義分割等各大領域,在機器人導航領域也有所進展。谷歌DeepMind團隊訓練了一個深度循環網絡(Recurrent Neural Network,RNN)中的長短期記憶網絡(Long Short-Term Memory,LSTM)以實現路徑整合[29]。該網絡通過監督學習進行訓練,可輸入速度信號,實現自我位置和運動狀態的更新,并且含有一組隱藏節點以讀取網絡中存儲的運動信息。研究人員使用了復雜的迷宮測試了這個網絡,結果顯示該網絡具有超乎尋常的尋路能力甚至于可以找尋捷徑,并發現隱藏節點的放電模式與網格細胞十分相似,呈現出了類似于網格細胞的放電野。 此研究證明了網格細胞的放電模式是可以通過學習形成的,以及RNN具有實現復雜空間導航的能力。
3.4 脈沖神經網絡
脈沖神經網絡(Spiking Neural Network,SNN)是一種人工神經網絡(Artificial Neural Network,ANN)。ANN是受大腦神經網絡結構啟發的計算模型,名為神經元的節點集合,各個節點的相互連接就像大腦神經元的突觸,可以互相傳遞并處理信號。雖然ANN是受大腦啟發的,但是從結構、計算與學習規則而言,與大腦有很大的區別。隨著對大腦研究的深入,研究人員發現真實的神經元可以產生精確定時的脈沖,并且神經元之間的信號傳遞也是通過向下游神經元廣播動作電位序列(也稱為脈沖序列)來完成的[30],這些單獨的脈沖在時間上是稀疏的,因此每個脈沖都有很高的信息含量,并且在一級近似下具有均勻的振幅[31]。
與ANN相比,SNN將時間概念引入了模型,SNN中的信息是通過脈沖時間傳遞的,包括潛伏期和峰值速率,因此更加接近自然的神經網絡,其結構如圖9所示。
20世紀90年代之后,隨著對動物大腦神經網絡研究的深入,越來越多的研究表明,自然的神經元可以發送具有精確計時能力的脈沖,并且發現了相關的突觸學習規則。SNN可以更好的處理時空數據,用于實現機器人的空間認知與導航。而基于SNN的類腦導航方法,主要實現的是機器人的路徑規劃、避障與用于導航的類腦形態硬件。
路徑規劃與避障方面,2015年,Zennir等基于SNN實現位置細胞的仿真,將真實環境表征為認知地圖,實現機器人的自主路徑規劃[32]。2018年之后,有研究人員基于SNN提出了一種能夠生成外部環境的內部表示并實現空間記憶的網絡模型[33],使用突觸向量場方法來驗證結果并計算信息特征。實驗表明該方法可以使機器人避開危險區域,雖然機器人最終會重新進入到該區域,這是因為危險轉移到了另一個區域,這代表著機器人可以不斷根據經驗更新地圖,以適應不斷改變的環境。2020年,Steffen等通過使用SNN表征位置細胞,基于脈沖時間依賴可塑性(Spike-Time Dependant Plasticity,STDP)的學習規則,實現了三維空間內的路徑規劃算法[34]。
類腦形態硬件方面,2018年,Kreiser等基于SNN實現了可用于路徑集成與地圖構建的SLAM模型,并搭載于混合信號模擬/數字神經形態硬件上[35]。同年,有研究人員基于SNN的神經形態設備實現了對頭朝向細胞的仿真[36],該網絡可以實現路徑整合,使用基于事件的攝像頭獲取視覺收入,通過檢測視覺地標,可以校正累積誤差。2021年,Kishore等結合蠕蟲的Klinokinesis的趨化性,在Loihi神經形態硬件上結合SNN塊陣列,實現了較為魯棒的導航性能[37]。相比于在軟件上實現神經元的仿真,在神經形態硬件進行仿真大大降低了成本與難度,具有廣闊的前景。
SNN在算法與網絡模型方面,主要實現的是機器人的路徑規劃與避障功能,但由于SNN網絡模型存在訓練困難的問題,很難訓練出效果較好的網絡,因此基于SNN的類腦網絡模型還處于實驗階段。同時,由于SNN模仿生物大腦通過脈沖信號對信息進行編碼,具有更高的時空信息處理能力與低功耗優勢,因此SNN在開發神經形態硬件如類腦芯片,類腦傳感器具有較好前景。
3.5 小" 結
目前,類腦仿真模型主要集中在個體的導航功能上,而群體層次的類腦仿真模型仍然處于發展階段。類腦仿真模型旨在模擬動物大腦中的空間導航神經機制,以實現智能無人系統的導航能力,具體如表1所示。
模型優勢劣勢現狀
CANN具有較強魯棒性,無需訓練,在未知環境下或者長期運行條件下具有較高可靠性。目前,參數為手動設置的固定參數,因此靈活性不足。已應用于位置細胞、網格細胞、頭朝向細胞的仿真建模,主要實現同步建圖與定位功能,具有初步應用。
OI適用于網格細胞的放電模型,可形成不同尺度的放電野。不是通用的生物學機理模型。大多數研究還停留在理論實驗階段。
DNN在各個領域已具有深厚的積累,有了很多的研究成果,可以借鑒如自然語言處理等帶有時空屬性的相關領域的已有算法,將其應用于類腦導航方面。需要大量數據進行訓練,且目前難以估計三維空間中的位姿,存在有網絡結構復雜、獎勵函數難以設計的問題。通過DNN對大腦空間神經架構進行仿真仍停留在理論實驗階段,等待后續的探索。
SNN更接近于真實的神經結構,由于脈沖具有時間信息,因此可以更好的處理時空數據,且功耗低。由于脈沖信號很難進行穩定的梯度傳播,因此模型訓練存在困難,很難訓練出效果較好的網絡。主要用于實現路徑規劃與構建類腦形態硬件。相比于前者存在的訓練困難、準確性不足的問題,SNN在后者具有更好的應用與發展前景。
4 類腦群體決策
類腦群體決策的關鍵是個體之間的信息交流和協同行為,個體可以通過感知周圍環境的信息,與其他個體共享自身的狀態和決策信息,進行局部的決策調整和協調,從而在群體層面上形成一種整體的決策模式。這種決策模式通常基于群體中的共識、多樣性、分工和分布式控制等原則,以實現群體的協調、合作和優化。類腦群體決策強調個體之間的自組織性,即個體基于局部信息和簡單的規則進行調整和適應,而無需全局信息或中央控制。通過交互和適應,整個群體可以表現出協調一致的行為和智能使得群體能夠應對環境變化和不確定性,提高群體的自適應性、魯棒性和容錯性,并在面臨挑戰時展現出合作和集體智慧。
類腦群體決策的目標是通過對生物群體智能的模擬實現群體的任務分配、路徑規劃等復雜任務,達成群體內個體間的良好協同,使群體具備更強大的問題解決能力、適應性和智能性,從而在復雜的任務環境中取得更好的表現。目前分為集中式與分布式兩種,前者代表為群體智能算法,后者代表為多智能體模型算法。
4.1 群體智能算法
基于群體智能的任務分配與路徑規劃算法以自然界中群體交互合作模式為基礎,通過模擬自然界中群體行為和集體智慧的原理,實現無人集群系統中任務的合理分配和協同執行。該類算法有以下幾種主要分支: 蟻群算法(Ant Colony Optimization,ACO)、粒子群優化算法(Particle Swarm Optimization,PSO)、 人工魚群算法(Artificial Fish Swarm Algorithm,AFSA)、蜂群優化算法(Artificial Bee Colony,ABC)等。
4.1.1 蟻群算法
蟻群算法受螞蟻在尋找食物時的行為啟發,模擬了螞蟻在尋找食物過程中的信息交流和路徑選擇策略。群體中每個個體可以看作一個螞蟻,任務可以看作食物源,螞蟻根據信息素和距離等因素進行選擇路徑,并通過信息素的釋放和蒸發來實現任務的分配。蟻群算法能夠在搜索空間中尋找到較優的任務分配與路徑規劃方案。
蟻群算法基于蟻群的集體智慧行為,螞蟻通過釋放信息素和跟隨信息素尋找最優路徑。螞蟻在搜索過程中通過正反饋機制加強對信息素濃度較高路徑的選擇,并將路徑上的信息素更新。這種信息素的正反饋和螞蟻的協作行為最終導致了全局最優解的發現。蟻群算法具有反饋信息好、魯棒性強、分布式計算能力好等優點,被廣泛應用于移動機器人的路徑規劃中。
1991年,Colorni提出蟻群算法[38],之后成為了基于群智能的優化算法的重要分支之一,有著眾多的改進版本以適應不同的應用領域。
2004年,Hsiao等提出了一種解決路徑規劃問題的改進ACO算法[39],該算法將最優路徑規劃問題表述為在考慮載荷約束的情況下,獲取地圖最短路徑長度的最優問題,具有擺脫局部最優解而實現全局最優解的能力。2010年,Zhang等針對于無人機集群的路徑規劃提出了一種新的ACO算法[40],該算法利用激勵概率來幫助螞蟻選擇下一個網格,并利用基于無限步長原理的新的啟發式信息來擴大視野,取得較好效果。2018年,Akka等在ACO算法的基礎上,采用了新的信息素更新規則和蒸發速率的動態調節,利用基于無限步長原理的新的啟發式信息來擴大視野,加快了收斂速度,擴大了搜索空間[41]。
4.1.2 粒子群優化算法
粒子群優化算法模擬了鳥群或魚群的行為,通過粒子在解空間中的搜索和交互來找到最優解。粒子根據自身的歷史最優位置和群體的最優位置來更新自己的位置,以尋找更好的任務分配方案。
1995年,Kennedy等最早提出PSO算法[42],該算法以其實現簡單、控制參數少等優點受到了廣泛的關注。PSO算法的思想和公式來源于觀察鳥類群集和魚群的社會行為。由于最初的PSO算法存在有過早收斂的問題,因此產生了之后許多優化改動的PSO算法變體。
1998年,有研究人員提出了一種基于粒子群的混合進化優化算法[43],并加入了進化計算的標準選擇機制,實現了對于部分復雜函數的選擇優勢。2004年,通過結合模擬退火算法,Wang等提出了一種混合粒子群算法,該算法縮小了優化過程中的搜索范圍,加快了收斂速度,具有較高的搜索效率[44]。2008年,Jiao等提出了帶突變的Elite粒子群優化算法[45],可以從群體中區分出優秀粒子與壞粒子,用優秀粒子取代壞粒子,并引入突變機制,防止局部最優。2011年,Alfi等通過自適應粒子群優化算法(APSO)來尋找最優系統參數和最優控制參數的方法,可以在最小的增量計算量下實現更快的收斂速度和更好的解精度[46]。2018年,Zhang等提出了一個新的PSO的變體-PPPSO[47],實現了捕獲、逃跑和繁殖策略,有助于提高收斂速度并減少計算時間。2022年,Zhang等為解決為異構多無人機的多任務分配問題,改進了模擬退火粒子群優化算法(SAPSO),建立了粒子群與可行任務分配方案之間的關系,得到了合理有效的任務分配方案[48]。
4.1.3 人工魚群算法
2003年,文獻[49]提出人工魚群算法,之后隨著廣泛的應用產生了許多變體。人工魚群算法模擬了魚群中的覓食行為。每個個體被看作一條魚,任務被看作食物。魚根據食物的位置和個體行為來選擇任務,并通過覓食行為的調整來實現任務的分配和調度。該類算法是一種并行隨機搜索算法,使用局部搜索策略,具有較強的全局搜索能力與隨機性,并且能夠在搜索空間中自動調整搜索策略和行為,具有較強適應性與魯棒性。
由于基礎的人工魚群算法存在有尋優精度不高的缺點,2006年,有研究人員提出了自適應人工魚群算法[50],通過對參數的實時調整,最終提高收斂精度。由于機器人路徑規劃必須具有平滑性,2014年,文獻[51]提出了基于對立強化學習機制的人工魚群算法,并將其應用于實際環境中的路徑規劃問題。該算法引入了衰減函數來改善標準人工魚群算法的視覺效果,實現了全局搜索和局部搜索的平衡,并采用自適應算子來增強步長的自適應,具有較強的搜索能力和理想的收斂性。2017年,文獻[52]提出了一種對數函數自適應人工魚群算法(ALF-AFSA),該算法采用對數函數作為步長范圍,提高了算法的搜索能力。2022年,為解決船舶的路徑規劃問題,有研究人員改進了人工魚群算法[53],提出一個概率權重因子來調整執行隨機行為的頻率,并引入了一個自適應算子,取得了較好的路徑規劃效果。
4.1.4 蜂群優化算法
蜂群優化算法受蜜蜂在尋找花蜜的行為啟發,其模擬了蜜蜂在尋找蜜源的過程中的交流和合作行為,通過多個虛擬的蜜蜂個體在問題的搜索空間中進行信息交流和搜索,以尋找最優解。2005年,蜂群算法首次被提出,并用于優化數值問題,之后基于蜂群算法的改進算法被應用于各個領域,是目前在解決實際問題方面應用最廣泛的算法之一。
2010年,為解決無人作戰飛行器的路徑規劃問題,研究人員將混沌理論與ABC算法相結合,實現了一種新的改進蜂群算法[54],利用混沌變量的遍歷性和不規則性,幫助基本ABC算法跳出局部最優,加快尋找最優參數的過程,實現較好效果。2015年,有研究人員將蜂群優化算法與進化遺傳算法結合,利用人工蜂群算法生成可行路徑,通過局部搜索逐步構建連接移動機器人起始位置和目標位置的無碰撞路徑; 采用進化規劃方法對可行路徑進行細化,實現了多機器人平滑的路徑規劃[55]。2020年,Xu等將協同進化框架與ABC算法相結合,設計了一種全局最優的人工蜂群算法[56],引入交叉策略和全局最優位置策略處理維度依賴現象,在機器人路徑規劃問題上得到較好測試結果。
4.1.5 小結
基于群體智能的類腦群體決策算法是一類基于群體行為和自組織原理的仿生優化算法,通過模擬自然界中群體行為、交互方式和生物進化的方式來解決復雜的優化問題。這些算法借鑒了社會群體、動物群體以及生物進化的啟示,將個體的局部知識和行為整合為整體的集體智能,從而能夠有效地搜索和優化解空間。在群體智能算法中,個體之間可以通過共享信息、相互協作、競爭或者覓食行為來實現信息傳遞和知識交流。這些算法常涉及到群體中個體的位置、速度、方向等狀態的調整和更新,以逐步搜索解空間并逼近最優解。基于群體智能的決策算法在未知環境下和處理大規模群體數據等方面具有潛在優勢,其可以有效地應對復雜環境的多樣性、不確定性和動態性,實現無人集群系統在群體層面的決策能力。
蜂群算法、蟻群算法、人工魚群算法和粒子群算法是基于群體智能的類腦群體決策算法的幾個主要分支,這些算法在具體實現上有所不同,但基本原理類似: 通過模擬群體行為、信息傳遞和個體適應調整,以獲取最優的決策結果,具有一些共同的優勢和劣勢,也有一些各自的特點,如表2所示。
4.2 多智能體模型
多智能體模型(Multi-Agent System,MAS) 的設計借鑒了生物群體的特征和行為,模型中的智能體通過相互通信、協調和合作來達到共同的目標。借用多智能體模型可以實現分布式、自治代理的決策控制方法,將復雜決策和任務分散到系統中的多個自治個體,每個個體根據自身的觀察和策略做出決策,并與其他個體進行交互和合作。多智能體模型這種分布式的特性使得多智能體模型能夠適應大規模、復雜的問題,具有較高的魯棒性、適應性與可擴展性。多智能體模型被廣泛應用于集群任務分配、路徑規劃與系統控制等方面。
早期的多智能體模型以博弈論為基礎,引入馬爾科夫決策過程(Markov Decision Process,MDP)進行建模,馬爾可夫決策過程是一種數學模型,用于描述一個智能體在與環境交互的過程中作出決策的問題。強化學習是一種可以解決馬爾可夫決策過程的方法,用于讓智能體通過與環境的交互來學習最優的行為策略,因此多智能體強化學習通過與環境的交互和獎勵信號的反饋,能夠逐步學習到最優的決策策略。
2020年,Chen等提出了一種基于高斯過程回歸和多智能體強化學習的無人機集群跟蹤方案,該方案以最小搜索時間為優化目標,通過接收信號強度(RSS)測量來跟蹤射頻目標[57]。同年,有研究人員針對于無人機集群軌跡規劃問題提出了一種基于多智能體深度強化學習的軌跡控制算法,通過優化每架無人機的軌跡以實現能耗的最小化[58]。2021年,Xia等為解決無人機集群目標追蹤問題,提出了端到端的多智能體強化學習方案,使無人機能夠根據目標的過去和當前狀態做出智能飛行決策,進行協同目標跟蹤[59]。2022年,Shang等提出了一種基于多智能體強化學習的協同路徑規劃模型,將多艦載機協同路徑規劃建模為多智能體強化學習問題,建立了基于艦載機狀態和行動空間的協同路徑規劃模型,實現了快速、準確率高的航母艦載機最優調度路徑[60]。
5 類腦群體導航發展方向
類腦群體導航是一項前沿的研究領域,旨在借鑒生物大腦中空間導航的神經機制以及群體智能原理,通過收集多模態傳感信息實現空間感知,將其應用于多機器人系統中,以實現在復雜未知環境中的自主導航和協作行為。該領域的研究目標是通過多模態傳感信息的收集,實現對環境的全面感知和理解。通過信息交換和協作,智能無人系統能夠建立個體環境地圖,并在此基礎上構建實時的群體地圖; 且通過個體之間的信息交流和合作,群體能夠共同解決復雜的導航問題,實現高級的路徑規劃和任務分配等決策能力。如今類腦群體導航依舊存在著很多挑戰與問題,仍需深入的發展。
(1) 神經機制解析。對于生物大腦空間神經結構的認知是類腦群體導航的基礎,而目前對于大腦的認識存在著大量迷霧,因此需要進一步深入研究動物大腦中與空間導航相關的神經機制,揭示更多神經元之間的相互作用和信息處理機制,為設計更精確、高效的類腦群體導航算法提供更多啟示。
(2) 多模態融合空間感知。集成多源信息和多模態融合空間感知是類腦群體導航發展的重要方向之一。不同的感知模態可以提供互補的信息,通過將多個感知模態進行融合和集成,可以提高系統的感知精度和魯棒性。當前研究主要關注視覺、激光雷達和定位傳感器,而忽視了其他感知模態的潛力。未來的發展方向將包括集成更多的傳感器,如溫度傳感器、壓力傳感器、氣體傳感器等,以提供更全面的感知能力和環境認知。同時,研究如何有效地融合多模態感知信息,加強多模態感知信息的融合,進一步提高導航系統的感知能力和環境適應性,以提高定位精度和環境理解能力。
(3) 地圖共享與群體地圖構建。在群體導航中,多個智能無人系統可以進行信息共享和協作,以實現更高效的導航。未來的發展方向是建立分布式地圖共享機制,使不同智能無人系統之間能夠相互交流地圖信息。通過共享地圖數據,將個體的感知信息整合為全局的環境地圖,群體中的個體可以更好地理解整體環境和其他成員的行為,從而實現更協調和智能的群體導航。
(4) 實現一體的群體類腦仿真模型。目前的類腦仿真模型主要集中在個體層次的研究和開發,而群體層次的模擬和研究相對較少。這是因為群體行為和群體智能的研究相對復雜,涉及到多個個體之間的相互作用和協調,以及群體整體行為的演化。但研究者已經開始關注和探索如何模擬和理解群體行為的機制,因此未來隨著群體通信、協調機制、決策策略等方面研究的加深,個體類腦仿真模型將擴展到群體層次,建立集定位、決策一體的群體導航模型。
(5) 具有自適應能力的群體決策。未來的群體決策將注重系統的自適應和自學習能力。改進和優化群體智能算法,以提高決策的效率和準確性。通過引入新的算法和技術,如深度學習和強化學習,智能無人系統將能夠根據環境的變化和任務需求進行自主學習和適應,以實現更靈活、可靠的決策能力。
6 總" 結
類腦群體導航作為新興的研究領域,融合了生物神經機制和群體協同能力,展現了廣闊的應用前景和發展潛力。通過借鑒生物大腦的導航機制與協作原理,并結合多模態傳感器信息,在建圖定位的基礎上實現智能體之間的協作與決策,適應復雜的未知環境。類腦群體導航目前仍然面臨一些挑戰,如需要高性能的計算資源和算法優化來應對高復雜性和計算開銷; 群體協作與通信需要解決群體間的信息共享和協調問題等。解決這些挑戰需要多學科的合作和深入研究,因此類腦群體導航仍有很多的工作需要完成。隨著技術的發展和應用場景的不斷涌現,類腦群體導航將更加注重與現實生活場景的融合。目前的研究主要集中在實驗室環境下的仿真和驗證,缺乏對復雜實際環境的應用,未來的發展方向將會把類腦群體導航技術應用于真實場景中的更多領域,如智能交通、智慧城市、環境監測等。研究者將在不同領域中探索應用,解決實際問題,并為未來的類腦群體導航研究提供新的挑戰和方向。
參考文獻:
[1] Omer D B, Maimon S R, Las L, et al. Social Place-Cells in the Bat Hippocampus[J]. Science, 2018, 359(6372): 218-224.
[2] O’Keefe J, Dostrovsky J. The Hippocampus as a Spatial Map: Preliminary Evidence from Unit Activity in the Freely-Moving Rat[J]. Brain Research, 1971, 34(1): 171-175.
[3] Quirk G J, Muller R U, Kubie J L. The Firing of Hippocampal Place Cells in the Dark Depends on the Rat’s Recent Experience[J]. The Journal of Neuroscience: the Official Journal of the Society for Neuroscience, 1990, 10(6): 2008-2017.
[4] Muller R U, Kubie J L. The Effects of Changes in the Environment on the Spatial Firing of Hippocampal Complex-Spike Cells[J]. The Journal of Neuroscience: the Official Journal of the Society for Neuroscience, 1987, 7(7): 1951-1968.
[5] Moser E I, Kropff E, Moser M B. Place Cells, Grid Cells, and the Brain’s Spatial Representation System[J]. Annual Review of Neur-oscience, 2008, 31: 69-89.
[6] Wilson M A, McNaughton B L. Dynamics of the Hippocampal Ensemble Code for Space[J]. Science, 1993, 261(5124): 1055-1058.
[7] Finkelstein A, Las L, Ulanovsky N. 3-D Maps and Compasses in the Brain[J]. Annual Review of Neuroscience, 2016, 39: 171-196.
[8] Rank J B, Jr. Head-Direction Cells in the Deep Layers of Dorsal Presubiculum in Freely Moving Rats[C]∥Social Neuroscience,1984, 10: 599.
[9] Taube J S, Muller R U, Ranck J B, Jr. Head-Direction Cells Recorded from the Postsubiculum in Freely Moving Rats[J]. The Journal of Neuroscience: The Official Journal of the Society for Neuroscience, 1990, 10(2): 420-435.
[10] Hafting T, Fyhn M, Molden S, et al. Microstructure of a Spatial Map in the Entorhinal Cortex[J]. Nature, 2005, 436(7052): 801-806.
[11] Fyhn M, Molden S, Witter M P, et al. Spatial Representation in the Entorhinal Cortex[J]. Science, 2004, 305(5688): 1258-1264.
[12] Barry C, Hayman R, Burgess N, et al. Experience-Dependent Rescaling of Entorhinal Grids[J]. Nature Neuroscience, 2007, 10(6): 682-684.
[13] Stella F, Treves A. The Self-Organization of Grid Cells in 3D[J]. eLife, 2015, 4: e05913.
[14] Eichenbaum H. The Hippocampus as a Cognitive Map of Social Space[J]. Neuron, 2015, 87(1): 9-11.
[15] Sarel A, Palgi S, Blum D, et al. Natural Switches in Behaviour Rapidly Modulate Hippocampal Coding[J]. Nature, 2022, 609(7925): 119-127.
[16] Samsonovich A, McNaughton B L. Path Integration and Cognitive Mapping in a Continuous Attractor Neural Network Model[J]. The Journal of Neuroscience, 1997, 17(15): 5900-5920.
[17] Chu T, Ji Z, Zuo J, et al. Oscillatory Tracking of Continuous Attractor Neural Networks Account for Phase Precession and Procession of Hippocampal Place Cells[J]. Advances in Neural Information Processing Systems, 2022, 35: 33159-33172.
[18] Milford M J, Wyeth G F, Prasser D. RatSLAM: A Hippocampal Model for Simultaneous Localization and Mapping[C]∥IEEE International Conference on Robotics and Automation, 2004: 403-408.
[19] Steckel J, Peremans H. BatSLAM: Simultaneous Localization and Mapping Using Biomimetic Sonar[J]. PLoS One, 2013, 8(1): e54076.
[20] Silveira L, Guth F, Drews-Jr P, et al. An Open-Source Bio-Inspired Solution to Underwater SLAM[J]. IFAC-PapersOnLine, 2015, 48(2): 212-217.
[21] Yu F W, Shang J G, Hu Y J, et al. NeuroSLAM: A Brain-Inspired SLAM System for 3D Environments[J]. Biological Cybernetics, 2019, 113(5): 515-545.
[22] Chen Y D, Xiong Z, Liu J Y, et al. A Positioning Method Based on Place Cells and Head-Direction Cells for Inertial/Visual Brain-Inspired Navigation System[J]. Sensors, 2021, 21(23): 7988.
[23] Shen D, Liu G L, Li T C, et al. A Brain-Inspired 3D Cognitive Map Construction Method Incorporating Monocular Visual Features[C]∥ International Conference on Guidance, Navigation and Control, 2023: 3808-3816.
[24] O’Keefe J, Burgess N. Dual Phase and Rate Coding in Hippo-campal Place Cells: Theoretical Significance and Relationship to Entorhinal Grid Cells[J]. Hippocampus, 2005, 15(7): 853-866.
[25] Bush D, Burgess N. A Hybrid Oscillatory Interference/Continuous Attractor Network Model of Grid Cell Firing[J]. The Journal of Neuroscience, 2014, 34(14): 5065-5079.
[26] Jeewajee A, Barry C, O’Keefe J, et al. Grid Cells and Theta as Oscillatory Interference: Electrophysiological Data from Freely Moving Rats[J]. Hippocampus, 2008, 18(12): 1175-1185.
[27] 斯白露, 羅壹凡. 空間記憶與類腦導航研究進展[J]. 人工智能, 2020, 7(1): 16-31.
Si Bailu, Luo Yifan. Research Progress of Spatial Memory and Brain-Like Navigation[J]. AI-View, 2020, 7(1): 16-31.(in Chinese)
[28] Yartsev M M, Witter M P, Ulanovsky N. Grid Cells without Theta Oscillations in the Entorhinal Cortex of Bats[J]. Nature, 2011, 479(7371): 103-107.
[29] Banino A, Barry C, Uria B, et al. Vector-Based Navigation Using Grid-Like Representations in Artificial Agents[J]. Nature, 2018, 557(7705): 429-433.
[30] Carr C E, Konishi M. A Circuit for Detection of Interaural Time Differences in the Brain Stem of the Barn Owl[J]. The Journal of Neuroscience, 1990, 10(10): 3227-3246.
[31] Tavanaei A, Ghodrati M, Kheradpisheh S R, et al. Deep Learning in Spiking Neural Networks[J]. Neural Networks, 2019, 111: 47-63.
[32] Zennir M N, Benmohammed M, Boudjadja R. Spike-Time Dependant Plasticity in a Spiking Neural Network for Robot Path Planning[C]∥AIAI Workshops, 2015: 2-13.
[33] Lobov S A, Zharinov A I, Makarov V A, et al. Spatial Memory in a Spiking Neural Network with Robot Embodiment[J]. Sensors, 2021, 21(8): 2678.
[34] Steffen L, da Silva R K, Ulbrich S, et al. Networks of Place Cells for Representing 3D Environments and Path Planning[C]∥ 8th IEEE RAS/EMBS International Conference for Biomedical Robo-tics and Biomechatronics (BioRob),2020: 1158-1165.
[35] Kreiser R, Renner A, Sandamirskaya Y, et al. Pose Estimation and Map Formation with Spiking Neural Networks: Towards Neuromorphic SLAM[C]∥ IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), 2019: 2159-2166.
[36] Kreiser R, Cartiglia M, Martel J N P, et al. A Neuromorphic Approach to Path Integration: A Head-Direction Spiking Neural Network with Vision-Driven Reset[C]∥ IEEE International Sympo-sium on Circuits and Systems (ISCAS), 2018: 1-5.
[37] Kishore A, Saraswat V, Ganguly U. Simplified Klinokinesis Using Spiking Neural Networks for Resource-Constrained Navigation on the Neuromorphic Processor Loihi[C]∥International Joint Conference on Neural Networks (IJCNN), 2021: 1-8.
[38] Colorni A, Dorigo M, Maniezzo V. Distributed Optimization by Ant Colonies[C]∥1st European Conference on Artificial Life, 1991, 142: 134-142.
[39] Hsiao Y T, Chuang C L, Chien C C. Ant Colony Optimization for Best Path Planning[C]∥IEEE International Symposium on Communications and Information Technology, 2005: 109-113.
[40] Zhang C, Zhen Z Y, Wang D B, et al. UAV Path Planning Method Based on Ant Colony Optimization[C]∥ Chinese Control and Decision Conference, 2010: 3790-3792.
[41] Akka K, Khaber F. Mobile Robot Path Planning Using an Improved Ant Colony Optimization[J]. International Journal of Advanced Robotic Systems, 2018, 15(3): 172988141877467.
[42] Kennedy J, Eberhart R. Particle Swarm Optimization[C]∥International Conference on Neural Networks, 2002: 1942-1948.
[43] Angeline P J. Using Selection to Improve Particle Swarm Optimization[C]∥ IEEE World Congress on Computational Intelligence, 1998: 84-89.
[44] Wang X H, Li J J. Hybrid Particle Swarm Optimization with Simulated Annealing[C]∥ IEEE International Conference on Machine Learning and Cybernetics, 2004, 4: 2402-2405.
[45] Jiao W, Liu G B, Liu D. Elite Particle Swarm Optimization with Mutation[C]∥ Asia Simulation Conference-7th International Conference on System Simulation and Scientific Computing, 2008: 800-803.
[46] Alfi A, Modares H. System Identification and Control Using Adaptive Particle Swarm Optimization[J]. Applied Mathematical Modelling, 2011, 35(3): 1210-1221.
[47] Zhang H R, Yuan M, Liang Y T, et al. A Novel Particle Swarm Optimization Based on Prey-Predator Relationship[J]. Applied Soft Computing, 2018, 68: 202-218.
[48] Zhang J, Wen P, Xiong A. Multi-Task Assignment Research for Heterogeneous UAVs Based on Improved Simulated Annealing Particle Swarm Optimization Algorithm[C]∥International Conference on Cyber-Enabled Distributed Computing and Knowledge Discovery," 2022: 284-288.
[49] 李曉磊. 一種新型的智能優化方法-人工魚群算法[D]. 杭州: 浙江大學, 2003.
Li Xiaolei. A New Intelligent Optimization Method-Artificial Fish Swarm Algorithm[D].Hangzhou: Zhejiang University, 2003. (in Chinese).
[50] Xiao J M, Zheng X M, Wang X H, et al. A Modified Artificial Fish-Swarm Algorithm[C]∥ 6th World Congress on Intelligent Control and Automation, 2006: 3456-3460.
[51] Wang J A, Wu L J. Robot Path Planning Based on Artificial Fish Swarm Algorithm under a Known Environment[J]. Advanced Materials Research, 2014, 989/990/991/992/993/994: 2467-2469.
[52] Huang Y Q, Wang P P, Yuan M R, et al. Path Planning of Mobile Robots Based on Logarithmic Function Adaptive Artificial Fish Swarm Algorithm[C]∥36th Chinese Control Conference (CCC), 2017: 4819-4823.
[53] Zhao L A, Wang F, Bai Y. Route Planning for Autonomous Vessels Based on Improved Artificial Fish Swarm Algorithm[J]. Ships and Offshore Structures, 2023, 18(6): 897-906.
[54] Xu C F, Duan H B, Liu F. Chaotic Artificial Bee Colony Approach to Uninhabited Combat Air Vehicle (UCAV) Path Planning[J]. Aerospace Science and Technology, 2010, 14(8): 535-541.
[55] Contreras-Cruz M A, Ayala-Ramirez V, Hernandez-Belmonte U H. Mobile Robot Path Planning Using Artificial Bee Colony and Evolutionary Programming[J]. Applied Soft Computing, 2015, 30: 319-328.
[56] Xu F Y, Li H L, Pun C M, et al. A New Global Best Guided Artificial Bee Colony Algorithm with Application in Robot Path Planning[J]. Applied Soft Computing, 2020, 88: 106037.
[57] Chen Y J, Chang D K, Zhang C. Autonomous Tracking Using a Swarm of UAVs: A Constrained Multi-Agent Reinforcement Learning Approach[J]. IEEE Transactions on Vehicular Technology, 2020, 69(11): 13702-13717.
[58] Wang L, Wang K Z, Pan C H, et al. Multi-Agent Deep Reinforcement Learning-Based Trajectory Planning for Multi-UAV Assisted Mobile Edge Computing[J]. IEEE Transactions on Cognitive Communications and Networking, 2021, 7(1): 73-84.
[59] Xia Z Y, Du J, Wang J J, et al. Multi-Agent Reinforcement Learning Aided Intelligent UAV Swarm for Target Tracking[J]. IEEE Transactions on Vehicular Technology, 2022, 71(1): 931-945.
[60] Shang Z H, Mao Z Q, Zhang H C, et al. Collaborative Path Planning of Multiple Carrier-Based Aircraft Based on Multi-Agent Reinforcement Learning[C]∥23rd IEEE International Conference on Mobile Data Management (MDM), 2022: 512-517.
Perspective and Development of Brain-Inspired Swarm Navigation
Li Weibin1, 2*, Yang Donghao1, Li Zhanbin3, Hou Biao1, Jiao Licheng1
(1. Beidou Intelligent Spatial-Temporal Research Center, Xidian University, Xi’an 710075, China;
2. Hangzhou Institute of Technology, Xidian University, Hangzhou 311231, China;
3. Haomo AI Technology Co., Ltd, Beijing 100000, China)
Abstract:" In recent years, intelligent unmanned systems such as drones, autonomous vehicles, and unmanned boats have played a significant role in various fields, including military, industrial and agricultural production, and logistics transportation. However, due to the limitations in resources and capabilities of individual intelligent unmanned systems, they are unable to meet the increasingly complex demands of real-world applications. it has become a trend to organize multiple intelligent unmanned systems into clusters to achieve collaborative work and swarm intelligence, of which swarm navigation and positioning is an important basis for swarm intelligence.Traditional satellite navigation systems are inadequate to meet the application requirements of intelligent unmanned systems in complex environments. Therefore, autonomous navigation of intelligent unmanned swarm systems has become an urgent problem to solve. Inspired by the neural mechanisms and principles of animal navigation systems and collective coordination, brain-inspired swarm navigation has emerged as a promising research field. It aims to achieve efficient and intelligent navigation in complex and unknown environments, fulfilling the navigation needs of intelligent unmanned systems operating in groups. This article provides an overview of the concept and mechanisms of brain-inspired swarm navigation. It explores the spatial neural mechanisms involved in brain-inspired swarm navigation, relevant simulation models, and swarm intelligence algorithms for brain-inspired swarm decision-making. Finally, the future directions of brain-inspired swarm navigation are discussed.
Key words:" brain-inspired intelligence; swarm coordination; self navigation; swarm navigation; brain-inspired navigation