999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于海馬體的面向未知復雜環境類腦導航技術綜述

2022-12-01 12:38:24陳雨荻熊智劉建業楊闖晁麗君彭楊
兵工學報 2022年11期
關鍵詞:環境信息模型

陳雨荻, 熊智,2, 劉建業,2, 楊闖, 晁麗君, 彭楊

(1.南京航空航天大學 自動化學院 導航研究中心, 江蘇 南京 211106;2.先進飛行器導航、控制與健康管理工信部重點實驗室, 江蘇 南京 211106;3.上海航天控制技術研究所, 上海 201109)

0 引言

近年來,機器人、無人車、無人機等無人移動平臺在民用領域和軍事領域被廣泛推廣[1],在作戰領域發揮出巨大的作用。在執行任務時,無人移動平臺的自主導航和運動控制能力尤為重要,因此搭載的導航系統占據重要地位,面對未知復雜的環境,現階段的導航系統面臨著諸多挑戰,需要進一步提升智能導航能力。

眾所周知,自然界中許多動物有較強的導航本領,不需要高精度的傳感器就能在未知復雜環境中生存,通過回憶之前的經驗可較好地完成導航任務。隨著人工智能的發展,智能自主導航技術也有了諸多研究方向。類腦導航作為人工智能(AI)技術的研究方向之一,其內容涉及了腦科學和控制科學等多個交叉學科內容。現階段類腦自主導航技術的概念還未統一,其基本內涵為通過多種傳感器感知環境信息,利用具有與大腦功能相似的智能技術形成仿生的學習、記憶和認知能力,能夠融合多種信息構建認知地圖并實現智能路徑規劃和導航[2],與其他導航方式相比,類腦自主導航技術具有不依賴衛星定位、低能耗等特點,為未知復雜環境下自主導航提供了有效的技術途徑[3]。本文將介紹類腦自主導航技術的最新研究進展,沿類腦自主導航技術的研究路線,即理論方法、模型構建以及應用實現三方面構成文章組織結構,同時綜述與類腦自主導航發展相關的代表研究成果。

1 基于海馬體的類腦自主導航技術機制

大腦導航機理提供構建“類腦”模型的方法和結構。由于類腦導航技術源于哺乳動物大腦對環境的認知方式,與仿生導航技術相比,類腦導航技術不止步于模擬生物導航行為,而是深入探索產生導航行為的來源,在模型構建方面會側重深層次模擬大腦組織結構以及神經細胞活動等。哺乳動物大腦中參與環境認知和導航的組織主要為海馬體(HF),其中內嗅皮層- 海馬區空間表征機理為類腦導航系統的構建提供理論基礎,為了方便讀者理解類腦模型構建和應用,本節歸納類腦導航技術研究所需的大腦機理。

1.1 內嗅皮層- 海馬區導航信息傳遞回路

哺乳動物大腦的海馬體多個區域參與記憶、認知和導航活動[4],其組織之間的連接與類腦導航系統模塊通信方式形成映射。綜合Witter和Van的研究內容[5-6],從宏觀角度分析,參與導航的海馬體可分為齒狀回 (DG)、海馬區[7-8]、下托綜合體[9]和內嗅皮層[10]。其中,下托綜合體分為下托(Sub)、前下托(PrS)、傍下托(PaS)和后下托(PoS)。海馬區進一步細化為海馬角(CA)、CA1~CA4,CA1與CA2通常可定義為海馬區。

近年來,隨著對海馬體研究的逐漸深入,研究學者揭示了海馬體整合信息的通信路徑。外界環境信息由嗅后皮層(POR)及嗅周皮層(PER)傳入內嗅皮層,內嗅皮層分為內側內嗅皮層(MEC)和外側內嗅皮層(LEC),內嗅皮層共有Ⅵ層。內嗅皮層的第Ⅱ層將信息傳遞給齒狀回和CA3,CA3有大量的循環連接,產生了自聯想記憶的假設。外側內嗅皮層第Ⅲ層將信息主要傳送到Sub,內側內嗅皮層第Ⅲ層將信息傳遞給CA1區和Sub,CA1區和下托將信息傳回內嗅皮層的深層,由內嗅皮層深層到淺層,再到齒狀回構成一個回路[11]。圖1為海馬體結構示意圖,圖2為信息傳遞回路示意圖。

圖1 海馬體[5-6]

圖2 內嗅皮層- 海馬區信息傳遞回路[11]

1.2 空間表征細胞特性

海馬體中的空間表征細胞編碼輸入信息產生放電,其放電形態用于表征環境,由此可以根據放電特性構建模型。現階段主要研究的空間表征細胞為位置細胞、頭朝向細胞以及網格細胞。

1.2.1 位置細胞

O’keefe等在鼠腦CA3和CA1中發現了位置細胞(place cells)[12-13]。位置細胞放電活動與動物所處空間位置有很強的相關性,當大鼠處于特定位置區域時,位置細胞才會產生動作電位[14-15]。位置細胞在環境空間中產生放電的范圍稱為放電野或位置野[16],根據位置細胞對空間中特定位置產生放電這一特性構建位置細胞模型。其放電形態如圖3所示。位置細胞整合內源信息和外源信息進行位置更新[17]。由本體感受的自運動和前庭感覺信息稱為內源信息(例如角速度、速度等),基于視覺、聽覺、嗅覺等進行外界感知的稱為外源信息。

圖3 位置細胞放電[14-15]

1.2.2 頭朝向細胞

頭朝向細胞通過整合內源信息和外源信息中的角速度或者方向角度對當前方位進行估計,起到了“羅盤”的作用。頭朝向細胞主要位于鼠腦的PrS、PoS等部位[18],隨著Kyriacou等[19]進一步研究發現頭朝向細胞具有高斯分布的放電規律,當大鼠頭部指向某一特定方向時,相應頭朝向細胞會產生最大動作電位,此方向為頭朝向細胞放電的最優方向,如圖4中頭朝向細胞的最優方向為90°。

圖4 頭朝向細胞放電

1.2.3 網格細胞

網格細胞作為“路徑積分器”位于大鼠內嗅皮層的第2層中[20]。當大鼠自由活動時,網格細胞在空間位置發生重復性規律放電,放電野在空間環境中形成六邊形結構[11-21],如圖5所示。在空間環境中形成六邊形放電特征成為網格細胞模型模擬的放電特性之一。

圖5 網格細胞放電[20]

之后,Fyhn等[22]提出了網格細胞與位置細胞形成的放電野都與空間中的位置相對應的理論,在活動區域中,位置細胞模型需要對應一個特定區域產生放電,網格細胞模型可在多個區域形成放電野。在未知環境下,網格細胞快速形成六邊形放電野并保持穩定,同時將外源信息和自運動信息作為信息輸入整合運動路徑。

另外,網格細胞放電野具有的空間特征在路徑綜合過程中發揮著重要作用。網格細胞放電野具有3個空間特征,分別為網格尺度、網格方向和網格相位,如圖6所示,其中ra和rb表示不同網格尺度的放電野半徑,λa和λb表示相同網格尺度放電野之間的距離。網格尺度描述了放電野之間的距離和放電野的大小,網格方向描述放電野連線之間的傾斜程度,網格相位描述相對參考點的位置[23-26]。

圖6 網格細胞空間特征(×表示網格放電野中心點所在相位)

網格細胞的網格尺度大小與表征的空間環境范圍相關,多尺度網格細胞模型在小尺度空間(2 m×2 m)范圍有較好的表征效果,但在大尺度范圍(km及以上)的適用性較差[27],Yang等[28]提出了利用余數系統解碼多尺度網格細胞模型的方法,該方法能夠使多尺度網格細胞模型適應在較大空間范圍中對速度和方位信息的整合。

1.2.4 其他空間表征細胞

隨著對內嗅皮層- 海馬區空間表征機理的深入研究,除了位置細胞、頭朝向細胞和網格細胞,還存在其他功能的空間表征細胞。例如,邊界細胞或者稱為邊界矢量細胞以及條紋細胞和動作細胞等。

邊界細胞具有在臨近位置細胞群表征空間邊界的放電特性[29],之后Lever等[30]發現了邊界細胞具有描述空間范圍的作用。經研究發現,通過整合具有不同特性的條紋細胞可以形成六邊形網格放電野,由此為網格細胞的構建提供理論參考[31]。此外,Dolle等[32]發現大腦中還存在根據環境變化、目標方位以及任務需求產生行為決策響應的動作細胞,該研究為類腦路徑規劃方法提供了新的技術策略。

2 類腦自主導航系統結構和空間表征細胞模型

類腦自主導航系統模型作為溝通動物大腦導航機制和類腦自主導航系統工程應用的“橋梁”,其系統模型參照大腦導航機制構建,即內嗅皮層- 海馬區導航信息傳遞回路、空間表征細胞之間的信息交互方式以及空間表征細胞放電特性。類腦自主導航系統的構建由單個細胞模型開始,之后以Barrera等[33]的研究為例,開始了網格細胞和頭朝向細胞等的集成化模型研究,隨后逐漸形成較為完善的類腦自主導航系統模型框架結構。

2.1 類腦自主導航系統整體結構模型

在類腦導航系統結構研究方面,一方面可以從嗅皮層- 海馬區整體功能層面建立系統模型,例如Mhatre等[34]提出的自組織內嗅皮層- 海馬區計算架構。另一方面,可以將空間表征細胞模型作為模塊單元,然后組合模塊形成類腦自主導航系統結構,例如Edvardsen等[35]基于網格細胞、位置細胞和邊界細胞構建類腦導航系統模型,該系統中結合網格細胞的矢量導航機制以及邊界細胞和位置細胞的調節機制實現局部避障功能,并可支持復雜環境中的導航。

圖7中展示了較為全面的類腦導航系統結構,該模型由Tejera等[36]構建,在系統中外源信息(例如視覺)和自運動信息作為輸入,經過頭朝向細胞、網格細胞和位置細胞等空間表征細胞的信息整合和相互作用形成認知地圖,進而通過Actor-Critic[37]架構的強化學習獎勵機制產生運動決策行為[38]。

圖7 類腦導航系統整體結構模型[36]

2.2 空間表征細胞模型構建方法

空間表征細胞模型作為類腦導航系統的組成單元,其通過編碼運動信息模擬神經細胞放電形態,從而表征環境位置變化。現階段構建空間表征細胞模型可基于吸引子神經網絡、振蕩干涉原理和脈沖神經網絡。

2.2.1 吸引子神經網絡模型

吸引子神經網絡模型的類腦特性表現為模擬CA3區神經元儲存大腦皮層的輸入信息和記憶能力。大腦中的神經元之間的突觸的連接是可塑的,當最初放電的神經元觸發其他神經元時形成記憶的整個形態,此時網絡會趨向于一個穩定的狀態,具有唯一性、持續性、集成性和漂移校正等特性。

2.2.1.1 吸引子

基于大腦神經特性構建動力學系統,Marr等[39]最早提出了吸引子概念,動力學系統中存在一組穩定的狀態,若在輸入中施加輕微干擾則會回到這個狀態,這些穩定狀態即為吸引子,這些吸引子也作為系統中的“記憶”。吸引子被用來描述狀態隨時間變化的動力學系統的穩定性,其表示一組穩定狀態的集合。劉建業等[40]的研究中表明,當系統受到偏移或噪聲干擾時,這些代表穩定狀態的吸引子會將相鄰的狀態吸引到該狀態,從而保持系統的相對穩定性,這種穩定性體現了吸引子動力學模型與大腦神經網絡具有的相關性和一致性。基于上述特性,空間表征細胞通常基于吸引子神經網絡進行模型構建。

吸引子按結構分為點吸引子、極限環和連續吸引子等。Wu等[41]的研究證實了連續吸引子神經網絡(CANNs)可用于神經系統細胞建模。連續吸引子最簡單的結構為一維線性吸引子和環狀吸引子。線性吸引子可以表示具有最小值和最大值的變量,例如表示水平方向眼睛位置。環狀吸引子適合于表示無邊界值的變量,例如頭部方向。一維線性和環狀吸引子的二維延伸稱為平面吸引子,平面吸引子適用于表示二維變量。不同類型吸引子并不相互排斥,可以將多種類型的吸引子嵌入同一網絡中。

2.2.1.2 基于吸引子神經網絡的空間表征細胞模型

頭朝向細胞連接強度的不對稱性會使波包沿著圓環移動,波包移動的方向代表頭部的朝向,當方向不發生改變時,頭朝向細胞連接強度不會發生改變[42]。Stringer等[43]提出了頭朝向細胞的自組織連續吸引子神經網絡模型如圖8所示,每個方向偏好細胞與周圍細胞之間存在不同的連接強度,連接強度是它們偏好方向角度差的函數,興奮性連接的相互作用形成的波包代表當前的頭朝向。之后Stringer等[44]提出了基于自組織連續吸引子神經網絡的位置細胞模型。

圖8 一維環狀吸引子[43]

多層連續吸引子的頭朝向細胞模型,如圖9所示[45],多層連續吸引子模型可擴展空間的表達信息,增加對環境高度的認知,多層頭朝向細胞在連續吸引子神經網絡中的表達可表示為二維矩陣形式,模型四周為包絡連接,實現周期性表達頭部朝向和高度信息。

圖9 多層連續吸引子[45]

網格細胞模型可建立為二維環狀吸引子模型,由于大腦中細胞的活動狀態與周圍細胞的遞歸連接強度和輸入密切相關,在吸引子網格細胞模型中,每個吸引子代表的是空間環境中的某一位置,神經網絡通過吸引子的興奮和抑制信號來對整個環境進行編碼,通過連接神經面板周圍的神經元形成環狀連續吸引子模型,實現連續的周期性環境信息編碼,如圖10[46]所示。Burak等[47]提出了速度編碼的連續吸引子網絡模型,該模型可以在10~100 m,1~10 min 內準確整合速度從而更新位置。為了擴展對三維空間的認知,Yu等[45]將網格細胞模型進行擴展,形成三維連續吸引子模型,該模型可用于三維空間位置積分,如圖11所示。

圖10 二維環狀吸引子[46]

圖11 三維連續吸引子[45]

2.2.2 振蕩干涉模型

振蕩干涉模型主要用于網格細胞模型的構建,模型啟發來源于Koenig的研究報告。當大鼠探索環境時,鼠腦內嗅皮層- 海馬區結構中腦電圖表現 8~12 Hz的θ波振蕩,當大鼠運動到位置細胞放電區域時,位置細胞出現θ波振蕩,到達網格細胞放電野的位置時也出現θ波振蕩,注入利多卡因使θ振蕩減少后,內嗅皮層的網格狀放電模式消失[48]。

單細胞的振蕩干涉模型由Burgess等[49]首次提出,在該模型中,網格細胞的輸入來自于頭朝向細胞選擇的最優方向。Zilli等[50]提出了多種不同網絡作用的振蕩干涉模型,該模型由可以保持恒定頻率的基線振蕩器V0和多個有源振蕩器組成Vi,i≥1有源振蕩器的相位相對于基線振蕩器改變從而編碼位置信息。不同的速度輸入振蕩器會改變振蕩器的頻率,從而產生高于或低于基線振蕩器的頻率,因此在有源振蕩器與基線振蕩器具有相同相位的位置集中產生一組平行帶。振蕩干涉模型如圖12所示,模型中的輸入為速度信號vi,震蕩器Vi通過ωi進行內部耦合連接,網格細胞通過突觸ωi,G接受震蕩器的所有輸出,經過整合后形成網格細胞六邊形放電野。基于振蕩干涉模型構建的網格細胞模型通過參數調節可形成不同尺度和相位的網格細胞放電野[51]。Yartsev等[52]的最近的研究表明,在果蝙蝠和獼猴的內嗅海馬系統中并沒有觀測到θ波振蕩,當對θ波振蕩產生進行破壞,網格細胞放電野依然保持不變,振蕩干涉模型在細胞建模中不具有廣泛通用的生理學機制。

圖12 網格細胞振蕩干涉模型

2.2.3 脈沖神經網絡模型

(1) 脈沖神經網絡模型原理

脈沖神經網絡(SNN)通過模擬大腦中神經活動進行建模,在生物神經元中,神經元之間的通信是通過傳播動作電位序列(也稱為傳到下游神經元的脈沖序列)來完成的。突觸前神經元的活動調節突觸后神經元的膜電位,當膜電位超過閾值時產生動作電位或脈沖。脈沖產生的速率和脈沖序列的時間模式攜帶外部刺激有關信息并持續進行計算。這些單獨的脈沖在時間上很稀疏,因此每個脈沖都有很高的信息含量,并且具有均勻的幅值(100 mV,脈沖寬度約為1 ms)[53]。

(2)脈沖神經網絡模型類型和應用

脈沖神經網絡通過脈沖的精確時間或脈沖序列進行通信[54],使單個脈沖的時間信息能夠進行表達,脈沖神經元具有動態特性,即內部狀態(定義為每個神經元輸入的加權和)隨時間變化[55-57],圖13所示為前饋脈沖神經網絡模型。

圖13 前饋脈沖神經網絡模型

生物神經元使用離散的脈沖來計算和傳輸信息,并且除了脈沖發放率外,脈沖時間也含有重要信息,由此脈沖神經網絡更加貼近了生物神經元信息傳遞形式。脈沖神經網絡中的信息是通過脈沖時序傳達,包括延遲和脈沖速率,也可以通過群體進行信息表達,因此脈沖網絡具有對生物神經系統中信息傳輸時間敏感的優勢,這使脈沖神經網絡在生物學上更具有生理學特性,對了解大腦的計算方式有很大研究價值。研究表明,每個脈沖的精確時序在神經編碼中起著重要的作用[58]。精確的脈沖時序作為感覺信息處理區域[59]和大腦運動控制[60-61]的重要編碼信息。

Hodgkin等根據烏賊軸突的細胞膜中離子通道的電壓門控特性首次建立了脈沖神經網絡模型—HH模型[62],該模型中描述了大量生物細節,計算量較大,隨后人們提出了多種神經元模型,例如脈沖響應模型[63]、Izhikevich神經元模型[64]、以及帶泄漏的積分觸發(LIF)模型[65]。LIF模型直觀描述了外部輸入信息,具有計算簡單等特點[66]。Lorenz等[67]將CA3中的位置細胞建模為LIF模型,該模型能有效對目標位置進行表征并形成放電野。Tang等[68]基于SNN模型構建多種空間表征細胞用于機器人導航控制系統。德國開姆尼茨工業大學Fred Hamker教授團隊[67]基于SNN構建位置細胞序列模型建立基于地圖的面向目標導航系統。

基于時序的脈沖序列含有大量有效信息可以減少能量消耗,可用于制造低能耗硬件設備。脈沖神經網絡的學習通過調整突觸權重實現,脈沖神經網絡基于神經啟發機制的學習規則并不能直接復制非脈沖形式,神經科學家定義這種學習規則及其變化規則為STDP(spike-timing-dependent plasticity)。通常STDP作為無監督學習機制,是一個時序非對稱形式的Hebb學習法則,與突觸前和突觸后神經元峰值之間的時間間隔密切相關。如果突觸前神經元在突觸后神經元之前不久觸發(大約10 ms),則連接它們的權重會增加。如果突觸前神經元在突觸后神經元后不久觸發,則時間事件之間的因果關系是虛假的,權重會減弱。突觸前脈沖在突觸后脈沖前幾毫秒內到達稱為LTP (long-term potentiation),反之為LTD (long-term depression)。隨著技術發展,神經科學家研究在脈沖神經網絡下進行強化學習,特別提出調節獎勵STDP (reward-modulated STDP, RM-STDP),由此,SNN可以在設計的全局獎勵信息下得到一個最優決策[69],目前SNN模型在準確性方面還有一些不足,但性能隨著研究的進步正在逐步提升。

3 面向未知復雜環境的類腦SLAM及路徑規劃技術應用

在未知復雜環境中實現自主導航需要在沒有預設路線的前提下了解實際的環境信息,同步地圖構建和定位(SLAM)[70]同時解決環境感知與定位這兩個問題,是智能系統在未知復雜環境下進行自主導航的關鍵技術。傳統的視覺SLAM在定位和制圖精度上可以滿足簡單的應用場景需求,其搭載的視覺傳感器在獲取信息的過程中易受光照變化、環境圖像紋理和快速運動等因素影響,以上影響因素對特征點的提取與匹配造成干擾,使其復雜環境的適用性較低。盡管研究人員開發的尺度不變特征變換[71](SIFT)算法使系統適應光照及圖形形變帶來的影響,提高了在復雜環境中的適用性,但效率較低,難以滿足實時定位與建圖需求。

通常情況下,環境感知信息存在噪聲和誤差,因此還需要進行優化處理,傳統SLAM技術多數基于概率模型進行優化估計,其主要原理為:將當前采集到的環境數據通過數學模型處理傳感器與環境的模糊性,其中較為常用的算法有卡爾曼濾波[72]算法、粒子濾波[73]算法、最大似然估計等。上述模型基于概率模型進行優化和估計,其準確性與可靠性依賴于建立精確的數學模型,而在未知復雜環境中難以構建精確數學模型,這使導航系統的適應性較差。

路徑規劃同樣需要構建環境數學模型,隨后利用搜索算法進行最優路徑規劃。常用環境建模方法主要有:柵格法、可視圖法、維諾圖法等,路徑搜索算法有A*[74-75]算法、Dijkstra算法[76-77]、人工勢場法[78-80]等。當面臨復雜的大范圍任務環境時,傳統路徑規劃算法出現了搜索速度慢、尋優能力差等問題。仿生的群智能路徑規劃算法克服了傳統路徑規劃算法的部分缺點,具有很好的魯棒性,其路徑規劃速度也有所提升。現階段仿生的群智能算法有蟻群算法[81-83]、遺傳算法[84-86]、粒子群優化算法[87-88]等。仿生的群智能路徑規劃算法主要思想是將路徑規劃問題轉化為最優搜索問題,然而仿生的群智能算法存在實時性較差,計算量大,全局搜索能力較弱等問題,其在路徑搜索的快速性、可靠性方面依然需要進一步提升[89]。

經過生物學研究發現,哺乳動物具有構建認知地圖和運動決策的能力,因此類腦SLAM和類腦路徑規劃具有解決實時性差、需要精確建模以及計算量大等問題。

3.1 類腦同步空間地圖構建與定位

自然界中的生物不具備高精度傳感器也可以在長途復雜環境中尋找食物并在找到食物后以捷徑回巢[90],同時在缺乏部分信息源時也能依靠經驗信息進行導航。1948年,Tolman等[91]發現在迷宮實驗中的老鼠能夠迅速地找到通往食物的捷徑,并且當熟悉路徑被阻擋后能夠找到新的路徑,由此猜想,哺乳動物通過在大腦中構建地圖來進行空間認知與導航。

Tolman[92]提出了認知地圖的概念,認知地圖是通過各種形式對環境進行的智力描述,動物對外界環境的學習,并不是把起始點到目標點的路徑信息進行簡單的搜集,而是對外界環境生成一種內部的抽象描述。認知地圖是動物對環境信息進行收集、組織、貯存、回憶、并對其空間方位和特征屬性加以編碼的產物。其建立在直覺和本能的基礎上進行編碼、解碼、學習和理解。

在未知復雜環境中進行導航時,先在認知地圖中鎖定目標的大致的范圍,然后憑借對目標形象的理解鎖定小范圍內的目標。認知地圖的構建主要依靠于海馬體各區域內的空間表征細胞,通過對外源信息和內源信息進行整合以及空間表征細胞之間的相互作用最終形成認知地圖,實現外部環境在大腦內的神經重現。研究學者受生物導航能力啟發,研究基于生物大腦導航機理啟發的SLAM系統,進而提升整體地圖構建與定位性能,環境地圖構建的主要形式有度量地圖、拓撲地圖及混合地圖[93]。

3.1.1 基于單一種類細胞模型的地圖構建

如前文所述,位置細胞和網格細胞具有表征位置信息能力,因此構建單一種類空間表征細胞模型可以得到路徑位置信息和認知地圖,同時也為形成更加完善的類腦自主導航系統提供基礎。Jacobson等[94]提出基于位置細胞模型的多尺度建圖系統,利用位置細胞模型將相機、WiFi和氣壓高度計信息進行編碼,由不同尺度位置細胞構建路徑地圖。南洋理工大學Datta等[95]研究了一種在線快速學習的地圖構建技術,該技術利用視覺信息作為位置細胞模型輸入,通過位置細胞模型解算得出實時位置信息并構建路徑地圖。Barboni教授研究團隊[96]基于網格細胞脈沖放電形式構建模型并用于機器人平臺驗證,該機器人具有大鼠自由探索環境的行為特征并向中心系統報告位置信息,從而構成生物啟發的認知地圖,具有一定的智能行為。

3.1.2 基于多種類細胞模型聯合的地圖構建

隨著對單一種類細胞模型的有效研究,逐漸形成基于多種空間表征細胞模型的類腦SLAM系統。通過不同種類空間表征細胞模型之間的信息交互,其系統表現出更加卓越的性能。美國羅格斯大學的Tang等[97]利用大腦導航機理構建一個實時SLAM系統,該系統由位置細胞、網格細胞、頭部方向細胞和邊界細胞組成。該系統基于SNN網絡構建空間表征細胞模型,在SNN中利用勝者為王學習規則構造位置細胞模型,引入異種突觸競爭學習塑造網格細胞和位置細胞之間的突觸連接。同時將系統集成到Loihi芯片中,該系統在未知環境下構建地圖的實時性是傳統方法的12倍。

昆士蘭科技大學Ball教授團隊[98]對基于嚙齒動物大腦中導航神經計算機理的RatSLAM系統進行建模,該系統將純視覺信息作為輸入,用連續吸引子網絡來建立細胞模型,利用經驗來建立未知定位可能假設,使其在感知信息缺失的情況下也能正常工作,通過跑車試驗驗證了系統的可靠性。在前面的研究基礎上,Milford教授團隊繼續研究,提出基于三維網格細胞和多層頭朝向細胞吸引子神經網絡模型的四自由度SLAM系統,如圖14所示。系統模擬哺乳動物利用視覺對環境的感知,擴展網格細胞與頭朝向細胞維度,利用視覺里程計數據激發三維網格細胞和多層頭朝向細胞活性,將采集的視覺信息與預先儲存的視覺模板進行匹配,當處于熟悉場景時局部場景細胞被激活,將活性輸入到頭朝向細胞和網格細胞模型中進行校準,通過路徑積分形成拓撲地圖,實現對三維空間的認知以及通過熟悉場景標定所在位置的功能[45]。

圖14 三維四自由度SLAM[45]

復旦大學Zeng等[99]提出基于空間記憶系統的視覺信息和自運動信息融合的貝葉斯吸引子網絡模型的SLAM系統,如圖15所示。該網絡模型由兩個子網絡模型組成,分別為頭朝向細胞網絡和網格細胞網絡,子網絡分別對應哺乳動物大腦頭朝向細胞和網格細胞的神經編碼形式,其中頭朝向細胞用于角度編碼,網格細胞用于位置信息編碼,分別表示方向和位置信息。將來自前庭的自運動信息輸入到每個子網絡中,通過細胞群編碼進行整合以及視覺信息進行校正,并基于貝葉斯方法進行更新,成功構建半度量半拓撲地圖,該系統在不同環境特征條件下均具有自主性。

圖15 基于貝葉斯吸引子網絡SLAM系統[99]

3.2 類腦路徑規劃

路徑規劃作為自主導航技術中的另一核心技術,需考慮路徑形成過程中的多方面因素,如路徑行程距離、避免與障礙物碰撞以及任務執行效率等。隨著人工智能技術的飛速發展,路徑規劃也應用更加智能的技術。無人移動平臺通過推斷任務目標和位置之間矢量信息產生路徑,該路徑的產生具有不確定性,隨后可由類腦算法選擇捷徑行走到任務目標區域。

3.2.1 基于單一種類細胞模型的類腦路徑規劃

由于SNN具有更好的神經放電形態模擬特性,中國、美國和日本等國家的科研單位和高校對基于SNN的空間表征細胞模型在路徑規劃和導航控制應用方面具有了一些研究進展和成果。日本東京都立大學Naghizadeh等[100]開發基于SNN的動態在線路徑規劃模型,該模型模擬神經元(某種空間表征細胞)信息傳遞方式,具有較好的規避障礙能力,并在不可預測的旅行成本下應用。該模型可用于機器人在崎嶇地形上的路徑規劃,系統設計如圖16所示[100]。第1步,使用Kinect傳感器生成地圖的結構,并通過無線通信將其發送給所提出的系統。第2和第3步,執行規劃的路徑,前向傳遞構造神經元連接以尋找可能的路徑,后向傳遞用突觸修剪模型可減少獲得當前位置到目標位置最佳路徑的神經網絡中的無效神經元。為了應對不可預測的障礙物,執行有效的動態規劃,其處理機制為起始點神經元首先向相鄰神經元發出信號,計算突觸權重值。當信號觸發目標神經元后,傳輸過程停止,然后優化突觸數目和處理反向信號。第4步,通過藍牙通信將最佳路徑發送給機器人,進行第5步執行命令產生相應動作,最后,機器人移動并更新當前位置,該方法令機器人在未知環境中更加高效地規劃移動路徑并靈活躲避障礙物。

圖16 基于神經元活動在線動態路徑規劃模型[100]

美國Naghizadeh教授研究團隊[101]提出一種網格細胞導航模型,該計算模型通過調整細胞之間的權重構建導航決策過程,提供機器人在未知環境以及未知目標位置環境下通用的路徑搜索方案,減少了訪問先驗狀態隨機游走的可能性,可在合理速度情況下實現相對更小能量消耗的有效路徑規劃,通過與相近的方法進行比較,該方法具有更高效的速度處理能力,同時運算占據更小的內存。

在已知環境活動的嚙齒動物能夠在觀察到目標位置后,快速規劃面向目標導向的軌跡。大腦中CA3區在面向目標導航過程中起到關鍵作用,其主要特征表現為位置細胞對特定環境的放電行為。由此,如何通過構建位置細胞模型模擬生物在熟悉環境中的面向目標快速導航行為成為研究重點。Dane等[102]將位置細胞建模為吸引子神經網絡模型,將障礙物位置、墻體位置等空間環境編碼生成序列,之后利用馬爾可夫決策過程對位置序列按照離目標距離較近進行較大獎勵,進而實現空間任意位置到達目標位置的路線規劃。德國Lorenz教授研究團隊[67]提出了一個位置細胞序列模型,將大腦DG中的神經細胞和CA3中的位置細胞建模為LIF模型的脈沖神經網絡,通過基于獎勵機制的目標學習過程生成位置細胞表征的位置序列,并且在形成的位置序列中指導空間活動行為,該模型能夠模擬大鼠在決策任務中的行為。上述兩種研究中的位置細胞模型雖然不同,但中心思想都是通過構建位置序列并給予目標位置最大獎勵產生最佳決策和面向目標的導航路徑。

3.2.2 基于多種類細胞模型聯合的類腦路徑規劃

位置細胞模型作為類腦導航系統中的重要模塊,能夠模擬生物導航過程中的某些方式,但對于類腦導航系統依然存在很多的性能提升空間,由此研究學者開展進一步研究,細化空間表征細胞的功能,增強模型單元之間的信息交互能力,在未知環境中路徑規劃、避障等展現更優越的性能,同時與構建類腦認知地圖相結合,在路徑規劃的同時對環境形成一定的認知。Dolle等[32]提出由位置細胞、標定細胞、動作細胞等空間表征細胞模型組成的系統結構,該計算模型具有過程線索導航和路徑規劃轉換機制,動作細胞能夠在基于程序性或者認知性這兩種學習機制下進行導航策略選擇,同樣可以在環境變化的條件下選擇最優行動路徑。Cuperlier等[103]依賴海馬體解剖結構之間的相互作用機理構建導航和路徑規劃模型。通過位置細胞和CA之間的聯系機理構建過渡細胞模型,過渡細胞模型能夠減少路徑規劃中對位置細胞的依賴,可以通過學習后建立分段認知地圖,之后利用Bellman-Ford algorithm算法進行路徑選擇。美國羅格斯大學Tang等[68]基于SNN構建由網格細胞、頭朝向細胞、位置細胞、邊界細胞等多種空間表征細胞模型組成的導航控制系統,其構建的系統模型在“Gridbot”機器人中進行驗證,實驗表明該神經網絡能使“Gridbot”機器人在最少的學習條件下就可以自己繪制環境地圖并學習不同目標的位置,可以像靈長類動物那樣,對環境進行有效的探索和反應。Huang等[104]同樣基于SNN構建網格細胞模型,該模型能夠在視覺消失的情況下,在短時間內保持對空間的方向定位,同時在模型中加入一個簡單的決策網絡控制平臺使機器人能夠執行覓食和規避風險等基本任務。

在認知地圖的基礎上執行面向目標導航、探索最優路徑等任務能更加有效地認知未知環境并提升路徑規劃效率。Erdem等[51]提出了一種基于頭向細胞、網格細胞、位置細胞和額前皮質(PFC)細胞等空間表征細胞模型組成的面向目標導航系統。在未知環境下,系統模擬大鼠隨機探索環境過程,逐步創建由位置細胞和PFC細胞組成的地圖。在模擬的大鼠探索完成后,系統對位置可形成記憶并快速篩選候選方向進行軌跡的前向線性預先探測,將激活PFC細胞獎勵最大的方向作為下一動作的運動方向。日本Chin等[105]基于大腦細胞神經活動提出了動態的路徑規劃模型,在模型中利用貝葉斯自適應共振聯想記憶算法壓縮數據提高拓撲地圖的生成效率,同時在拓撲地圖的生成過程中不需要有關環境的先驗知識,此過程可以對未知環境有效進行探索;路徑規劃器根據拓撲地圖信息生成最優路徑,此外還可以從最優路徑中減除無效節點,進一步提高最優路徑生成效率。Shim等[106]提出了方向驅動的類腦導航系統,該系統由認知地圖構建、基于網格化的方向規劃和多層不對稱局部導航3部分組成,通過在認知地圖中提取方向,能更快速并有效地從給定目標方向移動到目標所在位置。

我國在類腦路徑規劃方面同樣進行了研究,并在機器人等平臺上進行了結果驗證。北京科技大學于乃功教授團隊[107]基于吸引子神經網絡構建類腦SLAM認知地圖,在所構建精準的認知地圖基礎上采用全局導航和局部導航算法實現機器人的導航。全局導航通過構建的認知地圖所呈現的最近路線面向目標進行導航,局部導航算法對多組可能路線進行評估之后,選擇最優軌跡對應的速度驅動機器人運動。機器人在全局導航形式下向目標點移動,同時當前的最優路徑由局部導航算法進行選擇,在面向目標進行導航的過程中機器人可以避開障礙物規劃路徑,并在一定范圍內返回到先前的導航路徑。

4 展望

隨著腦科學的快速發展,導航、制導與控制和神經科學這兩個學科之間也在快速地交融發展。雖然在類腦導航模型、類腦SLAM以及類腦路徑規劃等研究方向有了一定的研究成果,但實現較強的環境認知和適應能力,提高在空間環境中的導航精度還需要開展許多的研究工作。類腦自主導航技術的研究重點和發展方向有以下幾個方面:

1)在類腦理論研究層面,探究空間表征細胞在智能導航行為過程中的協作機理。

生物大腦中海馬區與內嗅皮層之間構成的信息傳遞通路為機器人、無人機等無人移動平臺提供環境認知、情景學習與自主導航的理論方法。大腦對未知復雜環境進行認知與記憶是一個復雜的細胞放電活動,空間表征細胞放電活動與多種感官信息相關,但目前對神經信息傳遞機理的理解并不完善,需要隨大腦機理的深入研究而升級為更加智能的導航系統。

2)研究空間表征細胞交互連接方法,為類腦導航定位、地圖構建、路徑規劃技術研究提供更加完善的類腦導航系統。

海馬體中參與環境認知與導航的空間表征細胞主要為位置細胞、頭朝向細胞和網格細胞。在環境的探索過程中,空間表征細胞通過學習改變相互之間的突觸連接,從而形成特定的環境認知記憶回路。為了能更好地學習環境,需要尋找最優突觸訓練方法,增強空間表征細胞的感知和相互作用能力,因此應繼續探索與完善空間表征細胞交互連接模型,為后續SLAM、路徑規劃及運動控制技術研究提供模型基礎。

3)研究多源感知信息融合的類腦自主導航技術。

構建認知地圖作為動物對未知環境進行認知的重要途徑。在構建認知地圖的過程中,視覺是重要的信息來源之一,成為人等哺乳動物感知和認知環境的重要方式,在黑暗或弱光環境中,動物通過多種感官信息以及空間表征細胞的相互作用探索環境,具有較好的環境適應能力以及導航能力。因此結合傳統導航信息融合方法,開展視覺、慣性導航和衛星導航等多源信息融合的類腦導航系統研究是目前的熱點研究方向。

4)研究類腦認知、導航和決策一體化的類腦導航系統。

類腦路徑規劃/運動決策基于大腦伏隔核中的動作細胞、多巴胺神經元的預測獎勵機制,通過已經構建的認知地圖確定前進的方向和速度。現階段通過構建動作細胞模型模擬大腦路徑規劃方向的研究還需要進一步完善,該方向的研究為未來形成類腦認知、導航和決策一體化的導航系統奠定了基礎。

5) 研究面向三維空間環境的六自由度導航信息輸出的類腦導航系統。

類腦自主導航的研究還處于發展階段,基于神經科學的三維空間信息整合機理尚未統一,由此在“類腦”理論層面上缺少經過生物學實驗驗證的三維模型參考。在類腦自主導航的工程應用方面,目前多以機器人為應用研究對象,已有的研究成果主要為平面空間面向目標的矢量導航研究。無人移動平臺在進行環境探索或者面向目標進行導航過程中所構建的地圖也多為二維平面地圖,從模型中獲得的導航參數為二維位置信息和方向信息,缺少俯仰角、滾轉角等導航參數,因此在對無人機進行姿態控制的過程中會存在一定的局限,亟需進行三維空間類腦導航技術研究。

5 結論

本文沿著類腦自主導航技術的研究路線進行了總體闡述,歸納了內嗅皮層- 海馬區中的傳遞方式以及空間表征細胞模型的放電特性;分析了基于內嗅皮層- 海馬區信息傳遞通路以及類腦導航系統結構的模塊組成和作用,分類總結通過模擬神經元放電形態和空間表征細胞放電特性構建空間表征細胞模型的方法;重點分析了基于空間表征細胞模型在類腦導航系統中的作用以及類腦SLAM和類腦路徑規劃技術的發展和應用。最后,本文提出類腦自主導航技術未來的研究展望。

通過分析現階段國內外開展的類腦自主導航研究的現狀,類腦自主導航技術有著廣闊的發展和應用前景,腦科學的發展與類腦自主導航技術的發展互為輔助,生物大腦作為一個復雜的中樞控制系統,目前對大腦的研究還不夠全面,這也是制約類腦自主導航技術理論和模型構建的主要因素之一,與此同時,類腦算法也需要性能提升。另外。類腦芯片的研發與類腦自主導航技術的工程實現息息相關,隨著腦科學和類腦芯片的快速發展,類腦自主導航系統相關研究技術有望取得更大的突破。

猜你喜歡
環境信息模型
一半模型
長期鍛煉創造體內抑癌環境
一種用于自主學習的虛擬仿真環境
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
孕期遠離容易致畸的環境
環境
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
3D打印中的模型分割與打包
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 五月婷婷亚洲综合| 欧美国产日韩一区二区三区精品影视| 噜噜噜久久| 精品国产电影久久九九| 亚洲动漫h| 亚洲看片网| 亚洲成人动漫在线观看| 欧美午夜在线播放| 一级毛片在线直接观看| 国产无遮挡裸体免费视频| 国产理论一区| 国产无码精品在线| 小13箩利洗澡无码视频免费网站| 中文无码毛片又爽又刺激| 91丝袜美腿高跟国产极品老师| 欧美狠狠干| 精品国产aⅴ一区二区三区| 国产微拍一区| 福利视频99| 亚洲欧美另类专区| 精品久久国产综合精麻豆| 国产噜噜噜视频在线观看| 国产人前露出系列视频| 国产在线观看成人91| 黄色网页在线观看| 中文字幕精品一区二区三区视频| 国产网友愉拍精品| 久久精品国产电影| 在线观看免费国产| 无码视频国产精品一区二区| 九九热这里只有国产精品| 2018日日摸夜夜添狠狠躁| 操美女免费网站| 国产美女在线观看| 日日拍夜夜嗷嗷叫国产| 国产xx在线观看| 精品亚洲国产成人AV| 亚洲精品无码不卡在线播放| 四虎国产永久在线观看| 在线国产毛片手机小视频| 亚洲欧洲天堂色AV| 97综合久久| 日韩免费毛片视频| 国产成人a毛片在线| 日本五区在线不卡精品| 色吊丝av中文字幕| 国产国语一级毛片在线视频| 91原创视频在线| 亚洲无码精品在线播放| 麻豆精品在线视频| 992Tv视频国产精品| 亚洲国产第一区二区香蕉| 天天摸天天操免费播放小视频| 天天综合色天天综合网| 伊人福利视频| 日韩a级片视频| 亚洲黄网视频| 国产激爽爽爽大片在线观看| 午夜精品久久久久久久无码软件 | 最新痴汉在线无码AV| 国产亚洲美日韩AV中文字幕无码成人| 99re视频在线| 色精品视频| 久久综合伊人 六十路| 国内精自视频品线一二区| 四虎成人精品| 国产香蕉97碰碰视频VA碰碰看| 91精品国产综合久久香蕉922| 国产成人综合在线观看| 国产一区二区三区在线精品专区| 亚洲最新地址| 欧美视频在线播放观看免费福利资源 | 国产91高清视频| 亚洲成a人片| 国产一级精品毛片基地| 国产高清精品在线91| 国产剧情国内精品原创| 无码福利视频| 国产成人精品视频一区视频二区| 国产网站免费看| 国产自产视频一区二区三区| a级毛片免费网站|