999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于海馬體位置細胞的認知地圖構建與導航

2021-04-24 12:33:50阮曉鋼張曉平
自動化學報 2021年3期
關鍵詞:環境實驗

阮曉鋼 柴 潔 武 悅 張曉平 黃 靜

環境認知和導航是智能移動機器人必備的技能[1-2].人和動物可以在復雜環境中進行環境認知和導航,如覓食、歸巢等[3],而目前移動機器人的認知和導航能力不足以達到動物的水平,因此,模擬動物的神經結構和認知機制,使機器人更加智能地進行環境認知和導航得到了越來越多的關注[4-7].一方面,用數學模型或人工智能算法輔助傳統神經科學研究來驗證大腦運作的多種假設理論,可以促進我們對動物環境認知心理和導航行為的理解;另一方面,動物的環境認知和導航機制為開發機器人的類腦空間認知模型提供了一個很好的視角,可以幫助我們設計和構造像動物一樣進行自主環境認知的智能移動機器人[8-10].

嚙齒類動物出色的導航能力,其原因長期以來假設為是內部神經空間的類地圖的表達,也就是環境認知地圖.美國行為心理學家Tolman[11]發現老鼠能在沒有強化因素的情況下自由探索并學會迷宮的布局,初次提出認知地圖(Cognitive map) 的概念,認為老鼠能利用對空間環境的內在表達進行環境的認知與記憶.之后,O'keefe 等[12]發現,當老鼠處于某一特定位置時,大腦海馬體中有若干個神經細胞會一直處于活躍狀態;而當其從這一位置離開,其他神經細胞則會變得活躍,這些細胞稱為位置細胞(Place cells).位置細胞實時編碼老鼠在環境中的位置信息,從而在老鼠大腦內部產生一個對其所在空間環境的拓撲表達,提供了以非自我為中心的認知地圖(Allocentric cognitive map)[13].研究表明,在海馬CA3 區域的位置細胞能形成對環境的獨立表征[14].此外,海馬體能夠存儲大量的場景,并在相同場景出現的時候進行場景復現,從而指導人或動物的導航行為.

從老鼠環境認知的機制中獲得啟發,研究人員通過對老鼠大腦認知機理進行建模,進一步探究動物的環境認知機理,并用于指導機器人環境認知與導航[15-16].Tolman 經典迷宮實驗,包括T 巷迷宮實驗(T-alley maze)、T 高架迷宮實驗(T-elevated maze)、放射迷宮實驗(Radial maze)、老鼠繞道實驗(Tolman detour task)等,是對老鼠環境認知行為的探討.其中,繞道實驗(Detour task)用于研究不同的認知技能,如洞察力(Insight)、抑制控制(Inhibitory control)、路徑規劃(Route planning)等[17],其特點在于,更近的目標會產生更強的吸引力,使動物在遇到障礙物時很難擺脫認為的最短路徑而進行繞道.構建老鼠大腦的數學模型或神經網絡模型,用機器人對老鼠繞道實驗進行再現得到了各國研究者們的關注[18].Schmajuk 等[19]提出可以存儲空間位置和時間事件連接的遞歸聯結網絡(Recurrent associative networks)來構建空間和時間認知地圖,能在Tolman 繞道實驗中通過選擇正確的子目標最終到達目標點,但其沒有給出認知地圖的形成過程與形象展示.Martinet 等[20]建立了一個可以為空間學習和行動規劃提供分布式信息的前額皮質網絡模型,展示了前額皮質柱能夠從冗余的海馬輸入中學習到稀疏的拓撲-度量表示,再現Tolman 繞道實驗并說明老鼠的認知洞察能力得益于老鼠大腦神經機制.Gao 等[21]提出了一種基于基底神經節的運動學習模型,從基底神經節中強化學習的動作-評價機制著手再現了Tolman 迷宮繞道實驗,但并未涉及認知地圖的形成機制.

2011 年,Alvernhe 等[22]用電生理學方式對Tolman 繞道實驗中的局部重映射進行研究,認為位置細胞的局部重映射反映了迷宮局部結構的更新,使得老鼠在遇到熟悉的道路被阻斷或被阻斷的道路重新連通等情況時可以選擇最優路徑.此外,自組織圖被認為是最接近人腦或生物神經系統的模型,其表現出了神經細胞群的拓撲特征映射關系,這與海馬體位置細胞放電的機理非常相似.動態增長的自組織圖可以在不需要預先指定其大小的情況下進行拓撲映射,具有較好的環境映射效果[23-24].

基于此,本文結合位置細胞和自組織圖的特性,建立動態增減位置細胞認知地圖模型 (Dynamic growing and pruning place cells-based cognitive map model,DGP-PCCMM),該模型使機器人通過與環境的交互激活可達點的位置細胞,構建并更新位置細胞認知地圖;以構建的認知地圖作為輸入,運用位置細胞序列規劃算法,進行機器人實時導航.本文的認知地圖構建方法具有以下優點:1) 具有類腦仿生特性與一定的生物合理性;2) 能夠適應動態環境(如門的開閉);3) 能夠降低建圖的復雜性.實驗結果表明,DGP-PCCMM 能動態構建和更新認知地圖,能初步完成對Tolman 老鼠繞道實驗的再現,體現了其自組織與自學習特性.此外,本文進行了與柵格地圖、動態窗口法的對比實驗和與其他認知地圖模型的討論分析.結果表明,本文方法在所構建地圖的簡潔性、完整性和對環境中動態障礙適應性方面更有優勢.

1 位置細胞認知地圖模型

1.1 DGP-PCCMM 的“感知 — 響應”結構

DGP-PCCMM 具有如圖1 所示類似自組織圖的“感知—響應”結構,由感知層和響應層組成,或稱由感知輸入層和海馬體位置細胞認知地圖形成層組成.感知輸入層VI中的點如同機體感受器,從外部環境中獲得機器人的位置信息、場景圖像、障礙物信息等;海馬體位置細胞認知地圖形成層VO,如同老鼠大腦皮質中海馬記憶區,用來形成位置細胞認知地圖.VO層中的每個節點對應不同位置點處激活的位置細胞,節點之間的連線對應于位置細胞之間的連接關系.機器人在環境中的某個特定位置處,都有對應的獲勝位置細胞激活,同時,該獲勝位置細胞還記憶了場景圖像信息,以便在下次經過時進行有效識別.

圖1 DGP-PCCMM 的“感知—響應”框架Fig.1 The“sense-response”structure of DGP-PCCMM

位置細胞認知地圖形成過程中會涉及到一些相關概念,在此提前進行說明如下,并繪制其之間連接關系圖如圖2 所示.

圖2 各概念及其之間相互關系Fig.2 Concepts and their associations

1) 認知地圖形成層中的神經元不同于位置細胞.機器人每經過一個位置x,都會對應一個能使認知層神經元輸出最大的神經元vi(x),vi(x)便是感知層輸入x的獲勝神經元;獲勝神經元會對應一個前饋聯結權值wj,wj即為對應輸入x的激活的位置細胞.

2) 前饋聯結關系矩陣等價于位置細胞矩陣,都用W表示,記錄N個激活的位置細胞的位置信息.

3) 連接關系矩陣E記錄各位置細胞之間的連通性,在位置細胞增長過程中形成,并能通過動態縮減機制更新.

4) 位置細胞矩陣W和連接關系矩陣E共同組成位置細胞認知地圖G.

1.2 構建動態增長的認知地圖

為體現機器人與環境交互過程中位置細胞動態增長的特性,基于上述“感知—響應”框架,首先構建以位置細胞為頂點,以位置細胞之間連接關系為邊的動態增長認知地圖,其構建步驟如下.

動態增長認知地圖構建流程如圖3 所示.

認知地圖與人工神經網絡類似,是一個由輸入空間到輸出空間的映射,即由環境感知到認知地圖的映射.模型中,由前饋突觸權重向量構成的集合構成映像輸出空間的節點,即獲得位置細胞矩陣W;并能在此過程中獲得位置細胞鄰接矩陣E;從而獲得認知地圖G={W,E}.

圖3 動態增長認知地圖構建流程圖Fig.3 The flow chart of dynamic growing cognitive map

1.3 認知地圖的動態縮減機制

為使認知地圖模型能夠適應動態環境,即在遇到動態障礙物時能動態更新認知地圖,我們設計了認知地圖的動態縮減機制.此處的動態障礙物是指,在初次訪問某位置時不存在,而在第2 次訪問相同位置時出現的障礙物.認知地圖動態縮減機制的基本原則是:機器人在導航過程中檢測到動態障礙物時,將當前位置細胞與即將到達的位置細胞之間的連接關系變為 0,認為兩者之間的距離變為無窮大,并對認知地圖的連接關系矩陣E進行實時縮減與更新.之后調整機器人位姿至可行方向,應用第2節介紹的位置細胞序列規劃算法重新進行序列規劃,并指導機器人導航.值得一提的是,由于機器人探測到障礙物時只能觀察到距離障礙物表面的距離,并不能得知障礙物的厚度信息,故不能刪除即將到達的位置細胞,而只是將其之間的連接關系變為0.

2 基于認知地圖的導航

基于位置細胞認知地圖的移動機器人路徑規劃與導航,可分為三大部分內容:定位、構圖和決策.當給定一個導航任務后,首先對機器人當前位置進行定位;其次,將感知輸入層得到的機器人位置信息輸入到認知地圖形成層,根據DGP-PCCMM 進行認知地圖的構建和更新;接著,利用位置細胞序列規劃算法進行行為決策,指導機器人導航.機器人每行進一步,判斷是否到達目標場景,如果到達目標,則機器人對認知地圖及場景信息進行記憶,導航結束;如果沒到達目標,則重新對當前位置和目標位置進行定位,根據認知地圖進行行為決策,直至到達目標點,結束導航.機器人導航框圖如圖4所示,本文主要研究獲得精確定位信息后的認知地圖構建和行為決策部分的內容,用粗虛線框表示.

為實現基于認知地圖的路徑規劃與導航,提出位置細胞序列規劃算法.從動物導航有目標取向性獲得啟發,定義導航中的負取向函數為當前位置細胞經相鄰位置細胞到目標點位置細胞的能量消耗.所經過的路徑越長,能量消耗越多,負取向函數值越大.因此在導航時,選擇負取向函數值最小的相鄰位置細胞作為下一步的運動方向.機器人每到達一個位置,對應一個位置細胞激活,計算一次負取向函數,獲得機器人下一步的運動方向,行進一個步長后更新當前位置細胞并將其加入導航路徑,如此迭代直到到達目標點位置細胞,最終可以獲得從起始點位置細胞到目標點位置細胞的位置細胞序列P,從而實現導航.算法流程圖如圖5 所示.

3 仿真實驗

圖4 機器人導航框圖Fig.4 The diagram of robot navigation

圖5 位置細胞序列規劃算法Fig.5 The sequence planning algorithm of place cells

檢驗機器人是否具有智能的一個方法是令其完成與動物相類似的任務,例如用機器人再現老鼠實驗.老鼠的繞道取食行為使其能適應環境的變化,提高其存活的幾率,且這種繞道取食行為是由后天學習獲得.認知模型結果與動物實驗結果的契合度對比是評價、判斷和比較認知模型的最廣泛的方法[25].本文研究了能動態增減的位置細胞認知地圖模型 DGP-PCCMM.為驗證該學習模型的正確性,本文對Tolman 老鼠迷宮中的繞道實驗進行再現,首先對繞道實驗進行介紹,之后介紹機器人再現繞道實驗仿真環境的設計,最后給出實驗結果.

3.1 Tolman 老鼠繞道實驗

1930 年,Tolman 設計了三迷宮實驗用于研究老鼠的繞道行為智能;1964 年,Maier 團隊將Tolman 實驗進行簡化,本文采用簡化后的Tolman 迷宮環境[26],如圖6 所示.Tolman 老鼠繞道實驗分為兩個階段,環境探索階段和覓食導航階段.在環境探索階段,通過分別在離三叉路口不遠的地方設置障礙來迫使老鼠從三條不同路徑中選擇一條來達到目標,最短路徑和中間路徑共享一個在最長路徑中沒有的公共路徑.在覓食導航階段,老鼠會首先選擇通往目標點的最短路徑Route 1;當發現A處障礙后,老鼠會選擇中間路徑Route 2;當發現在最短和中間路徑的公共部分有障礙即障礙B時,它們會選擇最長的路徑Route 3,而不是選擇中間路徑,從而證明它們知道被阻塞的部分同時屬于最短路徑和中間路徑.

圖6 Tolman 老鼠繞道實驗迷宮環境Fig.6 Maze environment of Tolman detour task

Tolman 認為在老鼠大腦中存在認知地圖,當在迷宮中尋找目標時,即使在迷宮中的任意點看不到全局環境,但能根據認知地圖進行行為決策,選擇最優路徑進行導航.

3.2 實驗設計與結果

本文實驗對象是輪式圓形機器人,半徑為2.5 cm,運動線速度v=2.5 cm/s,機器人通過左右兩輪WL和WR的差動驅動行走,通過改變方向輪WD朝向可以實現任意角度的轉向,其俯視示意圖如圖7 所示.從老鼠感知系統獲得啟發,本文假設可以獲得機器人精確的位置信息,作為認知地圖形成層VO的輸入;配備8 個測距傳感器均勻分布在圓形機身用于探測與障礙物之間的距離,測距范圍為 1~ 10 cm.本文仿真環境尺寸參考文獻[22]中的Tolman 迷宮環境,尺寸為 130 cm×130 cm,其中灰色代表障礙物,白色代表通路,通路寬度為 10 cm,如圖8 所示.

圖7 輪式圓形機器人俯視圖Fig.7 Top view of wheeled circular robot

圖8 Tolman 迷宮仿真環境Fig.8 The simulation environment of Tolman maze

實驗 1.認知地圖構建過程

首先讓機器人漫游環境,以(35,5)為起點,每經過一個步長都采集位置信息、場景信息和障礙信息,邊漫游邊構建認知地圖.考慮到機器人自身尺寸,在仿真實驗采集樣本點的過程中,首先將墻邊界進行膨脹化處理,機器人所處的位置中心離邊界的距離一定大于機器人的半徑,此處設置為3 cm.設置機器人隨機搜索的行進步長dstep為 5 cm.初始實驗參數設置見表1.

分別采集1 000 和2 000 個能遍歷整個迷宮環境的位置點及相應的場景記憶信息,每有25 個位置細胞激活就記錄一次認知地圖,可以得到以下的認知地圖的構建過程,分別展示于圖9 和圖10.圖中圓點為機器人所經過的位置記錄,星號表示生成的位置細胞.機器人剛開始只有一個位置細胞激活,隨著機器人探索環境獲得可達位置點的增多,所激活的位置細胞也逐漸增多,最終只用了少量的位置細胞就可以映射整個迷宮環境.如圖9和圖10 所示,當有1 000 個可達位置點時,共有90 個位置細胞激活過;當有2 000 個可達位置點時,共有93 個位置細胞激活過.機器人在隨機探索環境的過程中,所激活的位置細胞個數不斷增多,表明其對環境的認知程度逐漸增強,最終能自組織地形成整體環境的認知地圖.

表1 DGP-PCCMM 初始參數設置Table 1 Initial simulation parameters for DGP-PCCMM

圖11 展示了位置細胞個數N隨學習次數n的變化情況,圖例中nm表示最大學習次數.實線和點劃線表示學習次數分別為1 000 和2 000 時,位置細胞個數的變化.由圖11 可知,在初始階段只有一個位置細胞激活;隨著與環境交互次數的增多,激活過的位置細胞個數不斷增加;當機器人基本遍歷環境后,認知地圖中的激活過的位置細胞個數大體一致;之后繼續遍歷環境,位置細胞的個數變化不大.值得一提的是,由于老鼠在迷宮中屬于探索式運動,經常出現折返現象,故對環境的認知也是漸進的.

圖9 認知地圖構建過程(nm=1 000)Fig.9 The formation process of cognitive map(nm=1 000)

圖10 認知地圖構建過程(nm=2 000)Fig.10 The formation process of cognitive map(nm=2 000)

圖11 位置細胞個數隨學習次數變化情況Fig.11 The number of place cells changing with the number of learning times

實驗 2.再現Tolman 老鼠繞道實驗

上述實驗闡明基于位置細胞的認知地圖是如何自組織構建出來的.在這個實驗中,我們使用已構建好的認知地圖進行Tolman 繞道實驗的再現,所用迷宮環境如圖8.起始點設置在(35,5),目標點設置在(35,125).實驗分為三部分,首先進行門A和B都打開情況下的導航,其次是門A關閉門B打開情況下的導航,最后是門A打開而門B關閉情況下的繞道行為再現.

首先在起始點根據位置細胞序列規劃算法得到一條初始全局最優位置細胞序列,機器人根據所規劃的位置細胞序列向目標點位置細胞行進;在行進過程中,當環境感知模塊檢測到當前場景與記憶中的場景信息不匹配時,啟動認知地圖動態縮減機制,更新位置細胞之間的連接關系,得到更新后的認知地圖;調整機器人位姿,重新進行位置細胞序列規劃選擇行進方向,最終到達目標點.

圖12 門A 和門B 都打開情況下的導航Fig.12 Navigation with door A and door B open

圖13 門A 關閉門B 打開情況下的導航Fig.13 Navigation with door A closed and door B open

圖12~ 14 為再現Tolman 繞道實驗結果圖,其中,星號表示激活的位置細胞,星號及其之間的細線表示得到的認知地圖,方塊表示起點,五角星表示目標點,粗線表示根據位置細胞規劃算法得到的導航路徑.圖12 為門A和B都打開的情況,此時機器人選取最短路徑Route1 作為導航路徑.圖13為門A關閉而門B打開的情況,開始時機器人在起始點繼續沿著Route 1 前進,當檢測到A處障礙物,啟動認知地圖動態縮減機制,將當前位置細胞與下一位置細胞之間的連接關系設為0;機器人位姿調轉180°方向,重新進行位置細胞序列規劃,可以看到機器人選擇中間路徑到達目標點;在下次導航時,由于認知地圖已經更新,機器人直接選擇Route 2到達目標點.同理,當門A打開而門B關閉時,最終機器人將學習到選擇Route 3 進行導航,如圖14 所示.

圖14 門A 打開門B 關閉情況下的導航Fig.14 Navigation with door A open and door B closed

仿真結果表明,移動機器人能夠在與環境交互的過程中感知環境并在遇到動態障礙物時動態更新認知地圖;同時基于所構建的位置細胞認知地圖,利用位置細胞序列規劃可以獲得最優導航路徑,從而實現對Tolman 繞道實驗的再現.

4 討論

機器人建圖一直是機器人和人工智能領域的一個非常活躍的研究領域,主要解決通過移動機器人獲取物理環境空間模型的問題.在20 世紀80 年代到90 年代早期,機器人建圖主要分為柵格地圖和拓撲地圖兩種方法.柵格地圖采集環境的幾何特性,而拓撲地圖側重描述不同位置之間的連接[27].同步定位與地圖構建(Simultaneous localization and mapping,SLAM)問題從1986 年提出后逐漸興起[28],側重于工程實踐研究.之后,隨著位置細胞、網格細胞、頭朝向細胞等與環境認知和導航相關細胞的發現,仿生建圖研究逐漸成為新的研究潮流,主要以探索動物環境認知機理和構建更智能的移動機器人為目的[15,29],側重于仿生理論研究.本文屬于仿生建圖研究的范疇.下面將本文的認知地圖與幾種經典的建圖方法進行對比討論分析.

4.1 與柵格地圖對比討論

柵格地圖是常用的地圖表示方法,其優點在于建模簡單、易于更新和處理,但隨著地圖范圍擴大,所需要的存儲空間將會大大提升.近年來,自適應柵格地圖表示方法被提出,能根據環境自適應調整柵格大小,從而有效節省存儲空間,如基于四叉樹的自適應柵格地圖創建方法.然而,自適應柵格地圖僅適用于靜態環境,在障礙物密度差異大的環境中效果明顯;在障礙密度差異小且障礙物較多的環境中,其優勢不突出[30].本文模型不僅具有類腦仿生特性和生物合理性,而且經實驗驗證,在所構建地圖的簡潔性和對環境中動態障礙的適應性方面更有優勢.

1) 在所構建地圖簡潔性方面的對比

為進行對比分析,本文分別采用四叉樹自適應柵格建圖法和本文方法對Hairpin 迷宮進行建圖.Hairpin 迷宮為如圖15 所示的 70 cm×70 cm 的靜態室內環境.在標準的四叉樹柵格建圖中,環境地圖分割方法是將整個未知環境切分成4 個節點樹,確定子柵格中哪些狀態是空置或被占據的,哪些狀態是未知的,然后將未知柵格進一步劃分為4 個小節點樹,指導整個地圖搜索完畢并滿足精度要求,則建圖完成.基于四叉樹的柵格地圖在一定程度上解決了傳統柵格占用海量存儲空間的問題,但該方法對應用環境有要求,在障礙密度差異小且障礙物較多的環境中,優勢不突出[30].本文認為,Tolman迷宮屬于障礙密度差異大且障礙物較多的環境,Hair pin 迷宮屬于障礙密度差異小且障礙物較多的環境.

圖15 Hairpin 迷宮Fig.15 Hairpin maze

圖16 四叉樹柵格地圖Fig.16 Occupancy grids based on quadtree

圖16 是構建的四叉樹柵格地圖,圖16(a)和圖16(b)分別為采用四叉樹柵格建圖法對Tolman迷宮和Hairpin 迷宮進行建圖的結果.圖17 是本文方法構建的認知地圖,圖17(a)和圖17(b)分別為采用本文方法對Tolman 迷宮和Hairpin 迷宮進行建圖的結果.從仿真結果圖可以定性地看出,本文認知地圖構建整個環境所需要的位置細胞數比四叉樹柵格地圖所需要的柵格數要少.對實驗結果做定量分析,以四叉樹柵格建圖法形成的大柵格計數,構建Tolman迷宮地圖需要的柵格數大于196,構建Hairpin 迷宮地圖需要的柵格數大于256.而以本文認知地圖建圖法構建Tolman 迷宮僅需要90個位置細胞,構建Hairpin 迷宮地圖僅需要65 個位置細胞,比四叉樹柵格地圖更簡潔.四叉樹柵格地圖和本文認知地圖的性能指標對比如表2 所示.此處需要說明的是,Tolman 迷宮地圖的尺寸為130 cm×130 cm,而Hairpin 迷宮地圖的尺寸是70 cm×70 cm,所以構建Tolman 迷宮所形成的位置細胞個數比構建Hairpin 迷宮多.此外,本文建圖過程與海馬體的一次學習或快速學習機制[31]相吻合,本文地圖生成過程更符合動物對環境的認知過程.

2) 在對動態障礙適應性方面的對比

圖17 本文方法構建的認知地圖Fig.17 Cognitive maps based on methods of this paper

表2 本文與四叉樹柵格對比Table 2 Comparison between occupancy grids based on quadtree and DGP-PCCMM

對動態障礙的適應性是機器人環境認知的重要內容.文獻[30]表明,四叉樹柵格地圖法較適合于對靜態環境的建圖,如果環境發生變化,則需要重新進行四叉樹柵格建圖,對動態變化的適應性較弱.人工勢場法、遺傳算法、蟻群算法、動態窗口法等都有一定的局部避障能力[32-33].其中,動態窗口法是近年來較常用的一種局部路徑規劃方法,對動態變化有良好的適應性,能夠實時避障,但其不能有效利用學習到的先驗信息,導致耗時較長,且其無法考慮路徑的全局最優性,時常會陷入局部最優[33-34].本文方法能在與環境的交互中學習到環境的地圖信息,并在之后的導航中能利用學習到的認知地圖指導導航,耗時短且能實現全局最優.為對比動態窗口法和本文方法對動態障礙的適應性,將這兩種方法分別用于在Tolman 迷宮的導航實驗,并在圖18中展示兩者的導航結果,其中實線和虛線分別表示動態窗口法和本文方法得到的路線.在18(c)門A打開而門B關閉的情況下,動態窗口法會由于避障而出現繞遠路或陷入局部最優的現象,并且在多次導航后并不會學習到環境的地圖信息,導致每次導航都會繞遠路.而在本文方法中,機器人在第一次發現臨時障礙后,會及時更新認知地圖,從而在之后的導航中能采用規劃出的全局最優路徑.兩種方法的性能指標對比表如表3 所示,其中,T1、T2 和T3 分別表示圖18(a)、18(b)和18(c)的情況.由表3 可知,在T1 和T2 情況下,兩種方法都能近似最優地進行導航,本文由于根據認知地圖進行導航,運行時間相對較短.在T3 情況下,采用動態窗口法由于繞遠路和陷入局部最優,運行時間相對很長,T3 的運行時間比T1 增長了約5 倍,而采用本文方法運行時間只比T1 時增長了約2.5 倍.本文認知地圖構建方法的一大優點在于在遇到動態障礙時可以利用已有的認知地圖,從而在下次導航時直接使用學習后的認知地圖進行導航,避免了重新學習環境信息的時間浪費.

圖18 動態窗口法和本文方法導航結果對比圖Fig.18 Comparation of navigation results between dynamic window approach and DGP-PCCMM

表3 本文與動態窗口法對比Table 3 Comparison between dynamic window approach and our method

4.2 與其他認知地圖對比討論

Martinet 等[20]提出了前額皮質柱神經網絡模型,通過構建位置細胞和皮質柱的分層網絡再現Tolman 繞道實驗.文獻[20]和本文都能對繞道實驗進行再現,文獻[20]展示了皮質柱網絡結構從海馬輸入中學習稀疏的拓撲度量表示,而本文側重基于海馬體位置細胞進行認知地圖的構建與更新,屬于對老鼠空間導航機制的不同研究方向的探索.

Erdem 等[35]提出了基于前向軌跡探針的目標導向的空間導航模型.通過隨機探索,可以創建由位置細胞和前額皮質細胞組成的地圖,實現目標導向的行為.然而,正如文獻[35]的討論中所說,何時引入位置細胞來表達空間環境的位置信息是一個重要的問題,文獻[35]中的位置細胞是通過特定的偽隨機方法來產生的,存在不能很好表達環境的問題.本文采用類似自組織圖的“感知—響應”結構,通過競爭與動態增長獲得位置細胞,可以實現對環境的良好表達,兩種方法獲得的認知地圖如圖19 所示,圖19(a)為文獻[35]得到的認知地圖,其中圓圈表示位置細胞,虛線表示得到的導航路徑;圖19(b)為本文方法得到的認知地圖,其中星號表示位置細胞,星號及其之間的連線表示得到的認知地圖.通過圖19 可知,文獻[35]得到的認知地圖在某些位置處沒有位置細胞表示,如最左邊一列,而在某些位置處有多余的位置細胞表示,如從左邊數第三列可行通路,不能生成對整個環境的完整表達;相比較而言,本文方法可以獲得對整個環境的一個均勻完整的表達,很好地解決了文獻[35]提出的如何引入位置細胞來表達空間環境這一重要問題.

圖19 Erdem 認知地圖與本文認知地圖對比Fig.19 Comparison between different cognitive maps

概括來說,本文認知地圖構建方法有以下優點:1) 具有類腦仿生特性與一定的生物合理性.與柵格地圖和一般的拓撲地圖相比,本文認知地圖的構建和更新過程與海馬體的一次學習或快速學習機制相一致,更符合動物對環境的認知過程.2) 能夠適應動態環境(如門的開閉).與動態窗口法相比,在遇到動態障礙后,本文方法能動態更新認知地圖,并利用學習到的認知地圖指導導航,耗時短且能實現全局最優.3) 能夠降低建圖的復雜性,并通過構建Tolman 迷宮、Hairpin 迷宮地圖進行驗證.與四叉樹柵格地圖相比,本文方法不僅適用于障礙密度差異大的環境,而且在障礙分布差異小且障礙物較多的環境中也表現出較好的性能.

5 結論

本文用機器人再現動物繞道實驗,是通過仿生使機器人更加智能化的一個初步探索.本文受海馬體位置細胞在特定位置放電的啟發,通過構建動態增減的位置細胞認知地圖,再現了Tolman 老鼠繞道實驗.目前研究的重點集中在對認知地圖的構建上,所提出的構建方法具有以下優點:1) 具有類腦仿生特性與一定的生物合理性;2) 能夠適應動態環境(如門的開閉);3) 能夠降低建圖的復雜性.實驗結果表明,機器人漫游和導航的過程中能動態形成和更新認知地圖,能像Tolman 老鼠那樣,利用認知地圖進行自主環境探索、認知與導航,完成繞道取食.

本文屬于對動物導航過程中大腦運作機制的一個探索,對海馬體位置細胞的建模是后續研究動物導航過程中可能涉及到的內嗅皮層、丘腦、紋狀體等之間聯合建模的基礎.本文簡單表明了海馬體位置細胞的場景記憶功能,對機器人場景記憶的仿生建模有待進一步的研究.將來期望進一步完善機器人對Tolman 繞道實驗的再現,使機器人實現更仿生(如將障礙物撤除后機器人重新發現捷徑等)的環境認知.

猜你喜歡
環境實驗
記一次有趣的實驗
長期鍛煉創造體內抑癌環境
一種用于自主學習的虛擬仿真環境
孕期遠離容易致畸的環境
做個怪怪長實驗
環境
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
主站蜘蛛池模板: 性色在线视频精品| 久久免费精品琪琪| 狠狠色综合网| 在线观看视频99| 国产成人综合网| 综合五月天网| 91亚洲国产视频| 高清无码手机在线观看| 91小视频版在线观看www| 国产成人免费| 国产综合精品日本亚洲777| 丁香五月亚洲综合在线 | 青青草91视频| 又爽又大又光又色的午夜视频| 国产在线一区视频| 亚洲无码高清免费视频亚洲 | 亚洲va欧美va国产综合下载| 在线va视频| 亚洲AV无码一区二区三区牲色| 欧美怡红院视频一区二区三区| 亚洲男人的天堂在线| 狠狠色香婷婷久久亚洲精品| 亚洲国产成人无码AV在线影院L| 免费a级毛片视频| 国产精品第5页| 免费国产黄线在线观看| 五月婷婷中文字幕| 久久人人97超碰人人澡爱香蕉 | 成人自拍视频在线观看| 大香伊人久久| 97青青青国产在线播放| 国产乱人激情H在线观看| 亚洲永久免费网站| a级毛片免费看| 国产精品深爱在线| 欧美色丁香| 国产91视频观看| 色噜噜综合网| 三上悠亚在线精品二区| 麻豆国产精品一二三在线观看| 51国产偷自视频区视频手机观看| 99热国产在线精品99| 午夜一级做a爰片久久毛片| 亚洲黄网视频| 亚洲精选高清无码| 99热线精品大全在线观看| 欧美日韩亚洲综合在线观看| a级毛片在线免费| 国产AV毛片| 精品一区二区三区视频免费观看| 97se综合| 日日噜噜夜夜狠狠视频| 六月婷婷精品视频在线观看 | 国产精品亚洲欧美日韩久久| 成年免费在线观看| 手机在线国产精品| 国产精品福利尤物youwu| 日本不卡视频在线| 日本精品αv中文字幕| 国产激爽大片高清在线观看| 亚洲精品国产综合99| 久久永久精品免费视频| 国产一级毛片高清完整视频版| 久久综合九色综合97婷婷| 麻豆AV网站免费进入| 国产综合无码一区二区色蜜蜜| 波多野结衣视频网站| 亚洲激情区| 亚洲水蜜桃久久综合网站 | 亚洲婷婷在线视频| 免费精品一区二区h| 亚洲女人在线| 国产一级做美女做受视频| 99精品热视频这里只有精品7| 亚洲全网成人资源在线观看| 中文字幕不卡免费高清视频| 亚洲免费福利视频| 萌白酱国产一区二区| 国产00高中生在线播放| 日韩视频免费| 国产主播福利在线观看| 午夜福利无码一区二区|