白 云
(西安科技大學 實驗室與設備管理處,陜西 西安710054)
環境模型是機器人通過自身攜帶的傳感器感知局部環境信息而建立起來的地圖模型[1-3],機器人的環境感知與空間環境建模是機器人實現路徑規劃的基礎。就煤礦救援蛇形機器人而言,只有在認知礦難發生后的煤礦井下環境才能進行路徑規劃、導航和避障,以完成救援任務,因此,應選取一種適用于煤礦環境,既能準確表達度量信息又能體現位置關系信息的地圖模型,是煤礦救援蛇形機器人在復雜煤礦環境中進行路徑規劃、完成救援任務的基礎,有著重要的現實意義。
在機器人系統中,環境信息主要包括物體的位置和形狀信息、路徑信息等。近年來,主要采用柵格表示法、幾何表示法、拓撲圖法等方法描述環境模型[4-6]
1)柵格表示法,是將整個環境分為若干相同大小的柵格,對于每個柵格指出其中是否存在障礙物。一些研究者對柵格表示法進行了改進,根據不同的信息優化策略,定期地刪除不必要的柵格存儲信息,以減少處理時間。例如:洪偉等人提出了根據超聲波傳感器建立柵格地圖、由柵格地圖變換產生極坐標地圖、在極坐標地圖基礎上識別障礙物群、提取障礙物邊緣特征、計算環境復雜指數等一系列的數據融合方法來建立機器人運動的環境模型[7];
2)幾何表示法,是指機器人從環境傳感信息中提取抽象的幾何特征,如交點、折線、邊角等來表示空間環境模型。該方法比較緊湊,占用計算資源較小,便于定位與目標識別,例如,Stephen 通過對環境視覺識別的特征點提取實現了對不確定環境的模型表達[8];
3)拓撲模型,是一種非度量空間環境模型,將空間表示為節點與連接節點的邊的關系拓撲圖,適合于大范圍的空間環境使用,缺點是由于缺少環境的細節表達,因而難以實現機器人的細節動作規劃。Choset 提出將拓撲節點用帶有度量信息的弧段連接起來,并通過仿真實驗證明這種方法可以在大規模室內環境中實現機器人的導航[9];
多傳感器數據融合是利用多個信息源所獲取的關于對象和環境的信息,從而獲得任務所需要的全面、完整的信息。目前,常見的方法有Bayes估計、卡爾曼濾波、D - S 證據推理等方法[10-11]。基于神經網絡的多傳感器數據融合方法是近幾年來發展的熱點。神經網絡所具有的信息分布存儲、容錯性,自學習、自組織和自適應等特征使得其在處理未知環境、環境信息復雜、知識背景不清楚以及推理規則不明確的問題時,顯得非常優越[12]。文中將神經網絡技術與模糊技術相結合,利用模糊神經網絡數據融合算法完成對煤礦救援蛇形機器人的環境建模,該算法采用神經網絡來進行模糊信息的處理,使得隸屬函數的調整和模糊規則的的擇優提取成為可能。通過實驗和仿真可以得出該算法不依賴于系統的精確數學模型且適用于復雜的煤礦井下環境,用于煤礦救援蛇形機器人的環境建模是一種切實、有效的方法。
為了使求援機器人能夠實時、準確地避開障礙物,救援蛇形機器人必須獲得障礙物的基本信息,如距離、形狀、位置等。結合煤礦井下的特殊環境和蛇形機器人自身結構特點,采用超聲波傳感器、紅外測距傳感器、激光雷達傳感器組來獲得障礙物的距離、位置信息及環境類型信息,利用模糊神經網絡多傳感器數據融合算法處理這些信息,對救援蛇形機器人的運動空間進行分析,建立機器人行走的環境拓撲結構。多傳感器數據融合模型如圖1 所示。由傳感器組獲取障礙物的信息作為模糊神經網絡的輸入,網絡隸屬度函數采用的是正態型函數,網絡最終輸出為八類典型環境標志。通過環境類型標志建立救援蛇形機器人行走的環境拓撲結構,為救援蛇形機器人路徑規劃提供依據。

圖1 模糊神經網絡多傳感器數據融合模型Fig.1 Model of fuzzy neural network multi-sensor data fusion
變結構模糊神經網絡結構設計如圖2 所示。

圖2 變結構模糊神經網絡的拓撲結構Fig.2 Topology of fuzzy neural network with changeable structure
其中 (A)~(D)層表示模糊規則的前提,網絡有n 個輸入節點,輸入變量xi經(A)~(D)層轉換成前提部分的隸屬度函數{μAji(xi)},其中,j =1,2,…,mi,mi是xi的模糊分割數。(E)~(G)層表示規則的結論部分,結論部分由結構相同的r 個并列子網絡組成,每個子網絡的輸出經(G)層的清晰化計算后成為模糊神經網絡的最終輸出量。具體為
(A)層為前提網絡的輸入層。它起著將輸入變量xi傳送到(B)層的作用,其中i=0,1,…,n;

(C)層將各隸屬度進行模糊計算,每個節點代表一條模糊規則,(C)層采用最小運算規則或積的運算規則計算出每條規則的強度為


該層的節點數為m,m 是可變的。通過對結論網路權值的調整,擇優選取模糊規則,從而自動的調節模糊神經網絡的結構。
(D)層進行歸一化計算,即

其中 j = 1,2,…,m.
(E)層是結論部分的輸入層,將輸入變量傳送到(F)層。(E)層的第0 號節點的輸入值為1,其作用是為模糊規則結論部分中提供常數項。
(F)層是計算每一條規則的結論,(F)層的r個并列子網絡分別有m 個結點與(G)層的每個輸出節點相連,m 個結點代表m 條模糊規則。

(G)層是模糊神經網絡的輸出層,作用是進行清晰化計算。

其中 k = 1,2,…,r.
網絡的學習算法采用改進的BP 算法,若網絡輸出yk與期望輸出值dk不一致,則將其誤差信號從輸出端反向傳播,并在傳播過程中不斷修正網絡權值,以結論網絡的連接權值ωkji為例,其中,j =1,2,…,m;i = 0,1,2,…,n;k = 1,2,…,r.設E 為平均誤差代價函數,

由(式1)~(式4)可得

如(式6)所示,通過對結論網路權值的調整,可以自動的調節模糊神經網絡的結構,若(E)層中與(F)層相對應的某個節點i,若其連接權值均小于某一閾值,則刪除該結點i,其對應的(D)層和(C)層的節點也相應地被刪除,這表明第i 條規則不存在,從而可以精練模糊規則庫,減少網絡節點數,使計算量變小。然后進行參數的再學習調整。
根據上述理論,文中采集超聲波傳感器、紅外傳感器、激光雷達傳感器所測得的距離數據如表1所示,分析機器人在接近障礙物時,3 種傳感器距離信息的差異性,可以總結出環境中存在八類典型的標志如圖3 所示。利用模糊神經網絡來識別對應環境的特征標志,完成機器人對環境的感知和識別,并給出了仿真結果。

表1 8 類典型環境傳感器測距樣本Tab.1 Eight typical environmental sensor ranging sample cm

圖3 8 類典型環境標志Fig.3 Eight typical environment mark


圖4 網絡誤差訓練變化曲線Fig.4 Change curve of the network training error
提出了一種變結構的模糊神經網絡多傳感器數據融合算法,并給出了算法的原理。通過實驗表明,該方法不依賴于系統的明確數學模型且適用于復雜的煤礦井下和過程,尤其是在環境信息融合過程中,通過對傳感器數據的處理能夠得到救援機器人所處的井下環境的拓撲結構,機器人據此可進行路徑的規劃和避障,從而順利完成救援任務。
References
[1] 齊 帥,李寶林,程 巖.煤礦救援機器人研究應用現狀和需解決的問題[J].礦山機械,2012,40(6):7-9.QI Shuai,LI Bao-lin,CHENG Yan. Study and application status of rescue robots used in collieries and existing problems[J].Mining Machinery,2012,40(6):7-9.
[2] 柳玉龍.煤礦搜救機器人的研究現狀及關鍵技術分析[J].礦山機械,2013,41(3):7 -9.LIU Yu-long. Analysis on current research status and key technologies of mine search and rescue robots[J].Mining Machinery,2013,41(3):7 -9.
[3] WEI Juan,MA Hong-wei. Study on mine rescue robot system[C]//Proceedings Second International Conference,Intelligent Robotics and Applications,Singapore,2009.
[4] Ren C. Luo,Michael G. KAY,multisensor integration and fusion in intelligent systems[J]. IEEE Trans. On SMC,1989,19(5):901 -931.
[5] 魏 寧,劉一松.基于柵格模型的移動機器人全局路徑規劃研究[J].微計算機信息,2008,24(4):2 -4.WEI Ning,LIU Yi-song. Research on global path planning for mobile robots based on the grid model[J].Micro Computer Information,2008,24(4):2 -4.
[6] 李瑞峰,趙立軍,靳新輝.基于粒子濾波器的室內移動機器人自定位[J].華中科技大學學報:自然科學版,2008,36(Suppl.):145 -148.LI Rui-feng,ZHAO Li-jun,JI Xin-hui. Self localization for indoor mobile robot based on particle filter[J].Journal of Huazhong University of Science and Technology:Natural Science Edition,2008,36(Suppl.):145 -148.
[7] 洪 偉.移動機器人系統中分布式傳感器信息融合方法及路徑規劃問題的研究[D]. 長春:吉林大學,2004.HONG Wei. Research on distributed multisensor information fusion and path planning in mobile robot system[D].Changchun:Jilin University,2004.
[8] Stephen S,David L,Jim L.Local and global localization for mobile robots using visual landmarks[C]//Proceedings 2001 IEEE/RSJ International Conference on Intelligent Robots and Systems,Maui,USA,2001.
[9] Choset H,Konuksven I,Burdick J W. Sensor based planning for a planar rod robot[C]//Proceedings of the 1996 IEEE nternational Conference on Multisensor Fusion and Integration for Intelligent Systems. Albuquerque,USA,1996.
[10]韓崇昭,朱洪艷,段戰勝. 多信源信息融合[M]. 北京:清華大學出版社,2006.HAN Chong-zhao,ZHU Hong-yan,DUAN Zhan-sheng.Multi source information fusion[M]. Beijing:Tsinghua University Press,2006.
[11]梁亞婷,楊振宏,屈利偉.基于多源異構信息融合的煤礦冒頂事故預報技術[J]. 西安科技大學學報,2013,33(1):78 -82.LIANG Ya-ting,YANG Zhen-hong,QU Li-wei. Mine roof fall prediction technique based on multi-source information fusion[J].Journal of Xi’an University of Science and Technology,2013,33(1):78 -82.
[12]毛紅閣,劉長旺,劉香偉,等.兩層模糊神經網絡交通信號控制模型[J].西安科技大學學報,2012,32(2):62 -65.MAO Hong-ge,LIU Chang-wang,LIU Xiang-wei,et al.A signal control model based on two layer signal fuzzy neural network[J]. Journal of Xi’an University of Science and Technology,2012,32(2):62 -65.