2
(1.西安工業大學 電子信息工程學院,西安 710021; 2.西北機電工程研究所,陜西 咸陽 712099)
傳統固定位置的傳感器網絡計算定位和移動機器人主動搜索定位是源定位的兩種主要方式?;趥鹘y固定位置傳感器網絡計算定位是通過實時采集的源濃度數據與源的擴散模型相結合,進行參數迭代求解,從而得到源參數的后驗分布。移動機器人主動搜索定位的思路是利用移動機器人安裝相應的傳感器形成的具有嗅覺感知的個體,機器人利用環境信息和源的濃度信息,采用啟發性搜索策略實現源定位。本文采用的源定位方法屬于移動機器人主動搜索定位,系統在開發中依舊存在魯棒性差和精度低等問題,使得難以應用到實際場景中。近年來,對于危險源、氣味源等發散性源的定位在國內外已成為研究的熱點問題,也一直是機器人學及智能控制等多種學科研究的熱點問題。切爾諾貝利與福島核泄露事故對生命、財產和環境造成了巨大的破壞,同時考慮到事件的毒害性、擴散性及不確定性,使得在信息匱乏的條件下展開高效的搜索定位工作迫在眉睫。由于光源是常見的源中相對穩定、安全的一種源,所以研究移動機器人的趨光控制理論對危險源的定位工作有著深刻的意義。
趨光性是一種生物對光靠近或遠離的特性,利用光源模擬危險源,實現移動機器人的趨光性是一套具有實際意義的源定位理論方法,而且這種特性也作為探索未知環境的過程得到廣泛重視。移動機器人對光源的定位可以被認為是簡單的源定位,將傳感器技術與機器人技術相結合,成為目前研究源定位問題的主要方法。按照時間維度來區分,可將源劃分為時變源和時不變源。時變源主要是源的特性隨時間發生變化的源,比如輻射源、氣味源等,它們的形狀、濃度等會隨著時間變化而變化。時不變源為特性不隨時間變化的源,比如光源就是一種穩定的時不變源,它的擴散模型穩定,并且隨著時間的推移光源強度不會發生變化。研究人員對時不變的光源進行定位開發出了不同的方法,文獻[1-2]針對移動機器人的自主趨光行為問題,提出基于神經網絡的趨光控制方法,分別采用Boltzmann機神經網絡和模糊神經網絡構建模型,克服了局部最小,在提高機器人學習的控制精度的同時,使機器人在未知環境下通過自主的學習和訓練逐漸形成、發展和完善趨光行為技能。文獻[3-4]利用一組小型移動機器人實現對光源的定位。S.Rounds等人設計出一個經濟且穩定的群體智能系統,以實現移動機器人的趨光性能。該系統將群體智能和重心Voronoi鑲嵌(CVT)法相結合,對動態運動光源進行定位和追蹤。在移動機器人根據CVT方法運動時,使用一組固定的傳感器網絡對環境進行監測,同時還提出一種光估計法,用來減少CVT收斂所需的傳感器數量,使整個系統架構魯棒性更強。AL Christensen等人對進化神經網絡控制器進行軟件仿真,將軟件模擬器中進化出來的控制器成功地轉移到真正的機器人上,利用一組攜帶該控制器的s-bots移動機器人實現趨光性能與避障行為。文獻[5]中設計了一種利用四旋翼進行光源追蹤的實驗裝置,對基于非模型的實時優化方法(極值尋優控制理論)在四旋翼上得到了實現,結果表明非模型的實時優化方法可以快速地對信號映射進行響應并跟蹤光源。
對于一些隨時間變化的源,比如氣味源、化學源和輻射源等,研究人員也進行了大量的研究工作,按照研究方法可將源定位的研究分為兩類:基于概率統計理論方法以及基于最優化理論方法。利用概率方法進行源參數確定主要集中在利用貝葉斯推理進行研究,文獻[6]通過對大量的采樣數據進行氣象色譜-質譜儀(GC/MS)分析,利用統計歸納方法進行源參數的辨識。然而統計歸納方法需要大量的數據來進行分析,在緊急應對中,由于數據的有限性,使得該方法應用性不高。文獻[7]將最小相對熵應用到三維空間釋放煙羽的重構,該方法考慮模型參數的先驗概率密度函數,通過先驗估計和測量濃度值來得到參數的二次估計,這種方法的優勢在于提供了可行的不確定性分析方法。而優化方法只需要提供濃度值即可求解,適用于數據有限的情形,克服了概率統計方法數據有限的缺點。文獻[8]充分利用了模擬退火法的穩健性,通過質量流量來描述泄漏源。文獻[9]利用模擬退火算法結合高斯煙羽模型來估計沙漠地區的氣源位置和濃度,以找到新的石油和天然氣儲備。同時他們對不同目標函數進行分析,檢驗模型的性能,并對觀測濃度數據引入噪聲,以測試模型的敏感性[10-13]。
本文利用地面移動機器人對室內光源的定位理論進行研究,為危險源的定位提供理論基礎,并建立了一套光源定位平臺,包括移動機器人和光源定位系統兩部分。移動機器人配備光敏傳感器組成具有嗅覺的個體,將梯度自適應極值搜索算法應用于地面移動機器人定位策略中,最后通過繪制等值線及軌跡追蹤驗證了該算法在光源定位平臺的適用性,從而實現在室內環境下光源的準確定位[14-16]。
由于在未知環境中移動機器人相關性能的限制以及傳感器技術發展緩慢,導致源定位的方法較為單一,將先進的機器人軌跡規劃技術與傳感器檢測技術結合在一起是目前源定位的主要策略,主要步驟如圖1。機器人技術和傳感器檢測技術是源定位中兩個重要的部分,其中,傳感器作為信息采集系統的基本單元,可以使整個系統具有檢測和識別等能力。移動機器人相對于源定位系統來說,傳感器將被測量信號的微小變化轉化為電信號,與機器人的位置信息一同作為機器人運動控制的輸入,使得機器人可以通過環境數據做出決策。另一方面,傳感器的數據可作為移動機器人等值線繪制和軌跡追蹤的基礎,通過算法仿真劃分源所在的區域,繪制出源濃度分布,最終實現源定位。

圖1 移動機器人源定位框圖
光源模型的建立首先需要確定其目標函數,由傳感器網絡實時采集光照強度信息和移動機器人位置信息建立,可以預測光源的位置,以及光源處光照強度I,因此光源的定位也可以認為是系統辨識問題。機器人模型可描述為:
(1)
c=P/G(▽)
(2)
式中,(x,y)為機器人的位置,θ為方向角,ω0為機器人的角速度。P為常數項,c為估計反饋增益參數,▽為估計的梯度,梯度通過機器人的歷史位置與當前位置的坐標信息進行估計,參數c隨著估計的梯度自動調整,本文中取c=4。
(3)
(x,y)為機器人通過的歷史位置相對于當前的坐標,假設經過兩個點的坐標(x1,y1)、(x2,y2),i為光照強度值,得到向量(x1,y1,i1)和(x2,y2,i2),則可確定梯度的大?。?/p>

(4)
某時間段內移動機器人獲取的光照強度為Ic(X1,t1),Ic(X2,t2),…,Ic(Xn,tn),假設目標函數為:
(5)
式中,Ij(Xi,ti)為機器人在ti時刻的理論光照強度,移動機器人的坐標為(x,y),Ic(Xi,ti)為ti時刻(x,y)位置處的光照強度,Δ為θ組成的解空間,移動機器人在n個位置進行測量。光源的定位問題也可以理解為在解空間Δ中找到一個合適的向量,來使目標函數的誤差變小,使移動機器人能夠快速收斂至光源附近。本文通過安裝在移動機器人上的光照度傳感器來檢測不同位置的光照強度,計算其梯度大小,使機器人按照光照強度上升梯度最大的方向搜索光源,達到無積累誤差的效果。這種梯度自適應極值搜索算法對先驗信息要求低,僅需要位置信息及光照強度,保證了源定位時的效率,而且在梯度較小時收斂速度加快,在梯度較大時也可運動到光源處。
參數密度估計中需要一個已知的概率密度函數,但在實際問題中并不能確定該特征空間服從哪個概率密度函數,所以采用無參數密度估計可以更好地解決問題。MeanShift算法屬于無參數密度估計中的一種,基本原理是利用概率密度梯度爬升尋找樣本點密度最大的區域。首先標定目標區域并計算該區域的特征值概率,然后利用相似函數度量第一幀圖片的特征描述,比較當前幀的與第一幀特征描述的相似性,最后選取使得相似函數最大的終點區域并得到MeanShift向量,經過不斷迭代計算MeanShift向量,算法將收斂到終點區域,實現了目標跟蹤。

(6)
然后對候選模型進行描述,在第t幀時刻根據上一幀中心坐標得到候選目標的中心坐標O,則其概率密度分布為:
(7)
h為核函數窗口大小,此時,定義相似性函數ρ(m,n)來度量式(6)和式(7)間的相似度,本文選用巴氏(Bhattacharyya)系數作為目標模型和候選模型的相似性度量,并泰勒展開后得到巴氏系數表達式:
(8)
(9)
其中,特征權重為:
(10)
最后通過中心坐標O的迭代直至移動最后兩次的距離小于閾值,即完成向終點區域的移動:
(11)
本文設計了一套自主實驗平臺,用于研究在未知環境下移動機器人光源定位的問題,如圖2所示。整個實驗對光照要求比較高,要求在僅有實驗光源的環境下進行。在實驗室中放置一塊邊長為1.2 m的正方形黑色平臺,一方面為了減少實驗過程中人為活動對結果造成的誤差,比如眼睛反光等問題。另一方面,理想情況下光源的呈圓環狀分布,平臺搭建為正方形可使得光源分布大致為四分之一圓環狀,便于數據的采集及等值線的繪制。偽GPS相機用來監視移動機器人的運動狀態和位置,并將整個實驗過程以視頻的形式存儲在基站中,作為跟蹤移動機器人軌跡的基礎。實驗中光源采用12 V LED可調節光源,放置在黑色平臺右上角空白區域,在LED光源外邊增加一個燈罩,使得光源分布得更加均勻。

圖2 光源定位平臺
實驗中所設計的具備光源感知能力的移動機器人,主要負責采集光源強度信息,自主決策后向光源運動,最終實現對光源的定位。如圖3所示,移動機器人是由微處理器模塊、供電模塊、光強采集模塊、無線通信模塊和電機驅動模塊組成的差速驅動式運動小車。本研究采用STM32F103RCT6作為移動機器人的微處理器,供電模塊為12 V電池組,一方面經過電壓轉換后為電機驅動模塊供電,另一方面經過降壓后為5 V的微處理器模塊供電。光強采集模塊由4個光照度傳感器構成,分布在移動機器人上方4個頂點處,負責光源數據的采集。無線通信模塊選用ESP8266 WIFI模塊,將光源數據傳送至基站,作為繪制光源等值線的數據。電機驅動模塊由步進電機驅動,通過比例控制PWM脈沖頻率,實現對移動機器人的運動速度的控制,通過兩輪差速控制移動機器人的運動方向。

圖3 實驗硬件系統結構圖及移動機器人
軟件系統設計主要體現在光強信息采集模塊,該模塊由4個光照度傳感器構成,以車頭方向為正方向,左前方傳感器的編號為a,沿順時針方向傳感器的編號分別為b,c,d,采用對角線控制策略,將移動機器人檢測到環境中的光照信息進行運算并做出決策。本文提出的對角線控制策略如圖4所示,該控制策略主要實現光強信息的采集,分析計算光照強度的變化,并引導移動機器人做出動作決策。計算光強采集模塊中兩條對角線光照強度的差值來判斷光源大致的位置,從而調整移動機器人的位置及朝向,經過多次迭代計算得到光源所在的位置,并使移動機器人移動到光源附近。

圖4 對角線控制策略程序流程圖
在配備有偽GPS相機的實驗室環境下,利用梯度自適應極值搜索算法進行移動機器人的趨光性實驗。在黑色區域內建立7×7的正方形網格地圖,光源固定在平臺一角的空白區域,為更好地驗證梯度自適應極值搜索算法在光源定位平臺的有效性,將移動機器人放置在與光源相對的區域,隨機給定機器人一個位置坐標,并設置機器人的初始方向,記錄該起始位置的坐標信息和光強度信息。同時為了避免外界光源及人為因素的干擾,實驗需要在僅有LED光源的情況下進行。圖5中分別為兩種搜索方法的趨光性進展,相同地,在初始狀態下,移動機器人未接通電源,處于靜止狀態。在運動中期,通過對光照強度的實時檢測并做出決策,移動機器人開始向著梯度較大的方向移動,但是并未朝著光源作直線運動。在運動末期,由于在光源附近光照強度的波動較小,基本維持在一定的范圍內,所以移動機器人按著近似于直線運動向光源移動。此時梯度減小,收斂速度相比于運動中期時的收斂速度慢,但是基本可以確定光源所在位置,使得移動機器人移動至光源附近。

圖5 移動機器人趨光性實驗
3.2.1 目標跟蹤
本文在Matlab中利用MeanShift算法來跟蹤移動機器人的軌跡,圖中左上角為LED光源位置,移動機器人從右下角開始搜索。首先獲取視頻幀圖像,通過人工標定的方法選取移動機器人作為目標區域,確定中心點的坐標(x0,y0)。若不是視頻初始幀,則以上一幀圖像中心位置為當前幀目標的迭代位置來構建候選模型。然后計算Bhattacharyya系數ρ(m,n)來衡量兩個模型的相似程度,若當前幀與上一幀中心坐標的距離小于閾值,則迭代結束,最后輸出當前幀的坐標。
3.2.2 等值線繪制
以往的等值線繪制算法主要有3種,一種是基于傳感器網絡監測的方法,該算法事先預設好若干傳感器,將監測到的數據發送回基站經算法處理后繪制出等值線。另一種是基于移動機器人搜索的算法,利用搭載特定傳感器的移動機器人進行數據的采集,對數據分析后做出決策,使機器人按照某一軌跡運動。第3種是數據信息采集后,通過繪圖軟件直接進行等值線的繪制。本研究受第2種方法啟發,采用一種簡單高效的等值線繪制算法。在趨光實驗平臺中建立一組實用的網格地圖,以光源位置相對一角為原點建立坐標系,控制移動機器人做直線運動。采集多組數據并進行數據篩選,舍去有數據缺失或是波動幅度過大的數據,并記錄光照強度相同的機器人的位置信息,然后通過光照強度反算得到近似的函數,最后繪制出的等值線如圖6所示。

圖6 等值線繪制及機器人運動軌跡
實驗中分別在黑色實驗平臺內部建立4×4、7×7的正方形網格,保持機器人方向不變,使得機器人沿著網格線運動,按照直線運動采集光照信息。通過測量數據對比發現利用7×7網格繪制的等值線更接近于理想的等值線。如圖6(a),移動機器人根據本文設定的對角線控制策略進行搜索,通過對采集到的光照強度進行對角做差,使機器人在運動的過程中不斷調整其運動方向,最終收斂至光源附近?;谔荻茸赃m應極值搜索算法的移動機器人運動軌跡如圖6(b),本研究中自適應參數c=4,可以看出移動機器人在光照強度相對較小時可迅速做出判斷,能夠更快速地定位光源,并收斂在光源附近。
3.2.3 結果分析
選取其中10組數據進行比較,分別從趨光過程用時、移動機器人與光源的距離兩個方面來比較。如圖7(a)所示,應用對角線控制策略定位用時約為25 s,基于梯度自適應極值搜索算法定位約為16 s。圖7(b)為移動機器人趨光停止時與光源之間的距離,圖7(c)為移動機器人在整個搜索定位過程中到光源的距離隨時間的變化曲線。在應用對角線控制策略時,移動機器人到達光源的整個過程用時較長,并且在距離光源約16 cm處停止。雖然完成了光源的定位,但是并沒能準確地到達光源,存在一定的誤差。而基于梯度自適應極值搜索算法在定位光源的過程中,移動機器人的運行軌跡更加平穩,而且可搜索至距離光源約5 cm處。

圖7 移動機器人趨光結果比較
分析得出,在進行移動機器人趨光性實驗時,對角線控制策略的魯棒性較差,定位效率及精度較低。而利用梯度自適應極值搜索算法不僅提高了源定位效率,同時在一定程度上提高了定位精度,使得移動機器人的定位性能更好,在實際應用中可以更好地完成源定位工作。
本文模擬危險源定位工作,介紹了移動機器人光源定位研究的硬件平臺搭建,并設計實驗驗證了該平臺的適用性,將梯度自適應極值搜索算法與移動機器人的趨光性相結合,通過MeanShift目標跟蹤算法和等值線繪制對光照強度分布及移動機器人的運動軌跡進行分析,結果表明光源梯度自適應極值搜索算法提高了移動機器人的光源定位的效率,并且可提高定位精度,驗證了梯度自適應極值搜索算法在本實驗平臺的有效性。實驗過程中由于移動機器人采集的位置信息和光照信息存在數據缺失,導致繪制等值線時出現波動幅度較大,如何提高梯度自適應極值搜索算法的穩定性并進行動態等值線繪制是下一步研究內容。