廣東工貿職業技術學院 孫濤 王朝輝 周佳杰
以學習或知識為基礎建立的機器人認知機制正面臨著普適性、智能性及服務性差的挑戰,物流機器人的自適應導航性能標志著劃時代的技術大變革和進步,對于機器人認知準確性、避障能力的提升功不可沒。文章以增量分層判別回歸算法(IHDR)為核心,將闡述其在物流機器人自適應導航中的技術構成、具體實現方法,并通過靜態、動態兩種環境下的仿真試驗,校檢物流機器人自適應導航算法的可行性,以充實物流機器人領域的技術體系。
完善的自適應導航環境,是物流機器人在操作中正確完成避障,在未知環境下有序作業的前提條件[1]。傳統的機器人導航算法涵蓋人工勢場法、遺傳算法等,這些算法按照技術方案的不同,支持全局性和局部的路徑規劃。隨著物流工業的發展推進,移動互聯網、人工智能、機器學習等技術相繼在“互聯網+物流”潮流中滲透,人們對物流工業的需求趨于智能化、生態化[2]。物流機器人自適應導航算法對技術條件也提出了較高的要求,傳統的技術已不適用于現實需求,局限性也日益凸顯,主要體現在技術應用范圍窄,適應能力差,僅可適合簡單的環境,對于復雜、多變的環境欠缺應用價值。IHDR算法具有自主學習、便捷化導航性等特點,計算效率高,且適應新環境的能力強,對于物流機器人自適應導航技術的研究與應用有著寶貴的意義[3]。
IHDR算法即增量式分層判別回歸算法,基本思想為:以IHDR原理將不純的數據集,經過整理歸納后劃分為N個較純的子樣本集。在輸入某個樣本數據時,首先判斷其在子樣本集中的歸屬,再判斷與當前樣本相接近的子樣本集,便可以獲得當前樣本對應的輸出動作向量,算法的核心技術涉及樣本集劃分、子空間劃分、子集劃分、檢索分析等[4]。
采用雙聚類策略劃分子集,即在獲取數據過程中,每個數據和一個指示類別或某一個指示動作對應,輸出、輸入兩者之間為分別對應、相互補充的關系[5]。針對輸入數據來說,輸出的指示信息較小,可在Y-Space上聚類分析,并在X-Space中驗證,可實現已有樣本數據有效、快速的劃分。
樣本空間內通常無法一次完成劃分,在應用中往往僅能得到目前時刻t所對應的數據,可將子空間的劃分過程假設為動態環境,設在IHDR樹中進行樣本的持續添加,樣本會在子數據集中自動劃分,若子數據集中的樣本數量高于設定的閥值ns,可把子數據集進行整理,將其劃分為q個子數據集,依次順序,通過增量式的方法數據集可轉化為M個子樣本集[6]。
如何將樣本劃分到對應的子集,是IHDR算法應當思考的問題。在劃分過程中,重點找尋子樣本集的中心,由于一個樣本歸屬于某個子樣本集,則該樣本相應地,和樣本集的中心較為貼近,僅需判斷子樣本集中心距離最近的樣本,即可對樣本進行快捷的子樣本集劃分。
無論是在節點對應樣本集中進行的樣本比對,還是在樣本與聚類子中心間的比對,比對的樣本數據和性能間有著密不可分的關系,可把樣本投影到待判別的特征空間,利用特征空間的優勢實施比對分析[7]。特征空間運用CCIPCA算法比對,通過對當前樣本空間對應判別的特征空間進行可增量式的評估,在特征空間內進行樣本的投影。針對常規的節點,各個節點均建立負對數似然模型,判定當前樣本屬于各聚類子中心的概率。因此,在建立的IHDR樹中,各個節點都會對應一個統計模型,各個節點可對應一個子樣本集。在展示結果時,對于未經處理的數據采用IHDR進行分類處理,即可增強對問題的識別率。
運用上述IHDR自適應導航算法的關鍵技術,文章將基于IHDR建立自適應導航框架、知識庫表示方法,設計適用于物流機器人的導航規劃方法[8]。
采用IHDR原理,根據物流機器人路徑規劃、避障需求,設計自適應導航框架,主要由知識學習模塊、內容檢索模塊、知識更新模塊三個部分組成[9-10]。知識學習模塊的目的在于,經過樣本的學習,借鑒以往的經驗,將之內化為知識的形式,在IHDR樹節點中添加。當機器人處于在線運行狀態時,結合物流機器人的本體狀態、環境狀態,可在現有的知識庫中檢索決策量信息。若決策量信息判斷無效,可重新啟動基本路徑規劃算法,幫助物流機器人在運行中提供路徑導航所需的決策量,不僅可以將決策的結果反饋給知識庫,以供知識庫的參數更新,還可為機器人的行為輸出提供參考。若決策量有效,則可以充當物流機器人的行為直接輸出。該框架和常規知識學習的區別在于,采用在線更新方式,與物流機器人的路徑規劃動態保持同步,以使機器人獲得及時的運行數據支持。
IHDR算法增量學習過程體現了某種映射機制,這種映射的表達式為[11]:

在表達式中,X代表當前的狀態,為輸入端,由自身所處的環境狀態和物流機器人的運行狀態兩個部分組成。它以相對量表示,在相對速度空間有著適用性。Y為輸出端,表示物流機器人在下一階段采用的規劃量,輸入、輸出兩者的表達式為:

在輸入、輸出兩個表達式中,VA代表物流機器人目前的速度,VAG代表物流機器人目前和目標間的相對速度,VA00代表物流機器人目前和第0個障礙物的相對速度,LAG代表物流機器人目前與目標的相對坐標,LA00代表物流機器人目前和第0個障礙物的相對速度,R01代表第0個障礙物對物流機器人作業的威脅半徑,△VA代表物流機器人在下一階段即將采取的加速度[12]。以兩個表達式的運算為依據,構建IHDR樹型結構,樹型結構的學習原理為:設S=(X,Y)為需要學習的新樣本,即率先從IHDR樹的根節入手學習,之后以節點的子節點為范圍,在其中找尋和新樣本狀態X接近的中心區域。以找到的該節點為中心繼續搜索,直至確定葉子的節點。之后對葉子節點的類別中心均值、方差進行更新。對物流機器人的規劃量進行持續的調整和優化[13]。
采用IHDR算法設計的自適應導航算法,基于自主學習框架結合建立的知識庫,在靜態環境下配置Visual Studio2008簡體中文版,硬件要求為:內存≥768MB,可用磁盤空間2.2GB,CPU1.6GHZ,分辨率1024×768,附帶DVD-ROM驅動器,在Windows7環境下完成試驗。假設物流機器人周邊環境中有4個障礙物,分別記為0b1、0b2、0b3、0b4,要求物流機器人避開4個靜態障礙物,運動路線為由起始點到目標點T,運行參數如表1所示[14-15]:

表1 靜態障礙物物流機器人仿真分析三維參數Tab.1 Three-dimensional parameters of static obstacle logistics robot simulation analysis
運用上述三維參數,對IHDR算法為核心的自適應導航算法進行運算分析,結果如表2所示:

表2 靜態環境下物流機器人仿真結果Tab.2 Simulation results of logistics robots in static environment
經IHDR算法反復運行10次,平均避障的總時間達到了150ms,平均路徑的總長度為6500m,檢索成功的比例為38/59,單次規劃的平均時長為2.58ms,經測試,該方法用于物流機器人的路徑規劃和導航有著較高的效率[16]。
考慮到單一的靜態環境下物流機器人自適應導航算法無法全面體現算法成效的特點,文章引入了動態環境法下的物流機器人仿真試驗,試驗所用的計算機硬件同靜態仿真[17]。在三維參數選擇上,動態仿真僅修改4個障礙物的初始運行速度。假設物流機器人運行中有著4個障礙物,初始狀態條件下障礙物對物流機器人的運行路線造成了堵塞。動態仿真時,物流機器人必須繞過4個目標障礙物方可保持既定的操作路線。動態仿真環境的三維參數及仿真試驗結果如表3和表4所示:

表3 動態環境下的物流機器人仿真分析三維參數Tab.3 3D parameters of logistics robot simulation analysis in dynamic environment

表4 動態環境下物流機器人仿真分析結果Tab.4 Simulation analysis results of logistics robots in a dynamic environment
動態環境下物流機器人單次路徑規劃用時低,綜合靜態仿真結果,以IHDR為核心的物流機器人自適應導航算法在應用中有著良好的適用性。
物流機器人自適應導航研究的問題在于,在給定的機器人運動構型、初始構型中,可以運算出一條連續并可以滿足不同狀態下環境約束的途徑,讓機器人可以沿著自主導航規定的路線,自初始點運行到目標點位終止。提供成熟的三維空間路徑規劃,能夠支撐物流機器人技術向精細化、專業化方向發展。以IHDR為核心的物流機器人自適應導航算法,適應了物流機器人領域的技術研發需求,通過傳感器數據感知環境信息,可進行數據研判,運用構建的知識庫修訂偏差,健全物流機器人自適應導航算法的流程和思路,從而對物流機器人的速度、位移數據進行合理的掌握,以不斷提升物流機器人自適應導航的精度。