于 進,王建鵬,張海君
(鄂爾多斯市國源礦業開發有限責任公司,鄂爾多斯 010399)
由于煤礦井下經常容易發生爆炸和坍塌事故,工作人員進入到煤礦井下工作具有一定的安全隱患。所以,可以通過管路安裝機器人完成煤礦井下相關設備安裝。管路安裝機器人的出現有效降低了煤礦井下人員傷亡,同時還可以為井上決策提供建議。但由于煤礦井下環境狹窄,且井下管路布局通常非常密集,管道之間的空間有限,并且可能存在彎曲、分支等復雜情況,導致機器人的靈活性和適應性受到一定的制約[1-2],為此研究管路安裝機器人在不確定環境下的協同自動控制,具有十分重要的意義。
國內相關專家也給出了一些比較好的研究成果。例如文獻[3]主要通過深度強化學習實現機器人自動化控制。該方法分析了神經網絡、深度學習獎勵模型對整體控制方法的影響,并最終通過實驗驗證了C2 結構的自動控制效率更高;文獻[4]通過DDPG 算法和PID 控制相結合的方式完成機器人協同控制,有效躲避障礙物;文獻[5]建立了機器人行走軌跡運動模型,計算對應的角速度和線速度,同時引入自動避障流程完成機器人自動避障控制方法。
但是以上方法在不確定的煤礦井下環境應用過程中,需要進行大量迭代計算完成環境確認,應用范圍受限。本文在以上幾種研究方法的基礎上,提出一種煤礦井下管路安裝機器人協同自動控制方法。通過實驗結果表明,采用所提方法可以獲取比較滿意的煤礦井下管路安裝機器人協同自動控制效果。
管路安裝機器人在通常情況下工作于結構化環境中,管路安裝機器人的周圍環境地圖可以采用比較簡單的柵格地圖描述。在管路機器人展開協同自動控制前期,優先對管路機器人所在的煤礦井下不確定環境展開精準描述,以組建精準的環境地圖。
在構建柵格環境地圖[6]過程中,精準描述不確定障礙物是一個十分關鍵的問題,需要對障礙物展開如下假設:
(1)二維柵格地圖中的障礙物面積也是障礙物在地面的面積,障礙物的高度信息并不參與計算。
(2)煤礦井下的障礙物詳細信息是利用傳感器以及攝像機采集到的,通過計算機展開處理,最終轉換為二值信息柵格。
柵格地圖表示法就是通過多個長和寬相等的柵格將對煤礦井下管路安裝機器人的工作空間展開劃分處理,柵格的大小不僅和煤礦井下管路安裝機器人的本體尺寸存在很大關聯,同時還會影響管路安裝機器人并行協同自動控制結果的精確度。管路安裝機器人在行駛過程中,環境空間布局不會發生變化,障礙物的大小也是完全不變的。地圖被劃分為具有固定頻率的柵格,每個柵格代表一個存儲信息的網格單元。這樣可以將環境問題轉化為柵格的路徑規劃問題。以下給出柵格數量劃分的詳細操作步驟:
(1)選定環境空間中的障礙物。
(2)選用多個矩形包絡障礙物,即可獲取邊長的最大值pmax和最小值pmin。
(3)通過式(1)求解每個矩形i 的面積Si:
式中:ai和bi分別為矩形的長和寬。
(4)通過式(2)求解n 個矩形的區域面積Sn:
(5)通過式(3)和式(4)求解第i 個柵格的長度pi以及柵格單元的長度l:
劃分的柵格總數N 如式(5)所示:
式中:E 為地圖的長度;A 為地圖的寬度。
通常情況下,柵格環境地圖是由兩類柵格組成,一類為自由柵格,采用z(x)=0 表示,也就是煤礦井下管路安裝機器人可通行區域;另外一類為障礙物柵格,采用z(x)=1 表示,是煤礦井下管路安裝機器人需要繞行的區域。在展開煤礦井下管路安裝機器人并行協同自動控制前期,分別對可通行區域和不可通行區域展開編號處理。
在劃分柵格總數后,并不是全部的障礙物都可以完整表示在柵格中,還有一部分不規則障礙物沒有占用整數倍的柵格單元,所以需要對其邊緣使用二值膨脹方法,使其可以填滿整數倍的柵格。為此,構建柵格環境地圖C 為式(6)的形式:
式中:D 為被處理的圖像;B 為結構元素;(x,y)為柵格位置;為以單位長度為步長展開移動。
通過柵格環境地圖,機器人可以了解到環境的結構和特征,進而進行路徑規劃、避障等決策。為此,以上述構建的地圖為主要實驗環境,引入啟發函數來估計當前位置到目標位置的預測距離。啟發函數可根據現有信息提供蟻群選擇下一步移動方向的指導,使蟻群算法[7]更加高效。蟻群算法模擬螞蟻在尋找食物時的行為,通過信息素和啟發函數的權衡,在柵格之間選擇最優路徑。
螞蟻作為柵格中的移動單位,將每只螞蟻視為一個實體,在柵格內進行移動。在柵格中引入信息素,每個柵格都具有一定數量的信息素。設定m 只螞蟻需要訪問n 個位置,記錄螞蟻k 當前已經訪問過的位置,行走路徑集合tk會隨著螞蟻的運動而變化。當行走路徑集合tk內包含了全部位置后,則說明螞蟻k 完成此次迭代。其中,轉移概率[8]決定了螞蟻k 下一步運動到哪個位置,而轉移概率和位置i及位置j 路徑上的信息素濃度以及啟發信息存在關聯,為此,計算螞蟻k 在設定時間內從位置i 轉移到位置j 的概率:
式中:ak為螞蟻k 能夠訪問的位置;τij(t)、ηij(t)為t時段內從位置i 到位置j 的信息素量和期望啟發函數;β 為期望啟發因子。
設定從位置i 到位置j 的啟發函數:
式中:dij為位置i 到位置j 的距離;(xi,yi)和(xj,yj)分別為位置i 和位置j 對應的坐標位置。
螞蟻在訪問完一個位置或者全部位置都完成訪問后,更新柵格環境中各個行走路徑上的信息素濃度τij(t+1),對應的計算式如下所示:
式中:ρ 為信息素揮發因子。
通過上述分析,給出蟻群算法的操作流程如圖1 所示。由圖1 可知,啟發函數只考慮了當前位置i和相鄰柵格位置j,但是并沒有起始點as以及目標點ag,同時會導致算法在選擇下一位置時陷入死鎖。所以,需要對啟發函數展開改進,經過改進后的啟發函數如式(10)所示:

圖1 蟻群算法操作流程Fig.1 Operation flow chart of ant colony optimization algorithms
經過多次迭代后,對信息素量的更新規則Δτij(t)以及信息素揮發因子ρ 展開更新,對應的計算式如下所示:
式中:Lm為路徑長度的均值;R 為常數;ψc為循環次數;Q 為信息素強度;Lk為螞蟻k 在此次循環走過的路徑長度;ρmax和ρmin為信息素揮發因子的最大和最小值;ψ 和ψmax為當前迭代次數和最大迭代次數。
完成上述操作后,通過改進啟發函數優化后的蟻群算法[9]展開煤礦井下管路安裝機器人并行協同自動控制,詳細的操作步驟如下所示:
(1)通過柵格法建立柵格環境地圖C,同時對全部參數展開初始化處理,主要包含迭代次數等;
(2)設定tk為機器人行走路徑集合;
(3)通過式(7)計算螞蟻從當前位置轉移到另外一個位置的概率,移動一步就對集合tk更新一次;
(4)判斷螞蟻k 是否陷入凹型障礙物死鎖,假設是,則直接啟用螞蟻退回策略,將凹型障礙物內的柵格設定為障礙物柵格,同時再返回上一步驟;反之,則跳轉至步驟(5);
(5)判斷螞蟻k 是否完成一次搜索,假設是,則跳轉至下一步;反之,則返回至步驟(3);
(6)通過多步長移動策略對螞蟻搜索到的路徑展開二次規劃,同時保存二次規劃后的路徑;
(7)通過式(11)對各個路徑上的信息素展開更新處理,且k=k+1;
(8)判斷是否全部螞蟻都完成一次搜索,假設是,直接跳轉至下一步;反之,則返回至步驟(3);
(9)判斷ψc<ψmax是否成立,假設是,則直接跳轉至步驟(2);反之,則直接跳出循環,同時輸出最優煤礦井下管路安裝機器人協同控制方案。
為了驗證所提煤礦井下管路安裝機器人并行協同自動控制方法的有效性,通過Matlab 平臺展開實驗分析。
通過激光雷達和Clearpath ROS 機器人構建煤礦井下管路真實環境下的地圖模型,對形成的環境地圖在Matlab 軟件中將地圖轉換為二值圖像,同時通過meshgrid 函數對地圖展開柵格化處理,同時障礙物邊緣和柵格單元邊緣兩者完全重合,采用式(6)最終獲取煤礦井下的柵格地圖。實驗分析過程中需要在同一個地圖內設定相同的起點和終點,具體如圖2 所示。實驗參數設置如表1 所示。

表1 實驗參數設置Tab.1 Experimental parameter settings

圖2 柵格環境地圖Fig.2 Grid environment map
采用所提方法展開煤礦井下管路安裝機器人并行協同自動控制,測試結果如圖3 所示。

圖3 所提方法的煤礦井下管路安裝機器人并行協同自動控制結果Fig.3 Parallel collaborative automatic control results of coal mine underground pipeline installation robot using the proposed method
分析圖3 可知,采用所提方法展開煤礦井下管路安裝機器人并行協同自動控制時,可以有效躲避障礙物,具有良好的煤礦井下管路安裝機器人并行協同自動控制性能。
分析不同柵格環境下所提方法的路徑長度變化情況,如表2 所示。

表2 不同柵格環境下所提方法的路徑長度實驗結果Tab.2 Experimental results of path length for proposed method in different grid environments
通過表2 可知,所提方法具有較短的搜索路徑,說明采用所提方法展開煤礦井下管路安裝機器人并行協同自動控制后,路徑長度得到有效降低,充分驗證了所提方法的優越性。
對所提方法的煤礦井下管路安裝機器人并行協同自動控制時間展開分析,如圖4 所示。
分析圖4 可知,所提方法的煤礦井下管路安裝機器人并行協同自動控制時間較低,說明所提方法具有較快的控制效率。
為了確保煤礦井下安裝工作的順利展開,提出一種煤礦井下管路安裝機器人并行協同自動控制方法。通過大量實驗測試證明,所提方法可以有效避免管路安裝機器在行走過程中出現碰撞,同時還可以縮短行走路徑,減少控制時間,獲取更加滿意的管路安裝機器并行協同自動控制效果。