王銓
(中國神華國際工程有限公司,北京 100007)
AGV(automated guided vehicle)車技術是一種背負式的、可無軌移動的、基于電磁及光學自我感知和自動尋跡的自動化運輸車輛技術[1]。小負荷AGV車輛可以用于快遞、郵件分揀系統;大負荷AGV車輛可以在車間系統中跨生產線搬運加工中間物資[2]。當前我國的AGV車輛技術已經處于國際先進水平,主要實現方式是通過輪對控制法實現車輛驅動,通過激光點云雷達和可見光實時建模技術實現尋跡和避障[3]。
車間內跨生產線運輸系統早期依靠小型叉車或者梭車實現,因為通道較為狹窄,人員跨線走動情況帶來的環境干擾較為復雜,所以該運輸系統容易造成車間生產事故[4]。人工駕駛的小型叉車或者梭車很難實現較高的生產效率,所以促進了對AGV車輛的市場需求[5]。
該研究在輪對全自動驅動底盤系統上實現AGV車輛技術,提升車間跨生產線運輸效率,提升車間安全管理效能,特別針對AGV輪對全自動輸送車的算法優化進行技術創新,并評價新技術的優勢及后續開發方向[6]。
輪對式驅動系統通過調節一對膠輪的相對轉速,實現車輛的直行、后退、轉向功能。驅動輪分別通過獨立的驅動電機進行驅動。驅動電機為大功率同步交流電動機,電源來自車載逆變器(部分大負荷AGV車輛電源來自車載發電機)[7]。該底盤系統整體架構詳見圖1。

圖1 輪對驅動AGV車輛底盤系統示意圖
圖1中,左、右兩套驅動系統驅動輪對底盤,利用變頻器實現4個前進擋、1個停止擋和2個后退擋,同時驅動左右獨立的制動系統,構建輪對驅動系統。驅動輪直徑33cm,該驅動策略詳見表1[8]。

表1 驅動策略匯總表
表1中,該車輛的最大前進線速度約為4.00m/s,即14.4km/h,用作長距離低風險轉運過程,如封閉或半封閉長距離轉運通道;低速前進速度約為1.25m/s,即4.5km/h,用作長距離高風險轉運過程。該車輪對中線間距設計為1.44m,最大車寬1.55m,最大車長設計為1.89m,其中輪對軸線前方1.25m,輪對軸線后方0.64m,其轉向能力驗算圖如圖2所示[9]。
圖2中,該輪對底盤的轉向方式主要分為兩種,其中圖2(a)為輪對對向運行實現以輪對驅動軸中點為回轉中心的小半徑轉向方式,圖2(b)為抱死一側驅動輪,使用另一側驅動輪低速驅動實現的以一側驅動輪為轉向回轉中心的轉向驅動方式。為計算該兩種轉向方式的底盤參數,應計算其轉向過程的最大掃過半徑Lmax和理論角速度ω,該輪對驅動底盤的具體數據如表2所示[10-12]。

圖2 該輪對底盤轉向能力相關參數試算圖

表2 驅動底盤具體數據匯總表
該驅動算法,采用機器人視覺神經系統理念,利用深度卷積神經網絡,將4個視頻探頭和4個激光點云探頭數據分別進行深度卷積,形成8個避障數據,將該8個避障數據進行繼續卷積,形成多列神經網絡決策,詳見圖3。

圖3 驅動系統神經網絡算法示意圖
圖3中,涉及到5個關鍵技術點,現分析如下。
1)激光點云的數據卷積方案
單個激光點云探頭的掃描視域為1 024×768點陣,共涉及到1個通道786 432個數據,數據格式為雙精度浮點變量格式。采用多項式回歸法進行節點設計,數據無損卷積率可達到40%,即其包含隱藏層14層,分別為314 573節點、125 830節點、50 332節點、20 133節點、8 054節點、3 222節點、1 289節點、516節點、207節點、83節點、33節點、14節點、6節點、3節點。其節點基函數如下:
(1)
式中:Xi為節點輸入項中的第i個輸入值;Y為節點輸出值;j為多項式階數;Aj為第j階多項式的待回歸系數。
激光點云處理器需要同時運行上述4個卷積神經網絡模塊,對嵌入系統的浮點計算能力要求較高,所以嵌入設備應配置多個高頻率(>2.4GHz)浮點型處理器及通用處理器運行操作系統,并控制多嵌入設備的周圍總線通信。該處理器向中央處理器報送4個雙精度浮點變量作為中央處理器的視覺參照數據。
2)可見光的數據卷積方案
可見光處理器的節點設計與激光點云處理器相同,即采用公式(1)基函數進行節點設計,但因為輸入數據量不同,其隱藏層架構有所不同。可見光采用三通道采集可見光數據,每通道為640×480解析度,故每個攝像頭探頭采集的可見光數據包括921 600個數據,數據格式為長整型變量,可在計算中強制轉化為神經網絡可識別的雙精度浮點型變量進行控制。同樣采用40%卷積率,其隱藏層共14層,分別為368 640節點、147 456節點、58 983節點、23 593節點、9 438節點、3 775節點、1 510節點、604節點、242節點、97節點、39節點、16節點、7節點、3節點。
可見光處理器需要同時運行上述4個卷積神經網絡模塊,處理器硬件設計同激光點云處理器。
3)路徑預設的跳點方式
傳統計算模式中,在路徑中設計拐點,計算拐點的回轉中心點與回轉角度,但在該設計中,將路徑下一跳點坐標(x,y)與AGV車輛當前定位點(x0,y0)共4個變量輸入到中央處理器的判斷坐標中,使其通過卷積神經網絡判斷輪對驅動方案。該4個變量均為雙精度浮點型變量。該卷積神經網絡設計方案詳見下文。
4)多列神經網絡實現驅動信號輸出方案
針對左輪和右輪驅動方案分別設計1列卷積神經網絡,形成多列卷積神經網絡系統。2列神經網絡的模塊架構相同,根據不同設計方案進行訓練。每列神經網絡共12個輸入數據,均為雙精度浮點型變量,包括4個激光點云數據卷積結果、4個可見光數據卷積結果、4個路徑預設結果。
該多列神經網絡系統的核心統計學目標并非數據卷積,因為與前文數十萬數據卷積為1個數據相比,通過12個輸入數據卷積為1個數據,其卷積壓力較小,所以該部分神經網絡的核心統計學目標為發掘數據細節,實現更高精度的數據表達。故其節點函數選擇方案應側重于數據細節的發現,應采用對數回歸函數進行節點設計,其基函數應改寫如下:
Y=∑(A·logeXi+B)
(2)
式中:Xi為節點輸入項中的第i個輸入值;Y為節點輸出值;e為自然常數,此處取近似值e=2.718 281 828;A、B為節點待回歸系數。
為加強數據分析結果,該部分神經網絡隱藏層層數設計為6層,分別為17節點、31節點、53節點、29節點、11節點、3節點。輸出為1個雙精度浮點型變量。
5)驅動方案解釋辦法
上述2列多列神經網絡各輸出1個雙精度浮點型變量,值域空間為(-∞,+∞)。在解釋辦法中應將該輸出值解釋為輪對單側驅動輪運行的8個驅動策略(表1),其輸出值與解釋值之間的關系如表3所示。

表3 驅動方案解釋辦法匯總表
表3中,將數據解釋方案設定為有效值域空間[0,1.000]范圍,超出此值域范圍的(-∞,0)和(1.000,+∞),均設定為報錯區間。該報錯區間用于判斷神經網絡系統是否有效收斂,而在實際運行中,一旦一側驅動輪給出報錯數據,則兩側驅動輪均同時制動抱死,防止出現不可預見事故。在有效值域空間內,系統根據兩側驅動輪的實際神經網絡輸出值選擇合適策略。但在安全保護裝置中,系統會給出以下輔助報錯空間,以對神經網絡的收斂情況給出加強輔助判斷過程,詳見表4。

表4 輔助報錯空間設置
表4中,前進策略共有4個,后退策略為2個,停車策略1個,計劃內制動策略1個,轉向策略10個,上述計劃內策略共18個,而策略投影空間共有81項。該81項中如果策略投影不在18個計劃內策略中,均會給出報錯,并使系統保護性制動。該策略進一步增加神經網絡訓練過程中的收斂度,且增加了系統安全性。
該系統軟件開發過程中,3個處理器均采用了Linux操作系統,邏輯數據管理使用了MySQL平臺軟件,視頻與激光點云驅動為探頭內置軟件,軟件開發使用了Java編譯系統。數據訓練過程采用了遙控訓練法,使用人工遙控的方式操作該輪對驅動系統,神經網絡系統根據操作指令和探頭輸入數據進行訓練,其自主訓練路徑長度100m,設計拐點6個,運行過程中設計額外障礙物及行人闖入等應急狀態。根據訓練時長測試其效率,得到測試結果如表5所示。

表5 系統開發測試結果表
表5中,當訓練達到25h時,該系統的自主尋跡能力已經與人工遙控操作時長保持持平;當訓練達到100h時,該系統的平均車速11.19m/s較人工遙控的9.59m/s提升16.7%。考察行人侵入的制動效率,人工遙控制動最終位置距離行人平均1.92±0.36m;訓練25h時制動最終位置距離行人平均1.23±0.24m;訓練100h時制動最終位置距離行人平均0.73±0.18m。可以推測自主尋跡避障功能,更傾向于貼近異常點進行制動,且所有機器人操作在訓練5h后均未發生意外碰撞事故。
使用4個激光點云探頭構建自主尋跡避障主視覺系統,使用4個3通道可見光攝像頭構建自主尋跡避障輔助視覺系統,采用機器人自主視覺系統,在輪對驅動AGV車輛底盤上,構建驅動系統。該系統使用3個嵌入系統運行8個深度卷積神經網絡和2個數據庫輔助多列卷積神經網絡,最終構建針對2個驅動輪的8擋位控制系統,給出4個前進策略、2個倒退策略、10個轉向策略、1個停車策略和1個計劃內制動策略。最終開發測試中,該系統在遙控訓練25h時,達到與人工遙控近似的自主尋跡能力;遙控訓練100h時,控制效率超出人工遙控16.7%;但后續訓練未發現有控制效率的顯著提升。該系統通過提升神經網絡系統的節點數量、增加控制器的硬件配置,可以得到更高的控制效率。