一種基于機器學習的軸孔拆卸框架

2020-01-17 07:40:54鄒澤成

探索科學(學術版) 2019年4期

鄒澤成

伯明翰大學英國伯明翰 B15 2TT

1 研究背景

在拆卸過程中,軸孔拆卸是一項常見的高重復性任務,機器人執行起來并不容易。究其原因,主要是在軸栓和軸孔剛性高、柔度不夠的情況下,即使在位置或方向上稍有偏差,也會產生無約束的接觸力,從而導致拆卸失敗[1]。在本研究中,我們設計了一個完整機器學習的演示方法,以克服卡阻和楔入的問題,生成能夠實現軸孔自動化拆卸控制策略。在KUKA iiwa上,應用該控制策略進行自動軸孔拆卸。

2 演示軸孔拆卸過程

2.1 演示前的過程分解軸孔拆卸過程分為三個主要階段:(1)抓取階段:機器人上的夾持器移動到預設位置,抓住軸栓的頭部。(2)方位調整階段:夾鉗夾緊軸栓,繞自由端旋轉,使軸栓與軸孔的軸線平行對齊。(3)分離階段:在垂直向上的方向施加適當的力,使其分離。在分離階段,力的大小和方向是不斷調整,以盡量減少軸栓和軸孔之間的阻力。

圖表1 Peg-hole disassembly process

3 動態時間規整(DTW)的數據同步

在控制策略訓練之前,演示數據要進行時域同步。因為人類無法高精度地重復同一動作,而不一致會對控制策略產生不利影響。在DTW 算法中,假設在時域上數據有兩組演示數據P'A(t)和P'B(t)。數據P'A(t)和P'Bt()的序列分別為m 和n,排列在網格板的兩側。網格表示時間間隔。如圖6所示,在m×n網格板中,每個網格都有一個坐標(i,j)。

為了對齊這兩個序列,點上(i,j)的數字是到這兩個點Ai和Bj的距離d

由于精確的定位系統,機器人(KUKA iiwa14)在給定位置信息的情況下,抓取軸栓頭部并不困難。同時,軸栓與軸孔之間的卡阻和楔入一般發生在第二、第三階段。因此,演示的重點是如何調整方向偏差和運用適當的作用力。

2.2 拆卸過程的演示演示過程由人類握住低剛度的機械臂,并且執行被夾持器抓住的軸栓與孔分離。從夾具抓住軸栓起,傳感器開始同時記錄腕部信息W 和軸栓的姿勢信息P,直到拆卸完成。若剛度太高,人很難移動機械臂。反之剛度太低,機械臂無法承受其重量并跌落到地面。因此,應改變軸X,Y,Z的剛度以適應不同階段。

傳感器記錄的數據要能夠提供足夠的信息以便充分學習。軸孔拆卸在三維空間中,坐標原點OH位于孔的中心,栓頭部中心為OP。軸栓姿勢信息為P=[x,y,z,α,β,γ]T。(x,y,z)表示位置,(α,β,γ)表示以z-x-z順序的歐拉角。腕部信息表示為W=[Fx,Fy,Fz,Mx,My,Mz]T。(Fx,Fy,Fz)表示施加的力,(Mx,My,Mz)表示力矩。由于整體形成十二維數據組,將導致額外的訓練,且控制策略不可靠。因而需要將數據減少到低維度進行訓練,執行運動時恢復高維度。訓練前三維減少到二維,忽略切向方向上的數據。

將樁孔拆卸壓縮成二維平面。其中栓的姿態信息可以表示為三個變量P'= [r ,z',φ]T,腕部信息也表示為三個W'=[Fz',Fr,M]T.映射函數計算如下:(Ai,Bj)。這是序列A 和序列B各點之間的相似性。距離越小,相似性越高。兩點之間的歐氏距離是。DTW 的目標是通過從左下角(1,1)到右上角(m,n)的連續點找到最佳路徑。通過計算,構成路徑的點是兩個序列的對齊點。沿著這條路徑,累積歐氏距離D(m,n)最小,其中K 為對齊點的總數。累積距離表示為:

4 高斯混合回歸(GMR)的控制策略訓練

本文使用高斯混合回歸來計算輸入和輸出之間的關系。輸入最直觀影響的是速度的變化,因此,選擇位置的導數(相對速度)作為輸出。

既，

5 控制策略在機器人的應用

該控制策略是建立在給定腕部W 的基礎上,它將產生最佳的校正速度,使p( W)最大化。校正速度的具體函數如下所示。

由于所確定的參數較多,計算負擔較低,能夠實時生成校正速度。用速度在KUKA iiwa上實現了速度控制策略。

6 結果與討論

第二個測試是將軸孔放置到距離原來位置30 cm 的位置,測試結果與第一組對比如下,實驗結果表明,成功率均為100%,可以實現自主軸孔拆卸。兩種情況下的平均試驗時間小于演示的平均時間,表明機器人在學習了人類的技能后可以很快執行。演示中X-Y 平面有一些偏差,使所學的技能在新的位置上有過多的修正。平均時間誤差和接觸力誤差分別為7.1%和4.9%,對計算結果沒有顯著影響,這種控制策略仍然可以被認為是有用的。

7 結論

在本課題中,介紹了一種基于人體演示的軸孔拆卸方法,達到了自主拆卸軸孔的目的。與其他費時的學習方法相比,該方法實驗次數少,學習范圍大大縮小,易于在實際中應用。提高學習的效率,同時提高控制的效率。