李琳, 肖佳棟, 張鐵, 肖蒙
(華南理工大學機械與汽車工程學院, 廣州 510640)
在利用機器人進行表面加工作業,如拋光[1]、打磨[2]、去毛刺[3]等時,往往需要機器人對未知工件的輪廓進行跟蹤,并且機器人末端工具和工件之間應該保持恒定的期望接觸力[4]。如果接觸力變化過大,會對加工產品質量產生影響[5],甚至損壞工件或機器人。為了實現恒力跟蹤,Qiao和Lu[6]利用在線力反饋數據對未知約束環境的形狀進行估計以獲得目標阻抗模型的虛擬參考運動軌跡,在力誤差信號的驅動下由目標阻抗模型產生機器人的指令運動軌跡,通過跟蹤該指令運動軌跡使機器人臂與環境的接觸力誤差限制在可接受的范圍內,但是生成的參考運動軌跡需要獲得終端與環境之間的摩擦系數,使系統分析變得復雜,而且難以建模,適應環境的不確定性能力會降低。李正義等[7]設計了沿任意傾斜面的機器人自適應阻抗控制方法,實現機器人末端在任意參數未知斜面的接觸力控制。Duan等[8]設計了不確定環境下動態接觸力跟蹤的自適應變阻抗控制方法。Pliego-Jiménez和 Arteaga-Pérez[4]通過設計一種自適應控制方案,實現機器人跟蹤未知剛性表面時的接觸力控制。李二超等[9]通過視覺傳感器建立跟蹤曲線圖像特征與機器人關節角度映射關系,再通過模糊調節機器人阻抗模型參數進行跟蹤,但是由于圖像處理時間比伺服控制時間長,導致了延遲。Baeten和de Schutter[10]設計了一種混合視覺/力的控制方法,通過接觸力引起的相機工具變形來檢測路徑中的突變點實現邊緣定位,并激活有限狀態控制器以在最佳條件下繞過拐角實現恒力跟蹤,但是對于連續光滑的曲線無法很好的識別。Jeon等[11]通過使用視覺傳感器檢測圖像中心到輪廓的距離和角度獲得輪廓的邊緣點和曲率,然后通過應變計力傳感器獲得的力信息控制工具與任務對象之間的接觸力,并通過移動機器人實現恒力輪廓跟蹤,但是由于移動機器人剛度不足,只能滿足曲面輪廓跟蹤的工況,不利于后續的加工過程。Lange和Hirzinger[12]通過力反饋控制的迭代自我控制實現輪廓跟蹤,但是沒有將傳感器反饋的力轉化為垂直于曲面的法向力進行控制器參數迭代,難以補償曲面曲率變化的不確定性,而且沒有進行收斂性分析,難以保證算法的收斂。Visioli等[13]設計了迭代學習混合力/速度控制方法用于曲面的輪廓跟蹤。Roveda等[14]通過迭代學習和強化學習算法進行自動化控制器參數調整實現機器人對未知環境順應性控制,但是設計的算法過于復雜。Winkler和Such[15]通過在力/位置傳感器中加入雙積分器,降低了力控制的穩態誤差,但是雙積分器的力控制方向固定,不能跟隨輪廓的改變而調整力控制方向。Kumar[16]和Jung[17]等提出通過神經網絡來學習機器人機械手的未知動力學,補償機器人運動學中的參數不確定性造成的干擾,從而實現機器人的恒力控制。Karayiannidis等[18]通過設計一種神經網絡自適應控制器,利用權值神經網絡中的線性逼近功能,保證對于任意小集合的力和位置誤差的一致最終有界性。He等[19]設計了一種自適應神經網絡阻抗器,用于處理跟蹤控制過程中的不確定性和輸入飽和度,實現力的控制。但是以上研究都只停留在仿真階段。
這些控制方法中,傳統控制方法難以補償機器人實際跟蹤過程中的不確定性,如機器人運動學的不確定性[20];而智能算法設計復雜,且大多停留在仿真階段。本文提出了一種基于自適應迭代學習算法的機器人力/位混合曲面恒力跟蹤控制方法,從而解決在機器人內部傳遞函數未知和環境剛度未知的情況下,通過多次迭代補償跟蹤過程中的不確定性問題,使機器人末端與工件的接觸力收斂到期望值。
機器人曲面恒力跟蹤實驗平臺如圖1和圖2所示。工作臺坐標系{S}、傳感器坐標系{T}、機器人運動坐標系{V}的姿態相對于機器人基坐標系{B}始終保持不變。機器人始終保持速度vs沿著Vx方向移動。當探頭和曲面接觸時,探頭受到曲面的法向力Fn和切向力Fτ。保持恒定的法向力Fn可以得出曲面的輪廓,為了得到法向力Fn的大小,需要將曲面坐標系{C}中的力映射到已知傳感器坐標系{T}中,曲面坐標系{C}中心與傳感器坐標系{T}中心重合,X軸方向與曲面切向方向相同,Y軸方向始終垂直于曲面輪廓[21]。由圖3受力分析可知:
(1)
式中:TFx和TFy分別為傳感器坐標系{T}下Fx和Fy的力;θ為傳感器坐標系{T}的X軸方向XT和曲面坐標系{C}的X軸方向XC的夾角。

圖1 機器人曲面恒力跟蹤實驗平臺模型Fig.1 Experimental platform model of robot constant-force curved-surface-tracking

圖2 機器人模型末端局部圖Fig.2 Partial view of end-effector of robot model

圖3 機器人末端受力分析Fig.3 Analysis of force on robot end-effector
將式(1)解耦可得
(2)
式中:TFx和TFy的大小可通過六維力傳感器測得。
由于夾角θ未知,需要對其進行估計,根據Vx和Vy方向的位移差分可得到每一步長的切線傾斜角,即
(3)

當使用機器人進行曲面恒力跟蹤時,為了得到精確的軌跡,需要對曲面進行重復多次的跟蹤,在這種情況下,可以使用迭代學習技術來逐漸提高跟蹤性能[22]。
當機器人末端與曲面相接觸時,實際接觸力與期望接觸力滿足如下阻抗模型:
(4)
式中:f為實際的接觸力;fd為期望的接觸力;x為機器人末端的位置;xr為參考運動位置;M、B、K分別為質量矩陣、阻尼矩陣和剛度矩陣。
當機器人與環境接觸時,常將環境當作線性彈簧[23],接觸力可表示為
f=-Ke(x-xe)
(5)
式中:Ke為環境的剛度矩陣;xe為環境的位置。
所以當機器人末端位置為參考位置xr時,對應接觸力為
fr=-Ke(xr-xe)
(6)
由式(4)~式(6)得
-(K+Ke)(x-xr)
(7)
參考文獻[7]設計迭代學習控制律,將式(7)化為
fd(t)-fr(t)=-(K+Ke)Δxk(t)+Dk(t)
(8)
式中:t為時間;非負整數k(k∈Z+)為迭代次數;Δxk(t)為控制的末端軌跡偏移調整量;Dk(t)為機器人系統參數不確定項和干擾。
為了方便起見,將式(8)化為
(9)
式中:m=M/(Ke+K);b=B/(Ke+K);Δf=fd-fr;dk(t)=Dk(t)/(K+Ke)。
假設系統參數未知,且系統滿足如下假設:
假設1系統的初始狀態一致且可重復,即x1(0)=x2(0)=…=xk(0)。



由式(9)所示系統以及假設1~假設4,設計迭代學習控制律為
(10)
式中:
(11)

1) 第1步:證明Wk的遞增性。
取如下Lyapunov函數:
(12)

(13)
則
(14)


(15)

(16)
由假設3和假設4可得
(17)
將式(10)、式(11)和式(17)代入式(14)得
(18)
式(18)說明Wk是非增序列,現只要證明W0有界就說明了Wk是有界的。
2) 第2步:證明W0的有界性。
對W0求導可得
(19)

(20)

(21)
對于λ>0,如下不等式
(22)
恒成立,則可得
(23)
(24)



Wk可改寫為
(25)
由式(18)可得
(26)
由式(26)可推得
(27)

第2節中已經設計了針對機器人末端位置控制量和位置參考量之間修正量的迭代學習控制律,因此當獲得機器人末端位置參考控制量時,便可對機器人進行恒力跟蹤控制。當機器人末端與環境接觸時,如果環境的剛度Ke和位置xe已知,則可根據設定的恒力fd獲得機器人的末端參考位置[24]為
(28)
實際接觸過程中,環境的剛度Ke和位置xe是很難測得的,所以就必須通過在線估計的方法求得參考位置xr。參考文獻[24]的方法[25],使用PID控制律進行在線估計:
(29)
為了避免誤差積累[26],用前一采樣時刻的接觸位置x(t-1)代替上一控制周期的參考位置xr(t-1),可得
(30)
由式(10)、式(11)和式(30)得機器人末端位置控制律為
(31)

根據式(31)設計的機器人末端位置控制律,設計機器人的控制框圖如圖4所示。

圖4 基于自適應迭代學習算法的力/位混合控制Fig.4 Hybrid force/position control based on adaptive iterative learning algorithm


圖6 探頭尺寸Fig.6 Size of probe detector

圖7 曲面工件尺寸Fig.7 Size of curved-surface workpiece

圖8 沒有迭代的跟蹤過程Fig.8 Tracking process before iteration

圖9 迭代1次、7次和15次的跟蹤過程Fig.9 Tracking process after 1 iteration,7 iterations and 15 iterations

表1 誤差分析Table 1 Error analysis

圖10 工件曲線與實際跟蹤曲線軌跡對比Fig.10 Comparison between curve of workpiece and curve of tracking trajectory

圖11 沒有迭代與迭代15次之后的跟蹤曲線軌跡對比Fig.11 Comparison between curve of tracking trajectory without iteration and curve of tracking trajectory after 15 iterations
1) 針對使用機器人進行打磨、拋光、去毛刺過程中難以得到穩定接觸力的問題,對曲面工件輪廓恒力跟蹤控制進行研究。對機器人末端執行器與曲面接觸進行了受力分析,得到各個坐標系間的映射關系,構建了法向接觸力和傳感器采集的力信號之間的映射關系。
2) 利用機器人和環境接觸時的阻抗模型設計了一種針對機器人末端位置控制量和位置參考量之間修正量的自適應迭代學習控制律,并通過構建Lyapunov能量函數對迭代學習控制律進行了收斂性分析和證明。
3) 將迭代學習控制律與力/位混合控制方法結合起來,用于機器人的曲面恒力跟蹤中。實驗表明,使用基于自適應迭代學習算法的機器人力/位混合曲面恒力跟蹤控制方法可以實現恒力跟蹤控制,并且經過15次迭代后得到的接觸力誤差絕對值平均值相比于沒有迭代時減少了79%,誤差標準差減少了64%,誤差方差減少了87%,同時曲面跟蹤精度提高。
本文提出的控制方法得到的軌跡可以用于機器人打磨、拋光、去毛刺時對工件輪廓進行跟蹤,具有一定的法向接觸力控制精度。