王露,劉霞
(西華大學電氣與電子信息學院,四川 成都 610039)
在機器人的很多應用領域中,機器人都需要完成與環境進行交互的任務,如打磨、裝配等任務[1-4]。這些任務不僅要求對機器人末端執行器的位置進行控制,還要求末端執行器對未知的約束環境接觸面具有適應性。要實現這個目的,一種方法是可以引入一些機械元件,如電纜驅動機械手等,然而這些元件可能會降低控制性能[5-6]。另一種方法是采用有效的控制策略,目前主要使用的是阻抗控制和混合位置/力控制(hybrid position/force control,HPFC)[7-8]。但是阻抗控制容易受到環境動力學和期望阻抗模型參數的影響。而混合位置/力控制的原理是利用所有驅動關節來控制自由運動方向上的位置,同時控制機器人位置受約束方向上的力,因此混合位置/力控制更適合處理環境不確定的實際問題[9]。
就機器人本身來講,它是一個高耦合、高時變和多輸入輸出的非線性系統,為了提高非線性機器人系統的混合位置/力控制的性能,學者們進行了大量研究[10-26]。文獻[10]提出了基于神經網絡的混合位置/力跟蹤控制方案,以控制基于神經網絡的速度觀測器的機器人系統,但是在神經網絡結構中難以確定隱藏層和神經元的數量。文獻[11]提出了一種模糊混合位置/力控制方法,位置控制采用傳統PID,力控制采用模糊PI。然而該方法并不能實時更新模糊規則中的權重,很難精確補償控制誤差。此外,神經網絡和模糊控制算法都是通過學習來逼近機器人的非線性未知模型,計算復雜。
與復雜的神經網絡和模糊控制相比,時延控制(time delay control,TDC)可以抵消機器人系統中的所有非線性未知模型,是一種更為簡單實用的方法。文獻[12]首次提出TDC,TDC 采用了時延估計(time delay estimate,TDE)技術,利用前一個采樣時刻的時滯信息來估計和補償機器人復雜的未建模動力學和外部干擾,從而抵消機器人系統中的所有非線性項。由于TDC 在具有簡單、高效、不需要依賴模型等優點的同時具有強魯棒性,它已被應用于各個領域[13-15]。然而,傳統的TDC 并不完善,主要是由于TDE 和真實信息之間存在誤差,該誤差被稱為TDE 誤差。近年來,許多研究將TDC 與其他輔助控制方法如梯度估計器[16]、終端滑模控制[17]、自適應滑模控制[18]等結合,這些方法相比于傳統的TDC更好地抑制了TDE 誤差。但是,這些方法中通常都是采用一個恒定的控制增益,且通常是通過調試和試錯的方法得到的,所以該過程非常耗時[19]。
此外,當機器人與未知環境交互時,使用恒定增益的TDC 并不能很好地適應未知的外界條件,性能不夠理想,甚至可能導致系統不穩定。文獻[20]首次提出了一種TDC 的自適應規則,將Nussbaum函數改進并引入。然而其中的自適應律是基于角加速度,使用數值微分,可能會產生噪聲,并且自適應增益的范圍十分有限;因此該方法不容易獲得精確的控制性能。文獻[21]中設計的自適應控制增益是基于滑動變量,其中阻尼項結合了滑模控制,實現了比文獻[20]更穩定的控制效果。然而由于阻尼項的存在,自適應律可能要很長時間才能收斂到平衡點。為了解決以上問題,文獻[22]提出了一種新的自適應TDC,該自適應律基于不含阻尼項的滑動變量,該滑動變量與阻尼項的大小成正比。這種方法雖然有效,但是因為包含一個連續函數,在控制增益抖動時可能會使得系統的跟蹤性能和魯棒性降低。文獻[23]在文獻[22]的基礎上進行改進,將控制增益構造為具有快速自適應能力的連續函數,可以補償自適應時延控制中的抖振。但是該方法只適用于單輸入單輸出系統。文獻[24]結合分數階終端滑模對控制增益設計了一種非線性自適應律來提高系統性能,控制增益由兩部分組成,一部分是常量部分,一部分是可變部分。由于自適應僅對可變部分進行調整,而可變部分占控制增益的比例很小,因此增益變化受到明顯的限制,并且,兩部分所占的比例必須通過試錯調整,否則閉環系統可能不穩定。文獻[25]結合非線性期望誤差動力學和一個新的滑動變量,實現穩定的自適應增益。文獻[26]針對有效負載變化的問題,提出了一種自適應增益動態系統,且相比于其他自適應方法需要調節的參數更少。然而,以上文獻中都只考慮了機器人的位置跟蹤控制,并沒有考慮到機器人的力跟蹤控制。
本文設計了一種基于時延控制的自適應混合位置/力控制算法,同時對機器人的位置和力進行控制。該算法采用TDC 來獲得不需要依賴模型的特性和良好的位置跟蹤性能,并通過控制增益的自適應律來減小由于不確定環境而引起的TDE 誤差。進一步,采用遞推最小二乘法來實現對環境接觸力的估計。所提方法對未知環境具有適應性,可以使機器人末端執行器沿著期望軌跡運動,且與接觸面保持期望的接觸力,保證位置和力軌跡的精確性。
一個n自由度(n-DOF)機器人系統在m維度的空間運動時,其動力學模型[27]為
式中:Fp為位置控制子系統的輸入力矩;Ff為力控制子系統的輸入力矩。
基于TDC 的自適應混合位置/力控制的思路框圖如圖1 所示。將位置和力控制分解到2 個正交的子系統。在位置控制子系統中,采用TDC 以抵消機器人系統的非線性項,并對控制增益設計自適應律來減小由于接觸環境的不確定性而引起的TDE 誤差,再計算得到位置控制力矩Fp。在力控制子系統中,通過遞推最小二乘算法在線辨識未知環境參數,并計算得到與環境的接觸力λ,經過空間轉換得到力控制力矩Ff。所提出的控制算法能夠實現機器人移動到期望位置qd的同時,使得實際接觸力達到期望的接觸力 λd。

圖1 基于TDC 的自適應混合位置/力控制框圖Fig.1 Control block diagram of adaptive hybrid position/force control based on TDC
2.1.1 傳統TDC
傳統的TDC 利用TDE 收集延時信息來抵消未知動力學和其他干擾,使用系統響應和控制輸入來直接修改控制器[10]。
在式(2) 的Fp中引入一個正定對角常數增益矩陣寫成
其中,
但是在現實中Sn很復雜且難以計算,因此采用時延估計(TDE)來獲取它的估計值
其中,L表示延時時間,當L足夠小時TDE(5) 可以較為準確地估計Sn,一般情況下L選擇為一段采樣時間,下標(t-L)表示為延時之后的值。
然而,在實際情況中會產生如下TDE 誤差
將式(5)、式(6) 代入式(3) 可以得到TDC 系統如下
結合式(3)—式(7),閉環動力學為
TDC 的穩定性條件[28-29]為
當滿足條件式(9)時,TDE 誤差式(6)有界。
2.1.2 自適應增益TDC 設計
首先定義一個滑動變量[30]如下
其中α ∈Rn×n為斜率增益。
則閉環動力學式(8)可以重寫為如下形式
由式(10)和式(11)可得
將式(8)、式(12)對比可得KD=2α,KP=α2。
所以,式(7)可以可改寫成如下形式
為了減小機器人與環境接觸時的TDE 誤差,采用滑動變量提出增益的自適應律
工作空間中的運動學表示如下
式中:x∈Rm×1表示機器人操作器的末端執行器在工作空間的位置向量;k表示機器人操作關節空間和工作空間之間的映射關系。
工作空間中的速度表示如下
其中雅克比矩陣J表示為
工作空間中的加速度表示如下
現將工作空間分成兩個子空間:與機器人末端執行器和環境接觸面垂直的法向v維空間和與環境接觸面相切的切向(m-v)維空間。因此,位置向量x在工作空間中可以寫成
式中:xτ∈Rm-v為位置向量的切向分量;xn∈Rv×1為位置向量的法向分量。假設接觸的環境是彈性的,則機器人末端執行器與環境的接觸力可以表示為
式中:λτ為相切于環境接觸面的接觸力;λn為垂直于環境接觸面的接觸力;Ke為環境的剛度;ω為接觸面的摩擦系數;為末端執行器的切向速度向量;xe為環境平衡位置。
由于環境的剛度Ke和平衡位置xe通常是未知的,該部分采用遞推最小二乘算法來在線辨識。遞推最小二乘算法不需要任何先驗知識,就可以實現參數的估計和更新,且收斂速度快。
設
選擇遞推最小二乘算法準則如下
為了選擇使準則式(23)最小的最佳估計值,遞推最小二乘算法的參數更新率設計如下
將式(15)和式(24)代入式(2),控制器最終可以寫為如下形式
定理1與未知環境交互的機器人系統(1)受自適應增益TDC(15)、遞推最小二乘算法(24) 組成的基于TDC 的自適應混合位置/力控制器(25)的作用,則系統是穩定的。
證明選取李雅普諾夫函數:
令:
將式(11)和式(14)代入式(30)可得
對V2求導得
將式(22)和式(24)代入式(32),可得
采用如圖2 所示的2-DOF 機器人進行仿真,仿真參數見表1,其動力學模型如下所述。

表1 兩連桿機器人的仿真參數Tab.1 Simulation parameters of two-link robot

圖2 兩連桿機器人Fig.2 Two-link robot model
仿真過程中,q1、q2分別為兩個關節的位置,期望值設為經過一次空間轉化可以得到機器人末端執行器在工作空間的期望位置。時延L設為一個樣本采樣時間,即L=0.001 s。垂直于接觸面上的力期望值設置為:λdn=35 N,平衡位置的初始值xe(0)=0.002 m,遞推最小二乘中的R(0)=0.2,初始環境剛度Ke(0)=20 N/m,摩擦系數ω=0.02。所涉及到的控制器參數取值為:α=[10,0;0,10],δ=0.00001,βii=0.02,=0.1,μ1=0.9,μ2=1.9,η=2000。將所提方法(ATDCHPFC)與基于傳統TDC 的混合位置/力控制(TDCHPFC)進行了比較,仿真結果如圖3—圖9 所示。
圖3(a)為所提方法在未知環境下相切于接觸面方向的位置軌跡跟蹤圖,可以看出機器人末端執行器沿著相切于接觸面的方向的實際位置軌跡可以迅速地跟蹤期望的位置軌跡,且在第7 秒期望位置發生改變時能夠進行自適應,再次跟蹤上改變后的期望位置。圖3(b) 為基于傳統TDC 混合位置/力控制的方法,可以看出跟蹤效果明顯更差,且在期望位置發生改變后,無法跟蹤上改變的期望位置。圖5 為未知環境下垂直于接觸面的方向上的力,從圖5(a)中可以看到機器人末端執行器在垂直于接觸面的方向的力能夠達到期望的接觸力λdn=35N,當期望位置發生改變后,該力仍然穩定在期望值。而傳統TDC 方法圖5(b) 當期望位置改變時,垂直于接觸面的方向的力發生波動,且超調量較大。此外,未知環境下機器人末端執行器的位置誤差和力誤差如圖4、圖6 所示,可以看出所提方法的位置誤差和力誤差相比于傳統TDC 方法都更小,且收斂速度更快。圖7 為對未知環境剛度的估計結果,所提方法圖7(a)可以實現對未知環境剛度的良好估計,且估計值收斂,而傳統TDC 方法圖7(b)的估計值波動明顯較多。圖8 為未知環境平衡位置的估計,所提方法圖8(a)的估計值收斂,且收斂速度比傳統TDC 方法圖8(b)更快。所提方法對控制增益的自適應調節如圖9 所示,可以看出系統經過短暫的一段時間就可以得出一個適應于當前環境的增益值,而在第7 秒期望軌跡發生變化時,也能夠迅速進行調整選擇一個新的控制增益來保持系統良好的控制性能。

圖5 垂直于接觸面方向上的力Fig.5 Force along xn-direction

圖6 垂直于接觸面方向上的力誤差Fig.6 Force errors along xn-direction

圖7 環境剛度估計Fig.7 Environment stiffness estimations results

圖8 環境平衡位置估計Fig.8 Position of equilibrium estimations results

圖9 自適應增益Fig.9 Values of adaptive gain
為了定量比較所提方法與傳統TDC 方法的位置和力跟蹤性能,計算了位置跟蹤的均方誤差ExMSE和力跟蹤的均方誤差EλMSE。計算結果如表2所示,可以看出所提方法的綜合性能優于基于傳統TDC 混合位置/力控制的方法,所提方法的位置誤差約為 0.016 m,力誤差約為 0.034 N。

表2 位置和力跟蹤誤差定量比較Tab.2 Quantitative comparison of position and force tracking errors
綜上,采用所提控制方法能夠在不確定環境下實現機器人末端執行器更好的位置和力跟蹤效果。
為了提高機器人與不確定環境交互時的位置和力跟蹤精度,提出了一種基于TDC 的自適應混合位置/力控制。在位置控制子系統中采用時延控制以抵消機器人系統的所有非線性項,并引入了一個自適應增益以適應未知的機器人接觸環境。在力控制子系統中將力分解為垂直于接觸面的力和相切于接觸面方向的力,在垂直方向通過遞推最小二乘算法在線辨識未知環境。該方法對未知環境具有較好的適應性,且可以同時保證機器人位置和力跟蹤的精確性。如何對本文的TDC 自適應混合位置/力控制方法進行擴展,并將其應用到受執行器故障影響的機器人系統的混合位置/力控制是下一步我們需要解決的問題。