999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于外環速度補償的封閉機器人確定學習控制

2023-09-27 23:33:58林梓欣楊辰光
自動化學報 2023年9期
關鍵詞:系統

王 敏 林梓欣 王 聰 楊辰光

近年來,機器人在工程應用和日常生活中發揮著越來越重要的作用,被廣泛應用于空間探測、焊接、裝配、醫療等領域,相關技術也越來越受到科研人員重視[1-3].在機器人控制領域,其控制目標之一就是實現機器人對特定任務軌跡的跟蹤.多自由度機器人作為一個高度耦合的非線性多輸入多輸出系統[4],主要控制難點在于機器人工作環境任務多變,在外界擾動、負載變化、參數測量不精確等因素影響下,機器人系統精確建模難度較大,使得比例積分微分(Proportional-integral-derivative,PID)控制等經典控制算法難以滿足機器人控制的精度要求.針對機器人系統存在部分參數不確定或測量不準確的問題,一些學者結合魯棒控制、滑模控制等思想,提出了許多有效的自適應控制算法[5-7].當機器人系統存在不可建模動態時,一些學者結合神經網絡的非線性函數逼近特性,提出了大量的自適應神經網絡控制方案,保證了機器人在多變環境下的高性能控制[8-12].

值得注意的是,上述控制方案大多數都是基于力矩進行控制器設計,其方案有效性主要是通過數值系統仿真進行驗證,鮮有在實際機器人上進行實驗和應用.造成上述現象的原因是,當前市面上大部分工業/商業機器人并不開放力矩接口,而是采用速度/位置控制.這些封閉機器人采用標準的內外環控制結構,其中外環為運動學環,內環為動力學環,內環控制的采樣速率一般比外環要快得多,且普遍認為其內環控制使用速度比例積分(Proportional-integral,PI)控制器或位置PID 控制器[13].封閉機器人的這些性質,導致用戶一般只能對其進行簡單的運動學控制[14],從而使得機器人難以應對多變的個性化產品加工.針對這類具有內外環結構的機器人的控制問題,部分學者提出了解決方案.文獻[5,15]在研究具有未知動力學和未知運動學的機械臂控制時,提出了適當的自適應控制器.文獻[16]研究了一類具有關節速度反饋內環的機器人任務空間控制問題,提出了一種基于模型的內環關節速度控制器通用結構[17].注意到,上述控制方案中跟蹤誤差的收斂依賴于內環速度控制器的修改或再設計,并不是常見的速度PI 控制器或位置PID 控制器,對于具有不可修改內環的工業/商業機器人而言,這些控制方案也難以實現應用.進一步,一些學者提出了預校正方案[18],這些預校正方案的有效性驗證主要是通過直觀解釋和實驗結果進行的,并沒有進行嚴格理論分析.針對封閉機器人控制存在的上述問題,文獻[19]在考慮機器人具有可以線性參數化的未知動力學和運動學且內環控制器參數未知和不可修改的背景下,設計了一類外環自適應速度補償控制器,保證了機器人系統的穩定性和誤差收斂.該方案需要計算動力學和運動學回歸矩陣,這兩個矩陣隨著機械臂關節增多,計算的復雜度呈指數倍增長.此外,實際機器人系統由于受到阻尼以及摩擦力等影響,存在本質的非線性.因此,如何提出簡單有效的封閉機器人控制方案,既能實現封閉力矩的補償控制,又能精確建模未知非線性仍是一個開放性的問題.

眾所周知,神經網絡是建模未知非線性的有效方法[20].然而,現有的大部分自適應神經網絡控制并沒有充分利用神經網絡的學習能力,即使是處理相同的任務也需要對神經網絡進行重復訓練,該過程耗時長、計算資源消耗大、暫態階段的控制性能也較差.因此,如何實現神經網絡在控制過程中的學習和經驗知識再利用是一個很有意義的課題[21].對此,文獻[22]提出確定學習理論,解決了神經網絡對未知動態的學習問題.該理論證明了沿著回歸軌跡的徑向基函數(Radial basis function,RBF)神經網絡滿足持續激勵(Persistent excitation,PE)條件,進一步結合線性時變系統指數穩定性證明了神經網絡權值的精確收斂.基于該理論,文獻[23]引入動態面技術,解決了自適應神經網絡在嚴格反饋系統中的學習問題.近年來,確定學習理論也已被廣泛應用于機器人編隊控制[24]、心肌缺血早期診斷[25]、水面無人船控制[26]等領域,在機械臂控制領域也有相關工作[27].然而,現有基于確定學習的控制方案仍是基于力矩進行設計的,無法在封閉的工業/商業機器人上直接進行應用.

綜上所述,本文針對未開放力矩接口的一類封閉機器人系統,在考慮機器人受到未知動力學影響且具有未知內環PI 速度控制器的情況下,基于文獻[19]的外環補償框架提出了一種基于外環速度補償的確定學習控制方案,實現了封閉機器人的關節軌跡跟蹤控制.該方案的主要貢獻點如下: 1)在文獻[19]的工作基礎上,引入神經網絡處理系統未知動態,取消了封閉機器人未知動力學模型參數線性化假設,并簡化了外環補償控制設計過程;2)采用寬度RBF 神經網絡動態增量神經網絡節點,降低了網絡結構復雜度,改善了系統控制的實時性;3)引入確定學習理論,實現了寬度RBF 神經網絡對封閉機器人未知動態的精確學習,并利用經驗知識避免了對網絡重復訓練,降低了計算負擔,實現了快穩準的高精度跟蹤控制;4)為確定學習理論應用于具有類似結構的封閉機械系統提供了研究思路,拓展了確定學習的應用范圍.

1 問題描述及預備知識

1.1 系統說明與控制目標

本文所考慮的由永磁直流電動機驅動的n自由度機器人動力學模型[19]如下

其中,x1∈Rn是機器人關節角位置;M(x1)∈Rn×n是機器人的慣性矩陣;C(x1,)∈Rn×n是機器人的科氏力矩陣;G(x1)∈Rn是機器人的重力向量;K ∈Rn×n是機器人內部的控制增益,為一常值對角正定矩陣;u∈Rn是封閉機器人的內環控制器.

性質 1.機器人動力學方程的慣性矩陣M(x1)是對稱并一致正定的,且具有一致的界限,存在正常數λm和λM使得λmI ≤M(x1)≤λMI,其中I為適當定義的單位矩陣.

性質 2.可以通過適當定義機器人動力學方程的科氏力矩陣C(x1,),使得(x1)-2C(x1,)是斜對稱矩陣.

在研究的封閉機器人內外環控制方法中,本文考慮內環控制器為PI 速度控制器[19],結構如下

考慮如下光滑有界參考模型,該模型將產生封閉機器人的關節期望軌跡

其中,xd1∈Rn和xd2∈Rn分別是封閉機器人期望的關節角位置和角速度,f(xd1,xd2)是給定的光滑非線性函數,yd=xd1是封閉機器人期望輸出.本文假設期望輸出yd為周期軌跡.

本文的控制目標是基于外環速度補償控制思想,在考慮封閉機器人具有不確定動力學和未知參數內環控制器的情況下設計系統(1)的速度控制指令,從而確保: 1)機器人系統的所有信號都是最終一致有界的;2)系統的輸出x1能夠跟蹤給定的期望輸出軌跡yd;3)在控制過程中學習機器人內部未知動態,并利用學到的未知動態知識實現封閉機器人高精度跟蹤控制.控制方案框圖如圖1 所示.

圖1 封閉機器人控制系統框圖Fig.1 Schematic diagram of manipulators with closed architecture control system

1.2 RBF 神經網絡

1)RBF 神經網絡的萬能逼近特性: 為逼近機械臂控制過程中的未知非線性動態,本文使用如下形式的RBF 神經網絡

那么向量函數S滿足PE 條件,其中I定義為s×s維的單位矩陣.

引理 1[22]. RBF神經網絡的局部PE條件: 考慮任意回歸/周期軌跡Z,假設Z是從[0,∞)到Rq的連續映射,且Z位于緊集 ?Z ?Rq中.則對于中心置于規則晶格(足夠大到覆蓋緊集 ?Z)上的RBF神經網絡,只有中心位于回歸/周期軌跡Z的小鄰域內的神經元才會被激勵,由其組成的回歸子向量Sζ(Z)將滿足PE 條件.

1.3 寬度RBF 神經網絡

在傳統的RBF 神經網絡逼近中,需通過選取合適的神經元節點數、中心和寬度來保證逼近精度,而在實際應用中通常需要設計者根據自己的經驗不斷試錯,采用均勻布點的方式來設計RBF 神經網絡的結構,具有很強的主觀性.同時,機器人控制系統是一個多輸入多輸出系統,隨著控制連桿數量的增加,RBF 神經網絡的輸入維數會呈幾何倍數增長,在均勻布點的設計方案下,神經元數量也會急劇升高,這將導致神經網絡的計算負荷提高,對硬件設備提出了更高的要求,同時也將影響系統控制的實時性.為了解決上述問題,本文將使用文獻[29]所提出的寬度RBF 神經網絡方法進行網絡結構設計.該方法結合寬度神經網絡增量節點的思想,可實現在系統控制過程中神經元的自適應調整.

寬度RBF 神經網絡在初始化階段以系統的初始狀態為第一個神經元,之后會根據神經網絡的實際輸入與網絡已有神經元中心的距離來判斷是否應該新增神經元.新增神經元的增加策略如下:

1)定義新增神經元所需參數

其中,ξn,ηn,Wn分別是新增神經元的中心、寬度和權值,本文新增神經元的寬度設置與已有神經元一致,權值統一初始化為零.

2)判斷當前網絡輸入是否超出現有神經元所構成的緊集域

首先,本文使用歐氏距離來描述當前網絡輸入與神經元中心點的距離,根據距離選取離當前輸入最近的k個點集Cmin={c1,···,ck},則可由下式獲得新增神經元的中心

然后,設置判斷是否新增神經元的可調閾值ε,當神經網絡當前輸入Z與神經元集合Cmin的平均中心位置之間距離大于閾值ε時,添加新的神經元,否則保持原有神經元集合不變.

2 外環自適應神經網絡速度控制指令設計

本節將針對系統(1),采用反步法進行基于外環補償的速度控制指令設計.首先將封閉機器人系統的內環速度PI 控制器(2)代入系統(1),將系統(1)轉化為如下形式

其中,KP=KKp,KI=KKi,y是機器人系統輸出關節角位置,y=x1.

根據傳統反步法設計思想,定義如下誤差變量

其中,α1是虛擬控制器.考慮系統(8),接下來的反步設計包括兩個步驟,將依次設計出虛擬控制器α1和速度控制指令.具體設計過程如下:

步驟 1.考慮系統(8)以及誤差定義(9),對z1求導得

根據式(10),虛擬控制器α1可設計為

其中,c1為控制增益,且為正的設計參數.

步驟 2.根據誤差定義(9),對z2求導可得

考慮封閉機器人系統具有未知的動力學和內環速度PI 控制器,定義未知系統動態為

其中,c2是速度控制指令q˙c的控制增益,且為正的可設計參數;γ,σ分別是神經網絡權值估計值更新率的控制增益和σ修正項,均為正的待設計參數.

注 1.在考慮未知動力學影響的機器人自適應神經網絡控制器設計中,現有大部分成果均為力矩控制器,無法應用于本文所考慮的封閉機器人系統.本文在機器人具有未知不可修改內環速度PI 控制器的背景下,設計了與內環相匹配的外環自適應神經網絡速度控制指令.該指令與常見力矩控制器的代數方程形式不同,是一個關于qc的一階微分方程,通過求解該微分方程,可以獲得輸入機器人系統的速度控制指令q˙c和位置控制指令qc,同時,RBF 神經網絡的應用使該速度控制指令具有適應機器人未知動力學影響和未知內環控制器的能力.

注 2.與現有基于反步法的自適應神經網絡力矩控制器相比,本文所設計速度控制指令在神經網絡輸入上將多出一個信號qc.這是因為在控制器設計過程中,為了處理內環速度PI 控制器的未知參數K,Kp,Ki帶來的不確定性,本文在定義未知系統動態的時候將考慮在內,從而有助于后續的控制器設計以及未知動態的精確神經網絡逼近.

至此,可得封閉機器人的閉環系統動態如下

定理 1.考慮由封閉機器人系統(8)、參考模型(3)、自適應神經網絡速度控制指令(16)和神經網絡權值估計值更新率(17)所組成的閉環系統,那么對于任意給定的常數μ>0 以及所有滿足V(0)≤μ的系統初始狀態,則通過選取合適的設計參數c1,c2,γ和σ,可以使得閉環系統中的所有信號是最終一致有界的,并且跟蹤誤差z1,z2能夠收斂到零的小鄰域內.

證明.選取如下Lyapunov 函數

結合機器人動力學方程性質2,沿系統(18)所產生的軌跡對所選Lyapunov 函數求導可得

利用Young 不等式對Lyapunov 函數的導數放縮得

其中,λmin(KP)是矩陣KP的最小特征值.

結合式(19)和式(21)可得

至此,只要選擇a>b/μ,那么可以保證當V=μ時,≤0,因此V ≤μ是一個不變集,即對于任意滿足V(0)≤μ的初始條件,對于任意t>0,有V(t)≤μ.進一步,對式(22)積分可得

從上式可知,通過選取合適的設計參數c1,c2,γ,σ,可使得θ任意小.因此,閉環系統中的所有信號是最終一致有界的.

進一步,從式(19)及式(23)可得

從上述分析可知,選取合適的設計參數可使θ任意小,即ν1,ν2可以任意小,因此跟蹤誤差z1,z2可以在有限時間T1內收斂到零的小鄰域內.

3 基于確定學習的速度補償控制

在第 2 節,本文針對封閉機器人系統(8)設計了外環自適應神經網絡速度控制指令(16)以及神經網絡權值估計值更新率(17),并證明了系統在該控制指令的作用下是最終一致有界的,且系統跟蹤誤差可在有限時間T1內收斂于零的小鄰域內.本節將基于確定學習理論[22],進一步驗證神經網絡對封閉機器人系統(8)未知動態的準確學習,且實現學習后的常值神經網絡權值的表達與存儲.

其中,?1(Z1)是神經網絡對未知系統動態的逼近誤差,且‖?1(Z1)‖≤??,??是一個任意小的正整數,且常值神經網絡權值的表達式為

其中,tb >ta >T1,[ta,tb] 是系統達到穩態后的一段時間.

證明.證明分為以下兩個部分進行:

1)神經網絡輸入Z1回歸性證明.

定理 3.考慮由封閉機器人系統(8)、參考模型(3)、基于確定學習的速度控制指令(31)所組成的閉環系統,對于任意給定的常數ρ>0 以及所有滿足U(0)≤ρ的系統初始狀態,則通過選取合適的待設計參數c1,c2可使得閉環系統中的所有信號是最終一致有界的,并且跟蹤誤差z1能夠收斂到零的小鄰域內.

該證明與定理1 的證明過程類似,此處略.

注 3.基于自適應神經網絡的速度補償控制方案需要在線自適應調整神經網絡估計權值,主要適用于控制任務變化的工作場景.基于確定學習的速度補償控制方案包括兩個工作階段: 神經網絡訓練和經驗利用.神經網絡訓練階段,即自適應調節過程,該階段適用任務多變的工作場景;經驗利用階段,即利用訓練階段獲取的未知動態知識構造神經網絡學習控制器,提升系統的暫態控制性能和降低在線計算量,主要適用于與訓練階段控制任務相同或相似的工作場景.

4 實驗驗證

為驗證本文所提方案的有效性,本節將分別在雙連桿封閉機器人數值系統和實際UR5 機器人平臺上進行實驗驗證.UR5 機器人作為市面上常見的工業機器人,其力矩控制接口不予開放,一般只可做運動控制,符合本文封閉機器人的研究背景.

4.1 數值仿真

本節將對定理1 所提自適應控制方案以及定理3 所提學習控制方案進行對比實驗,以驗證RBF神經網絡在穩定自適應控制過程中的學習和知識再利用能力,并分別使用均勻布點和寬度RBF 神經網絡兩種網絡構造方式完成上述對比實驗,以驗證寬度RBF 神經網絡的優越性.考慮由(1)和(2)組成的雙連桿封閉機器人動力學模型

其中,x1=[x1,1,x1,2]T,x1,1和x1,2分別代表封閉機器人的關節1 角位置和關節2 角位置,且各矩陣為

寬度RBF 神經網絡方案下的仿真結果如圖2~圖5 所示.圖2~圖4 展示了封閉機器人系統在自適應控制階段的控制效果,從圖2 可以看出機器人的關節輸出均很好地跟蹤上了給定的期望軌跡,圖3表示RBF 神經網絡的權值在一段控制時間后實現了收斂,圖4 表示RBF 神經網絡成功逼近未知動態,驗證了網絡的學習能力.圖5 展示了封閉機器人系統在不同控制方案下的控制效果.由圖可知,在僅依靠內環PI 控制的情況下,系統跟蹤誤差較大,外環補償控制的引入大幅度提高了系統跟蹤精度.進一步,學習控制階段的控制效果與自適應階段的控制效果相比,暫態階段超調量更小,且暫態時間也更短,在7 s 左右跟蹤誤差就收斂到零附近,比自適應控制減少了約84%.

圖2 封閉機器人關節角位置跟蹤效果(自適應控制)Fig.2 Angular-position tracking performances of two joints for the manipulator with closed architecture(Adaptive control)

圖3 神經網絡權值范數Fig.3 The norm of neural network weights

圖4 神經網絡對未知動態 f (Z1)學習效果(自適應控制)Fig.4 Neural network's learning performance of unknown dynamics f (Z1)(Adaptive control)

圖5 封閉機器人關節角位置跟蹤誤差(控制方案對比)Fig.5 Angular-position tracking errors of two joints for the manipulator with closed architecture (Comparison of different control methods)

此外,本節在神經網絡節點的均勻布點和動態布點下,進行了控制方案的性能對比實驗研究.在實驗中,均勻布點方案下控制器參數設置如下:c1=0.9,c2=0.8,γ=0.4,σ=0.00012,選取含有6561個神經元的RBF 神經網絡.對比實驗結果見表1.表1 中,ANC 表示自適應神經網絡控制,LC 表示學習控制.從表1 數據可知,寬度RBF 神經網絡的使用有效降低了神經元的數量,進而大幅減小神經網絡計算負荷,因此使用寬度網絡的控制方案在仿真時長上遠遠小于使用均勻布點的控制方案,從平均絕對誤差(Mean absolute error,MAE)可知,寬度網絡的使用基本實現了機器人對期望軌跡的有效跟蹤,但跟蹤效果稍差于均勻布點的控制方案.

表1 仿真結果對比Table 1 Comparison of simulation results

4.2 實物實驗

為進一步驗證所提方案的有效性,本節將在UR5 機器人上進行實驗,取機械臂第2、3 關節為控制對象.UR5 機器人由機器人本體、控制箱、示教器和計算機組成.計算機運行Matlab 程序實時計算速度控制指令,并通過有線網絡將指令傳輸給機器人控制箱以及獲取所需機器人狀態.實驗所選期望軌跡為yd=[0.5 sin(0.5t),0.5 sin(0.5t)]T,系統初始狀態為x1=[0,0]T,x˙1=[0,0]T,仿真步長為40 ms.自適應控制階段時長為400 s,學習控制階段時長為100 s.控制器參數設置如下: 初始神經元設置為[0,0,0,0,0.5,0.5,0.2,0.2],c1=1.8,c2=0.4,γ=0.12,σ=0.002,ε=0.15,β=0.95,神經元寬度為[0.3,0.3,0.3,0.3,0.3,0.3,0.3,0.3].

圖6 展示了UR5 機器人運動過程中不同時間下的運動狀態,實驗結果如圖7~圖9 所示.圖7、圖8 展示了機器人在自適應階段的控制效果.在圖7中,本文根據圖6 標定了機器人在對應時刻下的關節角位置.結合圖6 和圖7 可知,UR5 機器人的關節角很好地跟蹤上了給定的期望軌跡,從圖8 可知,神經網絡權值在有限時間內成功收斂.圖9 展示了機械臂在學習控制階段的控制效果,圖9 中結果與數值仿真的結果一致,通過神經網絡對知識的再利用,學習控制階段的跟蹤誤差更快地收斂,暫態時間更短,暫態誤差也更小.

圖6 UR5 機器人不同時間運動位置Fig.6 Positions of UR5 at different times

圖7 UR5 機器人關節角位置跟蹤效果(自適應控制)Fig.7 Angular-position tracking performance of UR5(Adaptive control)

圖8 神經網絡權值范數Fig.8 The norm of neural network weights

圖9 UR5 機器人關節角位置跟蹤誤差(學習控制對比)Fig.9 Angular-position tracking errors of UR5(Compared to learning control)

5 總結與展望

本文針對未開放力矩控制接口的封閉機器人系統,提出了一種基于外環補償的自適應神經網絡速度控制方案.與現有大部分自適應神經網絡控制方案不同的是,本文所提方案的控制輸入為關節角速度而不是關節力矩,實現了自適應神經網絡控制算法在封閉機器人上的應用,并通過引入確定學習機制,充分發揮神經網絡的學習能力,提高了機器人在執行相同或相似任務時的控制性能.此外,利用寬度神經網絡的動態網絡布點方式,大幅降低了RBF 神經網絡結構的復雜度,減小了設備計算負荷,提高了系統控制實時性.本文所提控制方案針對的是機器人關節空間控制,在未來的工作中,將逐步將其拓展到機器人任務空間控制、阻抗控制等,提高該控制方案的工程應用價值.

猜你喜歡
系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
基于UG的發射箱自動化虛擬裝配系統開發
半沸制皂系統(下)
FAO系統特有功能分析及互聯互通探討
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
一德系統 德行天下
PLC在多段調速系統中的應用
主站蜘蛛池模板: 亚洲天堂网在线观看视频| 91亚洲视频下载| 99在线免费播放| 成人免费午间影院在线观看| 四虎精品国产AV二区| 狠狠操夜夜爽| 亚洲三级网站| 国产欧美在线观看一区| 又黄又爽视频好爽视频| 老司国产精品视频91| 免费av一区二区三区在线| 在线播放国产一区| 无码又爽又刺激的高潮视频| 亚洲国产高清精品线久久| 伊人91视频| 国产精品第页| 在线欧美a| 国产96在线 | 一本无码在线观看| 亚洲AV无码一二区三区在线播放| 国产欧美日韩18| 日韩精品成人在线| 国产91小视频| 久久91精品牛牛| 国产91在线|中文| 国产激爽大片高清在线观看| 亚洲看片网| 亚洲女同欧美在线| 亚洲午夜福利精品无码| 成人亚洲国产| 91麻豆精品国产高清在线| 国产精品自在拍首页视频8 | 国产爽爽视频| 播五月综合| 精品无码专区亚洲| 97在线公开视频| 香蕉久久永久视频| 91精品在线视频观看| 色综合热无码热国产| 国产高清免费午夜在线视频| 色久综合在线| 114级毛片免费观看| 亚洲天堂免费在线视频| 国产在线观看成人91| 四虎永久免费在线| 青青热久免费精品视频6| 精品福利国产| 亚洲一区二区三区香蕉| 欧美精品一区二区三区中文字幕| 欧美不卡在线视频| 久久黄色一级片| 久久综合国产乱子免费| 真人高潮娇喘嗯啊在线观看| 亚洲视频三级| 色国产视频| 国产精品第一区| 在线综合亚洲欧美网站| 小说区 亚洲 自拍 另类| 亚洲视频欧美不卡| 99久久精品免费看国产电影| 精品精品国产高清A毛片| 伊伊人成亚洲综合人网7777| 青青操国产| 亚洲欧洲日韩国产综合在线二区| 欧美日韩一区二区在线免费观看 | 在线免费不卡视频| 在线观看国产精品日本不卡网| 国产色伊人| 国产女人爽到高潮的免费视频 | 国产成人永久免费视频| 18禁高潮出水呻吟娇喘蜜芽| 亚洲男人天堂久久| 在线亚洲精品福利网址导航| 国产成人精品一区二区不卡| 久久特级毛片| 久久精品国产亚洲AV忘忧草18| 欧美一区二区丝袜高跟鞋| 久久特级毛片| 欧美色视频在线| 国产成人午夜福利免费无码r| 久久综合激情网| 国产精品妖精视频|