姜毅龍,李許軍,王新震
(1.甘肅機(jī)電職業(yè)技術(shù)學(xué)院,甘肅天水741001;2.利曼機(jī)器人科技有限公司,北京100029)
基于自適應(yīng)自觸發(fā)遠(yuǎn)程控制的機(jī)器人路徑跟蹤研究*
姜毅龍1,李許軍1,王新震2
(1.甘肅機(jī)電職業(yè)技術(shù)學(xué)院,甘肅天水741001;2.利曼機(jī)器人科技有限公司,北京100029)
針對通過無線通信信道遠(yuǎn)程操控自主機(jī)器人的問題,以輪式移動機(jī)器人為研究對象進(jìn)行了運(yùn)動學(xué)分析并建立了運(yùn)動學(xué)模型。提出了用觸發(fā)條件調(diào)整跟蹤誤差的自觸發(fā)策略,實(shí)現(xiàn)了較好的跟蹤性能并減少了網(wǎng)絡(luò)信息傳輸量。以P3-DX移動機(jī)器人為平臺,對該策略進(jìn)行了仿真實(shí)驗(yàn),驗(yàn)證結(jié)果表明,與非自適應(yīng)自觸發(fā)策略相比,在網(wǎng)絡(luò)信息傳輸量減少的情況下,跟蹤性能幾乎沒有降低。
自適應(yīng)控制器;自觸發(fā);路徑跟蹤;P3DX機(jī)器人
隨著智能控制和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,在各種應(yīng)用中形成了空間分布式網(wǎng)絡(luò)控制系統(tǒng)(NCS),其中設(shè)備(包括傳感器和執(zhí)行器)和控制器、終端和控制中心之間的通信都是通過有限帶寬的共享數(shù)字網(wǎng)絡(luò)實(shí)現(xiàn)的。當(dāng)前,傳統(tǒng)的周期性信息交互法實(shí)時(shí)控制存在兩個主要問題:(1)可用的電子資源的使用效率低;(2)通信信道過載。于是一種新的控制技術(shù)即自適應(yīng)自觸發(fā)技術(shù)[1、2、6]便應(yīng)運(yùn)而生了。
本文將這種技術(shù)應(yīng)用于先鋒P3-DX移動機(jī)器人遠(yuǎn)程遙控中,實(shí)現(xiàn)最小化無線通信負(fù)載,使其它應(yīng)用能夠共享信道帶寬和機(jī)載電子資源,在跟蹤性能沒有顯著降低的情況下,大大減少了無線網(wǎng)絡(luò)的業(yè)務(wù)量。
在移動機(jī)器人的研究和教學(xué)領(lǐng)域,美國的MobileRobots公司開發(fā)出了一系列適合研究的機(jī)器人本體,并提供了與機(jī)器人本體和附件設(shè)備相配套的大量的客戶軟件,其中最主要的是ARIA(高級機(jī)器人應(yīng)用接口)軟件。它是運(yùn)行在機(jī)器人上位機(jī)并作為客戶端和下位機(jī)服務(wù)器端實(shí)時(shí)通信的高性能接口開源軟件類庫,該類庫采用C++編程語言實(shí)現(xiàn),用戶可以按照自己的需求修改和擴(kuò)展,支持從機(jī)器人基本的通訊、路徑規(guī)劃一直到機(jī)器人的導(dǎo)航與定位等進(jìn)行特定的編程和應(yīng)用。
P3-DX是目前世界上最成熟的輪式移動機(jī)器人實(shí)驗(yàn)平臺之一[3、7],其結(jié)構(gòu)采用上下位機(jī)模型架構(gòu),并采用前兩輪驅(qū)動后一輪導(dǎo)向的差分驅(qū)動方式。其豐富的軟件包可管理機(jī)器人平臺及機(jī)器人的各種傳感器附件,且代碼完全開放,可以滿足不同層次的開發(fā)需要。P3-DX機(jī)器人實(shí)體及結(jié)構(gòu)圖如圖1所示。

圖1 P3-DX機(jī)器人實(shí)體及結(jié)構(gòu)圖
3.1 運(yùn)動學(xué)模型建立
為整個機(jī)器人運(yùn)動推導(dǎo)出一個模型,必須建立統(tǒng)一的參考框架來表達(dá)各輪的力和約束。在整個運(yùn)動學(xué)分析過程中,將機(jī)器人建模成可運(yùn)行在水平面上的一個剛體。為了確定機(jī)器人在平面中的位置,我們建立了平面全局參考框架和機(jī)器人局部參考框架之間的映射關(guān)系[2],如圖2所示。P3-DX移動機(jī)器人前部的兩個驅(qū)動輪是由兩個獨(dú)立的電機(jī)驅(qū)動,完成各種基本的動作都是通過分別控制左右輪的輪速來實(shí)現(xiàn)的。另一個輪子是在移動機(jī)器人后部的從動輪(見圖1)。

圖2 移動機(jī)器人全局參考框架和局部參考框架
令D和r分別表示車輪軸線的長度和驅(qū)動輪的半徑、vL和vR分別表示左輪和右輪的速度、v和 w分別表示移動機(jī)器人的前進(jìn)速度和角速度。假設(shè)沒有滑移效應(yīng),并且移動機(jī)器人的運(yùn)動模型滿足非完整約束,且定義笛卡爾坐標(biāo)為(x,y),移動機(jī)器人前進(jìn)方向和x軸之間的定向角為θ,則差動驅(qū)動機(jī)器人的數(shù)學(xué)模型可以描述為:

非完整約束方程為:

其在X-Y平面中的運(yùn)動學(xué)模型可描述為:

其中q=[x,y,θ]T表示其在移動機(jī)器人質(zhì)量中心的姿勢坐標(biāo),控制輸入量u=[vw]T。
3.2 跟蹤控制問題
跟蹤控制分為軌跡跟蹤控制和路徑跟蹤控制兩種[8]。目前廣泛應(yīng)用的一種跟蹤方式是“跟隨路徑導(dǎo)引”,即機(jī)器人通過對其能敏感到的某些外部的連續(xù)路徑參照線作出相應(yīng)的反應(yīng)以此來進(jìn)行跟蹤。當(dāng)受控系統(tǒng)的參數(shù)發(fā)生變化時(shí),其自適應(yīng)控制系統(tǒng)通過及時(shí)地辨識、學(xué)習(xí)和調(diào)整,可以達(dá)到較好的控制性能。
解決跟蹤控制問題主要是設(shè)計(jì)前向速度v和角速度w的控制規(guī)律,使移動機(jī)器人能夠跟蹤參考軌跡。狀態(tài)向量qd=(xd,yd,θd)T,表示參考姿勢;狀態(tài)向量q=(x,y,θ)T,表示實(shí)際姿勢;狀態(tài)向量qe=(xe,ye,θe)T,表示姿態(tài)誤差。根據(jù)向量之間的幾何關(guān)系,全局坐標(biāo)變換[11]可描述為:

對上面公式取導(dǎo),可以得到系統(tǒng)的誤差方程為:

自適應(yīng)自觸發(fā)控制的主要思想是模擬事件觸發(fā)的實(shí)現(xiàn),而不是連續(xù)測量設(shè)備的狀態(tài),并從所獲取的最后測量結(jié)果來確定下一更新時(shí)間。本文為機(jī)器人設(shè)計(jì)應(yīng)用并實(shí)施NCS,通過修改觸發(fā)條件,對無線信道的接入次數(shù)與控制性能進(jìn)行權(quán)衡,實(shí)現(xiàn)最小化無線通信負(fù)載,以使其它應(yīng)用能夠共享信道帶寬和機(jī)載電子資源。
4.1 控制模型

如果線性系統(tǒng)穩(wěn)定,則函數(shù)V(t)=x(t)TPx(t)存在,根據(jù)線性系統(tǒng)的自觸發(fā)控制方法[3],系統(tǒng)可描述為:

其中,A、B、C是狀態(tài)、輸入、輸出的特征向量矩陣,如果A、B穩(wěn)定,則可得到閉環(huán)漸近穩(wěn)定的線性反饋控制器,其閉環(huán)控制系統(tǒng)用等式描述如下:

將狀態(tài)測量誤差定義為:

其中,tk是最近的采樣更新時(shí)刻,此時(shí),輸入保持恒定,控制器重新計(jì)算新的測量,直到接收到新的測量指令,即:

在該控制器的零階保持實(shí)現(xiàn)下的閉環(huán)動力學(xué)方程可以被重寫為:

自觸發(fā)控制策略的目的是找到離散時(shí)間序列{tk}。為了保證閉環(huán)控制的穩(wěn)定性,引入性能函數(shù)S(t),它是函數(shù)V(t)的上限值,那么更新時(shí)間{tk}就由不滿足以下條件的時(shí)刻來確定:

為了保證大于零的執(zhí)行時(shí)間,設(shè)計(jì)需要滿足V˙(tk)<S˙(tk),可以使用由下式給出的函數(shù)S(t):

其中As是Hurwitz矩陣,其滿足以下Lyapunov方程:

其中,0<R<Q,這保證了V˙(tk)<S˙(tk)。矩陣R描述了實(shí)施時(shí)的穩(wěn)定性,實(shí)施矩陣為As,其又確定S(t)。
根據(jù)自觸發(fā)線性控制器[9]中詳述的技術(shù),可以從時(shí)間tk的測量和系統(tǒng)的動力學(xué)來預(yù)測狀態(tài)x(tk+τ)的變化過程。因此,可以在時(shí)間間隔Δ單位時(shí)間中提前計(jì)算時(shí)間V和S,應(yīng)滿足下列條件:

4.2 自適應(yīng)條件
為確保條件V(t,xt0)≤S(t,xt0)成立,選擇R=Qσ,0<σ<1。在更新次數(shù)和穩(wěn)定性要求之間選擇σ。可定性地認(rèn)為:σ→0時(shí),使控制器更新次數(shù)顯著減少而性能相應(yīng)降級;σ→1時(shí),以增加更新次數(shù)為代價(jià)獲得更好的性能。自適應(yīng)觸發(fā)條件的主要思想是在不失去性能的情況下,減少數(shù)據(jù)傳輸量。所以σ值應(yīng)根據(jù)其平衡點(diǎn)處狀態(tài)向量的偏差來選擇,一旦檢測到參考變化或干擾,則選擇較高的σ值以增加更新速率,相反,當(dāng)狀態(tài)接近相關(guān)平衡時(shí),其更新速率會降低。
以P3-DX機(jī)器人為對象單元,通過設(shè)置參數(shù),驗(yàn)證P3-DX機(jī)器人的遠(yuǎn)程自適應(yīng)自觸發(fā)伺服控制器的優(yōu)化設(shè)計(jì)問題。這里,主要研究機(jī)器人單元與從里程計(jì)信息獲知的機(jī)器人的全狀態(tài)(提供線性和角的移動速度)。以與機(jī)器人在同一個無線網(wǎng)絡(luò)中的PC機(jī)作為遠(yuǎn)程控制中心,其涉及三個主要任務(wù):生成速度參考向量、計(jì)算機(jī)器人的控制向量和執(zhí)行自觸發(fā)調(diào)度程序。圖3顯示了自觸發(fā)控制的全局結(jié)構(gòu)。

圖3 自觸發(fā)伺服控制全局結(jié)構(gòu)圖
5.1 裝置模型
測試自適應(yīng)自觸發(fā)首先應(yīng)從遠(yuǎn)程中心側(cè)對機(jī)器人單元建模,P3-DX要通過無線通信信道與遠(yuǎn)程中心鏈接,發(fā)送參考輸入角速度到機(jī)器人(包括其嵌入式控制回路),并且記錄下開環(huán)機(jī)器人的響應(yīng)情況(線性和角速度作為輸出矢量y)。設(shè)備模型中包含一個恒定的信道延遲L,在這種情況下,信道延遲時(shí)間L近似為:

所得到的P3-DX機(jī)器人單元的連續(xù)狀態(tài)空間模型滿足:


由此得到的機(jī)器人路徑跟蹤伺服控制框圖如圖4所示。

圖4 遠(yuǎn)程機(jī)器人制導(dǎo)伺服控制框圖(無線鏈路由虛線箭頭表示)
其中,r˙(t)∈R4是設(shè)備狀態(tài)向量;u˙(t)∈R2是輸入狀態(tài)向量(發(fā)送給機(jī)器人的線性和角速度);y˙(t)∈R2是測量向量(從里程計(jì)系統(tǒng)獲得的線性和角速度)。
5.2 控制器參數(shù)設(shè)計(jì)
為了正確地跟蹤線性和角速度的參考輸入,所設(shè)計(jì)的伺服系統(tǒng)需要保證在穩(wěn)定狀態(tài)下的零跟蹤誤差。因?yàn)閺臏y量中無法獲得系統(tǒng)反饋的完整狀態(tài),所以由機(jī)器人輸出測量的觀測提供反饋狀態(tài)。根據(jù)以下公式確定KI和KR的增益矩陣:

加權(quán)矩陣使用LQR設(shè)計(jì)為:

控制器常數(shù)為:

因?yàn)闄C(jī)器人是一個價(jià)格昂貴的產(chǎn)品,如果直接在機(jī)器人上進(jìn)行運(yùn)行可能會導(dǎo)致機(jī)器人由于開發(fā)中的一些錯誤而撞毀或者產(chǎn)生一些不必要的麻煩。開發(fā)進(jìn)行測試的模擬仿真和實(shí)驗(yàn)測試使用的是先鋒機(jī)器人的P3-DX控制平臺,其中的開發(fā)軟件包ARIA提供了多樣靈活的機(jī)器人應(yīng)用技術(shù)基礎(chǔ),是最靠近機(jī)器人實(shí)體或仿真的類,并提供聯(lián)接ARIA其它部分的接口,它主要是用來聯(lián)接機(jī)器人或仿真器,也可以用來聯(lián)接激光測距儀等其它設(shè)備。通過這個接口可以訪問機(jī)器人狀態(tài)信息,包括評估、規(guī)劃和智能控制等。
輸出跟蹤的誤差平方控制積分[10]為:

實(shí)驗(yàn)采樣測量計(jì)算ISE的公式為:

為了進(jìn)行驗(yàn)證,根據(jù)圖4中所示的框圖對機(jī)器人單元遠(yuǎn)程引導(dǎo)操作進(jìn)行模擬,選擇線性和角速度的組合作為參考輸入。在不同條件和控制策略下的機(jī)器人路徑跟蹤仿真曲線如圖5所示。可以看出,σ取最高值時(shí)伺服控制性能最佳,但是通過無線信道的控制信息更新數(shù)目也最高。比較發(fā)現(xiàn),自適應(yīng)自觸發(fā)解決方案具有減少信道訪問數(shù)量和適當(dāng)平衡控制功能。
在通過模擬仿真之后,還對機(jī)器人單元的遠(yuǎn)程引導(dǎo)進(jìn)行了實(shí)驗(yàn)驗(yàn)證。相同的線性和角速度的組合被選擇作為參考輸入,并且根據(jù)圖4所示的框圖在遠(yuǎn)程中心中實(shí)現(xiàn)了伺服控制。每當(dāng)達(dá)到觸發(fā)條件時(shí),控制動作會被發(fā)送到P3-DX機(jī)器人單元,遠(yuǎn)程中心接收設(shè)備的狀態(tài)信息。其實(shí)驗(yàn)試驗(yàn)結(jié)果和仿真實(shí)驗(yàn)結(jié)果基本相同。
本文通過仿真和實(shí)驗(yàn),討論研究了自適應(yīng)自觸發(fā)遠(yuǎn)程控制的機(jī)器人路徑控制方案,它能夠有效減少信號更新量和網(wǎng)絡(luò)業(yè)務(wù)量,同時(shí)還能為其它應(yīng)用釋放通信資源,如視頻流、共享信道帶寬等。本文所描述的自適應(yīng)自觸發(fā)技術(shù)的一個關(guān)鍵缺點(diǎn)是狀態(tài)反饋的必要性,而完全狀態(tài)通常不能從測量訪問得到。另外,在自我觸發(fā)的實(shí)現(xiàn)中,在對命令的響應(yīng)還存在一定的延遲,這是由于當(dāng)提供新的設(shè)定點(diǎn)時(shí),需要根據(jù)自觸發(fā)時(shí)間獨(dú)立調(diào)度更新控制律而造成的。在未來的應(yīng)用中,還會出現(xiàn)需要更多群體機(jī)器人協(xié)作來完成的任務(wù),系統(tǒng)的設(shè)置將會更加復(fù)雜,可能會出現(xiàn)可變的通信延遲,這就需要以更為復(fù)雜的方式進(jìn)行處理。

圖5 在不同條件和控制策略下的機(jī)器人路徑跟蹤仿真曲線(- - - 線表示參考速度,——線表示線性速度)
[1]WANG X,LEMMON M.Event design in event-triggered feedback control systems[C].The 47th IEEE Conference on Decision and Control,2008.2105-2110.
[2]HUANGJ,etal.Adaptiveoutputfeedbacktracking control of a nonholonomic mobile[J].Robot Automation,2014,50:821-831.
[3]ROBOTICS A.Pioneer 3TM Operations Manual[A].Active Media Robotics[C].2004.
[4]LEE T C,SONG K T,LEE C H,TENG C C.Tracking control of unicycle-modeled mobile robots using a saturation feedback controller[J].IEEE Trans.on Control.System,2001,9(2):305-318.[5]MAZO M,ANTA A,TABUADA P.Self-triggered control for linear systems:guarantees and complexity[A].European Control Conference[M].2009.
[6]李建華,莊 健,等.基于綜合導(dǎo)向的輪式移動機(jī)器人自適應(yīng)軌跡跟蹤控制[J].西安交通大學(xué)學(xué)報(bào),2005,39(3):252-255.
[7]王 崢.P3DX機(jī)器人自主行為體系設(shè)計(jì)及BTMCPP-CSMA協(xié)議分析[A].云南大學(xué)碩士學(xué)位論文集[C].2013.
[8]李萬玉,董介春,等.移動機(jī)器人路徑跟蹤控制方法的研究[J].青島大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,(2).
[9]MAZO M,ANTA A,TABUADA P.An ISS self-triggered implementation of linear controller[J].Robot Automation,2010,46:1310-1314.
[10]DUTON K,THOMPSON S,BARRACLOUGH B.The art of control engineering[J].Addison-Wesley,1997.
Research on robot path tracking based on adaptive self-triggered remote control
JIANG Yi-long1,LI Xu-jun1,WANG Xin-zhen2
(1.Gansu Institute of Mechanical&Electrical Engineering,Tianshui 741001,China;2.Lehman Robot Technology Co.,Ltd.,Beijing 100029,China)
As regard to the problem of remote manipulating autonomous robots through wireless communication channel,the kinematic analysis and kinematics model of wheeled mobile robots are proposed,and a selftriggering strategy that adjusts the tracking error by triggering condition is proposed and realized so as to achieve the better tracking performance and the less network information transmission.The simulative results with P3-DX mobile robot show that the tracking performance is almost the same as the non-adaptive self-triggering method when the network information transmission is reduced.
adaptive controller;self-triggering;path tracking;P3-DX robot
1005—7277(2016)06—0010—05
TP24
A

2016-10-10
姜毅龍(1966-),男,副教授,主要從事教學(xué)和科研工作,研究方向主要為智能控制、嵌入式系統(tǒng)開發(fā)及其應(yīng)用。