胡亞南 馬書(shū)根 李斌 王明輝 王越超
輪手一體機(jī)器人能量次優(yōu)重構(gòu)規(guī)劃方法
胡亞南1,2馬書(shū)根1,3李斌1王明輝1王越超1
模塊化機(jī)器人的重構(gòu)規(guī)劃中,由于各模塊的目標(biāo)分配與其軌跡規(guī)劃之間的耦合關(guān)系導(dǎo)致組合爆炸問(wèn)題.本文提出一種基于簡(jiǎn)化模型的能量次優(yōu)規(guī)劃方法,將重構(gòu)規(guī)劃問(wèn)題轉(zhuǎn)化為最優(yōu)控制問(wèn)題,實(shí)現(xiàn)目標(biāo)分配與軌跡規(guī)劃的解耦.通過(guò)求解由Hamilton-Jacobi-Bellman(HJB)方程描述的最優(yōu)控制問(wèn)題,得到簡(jiǎn)化模型的值函數(shù)和最優(yōu)軌跡.各模塊的運(yùn)動(dòng)目標(biāo)由值函數(shù)的吸引域決定.通過(guò)在最優(yōu)軌跡附近的次優(yōu)區(qū)域內(nèi)搜索得到實(shí)際運(yùn)動(dòng)軌跡,提高了搜索效率.仿真實(shí)驗(yàn)結(jié)果表明,該方法能夠選擇合適的模塊組合,并能在障礙物環(huán)境中生成滿足機(jī)器人動(dòng)力學(xué)約束的運(yùn)動(dòng)軌跡.
模塊化機(jī)器人,重構(gòu)規(guī)劃,模型簡(jiǎn)化,最優(yōu)控制
在災(zāi)難救援、野外偵查等任務(wù)中,機(jī)器人面對(duì)的是不確定的多樣化環(huán)境.模塊化機(jī)器人能夠組成具有不同運(yùn)動(dòng)性能的構(gòu)形以滿足不同的任務(wù)或環(huán)境要求,這一過(guò)程又稱為重構(gòu).根據(jù)幾何結(jié)構(gòu),模塊化機(jī)器人可分為三類:柵格型、鏈型和移動(dòng)型[1].輪手一體機(jī)器人是一種移動(dòng)型模塊化機(jī)器人,其單模塊由五自由度機(jī)械臂和履帶輪體組成[2],如圖1(a)所示.在移動(dòng)時(shí),機(jī)械臂用于改變方向;在重構(gòu)時(shí),其負(fù)責(zé)連接各模塊組成群體構(gòu)形,如圖1(b)所示.
重構(gòu)規(guī)劃的任務(wù)是選擇合適的模塊并生成其運(yùn)動(dòng)軌跡從而組成特定的構(gòu)形.根據(jù)初始狀態(tài)的不同,重構(gòu)可分為由多個(gè)獨(dú)立的模塊組合成群體構(gòu)形,以及從一種構(gòu)形變換為另一種構(gòu)形,如圖1(c)所示.如果不考慮機(jī)械臂最后的對(duì)接步驟,可以將后者視為前者的特例.本文只考慮一般情況,即獨(dú)立模塊組成群體構(gòu)形.與傳統(tǒng)運(yùn)動(dòng)規(guī)劃相比,重構(gòu)規(guī)劃面臨兩個(gè)挑戰(zhàn).首先,每個(gè)模塊作為一個(gè)獨(dú)立運(yùn)動(dòng)的機(jī)器人,都需要對(duì)其運(yùn)動(dòng)進(jìn)行規(guī)劃,這產(chǎn)生高維的構(gòu)型空間.而規(guī)劃算法的復(fù)雜度與空間維度呈指數(shù)關(guān)系.其次,在規(guī)劃中不僅需要考慮模塊自身以及模塊間的約束關(guān)系,還要考慮當(dāng)前模塊對(duì)整體結(jié)構(gòu)可能的依賴和影響.為了避免對(duì)大量模塊同時(shí)進(jìn)行規(guī)劃,文獻(xiàn)[3?4]采用宏模塊的思想,將部分模塊作為一個(gè)整體進(jìn)行規(guī)劃.文獻(xiàn)[5?6]提出基于規(guī)則的策略以處理模塊間復(fù)雜的約束,減少搜索空間.現(xiàn)有的重構(gòu)規(guī)劃研究主要針對(duì)柵格型和鏈型模塊化機(jī)器人,其特點(diǎn)是單個(gè)模塊需借助其他模塊輔助運(yùn)動(dòng)才能實(shí)現(xiàn)重構(gòu).而且,現(xiàn)有方法只考慮了簡(jiǎn)單的幾何約束或運(yùn)動(dòng)學(xué)模型,忽略了機(jī)器人的完整(動(dòng)力學(xué))模型,對(duì)重構(gòu)策略的最優(yōu)性也缺少討論[1].文獻(xiàn)[7]將模塊狀態(tài)的歐氏度量作為優(yōu)化指標(biāo),并使用分配算法得到最優(yōu)的重構(gòu)方案.但存在運(yùn)動(dòng)學(xué)約束時(shí),歐氏度量并不準(zhǔn)確,而且協(xié)調(diào)機(jī)器人間的沖突時(shí)所采用的反應(yīng)式方法,只能保證運(yùn)動(dòng)是局部最優(yōu)而不能保證全局最優(yōu).

圖1 輪手一體機(jī)器人及其重構(gòu)Fig.1 Wheel-manipulator robots and their recon fi guration
傳統(tǒng)單機(jī)器人運(yùn)動(dòng)規(guī)劃中考慮動(dòng)力學(xué)約束的主要有三種方法:1)基于采樣的方法[8]通過(guò)對(duì)狀態(tài)空間或控制空間進(jìn)行采樣,并對(duì)動(dòng)力學(xué)方程積分生成可行軌跡.通過(guò)建立并逐漸擴(kuò)展樹(shù)形結(jié)構(gòu)實(shí)現(xiàn)對(duì)狀態(tài)空間的探索.該方法的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單,缺點(diǎn)是生成的軌跡通常遠(yuǎn)離最優(yōu)解,一般需要后期優(yōu)化;2)基于分層的方法[9]將規(guī)劃分為兩層實(shí)現(xiàn),高層負(fù)責(zé)生成一系列局部目標(biāo),其中只考慮機(jī)器人的運(yùn)動(dòng)學(xué)約束和幾何約束,而低層負(fù)責(zé)搜索連接局部目標(biāo)的可行軌跡,其中考慮動(dòng)力學(xué)約束.通過(guò)分層限制了探索區(qū)域,從而提高了效率.但高層在考慮運(yùn)動(dòng)學(xué)約束時(shí)對(duì)控制量取極值,只適用于機(jī)器人速度幅值不受約束時(shí)距離最優(yōu)的情況.而在速度幅值受約束并以能量為優(yōu)化準(zhǔn)則的情況下,機(jī)器人的轉(zhuǎn)向半徑并非極值[10];3)基于數(shù)值優(yōu)化的方法[11]將機(jī)器人的控制量用參數(shù)表示,使用數(shù)值優(yōu)化方法得到控制參數(shù)值和機(jī)器人的軌跡.其優(yōu)點(diǎn)是通用性好,適用于任意模型、優(yōu)化目標(biāo)和約束條件,缺點(diǎn)是計(jì)算量較大且容易收斂到局部極小值.
移動(dòng)型模塊化機(jī)器人的重構(gòu)規(guī)劃中,目標(biāo)構(gòu)形通常是給定的,而各初始模塊對(duì)應(yīng)的子目標(biāo)(即目標(biāo)構(gòu)形中的模塊)是未知的.初始模塊與子目標(biāo)間存在多種分配方式.為了實(shí)現(xiàn)重構(gòu)的總代價(jià)最優(yōu),對(duì)各模塊進(jìn)行子目標(biāo)分配時(shí)需要根據(jù)各自的運(yùn)動(dòng)軌跡計(jì)算其代價(jià),而規(guī)劃運(yùn)動(dòng)軌跡的前提是已知子目標(biāo),二者存在耦合關(guān)系.傳統(tǒng)方法只從單模塊角度考慮,窮舉出所有的可能的組合并選擇總代價(jià)最小的一個(gè).其缺點(diǎn)是:組合方式的數(shù)量與機(jī)器人模塊數(shù)量呈階乘關(guān)系,計(jì)算量隨模塊增加而急劇增加;而且沒(méi)有從整體考慮各模塊之間的運(yùn)動(dòng)影響,各模塊由于運(yùn)動(dòng)存在約束,孤立地對(duì)各模塊進(jìn)行規(guī)劃所得到的軌跡會(huì)出現(xiàn)干涉從而導(dǎo)致規(guī)劃的軌跡不可行.
本節(jié)通過(guò)一個(gè)例子闡述所提方法的基本思想.考慮二維平面中運(yùn)動(dòng)不受約束的機(jī)器人重構(gòu)問(wèn)題,如圖2(a)所示.目標(biāo)構(gòu)形由兩個(gè)模塊組成,但環(huán)境中共有3個(gè)獨(dú)立模塊.任務(wù)是選擇兩個(gè)模塊使其到達(dá)子目標(biāo),并且兩個(gè)模塊的移動(dòng)距離之和最小.為了避免子目標(biāo)分配與單模塊運(yùn)動(dòng)規(guī)劃之間的耦合,規(guī)劃運(yùn)動(dòng)軌跡時(shí),不是從初始模塊開(kāi)始,而是反其道而行之,以子目標(biāo)為初始值,根據(jù)動(dòng)態(tài)規(guī)劃的思想迭代計(jì)算平面中各點(diǎn)到(任一)子目標(biāo)的距離的最小值.最終得到以各點(diǎn)坐標(biāo)為自變量的函數(shù),稱為值函數(shù).值函數(shù)的圖像為如圖2(b)所示的雙圓錐,錐尖對(duì)應(yīng)子目標(biāo)所在的位置.各模塊沿著錐面做梯度下降即可得到最優(yōu)軌跡,因?yàn)樘荻确较蚴蔷嚯x下降最快的方向.對(duì)每個(gè)子目標(biāo),選擇最先到達(dá)該子目標(biāo)的模塊就是滿足要求的重構(gòu)組合.值函數(shù)的梯度定義了一個(gè)最優(yōu)反饋向量場(chǎng),如圖2(c)所示,對(duì)位于任意初始位置的模塊,這一向量場(chǎng)給出了到達(dá)子目標(biāo)的最優(yōu)控制律.值函數(shù)對(duì)于每個(gè)子目標(biāo)構(gòu)成了一個(gè)吸引域,不同吸引域的邊界就是值函數(shù)梯度為0的區(qū)域,如圖2(c)中的虛線所示.
值函數(shù)可以作為L(zhǎng)yapunov函數(shù),設(shè)計(jì)穩(wěn)定的控制器,也可類比為人工勢(shì)場(chǎng)法中的勢(shì)函數(shù),其作為導(dǎo)航函數(shù)的一個(gè)特例,常用于設(shè)計(jì)反饋運(yùn)動(dòng)規(guī)劃策略.例如文獻(xiàn)[12]通過(guò)構(gòu)造一系列的局部反饋控制器(被形象地比喻為漏斗)將障礙物環(huán)境中的復(fù)雜控制系統(tǒng)穩(wěn)定到目標(biāo)區(qū)域.但人工勢(shì)場(chǎng)法中對(duì)勢(shì)函數(shù)的定義只考慮局部信息,導(dǎo)致勢(shì)函數(shù)中存在局部極小值,從而使機(jī)器人無(wú)法到達(dá)目標(biāo)點(diǎn).而值函數(shù)不存在局部極小值.此外,勢(shì)函數(shù)中的吸引勢(shì)場(chǎng)采用啟發(fā)式的方法計(jì)算得到,其是對(duì)機(jī)器人當(dāng)前狀態(tài)到目標(biāo)點(diǎn)真實(shí)代價(jià)的下界估計(jì)值.而值函數(shù)自身反映了機(jī)器人到目標(biāo)點(diǎn)的真實(shí)代價(jià)信息.借助這一特點(diǎn),可以將其由單機(jī)器人單目標(biāo)的運(yùn)動(dòng)規(guī)劃推廣到多機(jī)器人多目標(biāo)的運(yùn)動(dòng)規(guī)劃,例如重構(gòu)規(guī)劃.

圖2 二維無(wú)約束機(jī)器人重構(gòu)例子Fig.2 The recon fi guration example of unconstrained robots in two dimensions
上述重構(gòu)規(guī)劃步驟可以總結(jié)為:
步驟1.確定優(yōu)化準(zhǔn)則,以子目標(biāo)為初始值根據(jù)機(jī)器人模型求解其最優(yōu)控制問(wèn)題,得到值函數(shù)和最優(yōu)反饋控制律.
步驟2.選取值函數(shù)最小的模塊,使用最優(yōu)控制律對(duì)機(jī)器人模型積分得到不同初始狀態(tài)下的最優(yōu)軌跡,完成重構(gòu).
如果將以上方法直接用于輪手一體機(jī)器人重構(gòu)規(guī)劃中,仍會(huì)面臨兩個(gè)問(wèn)題:首先,機(jī)器人動(dòng)力學(xué)模型維數(shù)較高且非常復(fù)雜,直接求其最優(yōu)控制問(wèn)題非常困難;其次,由于機(jī)器人受動(dòng)力學(xué)約束,得到的最優(yōu)軌跡間可能存在干涉.
在結(jié)構(gòu)力學(xué)、流體力學(xué)等領(lǐng)域,描述系統(tǒng)的模型往往也表現(xiàn)出高維、復(fù)雜的特征.但通過(guò)分析可以發(fā)現(xiàn),并非所有狀態(tài)變量對(duì)系統(tǒng)都有同等程度的影響.系統(tǒng)的行為可以通過(guò)幾個(gè)主要維度近似刻畫(huà),而忽略次要維度所引起的誤差可以控制在一定的范圍內(nèi).因此可以使用簡(jiǎn)化的模型近似描述復(fù)雜系統(tǒng)的行為.在控制理論等領(lǐng)域中,如果描述系統(tǒng)的模型維數(shù)過(guò)高或規(guī)模較大時(shí),人們也會(huì)尋找一個(gè)規(guī)模較小的簡(jiǎn)化模型來(lái)逼近完整的系統(tǒng)模型,這被稱為模型降階.類似思想在模型較復(fù)雜的機(jī)器人研究中得到體現(xiàn),例如用倒立擺模型為人形機(jī)器人設(shè)計(jì)控制律.現(xiàn)有的模型降階方法主要針對(duì)線性系統(tǒng)[13].對(duì)于非線性系統(tǒng)需要預(yù)先在選定的名義狀態(tài)附近進(jìn)行近似線性處理[14],導(dǎo)致其只能適用于名義狀態(tài)的臨域,并且在不同的名義狀態(tài)下需要切換.早期針對(duì)非線性系統(tǒng)的約簡(jiǎn)(降階)通常采取精確的方式,其依賴系統(tǒng)的某些特性,例如對(duì)稱性.因此精確約簡(jiǎn)一般用于滿足動(dòng)量守恒的系統(tǒng)或受非完整約束的系統(tǒng)[15],這限制了其適用范圍.為了處理更一般的動(dòng)力系統(tǒng),有學(xué)者提出近似約簡(jiǎn)的思想[16],其適用于具有一定穩(wěn)定性的系統(tǒng).受到上述研究的啟發(fā),本文首先對(duì)機(jī)器人的運(yùn)動(dòng)模型進(jìn)行分析,得出其在最優(yōu)控制律作用下的穩(wěn)定特性,并基于近似約簡(jiǎn)思想對(duì)機(jī)器人模型進(jìn)行簡(jiǎn)化處理.然后通過(guò)求解簡(jiǎn)化模型的最優(yōu)控制問(wèn)題,得到其最優(yōu)軌跡.隨后最優(yōu)軌跡附近搜索得到滿足機(jī)器人動(dòng)力學(xué)約束的能量次優(yōu)軌跡.
本節(jié)對(duì)機(jī)器人的運(yùn)動(dòng)模型進(jìn)行分析并給出其簡(jiǎn)化模型.在此之前,首先介紹后文用到的數(shù)學(xué)知識(shí).
向量場(chǎng)表示為(Rn,X),其中X 是光滑映射X:Rn→ Rm.如果光滑曲線x:I→ Rn滿足x(t)=X(x(t)),?t∈I(I是R 的開(kāi)子集),則稱x:I→Rn是向量場(chǎng)(Rn,X)的軌跡.為了強(qiáng)調(diào)軌跡的初始條件x(0)=x0,通常將軌跡表示為x(·,x0).控制系統(tǒng)表示為(Rn,Rm,F).其中F 是光滑映射F:Rn×Rm→Rn.假設(shè)系統(tǒng)的狀態(tài)空間是Rn,對(duì)于它的一個(gè)分解Rn=Rm×Rk,可以定義投影πm:Rn→Rm和πk:Rn→Rk.
定義1.向量場(chǎng)(Rn,X)與(Rm,Y)被稱為近似πm相關(guān)[16],如果存在K∞類函數(shù)γ和常數(shù)c∈R+0使得對(duì)任意的初始狀態(tài)x∈Rn和時(shí)間t∈,有 |πm?x(t,x)? y(t,πm(x))|< γ(|πk(x)|)+c.其中,|x|表示狀態(tài)x的歐氏范數(shù).系統(tǒng)完整模型對(duì)應(yīng)的向量場(chǎng)與其簡(jiǎn)化模型對(duì)應(yīng)的向量場(chǎng)近似相關(guān)意味著,完整模型軌跡的投影與簡(jiǎn)化模型的軌跡是有界的,其邊界是初始狀態(tài)的函數(shù).
定義2.控制系統(tǒng)(Rn,Rm,F)被稱為增量一致有界輸入有界狀態(tài)穩(wěn)定(Incrementally uniformly bounded input bounded state stable,IUBIBSS),如果存在K∞類函數(shù)γ1和γ2以及常數(shù)d∈使得對(duì)所有t∈,初始狀態(tài)x1,x2∈Rn和控制輸入其中,k f k=esssupt∈[0,τ]|f(t)|, 對(duì)于任意函數(shù)f:[0,τ]→ Rn,τ∈ R+.文獻(xiàn)[16]給出了兩個(gè)向量場(chǎng)近似相關(guān)的充分條件:
定理1.對(duì)于向量場(chǎng)(Rn,X),定義F=Tπm·X:Rm×Rk→Rm是狀態(tài)空間Rm上的控制系統(tǒng).向量場(chǎng)(Rm,Y)定義為Y(y)=T(y,0)πm·X(y,0)=F(y,0).如果(Rn,X)是沿纖維實(shí)際穩(wěn)定的(Fiberwise practically stable),且F 滿足IUBIBSS,則向量場(chǎng)(Rm,Y)和(Rn,X)是近似πm相關(guān)的.
下面介紹輪手一體機(jī)器人的運(yùn)動(dòng)模型.單模塊機(jī)器人的構(gòu)型可由描述.其中,矩陣表示輪體坐標(biāo)系Obxbybzb相對(duì)于全局坐標(biāo)系OIxIyIzI的位姿,而向量 q 表示手臂關(guān)節(jié)轉(zhuǎn)角.位姿矩陣 gggIb中的姿態(tài)存在多種表示方法,本文選取歐拉角參數(shù)表示.因此,單模塊機(jī)器人的構(gòu)型坐標(biāo)為,其中x,y和z為輪體質(zhì)心坐標(biāo),而θ,φ和ψ為輪體坐標(biāo)系的XY Z歐拉角.輪手一體機(jī)器人的動(dòng)力學(xué)模型[17]為



將式(1)和式(2)合寫(xiě)為狀態(tài)空間的形式


最優(yōu)控制問(wèn)題的代價(jià)泛函定義為狀態(tài)和控制的二次型函數(shù)

下面對(duì)各狀態(tài)在式(3)中的影響程度進(jìn)行分析.在正常行進(jìn)時(shí),機(jī)器人輪體的x,y和θ坐標(biāo)可以主動(dòng)控制,而φ,ψ和z則由地形約束決定,是被動(dòng)量.在地形起伏較小的環(huán)境中,ωx,ωy和vz的變化較小.輪手一體機(jī)器人采用履帶推進(jìn),在不打滑的情況下,輪體側(cè)向滑移量很小,因此側(cè)向速度vy對(duì)整體運(yùn)動(dòng)的貢獻(xiàn)較小.機(jī)器人在轉(zhuǎn)向時(shí),轉(zhuǎn)向速度ωz較小,手臂的關(guān)節(jié)變化范圍有限且速率較小.
基于以上分析,將機(jī)器人的狀態(tài)分解為主要分量和次要分量,即.其中主要分量由變化較大的狀態(tài)變量組成,即. 并由此定義投影πs:.根據(jù)狀態(tài)的分解,式(4)可以寫(xiě)成


由于未知參數(shù)和無(wú)法建模的因素,模型與實(shí)際系統(tǒng)總存在誤差.而且機(jī)器人在實(shí)際運(yùn)動(dòng)時(shí)可能受到外部擾動(dòng).因此,在最優(yōu)控制的基礎(chǔ)上考慮一定的魯棒控制更有實(shí)際意義.根據(jù)文獻(xiàn)[18]的結(jié)論,系統(tǒng)在代價(jià)下的最優(yōu)控制也是系統(tǒng)(4)的魯棒控制.通過(guò)求的最優(yōu)控制問(wèn)題,可以得到最優(yōu)反饋控制律.
證明.定義代價(jià)泛函

然后分析系統(tǒng)F=Tπs·f的穩(wěn)定性質(zhì).驗(yàn)證F的穩(wěn)定性同樣需要構(gòu)造相應(yīng)的Lyapunov函數(shù).由于系統(tǒng)(8)漸近穩(wěn)定,因此滿足部分穩(wěn)定(Partial stability).根據(jù)Lyapunov逆定理[19],對(duì)于不同的主要狀態(tài)和次要狀態(tài)(此時(shí)視為輸入),存在函數(shù)滿足,且有和.定義.所以可以作為 F 的 IUBIBSS Lyapunov函數(shù),因此F滿足IUBIBSS.

圖3 完整模型與簡(jiǎn)化模型的運(yùn)動(dòng)軌跡Fig.3 The trajectory of the full model and that of the simpli fi ed model
這一結(jié)論的意義在于,通過(guò)求解相對(duì)簡(jiǎn)單的簡(jiǎn)化模型對(duì)應(yīng)的最優(yōu)控制問(wèn)題,可以得到近似的值函數(shù),由此可得到次優(yōu)的子目標(biāo)分配.而且可以在簡(jiǎn)化模型對(duì)應(yīng)的最優(yōu)軌跡附近搜索得到滿足完整模型約束的次優(yōu)軌跡,從而提高規(guī)劃的效率.為此需要得到簡(jiǎn)化模型的具體形式.

其中,uθ表示轉(zhuǎn)向控制量,uv是履帶轉(zhuǎn)動(dòng)產(chǎn)生的加速度.為方便求解,將式(9)改寫(xiě)為以下形式

其中,v表示輪體的前進(jìn)速度vx,a是輪體驅(qū)動(dòng)器導(dǎo)致的加速度,ae是外力造成的加速度,例如重力,s表示機(jī)器人轉(zhuǎn)向控制量.簡(jiǎn)化模型的狀態(tài)為,控制量為=(a,s).
得到輪手一體機(jī)器人的簡(jiǎn)化模型后,下面建立并求解其最優(yōu)控制問(wèn)題.
動(dòng)態(tài)規(guī)劃原理給出了最優(yōu)控制問(wèn)題的充分條件,對(duì)于連續(xù)時(shí)間問(wèn)題,可由其推導(dǎo)出Hamilton-Jacobi-Bellman(HJB)方程.通過(guò)求解HJB方程可以得到簡(jiǎn)化模型的最優(yōu)控制律以及值函數(shù).受體積限制,模塊化機(jī)器人攜帶的能源有限,因此本文選取能量作為優(yōu)化目標(biāo).輪手一體機(jī)器人采用直流電機(jī)驅(qū)動(dòng),根據(jù)文獻(xiàn)[10],電機(jī)消耗的能量可以表示為速度和加速度的函數(shù)

其中,c1,c2,c3和c4均為反應(yīng)機(jī)器人和地形特性的常數(shù).機(jī)器人的控制量受到環(huán)境和自身的約束,因此需要確定控制量的可行范圍.
首先,機(jī)器人的加(減)速度受電機(jī)最大輸出力矩的限制,應(yīng)該位于最大加(減)速度范圍內(nèi),即amin≤a≤amax.機(jī)器人的轉(zhuǎn)向半徑r=1/|s|,其不應(yīng)小于最小轉(zhuǎn)向半徑rm,所以對(duì)轉(zhuǎn)向控制量的約束為|s|≤1/rm.此外,考慮到機(jī)器人的轉(zhuǎn)彎速度應(yīng)受到地面約束力的限制,其轉(zhuǎn)彎的離心力不應(yīng)超過(guò)地面能提供的最大摩擦力Fmax,即

從而得到另一約束關(guān)系|s|≤Fmax/(mv2).因此,定義可行控制空間為

基于動(dòng)態(tài)規(guī)劃原理建立簡(jiǎn)化模型(10)的HJB方程

其中,V是值函數(shù),?V是V的梯度(后文用下標(biāo)表示V 在某方向的偏導(dǎo),例如Vx=?V/?x),“·”表示內(nèi)積.注意式(14)左側(cè)的負(fù)號(hào)會(huì)影響其粘性解,不可省略.將式(10)和(11)代入式(14)展開(kāi)后得到:

HJB方程是一階雙曲型偏微分方程,其經(jīng)典意義上的解(即連續(xù)可微解)不存在,所以一般尋求其弱解,其中最常用的是粘性解[20].由于系統(tǒng)模型的非線性特征,難以得到HJB方程(15)的解析解,因此本文采用數(shù)值方法.根據(jù)文獻(xiàn)[21]的結(jié)論,單調(diào)的差分格式能夠收斂到正確的粘性解,本文采用Godunov差分方法[22].將簡(jiǎn)化模型的狀態(tài)空間離散化,建立分辨率為(hx,hy,hθ,hv)的網(wǎng)格,隨后的計(jì)算針對(duì)網(wǎng)格的節(jié)點(diǎn).令Vi,j,k,w=V(ihx,jhy,khθ,whv)表示值函數(shù)在節(jié)點(diǎn)坐標(biāo)(i,j,k,w)處的解.下面按照Godunov格式逐維對(duì)方程(15)離散化.首先,式(15)中不含有控制量的項(xiàng)可以直接提出

式(16)在x方向的離散結(jié)果為

其中,ξx=|v cosθ|.
y方向的離散結(jié)果為

其中,ξy=|v sinθ|.
θ方向的離散結(jié)果為
有學(xué)者對(duì)于中藥重金屬污染情況特別關(guān)注,并進(jìn)行了系統(tǒng)的考察評(píng)價(jià)。趙連華等[8]得出這5種重金屬的污染率在9.33%~26.35%,并且因?yàn)楫a(chǎn)地不同污染情況不同。郭蘭萍等[9]以《中醫(yī)藥——中藥材重金屬限量》ISO國(guó)際標(biāo)準(zhǔn)為依據(jù),分析了中藥材中Pb、As、Cd、Hg 4種重金屬元素的污染情況,結(jié)果顯示4種重金屬的超標(biāo)率分別為3.46%,4.03%,2.91%,1.41%。而重金屬元素一旦進(jìn)入人體后,由于其半衰期較長(zhǎng),在人體內(nèi)的含量不斷增高后,會(huì)誘發(fā)人體內(nèi)的各種疾病[10]。

根據(jù)Godunov方案,|Vθ|的離散結(jié)果為

為使(19)中的最小值符號(hào)成立,最優(yōu)控制s的符號(hào)應(yīng)和Vθ的符號(hào)相反,幅值應(yīng)為中允許的最大幅值.
v方向記為

式(21)的最小值符號(hào)中的項(xiàng)是a的二次函數(shù),將其記為fa(a).其最小值分為以下三種情況:
1)?Vv/2c1> amax,此時(shí)函數(shù)最小值取在a=amax處,最小值為.
2)?Vv/2c1< amin,此時(shí)函數(shù)最小值取在a=amin處,最小值為.
3)amin<?Vv/2c1<amax,此時(shí)函數(shù)最小值取在對(duì)稱軸a=?Vv/2c1處,最小值為.
對(duì)v方向離散時(shí)需要根據(jù)上述三種情況分別討論:
1)只需離散方程右側(cè)的第一項(xiàng),即

2)與情況1類似,有

其中,ζ2=sgn(ae+amin).
3)此時(shí)將fa視為Vv的函數(shù),其最值取在

將各維狀態(tài)的離散結(jié)果代入式(16)中,得到Vi,j,k,w與其鄰近節(jié)點(diǎn)值的方程,記為

這樣就得到了一組非線性代數(shù)方程,方程的個(gè)數(shù)等于網(wǎng)格節(jié)點(diǎn)數(shù).求解大規(guī)模的代數(shù)方程,需要高效的數(shù)值方法.本文采用快速掃描法(Fast sweeping method)[23?24],其使用了迭代思想,收斂速度快,計(jì)算復(fù)雜度為O(N),其中N 為網(wǎng)格節(jié)點(diǎn)數(shù)量.求解偏微分方程需要給定邊界條件.目標(biāo)構(gòu)形的狀態(tài)是給定的,在計(jì)算時(shí),將目標(biāo)構(gòu)形中各模塊的主狀態(tài)分量所在的節(jié)點(diǎn)的節(jié)點(diǎn)值Vi,j,k,w設(shè)為0.在最優(yōu)控制問(wèn)題的框架下,還可以考慮障礙物和環(huán)境地形等約束.在對(duì)網(wǎng)格節(jié)點(diǎn)初始化時(shí),障礙物所在的區(qū)域內(nèi)的節(jié)點(diǎn)值被設(shè)置為較大的數(shù)(大于所有軌跡的最大能量即可),在隨后掃描時(shí)其值不被更新.機(jī)器人在不平整地形中運(yùn)動(dòng)時(shí),所受的約束與地形有關(guān).假設(shè)地形由光滑函數(shù)z=M(x,y)定義,如圖4所示.

圖4 不平整地形中的運(yùn)動(dòng)軌跡參數(shù)Fig.4 The parameters of the trajectory on uneven terrain
機(jī)器人運(yùn)動(dòng)軌跡上某點(diǎn)處的單位切向量為

單位法向量為

考察機(jī)器人軌跡在地形切平面內(nèi)的曲率,即測(cè)地線曲率

其中,“×”表示差積.軌跡的曲率應(yīng)滿足:

將式(26)~(28)代入式(29)可求得控制量s的約束

其中,Mxy= ?2M/(?x?y).

求解得到了狀態(tài)空間中各個(gè)節(jié)點(diǎn)處的離散最優(yōu)控制律,如果想要得到非節(jié)點(diǎn)處的控制律則需要對(duì)離散控制律插值.根據(jù)最優(yōu)控制律,以各模塊初始狀態(tài)為初始值,對(duì)簡(jiǎn)化模型(10)數(shù)值積分即可得到最優(yōu)軌跡.對(duì)如圖5所示的存在障礙物和地面不平坦的環(huán)境,應(yīng)用上述方法計(jì)算不同初始位姿到目標(biāo)狀態(tài)的最優(yōu)軌跡.箭頭方向表示機(jī)器人的初始偏航角θ.惟一的目標(biāo)點(diǎn)位于環(huán)境中心.優(yōu)化目標(biāo)的參數(shù)為c1=c2=c3=0,c4=1.

圖5 不同初始位姿及單目標(biāo)下簡(jiǎn)化模型的最優(yōu)軌跡Fig.5 The optimal trajectories of the simpli fi ed model with a single goal and di ff erent initial poses
在各模塊子目標(biāo)已知的基礎(chǔ)上,本節(jié)提出滿足機(jī)器人實(shí)際動(dòng)力學(xué)約束的軌跡規(guī)劃方法.這一過(guò)程需要?jiǎng)恿W(xué)模型的仿真,為此首先介紹機(jī)器人的受力模型,然后給出軌跡搜索方法.
精確的模型可以準(zhǔn)確地預(yù)測(cè)機(jī)器人的運(yùn)動(dòng),從而提高軌跡跟蹤效率.機(jī)器人模型除自身動(dòng)力學(xué)模型外,其在環(huán)境中的受力模型對(duì)其運(yùn)動(dòng)的預(yù)測(cè)同樣重要.因此,下面給出機(jī)器人的受力模型.
輪手一體機(jī)器人輪體的履帶提供主要推進(jìn)力,可以用地面力學(xué)中的履帶受力模型描述.為了進(jìn)行仿真,需要對(duì)其離散處理.本文將履帶與地面接觸的一面均勻劃分為若干離散單元,每個(gè)單元與地面視為點(diǎn)接觸[25],從而將連續(xù)的分布力用多個(gè)離散力近似表示,如圖6所示.每個(gè)接觸點(diǎn)的受力由三個(gè)分量組成:法向力Fn,ij、切向力Ft,ij和側(cè)向力Fl,ij.第ij單元的面積為ΔAij=ΔxΔy.在第j列單元(沿xb方向)設(shè)立坐標(biāo)系Ojxjyjzj,各單元中心坐標(biāo)記為xiyj.

圖6 履帶接地面作用力離散示意圖Fig.6 Illustration of the discretized track-terrain forces
首先建立法向力的模型,t時(shí)刻xiyj坐標(biāo)處的法向應(yīng)力為

其中,kc,kφ是反應(yīng)地面特征的常數(shù),wt是履帶的寬度,Δzij是xiyj坐標(biāo)處履帶的沉陷深度,nt為沉陷指數(shù),C為阻尼系數(shù).
假設(shè)ij單元內(nèi)的應(yīng)力分布均勻,同為σ(xiyj,t).xiyj坐標(biāo)處的法向力代表其所在單元內(nèi)的法向合力,即應(yīng)力與單元面積的乘積

履帶的切向應(yīng)變jx(xiyj,t)也是位置和時(shí)間的函數(shù),其滿足如下微分方程

其中,rw為履帶驅(qū)動(dòng)輪的半徑,ωw為驅(qū)動(dòng)輪驅(qū)動(dòng)電機(jī)的轉(zhuǎn)速,也是輪手一體機(jī)器人的實(shí)際控制量.
解出jx(xiyj,t)后可計(jì)算xiyj處的切向應(yīng)力

其中,c,?和K 也是由實(shí)驗(yàn)測(cè)得的反應(yīng)地面特征的常數(shù).
根據(jù)切向應(yīng)力可計(jì)算xiyj坐標(biāo)處的切向力

側(cè)向力的計(jì)算方法與切向力類似

為將上述力分量引入機(jī)器人的動(dòng)力學(xué)模型,需將其表示為力旋量,并借助雅克比矩陣將其轉(zhuǎn)化為廣義力.

為了提高軌跡規(guī)劃的效率,可以利用完整模型最優(yōu)軌跡的投影與簡(jiǎn)化模型的最優(yōu)軌跡有界這一信息,將簡(jiǎn)化模型的軌跡作為基準(zhǔn),在其附近搜索滿足實(shí)際約束的可行軌跡.雖然完整模型與簡(jiǎn)化模型的軌跡偏差是有界的,但難以估計(jì)其邊界.定義狀態(tài)空間中到簡(jiǎn)化模型的最優(yōu)軌跡的距離小于ε的區(qū)域?yàn)棣?次優(yōu)區(qū)域.采用的ε越大,搜索的軌跡越可能接近最優(yōu),但計(jì)算量也越大.在實(shí)際搜索時(shí),可以根據(jù)要求調(diào)整ε的大小.在對(duì)軌跡質(zhì)量要求高且時(shí)間寬裕時(shí),設(shè)置較大的ε;在對(duì)軌跡質(zhì)量要求低且計(jì)算時(shí)間有限時(shí),設(shè)置較小的ε.本文采用Dijkstra圖搜索方法,從各模塊的起始狀態(tài)開(kāi)始構(gòu)造數(shù)棵樹(shù),樹(shù)的節(jié)點(diǎn)是各模塊的狀態(tài),樹(shù)的邊是各模塊的可行軌跡.
為了防止搜索在某個(gè)局部區(qū)域內(nèi)過(guò)度探索,將次優(yōu)區(qū)域內(nèi)狀態(tài)空間的子集Q′=(x,y,θ)劃分成網(wǎng)格,并規(guī)定每個(gè)網(wǎng)格內(nèi)最多只能有一個(gè)狀態(tài)節(jié)點(diǎn).搜索的具體步驟如下:
步驟1.將各模塊的起始狀態(tài)作為樹(shù)的根節(jié)點(diǎn),確定半徑ε.
步驟2.根據(jù)Dijkstra算法計(jì)算需要擴(kuò)展的節(jié)點(diǎn),對(duì)各模塊的控制量采樣并代入動(dòng)力學(xué)模型(1)依次進(jìn)行動(dòng)力學(xué)仿真,規(guī)定機(jī)器人的移動(dòng)距離到達(dá)一定距離Δs后停止.采樣策略為:在以最優(yōu)控制為中心的橢圓區(qū)域內(nèi)進(jìn)行采樣.得到控制量后再變換到機(jī)器人的實(shí)際輸入控制量,變換關(guān)系為

其中,函數(shù)PI是比例積分控制器,用于控制機(jī)器人的電機(jī)轉(zhuǎn)速ωw以跟蹤期望的加速度ar,函數(shù)InverseKinematics根據(jù)手臂導(dǎo)輪的偏角通過(guò)逆運(yùn)動(dòng)學(xué)計(jì)算得到手臂關(guān)節(jié)角度.
步驟3.判斷仿真得到的軌跡是否可行,如果可行則加入樹(shù)中.判斷依據(jù)為
1)軌跡位于次優(yōu)區(qū)域內(nèi);
2)機(jī)器人模塊保持穩(wěn)定,沒(méi)有傾翻;
3)機(jī)器人模塊間的距離大于安全閾值;
4)機(jī)器人模塊與障礙物的距離大于安全閾值;
5)各軌跡的末端所在的網(wǎng)格內(nèi)無(wú)其他軌跡的狀態(tài)節(jié)點(diǎn).
步驟4.判斷各模塊是否到達(dá)子目標(biāo).計(jì)算模塊與子目標(biāo)的距離,距離小于規(guī)定閾值則視為到達(dá).否則返回步驟2.
本節(jié)通過(guò)仿真實(shí)例驗(yàn)證所提出的重構(gòu)規(guī)劃方法的有效性.基于符號(hào)計(jì)算軟件Mathematica搭建了運(yùn)動(dòng)規(guī)劃平臺(tái),可用于動(dòng)力學(xué)積分,軌跡搜索和結(jié)果的動(dòng)畫(huà)顯示.為提高計(jì)算效率,求解HJB方程的快速掃描法用C++語(yǔ)言實(shí)現(xiàn),計(jì)算結(jié)果被Mathematica調(diào)用.仿真使用的參數(shù)見(jiàn)表1,仿真環(huán)境配置為Intel Core i5 6400,2.7GHz CPU,8GB RAM.

表1 仿真參數(shù)Table 1 The simulation parameters
實(shí)例1的目標(biāo)構(gòu)形為三角構(gòu)形,其位置在原點(diǎn).環(huán)境中存在4個(gè)障礙物和三個(gè)獨(dú)立的模塊,模塊的初始位姿由隨機(jī)生成.HJB方程的離散網(wǎng)格規(guī)模為70×70×50×15(分別對(duì)應(yīng)x,y,θ,v維度),求解HJB方程所需時(shí)間為386s(迭代誤差小于0.1視為滿足收斂要求).重構(gòu)規(guī)劃的結(jié)果如圖7(a)所示.實(shí)線是搜素得到的各模塊的實(shí)際運(yùn)動(dòng)軌跡,而虛線是簡(jiǎn)化模型的最優(yōu)軌跡,各模塊均避開(kāi)了靜態(tài)障礙物并到達(dá)目標(biāo)構(gòu)形中相應(yīng)的子目標(biāo),而且軌跡之間無(wú)干涉.圖7(b)為各模塊輪體電機(jī)的轉(zhuǎn)速.從圖7中可以發(fā)現(xiàn),各模塊基本都先以較大的加速度達(dá)到最大速度,在接近目標(biāo)時(shí)又以最大能力減速,其變化符合Bang-bang控制的特征.

圖7 三角構(gòu)形重構(gòu)例子Fig.7 The recon fi guration example of the triangle con fi guration
實(shí)例2的目標(biāo)構(gòu)形為串形構(gòu)形,其由3個(gè)模塊組成,附近存在5個(gè)模塊,其位姿為隨機(jī)生成.由于組成串形構(gòu)形的相鄰模塊的間距較小,各運(yùn)動(dòng)模塊在接近目標(biāo)的過(guò)程中為避免碰到已就位的其他模塊需要調(diào)整手臂的姿態(tài),這會(huì)使其難以到達(dá)各自的目標(biāo).為此,將串形構(gòu)形進(jìn)行縱向的分解,以增大模塊的間距,待各模塊就位后再作簡(jiǎn)單的平移組成最終的構(gòu)形.為實(shí)現(xiàn)重構(gòu),顯然只需要三個(gè)獨(dú)立模塊.以獨(dú)立模塊為出發(fā)點(diǎn)的簡(jiǎn)化模型軌跡如圖8(a)所示.其中,模塊3和模塊5到達(dá)同一子目標(biāo),模塊1和模塊4到達(dá)同一子目標(biāo).從模塊1~5出發(fā)的簡(jiǎn)化模型軌跡對(duì)應(yīng)的能量分別為:291.1、168.7、308.0、113.8和199.4.根據(jù)能量最小的準(zhǔn)則,模塊2、模塊4和模塊5被選擇參與重構(gòu).重構(gòu)過(guò)程中各模塊的運(yùn)動(dòng)狀態(tài)如圖8(b)所示.
在仿真中,出現(xiàn)了有些子目標(biāo)的吸引域內(nèi)無(wú)模塊的情況,此時(shí)無(wú)法順利完成重構(gòu),如圖9(a)所示的例子.進(jìn)一步分析發(fā)現(xiàn),值函數(shù)吸引域的邊界(梯度為0的區(qū)域)形成Voronoi圖,如圖9(b)所示的三個(gè)子目標(biāo)的情況,同心圓表示值函數(shù)的等值線.能量最優(yōu)準(zhǔn)則下得到的值函數(shù)吸引域邊界則是以能量為度量的狀態(tài)空間中的廣義Voronoi圖.如果出現(xiàn)無(wú)法重構(gòu)的情況,可根據(jù)模塊所處的狀態(tài)采取不同的措施:在模塊距離吸引域的邊界較近時(shí),可對(duì)其施加輕微擾動(dòng),使其落到期望的子目標(biāo)的吸引域中;在模塊距離吸引域的邊界較遠(yuǎn)時(shí),可以通過(guò)設(shè)置虛擬障礙物的方式對(duì)最優(yōu)控制的計(jì)算結(jié)果進(jìn)行干預(yù),使得值函數(shù)形成的吸引域符合最優(yōu)的分配.

圖9 二維無(wú)約束機(jī)器人距離最優(yōu)重構(gòu)的值函數(shù)Fig.9 The value function of the recon fi guration of two dimensional unconstrained robots with optimal distance
本文針對(duì)移動(dòng)型模塊化機(jī)器人的重構(gòu)規(guī)劃問(wèn)題提出一種能量次優(yōu)的規(guī)劃方法.借鑒近似約簡(jiǎn)思想,得到機(jī)器人的簡(jiǎn)化模型,通過(guò)求解最優(yōu)控制問(wèn)題,解決了目標(biāo)分配導(dǎo)致的組合爆炸問(wèn)題.在軌跡規(guī)劃中將搜索范圍集中于次優(yōu)區(qū)域,提高了算法效率.仿真結(jié)果表明,本文方法能夠在有障礙物的三維地形中選擇合適的模塊及其對(duì)應(yīng)的目標(biāo),并得到滿足機(jī)器人動(dòng)力學(xué)約束的運(yùn)動(dòng)軌跡.
附錄



其中,cθ=cosθ,sθ=sinθ,余下同理.
1 Yim M,Shen W M,Salemi B,Rus D,Moll M,Lipson H,Klavins E,Chirikjian G S.Modular self-recon fi gurable robot systems.IEEE Robotics&Automation Magazine,2007,14(1):43?52
2 He Xin-Yuan,Ma Shu-Gen,Li Bin,Wang Yue-Chao.Mechanical design of recon fi gurable planetary rover.Chinese Journal of Mechanical Engineering,2005,41(12):190?195
(賀鑫元,馬書(shū)根,李斌,王越超.可重構(gòu)星球探測(cè)機(jī)器人的機(jī)構(gòu)設(shè)計(jì).機(jī)械工程學(xué)報(bào),2005,41(12):190?195)
3 Bhat P,Ku ff ner J,Goldstein S,Srinivasa S.Hierarchical motion planning for self-recon fi gurable modular robots.In:Proceedings of the 2006 IEEE/RSJ International Conference on Intelligent Robots and Systems.Beijing,China:IEEE,2006.886?891
4 Dewey D J,Ashley-Rollman M P,De Rosa M,Goldstein S C,Mowry T C,Srinivasa S S,Pillai P,Campbell J.Generalizing metamodules to simplify planning in modular robotic systems.In:Proceedings of the 2008 IEEE/RSJ International Conference on Intelligent Robots and Systems.Nice,France:IEEE,2008.1338?1345
5 Vassilvitskii S,Kubica J,Rie ff el E,Suh J,Yim M.On the general recon fi guration problem for expanding cube style modular robots.In:Proceedings of the 2002 IEEE International Conference on Robotics and Automation.Washington,USA:IEEE,2002.801?808
6 Yoshida E,Murata S,Kamimura A,Tomita K,Kurokawa H,KokajiS.A motionplanningmethodforaselfrecon fi gurable modular robot.In:Proceedings of the 2001 IEEE/RSJ International Conference on Intelligent Robots and Systems.Maui,HI,USA:IEEE,2001.590?597
7 Hu Y N,Ma S G,Li B,Wang M H,Wang Y C.Recon fi guration planning for wheel-manipulator robots.In:Proceedings of the 5th Annual IEEE International Conference on Cyber Technology in Automation,Control and Intelligent Systems.Shenyang,China:IEEE,2015.529?534
8 Lavalle S M,Ku ff ner J J Jr.Randomized kinodynamic planning.The International Journal of Robotics Research,2001,20(5):378?400
9 Cherif M.Motion planning for all-terrain vehicles:a physical modeling approach for coping with dynamic and contact interaction constraints.IEEE Transactions on Robotics and Automation,1999,15(2):202?218
10 Tokekar P,Karnad N,Isler V.Energy-optimal trajectory planning for car-like robots.Autonomous Robots,2014,37(1):279?300
11 Howard T M,Kelly A.Optimal rough terrain trajectory generation for wheeled mobile robots.The International Journal of Robotics Research,2007,26(2):141?166
12 Burridge R R,Rizzi A A,Koditschek D E.Sequential composition of dynamically dexterous robot behaviors.The International Journal of Robotics Research,1999,18(6):534?555
13 Zhu Yao-Lin,Yang Zhi-Hai,Chen Xi-Hao.Investigation on the methods of model reduction.Microcomputer Information,2011,27(6):22?25
(朱耀麟,楊志海,陳西豪.模型降階方法研究.微計(jì)算機(jī)信息,2011,27(6):22?25)
14 Yamane K.Systematic derivation of simpli fi ed dynamics for humanoid robots.In:Proceedings of the 12th IEEE-RAS International Conference on Humanoid Robots.Osaka,Japan:IEEE,2012.28?35
15 Ostrowski J P.Computing reduced equations for robotic systems with constraints and symmetries.IEEE Transactions on Robotics and Automation,1999,15(1):111?123
16 Tabuada P,Ames A D,Julius A,Pappas G J.Approximate reduction of dynamic systems.Systems&Control Letters,2008,57(7):538?545
17 Hu Ya-Nan,Ma Shu-Gen,Li Bin,Wang Ming-Hui,Wang Yue-Chao.Modular dynamics modeling approach of group con fi guration of wheel-manipulator robots.Journal of Mechanical Engineering,2015,51(1):24?33
(胡亞南,馬書(shū)根,李斌,王明輝,王越超.輪手一體機(jī)器人群體構(gòu)形的模塊化動(dòng)力學(xué)建模方法.機(jī)械工程學(xué)報(bào),2015,51(1):24?33)
18 Lin F,Brandt R D,Sun J.Robust control of nonlinear systems:compensating for uncertainty.International Journal of Control,1992,56(6):1453?1459
19 Khalil H K.Nonlinear Systems(3rd Edition).Beijing:Publishing House of Electronics Industry,2012.116?120(Khalil H K.非線性系統(tǒng)(第3版).北京:電子工業(yè)出版社,2012.116?120)
20 Bardi M,Capuzzo-Dolcetta I.Optimal Control and Viscosity Solutions of Hamilton-Jacobi-Bellman Equations.Boston:Birkh¨auser,1997.
21 Crandall M G,Lions P L.Two approximations of solutions of Hamilton-Jacobi equations.Mathematics of Computation,1984,43:1?19
22 Osher S,Fedkiw R.Level Set Methods and Dynamic Implicit Surfaces(Applied Mathematical Sciences).New York:Springer,2003.
23 Tsai Y H R,Cheng L T,Osher S,Zhao H K.Fast sweeping algorithms for a class of Hamilton-Jacobi equations.SIAM Journal on Numerical Analysis,2003,41(2):673?694
24 Takei R,Tsai R.Optimal trajectories of curvature constrained motion in the Hamilton-Jacobi formulation.Journal of Scienti fi c Computing,2013,54(2?3):622?644
25 Solis J M,Longoria R G.Modeling track-terrain interaction for transient robotic vehicle maneuvers.Journal of Terramechanics,2008,45(3):65?78
26 Huang M H,Orin D E.Dynamic simulation of activelycoordinated wheeled vehicle systems on uneven terrain.In:Proceedings of the 2001 IEEE International Conference on Robotics and Automation.Seoul,South Korea:IEEE,2001.779?786

胡亞南 中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所博士.主要研究方向?yàn)闄C(jī)器人運(yùn)動(dòng)規(guī)劃.本文通信作者.
E-mail:robinvista2@gmail.com
(HU Ya-Nan Ph.D.candidate at Shenyang Institute of Automation,Chinese Academy of Sciences.His main research interest is robot motion planning.Corresponding author of this paper.)

馬書(shū)根 日本立命館大學(xué)機(jī)器人系教授,中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所研究員.主要研究方向?yàn)榉律鷻C(jī)器人,防災(zāi)救援機(jī)器人,環(huán)境適應(yīng)機(jī)構(gòu)學(xué).
E-mail:shugen@se.ritsumei.ac.jp
(MA Shu-Gen Professor in the DepartmentofRobotics,Ritsumeikan University,Japan.He is also a professor at Shenyang Institute of Automation,Chinese Academy of Sciences,China.His research interest covers biomimetic robots,rescue robots,and environment-adaptive mechanism.)

李 斌 中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所研究員.主要研究方向?yàn)榉律鷻C(jī)器人,移動(dòng)機(jī)器人,機(jī)器人控制.
E-mail:libin@sia.cn
(LI Bin Professor at Shenyang Institute of Automation,Chinese Academy of Sciences.His research interest covers biomimetic robots,mobile robots,and robot control.)

王明輝 中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所研究員.主要研究方向?yàn)橐苿?dòng)機(jī)器人,機(jī)器人控制,多機(jī)器人協(xié)作.
E-mail:mhwang@sia.cn
(WANG Ming-HuiProfessorat Shenyang Institute of Automation,Chinese Academy of Sciences. His research interest covers mobile robots,robot control,and multi-robot cooperation.)

王越超 中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所研究員.主要研究方向?yàn)闄C(jī)器人學(xué).
E-mail:ycwang@sia.cn
(WANG Yue-ChaoProfessorat Shenyang Institute of Automation,Chinese Academy of Sciences.His research interest covers robotics.)
An Energy Suboptimal Recon fi guration Planning Approach to Wheel-manipulator Robots
HU Ya-Nan1,2MA Shu-Gen1,3LI Bin1WANG Ming-Hui1WANG Yue-Chao1
In recon fi guration planning of modular robots,coupling between goal assignment for individual modules and their trajectory planning leads to the combinatorial explosion problem.This paper proposes an energy suboptimal planning approach based on a simpli fi ed model.The problem of recon fi guration planning is transformed into an optimal control problem,which decouples goal assignment and trajectory planning.By solving the optimal control problem described by the Hamilton-Jacobi-Bellman(HJB)equation,a value function and optimal trajectories of the simpli fi ed model are derived.Respective goals of the modules are determined by attraction regions of the value function.Actual trajectories are obtained by searching in suboptimal regions that locate in the neighborhood of optimal trajectories of the simpli fi ed model.Simulation results show that the proposed approach can select a proper set of modules,and that generated trajectories can satisfy the dynamic constraint of the robot in an environment with obstacles.
Modular robots,recon fi guration planning,model reduction,optimal control
November 12,2015;accepted June 14,2016
胡亞南,馬書(shū)根,李斌,王明輝,王越超.輪手一體機(jī)器人能量次優(yōu)重構(gòu)規(guī)劃方法.自動(dòng)化學(xué)報(bào),2017,43(8):1358?1369
Hu Ya-Nan,Ma Shu-Gen,Li Bin,Wang Ming-Hui,Wang Yue-Chao.An energy suboptimal recon fi guration planning approach to wheel-manipulator robots.Acta Automatica Sinica,2017,43(8):1358?1369
2015-11-12 錄用日期2016-06-14
國(guó)家自然科學(xué)基金(61473283)資助
Supported by National Natural Science Foundation of China(61473283)
本文責(zé)任編委侯增廣
Recommended by Associate Editor HOU Zeng-Guang
1.中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室 沈陽(yáng)110016中國(guó) 2.中國(guó)科學(xué)院大學(xué)北京100049中國(guó) 3.日本立命館大學(xué)理工學(xué)部機(jī)器人學(xué)系滋賀525-8577日本
1.State Key Laboratory of Robotics,Shenyang Institute of Automation,Chinese Academy of Sciences,Shenyang 110016,China 2.University of Chinese Academy of Sciences,Beijing 100049,China 3.Department of Robotics,Ritsumeikan University,Shiga-ken 525-8577,Japan
DOI10.16383/j.aas.2017.c150752