Alδ+=Alδ-cosβ+Qsinβ
(8)
φ+=δ+(1-cosβ)
(9)
2 雙足移動(dòng)機(jī)器人越障步態(tài)控制
2.1 姿態(tài)信息獲取
為提升雙足移動(dòng)機(jī)器人智能化程度,在越障步態(tài)控制中引入姿態(tài)信息,更準(zhǔn)確地掌握機(jī)器人的運(yùn)行姿態(tài),完成精準(zhǔn)越障。將雙足移動(dòng)機(jī)器人分成軀體、頭部、左上肢、右上肢、左下肢和右下肢6部分。創(chuàng)建機(jī)器人部件檢測(cè)器,其目標(biāo)是利用該檢測(cè)器,在圖片中找出機(jī)器人對(duì)應(yīng)部件方位[8]。以軀體部分為例,依照如下過程創(chuàng)建機(jī)器人部件檢測(cè)器。
a.在已拍攝完畢的訓(xùn)練圖片中裁剪軀體部位,將其旋轉(zhuǎn)到豎直狀態(tài),采集一些機(jī)器人軀體的圖片作為負(fù)例樣本。
b.計(jì)算各樣本圖片的方向梯度直方圖特征,取得1個(gè)矢量Z,矢量Z加上正例或負(fù)例標(biāo)簽,就表示相對(duì)的樣本圖片。
c.把獲得的矢量引入AdaBoost算法內(nèi)訓(xùn)練獲得強(qiáng)分類器,記為
(10)
式中:S(·)為sigmoid函數(shù);hi(·)為第i個(gè)矩形框長度計(jì)算函數(shù)。
關(guān)聯(lián)性是獲得機(jī)器人姿態(tài)信息的關(guān)鍵指標(biāo),以左上肢和軀體之間的距離關(guān)系為例,設(shè)定軀體方位是已知的[9],僅需計(jì)算左上肢當(dāng)前處在何種方位即可。設(shè)定左上肢和軀干相連的邊是g,二者在軀體的頂點(diǎn)k處相互連接,則邊g的中心點(diǎn)和軀體頂點(diǎn)k之間的距離為
(11)
式中:xg、yg為邊g的橫縱坐標(biāo);xk、yk為頂點(diǎn)k的橫縱坐標(biāo)。
關(guān)聯(lián)性評(píng)價(jià)指標(biāo)最終表達(dá)式為
od=p(-1×(d-n))/(N-n)
(12)
式中:p為關(guān)聯(lián)常數(shù);n為全部候選區(qū)域內(nèi)的最小d值;N為全部候選區(qū)域內(nèi)的最大d值。
可以看出,d值越小,關(guān)聯(lián)度od的值越大,機(jī)器人姿態(tài)信息的關(guān)聯(lián)程度越高。
骨骼密度能展現(xiàn)機(jī)器人每個(gè)部位的位置與走向,在人機(jī)交互中為一個(gè)核心識(shí)別特征[10]。通過獲取骨骼數(shù)據(jù)系統(tǒng)評(píng)估機(jī)器人姿態(tài),將候選區(qū)域的骨骼密度計(jì)算公式描述為
qj=r1q1+r2q2
(13)
式中:q1為骨骼點(diǎn)數(shù)量;q2為骨骼點(diǎn)居中水平;r1、r2均為計(jì)算權(quán)重,二者相加之和等于1。
2.2 越障步態(tài)控制
得到足夠的姿態(tài)信息后,為進(jìn)一步優(yōu)化越障步態(tài)控制精度,實(shí)現(xiàn)期望越障成效,設(shè)計(jì)一種基于神經(jīng)網(wǎng)絡(luò)前饋補(bǔ)償[11]的機(jī)器人越障步態(tài)控制策略,神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)為機(jī)器人姿態(tài)信息與障礙物圖像信息。
利用攝像頭獲取障礙物圖像信息[12],圖像信息使用坐標(biāo)系描述,將障礙物投影方位表示為
(14)
式中:u、w為橫向與縱向參照點(diǎn)方位。
雙足移動(dòng)機(jī)器人越障時(shí),使用具備前饋補(bǔ)償性能的神經(jīng)網(wǎng)絡(luò)進(jìn)行步態(tài)控制,針對(duì)機(jī)器人導(dǎo)線彎曲引發(fā)的不良影響創(chuàng)建前饋控制模型,在偏差與控制量之間組建補(bǔ)償模型[13]。
神經(jīng)網(wǎng)絡(luò)前饋補(bǔ)償控制器和神經(jīng)網(wǎng)絡(luò)分辨器的網(wǎng)絡(luò)架構(gòu)完全相等,都涵蓋輸入層、隱含層與輸出層,不同之處是輸入、輸出2個(gè)層級(jí)的引入?yún)?shù)。以神經(jīng)網(wǎng)絡(luò)分辨器為例,詳細(xì)分析雙足移動(dòng)機(jī)器人越障步態(tài)控制全過程。
設(shè)定I(1)、O(1)分別是神經(jīng)網(wǎng)絡(luò)第1層輸入值與輸出值,在輸入層中,把機(jī)器人加速度傳感器測(cè)量信號(hào)f與感知的姿態(tài)信息擬作輸入量,并代入網(wǎng)絡(luò)控制器輸入端,同時(shí)將其輸出值fi傳遞至網(wǎng)絡(luò)的下一層,此時(shí)存在如下對(duì)應(yīng)關(guān)系,即
O(1)=I(1)=f
(15)
在隱含層內(nèi)部,使用sigmoid函數(shù)[14]獲得各節(jié)點(diǎn)輸入的激勵(lì)函數(shù)為
(16)
式中:si為第i個(gè)節(jié)點(diǎn)下的函數(shù)權(quán)重值。
輸出層中,線性化計(jì)算隱含層獲得的信息,把計(jì)算結(jié)果擬作權(quán)重,得到
(17)
式中:R為訓(xùn)練總次數(shù)。
梯度下降算法計(jì)算簡(jiǎn)便、及時(shí)性強(qiáng)[15],在神經(jīng)網(wǎng)絡(luò)參數(shù)學(xué)習(xí)中使用梯度下降完成運(yùn)算任務(wù)。首先設(shè)置目標(biāo)函數(shù)F(x)的值域,記作
(18)
式中:z為控制系統(tǒng)輸出控制量;zn為神經(jīng)網(wǎng)絡(luò)分辨器補(bǔ)償量。
神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的根本目的是讓目標(biāo)函數(shù)值為最小[16],設(shè)定控制周期的補(bǔ)償量為tc,越障步態(tài)控制器的輸出為to。控制系統(tǒng)的當(dāng)前控制量t(j)為上述二者的總和,求出總和值即可完成神經(jīng)網(wǎng)絡(luò)訓(xùn)練,完成機(jī)器人智能化越障步態(tài)控制任務(wù)。
控制輸出總和計(jì)算公式為
t(j)=tc(j)+to(j)
(19)
式中:j為當(dāng)前控制所需時(shí)間。
3 實(shí)驗(yàn)分析
為驗(yàn)證本文所提方法能否完成精準(zhǔn)的越障步態(tài)控制,對(duì)其進(jìn)行實(shí)驗(yàn)分析,并把文獻(xiàn)[4]深度強(qiáng)化學(xué)習(xí)法與文獻(xiàn)[5]變質(zhì)心高度策略法擬作對(duì)比組,實(shí)驗(yàn)軟件為MATLAB。以某型號(hào)雙足移動(dòng)機(jī)器人為例,設(shè)置障礙物數(shù)量為5個(gè),起點(diǎn)坐標(biāo)是(0,0),目標(biāo)點(diǎn)所處坐標(biāo)是(8,8)。3種方法越障步態(tài)控制結(jié)果如圖1所示,圖中圓形為出發(fā)點(diǎn),三角形為目標(biāo)點(diǎn),實(shí)心方塊是障礙物,虛線部分為障礙物影響范圍。

圖1 3種方法越障步態(tài)控制結(jié)果對(duì)比
由圖1可知,本文方法的越障路徑較為平滑,能以最快速度完成越障,越障路徑最為合理,有效改進(jìn)了機(jī)器人在障礙物停滯不前的現(xiàn)象,越障性能顯著優(yōu)于其他2種方法。
通過越障步態(tài)控制偏差、質(zhì)心高度和SI指數(shù)來驗(yàn)證方法穩(wěn)定性。越障步態(tài)控制偏差實(shí)驗(yàn)中,設(shè)定實(shí)驗(yàn)時(shí)間為5 min,越障路徑總長為2 000 m,且有500 m路徑處于崎嶇地段,障礙物影響范圍較大,分析3種方法下機(jī)器人在二維平面垂直和水平方向上的越障姿態(tài)偏差,結(jié)果如圖2所示。

圖2 不同軸位的越障步態(tài)控制偏差對(duì)比
由圖2可知,越障控制下0~80 s與130~300 s時(shí),機(jī)器人控制偏差浮動(dòng)較小,偏差控制狀態(tài)較好,而在90~120 s時(shí)發(fā)生較大浮動(dòng)。這是由于機(jī)器人經(jīng)過了崎嶇地段,越障時(shí)會(huì)產(chǎn)生一定擺動(dòng)。但和其他2種方法相比,本文方法利用姿態(tài)信息感知功能,快速調(diào)整了機(jī)器人重心,增強(qiáng)機(jī)器人在垂直及水平方向的越障水準(zhǔn),證明了本文方法在極端情況下也能進(jìn)行更細(xì)微的行走操作,實(shí)現(xiàn)可靠的越障任務(wù)。
雙足移動(dòng)機(jī)器人的初始質(zhì)心高度采用傾斜平臺(tái)法測(cè)得,以初始質(zhì)心高度為中心零點(diǎn),當(dāng)雙足移動(dòng)機(jī)器人跨越障礙運(yùn)動(dòng)時(shí),其質(zhì)心的高度會(huì)發(fā)生變化,當(dāng)運(yùn)動(dòng)質(zhì)心高于初始質(zhì)心則為正數(shù);當(dāng)運(yùn)動(dòng)質(zhì)心低于初始質(zhì)心則為負(fù)數(shù)。假設(shè)機(jī)器人在平地運(yùn)動(dòng),路面上安置一個(gè)高度為7 m的障礙物,觀察雙足機(jī)器人越障時(shí)的質(zhì)心波動(dòng),結(jié)果如圖3所示。由圖3可知,面對(duì)7 m高的障礙物,本文方法下機(jī)器人成功越障后,質(zhì)心高度波動(dòng)情況明顯小于深度強(qiáng)化學(xué)習(xí)法和變質(zhì)心高度策略法,證明了本文方法可以花費(fèi)較小的動(dòng)力就能越過障礙,垂直方向能量耗損有較大改善,完成了越障步態(tài)控制的預(yù)期目標(biāo)。

圖3 機(jī)器人越障質(zhì)心浮動(dòng)對(duì)比
采用穩(wěn)定性指數(shù)(stability index,SI)衡量機(jī)器人越障步態(tài)控制水準(zhǔn),該指標(biāo)計(jì)算公式為

(20)
式中:λt為實(shí)測(cè)零力矩點(diǎn);λs為預(yù)期零力矩點(diǎn);λmax、λmin分別為零力矩點(diǎn)的最大值與最小值。
設(shè)定越障路徑總長為100 m,在行走第9 s引入一定外力擾動(dòng),SI指數(shù)變化趨勢(shì)如圖4所示。

圖4 SI指數(shù)變化趨勢(shì)
由圖4可知,本文方法雙足機(jī)器人行走受到擾動(dòng)時(shí),步態(tài)控制的SI指數(shù)波動(dòng)較小,具備更好的抗干擾性能,動(dòng)態(tài)穩(wěn)定性也隨之提高,綜合性能優(yōu)于其他2種方法,在真實(shí)場(chǎng)景應(yīng)用中可獲得更優(yōu)的實(shí)踐結(jié)果。
4 結(jié)束語
為有效處理雙足移動(dòng)機(jī)器人越障波動(dòng)性大、穩(wěn)定性不高的實(shí)際問題,結(jié)合人機(jī)交互概念,本文提出一種基于姿態(tài)信息的雙足移動(dòng)機(jī)器人越障步態(tài)控制方法。分析機(jī)器人動(dòng)力學(xué)特征并劃分姿態(tài)規(guī)律,使用擁有前饋補(bǔ)償性質(zhì)的神經(jīng)網(wǎng)絡(luò)進(jìn)行越障步態(tài)控制訓(xùn)練。實(shí)驗(yàn)過程中,利用不同指標(biāo)和傳統(tǒng)算法進(jìn)行對(duì)比,充分驗(yàn)證了所提方法在越障步態(tài)控制方面的實(shí)用性與可靠性,為提升機(jī)器人整體越障性能打下堅(jiān)實(shí)基礎(chǔ)。