摘 要:構建了基于Internet的移動機器人控制平臺,針對該平臺中網絡時延的非線性特性,提出了利用線性核和RBF核方法對網絡時延序列樣本進行回歸建模和預測。比較了核方法、BP神經網絡和RBF神經網絡算法預測誤差,表明在移動機器人遠程控制中,核方法對網絡時延序列預測具有更好的函數逼近能力和較高的預測精度,從而可根據預測時延調節移動機器人控制指令和狀態信息的網絡傳輸,保證系統的可靠性,提高移動機器人的控制性能。
關鍵詞:移動機器人; 遠程控制; 核方法; 網絡時延; 預測
中圖分類號:TP39
文獻標志碼:A
文章編號:1001-3695(2008)07-2129-03
Time delay prediction and analysis based on kernel method
for mobile robot remote control
LI Xue,HE Yu-yao, YAN Mao-de
(School of Electronic Control Engineering, Chang’an University, Xi’an 710064, China)
Abstract:This paper built a mobile robot control platform based on Internet; with the consideration of the time-delay non-li-near characteristics of the platform proper, advanced the proposal of regression modeling and prediction to the time-delay series samples by means of linear kernel and RBF kernel methods. An error comparison was conducted between two kinds of predictions: the kernel method prediction and the BP neural network and RBF neural network method prediction. The result shows that, in the process of mobile robot control, compared with the neural network method, the adoption of the kernel method in the prediction of the network time-delay has better function approximation and higher prediction accuracy, so that, according to the predicted time-delay, it is possible to adjust the control instructions of the mobile robot and the network transmission of the status information to guarantee the system reliability and improvement of control performance of the mobile robot.
Key words:mobile robot;remote control;kernel method; network time-delay; prediction
基于Internet對移動機器人進行遠程控制時,由于互聯網傳輸時延的變化可能引起控制效果的惡化,甚至使系統變得不穩定[1]。采用有效的預測方法對傳輸時延進行精確估計,可以根據預測時延進行移動機器人控制指令和狀態信息的網絡傳輸控制和用戶行為調節,從而降低信息丟失和延遲,保障系統的可靠性。移動機器人遠程控制系統基于Internet進行通信,由于受多種因素如通信距離、互聯網負載以及通信節點數量、負荷和處理速度甚至連接帶寬等影響,網絡時延會呈現出非平穩動態隨機變化特征,具有較強的非線性 [2~4]。傳統的馬爾可夫、AR、ARMA等模型只能處理平穩過程,ARIMA和ARIMA季節模型只能處理齊次的非平穩性過程[5]。因而上述模型難以描述大規模網絡流量的非平穩隨機過程。近年來,隨著智能算法的不斷發展,神經網絡被應用到網絡時延預測中,文獻[6]采用線性網絡和RBF網絡對網絡時延進行預測,但是預測準確率在時延穩定情況下,用RBF神經網絡方法預測誤差大于15%的結果占到30%之多。在某些情況下,神經網絡雖然擬合非常好,但預測卻很差。核方法采用的是對多維空間的超平面尋找,其良好的非線性映射能力在預測領域中表現出比神經網絡方法較好的效果[7]。網絡時延預測屬于非線性回歸估計問題,核方法解決這類問題有較強的優勢。
1 網絡環境搭建及樣本采集
進行網絡時延預測,首先要獲取網絡時延樣本。為了對移動機器人進行遠程控制和獲取網絡時延樣本序列,搭建無線網絡環境如圖1所示。該系統主要由遠程控制中心、Internet網絡傳輸和移動機器人三部分組成。采用基于Web的操作手段,用戶通過圖形化控制界面將指令發送至遠程控制中心,遠程控制中心通過無線網卡與移動機器人進行通信,以實現用戶與遠程移動機器人的控制指令傳輸、圖像傳輸和機器人狀態信息(環境、位置、運動等信息)反饋。系統以美國ActivMedia Robotic公司的Pioneer3-AT移動機器人為被控對象,移動機器人下位機將傳感器采集到的數據通過RS-232串行口傳給機器人上位機,機器人上位機將采集的數據信息實時傳給遠程控制中心,控制中心對這些信息進行分析,指導機器人下一步動作,并將機器人采集到的數據進行處理。
采用原始socket編程,設計并實現了一種改進的UDP,將TCP的三次握手變為兩次握手,在保證傳輸可靠性的同時,也能保證傳輸時延減小。在移動機器人控制平臺上,使用本協議連續采集從2007年4月2日11:00到次日凌晨6:00遠程控制中心到移動機器人的RTT(round trip time)時延,選取時延變化較為強烈的連續網絡時延樣本500個,用于核方法學習和預測。網絡時延樣本如圖2所示。
2 核函數的構建與選擇
核方法是核函數方法與機器學習的有機結合,在解決時延序列預測方面有相對于其他智能算法獨特的優勢。網絡時延預測為一個非線性回歸問題,給定網絡時延序列樣本集為 xk,yknk=1。其中:xk∈Rd,為 d維輸入變量;yk∈R,為輸出變量。構造回歸估計函數:
f(x)=(ω×Φ(x))+b,Φ:Rd→H,ω∈Rd(1)
其中:ω為權向量;b為偏差;Φ(#8226;)為非線性映射函數,它將輸入空間數據集映射到高維特征空間(核空間)H。在 H空間進行線性回歸。該回歸問題等價于使如下泛函最小:
其中:C(#8226;)為損失函數。其優化目標為
minω,b(1/2)‖ω‖2 s.t.|yi-(ω×Φ(x))-b|≤ε(3)
引入松馳變量 ξi、ξi和懲罰系數C>0,對超出回歸允許最大誤差ε的樣本進行調節,則有
這是一個不等式約束下的優化問題,引入Lagrange乘子,將式(4)轉換為
此時,ω=ni=1(αi-αi)Φ(xi),α≠0對應的樣本xi稱做支持向量。任意支持向量的ξi、ξi均為0,解上述凸二次規劃問題可得非線性映射表示:
延序列非線性回歸時,通過核函數實現非線性變換將輸入空間變換到一個高維空間(核空間),使其在核空間中變得線性可分或近似線性可分,然后在核空間中進行線性算法,從而實現相對于原空間的非線性算法。采用不同的核函數如線性核K(xi,x j)=(xi×x j)、多項式核K(xi,x j)=[(xi×x j)+k]n、RBF核K(xi,x j)=exp[-(xi-x j)2/σ2]和Sigmoid核K(xi,x j)=tanh[v(xi×x j)+k]等可以獲得不同的核機器,性能也各不相同。線性核函數和RBF核函數是具有全局收斂特性的線性學習算法的前饋網絡,其學習速度快,故可擬合網絡時延,進行網絡時延預測。
3 數據預處理
對于采集到的網絡時延序列樣本,前150個樣本進行學習,后350個樣本用于預測。為了取得較好的預測結果,在樣本學習前,首先需提取樣本特征。設網絡時延序列為 (t1,t2,t3,…,ti),i為樣本時間序列號, i≤150。提取如下特征量:
a)前四個特征值分別取當前i、i-1、i-1、i-3時刻網絡時延xi1=ti,xi2=ti-1,xi3=ti-2,xi4=ti-3。
b)第五個特征值取前四個特征值加權平均值,xi5=(1/4)∑4j=1ωi jxi j。某一時刻越接近預測時刻,該時刻網絡時延值就會越接近預測時刻的時延值,所以取權值ωi1=1; ωi2=1/2,ωi3=1/3; ωi4=1/4。
可得學習機需要的數據集格式 S=[yi;xi1,xi2,xi3,xi4, xi5],i≤150。其中:x為核方法的學習輸入變量,yi是ti+1時刻的網絡時延預測值,為學習的輸出。對輸入變量進行歸一化處理,得到輸出結果yi。部分網絡時延樣本如表1所示。
4 時延預測及結果分析
首先采用線性核和高斯核函數獲得核機器,用基于混合遺傳算法的核參數選擇方法[9]來選擇參數。該算法是遺傳算法與最速下降法的結合。在選擇參數過程中,為了避免適應度高的個體被淘汰,選擇再生算子(reproduction) 和期望值方法(expected value model)對問題進行聯合來求得最優的目標函數值,它模擬生物進化過程隨機搜索解空間中的許多點, 不易陷入局部最優解, 能夠快速全局收斂。參數選擇如表2所示。其中:C為懲罰系數;ε為超出回歸允許最大誤差;σ為高斯函數的方差。
選取表2中參數,基于線性核方法和RBF核方法對350個時延序列進行預測,定義損失函數為二次線性不敏感損失函數:
實測時延樣本與線性核方法預測結果及RBF核方法進行預測結果如圖3所示。
定義網絡時延預測相對誤差 Err=|(yf-yr)/yr|×100%。對時延預測結果分析總結如下:
a)對移動機器人遠程控制平臺網絡時延進行預測時,線性核方法和RBF核方法預測統計相對誤差結果如表3所示。
文獻[6]中采用線性神經網絡和RBF神經網絡對網絡時延進行預測,統計預測誤差結果如表4所示。
從表3和4中可明顯看出,核方法比神經網絡方法可更好地進行網絡時延預測。神經網絡是對局部的優化,同時又極為依賴訓練樣本,而核方法由于采用對多維空間超平面的尋找,良好的非線性映射能力在對網絡時延預測中表現出比神經網絡方法較強的優勢。
b)線性核方法和RBF核方法對移動機器人遠程控制平臺網絡時延序列訓練和預測分析結果如表5所示。
從表5中核方法學習速度和支持向量個數統計結果可以看出,在進行網絡時延訓練模型過程中,使用RBF核比使用線性核迭代次數少,并且得到的支持向量個數少,證明RBF核方法在時延模型訓練時優于線性核方法。
定義均方誤差 σ=[∑ni=1(yfi-yri)2]/n。從表5中核方法預測分析結果可看出,利用核方法進行網絡時延預測時,達到了較高的預測精度。比較兩種核方法預測均方誤差,可得σlin<σRBF,表明線性核方法有比RBF核方法更高的預測精度。同時,對兩種核方法進行算法綜合評價,計算其相互關聯系數(correlation coefficient),可得cclin>ccRBF,可見線性核方法比RBF核方法算法更加優化。
c)從圖4和5可以看出,雖然在網絡較穩定的情況下,采用兩種核方法進行預測,均能達到較高精度,但在網絡時延跳變較大的時刻,如在第46、71、120、251、333這些樣本處會產生較大預測誤差。因此在實際應用中,對于網絡時延預測結果,必須進一步進行正確性判斷,并采取有效的控制方法對錯誤結果進行修正。
5 結束語
本文構建了一個基于Internet的移動機器人控制平臺,采用無線網絡對遠程機器人進行遙控操作,對網絡時延序列樣本用線性核和RBF核兩種核方法進行回歸建模和預測,得到兩種不同的核方法預測結果,并分析了誤差。實驗表明,在進行網絡時延序列預測時,與BP神經網絡和RBF神經網絡算法相比,核方法具有更好的函數逼近能力和較高的預測精度。同時,線性核方法比RBF核方法有較高的預測精度。結果表明,在移動機器人遠程控制系統中,基于核方法對網絡時延近預測,可較好地預測網絡時延,從而可根據預測時延控制移動機器人指令傳輸速率,調節遠程用戶對移動機器人動作控制,保證系統的可靠性。
參考文獻:
[1]GOLDBERGK,CHEN B,SOLOMON R,et al.Collaborative teloperation via the Internet[C]//Proc of IEEE International Conference on Robotics and Automation.San Francisco,CA:[s.n.],2000:2019-2024.
[2]LUO R C, CHEN T M. Development of a multibehaviour-based mobile robot for remote supervisory control through the Internet[J]. IEEE Trans on Mechatronics, 2000,5(4):376-385.
[3]任長清,吳平東,王曉鋒,等. 基于互聯網的液壓遠程控制系統延時預測算法研究[J]. 北京理工大學學報,2002,22(1):85-89.
[4]YE Xiu-fen, MENG M Q H,LIU P X,et al.Statistical analysis and prediction of round trip delay for Internet based teleoperation[C]//Proc of IEEE International Conference on Intelligent Robots and Systems.2002:2999-3004.
[5]KANTZ H.非線性時間序列分析[M].北京:清華大學出版社,2000.
[6]孫立寧,謝小輝,張峰峰,等.基于神經網絡的時延預測算法研究[J]. 機器人,2004, 26 (3):237-240,245.
[7]董輝,傅鶴林,冷伍明. 支持向量機的時間序列回歸與預測[J]. 系統仿真學報,2006,18(7):1785-1788.
[8]VAPNIK V. The nature of statistical learning theory[M]. New York:Springer,1999.
[9]齊志泉,田英杰,徐志浩.支持向量機中的核參數選擇問題[J]. 控制工程, 2005,12(4):379-381.
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。”