999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

力反饋遙操作系統中的在線環境參數辨識研究

2017-10-18 11:25:26丁宇堃宋荊洲尚志豪韓亮亮
載人航天 2017年5期
關鍵詞:環境實驗模型

丁宇堃,宋荊洲,尚志豪,韓亮亮

力反饋遙操作系統中的在線環境參數辨識研究

丁宇堃1,宋荊洲1,尚志豪1,韓亮亮2

(1.北京郵電大學自動化學院,北京100876;2.上海宇航系統工程研究所,上海201108)

力反饋遙操作系統是載人航天工程中的重要技術組成部分,而環境的在線參數辨識是實現大時延下反饋力的本地實時預測的關鍵技術。使用交叉驗證分析了不同建模方法的準確性和適用條件;對常用的在線參數辨識算法進行實驗驗證,從參數收斂性和對時變環境的跟蹤性等方面進行對比分析。實驗結果表明,Hunt-Crossley模型以高復雜獲得了更高的建模精度,適宜在數據充分的離線條件下采用;同時,在參數辨識算法方面,相比于同類算法,自擾動遞歸最小二乘法在參數辨識的收斂性和對時變環境的跟蹤性上都有較好的表現,是實際應用中的首選方法。該結果可為環境動力學模型的在線參數辨識技術的工程應用提供參考。

遙操作;環境模型;參數辨識

Abstract:Force feedback teleoperation system is an important part of the manned space flight project,and the on-line parameter identification of environment is the key technology to realize the local real-time prediction of the feedback force under large time delay.In this paper,the method of online environment parameter identification in force feedback teleoperation system was studied.The accuracy of different modeling methods and applicable conditions were analyzed through cross validation;then the commonly used online parameter identification algorithms were experimentally verified.The convergence of the environment parameters and the tracking of the time-varying environment were analyzed.The experimental results showed that the Hunt-Crossley model achieved higher modeling accuracy with high complexity and was suitable for use under sufficient offline conditions.At the same time, compared to similar parameter identification algorithms, the tracking of dynamic recursive least squares method had better performancein parameter identification of self convergence and time-varying environment and was the preferred method for practical application.This paper provides a reference for engineering application of technology for online parameter identification of dynamic model of environment.

Key words:teleoperation; environment model; parameter estimation

1 引言

隨著空間站建設和運營的深入,機器人天地遙操作裝配任務的需求越來越多。如果本地端操作設備能夠實時提供準確的反饋力信息,將有助于增強操作者對工作環境的感知,提高操作效率,改善操作者的操作體驗。因而采用力預測的方法,構造力預測模型,解算出與顯示的仿真環境同步的反饋力,通過力反饋手控器施加給操作者,使操作者感受到操作中的反饋力,能夠帶來更好的臨場感。

環境模型建模及參數辨識是實現接觸力預測的關鍵。通常將與機器人系統末端執行器發生接觸的物體稱為“環境”,將環境的接觸動力學特性建模為環境動力學模型。在接觸階段,可以通過傳感器獲得從端執行器和環境的相對位置、速度和接觸力等信息,從而對動力學模型中在線參數辨識進行修正。參數辨識結果可以輸入自適應阻抗控制器或模型參考自適應控制器來實現穩定的接觸。此外,基于預測模型的力反饋遙操作系統也依賴在線環境參數辨識力修正主端預測模型的動力學參數,為操作者提供準確的力覺臨場感。

對于環境的幾何特征辨識,國內外的研究者也開展了相當多的研究:Xu Xiao等基于飛行時間的立體相機,進行距離測定從而進行環境幾何參數辨識[1]。李會軍等使用力和位置信息的綜合處理來對環境的位置信息進行辨識[2],Velanas等使用遞歸最小二乘法對環境進行曲率辨識[3]。Willaert等則研究了利用視覺信息辨識接觸點的位置和法線方向[4-5]。

相關研究應用中采用的環境動力學模型主要包括純剛度模型和Kelvin-Voigt模型[6]。近年來,學者開始關注準確性更高的Hunt-Crossley模型,然而它的非線性增加了對其進行參數辨識的難度,導致它目前還難以實現實際應用[7]。在不同模型的比較方面,Yamamoto等首先使用了交叉驗證的方法比較了不同環境模型的建模精度[8]。

在環境的動力學參數辨識方面,Haddadi等研究了基于梯度下降的最小二次均方算法(BLMS),并與基于窗函數的最小二乘法(BLS)做了比較[6-9]。Love等較早使用了遞歸最小二乘法來辨識環境剛度,并用于調整從端阻抗控制器的參數,改善接觸性能[10]。Colton等則使用了指數加權遞歸最小二乘法(EWRLS)進行參數辨識[11]。Achhammer等使用了自擾動遞歸最小二乘法(SPRLS)進行了混合模型的參數辨識,并取得了較好的效果[12]。雖然研究者探索了多種參數辨識方法,遞歸最小二乘法類算法憑借其簡單有效和魯棒性強的特點得到了最廣泛的應用。

本文對機器人系統中的環境動力學模型建模和參數辨識技術進行比較驗證研究,比較分析不同建模方法的準確性和適用范圍,首次使用交叉驗證的方法衡量在線參數辨識過程中模型準確性的變化,以期為環境模型參數在線辨識技術在機器人空間裝配中的應用提供指導。

2 動力學模型建模

首先分析現有的環境動力學模型建模方法,在大范圍實驗條件下對其進行實驗驗證,使用交叉驗證的方法更完整地分析其建模準確性。

2.1 接觸動力學模型

純剛度模型(以下簡稱K模型)只有一個參數,即環境剛度k,在接觸階段,接觸力f按環境剛度正比于侵入深度[7],如公式(1)所示。

其中,x表示侵入物體簡化的代理點位置,xe為環境位置。kK和fK的下標表示對應K模型的參數,以下類似。

Kelvin-Voigt模型(以下簡稱KV模型)考慮了阻尼項bKV[7],如公式(2)所示。

Hunt-Crossley模型(以下簡稱HC模型)具有3個參數,通過阻尼項與位置的耦合,解決了KV模型的反向力問題,更接近實際環境物理性質。指數n的存在使其更好地描述接觸力隨侵入深度的非線性變化[8],模型如公式(3)所示。

相同輸入信號下,典型的KV模型和HC模型的接觸力與侵入深度的磁滯回線如圖1所示。對于KV模型,當(x-xe)→0而且x·<0時,fKV為負值,而實際接觸時,接觸力始終為正值。為負值的接觸力會造成力反饋遙操作中的“黏附感”,影響操作者對環境的認知和正確操作。而HC模型則不存在負值力的問題,整個接觸過程中fHC始終為正值。

另一方面,KV模型的不連續問題也給系統穩定性帶來不利影響。由于直接相關,在接觸的開始和結束階段,的突變會導致的突變,也導致了系統能量的突變。而實際的接觸中,即使考慮碰撞效應,實際接觸力也在連續變化。

圖1 KV模型與HC模型的磁滯回線Fig.1 Hysteresis loops of KV model and HC model

2.2 模型準確性分析

根據上述3種模型參數數量的依次遞增和實驗結果驗證,K、KV和HC模型的復雜度和準確性依次遞增,通常在實際應用中根據不同情況選取合適的建模方法。為了研究不同的模型在實際環境建模中的效果,首先比較不同模型在離線辨識中對不同剛度的環境的建模準確性。實驗構造了剛度依次遞增的4種典型的接觸環境,分別為圖2中海綿、覆蓋于海綿上的橡膠墊、橡膠墊、金屬蓋板,并將其依次記為A、B、C、D。其剛度分別約為400 N/m、2000 N/m、8000 N/m和18 000 N/m。使用末端腕部裝有ATI mini40力傳感器的三自由度平動機械臂與環境進行接觸,機械臂末端位置和接觸力的采樣頻率為170 Hz。判斷發生接觸的力閾值設為0.05 N。

圖2 實驗接觸環境Fig.2 Contact environments in experiment

控制機械臂末端與不同環境發生接觸,并記錄接觸過程中機械臂末端位置和接觸力信息。每種接觸環境進行5次接觸實驗,共得到20組數據。每次接觸實驗中,機械臂位置由操作者手動控制,并在5次實驗中采用不同的動作模式來盡可能覆蓋可能的接觸情況,例如侵入深度偏大和偏小,速度較快和較慢。圖3為4種環境的典型力/位曲線圖。

使用最小二乘法根據得到的數據對各個模型選取最優參數,比較其理論上的最高準確度。對于線性模型[14],預測力可根據公式(4)進行計算。

其中,f(t)為t時刻的預測力,θ為未知參數,φ為回歸向量。可直接按照式(5)計算θ。

其 中,X=[φ1,φ2,…,φn]Τ,Y=[f1,f2,…,fn]Τ。 對于非線性的HC模型,本文采用信賴域算法進行迭代計算,當目標函數變化小于10-6時停止迭代。以環境B的第一組數據為例,根據所得參數計算得到的接觸力fp與實際接觸力fs的比較如圖4所示。可見,各環境模型建模都基本準確,K模型和KV模型具有明顯的力誤差,而HC模型的力誤差較小。

使用平均標準均方根誤差量化衡量模型準確性。相比于平均力誤差,標準均方根誤差使用誤差的二次項,對較大的誤差更敏感,并考慮原始數據的變化范圍,能夠更好地衡量模型的準確性。對誤差估計量y,標準均方根誤差的計算公式如式(6):

實驗結果如表1所示。由表可見,對于各種環境,HC模型都具有最低的力誤差,且對于中等剛度的對象優勢較為明顯。KV模型相比于K模型,雖然具有更高的復雜度,但是準確性只有微小的提高。

圖3 不同環境力/位曲線圖Fig.3 Force and position profiles of different environments

圖4 模型力誤差Fig.4 Force error of different models

表1 環境模型自驗證誤差Table 1 Self-validation error of different models

2.3 模型準確性交叉驗證

常用的自驗證方法是使用同一數據集進行參數辨識和準確性驗證,而交叉驗證則使用重復實驗的多次數據分別進行參數辨識和準確性驗證。相比于自驗證,交叉驗證的結果具有更強的通用性和魯棒性。為了更好地衡量辨識得到的模型對位置等狀態信息的魯棒性,綜合體現模型在實際應用中的準確性,使用交叉驗證的方法對模型準確性進行分析。對每組數據所得參數,使用相同環境下的其它4組數據進行準確性檢驗,并取平均標準均方根誤差。實驗結果如表2所示。

表2 環境模型交叉驗證誤差Table 2 Cross-validation error of different models

由實驗結果可見,HC模型在交叉驗證中仍具有較小的預測誤差,體現出針對期望的實際物理特征具有更高的準確性。但是相比于自驗證誤差,其在交叉驗證中相對于其他模型的優勢有所降低。尤其是在與海綿的接觸實驗中,誤差明顯超過了K和KV模型,其原因是包括海綿在內的低剛度柔性環境的接觸動力學特征具有較強的非線性,在辨識過程中,擬合能力較強的HC模型容易產生過擬合現象。過擬合的模型雖然在當前數據下具有較小的誤差,但是整體模型準確性卻明顯降低。

總體而言,相比于K模型,KV模型在準確性上僅有微小提高,但是由于參數數量卻為K模型的2倍,所以在存儲空間、計算能力和通信帶寬等方面幾乎具有雙倍的占用。HC模型雖然具有更高的復雜度和資源占用,但是對中等剛度的環境的建模具有明顯提高的準確性。同時,HC模型對低剛度柔性環境建模效果較差,對高剛度環境的建模沒有改善。

3 環境參數在線辨識

在環境模型建模的基礎上,模型參數決定了模型準確性。由于往往不能事先獲得準確的模型參數,需要在實際任務過程中,根據實時傳感信息,對環境參數進行在線辨識。從參數收斂性和對模型變化的快速響應特性等方面對最新的參數辨識算法進行比較分析,首次使用交叉驗證的方法衡量不同參數辨識算法在在線參數辨識過程中對模型準確性的影響。得到參數辨識過程中模型準確性的變化過程,更好地衡量參數辨識算法的實際效果。

3.1 環境參數的在線參數辨識方法

BLS算法取最近一段時間內的數據求解具有最小二次誤差的參數。該方法的主要優點在于簡單有效,但缺點在于難以取得合適的窗口大小W,較大的W收斂性較好,但是對變化系統的響應較慢,較小的W雖然能迅速反映系統變化,但是容易波動劇烈,收斂性較差。

基于梯度下降的算法利用目標函數的梯度進行迭代計算來搜索最優參數。在BLMS算法中,目標函數定義為預測誤差的二次函數如式(7)[13]:

未知參數的迭代公式如式(8):

其中,λk為迭代步長,為與梯度方向相反的單位向量,

EWRLS是環境參數辨識中一種常用的參數辨識算法,其迭代公式如式(9)所示[7]:

其中,P為協方差矩陣,η為遺忘因子。當η=1時,算法等效于標準的遞歸最小二乘法。通常取η為小于但接近1的數值來使算法對新數據賦予更高的權值。

上述參數辨識算法的缺點在于通常難以兼具收斂性和跟蹤性,即在實際環境不變時得到收斂的辨識結果,并在環境發生變化時及時反應環境變化。

SPRLS的核心思想是在在線辨識的過程中檢測前向預測誤差,當前向預測誤差超出預設閾值時,認為待辨識系統發生了變化,并按前向預測誤差大小增大協方差矩陣,提高算法對新數據的敏感性,使算法具有快速響應特性。同時,當前向預測誤差預設閾值時,算法等效于標準的遞歸最小二乘法,具有良好的收斂性。因此,SPRLS兼具良好的收斂性和對變化系統的快速跟蹤性能。算法遞歸方程如式(10)所示[12]:

其中β和γ分別為擾動增益和誤差增益,取整函數NINT()的表達式如式(11)所示:

3.2 環境參數的在線參數辨識實驗分析

對2.2節中設計的4種接觸環境各取2000個連續采樣數據,在K模型上應用上述方法進行參數辨識實驗。使用試錯法人工調節各算法的參數設置至最好的效果,實驗結果如圖5所示。

圖5 辨識算法比較圖Fig.5 Comparison of different estimation algorithms

由圖5(a)可見,4種辨識算法總體上都能夠辨識出環境剛度并能及時反映環境的變化,但在收斂性和跟蹤速度上有差異。圖5中(b)為環境B切換到環境C的過渡階段的放大圖。可見,SPRLS和BLMS算法對采樣編號為4000時發生的環境變化具有較快的反應速度,而EWRLS和BLS則響應較慢。圖5中(c)為環境C的平穩階段的放大圖,可見,只有SPRLS表現出了良好的收斂性,其余3種算法都有一定程度的波動。可見,相比于其余算法,SPRLS兼顧了良好的參數收斂性和對環境變化的快速跟蹤特性。在此基礎上,使用交叉驗證的方式衡量參數辨識過程中模型準確性的變化。即使用4種接觸環境的五組采樣數據中的一組數據進行參數辨識,然后取參數辨識過程中各個時刻的參數辨識值,并使用其余四組數據進行交叉驗證計算相應的誤差。實驗結果如圖6所示。

圖6中,各條曲線在采樣編號為2000、4000和6000處的尖峰表明環境的突變導致環境模型的誤差突然增大,但是各個參數辨識算法都能夠通過在線辨識修正模型參數,有效降低模型誤差,即獲得了較高的模型準確性。其中,SPRLS算法在環境突變后既能夠較快地降低誤差,又能在誤差降低后保持很好的穩定性。各個算法的模型誤差曲線與圖5中的模型參數變化規律相一致。SPRLS算法在采樣編號為2000的環境突變過程中保持了一小段時間的較高誤差之后才迅速降低誤差,其原因是該時刻主端位置較小,環境突變并沒有使預測力產生明顯誤差,沒有觸發SPRLS中的自擾動項。它表明SPRLS算法的快速跟蹤特性依賴于明顯的前向預測誤差,在缺乏特定輸入條件的情況下可能會導致參數收斂速度過慢。

4 結論

本文通過理論分析和實驗驗證對力反饋遙操作系統中環境動力學模型的建模和在線參數辨識方法進行了深入的比較分析,得到如下結論:

1)交叉驗證的結果說明:純剛度模型能以較低的復雜度得到一般的建模精度,Kelvin-Voigt模型相比于純剛度模型并沒有明顯優勢;Hunt-Crossley模型以高復雜度獲得了更高的建模精度,適宜在數據充分的離線條件下采用。

2)在參數辨識算法方面,相比于同類算法,自擾動遞歸最小二乘法在參數辨識的收斂性和對時變環境的跟蹤性上都有較好的表現,是實際應用中的首選方法,但是需要注意其快速跟蹤特性對較大前向誤差的依賴問題。

圖6 模型準確性變化圖Fig.6 Model accuracy profile during online estimation

(References)

[1] Xu X, Cizmeci B, Al-Nuaimi A, et al.Point cloud-based model-mediated teleoperation with dynamic andperceptionbased model updating[J].Instrumentation and Measurement,IEEE Transactions on, 2014, 63(11): 2558-2569.

[2] Liu H J, Aiguo S.Virtual-environment modeling and correction for force-reflecting teleoperation with time delay[J].Industrial Electronics, IEEE Transactions on, 2007, 54(2):1227-1233.

[3] Velanas S V,Tzafestas C S.Model-mediated telehaptic perception of delayed curvature[C]//RO-MAN, 2012 IEEE.IEEE,2012:941-947.

[4] Willaert B, Bohg J, Van Brussel H, et al.Towards multi-DOF model mediated teleoperation:using vision to augment feedback[C] //Haptic Audio Visual Environments and Games(HAVE), 2012 IEEE International Workshop on.IEEE,2012:25-31.

[5] 徐效農,宋愛國,朱澄澄,等.基于環境建模與修正的視覺/力覺輔助遙操作系統[J].載人航天,2016,22(1):55-61.XU Xioanong, SONG Aiguo, ZHU Chengcheng, et al.Visualhaptic aid teleoperation system based on environment modeling and updating[J].Manned Spaceflight, 2016, 22(1):55-61.(in Chinese)

[6] Haddadi A,Hashtrudi-Zaad K.Online contact impedance identification for robotic systems[C]//Haddadi A.2008 IEEE/RSJ International Conference on Intelligent Robots and Systems.Piscataway, NJ: IEEE, 2008:974-980.

[7] Haddadi A, Hashtrudi-Zaad K.Real-time identification of Hunt-Crossley dynamic models of contactenvironments[J].Robotics, IEEE Transactions on, 2012, 28(3): 555-566.

[8] Yamamoto T,Vagvolgyi B,Balaji K,et al.Tissue property estimation and graphical display for teleoperatedrobot-assisted surgery[C] //Yamamoto T.IEEE International Conference on Robotics and Automation, 2009.Piscataway, NJ: IEEE,2009:4239-4245.

[9] Haddadi A,Hashtrudi-Zaad K.A new fast online identification method for linear time-varying systems[C] //Haddadi A.2008 American Control Conference.Piscataway, NJ: IEEE,2008:1322-1328.

[10] Love L J, Book W J.Environment estimation for enhanced impedance control[C]//Love L J.1995 IEEEInternational Conference on Robotics and Automation.Piscataway, NJ:IEEE,1995,2:1854-1859.

[11] Colton M B, Hollerbach J M.Identification of nonlinear passive devices for haptic simulations[C]//Colton M B.2005 First Joint Eurohaptics Conference and Symposium on Haptic Interfaces for Virtual Environment andTeleoperator Systems.] //Piscataway, NJ: IEEE, 2005: 363-368.

[12] Achhammer A, Weber C, Peer A, et al.Improvement of model-mediated teleoperation using a new hybridenvironment estimation technique[C] //Achhammer A.2010 IEEE International Conference on Robotics andAutomation.Piscataway,NJ: IEEE,2010: 5358-5363.

[13] Haddadi A.Stability, performance, and implementation issues in bilateral teleoperation control and haptic simulation systems[J].2012.

[14] Yamamoto T, Bernhardt M, Peer A, et al.Techniques for environment parameterestimation duringtelemanipulation[C]//IEEE Ras& Embs International Conference on Biomedical Robotics and Biomechatronics.IEEE, 2008:217-223.

(責任編輯:康金蘭)

Online Environment Parameter Estimation for Force Feedback Teleoperation System

DING Yukun1, SONG Jingzhou1,SHANG Zhihao1,HAN Liangliang2
(1.Automation School in Beijing University of Posts and Telecommunications, Beijing 100876, China;2.Aerospace System Engineering Shanghai, Shanghai 201108, China)

V11

A

1674-5825(2017)05-0704-07

2017-03-06;

2017-08-05

載人航天預先研究項目(030401)

丁宇堃,男,碩士研究生,研究方向為機器人遙操作。E-mail:dingyukun1994@126.com

猜你喜歡
環境實驗模型
一半模型
記一次有趣的實驗
長期鍛煉創造體內抑癌環境
一種用于自主學習的虛擬仿真環境
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
孕期遠離容易致畸的環境
做個怪怪長實驗
環境
3D打印中的模型分割與打包
主站蜘蛛池模板: 99热这里都是国产精品| 毛片基地美国正在播放亚洲| 99在线视频精品| 免费观看成人久久网免费观看| 91亚洲国产视频| 精品少妇人妻av无码久久| 伊人中文网| 一本视频精品中文字幕| 欧美日韩资源| 久久久久青草线综合超碰| 一级毛片免费不卡在线视频| 无码高清专区| 成人va亚洲va欧美天堂| 老色鬼欧美精品| 色婷婷久久| a级毛片网| 久久永久精品免费视频| 在线观看亚洲天堂| 五月天综合婷婷| 国产成熟女人性满足视频| 国产成人高清亚洲一区久久| a级毛片免费网站| 欧美日韩在线成人| 国产精品无码作爱| 中文字幕2区| hezyo加勒比一区二区三区| 91色国产在线| 亚洲无码熟妇人妻AV在线| 国产精品久久久久无码网站| 亚洲国产精品不卡在线 | 国产综合欧美| 精品福利视频网| 国产成人在线小视频| 日韩在线影院| 91系列在线观看| 色天堂无毒不卡| 色婷婷色丁香| 麻豆a级片| 99精品在线视频观看| 欧美午夜在线视频| 免费国产好深啊好涨好硬视频| 亚洲妓女综合网995久久| 国模私拍一区二区三区| 国产欧美专区在线观看| 亚洲精品无码抽插日韩| 福利视频一区| 国产精品视频导航| 色哟哟色院91精品网站| 欧美性精品| 国产成人精品一区二区不卡| 91香蕉视频下载网站| 日韩欧美国产成人| 久久伊人久久亚洲综合| 久久精品中文字幕少妇| 亚洲精品在线91| 亚洲视频四区| 国产亚洲欧美在线视频| 欧美国产精品不卡在线观看| 国产国产人免费视频成18| 无码专区第一页| 亚洲va欧美ⅴa国产va影院| 国模沟沟一区二区三区| 国内熟女少妇一线天| 超清无码一区二区三区| 亚洲中文字幕久久无码精品A| 女人毛片a级大学毛片免费| AV色爱天堂网| 996免费视频国产在线播放| 欧美a级在线| 亚洲精品无码高潮喷水A| 国产欧美日韩专区发布| 狠狠v日韩v欧美v| 亚洲91精品视频| 久久不卡国产精品无码| 999国内精品久久免费视频| 高清色本在线www| 国产靠逼视频| 日韩免费毛片视频| 日韩精品欧美国产在线| 91在线日韩在线播放| 欧美成人A视频| 欧美成人二区|