999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于極限學(xué)習(xí)機(jī)的仿真機(jī)器魚(yú)動(dòng)作策略

2017-03-13 05:37:37廣東工業(yè)大學(xué)自動(dòng)化學(xué)院彭澤榮張學(xué)習(xí)王建樺
電子世界 2017年4期
關(guān)鍵詞:動(dòng)作策略模型

廣東工業(yè)大學(xué)自動(dòng)化學(xué)院 彭澤榮 張學(xué)習(xí) 王建樺

基于極限學(xué)習(xí)機(jī)的仿真機(jī)器魚(yú)動(dòng)作策略

廣東工業(yè)大學(xué)自動(dòng)化學(xué)院 彭澤榮 張學(xué)習(xí) 王建樺

針對(duì)URWPGSim2D仿真平臺(tái),為實(shí)現(xiàn)機(jī)器魚(yú)快速、準(zhǔn)確的調(diào)整,本文將機(jī)器魚(yú)的狀態(tài)定義為“調(diào)整”和“推球”,并提出基于極限學(xué)習(xí)機(jī)的動(dòng)作決策模型,利用此模型自主選擇相應(yīng)的動(dòng)作策略。動(dòng)作決策模型根據(jù)當(dāng)前時(shí)刻周?chē)沫h(huán)境信息,利用極限學(xué)習(xí)機(jī)確定機(jī)器魚(yú)的狀態(tài),自主選擇當(dāng)前時(shí)刻的最優(yōu)擊球點(diǎn),并確定機(jī)器魚(yú)速度和角速度檔位的最優(yōu)組合。經(jīng)URWPGSim2D仿真平臺(tái)驗(yàn)證結(jié)果表明:機(jī)器魚(yú)可根據(jù)策略調(diào)整路徑,選擇合適的動(dòng)作策略,以更少的時(shí)間代價(jià)完成比賽。這說(shuō)明基于極限學(xué)習(xí)機(jī)的動(dòng)作決策策略能充分考慮機(jī)器魚(yú)和水球的實(shí)時(shí)信息,在不同情況下選擇不同的策略,具有很強(qiáng)的適應(yīng)能力,滿(mǎn)足仿真機(jī)器魚(yú)對(duì)于動(dòng)作決策的要求。

URWPGSim2D仿真;機(jī)器魚(yú);極限學(xué)習(xí)機(jī);動(dòng)作決策

1 引言

隨著海洋科技的長(zhǎng)足發(fā)展,水中機(jī)器人的應(yīng)用變得越來(lái)越廣泛,關(guān)于仿真水中機(jī)器人的研究也成為該領(lǐng)域的研究熱點(diǎn)之一[1]。近年來(lái),國(guó)內(nèi)外爭(zhēng)相舉辦各類(lèi)機(jī)器人大賽,以期在比賽中交流機(jī)器人研究領(lǐng)域的新思想和新進(jìn)展,其中,北京大學(xué)聯(lián)合多所高校和科研所建立的URWPGSim2D仿真平臺(tái)就是一個(gè)很好的水中機(jī)器人研究平臺(tái)。該平臺(tái)以魚(yú)作為仿真對(duì)象,以充滿(mǎn)擾動(dòng)的仿生水作為仿真環(huán)境,提供了一種仿真水中機(jī)器人水球比賽實(shí)時(shí)仿真系統(tǒng),旨在通過(guò)各種比賽項(xiàng)目[2],研究多仿真體的協(xié)作性和智能性[3]。

為了使機(jī)器魚(yú)在動(dòng)態(tài)變化環(huán)境中完成指定的任務(wù),必須讓機(jī)器魚(yú)精確地運(yùn)動(dòng)到指定位置,換句話說(shuō),點(diǎn)對(duì)點(diǎn)控制效果決定了機(jī)器魚(yú)的控制效果。機(jī)器魚(yú)點(diǎn)對(duì)點(diǎn)(PTP)控制算法是喻俊志、陳爾奎等人提出來(lái)的,該算法的目的是消除機(jī)器魚(yú)在初始方向、位置與目標(biāo)點(diǎn)之間的方向誤差和距離誤差[4]。由于機(jī)器魚(yú)所處環(huán)境因素的不確定性,以及機(jī)器魚(yú)在游動(dòng)的過(guò)程中水對(duì)機(jī)器魚(yú)的干擾,導(dǎo)致機(jī)器魚(yú)點(diǎn)對(duì)點(diǎn)控制效果不理想。

針對(duì)上述不足,本文提出了基于極限學(xué)習(xí)機(jī)的動(dòng)作控制算法,根據(jù)實(shí)驗(yàn)數(shù)據(jù)設(shè)計(jì)控制模型。實(shí)驗(yàn)結(jié)果表明,基于極限學(xué)習(xí)機(jī)的動(dòng)作控制算法能優(yōu)化機(jī)器魚(yú)的游動(dòng)路徑,提高機(jī)器魚(yú)的控制效果。

本文將基于該平臺(tái),針對(duì)“水中搬運(yùn)”項(xiàng)目,對(duì)其比賽策略進(jìn)行研究。

2 極限學(xué)習(xí)機(jī)

在2006年,黃廣斌教授提出了前饋神經(jīng)網(wǎng)絡(luò)的極限學(xué)習(xí)概念,并詳細(xì)介紹了基本原理[5]。極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)是一種特殊類(lèi)型的單隱藏層前饋神經(jīng)網(wǎng)絡(luò),它僅有一個(gè)隱藏節(jié)點(diǎn)層。后來(lái)將它擴(kuò)展到通用的單隱藏層前饋神經(jīng)網(wǎng)絡(luò),它的隱結(jié)點(diǎn)類(lèi)似神經(jīng)元[6]。極限學(xué)習(xí)機(jī)的基本組成如下:

圖1 極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)結(jié)構(gòu)圖

通常,描述標(biāo)準(zhǔn)的SLFNs模型能夠零誤差地逼近上述N個(gè)樣本,表示的是:

即存在w、β和b,使得:

利用矩陣表示時(shí),(2)可以緊湊地寫(xiě)成:

當(dāng)w和b固定時(shí),等價(jià)于求線性系統(tǒng)(3)的最小二乘解,即:

得到:

其中H?是H的Moore-Penrose廣義逆[8]。而最小范數(shù)的最小平方解具有唯一性,使其訓(xùn)練誤差達(dá)到最小。也就是說(shuō),對(duì)于隨機(jī)賦值的輸入權(quán)值和偏置向量,只要設(shè)置合適的隱含層神經(jīng)元個(gè)數(shù),可以通過(guò)求取線性方程的最小二乘解來(lái)得到隱含層的權(quán)值。

3 極限學(xué)習(xí)機(jī)(ELM)與機(jī)器魚(yú)動(dòng)作決策

3.1 擊球點(diǎn)的確定

本文根據(jù)機(jī)器魚(yú)當(dāng)前時(shí)刻周?chē)沫h(huán)境信息來(lái)選擇擊球點(diǎn),并采取相應(yīng)的動(dòng)作策略。如圖2所示,連接地標(biāo)中心點(diǎn)與水球球心,連線交水球遠(yuǎn)端處為P點(diǎn),過(guò)水球球心作此連線的垂線,此時(shí)將場(chǎng)地劃分為I、II、III、IV四個(gè)區(qū)域;然后以P點(diǎn)為圓心,水球直徑為半徑作圓,此圓與垂線相交于A、B兩點(diǎn)。則:若機(jī)器魚(yú)處于I區(qū)域,以A點(diǎn)為擊球點(diǎn);若機(jī)器魚(yú)處于II區(qū)域,以B點(diǎn)為擊球點(diǎn);若機(jī)器魚(yú)處于III、IV區(qū)域,以P點(diǎn)為擊球點(diǎn)。這樣做的好處是,當(dāng)機(jī)器魚(yú)處于“調(diào)整”狀態(tài)時(shí),通過(guò)A點(diǎn)(或者B點(diǎn))不僅可以達(dá)到調(diào)整的目的,而且能夠保證機(jī)器魚(yú)在整個(gè)調(diào)整過(guò)程中盡量靠近水球,從而縮短進(jìn)入“推球”狀態(tài)時(shí)機(jī)器魚(yú)與水球的距離。

圖2 擊球點(diǎn)確定示意圖

3.2 機(jī)器魚(yú)位置的確定

圖3 機(jī)器魚(yú)位置確定示意圖

利用θ和D確定機(jī)器魚(yú)位置的過(guò)程如下:

通過(guò)抽象出θ和D,不僅能更精確的描述機(jī)器魚(yú)的位置,而且只有兩個(gè)特征參數(shù),降低了計(jì)算復(fù)雜度,減少了運(yùn)算時(shí)間。

4 仿真結(jié)果及其分析

本文基于URWPGSim2D平臺(tái),針對(duì)“水中搬運(yùn)”項(xiàng)目,分別建立了基于BP神經(jīng)網(wǎng)絡(luò)和基于極限學(xué)習(xí)機(jī)的仿真機(jī)器魚(yú)動(dòng)作決策模型,并討論這兩個(gè)模型的優(yōu)劣。

本文通過(guò)MATLAB仿真實(shí)驗(yàn)來(lái)獲取機(jī)器魚(yú)動(dòng)作控制模型中極限學(xué)習(xí)機(jī)和單隱含層BP神經(jīng)網(wǎng)絡(luò)的最優(yōu)隱含層神經(jīng)元個(gè)數(shù)。實(shí)驗(yàn)中使用500個(gè)訓(xùn)練樣本數(shù)據(jù),100個(gè)測(cè)試數(shù)據(jù),測(cè)試的隱結(jié)點(diǎn)個(gè)數(shù)分別為100、150、200、250、300、350、400,測(cè)試結(jié)果如圖4所示。最終得到:當(dāng)極限學(xué)習(xí)機(jī)的隱含層神經(jīng)元個(gè)數(shù)為250,單隱含層BP神經(jīng)網(wǎng)絡(luò)的隱含層神經(jīng)元個(gè)數(shù)為160時(shí),兩種模型的學(xué)習(xí)精度比較高,能夠準(zhǔn)確定位機(jī)器魚(yú),為機(jī)器魚(yú)的動(dòng)作決策提供良好的基礎(chǔ)。

圖4 隱結(jié)點(diǎn)個(gè)數(shù)測(cè)試結(jié)果

綜合上述分析,分別對(duì)BP神經(jīng)網(wǎng)絡(luò)、極限學(xué)習(xí)機(jī)進(jìn)行建模。兩個(gè)模型均采用三層拓?fù)浣Y(jié)構(gòu),輸入層的神經(jīng)元個(gè)數(shù)為2,隱藏層的神經(jīng)元個(gè)數(shù)分別為160、250,輸出層神經(jīng)元個(gè)數(shù)為1。所得結(jié)果見(jiàn)表1:

表1 兩種算法的性能比較

從表1可以看出,BP算法搜索最優(yōu)解的偏差過(guò)大,而極限學(xué)習(xí)機(jī)能以更短的時(shí)間,以及更高的精確度對(duì)全局最優(yōu)解進(jìn)行搜索,換言之,極限學(xué)習(xí)機(jī)在時(shí)間和精度方面都要優(yōu)于BP算法。實(shí)驗(yàn)結(jié)果表明,極限學(xué)習(xí)機(jī)具有更好的性能。

5 結(jié)束語(yǔ)

基于極限學(xué)習(xí)機(jī)的仿真機(jī)器魚(yú)策略綜合考慮了水下環(huán)境的復(fù)雜性及機(jī)器魚(yú)自身結(jié)構(gòu)和運(yùn)動(dòng)的特點(diǎn),首次提出以地標(biāo)為坐標(biāo)原心,通過(guò)水球、機(jī)器魚(yú)的斜率θ與距離D來(lái)判斷三者的相對(duì)位置,從而正確的確定機(jī)器魚(yú)的狀態(tài)。并根據(jù)機(jī)器魚(yú)在頂球過(guò)程中的連貫性,利用極限學(xué)習(xí)機(jī)讓機(jī)器魚(yú)自主選擇擊球點(diǎn),使得頂球更加平穩(wěn)快速。經(jīng)過(guò)在URWPGSim2D平臺(tái)上運(yùn)行該算法編寫(xiě)的程序,效果明顯。由實(shí)驗(yàn)結(jié)果可知:該優(yōu)化策略能夠很好地完成比賽,不但提高了策略的穩(wěn)定性,而且具有很強(qiáng)的適應(yīng)能力,滿(mǎn)足仿真機(jī)器魚(yú)對(duì)于動(dòng)作決策的要求,說(shuō)明這種方法是可靠、可行的。

[1]謝廣明.機(jī)器人水球比賽項(xiàng)目推介書(shū)[M].北京:北京大學(xué)工學(xué)院,2009:1-5.

[2]黃永安,馬路,劉惠敏.Matlab7.0/simulink 6.0建模仿真開(kāi)發(fā)與高級(jí)工程應(yīng)用[M].北京:清華大學(xué)出版社,2007:1-75.

[3]喻俊志,陳爾奎,王碩,等.仿生機(jī)器魚(yú)研究的進(jìn)展與分析[J].控制理論與應(yīng)用,2003,4(4):485-491.

[4]J.Liu,I.Dukes,and H.Hu.Novel mechatronics design for a robotic fish.In Proc.IEEE/RSJ International Conference on Intelligent Robots and Systems,pages 2077-2082,2005

[5]G.B.Huang,Q.Y.Zhu,C.K.Siew.Extreme learning machine:theory and applications[J].Neurocom-puting,2006,70:489-501.

[6]G.B.Huang,L.Chen.Convex incremental extreme learning niachine[J].Neurocomputing,2007,70:3056-3062.

[7]P.L.Bartlett.The sample complexity of patteni classification with neural networks;the size of the weights is more important than the size of the network[J].IEEE Transactions on Information Theory,1998,44:525-536.

[8]K.S.Baneijee.Generalized inverse of matrices and its applications[J].Technometrics,1973,15:197-202.

The Simulation Robotic Fish Action Strategy Based on Extreme Learning Machine

Peng Zerong Zhang Xuexi Wang Jianhua

Aiming at URWPGSim2D simulation platform,in order to realize rapid and accurate adjustment of simulation robotic fsh,this paper defned the state of robotic fsh for"adjustment"and"push ball",and action decision model based on extreme learning machine is put forward.By using this model,the corresponding action strategies are selected.In the action decision model,according to the current environment information around the robotic fsh,the state of the robotic fsh is determined by the extreme learning machine.Then the fsh can independently choose the optimal hitting point of the current time,and determine the optimal combination of velocity and angular velocity.Verifed by URWPGSim2D simulation platform show that:the robotic fsh can choose the appropriate action strategy to adjust its path by using the action decision model,and complete the competition with less time.This shows that action decision-making strategy based on extreme learning machine can fully consider the real-time information of robotic fsh and water polo,choose a different strategy in different cases,have a strong ability to adapt,meet the requirements of simulation robotic fsh for the action decisions.

URWPGSim2D;robotic fsh;extreme learning machine;action decision-making

國(guó)家自然科學(xué)基金(61573108)。

彭澤榮,男,廣東汕頭人,研究生,主要研究方向:智能控制與信息處理技術(shù)。

張學(xué)習(xí),男,江蘇徐州人,博士,副教授,主要研究方向:智能控制與信息處理技術(shù)。

猜你喜歡
動(dòng)作策略模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
例談未知角三角函數(shù)值的求解策略
我說(shuō)你做講策略
動(dòng)作描寫(xiě)要具體
高中數(shù)學(xué)復(fù)習(xí)的具體策略
畫(huà)動(dòng)作
動(dòng)作描寫(xiě)不可少
3D打印中的模型分割與打包
主站蜘蛛池模板: 伊人91视频| 一级福利视频| 中文字幕av一区二区三区欲色| 国产真实二区一区在线亚洲| 免费看久久精品99| 免费看的一级毛片| 四虎综合网| yy6080理论大片一级久久| 亚洲精品桃花岛av在线| 人妻免费无码不卡视频| 亚洲无码在线午夜电影| 亚洲国产系列| 午夜视频免费试看| 国产精品九九视频| 中文字幕免费播放| 欧美高清三区| 亚洲国产中文精品va在线播放| 波多野结衣一级毛片| 一级毛片在线免费视频| 国产在线视频自拍| 国产黄色片在线看| 国产香蕉国产精品偷在线观看| 久久久精品无码一二三区| 亚洲青涩在线| 制服丝袜在线视频香蕉| 日本福利视频网站| 亚洲av无码人妻| 欧美日韩另类国产| 国产精品视频久| 又黄又湿又爽的视频| YW尤物AV无码国产在线观看| 欧美黄网站免费观看| 一区二区三区在线不卡免费 | 亚洲妓女综合网995久久| 91丨九色丨首页在线播放| 亚洲—日韩aV在线| 国产91九色在线播放| 免费va国产在线观看| 超碰aⅴ人人做人人爽欧美 | 欧美v在线| 99久久国产精品无码| 白丝美女办公室高潮喷水视频| 成人在线欧美| 五月天香蕉视频国产亚| 亚洲国产理论片在线播放| 中文字幕亚洲精品2页| 日本一区高清| 亚洲日韩在线满18点击进入| 亚洲中文字幕久久无码精品A| 日日碰狠狠添天天爽| 亚洲国产欧洲精品路线久久| 亚洲不卡网| 国产剧情一区二区| 精品久久综合1区2区3区激情| 国产极品美女在线| 国产欧美日韩专区发布| 欧美一级爱操视频| 噜噜噜久久| 欧美成一级| 国产系列在线| 精品国产Av电影无码久久久| 在线观看免费人成视频色快速| 99r在线精品视频在线播放| 欧美啪啪网| 无码AV高清毛片中国一级毛片| 露脸国产精品自产在线播| 亚洲精品视频在线观看视频| 国产成人欧美| 女人爽到高潮免费视频大全| 欧美日韩专区| 国产色婷婷视频在线观看| 欧美综合中文字幕久久| 伊在人亚洲香蕉精品播放| 亚洲第一视频免费在线| 黄色免费在线网址| 国产午夜人做人免费视频| 亚洲成a人片在线观看88| 99伊人精品| 在线观看国产精美视频| 日韩高清成人| 精品无码国产自产野外拍在线| 人妻无码中文字幕一区二区三区|