999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于單波束測距聲吶的水下機器人避障仿真研究

2014-12-01 08:15:06黃朝熙吳海濤吳道曦徐素霞
廈門大學學報(自然科學版) 2014年4期
關鍵詞:控制策略環境

黃朝熙,潘 偉,陳 杰,吳海濤,吳道曦,徐素霞

(福建省仿腦智能系統重點實驗室(廈門大學),廈門大學信息科學與技術學院,福建 廈門361005)

由于海洋環境的探測面積巨大,水下環境的復雜多變,傳統的定點或走航式的作業方式,越來越難以適應新的海洋探測需求,自主式水下航行器(autonomous underwater vehicle,AUV)的研究與應用便成了自然.AUV可以自主地在遠程復雜甚至危險的海洋環境之中運行,在海洋探測、海底地形繪制、海洋資源探測等各方面扮演著重要角色.

為了使AUV完成海洋環境檢測、海底救撈及水下作業等復雜任務,保證AUV自身的安全是一切任務開展的前提.具備自主避障功能的AUV的研究與應用,受到越來越多研究者的重視.Qiao等[1]利用神經網絡的學習能力,用近似Q函數的方式來存儲Q值,其基于行為的控制架構使其獲得了更好的穩定性和更優的實時性,通過一段時間的學習能使機器人有效地躲避障礙物.Sayyaadi等[2]提出了基于強化學習算法隨機值的學習函數,通過得到連續的輸出值使AUV具備更強的控制能力使其達到避障能力.Jia等[3]提出了針對AUV的一個基于勢函數和行為規則的控制算法,通過對避障區域的劃分,有效地解決了勢函數控制算法只適用于較大避障半徑的問題,驗證了多AUV編隊在未知的環境中控制和避障算法的有效性.這些算法在避障的穩定性和實時性方面都進行了不同程度的優化,對各自算法存在的不足都進行了改進,存在的不足主要是計算量的差異.此外,目前研究的大多數AUV系統需要接受上位機的控制,缺乏有效的信息獲取手段,無法適應復雜多變的水下環境.因此,研究集成有多種傳感器的AUV系統,提高水下航行器的自主運動能力和避障功能,具有非常重要的意義.比如Khanmohammadi等[4]設計了一個基于前視聲吶信息的模糊魯棒控制器,通過聲吶對障礙物的速度和角度信息能較為精確的獲取,使AUV能實現自主躲避動態的障礙物;Zhang等[5]通過建立水下環境模型,對遺傳算法進行優化,提高了對多障礙情況下的位置和速度等數值的優化處理,達到了有效的水下避障,并在名為“Twin-Burger”的AUV上實驗成功;McPhail等[6]基于高分辨率的彩色成像技術和多波束聲吶的應用,提出了重試避碰算法的調用機制,有效地補充了其默認避障算法的不足,提高了避碰的成功率.AUV系統中的控制算法是基于聲吶探測的范圍和標高相對于AUV的水平線來實現的,“Autosub6000”號AUV在大西洋的卡薩布蘭卡海山區的深水海試結果顯示了其良好的避障效果.這些基于大型傳感器設備的避障實驗在已有算法的基礎上,能較好地達到避障的效果,顯示出一定的應用前景,但是其高額的資金投入限制了推廣應用.

AUV要實現避障的行為,環境傳感器數據起著舉足輕重的作用.很多的科研機構使用基于多波束的前視聲吶來采集AUV周圍環境障礙物的信息[7-8],但前視聲納體積大、價格高,不適合用于小型的AUV平臺.也有些AUV使用光學強度攝像機來獲取環境障礙物的信息,但光線在水下環境會很快衰減.即使增加輔助燈光,光學攝像機探測距離也十分有限,不適用于AUV工作的實際海洋環境.

本文結合課題組的實際研究項目,模擬單波束聲納的工作特點,提出了一種基于強化學習的AUV自主避障策略.仿真實驗結果表明:通過強化學習獲得的障礙物狀態與避障動作之間的最佳組合,可以保證AUV在行進過程中,安全躲避前方90°開角內的障礙物.

1 AUV與聲納設備

我課題組在英國Essex大學胡豁生教授的指導下,基于原有智能機器魚的研究與應用成果,聯合設計如圖1所示的新一代機器魚.新設計的AUV具有更好的小阻力外形,更強的續航能力,更好的機動性能.機器魚擬采用單波束聲納為環境障礙物信息采集傳感器,實現一種小型、低成本的機器魚避障方案.

針對近海淺海的實際情況,同時著眼于小型的開發平臺,本課題組使用的避障傳感器是由英國Tritech International Limited公司基于 Micron DST開發的側掃成像單波束聲納(圖1).

2 避障算法設計

2.1 環境數據采集

本文中對環境數據采集使用的傳感器是單波束聲吶,這款聲納的工作中心頻率為700kHz,最大探測范圍為100m.聲納水平開角為3°,垂直開角為30°.這種單波束聲吶數字化程度高,成像清晰,與多波束聲吶相比,具有體積小,成本低,便于安裝,可應用到小型化的平臺上去的優勢;但是在同等時間內,其掃描范圍較多波束聲吶而言小了許多.如圖2所示.

圖2 單波束聲吶與多波束聲吶掃描范圍的大致對比Fig.2 Scan range comparing single beam sonar with multi beam sonar

同時單波束聲吶在隨著AUV的行進中,聲吶掃描的截面也會發生相應的移動.在掃描成像方面可能出現圖像錯位的情況,所以在后期數據處理與成像分析的時候,需要進一步的處理(圖3).

圖3 AUV的掃描劃分與動作選擇執行Fig.3 Scanning division and action choice of AUV

根據單波束聲吶的工作特點,我們設計以下避障算法.整個避障模塊分為學習階段和執行階段,兩個階段相對獨立,又相互聯系.各自的工作流程如圖4所示.

2.2 AUV的狀態集與行為集

強化學習采用試錯法(trial-and-error),不用建立環境和任務的精確數學描述.通過學習,AUV能通過獲取系統狀態、動作和獎勵等有用的經驗,從而掌握一套優化的避障策略與知識.

基于單波束聲吶的特點,本文中的AUV強化學習模型由以下幾部分組成:控制策略P被定義成狀態集合S到控制行為集合Μ 的映射,其函數的形式是:m=P(x),x∈S,m∈M.其含義是:根據策略Ρ,當觀察到系統狀態為x時,決策結果是控制行為m.

圖4 避障算法設計流程圖Fig.4 Obstacle avoidance algorithm design flow chart

由于AUV的游動方向主要表現為前向運動,所以在AUV的前方有無障礙及與障礙間的距離對AUV的運動影響是最大的.為了減少狀態集的數量和提高學習速度,對各種狀態進行了合并[9],AUV狀態的描述由聲吶掃描的左中右3個方位的狀態組合而成,并根據其各個方位與障礙物距離關系在s0,s1,s2中取值(詳見表1),此處詳見2.4節.

同時針對AUV可能遇到的環境狀態設計了如下的6種行為:

b1:AUV右螺旋槳速度為0向右轉彎;

b2:AUV左螺旋槳速度為0向左轉彎;

b3:AUV以速度V向右轉彎;

b4:AUV向前直游;

b5:AUV以速度V向左轉彎;

b6:漫游.

上述行為中,b1~b5是AUV學習的目標,而b6并不需要AUV通過學習獲取,它作為AUV本身所應該具有的基本能力,當聲吶在3個方向都沒有探測到障礙物時,AUV自動選擇該行為.

2.3 AUV的獎懲評價設置

如何獎懲也是AUV強化學習中的一個重要環節,它影響到學習的好壞、快慢.在Tucker Balch的文獻[10]中,給出了一套描述符,對強化學習的獎勵進行了分類.情況設置見表2.

假定3個方向探測到的距離值分別為dL,dF,dR,則障礙物相對AUV的距離d定義為:d=min(dL,dF,dR).

狀態評價函數V是某個狀態和目標狀態之間距離的度量,其定義如下:在某種控制策略下,從某個狀態轉移到目標狀態的過程中,把增強信號加權和的數學期望定義為該狀態的評價函數值,即:

表1 合并后的狀態集Tab.1 After the merger of the state set

表2 獎懲情況設置Tab.2 Rewards and punishments set

式(1)中的E表示數學期望;γ稱為折扣因子(discount factor),也是常數,且0<γ<1,在數學上使式(1)中的無窮級數收斂;rt+1是t+1時刻產生的增強信號值;x0表示初始狀態.某個狀態的評價函數值越大,表示它距離目標狀態越近.從上述定義可知,狀態評價函數和控制策略是相聯系的,不同控制策略下的狀態評價函數可能不同.強化學習使狀態評價的估計值逐漸逼近最優策略控制下的狀態評價值,同時使控制策略逼近最優策略.

2.4 聲吶數據處理與方位角設置

本文對聲吶所掃描到的距離數據采取了分段處理方式.假定聲吶的最大探測距離為Dmax,執行有效避障行為的臨界距離為Dc,AUV到障礙物的危險距離為Dh,這3者的距離關系是Dmax>Dc>Dh.

根據聲吶測量到的數據值Dt,將AUV某一方向的障礙物分布情況分為s0,s1,s2等3種如下的狀態:

s0:AUV沒有探測到障礙物;

s1:AUV距離障礙物較遠,即Dc>Dt>Dh;

s2:AUV距離障礙物較近,即Dh>Dt.

將AUV聲吶的掃描范圍做一個如圖3的劃分,同時將L區所包含的掃描范圍視為AUV的左方位,將F區部分范圍視為AUV的前方,同理R區部分為AUV的右方位.在描述AUV的狀態時,可建立一個3個方位的狀態組合為FWLFWFFWR,其中FWL為AUV左方位的狀態,FWF為AUV前方的狀態,同理,FWR為 AUV 的右方位狀態.FWL,FWF,FWR在s0,s1,s2中取值.例如:s0s0s1表示 AUV右方掃描到障礙物,且距離較遠,其他方向沒有探測到障礙物.

由于傳感器不能對障礙物進行精確的方向定位,為此綜合AUV 3個方向的信號情況,將障礙物相對于AUV的方向角離散化為7種情況[9],作如下定義:

AUV與障礙物的相對方向角為Φ,當AUV執行行為偏離障礙物相對AUV的方向時,稱AUV偏離障礙物;反之稱AUV靠近障礙物.

3 仿真實驗

在MATLAB仿真下,對局部有障礙物的環境設置如圖5所示,圖5中的圓框為障礙物,星形點為AUV,障礙物為高約15cm,邊長約5cm的等八邊形柱體.AUV長60cm(只包含魚身部分),最寬處寬度為16cm,最高處高度為27.6cm.本文采用強化學習來進行狀態-動作的學習,不用建立環境和任務的精確數學描述,通過不斷的試錯,再對其選擇的行為給予獎懲,從而獲取對避障有用的經驗.行為學習選取采用貪婪算法,貪婪算法的基本思想是采用逐步構造最優解的方法,其本質上是一種局部搜索算法,可以對當前的環境選擇局部最優的避障行為.ε表示各設定避障行為的加權系數,其初始值εn設為0.9,每代遞減,其中T為學習總代數,學習總代數為60,每代最大運動步數是2 000步.通過不斷的試錯之后,AUV系統掌握了一套有效的避障策略.在實驗中,對障礙物的位置隨機設置,均達到了預期避障目標.相關的仿真實驗如圖5所示.

圖5 避障仿真實驗路徑圖Fig.5 The path graph of obstacle avoidance simulation experiment

系統學習的任務是通過訓練次數的不斷深入,對AUV的避障方法學習得出一個較為穩定的躲避策略,圖6給出了學習策略改變次數與學習代數之間的變化曲線關系,可以看出,算法是收斂的,且學習代數為50時,可以達到一個學習成本與執行效果較好的平衡,同時可以看出其曲線基本趨于平穩,繼續增加學習代數對提高學習效果并不明顯.綜上所述作出如上選擇.

圖6 學習代數與策略學習的平均步數的關系圖Fig.6 The graph of the relationship between the strategies of learning algebra and the average number of strategy learning

4 討 論

本文針對小型的AUV開發平臺,使用基于Micron DST開發的側掃成像單波束聲吶,提出了一種基于單波束聲吶掃描特性的AUV避障控制策略.利用單波束聲吶的探測波束依次旋轉,依次獲取AUV前方3個區域的障礙物距離信息,同時給出了合適的環境狀態與有效的避障行為集合,并通過強化學習來優化狀態行為組合,給小型、低成本AUV避障提供一種解決方案.在仿真實驗中,通過多次隨機設定環境的初始狀態,均達到了預期的避障效果,驗證了學習結果的有效性.

通過多次的仿真實驗表明,使用基于強化學習的避障算法和基于Micron DST開發的單波束聲納能夠及時地為系統的安全運行提供有效的信息和控制策略.但是在水池實驗中由于慣性導航系統的低精度問題,我們不能得到準確的速度信息,在一定程度上影響到系統反應的準確性;此外,單一的聲學傳感器的局限性問題也在特定的環境中顯現出來.所以在未來我們要從以下3個方面來改善它:

1)采用精度較高的慣性導航系統或其他巡航速度傳感器,速度信息的補充將使決策更加及時有效.

2)添加一個視覺傳感器系統,在一定的距離范圍內,給聲學傳感器提供補充和輔助.

3)添加其他模塊如通信模塊、導航模塊等使系統更完整.

[1]Qiao J F,Hou Z J,Ruan X G.Application of reinforcement learning based on neural network to dynamic obstacle avoidance[C]∥Proceedings of the 2008IEEE International Conference on Information and Automation.Changsha,China:IEEE,2008:784-788.

[2]Sayyaadi H,Ura T,Fujii T.Collision avoidance controller for AUV system using stochastic real reinforcement learning method[C]∥Proceedings of the 39th SICE Annual Conference.Iizuka,Japan:IEEE,2000:165-170.

[3]Jia Q L,Li G W.Formation control and obstacle avoidance algorithm of multiple autonomous underwater vehicles(auvs)based on potential function and behavior rules[C]∥Automation and Logistics,2007IEEE International Conference on.Jinan,China:IEEE,2007:569-573.

[4]Khanmohammadi S,Alizadeh G,Poormahmood M.Design of a fuzzy controller for underwater vehicles to avoid moving obstacles[C]∥Fuzzy Systems Conference.London,England:IEEE,2007:1-6.

[5]Zhang M,Ura T.Motion optimization of autonomous underwater vehicle by genetic algorithm[J].Journal of the Society of Naval Architects of Japan,1997,182:491-497.

[6]McPhail S,Furlong M,Pebody M.Low-altitude terrain following and collision avoidance in a flight-class autonomous underwater vehicle[J].Journal of Engineering for the Maritime Environment,2010,224(4):279-292.

[7]Huvenne V A I,Blondel P,Henriet J P.Textural analyses of sidescan sonar imagery from two mound provinces in the Porcupine Seabight[J].Marine Geol,2002,189:323-341.

[8]Petillot Y,Ruiz I T,Lane D.Underwater vehicle obstacle avoidance and path planning using a multi-beam forward looking sonar[J].IEEE Journal of Oceanic Engineering,2001,26(2):240-251.

[9]沈志忠,曹志強,譚民.基于增強式學習的仿生機器魚避障控制[J].高技術通訊,2006,16(12):1253-1258.

[10]Balch T.Behavioral diversity in learning robot teams[D].Atlanta:Georgia Institute of Technology,1998.

猜你喜歡
控制策略環境
長期鍛煉創造體內抑癌環境
一種用于自主學習的虛擬仿真環境
考慮虛擬慣性的VSC-MTDC改進下垂控制策略
能源工程(2020年6期)2021-01-26 00:55:22
孕期遠離容易致畸的環境
不能改變環境,那就改變心境
工程造價控制策略
山東冶金(2019年3期)2019-07-10 00:54:04
環境
孕期遠離容易致畸的環境
現代企業會計的內部控制策略探討
消費導刊(2018年10期)2018-08-20 02:57:02
容錯逆變器直接轉矩控制策略
主站蜘蛛池模板: 五月天婷婷网亚洲综合在线| 巨熟乳波霸若妻中文观看免费| 国产精品成人第一区| 中文国产成人精品久久| 亚洲欧美成aⅴ人在线观看| 91免费国产高清观看| 特级aaaaaaaaa毛片免费视频 | 色哟哟色院91精品网站| 国产打屁股免费区网站| 国产欧美在线观看视频| 中文字幕首页系列人妻| 亚洲码在线中文在线观看| 91日本在线观看亚洲精品| 亚洲天堂区| 国产自在线拍| 亚洲美女一区二区三区| 在线毛片免费| 首页亚洲国产丝袜长腿综合| 91毛片网| 丁香婷婷久久| 综合色区亚洲熟妇在线| 九九热精品视频在线| 国产美女主播一级成人毛片| 国产精品播放| 四虎成人在线视频| 最新亚洲人成无码网站欣赏网| 人妻丰满熟妇av五码区| 欧美精品色视频| 97亚洲色综久久精品| 久久久久久国产精品mv| 一本大道香蕉中文日本不卡高清二区 | 久青草国产高清在线视频| 在线va视频| 亚洲无线国产观看| 欧美日韩在线第一页| 亚洲色图在线观看| 亚洲无码电影| 青草国产在线视频| 精品国产91爱| 国产成人高清精品免费5388| 韩国福利一区| 玖玖免费视频在线观看| 东京热av无码电影一区二区| 91九色最新地址| 国产成人在线无码免费视频| 风韵丰满熟妇啪啪区老熟熟女| 国产成人在线无码免费视频| 日韩在线2020专区| 亚洲无限乱码| 老司国产精品视频| 国产亚洲精| 国语少妇高潮| 亚洲天堂网在线观看视频| 中文无码毛片又爽又刺激| 国产自产视频一区二区三区| 国产自在线播放| 狠狠色噜噜狠狠狠狠色综合久| 国产18在线播放| а∨天堂一区中文字幕| 干中文字幕| 国产精品女同一区三区五区| 永久免费精品视频| 亚洲 欧美 偷自乱 图片 | www.日韩三级| 午夜福利无码一区二区| 日韩无码真实干出血视频| 亚洲欧洲日韩综合色天使| 日韩无码真实干出血视频| 欧美成人精品高清在线下载| 黄色网址免费在线| 91系列在线观看| 制服丝袜 91视频| 亚洲国产中文在线二区三区免| 亚洲精品国产成人7777| 香蕉蕉亚亚洲aav综合| vvvv98国产成人综合青青| 国产99精品久久| 亚洲天堂2014| 欧美一区精品| 日本一区二区三区精品国产| 农村乱人伦一区二区| 国产成人精品亚洲77美色|