999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于模糊神經網絡的無人機實時避障算法

2021-12-22 05:29:56呂智虎梁曉龍任寶祥張佳強侯岳奇
空軍工程大學學報 2021年5期
關鍵詞:規則環境

呂智虎,梁曉龍,任寶祥,李 哲,張佳強,齊 鐸,侯岳奇

(1.空軍工程大學空管領航學院,西安,710051; 2.陜西省電子信息系統綜合集成重點實驗室,西安,710051)

無人機具有隱蔽性好、機動性強、成本較低等特點,隨著無人機應用領域不斷拓展,所處的飛行環境也更加復雜,提高無人機的自主避障能力成為確保任務完成的必要條件[1]。

目前避障算法主要包括勢場法[2]、基于圖論的算法[3]和智能優化算法[4]。基于圖論的避障算法主要有A*算法[5]、D*算法[6]、Voronoi圖法[7]等。智能優化算法主要包括遺傳算法[8]、蟻群算法[9]、人工蜂群算法[10]、粒子群算法[11]等。當前的無人機避障方法大部分是在障礙物信息已知的條件下進行全局路徑預規劃,對有碰撞風險的路徑進行重規劃從而實現避障要求。而在環境中障礙物信息未知的情況下,無人機難以進行全局路徑規劃,需要無人機能夠實時探測并規劃避障路徑。

針對未知環境中的無人機避障問題,文獻[12]提出了一種改進人工勢場路徑規劃算法,實現了未知環境中對靜態、動態障礙物的規避,但其避障路徑中存在冗余路徑。文獻[13]提出一種多層雙向A*算法,使智能體可以在復雜環境中實時規避突發障礙,但該算法僅適用于少量存在未知障礙物的情況。文獻[14]將模糊神經網絡應用于無人機電力巡檢,無人機能夠沿預設路徑飛行并規避未知障礙物,但沒有利用無人機運動方向與障礙物的角度信息,增加避障路徑。

模糊神經網絡能夠結合已有的避障規則與障礙物特征,通過訓練優化模糊控制器的參數,使無人機在障礙物信息未知的環境中依然能夠實現避障[15]。

本文首先對模糊控制器的輸入變量、輸出變量以及初始隸屬度函數進行設計,優化了模糊控制器的輸入變量;其次利用模糊控制器得到無人機避障的理想路徑,從該路徑中提取避障過程中無人機運動狀態、與障礙物位置關系的數據生成訓練數據集,用于訓練模糊神經網絡;最后將訓練后的模糊神經網絡在新的未知環境中進行測試驗證。

1 無人機實時避障問題建模

1.1 問題描述

在障礙物信息未知的室內飛行區域中,給定起始點O與目標點E,在飛行過程中無人機能夠主動探測環境中障礙物信息,并對障礙物進行實時規避,最終安全抵達目標點,如圖1所示。由于室內環境較為狹窄,因此選用低速微型無人機。

圖1 避障環境模型

1.2 模型建立

1.2.1 傳感器模型

激光雷達能夠測得目標距離、方位甚至形狀等參數,具有測量精度高、探測范圍大以及結構簡單等優點,在避障和建圖中較為常用[16]。目前激光雷達主要有兩種測距原理:三角測距原理與TOF測距原理[17],其中,TOF雷達可以測量的距離更遠,并且可以在長距離范圍內保持較高精度[18]。

(1)

則無人機到第i個障礙點的距離di為:

(2)

式中:c表示電磁波傳播速度。

(3)

1.2.2 無人機運動模型

給定無人機某一時刻的運動速度大小改變量與航向角改變量,通過無人機運動方程來計算無人機的下一時刻位置,實現無人機的運動控制。

設定無人機的控制量更新周期為Ts,通過式(4)便可計算出其下一航跡點位置。

(4)

式中:v(t)為t時刻無人機運動速度大小;α(t)為t時刻無人機航向角。其更新公式為:

(5)

式中:Δv及Δα分別為t時刻的速度改變量及航向角改變量,單位分別為m/s及rad/s。

1.2.3 環境模型

文獻[19]將障礙物劃分為平面類、棱角類、弧形類3類,成功實現了障礙物的形狀識別。文獻[20]將不規則障礙物進行分割或者補全為規則的四邊形、圓形等凸多邊形,再利用幾何法計算無人機登陸點,最后選取最優路徑實現避障。

本文將障礙物簡化為3類,分別是四邊形、三角形、圓形,其他復雜障礙物均可以由這3類組合而成。為模擬未知環境,無人機在飛行過程中只能獲取探測半徑以內的障礙物信息。

1.3 無人機避障流程

無人機的實時避障流程如圖2所示。

圖2 無人機避障流程

如圖3所示,設無人機自身位置與目標點之間的距離為Df,無人機與目標點最大許可距離為Da。將Da作為判斷無人機是否抵達目標點的依據,即當無人機與目標點的距離小于最大許可距離時,認為無人機已經到達目標點。探測器獲取的附近障礙物的最小距離為Dmin,無人機探測半徑為Rd。

圖3 避障流程參數說明

Step1無人機開始飛行并檢測距離Df,如果Df>Da,即無人機與目標點的距離大于最大許可距離,轉到Step2,否則轉到Step5;

Step2無人機實時探測障礙物,如果探測到障礙物,即Dmin

Step3無人機獲取到障礙物距離與角度信息,在模糊神經網絡控制器下進行避障,轉到Step2;

Step4無人機在目標點的引力作用下,以當前位置與目標點連線為航向角飛行,逐漸增大速度,轉到Step1;

Step5抵達目標點,結束飛行。

2 基于模糊控制的避障算法

為獲取模糊神經網絡避障算法的訓練數據,首先需要設計能夠有效規避障礙物的Mamdani型模糊控制器,然后提取無人機在避障過程中的數據,最后用于模糊神經網絡的訓練。

2.1 模糊控制器輸入輸出變量定義

2.1.1 輸入變量定義

為了使障礙物信息得到充分利用,將模糊控制器的輸入變量定義為無人機到探測范圍內障礙點的最小距離d和無人機當前運動方向與無人機與障礙點連線形成的等效夾角θ,如圖4所示。

圖4 模糊控制器輸入變量

O點表示無人機當前位置,E表示目標點,D1,D2,…,Dn表示在無人機探測范圍內的障礙物邊界離散點,n為探測范圍內的障礙點個數,di為無人機到探測范圍內第i個障礙點的距離,則模糊控制器第1個輸入變量d為:

d=min{d1,d2,…,dn}

(6)

將式(1)、式(2)代入式(6)得到d的計算公式:

(7)

(8)

θi為無人機當前運動方向與無人機與第i個障礙點連線的夾角,其計算公式為:

(9)

將式(3)、式(9)代入到式(8)得到θ計算公式:

(10)

2.1.2 輸出變量定義

本文中無人機的運動狀態由速度大小與航向角確定,輸出變量設計為運動速度大小改變量Δv與航向角改變量Δα。

2.2 模糊控制器隸屬度函數定義

2.2.1 輸入變量隸屬度函數

對于輸入變量d,其論域是由無人機最大探測范圍所決定的。目前市面上的激光雷達,例如HOKUYO公司的UST-05LX,SLAMTEC公司的RPLIDAR等,能夠很好地實現對15 m以內障礙物的探測,因此確定d的模糊論域為[0,15],單位為m,模糊分割數為3,模糊集合為{近,中,遠}={N,M,F}。其中“近”表示無人機與障礙物距離較近,“中”、“遠”含義同理。其隸屬度函數采用高斯分布,如圖5所示。

圖5 輸入變量d隸屬度函數

對于輸入變量θ,其論域是由無人機運動方向與無人機與障礙物相對位置關系共同確定,如圖6所示。

圖6 輸入變量θ范圍

只有θi為銳角時,才認為此時的障礙點Di對無人機有碰撞威脅,否則忽略不滿足該條件的點。因此,θ模糊論域為[-π/2,π/2],單位為rad,模糊分割數為5,模糊集合為{左大,左下,中,右小,右大}={LB,LS,M,RS,RB},其中,“左大”表示障礙物主要集中分布在無人機運動方向的左側,且與無人機運動方向的夾角較大。其他模糊語言的含義同理,其隸屬度函數定義如圖7。

圖7 輸入變量θ隸屬度函數

2.2.2 輸出變量隸屬度函數

為實現無人機更精確的控制,將輸出變量Δv、Δα的模糊分割數設計為5。同時為使無人機的運動軌跡更為平滑,需要考慮其運動學約束,本文限定了無人機的最大加速度與最大角速度。無人機的控制量更新周期Ts=0.25 s,速度改變量Δv論域范圍為[-0.5,0.5],即無人機加速度大小最大為2 m/s2,模糊集合為{驟減,減速,勻速,加速,驟增}={VS,S,M,F,VF}。其隸屬度函數采用高斯分布,如圖8所示。

圖8 輸出變量Δv隸屬度函數

無人機最大角速度確定為1.57 rad/s,根據控制量新周期Ts=0.25 s,因此航向角改變量Δα論域范圍為[-0.393,0.393],模糊集合為{左大,左小,中等,右小,右大}={LB,LS,M,RS,RB}。其中“左大”表示航向角增加較大角度;即無人機向左轉較大角度;“中等”表示無人機航向角不發生明顯改變,其他模糊語言含義同理。其隸屬度函數如圖9所示。

圖9 輸出變量Δα隸屬度函數

2.2.3 模糊控制器規則設計

模糊控制器的規則設計,需要在已有經驗的前提下,給定輸入、輸出變量的對應關系,保證無人機能夠實現躲避障礙物的功能。本文設計的兩個輸入變量d、θ的模糊分割數分別為3、5,因此共有15條規則,如表1所示。

表1 模糊控制器規則表

當輸入變量d為“N”,θ為“LS”時,輸出變量Δv為“VS”,Δα為“TRB”,即當無人機距離障礙物近,且當前航向角方向與無人機與障礙物連線夾角較小時,需要減速,減小航向角,使無人機低速右轉,從而安全規避障礙物。

2.2.4 輸出量控制曲面

圖10反映了模糊控制器的輸出變量Δv、Δα與輸入變量的變化關系。

圖10 速度與航向角控制曲面

由圖10可知,隨著d和|θ|的減小,輸出變量Δv減小。說明無人機距離障礙物越近,航向角越靠近障礙物,則越需要低速飛行。且Δv、Δα的變化較為平滑,保證了無人機飛行過程中能夠滿足運動學約束。

模糊控制器采取固定的規則來實現無人機的避障要求,控制過程簡單,實時性較好。但是其控制器的參數與規則確定后無法更改,適應性較差,當面對不同的環境時,規劃路徑效果不理想。此外,由于固定規則的限制,面對“凹多邊形”障礙物時,容易進入“陷阱”,無法實現避障要求。

3 模糊神經網絡避障算法

模糊控制適應性差,在障礙物分布差異較大的新環境中避障效果不穩定。而模糊神經網絡在通過訓練后,能夠充分利用輸入信息,提取障礙物的深度特征,提高避障算法對環境的適應性,使無人機在障礙物較為復雜的環境中也能夠完成避障任務。

3.1 模糊神經網絡

在模糊系統中,主要有Mamdani模型和Takagi-Sugeno模型。Takagi-Sugeno型模糊推理計算簡單,有利于數學分析,且易于和PID控制方法以及優化、自適應方法相結合[21]。

圖11為Takagi-Sugeno模型的模糊神經網絡結構。該網絡由前件網絡和后件網絡兩部分組成[22]。前件網絡由4層組成,其作用分別為傳遞輸入,計算隸屬度、計算適應度以及歸一化。后件網絡有yi個結構相同的并列子網絡組成,每個子網絡生成一個輸出量。自網絡的第1層為輸入層,將輸入傳遞給第2層。第2層用于計算每一條規則的后件,即:

圖11 基于Takagi-Sugeno模型的模糊神經網絡結構圖

(11)

式中:j=1,2,…,m;i=1,2,…,r。

子網絡的第3層是計算系統的輸入,即:

(12)

yi是模糊神經網絡的輸出,由各規則后件加權和計算,加權系數為各模糊規則經歸一化的使用度,即前件網絡的輸出用于后件網絡第3層的連接權值。

3.2 模糊神經網絡的結構和參數訓練流程

本文利用MATLAB中的自適應神經模糊推理系統工具箱來完成模糊神經網絡的設計與訓練。首先無人機在模糊控制下進行避障,提取避障路徑中的d、θ、Δv、Δα參數生成訓練數據。然后將前文所設計模糊控制器中的輸入變量及隸屬度函數作為初始參數。由于d、θ模糊分割數分別為3、5,因此初始模糊神經網絡同樣有15條規則,每條規則下都對應一個輸出變量的隸屬度函數。MIMO的模糊規則可分解為多個MISO模糊規則,因此分別對Δv、Δα進行訓練。圖12為Δv、Δα的初始模糊神經網絡結構。

圖12 輸出變量Δv、Δα訓練網絡

第1層為輸入變量層,將輸入變量值傳遞給網絡;第2層為輸入變量隸屬函數層,其中定義了初始的隸屬度函數;第3層為規則層,規則均采用and邏輯;第4層為輸出變量隸屬度函數,每個隸屬度函數由輸入變量通過線性運算得到;第5層為歸一化層,第6層為輸出變量。

之后將初始模糊神經網絡、訓練數據、測試數據導入至模糊推理系統編輯器,并設置訓練算法、誤差精度以及訓練次數。

本文選擇混合算法,訓練誤差為0.003,訓練次數為40。訓練完成的輸入變量隸屬度函數如圖13所示。

圖13 輸入變量d、θ訓練結果

與初始隸屬度函數(圖5~7)相比,該隸屬度函數的中心值與寬度值有了較大改變。最后將訓練完畢的模糊神經網絡在新的仿真環境中進行測試,驗證其避障效果。

4 仿真結果

4.1 仿真條件

仿真環境為600 m×600 m的正方形,以原點(0,0)建立直角坐標系,起始點坐標(30,30),目標點坐標(500,500),無人機最大速度vmax=4 m/s,最小速度vmin=1 m/s,控制量更新周期Ts=0.25 s,最大角速度ωmax=1.57 rad/s,最大加速度amax=2 m/s2,最大探測半徑Rd=15 m。

4.2 模糊控制避障仿真結果

圖14為模糊控制器在仿真環境下的避障效果,從圖中可以看出,在多次調整隸屬度函數和模糊規則后,控制器能夠實現較好的避障效果,且運動軌跡平滑,安全性較高。圖中標注出了5個關鍵避障節點,其飛行仿真數據見表2。根據表中的數據與輸入、輸出變量隸屬度,可以確定每個節點無人機所采取的模糊規則,證實了模糊控制器實現避障的可行性。

圖14 模糊控制器避障結果

表2 關鍵節點飛行數據

但是模糊控制算法采用固定規則來實現避障,試湊法確定的模糊控制器參數無法實時變化。當環境發生改變時,適應性較差。此外,基于經驗設計的規則只考慮了簡單的障礙物分布情況,當環境中存在復雜“凹多邊形”區域,無人機便會進入“陷阱”,無法實現避障要求。

4.3 模糊控制與模糊神經網絡避障仿真對比

圖15為兩種算法在新的障礙物環境中的避障效果對比。與圖14相比,環境中的障礙物位置發生了變化。對比兩圖可知,兩種算法都能實現避障,但在面對同一障礙物時,規劃的避障路徑卻不同。模糊控制器按照固定的規則,當θ為M時,只能采取向左飛行規避障礙物的策略。而模糊神經網絡控制器則能根據訓練數據,提取障礙物特征,根據不同的障礙物采取更優的避障策略。

圖15 模糊控制、模糊神經網絡仿真結果對比

圖16為在該環境中采用兩種避障方法的無人機飛行狀態對比圖。模糊控制規劃路徑長度為1 046.4 m,模糊神經網絡規劃路徑長度為938.7 m。由圖可知,在118 s時無人機采取了不同的避障動作,路徑抵達目標點的時間分別為244 s和271.75 s。模糊神經網絡縮短了避障路徑,能夠更快到達目標點。

圖16 飛行狀態對比

圖17為其中另一新環境中的避障效果對比,該環境中存在局部的“凹多邊形”障礙物區域。

圖17 隨機環境中模糊控制、模糊神經網絡仿真結果對比

模糊神經網絡經過大量避障數據的訓練,能夠提取障礙物分布的深度信息,其輸出是輸入的線性組合,并不依賴固定的規則。當無人機進入到“凹多邊形”區域內時,能夠根據障礙物特征,做出“后退”的飛行動作,從“陷阱”中脫離。

最后,通過蒙特卡羅仿真實驗比較模糊控制與模糊神經網絡算法的避障效果,驗證模糊神經網絡具有更強的適應性。首先以文中的7個障礙物模型為基礎,隨機更改它們的位置,生成了500張障礙物地圖。然后無人機在兩種控制算法下分別進行避障仿真,并統計無人機的避障次數、路徑長度與飛行時間。實驗結果如表3所示。

表3 避障仿真實驗結果

在500次的仿真實驗中,模糊神經網絡算法的避障成功率更高,平均路徑更短,飛行時間更少,說明了該算法有更強的適應性。

但是由于無人機在未知環境中規劃的是局部路徑,且模糊神經網絡算法沒有考慮障礙物信息處理、環境信息融合等問題,因此依然存在部分“凹多邊形”區域影響無人機的避障效果。另外,由于全局環境信息未知,模糊神經網絡只能得到可行解,并非最優解。針對未知環境中如何得到最優路徑問題,還需更深入的研究與探討。

5 結語

本文采用等效夾角優化了模糊控制器的輸入變量,將模糊控制應用于無人機未知環境中的避障,生成了避障路徑。然后提取路徑數據,設計并訓練模糊神經網絡,并進行了蒙特卡羅仿真實驗,比較了兩種算法的避障效果。結果表明模糊神經網絡算法的適應性更強,能夠優化局部避障路徑,規避分布較為復雜的障礙物,在未知環境中的避障成功率更高。

猜你喜歡
規則環境
撐竿跳規則的制定
長期鍛煉創造體內抑癌環境
一種用于自主學習的虛擬仿真環境
數獨的規則和演變
孕期遠離容易致畸的環境
不能改變環境,那就改變心境
環境
規則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
孕期遠離容易致畸的環境
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
主站蜘蛛池模板: 亚洲美女一级毛片| 日韩资源站| 亚洲欧美精品一中文字幕| 国产精品美女免费视频大全| 最新国产精品第1页| 国产精品视频系列专区| 国产精品永久在线| 毛片三级在线观看| 呦视频在线一区二区三区| 亚洲天堂视频在线免费观看| 一级做a爰片久久免费| 亚洲色图欧美视频| 久久久久亚洲AV成人网站软件| 国产情侣一区| 国产自在自线午夜精品视频| 毛片在线播放a| 国产综合另类小说色区色噜噜| 国产va欧美va在线观看| 高h视频在线| 成人一级免费视频| 欧美成人午夜影院| 99久久精品免费观看国产| 欧美区国产区| 亚洲热线99精品视频| a色毛片免费视频| 国产二级毛片| 国产高清在线精品一区二区三区| 国产精品免费露脸视频| 五月婷婷导航| 日韩福利在线观看| 亚洲国产中文综合专区在| 在线日韩一区二区| 日韩福利在线视频| 欧美国产综合视频| 国内精自视频品线一二区| 国产永久免费视频m3u8| 精品91自产拍在线| 色欲色欲久久综合网| 久久久精品国产亚洲AV日韩| 国产精品国产三级国产专业不| 伊人久久大香线蕉综合影视| 国内a级毛片| 97国产在线播放| 国产主播喷水| 亚洲精品成人福利在线电影| 亚洲AV无码乱码在线观看裸奔| 福利视频一区| 新SSS无码手机在线观看| 亚洲综合第一区| 99久久国产精品无码| 毛片a级毛片免费观看免下载| 久久综合婷婷| 国产乱子伦手机在线| 亚洲三级电影在线播放| 欧美专区在线观看| 蝴蝶伊人久久中文娱乐网| 国产 在线视频无码| 依依成人精品无v国产| 午夜日b视频| 久久国产乱子| 18黑白丝水手服自慰喷水网站| 亚洲男人的天堂久久精品| 精品少妇人妻av无码久久| 国产SUV精品一区二区6| 五月天婷婷网亚洲综合在线| 国产香蕉在线视频| 国产精品任我爽爆在线播放6080 | 久久伊人操| 日本午夜在线视频| 中文成人在线视频| 亚洲人成网站观看在线观看| 色哟哟色院91精品网站| 久久久精品无码一区二区三区| 免费人成在线观看视频色| 亚洲欧美精品一中文字幕| 免费国产黄线在线观看| 久久国产精品国产自线拍| 国产欧美日韩91| 亚洲第一视频免费在线| 国产va免费精品观看| 午夜激情福利视频| 2020久久国产综合精品swag|