999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于改進貝爾曼方程的最短路徑規劃算法

2023-01-18 05:39:18
關鍵詞:控制策略規劃

魯 韻 王 姣

(武昌首義學院機械與自動化學院 武漢 430074)

0 引 言

無人駕駛技術的快速發展給城市交通帶來了一定壓力.隨著交通網絡的規模越來越大,其路徑規劃也越來越復雜.最短路徑規劃作為提高無人駕駛車輛通行效率、緩解城市交通壓力的基本方法已成為研究熱點.

郭興海等[1]采用多目標與速度控制的方法提出了一種全局路徑規劃方法,該方法對靜態全局路徑規劃的效率提升明顯.趙衛東等[2]通過添加約束的方法提出了一種兩階段搜索的A~*全局路徑規劃算法,相比于傳統算法,該算法改進了動態全局路徑規劃計算問題的效率.然而,全局路徑規劃考慮了地圖上所有的節點信息,通常非常耗時,因此提出最短全局路徑算法,如Voronoi圖方法[3],單元分解法[4]和隨機規劃法[5]等.盡管這類算法執行速度很快,但對于如何生成足夠的樣本以覆蓋和連接配置空間,以及如何優化生成路徑等問題并未得到很好解決.在路徑規劃問題中效率和可達性的平衡一般要根據項目的實際情況進行取舍,這給工程實際帶來了一定的困難.

本文提出一種最短路徑規劃算法,該算法將目標集看作有限維的歐幾里德空間并采用改進貝爾曼方程選擇當前最佳的適宜型控制策略以解決其效率和精度問題.

1 最短路徑問題的數學描述

假設一個具有有限集合節點的圖為X∪{t},一組有限的有向弧為A?{(x,y)|x,y∈X∪{t}},其中t為目標節點.在每個x∈X節點處,可以從非空集合U(X)中選擇一個控制或動作u,它是有限集合U的子集.然后,從非空集Y(x,u)?X∪{t}中選擇一個后續節點y.那么對于所有的y∈Y(x,u)都有(x,y)∈A,此過程中的成本函數記為g(x,u,y).目標節點t具有可吸收性并且生成過程中不產生成本.所以從這個意義上說,目標節點t的唯一輸出弧是(t,t)且對所有的u∈U(t)都有g(t,u,t)=0.

為每個節點x∈X分配一個控制μ(X)∈U(x),其中μ(X)為控制策略函,用M表示所有控制策略的有限集.在控制策略μ下從節點x0∈X開始的一條可能的規劃路徑可視為弧序列p:

p={(x0,x1),(x1,x2),…,}

(1)

對所有的k≥0都有xk+1∈Y(xk,μ(xk)).P(x0,μ)為從x0開始的控制策略μ下的所有可能路徑的集合.路徑p∈P(x0,μ)的長度為

(2)

若式(2)中的級數收斂,則有

(3)

當x0≠t時,對給定的控制策略μ,若路徑p∈P(x0,μ)見式(4),則稱其為路徑終止.

p={(x0,x1),(x1,x2),…,(xm,t),(t,t),…}

(4)

式中:m為定義范圍內的一個正整數,x0,…,xm為不同的非目的節點.因為對所有u∈U(t)都有g(t,u,t)=0,控制策略μ下具有式(4)形式的終止路徑p的長度為

Lμ(p)=g(xm,μ(xm),t)+

(5)

有限弧子集描述了控制策略μ的一個重要特征信息:

Aμ=∪x∈X{(x,y)|y∈Y(x,μ(x))}

(6)

因此,在某種意義上Aμ與自弧(t,t)共同構成一組唯一路徑∪x∈XP(x,μ).若對每個x∈X都在P(x,μ)中存在一個終止路徑,則稱Aμ為目的地可連接型.如果弧Aμ的子圖是非循環的(即不包含循環),則稱Aμ為適宜型.因此,到目的節點時當且僅當∪x∈XP(x,μ)中所有路徑都是簡單路徑,則稱μ為適宜型.等價于當且僅當Aμ為目的地可連接型并且不存在循環時,μ為適宜型.“適宜型”策略的定義與隨機最短路徑問題中的定義一致,表示以概率1到達目的地的策略[6-8].如果μ為不適宜型,則稱尋求路徑的整個過程為不適宜過程,在這種情況下,弧Aμ的子圖會至少包含一個循環,見圖1.

對于適宜型的控制策略μ,對每個x∈X從x開始的有限可能路徑集合上最壞情況的路徑長度為

(7)

式中:Jμ(x)為弧Aμ的非循環子圖中從x到t的最長路徑的長度.由于此非循環圖中有有限多條路徑,因此,在簡單情況下可以通過枚舉并比較這些路徑長度的方法來找到Jμ(x).因此對于所有的x∈X,在經典最短路徑問題的假設下,需要找到一個適宜型的最佳控制策略μ使Jμ(x)最小.將此稱為魯棒最短路徑選擇問題(RSP),且RSP中的極小化只建立在適宜型的控制策略之上[9-11].

2 基于改進貝爾曼方程的極值算法

2.1 研究假設

研究假設如下:①對每個有向圖集,至少存在一個適宜型的控制策略;②對于每個不適宜型的控制策略μ,弧Aμ子圖中的所有循環的長度都為正.

該假設與經典的確定性最短路徑問題中的假設一致,即Y(x,μ)由單個節點組成.假設①等價于假設每個節點都有一個路徑連接到目的地;假設(2)等價于假設圖中的所有有向循環的長度均為正.對假設②進一步補充為假設圖中的所有有向循環的長度均為非負數.該假設適用于所有弧長g(x,u,y)均為非負的情況,此情況下保留了存在零長度循環的可能性.

2.2 改進貝爾曼方程的極值算法

將函數Jμ(x)的定義擴展到不適宜型的情況中去.對于適宜型控制策略μ,Jμ(x)可由式(7)計算,對路徑p∈P(x,μ),最長路徑的長度為

定義:

(8)

(9)

(10)

通過式(9)~(10),對于一個適宜型的控制策略μ,任何最短路徑算法均可用于解決該最長路徑問題.對不適宜型的μ,Jμ(x)→∞, 相應的解決最長路徑問題的算法也就不再適用.此時,需要尋求一種最小化算法找到目標函數式(11)的最小值,使之同時適用于所有的x∈X.這與第一節中魯棒最短路徑選擇問題不同,該最小化算法要對所有的控制策略成立.

(11)

將式(11)所描述的極值問題抽象化,改寫為匹配貝爾曼方程式(8)~(9)的形式,從而將其轉化為抽象動態規劃問題.用E(X)表示函數集J:X→[-∞,∞];用R(X)表示函數集J:X→(-∞,∞).注意,因為X是有限集,所以R(X)可以看作有限維的歐幾里德空間.引入映射H:X×U×E(X)→[-∞,∞],為

(12)

(13)

對任意的控制策略μ,定義映射Tμ:E(X)→E(X)為

(TμJ)(x)=H(x,μ(x),J),x∈X

(14)

注意到不動點方程Jμ=TμJμ與貝爾曼方程(8)相同,映射Tμ:E(X)→E(X)可寫為

(15)

等價于

(16)

引入一個零函數:

(17)

(18)

將上式帶入式(8),可得到:

(19)

這樣就所得到了在2.1的假設下經典確定性最短路徑問題的主要分析結果,即改進貝爾曼方程的極值算法,該算法可以抽象形式表述如下:

1)J*為T在R(X)內的唯一不動點,對所有的J∈R(X),Tk(J)可以將轉換為J*.

2) 對最短路徑規劃問題,存在一個最佳的適宜型控制策略,并且只有在該適宜型控制策略下才能得到最優解.

3) 當J=J*時,當且僅當對式(16)中所有的x∈X它都能取得最小值,那么控制策略μ即為最優.

3 試驗結果與分析

3.1 標準最短路徑規劃仿真結果與分析

通過仿真模擬比較改進貝爾曼方程的極值算法和快速行進算法在四個不同種類地圖上的最短路徑尋跡結果,見圖1~4.

圖1 快速行進算法與極值算法在地圖1的最短路徑規劃仿真結果對比

圖2 快速行進算法與極值算法在地圖2的最短路徑規劃仿真結果對比

圖3 快速行進算法與極值算法在地圖3的最短路徑規劃仿真結果對比

圖4 快速行進算法與極值算法在地圖4的最短路徑規劃仿真結果對比

由仿真結果可知,改進貝爾曼方程的極值算法生成的路徑比快速行進算法生成的路徑更精確,尤其是在垂直和水平方向.這是因為快速行進算法中所使用的2階龍格-庫塔法的累計誤差影響了原始常微分方程在路徑恢復中的數據精度.此外,極值算法所仿真出的最短路徑的起始位置和終點位置非常精確,但快速行進算法只在特定范圍內比較準確.然而,如果缺少適當的線性插值誤差校正,極值算法路徑的某些中間段部分會變得比快速行進算法路徑稍差.導致這種結果的原因在于路徑上的一個附加有限弧節點可能被錯誤地分配給另一個有限弧節點的父有限弧節點.

表1為當最大成本值較大時,極值算法和快速行進算法的計算時間.通過仿真分析,因此當最大成本值設置為較大數值時,極值算法的總時間比快速行進算法快.極值算法的計算速度是穩定的,其計算速度僅取決于圖大小的比例,計算復雜度僅取決于有限弧節點的個數.極值算法對最大成本值沒有影響,因此其總時間幾乎等于有限弧節點的前向傳播時間.雖然快速行進也具有穩定的傳播速度,但其路徑計算時間將取決于環境的復雜性,其收斂速度也受最大成本值的影響.

表1 極值算法和快速行進算法的計算時間比較 單位:s

3.2 涉及追蹤的動態路徑規劃仿真結果與分析

通過應用極值算法和路徑恢復規則,對涉及追蹤規避問題的動態路徑規劃進行了仿真.地圖尺寸也為100×100網格,藍色標記的路徑為追蹤者,綠色標記的路徑為躲避者,二者的速度均設置為1單位/s.躲避者的行動模式設置為試圖逃離追蹤者的追捕,結果見圖5.在第12 s,因為躲避者稍微向上移動,可以看到新規劃路徑在公共有限弧節點重置后被立即更新,說明極值算法具有較好的動態性能.從最后追捕結果可以得到如果躲避者的躲避路徑總使得障礙物出現在躲避者和追趕者之間,則當躲避著和追蹤者速度相同時該方法不能保證捕獲成功.然而,如果追蹤者的速度更快,由于極值算法在每個時隙都提供了最短的追蹤路徑,所以無論躲避者如何移動,該方法都能保證成功.

圖5 涉及追蹤的動態路徑規劃仿真結果

4 結 束 語

考慮到無人駕駛車輛的安全性和城市交通通行效率,其靜態和動態路徑規劃需要兼顧準確性、可靠性和快速性.文中提出了一種基于改進貝爾曼方程最短路徑規劃算法,該算法可以選擇當前最佳的適宜型控制策略以解決其效率和精度的平衡問題.仿真實驗結果表明,極值算法生成的路徑比快速行進算法生成的路徑更精確,尤其是在垂直和水平方向.極值算法的計算速度是穩定的,其計算速度僅取決于圖大小的比例,計算復雜度僅取決于有限弧節點的個數,其動態路徑規劃性能優于快速行進算法.但該方法在任務分配復雜的情況下,其協同能力仍有提升空間,有待后續進一步研究.

猜你喜歡
控制策略規劃
考慮虛擬慣性的VSC-MTDC改進下垂控制策略
能源工程(2020年6期)2021-01-26 00:55:22
發揮人大在五年規劃編制中的積極作用
工程造價控制策略
山東冶金(2019年3期)2019-07-10 00:54:04
現代企業會計的內部控制策略探討
消費導刊(2018年10期)2018-08-20 02:57:02
規劃引領把握未來
快遞業十三五規劃發布
商周刊(2017年5期)2017-08-22 03:35:26
多管齊下落實規劃
中國衛生(2016年2期)2016-11-12 13:22:16
十三五規劃
華東科技(2016年10期)2016-11-11 06:17:41
容錯逆變器直接轉矩控制策略
基于Z源逆變器的STATCOM/BESS控制策略研究
主站蜘蛛池模板: 在线高清亚洲精品二区| 欧美日韩精品综合在线一区| 亚洲成人精品在线| 久久五月天国产自| 天天综合色天天综合网| 秋霞一区二区三区| 在线人成精品免费视频| 国产大全韩国亚洲一区二区三区| 男人天堂亚洲天堂| 亚洲有无码中文网| 波多野结衣中文字幕久久| 午夜激情婷婷| 看国产一级毛片| 玖玖精品视频在线观看| 欧美综合中文字幕久久| 国产精品专区第一页在线观看| 香蕉eeww99国产在线观看| 好紧太爽了视频免费无码| 日本黄色不卡视频| 欧美视频在线不卡| 91探花国产综合在线精品| 亚洲欧美成人网| 美女内射视频WWW网站午夜 | 伊人网址在线| 99精品国产电影| 免费a级毛片视频| 国产成人精品免费视频大全五级| 丁香六月综合网| 欧美日韩成人在线观看 | 免费人成视网站在线不卡| 欧美在线网| 久久国产精品电影| 色噜噜久久| 国产视频一二三区| 日本高清在线看免费观看| 国产精品尤物铁牛tv | 国产农村妇女精品一二区| 四虎影视库国产精品一区| 亚洲中文无码av永久伊人| 不卡视频国产| 2021国产v亚洲v天堂无码| 在线视频一区二区三区不卡| 亚洲精品波多野结衣| 这里只有精品在线播放| 91久久大香线蕉| 国产激情第一页| 国产精品久久自在自线观看| 亚洲成人免费在线| 日本人妻一区二区三区不卡影院| 2021无码专区人妻系列日韩| 国产伦精品一区二区三区视频优播 | 波多野结衣爽到高潮漏水大喷| 国产成人综合网| 亚洲国产综合第一精品小说| 无码福利日韩神码福利片| 久久精品国产亚洲麻豆| 日本草草视频在线观看| 亚洲成肉网| 丁香婷婷激情网| 国产区福利小视频在线观看尤物| 亚洲人成人伊人成综合网无码| 国产自在自线午夜精品视频| www亚洲精品| 国产99精品久久| 72种姿势欧美久久久大黄蕉| 成人综合网址| 日本手机在线视频| 91亚洲免费视频| 亚洲va欧美va国产综合下载| 99视频精品在线观看| 国禁国产you女视频网站| 亚洲 欧美 偷自乱 图片| 久久综合婷婷| 日本国产一区在线观看| 国产精品.com| 欧美在线综合视频| 无码日韩视频| 亚洲香蕉久久| 青青热久免费精品视频6| 国产精品无码AⅤ在线观看播放| 高清精品美女在线播放| 成人av专区精品无码国产|