999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于MADDPG 算法的匝道合流區多車協同控制

2024-12-15 00:00:00蔡田茂孔偉偉羅禹貢石佳姬鵬霄李聰民
汽車安全與節能學報 2024年6期
關鍵詞:智能優化方法

摘 要:為了保障匝道合流區的安全高效通行,提出了一種基于多智能體強化學習算法的多車協同控制方法。以提升系統計算效率為目標,設計了基于多智能體確定性策略梯度算法(MADDPG)的分布式訓練框架;針對智能體模型難以應對連續車流場景的問題,通過構建相對靜止環境,改進策略更新梯度,保障智能體面向連續車流環境的平穩性;拆分匝道合流區場景為準備區和匯入區,分別依據兩區域控制目標設計了狀態、動作空間及獎勵函數。結果表明:在不同交通流量下,與基于規則的方法相比,該方法通行合流區的總延誤時間平均縮短25.46%;與全局優化方法相比,延誤時間相差8.47%,但控制時長上不會隨車輛數量增加而增長。該文所提出匝道合流區多車協同控制方法能夠更好地兼顧通行效率提升與系統實時性。

關鍵詞: 多智能體確定性策略梯度算法(MADDPG) ;多智能體強化學習;多車協同控制;匝道合流

中圖分類號: U 491.1 文獻標識碼: A DOI: 10.3969/j.issn.1674-8484.2024.06.014

匝道合流區域作為高速公路與其他道路交匯的關鍵部分,常常成為交通擁堵和事故高發區域[1]。而隨著智能網聯汽車(intelligent connected vehicles,ICV) 技術的進步,車與車之間得以信息共享[2] ,在匝道合流場景下,主線車輛和匝道車輛之間可以通過綜合協調控制避免軌跡沖突,開展智能網聯環境下的匝道合流區多車協同控制方法研究,對于提升匝道合流區車輛行駛安全性與道路整體通行效率有著重要意義[3]。

目前,針對匝道合流問題的多車協同控制方法研究以優化方法為主流[4]。東南大學劉暢[5] 采用混合整數線性規劃和動態規劃實現合流次序優化,并構建了考慮車輛動力學的多車安全合流軌跡規劃方法。XULinghui 等[6] 將以主道車輛行駛時間最小和合流車輛數量最大為優化目標,采用遺傳算法求解最優合并順序。HUANG Tianyu 等[7] 則設計了一種雙層動態規劃的求解方法以縮短計算時長,上層尋找最優合并次序,下層在給定的合并策略中優化車輛軌跡。XUE Yongjie 等[8]側重降低匝道車流匯入對主道交通的干擾,應用灰色預測模型與模型預測控制分別完成多車的規劃與控制。

然而,基于優化的方法計算復雜度往往會隨車輛增加急劇增長,實際應用中計算資源需求較大[9]。在此背景下,基于深度強化學習的方法因其能夠實現離線訓練的特性,因而具有較好的實時性[10],在匝道合流區多車協同控制問題上具有獨特優勢。

基于強化學習的匝道合流研究方法中,單智能體強化學習相關研究主要以匝道車輛為研究對象,探究單車匯入場景為主[11],較少考慮多車交互,而多智能體強化學習則在多車協同方面有獨特優勢,目前多數研究集中應用在非信控交叉路口,少數學者開始探索將其應用于匝道場景。ZHOU Shanxing 等[12] 采用多智能體確定性策略梯度(multi-agent deep deterministic policygradient,MADDPG) 算法解決了混合交通下的匝道匯入問題,著重降低匝道匯入過程中的能耗,其協同車輛數目局限在3 輛車。ZHUANG Huanbiao 等[13] 使用集中式訓練、分布式執行架構的多智能體近端策略優化 (multi-agent proximal policy optimization,MAPPO)算法研究無信控交叉路口下的車輛協同問題,協同車輛數目最多為4 輛ICV 與5 輛重型車輛(heavy-dutyvehicles,HDV)。CHENG Dong 等[14] 面向含有HDV的混合交通匝道合流場景提出了具有動作掩蔽、局部獎勵、課程學習與參數共享等特點的分布式架構多智能體強化學習算法,最多實現6 輛ICV與5 輛HDV 的匯入場景。

綜上,多智能體強化學習方法在解決匝道合流區多車協同控制問題上,相較優化方法與單智能體強化學習方法兼顧了實時性與通行效率[15],但是在當前研究中,普遍存在協同車輛數量少的問題,訓練場景多側重應對固定數量智能體場景[16],較少探究連續車流解決方案。

因此,本文提出了一種基于多智能體深度確定性策略梯度算法的匝道合流區多車協同控制方法。基于匝道合流場景建立分布式MADDPG 算法訓練架構; 針對連續車流訓練場景中智能體環境動態變化的問題,通過構建相對靜止環境,改進策略更新梯度,拓展協同車輛數目;在此基礎上,為準備區與匯入區分別設計狀態、動作空間及獎勵函數,構建匝道合流區訓練環境進行模型訓練并提出模型合并應用方法;最后,本文選取現有典型的全局優化方法與基于規則的方法作為對比算法,對所提出匝道合流控制方法的高效性與實時性進行驗證。

1 問題描述

本文的研究場景為圖 1 所示在理想通信條件下的高速公路匝道合流區,區域內車輛均為智能網聯車輛,通過車端無線通信設備與路側單元交換信息。合流區道路分為主道與匝道,加速車道區域位于匝道末端,在該區域內車輛可以換道并入主道中。為了優化強化學習訓練效果,減小單個回合內智能體任務量,本文將如圖1 所示的匝道合流區劃分為加速車道前800 m 的準備區與200 m 長含加速車道區域的匯入區,并根據匝道合流區不同區域,拆解匝道合流的任務,制定不同控制目標與訓練方案。

猜你喜歡
智能優化方法
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 亚洲首页在线观看| 四虎精品黑人视频| 欧美国产在线精品17p| 99尹人香蕉国产免费天天拍| 亚洲欧美日韩天堂| 女人天堂av免费| 99久久精品免费观看国产| 国产色爱av资源综合区| 熟妇丰满人妻| 国产日本欧美在线观看| 在线网站18禁| 国禁国产you女视频网站| 一本二本三本不卡无码| 国产一区二区人大臿蕉香蕉| 老司机午夜精品视频你懂的| 尤物视频一区| 欧美a网站| 亚洲天堂首页| 99热这里只有精品久久免费| 欧美中文字幕在线二区| 911亚洲精品| 色屁屁一区二区三区视频国产| 免费看a毛片| 免费一级α片在线观看| 色妞www精品视频一级下载| P尤物久久99国产综合精品| AV天堂资源福利在线观看| 久久人人妻人人爽人人卡片av| 成人福利在线观看| 日韩欧美视频第一区在线观看| 在线精品亚洲国产| 欧美在线视频不卡第一页| 这里只有精品国产| 强奷白丝美女在线观看| 亚洲午夜天堂| 亚洲日韩AV无码一区二区三区人| 欧美第二区| 99久久国产精品无码| 自慰网址在线观看| 国产精品成人久久| 国产91麻豆视频| 国产精品无码一二三视频| 欧洲熟妇精品视频| 国产人成午夜免费看| 亚洲婷婷六月| 91人人妻人人做人人爽男同 | 高清码无在线看| 亚洲人成亚洲精品| 伊人久久福利中文字幕| 国产精品自在在线午夜区app| 99伊人精品| 欧美自慰一级看片免费| 丁香婷婷激情网| 中美日韩在线网免费毛片视频| 99久久99这里只有免费的精品| 制服丝袜一区| 福利一区在线| 不卡网亚洲无码| 久久综合丝袜日本网| 青青久在线视频免费观看| 国产剧情国内精品原创| 91青草视频| 国产网站一区二区三区| 日a本亚洲中文在线观看| 国产自在线播放| 亚洲国产一成久久精品国产成人综合| 91精品视频在线播放| 狠狠色婷婷丁香综合久久韩国| 中文字幕人妻av一区二区| 亚洲色图欧美在线| 一区二区三区四区精品视频 | 欧美在线一二区| 亚洲精品麻豆| 真人高潮娇喘嗯啊在线观看| 国产视频大全| 中文字幕啪啪| 国产精品亚洲综合久久小说| 国产地址二永久伊甸园| 日韩 欧美 国产 精品 综合| 秋霞国产在线| 国内精品免费| 98精品全国免费观看视频|