999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

采用多智能體強化學習的交通信號優化控制

2012-07-04 09:43:20炯,金
制造業自動化 2012年17期
關鍵詞:方向智能

宋 炯,金 釗

(1.云南交通職業技術學院,昆明 650101;2.云南大學,昆明 650091)

0 引言

實現智能交通信號控制是一種減少交通擁堵和提高交通效率的低成本方法[1]。因為交通流量具有隨時變化和隨機性的特點,尤其是在多十字路口的城市交通環境,因此流量建模仍然是非常困難的。一個預設的交通控制模型是不可能符合所有的交通情況。所以有更多研究關注機器學習的實時交通流量控制[2~4]。在所有機器學習的方法中,強化學習受到更多的關注,因為其自主學習的能力, 使得能夠智能感知不同的條件和自我自適應調整控制策略,以符合交通條件。

雖然在參考文獻[2]中提出了自適應減少時間延遲的交通信號控制的Q學習方法,但只考慮了一個十字路口的情況。A.Salkham[3]提供了一個強化學習交通控制優化框架,但對硬件基礎設施依賴較大。Li T[4]等學者提出了一種自適應動態規劃方案實施多十字路口的交通信號智能控制,但針對相互作用和相互影響的多交叉路口的情況卻沒有進一步探討。在參考文獻[5~7]中,可以看到到一些類似的研究。這些研究表明使用自主學習的強化學習解決隨時變化和隨機性交通流量問題,一直是智能交通信號控制研究的重點之一[8]。雖然這些問題都受到關注,但都沒有進一步詳細討論和研究。

圖1 由六個十字路口的城市交通網絡構建的仿真環境

在本文中,作者提出了一種多智能體強化學習的多十字路口的交通信號控制模型。

首先,作者定義多十字路口的交通信號控制問題的多智能體的強化學習模型,其中包括狀態空間、目標狀態、行動和培訓的事件,完整描述在強化學習語言的問題。然后,從中找出多路口交通信號控制的最優政策的多智能體強化學習算法。交通信號控制策略的最優政策是讓所有的車輛可以在最短的時間內,離開多路口的城市交通網絡。最后,在仿真環境中,作者通過比較常規定時控制與多智能體增強學習自適應控制下所有車輛離開多路口的城市交通網絡的時間,來進行驗證。

1 強化學習模型的多路口交通信號控制問題

首先,作者對多路口的交通信號控制問題的多智能體強化學習模型進行描述。

在作者的模型中,一個城市的交通網絡是由多個十字路口構成,例如,圖1顯示由6個十字路口組成的交通網絡,同時它也是作者實驗的仿真環境。當然,可以由更多的十字路口組成擴大的交通網絡。

交通信號控制的目標是使這些車輛安全,快速地離開由十字路口組成的交通網絡。很明顯在十字路口的車輛是隨時變化和隨機的。預設的控制模型是不可能的適應所有的交通流量,這也是作者采取多智能體強化學習方法的原因,它可以根據實時交通流量自主學習的最優政策。

在交通信號控制中,一個相位是信號燈不中斷照明的間隔時間,舉個例子,一個紅色信號燈照明時間間隔或綠色信號燈照明時間間隔都是相位。通過在一個合理的時間間隔,使車輛在較短的時間內交叉十字路口切換不同的相位是交通信號控制的主要目標。例如,當車輛在西向東方向比車輛在南向北方向的流量多,東向西方向的綠色信號燈相位應該是比紅色信號燈相位長。

通常的相位是最大的時間間隔是的間隔時間最短的相位的整數倍,我們記為“MinPT”。例如,如果MinPT = 60秒,那么相位時間間隔應該60秒,120秒,180秒,以此類推。

根據交通信號控制問題的描述,車輛數量和所有路口的組合稱為一個狀態,反映了交通流量的信號控制??刂颇繕耸窃谳^短時間內使所有的車輛離開城市交通網絡,當在交通網絡中的每一個十字路口的汽車數量趨于零時,就達到了理想的目標狀態。完成每個階段后最短相位時間間隔、通過智能控制達到紅綠燈最短相位。

當一個方向設置為綠色信號燈時,然后另一個方向必須設置為紅色信號燈,因為只有一個方向的車輛可以通過一次。因此,每個階段最短的時間間隔后的行動只是設置一個方向的綠色信號燈,因為另一個方向必須是紅信號燈。整個訓練集可以描述為:后完成每個階段最短的時間間隔,允許或不允許車輛通行狀態,控制代理選擇隨機一個方向綠色信號燈(另一個方向是紅色信號燈),然后選擇下一步的操作,直到所有車輛都離開交通網絡(實現目標狀態)。這個過程被稱為一個訓練集。圖2顯示兩個十字路口的交通流量的狀態和行為。

圖2 交通控制問題的狀態和行為

2 多十字路口的交通信號控制最優策略的多智能體強化學習算法

作者使用最廣泛使用的強化學習方法:Q-leaming[9]來完成該算法算,以實現多十字路口的交通信號控制最優策略。通過算法l的程序實現交通信號控制的最優策略。

算法1 多智能體強化學習實現交通信號控制問題的最優策略。

Create null list: trajectory

Create null list: State-List

Create null set: State-Cluster

For each s,a initialize the table entry Q(s,a) to zero

Observe the current state s

Add s into trajectory Repeat

Select an action a and execute it

Receive immediate reward r

Observe the current state s'

Add s' into trajectory

Let State-List ← the reverse of trajectory

Update the table entry fors,a) as follows:

For each list cur_list in State-Cluster do

Let i ← 2

While i < the length of cur_list

Let spre← cur_list [i-1]

圖3 兩個十字路口交通網絡信號控制的最優策略

Let snow← cur_list [i]

Let a*← the action agent takes when it move from snowto spre

Let i ← i+1

End while

End for

s←s'

Until all table entry are convergent

圖3給出兩個十字路口的交通網絡中的最優策略。從圖3可以很明顯的看到,在南北方向綠色信號的時間超過了在東西方向的綠色信號時間,因為在南北方向的汽車數量大于東西方向的汽車數量。算法1通過智能控制來調節控制策略,以應對實時的交通狀態實現自適應的控制。

3 實驗

在交通狀況仿真環境下通過30次不同的交通狀況,我們分別采用傳統的定時控制和基于多智能體強化學習的自適應控制,比較所有車輛離開當地城市交通網絡的時間。實驗結果如圖4所示。

通過圖4顯示出來的比較結果看到:基于多智能體強化學習的自適應控制策略與采用傳統定時策略的控制方法相比,所有車輛離開交通網絡的時間可以減少20~30%。結果顯示作者的控制算法可以顯著減少所有車輛離開當地城市交通網絡的時間。

圖4 傳統定時控制與多智能體強化學習的自適應控制對比實驗

4 結論

在這項研究工作中,作者提出了一個多智能體強化學習的交通信號控制方法。作者定義了多智能體強化學習模型的交通信號控制問題,并提出實現最優策略的算法。通過仿真環境下交通信號控制效果的和實驗結果,可以清楚的說明作者的方法。采用多智能體強化學習的交通信號優化控制的方法可以大大減少所有車輛離開城市交通網絡的時間。

隨著日益膨脹的城市交通流量和十字交叉路口,空間及狀態因素將變得非常巨大,今后的研究應解決如何加速學習以應對這一趨勢。

[1] A.L.C.Bazzan, Opportunities for multi-agent systems and multi-agent reinforcement learning in traffic control,Autonomous agent multi-agent systems, 18, 342-375, 2009.

[2] Lu Shou feng, Liu Ximin, Dai Shiqiang.Q-learning for adaptive traff i c signal control based on delay minimization strategy.International Conference on Networking, Sensing and Control.In Proceedings of ICNSC'2008.pp.687-691

[3] A.Salkham, R.Cunningham, A.Garg, and V.Cahill, A Collaborative Reinforcement Learning Approach to Urban Traffic Control Optimization, In: The 2008 International Conference on Web Intelligence and Intelligent Agent Technology, Vol.2, 560-566, 2008.

[4] Li T, Zhao D B, Yi J Q.Adaptive dynamic programming for multi-crossroads traffic signal intelligent control.In:Proceedings of the 11th IEEE International Conference on Intelligent Transportation Systems.Beijing, China: IEEE,2008.286-291.

[5] Cai C.An approximate dynamic programming strategy for responsive traffic signal control.In: Proceedings of IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning.Honolulu,USA: IEEE,2007.303-310.

[6] A.L.C.Bazzan, D.Oliveira , B.C.Silva, Learning in groups of traffic signals, Engineering Applications of Artificial Intelligence, Vol.23, No.4, 560-568, 2010.

[7] G.Balan, S.Luke, History-based traff i c control, Proceedings of the fifth international joint conference on Autonomous agents and multiagent systems, Hakodate, Japan, 973-980,2006.

[8] T.L.Thorpe, C.W.Anderson, Traffic Light Control Using SARSA with Three State Representations[Z], Technical report, IBM Corporation, Boulder, 1996.

[9] C.J.Watkins, Q-Learning, Machine Learning,Vol.8, 279-292,1992.

猜你喜歡
方向智能
2022年組稿方向
計算機應用(2022年2期)2022-03-01 12:33:42
2022年組稿方向
計算機應用(2022年1期)2022-02-26 06:57:42
2021年組稿方向
計算機應用(2021年4期)2021-04-20 14:06:36
2021年組稿方向
計算機應用(2021年3期)2021-03-18 13:44:48
2021年組稿方向
計算機應用(2021年1期)2021-01-21 03:22:38
智能制造 反思與期望
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
主站蜘蛛池模板: 国产一区二区三区在线无码| 欧美一区二区三区香蕉视| 亚洲第一网站男人都懂| 国产91小视频在线观看| 亚洲综合激情另类专区| 日韩欧美国产精品| 国产国语一级毛片在线视频| 在线免费观看AV| 激情午夜婷婷| 国产日韩精品一区在线不卡 | 亚洲一区二区在线无码| 中文成人在线视频| 亚洲欧美天堂网| 亚洲天堂网视频| 在线观看免费AV网| 精品国产美女福到在线不卡f| 在线观看欧美精品二区| 亚洲第一黄片大全| 黄色三级网站免费| 久久中文字幕av不卡一区二区| av色爱 天堂网| 国产午夜人做人免费视频| 国产精品手机视频| 久草视频精品| jizz亚洲高清在线观看| 国产视频入口| 国产精品亚欧美一区二区三区| 男女男免费视频网站国产| 色天天综合| 日本一区二区不卡视频| 久久久久久午夜精品| 欧美一区二区三区不卡免费| 久久精品只有这里有| 国产91特黄特色A级毛片| 国产乱子伦无码精品小说| 亚国产欧美在线人成| 无码AV日韩一二三区| 青青草国产在线视频| 国产区人妖精品人妖精品视频| 2022国产91精品久久久久久| 国产视频自拍一区| 中国一级特黄大片在线观看| 日本欧美成人免费| 99热国产这里只有精品无卡顿" | 欧美一级99在线观看国产| 久久国产热| 狠狠五月天中文字幕| 国产91丝袜| 在线亚洲小视频| 人妻夜夜爽天天爽| 亚洲码一区二区三区| 青草视频免费在线观看| 毛片免费在线| 亚洲视频黄| 免费人成黄页在线观看国产| 国产精品浪潮Av| 亚洲三级视频在线观看| 五月婷婷丁香综合| 久久久受www免费人成| 国产簧片免费在线播放| 国产电话自拍伊人| 亚洲αv毛片| 亚洲日本在线免费观看| 综合天天色| 国产屁屁影院| 欧美黄网在线| 香蕉国产精品视频| 欧美日韩精品一区二区在线线| 91色爱欧美精品www| 99精品国产自在现线观看| 亚洲国产系列| 亚洲天堂视频在线播放| 亚洲国产成熟视频在线多多 | 无码'专区第一页| 亚洲成人精品| 亚洲成年人片| 少妇精品网站| 无码人中文字幕| 毛片久久网站小视频| 在线视频精品一区| 人人澡人人爽欧美一区| 97免费在线观看视频|