摘 要:針對遺傳規(guī)劃(GP)算法在大規(guī)模動態(tài)交通流分配中訓練超啟發(fā)式策略時,算法迭代次數的增加而個體平均大小不斷膨脹的問題,提出應用不同GP控制膨脹方法來限制種群中大尺寸個體的遺傳,讓算法能夠在訓練過程中找到更小且性能更優(yōu)的超啟發(fā)式策略。考慮到超啟發(fā)式策略在如網格式、環(huán)形放射式、自由式的不同結構路網上可能存在性能差異,會影響算法在訓練過程中對個體的選擇,采用不同結構的路網訓練出超啟發(fā)式策略以進行分析比較。訓練后的超啟發(fā)式策略在不同規(guī)模和車流量的大城市路網上進行模擬測試。結論是基于雙錦標賽的膨脹控制方法對不同結構路網的效果最優(yōu),得到的GP算法對比現有調度方法能獲得路網整體更短的平均旅行時間,更精簡有效的超啟發(fā)式策略,提高決策效率。
關鍵詞:遺傳規(guī)劃;動態(tài)交通流優(yōu)化;控制膨脹;超啟發(fā)式策略;雙錦標賽法
中圖分類號:TP18"" 文獻標志碼:A
文章編號:1001-3695(2025)01-024-0171-06
doi: 10.19734/j.issn.1001-3695.2024.05.0177
Traffic flow optimization bloat control genetic programming algorithm
Abstract:In addressing the issue of increasing individual average size with iterations of the GP algorithm for training hyper-heuristic strategies in dynamic traffic assignment, this paper proposed various methods for bloat control in GP to constrain the genetic inheritance of large-sized individuals within the population. This enabled the algorithm to discover smaller-sized yet higher-performing hyper-heuristic strategies during the training process. Considering the potential performance differences of hyper-heuristic strategies on various structured road networks such as grid, ring radial, and free style networks, this paper adopted different structured road networks to train hyper-heuristic strategies for analysis and comparison. The trained hyper-heuristic strategies underwent simulation testing on urban road networks of varying scales and traffic volumes. The conclusion is that the double tournament bloat control method performs the best for different structured road networks. The GP algorithm obtained from this study demonstrates its ability to achieve shorter overall average travel times for road networks compared to existing dispatch methods. Consequently, more concise and effective hyper-heuristic strategies are derived, leading to enhanced decision-making efficiency.
Key words:genetic programming(GP); dynamic traffic flow optimization; bloat control; hyper-heuristic strategies; double tournament
0 引言
隨著經濟水平的提高和工業(yè)的發(fā)展,許多大城市的交通道路承受能力受到挑戰(zhàn),上下班高峰期面臨嚴重的道路擁堵問題。 交通流分配問題是智能交通領域一個研究焦點,目的在于為路網上每個出行需求分配合適的路線,減少擁堵,提高出行效率[1]。最早Wardrop[2]設計了兩個交通流分配原則,分別為用戶均衡原理和系統(tǒng)最優(yōu)原理。在用戶均衡原理下,每個車輛出行都選擇對自己有利的路線。在系統(tǒng)最優(yōu)原理下,車輛聽從系統(tǒng)的安排達到整體旅行成本最低。
交通流分配模型可分為靜態(tài)和動態(tài)模型[3,4]。靜態(tài)模型提前分配路網上的交通量,即起點到終點的交通需求,代表有容量受限的路徑規(guī)劃[5]、靜態(tài)多路徑[6]和疏散路徑優(yōu)化[7]。動態(tài)模型又分為基于分析的動態(tài)模型和基于仿真的動態(tài)模型兩大類。第一種可以細分為數學規(guī)劃模型[8],最優(yōu)控制模型[9]與變分不等式模型[10]。在仿真模型中[11~15],通過使用交通仿真軟件來模擬交通流在交通網絡中的運行狀態(tài)。
智能優(yōu)化算法在求解NP難復雜組合優(yōu)化問題上有獨特優(yōu)勢,在交通流分配領域的應用越來越受到重視。文獻[16]提出了下一代智能交通系統(tǒng)的模型,車輛能夠根據交通流動態(tài)進行自計算,作出自適應路由決策。文獻[17]提出了基于隨機森林和遺傳算法的新型混合預測框架以實現交通流預測。文獻[18]使用遺傳規(guī)劃構建超啟發(fā)式策略來解決不確定的容量受限的路徑規(guī)劃問題。文獻[19]使用超啟發(fā)式算法對多目標路徑規(guī)劃問題進行了研究。但它們大多數是解決靜態(tài)、小規(guī)模的交通流分配問題。文獻[20]提出了一個遺傳規(guī)劃超啟發(fā)式(genetic programming hyper-heuristic, GPHH)算法進行交通流優(yōu)化方法,該方法通過對現有交通數據的學習與訓練,生成指導流量分配和路徑規(guī)劃的自適應策略,為每個出行需求提供面向全局優(yōu)化的路徑指引,并且擴展到了更大規(guī)模的動態(tài)交通流分配。
然而,GP傾向于不斷增加其個體的大小,這被稱為膨脹[21]。GP簡化是通過從GP樹中移除多余分支來減少策略大小的一種方法。文獻[22]提出可以在搜索過程中簡化GP樹。文獻[23,24]探索了使用哈希技術進行代數樹簡化,并將其應用于回歸和分類問題。文獻[25,26]都提出了基于子樹的局部效應數值樹簡化方法。目前遺傳規(guī)劃方法應用于交通流優(yōu)化問題上,存在決策樹過于復雜導致決策效率低的問題,因此本文將通過分析現有的多種膨脹控制方法,設計出更加高效控制交通流優(yōu)化決策樹規(guī)模的遺傳規(guī)劃算法。
本文在GPHH[20]算法的基礎上進行改進,研究動態(tài)交通流分配模型的特性和現有交通流仿真模型的特點,通過現有的交通流仿真系統(tǒng)與現實路網相結合,設計出指導車輛路線規(guī)劃的策略,用于構造基于GP的超啟發(fā)式指導路徑的生成。此外,還研究現有GP個體規(guī)模膨脹控制方法。GP中的個體往往在優(yōu)化過程中增大自身的樹狀結構,但適應性沒有相應提高,反而造成個體評估用時的增加,需要加入一些策略引導和限制個體的膨脹。通過對四種膨脹控制方法的分析實驗發(fā)現,本文GP算法在利用了基于線性參數簡約壓力的膨脹控制方法下對交通流優(yōu)化問題的適應性更佳。訓練后的GP策略在不同規(guī)模和車流量的大城市路網上進行測試。實驗結果表明,通過遺傳規(guī)劃不斷迭代訓練出的策略對比現有調度方法能獲得路網整體的更短平均旅行時間,提高車輛的出行效率。
1 動態(tài)交通流仿真模型
本文考慮的動態(tài)交通流仿真模型為CBLab[27],該模型能動態(tài)生成路網中具有隨機出發(fā)地和目的地的車輛,通過遺傳規(guī)劃算法得到每輛車的最優(yōu)路線規(guī)劃決策,從而引導動態(tài)生成的車輛在路網中移動,獲得仿真時間內路網車輛的整體平均旅行時間最短。下面將給出路網的定義和地圖數據來源,本文考慮不同路網形式和交通流仿真決策目標的描述。
1.1 路網的定義和數據來源
交通流仿真模型的構建是在現實路網的基礎上建立的。車輛行駛在道路上,道路的連接處形成路口。根據文獻[28]對路網的定義,路網可以表示為G(N,E),它是一個有向圖,其中變量N和E分別代表路口和道路的集合,每一條道路e=(u, v)∈E都有d(e)長度這一個基本屬性,u代表道路e的起點,v代表道路e的終點。仿真模型的使用需要依賴于現實的路網數據,而路網的數據信息可以在OpenStreetMap[29]里獲取。
1.2 路網的分類與特點
道路布局網絡是城市的骨架,形成的道路系統(tǒng)通常可以歸納為網格式、環(huán)形放射式、自由式和復合式[30]四種典型形式,圖1給出了前三種例子,復合式是三種形式的復合形態(tài)。
1.3 交通流仿真的決策目標
本文以仿真時間內路網車輛的整體平均旅行時間最短為決策目標,平均旅行時間的計算公式如下:
其中:t(e,v)表示車輛v在道路e上的行駛時間,即
te,v=toute,v-tine,v(2)
其中:tout(e,v)和tin(e,v)分別表示為車輛v進入和離開道路e的時刻,兩個相減就是車輛在路網一共行駛的時間;V(e)代表在仿真時間內經過道路e的車輛集合。
2 交通流優(yōu)化膨脹控制GP算法
2.1 GP個體編碼
GP算法是學者Koza[31]提出的一種基于種群的進化計算算法。該算法和遺傳算法類似,也是模擬自然世界中生物進化的過程。不同的是,GP算法根據達爾文的“物競天擇,適者生存”的理念自動構建出可以解決具體問題的計算機程序。GP個體一般的表現形式為樹型結構,個體由葉子節(jié)點(終端節(jié)點)和非葉子節(jié)點(操作符或函數)組成。圖2為一個GP樹的例子。它的數學表達式為:F1+0.22×F2,其中F1、F2和0.22都為葉子節(jié)點,通常為輸入的變量或者是隨機生成的常量,“+”和“×”是非葉子節(jié)點,通常為函數或者是操作符。
2.2 個體評估
本文每一個超啟發(fā)式策略都可以表示為一個GP個體h。基于該超啟發(fā)式策略h,首先計算路網中所有道路的成本值,然后基于每輛車的起始和目的地,生成每輛車移動總成本最小的路線。設每個道路e有成本C(e),路線r的總成本為它包含的所有道路e的成本總和,即
根據所有車輛的移動路線,利用式(1)仿真計算得出整體平均旅行時間,作為該GP個體h的評價值,該評價值越小越好。
2.3 GPHH總體框架
GPHH的框架如圖3所示,首先隨機初始化GP種群,每個GP個體代表一個超啟發(fā)式策略,對每個超啟發(fā)式策略進行評估,若沒有達到停止標準(例如最大迭代次數),則種群先通過錦標賽選擇出候選種群,再通過遺傳操作對新種群進行交叉、變異或復制,獲得新的個體組成新種群。算法1展示了GPHH的總體框架。
算法1 GPHH的總體框架
輸入:最大代數Gen;種群數量S。
輸出:最優(yōu)個體h。
1 根據種群數量S初始化種群pop,并且初始化初始代數Gen = 0;
2 評估pop中每一個GP個體;
3 while gen lt; Gen do
4 "使用錦標賽選擇從pop選出S個用于遺傳的親本npop;
5 "while size(newpop) lt; S do""" //newpop為這一代進化后的新種群
6 """從npop隨機選擇親本進行遺傳操作(交叉、變異、復制)產生一個新的后代并加入到新種群newpop;
7 "end
8 "評估新種群newpop里的每個個體;
9 "newpop中的個體取代原始種群pop中的個體;
10 "gen += 1;
11 end
12 從pop中找到一個適應度值最好的個體h
13 返回個體h
錦標賽選擇隨機選出S個個體,適應度值好的個體獲勝被選中。種群遺傳的交叉、變異和復制,對應于算法1中的第6行。每次遺傳時都會有三分之一的概率從三個操作選擇其中的一個執(zhí)行。具體如下:
交叉:在種群中選擇兩個個體,分別讓兩個個體的某子樹進行交換,把交換后第一個新個體作為后代。
變異:利用隨機初始化的方法生成一個GP樹,接著在種群中選擇一個個體,用新生成的GP樹代替該個體的某一個子樹,成為新的個體。
復制:在種群中隨機選擇一個個體作為后代。
3 GP控制膨脹方法
現有膨脹方法都是通過在個體評價或選擇過程中加入決策樹的一些屬性,來提高節(jié)點數目少的個體被選入下一代的概率。下面將介紹本文使用的幾個膨脹控制方法[18,21]。
3.1 LPPP
線性參數簡約壓力(linear parametric parsimony pressure,LPPP)將個體最終的適應度值g利用公式重新計算,變成與個體的原始適應度f及節(jié)點數目s有關。最常使用的方法是將個體的大小視為適應度的線性因子,公式如下:
g=xf+ys(4)
其中:x和y是預設的參數。
3.2 DT
雙錦標賽(double tournament,DT)使用兩場錦標賽對個體進行選擇,第一場為普通的錦標賽選擇,第二場為基于簡約的錦標賽選擇。第一場根據適應度值進行k場普通的錦標賽,選出k個勝者參加第二場錦標賽。第二場時,從k個晉級個體中逐次兩兩比較,節(jié)點數目小的個體有D/2的概率獲勝,最終得到優(yōu)勝的一個個體。DT多次執(zhí)行獲得多個優(yōu)勝個體。可知當D取值為2時,節(jié)點數目小的個體必勝。
DT的特點是增加第二次錦標賽使尺寸小的個體有概率獲勝而不考慮適應度值。采用DT控制膨脹時,本文算法用DT取代算法1第4行中的錦標賽選擇。
3.3 Tarpeian
Tarpeian方法的工作原理是使具有高于平均體型的個體的一部分缺乏競爭力。在評估過程之前,具有高于平均大小的GP個體有概率W被分配非常差的適應度值,大大降低了個體被選中進行遺傳的機會。
Tarpeian的特點是被賦予差適應度值的個體幾乎不能在錦標賽選擇中獲勝,除非錦標賽中其他個體都是被賦予了差適應度值。采用Tarpeian方法控制膨脹時,在算法1中的第2、8行會對種群中節(jié)點數量小于平均節(jié)點數量的個體進行評估,沒被評估的個體適應度值有W的概率直接被賦予一個非常大的數(本文賦予1030)。
3.4 Niche
基于小生境(Niche)的遺傳規(guī)劃算法是文獻[18]提出的一種控制GP膨脹的方法,它將種群在進行遺傳之前進行簡化,為每一個生態(tài)位保留一個GP樹。具體做法是基于適應度值的大小對每一個GP樹進行分類,分出不同的生態(tài)位,在每一個生態(tài)位里不同的GP樹的適應度值相同。然后每一個生態(tài)位都只保留一個GP樹節(jié)點最少的個體進行遺傳。例如圖4為兩個GP樹個體,它們的適應度值相同而節(jié)點數不同,其中樹a的節(jié)點數多于樹b,算法則會保留GP樹b,拋棄GP樹a。如果有多個個體節(jié)點最少,則保留第一個被發(fā)現的個體,然后使用簡化之后的個體進行遺傳。為了增加種群的多樣性,新種群中一半的個體是用簡化后的種群進行遺傳的,另一半使用原種群進行遺傳。
進行遺傳的GP個體從不同的生態(tài)位使用錦標賽選擇出來。但是與傳統(tǒng)錦標賽選擇不同,這里每個個體被選擇的概率和它所在的生態(tài)位的個體數目有關,個體被選擇的概率為
其中:N為生態(tài)位總數;H表示生態(tài)位i中的個體數目。式(5)通過α的值來影響每個個體被選中的概率。當α的取值在0~1逐漸增大時,個體被選擇的概率受到它所在的生態(tài)位中個體數目的影響也越大。
Niche的特點在于讓尺寸大的個體被尺寸小且適應度值相等的個體取代,精簡了種群中的基因。使用基于小生境的方法控制膨脹時,對應于算法1中的第4~8行,本文算法先對種群進行簡化得到種群ncpop,下一代的新種群有一半的個體是使用式(5)對種群ncpop遺傳得到,而另一半個體則使用普通的錦標賽選擇進行遺傳。
4 實驗
本文采用動態(tài)交通流仿真模型CBLab[27]作為交通流仿真平臺,共使用4個城市的不同規(guī)模路網進行訓練和測試。CBLab是一種高效的微觀交通模擬器。它支持對超過十萬個十字路口和一百萬輛車輛的交通系統(tǒng)進行實時模擬,具體包括模型的屬性定義、調度策略的優(yōu)化目標、模型定義的具體描述、約束條件的定義和車流量生成的策略。
在訓練階段先使用小型路網訓練出超啟發(fā)式策略,再使用更大規(guī)模的路網對超啟發(fā)式策略進行測試。仿真結束時的平均旅行時間越小代表測試的性能越好。
本文的測試結果將對比普通GPHH和加了控制膨脹方法之后訓練出來的策略,以及現有交通流調度策略。每次訓練進行5次獨立運行,訓練時的迭代圖為平均值。每個訓練出的最優(yōu)超啟發(fā)式策略在測試中獨立運行5次,策略的測試結果取平均值。
4.1 實驗數據
本文使用了中國深圳、西安、成都和重慶四個不同結構的城市道路數據進行模擬仿真,其中深圳和西安的路網為網格式結構,成都的路網為環(huán)形放射式結構,重慶的路網為自由式結構[30]。表1給出了本文測試的路網數據參數。
4.2 實驗參數設置
本文交通仿真模擬的參數和GP訓練時的函數集合和終端集合與文獻[20]的保持一致。GP的初始化方法為半生長法(ramped half-and-half)。表2為GP訓練時的參數。
4.3 四種控制膨脹的方法的參數分析
實驗中發(fā)現對于不同路網,4種控制膨脹方法的最佳參數取值近似,下面只給出采用sz50深圳路網進行訓練得到的結果。
4.3.1 LPPP
本文LPPP的實驗中y始終設置為1,通過改變式(4)中x的大小來改變節(jié)點數s帶來的影響。實驗中x的取值為[0.5,32],x的取值每一次增加1倍。x越大,s對種群遺傳的影響越小。圖5為GPHH使用LPPP之后的迭代過程。綜合平均旅行時間和平均節(jié)點數來看,x=16時表現最好。
4.3.2 DT
在本文的DT實驗中,k的值始終為5。本文只考慮參數D的取值,在實驗中取值為[1.0,2.0],每一次取值加0.2。圖6為DT下的迭代過程。綜合平均旅行時間和平均節(jié)點數來看,D=1.4時最優(yōu)。
4.3.3 Tarpeian
測試Tarpeian的參數W的影響,取值為[0.1,0.5],每次實驗增加0.1。圖7為Tarpeian下GPHH的迭代過程,綜合平均旅行時間和平均節(jié)點數來看,W取值為0.2時最好。
4.3.4 Niche
根據式(5),每個個體被選擇進行遺傳的概率與α有關,實驗測試了α的值為0、0.5、1的情況。圖8為Niche下GPHH的迭代過程。綜合平均旅行時間和平均節(jié)點數來看,α取值為0時最好。
4.4 控制膨脹方法在不同路網的結果分析
本節(jié)分析使用網格式(西安)、環(huán)形放射式(成都)和自由式(重慶)路網,并采用算法最優(yōu)參數下的GPHH算法性能,其中用于訓練的路網為xa50、cd50和cq50。基于網格式路網(xa50),圖9在最優(yōu)平均旅行時間上,LPPP、Tarpeian和Niche方法都比普通GPHH小,最好的是Niche,最優(yōu)值為316.01。在平均節(jié)點數上,普通GPHH表現最差,DT表現最好,每代平均為14.66。從表3可見,LPPP方法下的超啟發(fā)式策略的指導能力最佳,有7組數據最好,15組數據的平均值也最小,為656.47。
基于環(huán)形放射式路網(cd50),圖10在最優(yōu)平均旅行時間上,LPPP、DT和Tarpeian都比普通的GPHH小,最好的為DT,最優(yōu)值為438.02。在平均節(jié)點數上,Niche表現最差,而LPPP、DT和Tarpeian表現比普通GPHH好,其中LPPP最好,每代平均值為15.72。表4可見DT下的超啟發(fā)式策略的指導能力最佳,有8組數據最好,15組數據的平均值也最小,為627.64。
基于自由式路網(cq50),圖11在最優(yōu)平均旅行時間上,普通GPHH表現最差,最好為Niche,最優(yōu)值為274.82。在平均節(jié)點數上,Niche表現最差,而LPPP、DT和Tarpeian表現比普通GPHH好,其中LPPP最好,每代平均值為18.68。從表5可見,DT下的超啟發(fā)式策略的指導能力最佳,有14組數據最好,15組數據的平均值也最小,為836.95。
綜上所述,結合訓練和測試的結果,每個路網下表現最好的控制膨脹方法不相同。在網格式路網中,表現最好的為LPPP和DT。在環(huán)形放射式路網和自由式路網中,表現最好的是DT。
5 結束語
本文在基于遺傳規(guī)劃的城市交通流分配方法上研究了不同的控制膨脹方法,包括LPPP、DT、Tarpeian和Niche。通過應用于中國深圳、西安、成都和重慶四個不同結構的城市道路仿真,添加了膨脹控制方法的遺傳規(guī)劃算法,有助于生成規(guī)模更小且性能更優(yōu)的超啟發(fā)式策略。研究了在不同結構的路網下,控制膨脹方法的優(yōu)化性能,并總結出不同類型路網上的最佳膨脹控制方法。在未來的工作里,將進一步研究控制膨脹方法在GPHH上的優(yōu)化,找到一個在不同路網的訓練中都能擁有最佳優(yōu)化能力的方法。
參考文獻:
[1]邵政熙, 陳繼鋒. 城市智能交通系統(tǒng)發(fā)展模式探析[J]. 智能城市, 2023, 9(11): 26-29. (Shao Zhengxi, Chen Jifeng. Analysis on the development mode of urban intelligent transportation system[J]. Intelligent City, 2023, 9(11): 26-29.)
[2]Wardrop J G. Some theoretical aspects of road traffic research[J].Proceedings of the Institution of Civil Engineers, 1952,1(3): 325-362.
[3]Merchant D K, Nemhauser G L. A model and an algorithm for the dynamic traffic assignment problems[J]. Transportation Science, 1978, 12(3): 183-199.
[4]Al-Sahaf H, Bi Ying, Chen Qi,et al. A survey on evolutionary machine learning[J]. Journal of the Royal Society of New Zea-land, 2019, 49(2): 205-228.
[5]Tsang Y P, Mo D Y, Chung K T, et al.Solving capacitated and time-constrained vehicle routing problems by deep reinforcement learning-based method[C]// Proc of IEEE International Conference on Industrial Engineering and Engineering Management. Piscataway, NJ: IEEE Press, 2023: 1578-1582.
[6]Min M, Lee J, Lim S. Effective evacuation route planning algorithms by updating earliest arrival time of multiple paths[C]// Proc of the 3rd ACM SIGSPATIAL International Workshop on Mobile Geographic Information Systems. New York: ACM Press, 2014: 8-17.
[7]Yang Xiaoxia, Zhang Rui, Li Yongxing, et al.Passenger evacuation path planning in subway station under multiple fires based on multiobjective robust optimization[J]. IEEE Trans on Intelligent Transportation Systems, 2022, 23(11): 21915-21931.
[8]王清永, 曲偉強. 基于線性規(guī)劃的城市軌道交通運行調度優(yōu)化算法[J]. 吉林大學學報: 工學版, 2023, 53(12): 3446-3451. (Wang Qingyong, Qu Weiqiang. Optimization algorithm of urban rail transit operation scheduling based on linear programming[J]. Journal of Jilin University: Engineering and Technology Edition, 2023, 53(12): 3446-3451.)
[9]Pasquale C, Sacone S, Siri S,et al. Optimal control for reducing congestion and improving safety in freeway systems[J]. IEEE Trans on Intelligent Transportation Systems, 2018, 19(11): 3613-3625
[10]謝仕煒, 陳鎧悅, 張亞超, 等. 考慮需求彈性的電力-交通網絡雙層博弈模型——基于擬變分不等式[J]. 中國電機工程學報, 2024, 44(6): 2185-2197. (Xie Shiwei, Chen Kaiyue, Zhang Yachao, et al. A two-layer game model for power-transportation coupled networks considering demand elasticity—based on quasi-variational inequalities[J]. Proceedings of the CSEE, 2024, 44(6): 2185-2197.)
[11]毛天露, 王華, 康星辰, 等. 復雜路網內大規(guī)模車輛運動的仿真[J]. 計算機學報, 2017,40(11): 2466-2477. (Mao Tianlu, Wan Hua, Kang Xingchen, et al. Simulating large-scale traffic in complex networks[J]. Chinese Journal of Computers, 2017,40(11): 2466-2477.)
[12]Müller E R, Carlson R C, Kraus W,et al. Microsimulation analysis of practical aspects of traffic control with variable speed limits[J]. IEEE Trans on Intelligent Transportation Systems, 2015, 16(1): 512-523.
[13]M. Van Aerde amp; Assoc., Ltd. Integration release 2.30 for windows user’s guide, volume I: fundamental model features[EB/OL]. (2005-05). http://tis.unical.it/download/guide/manuale_int_1.pdf.
[14]夏英, 石梔琦. 面向交通流量預測的多頭注意力時空卷積圖網絡模型[J]. 計算機應用研究, 2023, 40(3): 766-770. (Xia Ying, Shi Zhiqi. Multi-head attention spatio-temporal convolutional graph network for traffic flow prediction[J]. Application Research of Computers, 2023, 40(3): 766-770.)
[15]翟子洋, 郝茹茹, 董世浩. 大規(guī)模智慧交通信號控制中的強化學習和深度強化學習方法綜述[J]. 計算機應用研究, 2024, 41(6): 1618-1627. (Zhai Ziyang, Hao Ruru, Dong Shihao. Review of reinforcement learning and deep reinforcement learning methods in large-scale intelligent traffic signal control[J]. Application Research of Computers, 2024, 41(6): 1618-1627.)
[16]Bui K H N, Jung J J.ACO-based dynamic decision making for connected vehicles in IoT system[J]. IEEE Trans on Industrial Informatics, 2019, 15(10): 5648-5655.
[17]Zhang Lizong, Alharbe N R, Luo Guangchun, et al.A hybrid forecasting framework based on support vector regression with a modified genetic algorithm and a random forest for traffic flow prediction[J]. Tsinghua Science and Technology, 2018, 23(4): 479-492.
[18]Wang Shaolin, Mei Yi, Zhang Mengjie, et al.Genetic programming with niching for uncertain capacitated arc routing problem [J]. IEEE Trans on Evolutionary Computation, 2022, 26(1): 73-87.
[19]Yao Yuan, Peng Zhe, Xiao Bin. Parallel hyper-heuristic algorithm for multi-objective route planning in a smart city [J]. IEEE Trans on Vehicular Technology, 2018, 67(11): 10307-10318.
[20]Hu X M, Duan Y H, Li Min, et al.Hyper-heuristic algorithm for urban traffic flow optimization [C]// Proc of the 15th International Conference on Advanced Computational Intelligence. Piscataway, NJ: IEEE Press, 2023: 1-7.
[21]Luke S, Panait L. A comparison of bloat control methods for genetic programming[J].Evolutionary Computation, 2006, 14(3): 309-344.
[22]Javed N, Gobet F, Lane P. Simplification of genetic programs: a literature survey[J]. Data Mining and Knowledge Discovery, 2022, 36(4): 1279-1300.
[23]Wang Shaolin, Mei Yi, Zhang Mengjie.A multi-objective genetic programming algorithm with α dominance and archive for uncertain capacitated arc routing problem [J]. IEEE Trans on Evolutionary Computation, 2023, 27(6): 1633-1647.
[24]Raymond C, Chen Qi, Xue Bing, et al. Learning symbolic model-agnostic loss functions via meta-learning [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2023, 45(11): 13699-13714.
[25]Javed N, Gobet F, Hung C,et al. On-the-fly simplification of genetic programming models[C]// Proc of the 36th Annual ACM Symposium on Applied Computing." New York: ACM Press, 2021: 464-471.
[26]Song A, Chen Dunhai, Zhang Mengjie. Contribution based bloat control in genetic programming[C]// Proc of IEEE Congress on Evolutionary Computation. Piscataway, NJ: IEEE Press, 2010: 1-8.
[27]CBLab. Welcome to the CBLab documentation [EB/OL]. (2022). https://cblab-documentation.readthedocs.io/en/latest/index.html.
[28]Du Lun, Song Guojie, Wang Yiming, et al.Traffic events oriented dynamic traffic assignment model for expressway network: a network flow approach[J]. IEEE Intelligent Transportation Systems Magazine, 2018, 10(1): 107-120.
[29]Lu Jiawei, Zhou Xuesong. Virtual track networks: a hierarchical modeling framework and open-source tools for simplified and efficient connected and automated mobility (CAM) system design based on general modeling network specification (GMNS)[J]. Transportation Research Part C: Emerging Technologies, 2023, 153: 104223.
[30]Gao He, Feng Shumin, Guo Caixiang. Research on selection method of urban road network structure form[C]// Proc of WASE International Conference on Information Engineering. Piscataway, NJ: IEEE Press, 2010: 360-364.
[31]Koza J R. Genetic programming: on the programming of computers by means of natural selection[M]. Cambridge, MA: MIT Press, 1992.