李仲興,沈安誠,江 洪
(1.江蘇大學(xué)汽車與交通學(xué)院,鎮(zhèn)江 212013; 2.江蘇大學(xué)機(jī)械工程學(xué)院,鎮(zhèn)江 212013)
20世紀(jì)80年代,電子技術(shù)被應(yīng)用于汽車空氣懸架系統(tǒng),至此電控空氣懸架系統(tǒng)(electronic-controlled air suspension system)受到了廣泛的關(guān)注[1]。電控空氣懸架可以根據(jù)當(dāng)前行駛工況再結(jié)合駕駛員意圖,實(shí)現(xiàn)車身高度的自適應(yīng)調(diào)節(jié)[2]。當(dāng)車輛以不同的車速行駛在不同等級(jí)的路面上時(shí),通過調(diào)整車身高度來改善車輛行駛平順性、操縱穩(wěn)定性和燃油經(jīng)濟(jì)性[3]。橫向互聯(lián)空氣懸架作為空氣懸架的一種衍生結(jié)構(gòu),是將傳統(tǒng)空氣懸架中左右相鄰的空氣彈簧用氣動(dòng)管路相連通。當(dāng)車輛受到路面沖擊時(shí),互聯(lián)空氣彈簧間發(fā)生氣體交換,可起到緩和路面沖擊、保持車身姿態(tài)的作用[4-6]。
作為分布式人工智能的重要分支,多智能體系統(tǒng)(multi-agents system,MAS)由于其自治性與學(xué)習(xí)性為建立電控空氣懸架控制系統(tǒng)提供了新的思路[7]。近年來,多智能體系統(tǒng)被應(yīng)用于信息的采集與分享、交通信號(hào)管理、智能電網(wǎng)等多個(gè)領(lǐng)域[8-10]。多智能體系統(tǒng)中,各智能體之間如何彼此協(xié)調(diào),并行求解成為研究的重點(diǎn)和難點(diǎn)。博弈論被用于解決理性主體間的沖突與合作問題[11]。在多智能體系統(tǒng)中利用博弈理論,分析不同智能體的利益追求以及可能達(dá)到的利益均衡關(guān)系,實(shí)現(xiàn)各智能體間的相互協(xié)調(diào)與合作。
目前國內(nèi)外學(xué)者對車輛車身高度與互聯(lián)狀態(tài)的單獨(dú)特性研究較多,沒有考慮兩者之間的協(xié)同關(guān)系。對此本文中構(gòu)建了一種電控空氣懸架多智能體博弈控制系統(tǒng),該系統(tǒng)由信息采集智能體、車身高度控制智能體、互聯(lián)狀態(tài)控制智能體和博弈智能體構(gòu)成。能夠在不同行駛工況下進(jìn)行自主學(xué)習(xí),協(xié)調(diào)車輛行駛平順性與操縱穩(wěn)定性之間的矛盾,提升整車綜合性能。
參照試驗(yàn)樣車,建立前后軸都使用非獨(dú)立懸架的整車模型,該模型具有車身側(cè)傾運(yùn)動(dòng)、車身俯仰運(yùn)動(dòng)、質(zhì)心處垂向運(yùn)動(dòng)和4個(gè)車輪處垂向運(yùn)動(dòng)共7個(gè)自由度,簡化后的整車物理模型如圖1所示。

圖1 簡化的非獨(dú)立懸架整車物理模型
其動(dòng)力學(xué)方程為

式中:Mb為簧上質(zhì)量;Zcg為簧上質(zhì)量質(zhì)心處的垂向位移;θ、φ分別為車身側(cè)傾角和俯仰角;lf、lr分別為簧上質(zhì)量質(zhì)心到前后軸水平方向的距離;Ir、Ip分別為側(cè)傾運(yùn)動(dòng)時(shí)的轉(zhuǎn)動(dòng)慣量與俯仰運(yùn)動(dòng)時(shí)的轉(zhuǎn)動(dòng)慣量;F1、F2、F3、F4分別對應(yīng) 4個(gè)懸架力。
模型中把空氣彈簧視為變質(zhì)量開口絕熱系統(tǒng),其內(nèi)部氣體運(yùn)動(dòng)方程為

式中:const為常數(shù);pi、p0為空氣彈簧瞬時(shí)氣壓與初始?xì)鈮海籚i、V0為空氣彈簧瞬時(shí)體積與初始體積;mi、m0為空氣彈簧瞬時(shí)質(zhì)量與初始質(zhì)量;κ為等熵指數(shù)。
在互聯(lián)管路模型中,將互聯(lián)管路視為節(jié)流小孔,考慮其節(jié)流效應(yīng)質(zhì)量流量為

式中:pup、pdn為上游與下游氣體的絕對壓力;At為有效流通面積;R為氣體常數(shù)。
考慮互聯(lián)管路的時(shí)滯效應(yīng),管路中不同位置處的質(zhì)量流量為

式中:L為互聯(lián)管路的長度;pdn、Tdn為互聯(lián)管路下游氣壓和溫度;RT為互聯(lián)管路阻力系數(shù);c為聲速。
為滿足后續(xù)研究需求,搭建適用于試驗(yàn)樣車的整車信號(hào)采集系統(tǒng),驗(yàn)證所建立仿真模型的準(zhǔn)確性。由加速度采集模塊采集車輛4個(gè)空氣彈簧處簧上、簧下質(zhì)量的三軸加速度信息,由陀螺儀模塊采集前后軸中間位置處的側(cè)傾角信息,各模塊將采集到的信息發(fā)送至CAN總線上,再由CAN分析儀傳送到上位機(jī)中,并進(jìn)行后續(xù)處理。試驗(yàn)樣車與信息采集系統(tǒng)如圖2所示。

圖2 試驗(yàn)樣車與信息采集系統(tǒng)
通過對比車輛經(jīng)過減速帶時(shí)簧上、簧下質(zhì)量垂向加速度來驗(yàn)證車身、輪胎的垂向振動(dòng)特性。通過對比車身側(cè)傾角速度自由衰減信號(hào)來驗(yàn)證車身側(cè)傾運(yùn)動(dòng)特性。試驗(yàn)與仿真對比結(jié)果如圖3和圖4所示。

圖3 前左簧上質(zhì)量以及簧下質(zhì)量垂向加速度對比

圖4 側(cè)傾角速度對比
從圖中可以看出,仿真和試驗(yàn)中,車輛前左簧上質(zhì)量和簧下質(zhì)量的垂向加速度響應(yīng)曲線的振動(dòng)幅值變化趨勢較為一致。相比于試驗(yàn)曲線,仿真曲線較為平滑,這是因?yàn)榉抡婺P秃雎粤藢?shí)際懸架中存在的連接件、傳感器噪聲和發(fā)動(dòng)機(jī)振動(dòng)等因素的影響。試驗(yàn)與仿真中的側(cè)傾角速度自由衰減曲線的幅值、周期基本一致,這說明模型與實(shí)車的側(cè)傾角振動(dòng)頻率基本一致。建立的整車動(dòng)力學(xué)模型可較為準(zhǔn)確地反映試驗(yàn)樣車的車身、車輪垂向運(yùn)動(dòng)狀態(tài)和車身側(cè)傾運(yùn)動(dòng)狀態(tài)。因此,可以此模型作為研究基礎(chǔ),展開后續(xù)的研究工作。
電控空氣懸架多智能體博弈控制系統(tǒng)能夠感知車輛當(dāng)前的行駛工況,控制車輛車身高度與互聯(lián)狀態(tài),保證車輛行駛平順性與操縱穩(wěn)定性,提升整車綜合性能。系統(tǒng)結(jié)構(gòu)如圖5所示。

圖5 電控空氣懸架多智能體博弈控制系統(tǒng)結(jié)構(gòu)圖
多智能體博弈控制系統(tǒng)包括信息采集智能體、車身高度控制智能體、互聯(lián)狀態(tài)控制智能體和博弈智能體。其結(jié)構(gòu)自上而下分為信息發(fā)布層、數(shù)據(jù)處理層、最終決策層。信息發(fā)布層中的信息采集智能體從環(huán)境中感知當(dāng)前車輛運(yùn)行狀態(tài)和行駛工況,并結(jié)合下層智能體需求將采集到的信息經(jīng)過處理后發(fā)布到數(shù)據(jù)處理層。數(shù)據(jù)處理層中的車身高度控制智能體和互聯(lián)狀態(tài)控制智能體讀取發(fā)布的信息,計(jì)算符合當(dāng)前工況的置回區(qū)間和目標(biāo)車身高度,將其發(fā)送到最終決策層。最終決策層中的博弈智能體接收上層信息,計(jì)算預(yù)期回報(bào)進(jìn)行博弈,得出最終決策。系統(tǒng)在車輛運(yùn)行過程中,不斷學(xué)習(xí),完善自身知識(shí)庫,逐漸將整車綜合性能提升至最優(yōu)。
信息采集智能體的主要作用是車輛運(yùn)行狀態(tài)與行駛工況信息的采集與處理并將信息發(fā)送至數(shù)據(jù)處理層中。其功能相對簡單,因此采用反應(yīng)型智能體模型,模型結(jié)構(gòu)如圖6所示。

圖6 信息采集智能體模型
該智能體通過傳感器采集車輛車速信息v,簧下質(zhì)量加速度信息at、車身側(cè)傾角信息θ、車身側(cè)向加速度信息ays、車身前左簧上質(zhì)量三軸加速度信息axw、ayw、azw以及車身高度信息H,通過讀取系統(tǒng)內(nèi)部信息,采集當(dāng)前滯回區(qū)間δ。
由簧下質(zhì)量加速度和車速計(jì)算出行駛路面的路面不平度 Gd(n0)[12]。參考 GB/T 4971—2009《汽車平順性試驗(yàn)方法》,近似計(jì)算駕駛員位置處的總加權(quán)加速度均方根值aw。根據(jù)車身側(cè)傾角和車身側(cè)向加速度,計(jì)算側(cè)傾因子 R[13]。
綜合考慮系統(tǒng)計(jì)算量與后續(xù)智能體學(xué)習(xí)行為建模需求,將車速信息v、車身側(cè)向加速度信息ays進(jìn)行離散化,將車速劃分為5個(gè)等級(jí),以S1…Si…S5表示當(dāng)前車速所處區(qū)間等級(jí);將側(cè)向加速度分為4個(gè)等級(jí),以G1…Gi…G4表示當(dāng)前側(cè)向加速度所處區(qū)間等級(jí)。參考GB 7031—2005《機(jī)械振動(dòng)道路路面譜測量數(shù)據(jù)報(bào)告》,將路面分為5個(gè)等級(jí),其中以L1…Li…L5表示當(dāng)前路面等級(jí)。將得到的 aw、R、Si、Gi、Li、H、δ發(fā)送至數(shù)據(jù)處理層。信息采集智能體對傳感器信息作了統(tǒng)一化處理,減輕了其余智能體的運(yùn)算負(fù)擔(dān),提升整體系統(tǒng)的運(yùn)算效率。
車身高度控制智能體以目標(biāo)車身高度為控制對象,以整車綜合性能最優(yōu)為控制目標(biāo),為博弈智能體提供輸入。該智能體需要具有自主學(xué)習(xí)能力和對動(dòng)態(tài)環(huán)境的自適應(yīng)能力,因此采用智能程度較高的混合式智能體結(jié)構(gòu) 過程推理系統(tǒng)(procedural reasoning system,PRS),智能體模型結(jié)構(gòu)如圖7所示。

圖7 車身高度控制智能體模型

(1)“信念”:信念表示智能體對環(huán)境和自身的認(rèn)知。在車身高度控制智能體中,信念為接收信息、采集智能體傳輸?shù)男畔⒉⒋嫒胄拍罹仃嚒\嚿砀叨瓤刂浦悄荏w接收信息采集智能體傳輸?shù)男畔w、R、Si、Gi、Li、H。對車身高度信息 H進(jìn)行分級(jí)處理,用Hi代表當(dāng)前實(shí)際車身高度等級(jí)。以 Si、Gi、Li、Hi為環(huán)境狀態(tài)坐標(biāo),以時(shí)間段t為動(dòng)態(tài)坐標(biāo)建立信念矩陣RChaw和RChr,分別用來存儲(chǔ)t時(shí)間段內(nèi)行駛平順性評(píng)價(jià)指標(biāo)aw的均值和操縱穩(wěn)定性評(píng)價(jià)指標(biāo)R的均值。
(2)“愿望”:愿望是智能體希望自身達(dá)到或者保持的狀態(tài)。車身高度控制智能體的愿望為提升整車綜合性能至最優(yōu)。為達(dá)成這一愿望,建立愿望矩陣Zh,計(jì)算當(dāng)前整車綜合性能評(píng)價(jià)指標(biāo)JHt。以Si、Gi、Li、Hi為坐標(biāo),迭代生成 JHnew,更新愿望矩陣。具體公式如下。

式中:K為到目前為止的總決策次數(shù);k為目前決策項(xiàng)被選擇的次數(shù)。
為解決橫向互聯(lián)空氣懸架在急速轉(zhuǎn)彎時(shí)車身側(cè)傾加劇的問題,2017年琚龍玉提出了一種仿天棚互聯(lián)狀態(tài)控制策略[12]。利用簧下質(zhì)量側(cè)傾角θt和簧上質(zhì)量側(cè)傾角θ的差值表示車身所受總回復(fù)力矩方向,控制策略為

式中:max(RChaw(Si,Gi,Li,Hi))為矩陣 RChaw中 Si,Gi,Li,Hi坐標(biāo)下所有樣本數(shù)據(jù)的最大值;ω為操穩(wěn)平順修正系數(shù),ω∈(0,1);ρ為更新權(quán)重系數(shù),ρ∈(0,1)。
(3)“意圖”:意圖是為達(dá)成愿望所需要執(zhí)行的動(dòng)作,對于車身高度控制智能體而言,其意圖是將解釋器和規(guī)劃共同決策出的目標(biāo)車身高度傳輸給博弈智能體。
(4)“規(guī)劃”:規(guī)劃是智能體為達(dá)成愿望所能采取的所有動(dòng)作序列,在不同的信念下,規(guī)劃也不盡相同。在車身高度控制智能體中,把車身調(diào)節(jié)至不同的既定高度是該智能體的規(guī)劃。
(5)“解釋器”:解釋器連通智能體中其余模型,在規(guī)劃中找出適合當(dāng)前信念并且能夠達(dá)成頂層愿望的動(dòng)作發(fā)送給意圖。車身高度控制智能體中,解釋器利用強(qiáng)化學(xué)習(xí)方法對每個(gè)動(dòng)作進(jìn)行交替探索和利用,直至系統(tǒng)穩(wěn)定。由于備選動(dòng)作個(gè)數(shù)較少,各動(dòng)作間對整車性能造成的差異較小,因此采用較為保守、嘗試次數(shù)較多的信心上界算法(upper confidence bound,UCB)計(jì)算當(dāng)前車身高度下的收益Qh。
式中:krollmax代表互聯(lián)狀態(tài)關(guān)閉;krollmin代表互聯(lián)狀態(tài)開啟。
為避免在高頻小幅激勵(lì)下,互聯(lián)狀態(tài)切換過于頻繁,設(shè)置滯回區(qū)間(δmin,δmax),利用互聯(lián)管路有效流通面積At代替互聯(lián)狀態(tài),控制策略變形為

在仿天棚互聯(lián)狀態(tài)控制策略中滯回區(qū)間的選擇影響著策略控制品質(zhì)。互聯(lián)狀態(tài)控制智能體利用混合式智能體PRS架構(gòu)結(jié)合SoftMax強(qiáng)化學(xué)習(xí)算法計(jì)算出最適合當(dāng)前工況下的滯回區(qū)間。其中5個(gè)關(guān)鍵模塊具體工作如下。
(1)“信念”:接收信息采集智能體傳輸?shù)腶w、R、Si、Gi、Li、δ信息,對 δ的上下界 δmin、δmax分別進(jìn)行分級(jí)處理,以Kh和Kl分別表示δmin與δmax所處區(qū)間等級(jí)。以 Si、Gi、Li、Kh、Kl、t為坐標(biāo)建立信念矩陣RCinaw和 RCinr存放 aw、R值。
(2)“愿望”:以整車綜合性能最優(yōu)為控制目標(biāo),計(jì)算當(dāng)前綜合性能評(píng)價(jià)指標(biāo)JInew,更新愿望矩陣Zin,計(jì)算公式如下。

式中:γ為操穩(wěn)平順修正系數(shù);ρ為更新權(quán)重系數(shù)。
(3)“規(guī)劃”:規(guī)劃中存放著15個(gè)智能體動(dòng)作,不同的4個(gè)置回區(qū)間上界和下界排列組合,構(gòu)成所有動(dòng)作目標(biāo),將置回區(qū)間調(diào)整至理想目標(biāo)。建立規(guī)劃庫HSin,存放不同狀態(tài)、不同滯回區(qū)間等級(jí)下的收益Qin。
(4)“解釋器”:由于備選規(guī)劃中存放的動(dòng)作較多,為了與車高控制智能體的求解效率相匹配,選擇探索次數(shù)相對較少,收斂速度較快的SoftMax算法,計(jì)算當(dāng)前滯回區(qū)間下的收益Qin。

式中:T為溫度系數(shù),T的大小決定每個(gè)動(dòng)作被選中的概率的差別;HSin(Si,Gi,Li,k)表示規(guī)劃庫中 Si,Gi,Li,k坐標(biāo)下的收益值。
(5)“意圖”:從規(guī)劃庫中選擇收益值最大的置回區(qū)間,發(fā)送給博弈智能體。
因?yàn)榛ヂ?lián)狀態(tài)控制智能體與車身高度控制智能體均只考慮自身控制性能,輸出的目標(biāo)車身高度和置回區(qū)間并不能相互契合保證整車的綜合性能最優(yōu),故以協(xié)調(diào)車身高度和置回區(qū)間為目標(biāo),從博弈論的觀點(diǎn)出發(fā),根據(jù)多人隨機(jī)博弈理論,提出一種多智能體博弈方法,均衡兩個(gè)智能體在聯(lián)盟中的回報(bào),從而求解出全局納什均衡解。該智能體采用BDI架構(gòu),模型如圖8所示。

圖8 博弈智能體模型
(1)“信念庫”:將車身高度控制智能體得出的目標(biāo)車身高度向兩邊等區(qū)域拓展,選取拓展后的兩個(gè)邊界值作為博弈中玩家1的兩個(gè)行為n1、n2。將互聯(lián)控制智能體得出的置回區(qū)間向下界進(jìn)行單邊拓展,得出玩家2的兩個(gè)行為m1、m2。
(2)“愿望庫”:通過隨機(jī)博弈,協(xié)同控制車身高度與互聯(lián)狀態(tài),平衡簧上質(zhì)量振動(dòng)和車身側(cè)傾。
(3)“意圖庫”:存放當(dāng)前狀態(tài)下系統(tǒng)的納什均衡解。
(4)“推理器”:采用隨機(jī)博弈分支下的雙人雙矩陣博弈構(gòu)造博弈推理器,通過Lemke-Howson算法求解雙人博弈的納什均衡解,以此解作為權(quán)重系數(shù)分配玩家的兩個(gè)行為,從而確定出最優(yōu)目標(biāo)車身高度Hrequire和最優(yōu)置回區(qū)間δrequire。
構(gòu)建玩家1回報(bào)矩陣A,設(shè)置玩家1的回報(bào)函數(shù)如下:

式中awij代表玩家1執(zhí)行動(dòng)作i、玩家2執(zhí)行動(dòng)作j時(shí)的加權(quán)加速度均方根值。
構(gòu)建玩家2回報(bào)矩陣B,設(shè)置玩家2的回報(bào)函數(shù)如下:

式中θ為簧上質(zhì)量側(cè)傾角。
計(jì)算兩個(gè)玩家的預(yù)期回報(bào),并根據(jù)式(13)求解當(dāng)前工況下的納什均衡解。

式中:x0為玩家1的動(dòng)作權(quán)重系數(shù);y0為玩家2的動(dòng)作權(quán)重系數(shù);x為任意權(quán)重系數(shù)。
博弈智能體中,納什均衡的求解時(shí)間極大的影響著整個(gè)系統(tǒng)的收斂速度,利用Lemke-Howson算法,能夠較快的求解出多人隨機(jī)博弈中的納什均衡解,該方法應(yīng)用于雙人雙矩陣博弈中,求解速度快,求解精度符合系統(tǒng)要求。基于隨機(jī)博弈Lemke-Howson算法的數(shù)學(xué)模型為

為驗(yàn)證電控空氣懸架多智能體博弈控制系統(tǒng)中車身高度控制智能體和互聯(lián)狀態(tài)控制智能體學(xué)習(xí)行為的有效性,在“256×10-6m-3路面不平度系數(shù)、60 km·h-1車速”的工況下進(jìn)行仿真。圖9為學(xué)習(xí)過程中車身高度控制智能體所有意圖的選擇次數(shù)統(tǒng)計(jì)。圖10為學(xué)習(xí)過程中互聯(lián)狀態(tài)控制智能體所有意圖的選擇次數(shù)統(tǒng)計(jì)。

圖9 車身高度控制智能體意圖選擇次數(shù)統(tǒng)計(jì)
由圖9中可以看出,車身高度智能體中7個(gè)意圖的執(zhí)行次數(shù)存在明顯的差異性,意圖1和意圖2的選擇次數(shù)較少,意圖3的選擇次數(shù)最多,意圖4到意圖7的選擇次數(shù)呈階梯式下降。這是由于當(dāng)車身高度較低時(shí),車身撞擊限位塊的概率增加,導(dǎo)致行駛平順性較差,當(dāng)車身高度升高時(shí),車身質(zhì)心上移,車輛操縱穩(wěn)定性有所降低,為保持平順性與操穩(wěn)性的均衡,選擇意圖3符合智能體的愿望需求,車身高度控制智能體的學(xué)習(xí)性能達(dá)到預(yù)期。由圖10可以看出,意圖13的選擇次數(shù)較多,其余意圖的選擇次數(shù)相近,這是由于在標(biāo)準(zhǔn)化的過程中,使用了Z-score的方法,該方法會(huì)放大最優(yōu)意圖與其余意圖之間的差距,使得最優(yōu)意圖尤為突出。

圖10 互聯(lián)狀態(tài)控制智能體意圖選擇次數(shù)統(tǒng)計(jì)
為進(jìn)一步確定車身高度控制智能體與互聯(lián)狀態(tài)控制智能體學(xué)習(xí)結(jié)果的適用性,驗(yàn)證博弈智能體所選納什均衡解的合理性,對車輛的行駛平順性和操縱穩(wěn)定性在此工況下與普通空氣懸架進(jìn)行對比。為保證仿真曲線清晰,圖11展示前20 s的仿真情況。

圖11 行駛平順性與操縱穩(wěn)定性對比
從圖中可以看出,在多智能體博弈控制系統(tǒng)的控制下,車輛的加權(quán)加速度均方根值和側(cè)傾因子在數(shù)值上都有明顯的降低,說明多智能體博弈控制系統(tǒng)得出的最優(yōu)置回區(qū)間和最優(yōu)車身高度具有一定的適用性,對提升車輛整體性能有益。
為進(jìn)一步驗(yàn)證電控空氣懸架多智能體博弈控制系統(tǒng)的控制效果,在混合工況下進(jìn)行仿真,比較傳統(tǒng)空氣懸架車輛和裝有多智能體博弈控制系統(tǒng)車輛的性能指標(biāo)。圖12為混合工況的路面等級(jí)、車速和側(cè)向加速度隨時(shí)間的變化情況。圖13表示不同工況下的平均加權(quán)加速度均方根值和平均側(cè)傾因子。表1表示混合工況中直線行駛工況下兩種車輛性能對比。表2表示混合工況中轉(zhuǎn)彎工況下兩種車輛性能對比。表3表示混合工況下兩種車輛性能對比。

圖12 混合工況

圖13 不同工況下平均加權(quán)加速度均方根值和平均側(cè)傾因子
根據(jù)圖13可知,裝有電控空氣懸架多智能體博弈控制系統(tǒng)的車輛在不同車速下直線行駛時(shí),車輛的加權(quán)加速度均方根值和側(cè)傾因子都低于普通空氣懸架,車輛的行駛平順性與操縱穩(wěn)定性都有所提高。在轉(zhuǎn)彎工況下,車輛犧牲了部分行駛平順性用來提高操縱穩(wěn)定性,這是由于互聯(lián)開啟會(huì)加劇車輛的側(cè)傾,車身更加頻繁地撞擊限位塊,若是通過提高車身高度來提升舒適性又會(huì)進(jìn)一步加劇車身側(cè)傾,為保證車輛可控,需要增加互聯(lián)關(guān)閉時(shí)間并將車身高度適度降低,車輛平順性不可避免地有所下降。由表1~表3可以看出,在直線行駛工況下車輛行駛平順行改善率為7.77%,車輛操縱穩(wěn)定性改善率為17.87%。在轉(zhuǎn)彎工況下,犧牲2.36%的行駛平順性提升了6.67%的操縱穩(wěn)定性。從整體上講,該系統(tǒng)提升了車輛的綜合性能,在提升操縱穩(wěn)定性方面,效果較為突出。

表1 直線行駛工況下兩種車輛性能指標(biāo)

表2 轉(zhuǎn)彎工況下兩種車輛性能指標(biāo)

表3 混合工況下兩種車輛性能指標(biāo)
基于多智能體模型,通過隨機(jī)博弈協(xié)同車輛互聯(lián)狀態(tài)和車身高度調(diào)節(jié),搭建電控空氣懸架多智能體博弈控制系統(tǒng)。該系統(tǒng)能夠感知車輛行駛環(huán)境,學(xué)習(xí)并完善自身知識(shí)庫,動(dòng)態(tài)調(diào)整自身運(yùn)行狀態(tài)。
通過單一工況驗(yàn)證了系統(tǒng)學(xué)習(xí)行為的有效性和學(xué)習(xí)結(jié)果的適用性。通過混合工況仿真驗(yàn)證系統(tǒng)的控制效果,與傳統(tǒng)的空氣懸架相比,車輛行駛平順性改善了2.7%,車輛的操縱穩(wěn)定性改善了12.27%。
當(dāng)各智能體數(shù)據(jù)庫完善,系統(tǒng)輸出穩(wěn)定時(shí),綜合考慮傳感器的采樣頻率和ECU的計(jì)算能力,系統(tǒng)能夠在0.8 s內(nèi)計(jì)算出最優(yōu)車身高度和滯回區(qū)間,有較好的實(shí)時(shí)性且具備應(yīng)對突發(fā)事件的能力。
但在數(shù)據(jù)庫完善過程中,由于算法的探索行為會(huì)導(dǎo)致車輛綜合性能產(chǎn)生較大波動(dòng),下一步要深度挖掘各工況下智能體選擇行為的內(nèi)在聯(lián)系,設(shè)置選擇閾值,減少錯(cuò)誤行為的選擇概率,使綜合性能平穩(wěn)提升。