曹 江 萬 欣 張程熙 付敏雪 郝世聰
(1. 中車青島四方機車車輛股份有限公司, 266111, 青島;2. 北京交通大學電子信息工程學院, 100044, 北京∥第一作者, 高級工程師)
列車運行速度曲線優化是一種能夠有效降低列車運行能耗的方法。文獻 [1-3]給出了列車駕駛策略節能優化的數學模型,并使用PMP(龐特里亞金極大值原理)分析最優條件。文獻[4]對列車節能運行優化的求解算法進行了對比分析。文獻[5]采用MOPSO(多目標粒子群優化)建立了以牽引能耗、準點率及精確停車為目標的優化模型。文獻[6]考慮了中間目標點的到達時間,并提出了一種改進的MOPSO。上述文獻僅考慮列車運行速度曲線優化本身的數學問題,或ATO(列車自動運行)控制場景下的優化問題,對于人工駕駛場景下輔助司機完成駕駛的需求考慮不足。
即使是優秀的司機,在生理、心理和外部環境因素的影響下,也可能在駕駛過程中做出不當行為,可能會對列車運行指標產生潛在的不利影響。在鐵路領域,司機的行為主要通過生理反應信號進行分析,不受運行線路或駕駛環境的限制。文獻[7]通過仿真量化了警覺性、反應時間、列車超速、緊急制動和疲勞程度之間的關系。文獻 [8]開發了UMD(統一司機行為)模型并在不同類別的駕駛模擬器中對其進行了驗證。文獻[9]利用人因技術分析了司機對列車運行安全的影響及其機理。此外,大部分文獻將列車運行速度曲線作為優化列車駕駛策略的最終形式,但此種形式可能不適合司機理解和實施。結合智能方法,優化考慮司機行為的列車運行速度曲線,提高人工駕駛場景下的準點率、舒適性以及節能性,完善人機協同共駕技術,仍然是值得研究的問題。
為了進一步結合人工駕駛場景對列車運行速度曲線進行優化,提出了考慮司機行為的列車運行曲線優化方法。構建了列車運行速度曲線優化模型。對列車實際駕駛場景和司機行為習慣進行了調研,建立了列車動力學模型和考慮動態損耗的列車運行能耗模型,并確定了生成駕駛建議的原則。在此基礎上,應用AG-MOPSO(自適應網格-多目標粒子群優化)算法對列車運行速度曲線進行了優化。提出了一種駕駛建議生成方法,對所提方法的優化效果和結果進行分析,并引入UMD模型構建了閉環仿真環境,以完成人在此環境下對優化效果的分析。
本文構建了考慮動態損耗的列車運行能耗模型,介紹了人工駕駛特點及實際操作方法,并確定了生成駕駛建議的原則。
列車運行能耗的精確計算是列車運行節能優化的基礎。考慮牽引系統動態損耗與列車運行狀態的關系,定義了列車運行能耗函數。
(1)
式中:
J——列車運行能耗;
ηa(v,F)、ηb(v,B)——表示列車傳動系統在牽引工況和再生制動工況下的總效率;
F(v)、B(v)——表示列車牽引力和制動力;
v——列車運行速度;
t——時間;
tw——總運行時間。
在CR400AF型動車組中,司機首先需完成行車前的所有檢查和準備工作。司機通過選擇合適的司控器操作擋位來調整列車狀態,完成列車站間運行任務。司控器牽引手柄具備多級擋位,見圖1。司控器牽引手柄中,O位左側的擋位區包括K1—K4位和C位。K1—K4位對應的牽引級位變化速率如表1所示。列車牽引力總共有0~8級,且級位可以實現連續變化。
表1 司控器牽引手柄牽引級位變化速率
注:B1—B7為制動手柄區擋位。
結合司機操作手冊及優秀司機經驗,制定以下駕駛建議需遵循的原則:① 通過將司控器牽引手柄置于K1或K2位并逐漸平穩加速,以確保乘客舒適性;② 列車運行中,牽引手柄無須逐級提升或降低,可根據加、減速需要自由控制;③ 通常情況下,增加或減少制動力時,應逐級切換制動手柄;④ 在實施常用制動時,應避免頻繁操作制動手柄,保持列車均勻減速;⑤ 除限速路段和過分相路段外,司機調整手柄的間隔通常約為3 min。駕駛建議不應頻繁變化,以避免增加司機的工作負荷。
以列車準點為基礎研究了一種滿足司機操作行為要求的列車運行速度曲線優化方法,建立了列車運行時間、列車運行能耗和司機操作手柄擋位切換頻率的多目標優化模型。采用AG-MOPSO算法優化列車運行速度曲線。
本文使用經典的單質點模型列車運行,并構建了列車動力學模型[3]。列車運行速度曲線優化的目標是獲得滿足多個指標的目標速度曲線。引入帕累托原理來確定最優解。定義列車運行多目標優化的目標函數如下:
minZ=(f1,f2,f3)
(2)
f1=J
(3)
(4)
(5)
(6)
式中:
Z——目標函數;
f1——列車運行能耗,見式(1);
f2——列車運行時間與計劃運行時間的差值;
f3——司機手柄擋位切換時間評估值;
ttarget——計劃運行時間;
th,i、tdrive——當前手柄的持續時間和基于優秀司機經驗確定的手柄位置切換周期(i為列車運行階段),取3 min;
ti、vi、si和Δai——離散過程中列車的運行時間、速度、位置和加速度增量;
a、s——最大加速度和線路運行終點;
vmax——列車最高運行速度,由線路限速、列車允許速度、防護速度等共同確定;
ui——控制變量,ui∈{K1, K2, K3, K4, C, O, B1, B2, B3, B4, B5, B6, B7};
Ω——可行域。
列車運行速度曲線目標函數的約束條件包括列車運行速度約束、列車運行位置約束和舒適度約束。
本文采用AG-MOPSO算法來解決考慮司機行為的列車運行多目標優化問題,基本步驟如下:
步驟1 初始化種群。將列車最優運行工況作為啟發設置,并選擇符合約束條件的粒子種群。
步驟2 計算每個粒子的目標函數值,得到非劣解集、種群最優解gbest和個體最優解xbest。為改善算法的探索性,設置1個網格來劃分非劣解集,被選中的概率與其目標函數值的適應度呈正相關。
(7)
式中:
dj、dn——第j個網格和第n個網格中的粒子數;
gd,j——被選中的概率;
Nk——網格總數,k為選代次數。
步驟3 將上述結果添加到外部存儲器中。
步驟4 計算慣性權重,并更新粒子的速度和位置。
vm,k+1=wvm,k+c1r1(xbest,k-xi,k)+c2r2(gbest,k-xm,k)
(8)
xm,k+1=xm,k+vm,k+1
(9)
式中:
vm,k、xm,k——第m個粒子在第k次迭代中的速度與距離;
w——慣性權重;
c1、c2——加速因子;
r1、r2——[0,1]區間中的隨機數。
步驟5 確定每個粒子是否滿足約束條件。如不滿足,則重復步驟4,直至滿足。同時增加全局突變率,防止陷入局部循環。
步驟6 計算每個粒子的目標函數值,并更新個體最優解xbest。
步驟7 更新非劣解集、種群最優解和外部存儲器。當非劣解的數量超過網格存儲限制,則從每個網格中隨機刪除指定數量的非劣解。
xd,j=round((Nkdj-Nlim)/Nk)
(10)
式中:
xd,j——第j個網格的刪除編號;
Nlim——非劣解集合數量的上限;
round(·)——四舍五入的基本函數。
步驟8 判斷是否滿足終止條件。如果滿足,則算法停止運行;否則,返回步驟4。
經過上述步驟,通過AG-MOPSO算法輸出非劣解集合。
根據1.2節提出的生成駕駛建議的原則,結合列車運行時間和運行能耗,確定列車運行速度曲線優化結果,并輸出司控器手柄序列。使用模糊隸屬函數計算每個子目標函數的隸屬度值。模糊隸屬函數Uf如下:
Uf=(fi-fmin)/(fmax-fmin)
(11)
式中:
Uf、fi、fmax、fmin——子目標函數的隸屬度值、適應度、最大值和最小值。
基于選擇的解決方案,獲得適用于人工駕駛場景的列車節能運行速度曲線。
考慮司機行為的列車運行速度曲線優化體系見圖2。
圖2 考慮司機行為的列車運行速度曲線優化體系架構
本文使用CR400AF型動車組對京廣鐵路保定東站—石家莊站的實際線路數據進行了仿真計算。設置AG-MOPSO算法參數(見表2),設置不同初始化方法對列車節能運行進行仿真優化。圖3展示了不同初始化方法對應的帕累托最優解集。圖4為不同初始化方法下的列車運行速度曲線。
表2 AG-MOPSO算法參數取值
a) 隨機初始化
a) 隨機初始化
表3對比了經不同初始化后的優化指標。由表3可見: 通過AG-MOPSO算法生成的列車運行速度曲線具有更低的能耗;隨機初始化后的粒子滿足約束條件的pareto最優解較少,且求解時間較長;經過隨機初始化和啟發設置初始化后,列車運行能耗分別降低了9.22%和20.33%;與列車運行時間的原始數據2 072 s相比,經過隨機初始化和啟發設置初始化后的列車運行時間分別減少了16 s和76 s,所提方法確保了列車運行的準點率。此外,該算法生成的操作手柄序列的切換頻率較低,符合司機的行為習慣,可有效應用于人工駕駛場景中的列車節能駕駛。
表3 不同初始化方法下優化指標對比
UMD模型旨在簡化表示司機-車輛-環境交互。本文采用文獻[8]提出的UMD模型構建人在閉環仿真環境,并驗證了列車運行速度曲線的優化結果。需注意,該模型僅用于列車運行狀態快速變化的階段,如列車起動的早期階段,以及列車從制動到停車的后期階段。UMD模型定義了5個參數:ATT(司機的感性水平)、EXP(司機危險感知能力)、DS(司機午餐后的疲勞程度)、TD(次要任務的主觀工作量)和CULT(司機的文化程度)。上述參數捕捉了影響司機行為的各種具體因素,且其取值與不同類型的司機和背景條件相關。描述司機行為的基本參數取值見表4。有關UMD模型及其參數的更詳細討論,參考文獻[10]。
表4 描述司機行為的基本參數取值
描述司機行為Fi的通用表達式為:
Fi=αC1(ATT,EXP)+γC2(DS)+βC3(TD)
(12)
其中:
式中:
C1、C2、C3——與司機特性相關的函數;
α、γ和β——與試驗無關的標準值。
在列車運行場景中,司機參數被設定為感性、經驗豐富、警覺和低任務需求。圖5展示了由UMD模型仿真得到的列車運行速度差、加速度差隨里程變化曲線。在人在閉環仿真中,J為1 824.58 kWh,列車運行時間為2 049 s,滿足準時和節能的目標。該方法已應用于中車青島四方機車車輛股份有限公司的測試環線上,測試環線總長度為3.69 km,呈環形分布在廠房周圍。測試環線鳥瞰圖如圖6所示。
圖5 列車運行速度差、加速度差隨里程變化曲線
圖6 測試環線鳥瞰圖
本文提出了一種考慮司機行為的列車運行速度曲線優化方法。基于CR400AF型動車組的實際人工駕駛場景以及駕駛建議的生成原則,構建了列車運行速度曲線優化模型,將列車運行最優運行工況用作啟發設置,采用AG-MOPSO算法對京廣鐵路保定東站—石家莊站的實際線路數據進行了仿真計算。引入UMD模型,對司機-車輛-環境交互進行了人在閉環仿真優化分析,并在中國中車股份有限公司的測試環線上進行了聯調測試。所提方法有助于完善人機協同共駕技術,提升軌道交通智能化水平。