韓 浪,王壯鋒,張春德
(1.中國鐵道科學研究院研究生部,北京 100081; 2.中國鐵道科學研究院集團有限公司通信信號研究所,北京 100081; 3.中國鐵路北京局集團有限公司,北京 100860)
在調車作業頻繁的調度集中車站,影響接發車作業和切割正線的調車作業會與列車作業在時間和空間上產生沖突,影響彼此的作業效率和行車安全[1]。分散自律調度集中控制系統將調車作業權和列車作業權分置,協調解決了列車作業和調車作業的時空沖突問題[2]。在分散自律控制模式下,調度中心控制列車作業,助調員(采用中心控制操作方式的車站)或車站值班員(采用車站控制操作方式的車站)控制調車作業。在不影響列車作業的情況下,車站自律機根據列車運行調整計劃,調車作業估算時間,聯鎖關系,《車站行車工作細則》(以下簡稱“《站細》”)等條件尋找列車與列車之間合適的運行空當,及時完成調車作業[3-4]。
科學準確地預測調車作業時間對于調車作業安全卡控,提升調車作業效率,保證列車作業不受影響及行車安全十分重要。預測值過大,會導致調車作業長時間處于等待狀態,調車作業效率不高,車站線路利用率低;預測值過小,會導致調車作業時間緊張甚至無法完成,影響列車作業,導致后續列車的停車和運緩,甚至導致列車站外停車,發生沖突等危險情況。由于調車作業過程復雜,參與人員眾多,對調車作業時間合理有效地進行預測具有較大難度。
目前,針對調度集中系統中調車作業時間估算方法的研究較少。由于影響調車作業時間的因素復雜,部分因素不可量化,無法參與計算,所以純粹的計算法便顯得過于理想化,無法付諸實踐。純計算法考慮調車程類型、調車程數量和調動車輛數3種因素建立簡單線性函數對調車作業時間進行粗略估算;王秀娟[5]等通過采用寫實法建立調車作業時間庫,并對庫中數據進行不斷修正與補充,從中獲取調車作業時間的評估值。純計算法無法綜合考慮各影響因素,其計算值與實際相差較大,誤差率較高;寫實法需要大量的時間成本和人力成本,且由于靠人工經驗和少量計算評估,所獲取調車作業時間評估值波動性大,指導性參考性較弱,個人主觀性強,缺乏統一的解讀標準,容易產生不同的解讀。
在對調度集中車站調車作業過程和時間影響因素分析的基礎上,提取調車作業時間的影響因素作為數據集特征,構建有標識的數據集訓練和驗證回歸分析預測模型,得出誤差率可接受的調車作業時間預測值;通過采用回歸分析算法[6]對智能預測模型進行示例實現,并對智能預測邏輯流程和應用效果進行簡單分析。
在鐵路運輸生產活動中,除列車運行以外,機車、車輛或機車車輛在站線或其他線路上一切有目的、有計劃的移動都屬于調車。調車作業是在一定氣候、光照等外部物理環境下,助調員或車站值班員編制調車計劃,機車乘務組按調車進路操縱機車或機車車輛運行,調車組按計劃對車輛進行摘、掛等作業的一系列過程。調車作業按照調車設備不同可分為牽出線調車和駝峰調車[7]。調度集中站一般利用到發線、正線進行調車作業,特殊情況下會用到部分區間線路進行調車作業,屬于牽出線調車作業。
任何調車作業都能以調車鉤作為基本單位進行分解,調車鉤按照作業性質不同可分為牽出鉤、摘車鉤、掛車鉤、轉線鉤,調車鉤,按照一定順序排列即可組成調車作業計劃[8-10]。調車鉤可進一步細分為不同種類、數量和長度的調車程,調車程按照其各階段運行速度不同分為加速—制動、加速—惰行—制動、加速—定速—制動、加速—定速—惰行—制動等類型。為闡述調車鉤、調車程和調車作業計劃的概念,以某一調車作業計劃為例進行分析:A車起始位置如圖1所示,位于VG道,調至8G摘鉤甩2節車輛,進行一次摘車鉤作業;然后調至7G掛鉤1節待編組車輛,進行一次掛車鉤作業;重新調回VG。其對應的調車作業計劃如表1所示,其中,“-”表示摘車作業,“+”表示掛車作業。

圖1 車站調車作業示例

表1 調車作業計劃
A車從VG牽出至2-4DG為一個加速—定速—制動調車程;調至8G摘鉤甩2節車輛,為一個加速—定速—惰行—制動調車程;回至2-4DG為一個加速—定速—制動調車程;調至7G掛鉤1節待編組車輛,為一個加速—定速—惰行—制動調車程;回至2-4DG為一個加速—定速—制動調車程;回至VG為一個加速—定速—制動調車程。
調度集中車站的調車作業在相鄰兩次列車作業間的時間空當內完成,該空當時間記作T間。根據《站細》,調度集中站在接發列車前,應在規定的時間內停止影響列車進路的調車作業,這一按規定預留的時間間隔稱為安全預留時間,記作T安。在相鄰兩次列車作業時間間隔T間內,做完一次調車作業T總并保證安全預留時間T安后,可能會空出一段時間間隔,無調車作業計劃或不能滿足下次調車作業時間的要求,該時間間隔稱作空閑時間,記作T空。
調車作業的總時間T總與T間、T安、T空之間有如下關系
(1)
其包含關系如圖2所示。

圖2 調車作業各時間量關系
一次實際調車作業時間可由上述各時間量相加得出,但每個時間量并不能通過簡單的數值計算得到。實際調車作業過程會受到各種因素的影響,如天氣、夜間照明等物理環境,機車乘務組機車操縱水平,調車組摘掛作業熟練程度,調車機車的類型、牽引性能、制動性能等,均會對加速運行時間T加、定速運行時間T定、惰行時間T惰、制動運行時間T制和摘掛鉤作業時間t產生不同程度的影響。將這些影響因素進行抽象,視作變量。可知這些影響因素變量部分是分類變量,部分是含義和量綱均不同的數值變量,均無法通過傳統數學計算進行分析。針對這一問題,利用大數據技術,將影響因素變量作為特征構建數據集,通過構建回歸分析模型并對其進行訓練驗證,構建一種綜合考慮各種影響因素的智能預測模型,獲取到更為科學準確的調車作業時間預測值。
利用大數據技術和機器學習算法對調車作業時間進行預測需分3個步驟進行。
(1)抽象時間影響因素作為特征,構建數據集。
(2)構建算法模型并利用訓練數據集對模型進行訓練,利用測試數據集對模型進行驗證。
(3)結合調車作業流程,設計調車作業時間智能預測邏輯流程。
構建數據集首先需進行特征提取,即對所有影響調車作業時間的影響因素進行變量定義和命名,如圖3所示,調車作業時間數據集的特征組如下。

圖3 調車作業時間數據集特征組成
(1)調車程類型x1、調車程長度x2、調車程數量x3:不同調車鉤計劃可以分解為不同類型、長度和數量的調車程,調車程決定調車作業的走行距離。
(2)調動車輛的數量x4、調動車輛的質量x5:在牽引和制動性能一定條件下,調動車輛的數量和質量會限制調車車列的運行速度。
(3)調車機車類型x6、調車機車牽引性能x7、調車機車制動性能x8:不同動力的調車機車具有不同的牽引和制動性能,決定調車程加速、定速、惰行和制動過程的速度曲線。
(4)調車允許速度x9:不同的調車進路,途徑的道岔號不同,所允許的最高調車速度會不同[11]。
(5)站場的正線數量x10、站場的到發線數量x11:站場的正線和到發線數量等站場布置信息決定構成調車進路的調車程的類型、長度和數量。
(6)機車乘務組機車操縱水平x12、調車組摘掛作業熟練程度x13:參與調車作業的機車乘務組和調車組的業務水平影響機車性能發揮程度和摘掛鉤作業時間t。
(7)濕度x14、溫度x15、光照條件x16:不同濕度、溫度,對輪軌的黏著系數[12],各種調車設備性能和作業人員的生理、心理都會產生不同程度且難以量化的影響。
(8)調車作業時間T總:記錄實際調車作業時間,包含該特征值的數據集是有標識的數據集[13],方可用于訓練或測試算法模型。
數值特征是特征取值為數字的一類特征,如調車程長度x2、調車程數量x3、調動車輛的數量x4、調動車輛的質量x5、調車允許速度x9、站場的正線數量x10、站場的到發線數量x11、濕度x14、溫度x15、光照強度x16、調車機車牽引性能x7、調車機車制動性能x8、調車作業時間T總等。不同數值特征的取值范圍和衡量單位差異較大,需進行特征標準化處理,即將特征值縮放成均值為0,方差為1的狀態,可減少取值過大的特征對訓練模型精度的影響程度[14]。
分類特征是特征取值為不同類別的一類特征,如調車程類型x1、調車機車類型x6、機車乘務組機車操縱水平x12(例如取值“優”“良”“一般”)、調車組摘掛作業熟練程度x13(例如取值“優”“良”“一般”)等。不同的分類特征,其取值通常為具有不同含義的字符,為使訓練模型可以識別其含義并進行處理運算,需進行one-hot[15]特征編碼。
數據集按照4:1分為訓練數據集和測試數據集,訓練數據集用來訓練預測算法模型,測試數據集用來驗證預測算法模型的好壞程度。
數據集具有可調性,其中的特征可以進行增、刪調整,對調車作業時間影響微乎其微的特征可進行剔除,對調車作業時間具有一定影響但未被考慮的因素進行增加操作,使得數據集特征結構更具科學合理性。
數據集同樣具有一定的時效性,調車設備大規模升級改造、調車作業規范發生較大變化等時間節點前后的數據對于調車作業時間預測模型會產生不同程度的影響,應盡量使用最新時間節點的數據作為數據集進行預測。
在建立數據集結構的基礎上,便可利用機器學習算法對時間預測問題進行建模。調車作業時間預測問題可抽象為:由已知的16種影響因素,即調車程類型、調車程長度、調車程數量,調車機車類型等,對調車作業時間T總進行預測。輸入是一系列數值特征數據或分類特征數據,輸出是一個數值型數據,回歸分析算法或深度學習算法均適用于此類預測問題。以回歸分析算法[16]為例進行介紹,建立回歸分析算法模型分3步進行,如圖4所示。

圖4 回歸分析算法模型訓練過程
STEP1:確定方程域
T總=f1、2、3、…(x1,x2,x3,…,x15,x16)
(2)
方程域是由一系列函數方程f1、f2、f3…組成的方程集合。調車作業時間與16種影響因素的映射關系就被包含于方程域中,回歸分析算法就是試圖從方程域中尋找出最擬合調車作業時間預測的函數模型。根據調車作業時間影響因素及調車作業過程特性,采用線性回歸方程域,即
T總=b+∑wixi,i=1,2,3,…,15,16
(3)
其中,wi為特征權重;xi為特征;b為偏差。
STEP2:建立損失函數

(4)

STEP3:尋找目標線性回歸模型,即尋找目標函數f*使滿足

(5)
或尋找目標參數w*和b*使滿足

(6)
即,尋找使損失函數L(f)=L(wi,b)最小的f*,即為所求的最佳線性回歸函數模型。確定方程域,建立損失函數后,需利用數據集進行訓練,逐步逼近最擬合調車作業時間的回歸分析模型。文中采用隨機梯度下降的方法,即初始時隨機給定一組wi和b值,計算損失函數L(f),設定各參數的下降梯度,使得wi和b值向著使損失函數遞減的方向梯度變化,可設定
wi的下降梯度為

(7)
b的下降梯度為

(8)
學習率(Learning Rate)η值可由專家確定,決定wi和b值的梯度變化速度。利用隨機梯度下降的方法可以逐步逼近得出最擬合調車作業時間的預測模型f*。
構建出調車作業時間智能預測模型f*后,設計智能預測邏輯流程,可將預測得到的調車作業時間提供給車站自律機進行必要的自律運算和安全卡控。調車作業時間智能預測邏輯流程如圖5所示。

圖5 調車鉤時間智能預測邏輯流程
(1)對調車作業時間進行智能預測,首先需要對調車作業計劃進行分解,一次調車作業可分解為若干不同類型的調車鉤[17],調車鉤可進一步分解為若干個不同類型、長度和數量的調車程。
(2)通過鐵路大數據平臺[18-19]或調度集中大數據平臺[20-21]可獲取除調車作業時間以外的16種特征值,輸入智能預測模型f*中獲取預測值。
(3)自律機根據調車作業時間的預測值,綜合列車運行調整計劃、《站細》、聯鎖關系等條件進行自律運算,判斷調車進路是否符合排列條件并進行安全卡控。
(4)當調車進路排列完成,進行調車作業,并在調車作業完成后,記錄實際調車作業時間,與預測值進行比對,計算誤差率(可接受誤差率范圍由專家設定),判斷誤差能否接受。誤差率可接受,則進行下一鉤調車作業;如果不滿足誤差率要求,則將數據更新至數據集對預測模型f*進行重新訓練,得到優化后新的預測模型f′*,返回至第3步驟重新進行自律運算及后續操作,直至調車作業完成。
選取某鐵路局下轄3個區段站內一晝夜間的調車作業為研究對象,利用調度集中系統總顯示軟件的歷史回放功能,統計得到實際調車作業時間。根據實際調車作業信息,結合路內及路外數據,構建仿真數據集,對線性回歸分析預測模型進行仿真訓練。
所選取的3個區段站有如下特點:調車作業頻繁,晝夜均有大量調車作業進行;車站所處地區晝夜氣候變化大,溫度、濕度、光照均有較大起伏;機車型號不一,數量較多;機車乘務組和調車組人員眾多,各班組間作業水平存在一定差距;站場調車設備狀況不同;站場布局及相關信號設備有較大差異。
仿真分析時,對調車作業場景作如下假設。
(1)調車作業均由一臺本務機車完成。
(2)調車作業時間,系指在站線作業(不包括貨場內的貨物線)的時間。
(3)對各項非生產時間(如待摘掛、待發車等信號的各種等待時間),不計入作業時間內。
文中寫實法評估值由專家(經驗豐富的助調員和車站值班員)給出參考值;純計算法預測值由以下公式計算得出
t=a+bm
(9)
式中,t為調車鉤作業時間;a為單機完成該調車鉤作業所需要的平均時間,參照寫實法評估值;b為每增加調動一輛車所增加的調車鉤作業時間;m為本調車鉤調動的車數。
利用寫實法和純計算法對某車站10個調車鉤作業時間進行預測,與線性回歸智能預測值的對比如表2所示。

表2 調車鉤作業時間對比分析
由表2可知:由寫實法得出的10個調車鉤作業時間的評估值與實際值相比,累計偏差為2 278 s,平均相對誤差為13.171%;由純計算法得出的10個調車鉤作業計劃的評估值與實際值相比,累計偏差為2 109 s,平均相對誤差為11.861%;由線性回歸分析預測模型得出的10個調車鉤作業計劃的預測值與實際值相比,累計偏差減小到835 s,對相對誤差取絕對值之后求得平均值為4.712%,滿足設定的可接受誤差率(本文設定可接受誤差率為5%),驗證了本文模型和方法的可行性。
未來需加強對現場調車作業數據的規范收集和統計工作,以便擴充數據集,進一步優化模型和相關參數。
利用大數據技術和機器學習算法,構建數據集和智能預測模型,設計調車作業時間智能預測邏輯流程。根據調車作業各個影響因素,獲取誤差率可接受的調車作業時間預測值,為調車作業在列車運行空當及時合理地完成提供可靠判斷依據。
通過對調度集中車站調車作業的物理過程進行細致分析,并對調車作業時間的各部分組成進行分解和詳細闡述,在此基礎上找出影響調車作業時間的多種影響因素,并將其作為數據集特征,提出一種調車作業時間的線性回歸分析智能預測方法。相比于純計算法和寫實法,預測得到的調車作業時間所考慮的影響因素更全面,獲取的數值誤差相對較小,可為車站自律機對調車作業的自律運算和安全卡控提供更為有效可靠的數值依據。未來通過與調度集中系統大數據平臺或鐵路大數據平臺(目前可通過與現車系統接口)信息共享,實現調車作業計劃單自動獲取,調車進路指令序列自動生成和調車進路自動排列等功能,提高調度集中系統中調車作業的自動化水平,減輕人員勞動強度,提高運輸效率和安全水平。