張英貴,劉青意,雷定猷,徐新平,曾 曉
ZHANG Yinggui,LIU Qingyi,LEI Dingyou,XU Xinping,ZENG Xiao
(中南大學 交通運輸工程學院,湖南 長沙 410075)
(School of Traffic&Transportation Engineering,Central South University,Changsha 410075,China)
隨著綜合交通樞紐概念的強化,普速、高速、市郊和城際鐵路越來越集中地引入同一大型鐵路客運站,站場布局復雜,且常與車底整備場、動車段或調車場相銜接,列車作業與調車作業時有交叉,不同速度和等級列車共站運營,復雜大型鐵路客運站仍基本采用手工編制與調整股道運用方案[1];股道運用方案的編制與調整必須充分考慮旅客列車到發特征,便于作業組織。因此,通過挖掘客運站旅客列車的到發特征,合理劃分列車種類,進而確定列車編制與調整的優先級,為解決股道運用方案的編制與調整問題提供有效的決策依據。
既有研究多集中在股道運用優化模型與算法設計層面。在國外,Zwaneveld、Kroon和Carey等指出大型復雜車站股道運用優化是一個NP-Hard問題,未找到通用有效的好算法[2-3],在國內,呂紅霞和史峰等提出了客運站到發線運用計劃編制方法[4],張英貴和雷定猷構建了鐵路客運站股道運用窗時排序模型與算法[5-6]。旅客列車到發特征及其列車計劃編制與調整的先后次序對股道運用方案編制與調整效率具有顯著的影響[1],但專門針對大型鐵路客運站旅客列車到發特征的量化聚類研究較少,呂紅霞等采用聚類分析的方法研究了鐵路出行旅客類別劃分問題[7]?;诖?,構建列車到發特征聚類指標體系,設計基于模糊C均值聚類的列車密集到發峰期確定方法,分析經停、通過、立折、始發和終到等旅客列車在特定車站的到發密集程度,并提出一種基于近鄰傳播的列車到發特征聚類分析方法。
鐵路大型客運站(如鄭州站、廣州東站等)辦理的旅客列車類型包括高鐵、動車組、直達、特快、普速、臨客和旅游等旅客列車,在站作業主要包括接發車作業、始發終到作業、車底出入庫與車底整備作業、旅客乘降、列車上水和行包等股道運用技術作業。通過分析鐵路大型客運站旅客列車類型、特征及其股道運用技術作業要求,基于客運站股道運用方案智能編制與調整優化的視角,統籌考慮列車類型、牽引性質、列車長度、運行速度、作業類型、開行方向和到發時間等因素,構建旅客列車到發特征聚類指標體系,挖掘旅客列車到發特征。
鐵路大型客運站旅客列車到發特征聚類指標如表1所示:

表1 旅客列車到發特征聚類指標
除到發時間外的指標均可由列車編組及參數、走行路徑、車站作業等相關數據的現場調研獲得。不同車站列車到發高峰期不盡一致,到發時間指標旨在判定列車是否高峰期到達或離開車站,通過設計基于模糊C均值的列車密集到發峰期確定方法,用于確定“到發時間”指標,分析旅客列車在特定車站的密集到發程度,為股道運用方案編制與調整提供決策依據。

其中:式(1)表示以類內加權平方誤差和最小為優化目標,m為模糊加權指數(m>)1 ,式(2) 表示基于聚類類型全覆蓋的列車密集到發峰期隸屬度取值約束。
采用迭代的方式,計算列車到發時間指標的隸屬度和聚類中心矩陣,進而獲得經停、始發和終到旅客列車在特定車站的密集到發程度及峰期的模糊劃分結果。具體算法如下:
Step1:初始化。輸入列車到發時間取值集合X,給定聚類類別數a、模糊加權指數m、迭代停止閾值ε和最大迭代次數為kmax,初始化迭代次數為k=1和隸屬度矩陣U()k;
Step2:按式(2),確定各到發時間聚類類型下的聚類中心cz取值:

Step3:按式(3),更新列車到發時間指標的隸屬度矩陣U k+()1:

Step5:確定最佳的模糊劃分U以及聚類中心C,輸出結果,算法結束。
近鄰傳播聚類算法是2007年Frey等人提出的一種新的聚類算法,通過確定對象之間的相似度進行聚類,且相似度可對稱,即兩個不同對象相互之間的相似度取值一樣(如歐氏距離)。論文將客運站到發的n列旅客列車視為n個對象,為每列旅客列車確定其與其他列車的相似度信息,并存儲在一個n×n的相似度矩陣S中,將其視為本方法的數據輸入。同時,列車聚類指標數量會受參考度p(近鄰傳播聚類算法根據S對角線的數值為某個點能否成為聚類中心的評判標準,若該值越大,該點成為簇中心的可能性越大,對角線上的值即為參考度p)的影響。每列車均有可能成為聚類中心,則p的取值應該相同。基于此,不妨假設列車屬性相似度矩陣的對角線元素s j,()j 為一相同值p,p<0。
近鄰傳播聚類算法需傳遞兩類消息:代表矩陣r( ja,jb)和適選矩陣a( ja,jb),其中r( ja,jb)表示從點xi發送到候選列車聚類中心xk的數值消息,反映xk點是否適合作為xi點的列車聚類中心;a( ja,jb)從候選列車聚類中心xk發送到xi的數值消息,反映i點是否選擇xk作為其列車聚類中心,r( ja,jb)與a( ja,jb)越大,則xk點作為列車聚類中心的可能性就越大,并且xi點隸屬于以xk點為列車聚類中心的聚類的可能性也越大。
代表矩陣r( ja,jb)和適選矩陣a( ja,jb)的更新過程分別如下:

基于以上迭代過程,確定列車聚類數以及列車聚類穩定性圖。因此,基于近鄰傳播的列車到發特征聚類分析方法的具體步驟如下:
Step1:初始化。運用式(6)計算列車指標兩兩之間ja與jb的相關性rjajb;計算相關性rjajb后得出聚類系譜圖,判斷給的閾值下具有旅客列車到發代表性指標。輸入代表性指標取值矩陣A(經由指標相關性計算之后選取重要指標得到初始列車特征量值矩陣)。


Step3:列車聚類迭代過程。令代表矩陣r( ja,jb)和適選矩陣a( ja,jb)的初始值為0→,對所有列車數據點信息量代表度和適選度求和,找到每個點的類中心點,使得代表度和適選度為最大即為最優列車聚類中心點,選擇的列車聚類中心在連續幾步迭代過程中保持穩定。
Step4:參考度判定。判斷得到的列車聚類數是否滿足要求,若不滿足,則改變p值,重復進行程序直至列車聚類數以及迭代穩定性滿足要求為止。
Step5:輸出聚類結果圖,算法結束。

圖1 不同時刻始發、終到和經停到發列車數量
某個日計劃內該站辦理的G字頭高鐵26列、D字頭動車組20列、T字頭特快旅客列車65列、K字頭快速旅客列車143列、臨時旅客列車19列、其它旅客列車25列,共298列旅客列車在該站辦理相關客運業務;旅客列車在該站辦理的作業類型包括始發、終到、經停三大類,不同時間始發、終到和經停列車到發數量統計如圖1所示:
“到發時間”指標需采用基于模糊C均值的列車密集到發峰期確定方法進行確定,并結合MATLAB編程計算,該站經停旅客列車、終到和始發旅客列車在不同時間的到發數量聚類結果如圖2所示:

圖2 基于模糊C均值的列車到發聚類結果圖
由圖2得知,經停旅客列車密集到發高峰時間段包括:4:00~5:00、9:00~10:00、15:00~16:00、20:00~21:00,終到旅客列車密集到發高峰時間段包括:7:00~8:00、14:00~15:00、17:00~18:00、22:00~23:00,始發旅客列車密集到發高峰時間段包括:8:00~9:00、13:00~14:00、17:00~18:00、22:00~23:00。亦知,不同類型列車在特定車站的密集到發時間不盡完全相同,并存在相互交叉(如始發和終到旅客列車在時間段17:00~18:00、22:00~23:00到發數量較為密集);基于此,“到發時間”聚類指標特定量值的列車數分別為:高峰期密集到發66列、非高峰期到發232列?,F采用論文所提出的基于近鄰傳播的列車到發特征聚類分析方法,借助SPSS統計軟件,對該站旅客列車到發特征進行聚類分析。
采用式(6)確定其相關系數矩陣,并確定到發特征聚類圖,如圖3所示:

圖3 旅客列車到發特征聚類圖
不妨設閾值為0.3,由圖3得知,聚類數為5,以此為標準選取代表性指標。具體如下:在上水服務(CNo8)、到發時間(CNo9) 和開行方向(CNo7) 中選取到發時間為代表性指標;在牽引性質(CNo2)、列車長度(CNo3) 和作業類型(CNo5) 中選取作業類型為代表性指標。因此,此種情況下,不妨選擇到發時間(CNo9)、作業類型(CNo5)、列車類型(CNo1)、跨局數量(CNo6)、運行速度(CNo4)作為列車到發特征的代表性指標。
現分析基于不同參考度p的列車到發特征聚類情況。初始參考度p=-2.4495是經由近鄰傳播聚類算法計算確定的初始值,其聚類數為37。此時,聚類數過多,不妨再取一些較小的p值,代入本方法后重新確定聚類數?;趨⒖级鹊木垲惤Y果及穩定性如表2所示:

表2 基于不同參考度的列車聚類數
由表2得知,參考度為-11、-10.5時客運站到發旅客列車聚類數較少,分別為14和12;經對比,得知參考度為-11的列車聚類數多于參考度為-10.5的列車數,并且由聚類結果知參考度為-11的聚類迭代穩定性不如參考度為-10.5;綜上,基于參考度p=-10.5,其旅客列車到發聚類數最小(12),且迭代穩定后非常平穩,聚類效果最佳。因此,針對該車站該日計劃內的旅客列車聚類數取值12。即將原始的298列旅客列車劃分成12類,進而確定列車股道運用計劃編制與調整的優先級。p=-10.5時,對應的迭代穩定性圖如圖4所示:
結合該站旅客列車到發特征的聚類分析結果,合理劃分旅客列車種類及股道運用計劃編制與調整的先后次序,即:(1)高峰期高速跨局始發終到旅客列車;(2)非高峰期高速跨局始發終到列車;(3)高峰期普速跨局始發終到列車;(4)非高峰期普速跨局始發終到列車;(5)高峰期高速跨局非始發終到列車;(6)非高峰期高速跨局非始發終到列車;(7)高峰期普速跨局非始發終到列車;(8)非高峰期普速跨局非始發終到列車;(9)管內高速非始發終到列車;(10)管內普速非始發終到列車;(11)管內高速始發終到列車;(12)管內普速始發終到列車。其中,管內列車中沒有呈現到發時間聚類指標,主要是由于該站辦理的管內旅客列車(跨局數量指標取值為0)僅有 12列,占列車總數的4.03%,占比較少,其到發時間聚類指標(高峰期與非高峰期)呈現不明顯。計算結果表明:采用論文基于近鄰傳播的列車到發特征聚類分析方法,能夠有效挖掘不同類型客運站或不同時期客運站旅客列車到發特征;因列車大面積晚點、突發事件等情形下,針對不同類型旅客列車在線調整股道運用計劃時,高峰期到發列車占用股道與站臺安排要優先于非高峰期列車,高速列車優先于普速列車,跨局列車優先于管內,始發終到跨局旅客列車優先于非始發終到跨局列車,非始發終到管內列車優先于始發終到管內列車;因此即可確定車站作業計劃編制與實時調整次序,能為解決大型客運站股道運用方案的編制與實時調整問題提供有效的決策依據。

圖4 p=-10.5列車聚類結果與迭代穩定性圖
大型復雜鐵路客運站股道運用方案的編制與調整影響因素復雜易變,論文充分考慮旅客列車到發特征,提出了一種基于模糊C均值聚類的列車密集到發峰期確定方法和基于近鄰傳播的列車到發特征聚類分析方法,明確計劃編制與實時調整次序,提高車站作業計劃智能編制水平和組織效率。同時,通過對列車聚類指標的合理歸并,確定到發時間、作業類型、列車類型、跨局數量和運行速度可作為聚類分析的屬性變量,通過近鄰傳播算法挖掘列車到發特征及分類情況,通過計算驗證了上述聚類結果為最好。通過改造或構建傳統股道運用方案編制與調整模型和算法,為上述旅客列車到發特征聚類結果更好地融入實際方案的編制與調整是筆者正要開展的工作。
參考文獻:
[1] 張英貴.鐵路客運站股道運用優化方法與應用研究[D].長沙:中南大學(博士學位論文),2012.
[2]Zwaneveld P.J.,Kroon L.G.,Hoesel P.M..Routing trains through a railway station based on a node packing model[J].European Journal of Operational Research,2001,128(1):14-33.
[3]Craey M.,Crawford I..Scheduling trains on a network of busy complex stations[J].Transportation Research Part B,2007,41(2):159-178.
[4] 呂紅霞,何大可,陳韜.基于蟻群算法的客運站到發線運用計劃編制方法[J].西南交通大學學報,2008,43(2):153-158.
[5] 張英貴,雷定猷,湯波,等.鐵路客運站股道運用窗時排序模型與算法[J].鐵道學報,2011,33(1):1-7.
[6]Dingyou Lei,Chuijiang Guo,Yinggui Zhang,et al.Reasonable scheduling for arrival-departure track operations in railway stations[J].Transportation Planning and Technology,2016,39(6):1-16.
[7] 呂紅霞,王文憲,蒲松,等.基于聚類分析的鐵路出行旅客類別劃分[J].交通運輸系統工程與信息,2016,16(1):129-134.