李 郁,韓 松,婁永梅,張 寧
(1.北京全路通信信號研究設計院集團有限公司,北京 100070;2.東南大學自動化學院,南京 210018;3.東南大學智能運輸系統研究中心軌道交通研究所,南京 210018)
隨著國內城市化進程加快,城市人口急劇增加,軌道交通作為緩解城市交通擁堵的重要方式在國內得到了大力推廣應用,很多城市的軌道交通已進入網絡化運營階段,同時路網客流需求分布越來越復雜,對地鐵運營組織及安全保障提出更高要求[1-2]。而運營組織的核心是根據軌道交通客流的變化有效調配和使用系統資源,及時調整運營策略,保證軌道交通安全完成運輸任務[3]。客流預測及分析作為運營管理的基礎,能夠為站點管理和應急響應提供決策依據,同時也是軌道交通服務水平、系統運行狀態評價的重要指標,實現不同場景下客流的準確預測,可以及時了解各條線路的客流信息,輔助地鐵運營部門制定合理的方案, 使軌道交通的運營管理更加精細化[4-6]。
軌道交通客流預測的應用開發按難易程度可分為3 類:商業軟件、利用專業工具軟件開發、自主開發。商業軟件無需使用者對其進行任何開發操作,但目前還沒有經過市場檢驗并得到行業內廣泛認可的相關產品;自主開發既要求開發人員對軟件開發語言和開發環境有極高的熟練度,如:python、java 等,又要求開發人員具有深厚的客流預測理論和算法功底,所以此種開發方式一般情況下也不適用;而一些專業工具軟件如SPSS Modeler 集成了多種通用、成熟的算法和模型,可以在軌道交通網絡化運營的初期,根據不同的客流類型進行二次開發,操作簡單,上手容易,非常適用于運營工作人員。當這些人員積累了足夠的經驗和理論儲備之后,可以進行以本地特色需求為導向的自主研發。南京地鐵線網指揮中心客流預測模塊即是采用這種方式開發,本文首先介紹SPSS Modeler 的開發環境,然后討論南京地鐵線網指揮中心客流預測模塊的開發過程。
SPSS Modeler 是一個數據挖掘工作平臺,它由SPSS 統計分析軟件與Clementine 數據挖掘軟件整合形成[7],擁有諸多行之有效的統計分析方法,充分利用計算機的運算處理能力和圖形展現能力,將應用、方法與工具有效結合,擁有直觀的操作界面、自動化的數據準備和成熟的預測分析模型[8]。主要包含兩大類功能:數據功能和模型管理功能,下面分別介紹。
1)數據導入和導出
數據傳輸是處理客流數據的必要條件,SPSS Modeler 可以通過“源節點”系列功能與多方面來源的數據進行導入或導出,最常用的數據來源是數據庫和存儲在本地或是服務器中的變量文件。也可與存儲在服務器中的變量文件建立連接,只需將該軟件的模式調整為相應的服務器模式即可。
2)數據處理
數據的有效處理是保證客流預測準確性、高效性的必要前提。運用“記錄選項”系列功能對導入的多源數據進行處理,包括“選擇”、“排序”、“匯總”、“合并”等處理方式,將原始的輸入數據結構轉換為客流預測模型所需要的類型。
3)模型運算功能
SPSS Modeler 提供的“建模”功能,從應用方法可以分為回歸模型、分類模型和聚類模型。也可根據客流數據類型分為無監督學習模型和有監督學習模型。如:常見的時間序列模型,大都為單輸入單輸出的無監督回歸模型。其他回歸預測方法多為多輸入單輸出的有監督回歸模型。這些節點都已將算法集成好,直接連接使用即可。
4)圖形分析功能
該功能以圖形形式和分析指標形式展現結果。其中圖形形式包括:折線圖,熱力圖,散點圖,分析指標形式包括:誤差,線性相關等。通過此功能可對預測結果進行分析,計算模型的可靠性指標。
針對不同的客流預測類型應開發專門的模型與其對應,因此對多種模型的管理是必不可少的。SPSS Modeler 中帶有模型管理功能模塊。開發人員構建的客流預測模型可添加到此模塊中,可以完成以下一些操作。
1)模型注冊
利用此功能,可以將客流預測中的每種模型注冊到此管理模塊中,其中包括模型標識信息、模型參數信息、模型調用信息。
2)模型查詢
使用者可以對已經注冊的模型按照模型的分類、名稱、描述等進行查詢。
3)模型維護
支持使用者新增、修改和刪除模型,對于已經注冊的預測模型,可以對其屬性及參數進行調整。
以南京地鐵線網指揮中心項目中的短時客流預測功能實現為例,討論客流預測模型在SPSS Modeler 中的數據連接、數據處理、預測建模以及完整運行過程。
數據來源為存儲在數據庫中的實際客流數據,首先需建立SPSS Modeler 與相應數據庫的連接,通過“數據庫”節點可建立軟件與數據庫的連接,進而可以從數據庫中的表選取相應的客流數據。如圖1 所示。

圖1 SPSS Modeler與數據庫建立連接Fig.1 Establishing connection between SPSS Modeler and database
為使實際客流數據能有效進行處理,在本預測中首先進行數據篩選、進行格式轉換以符合本預測模型中的數據輸入格式。例如:“選擇”節點可以對數據源中的數據進行篩選。如圖2 所示,可以遵循CLEM 語言構建相應的表達式,從而對源節點中傳來的數據進行篩選,選擇符合客流預測條件歷史的數據。
本例使用時間序列模型進行短時客流預測,在SPSS Modeler 中已集成好時間序列模型節點,只需將處理好的數據傳輸到模型中,并設置模型參數即可,如圖3 所示。

圖2 選擇節點Fig.2 Node selection

圖3 時間序列模型參數設置Fig.3 Parameter configuration of time series model
一個完整的客流預測模型就是通過數據的導入、處理、模型運算、分析,導出形成的,如圖4 所示,為短時客流預測模型。模型的運行可分為手動運行和自動運行。
如圖5 所示為本次短時客流預測的輸出結果,內容包含預測日期、站點編號、進站量、出站量等。

圖4 短時客流預測模型Fig.4 Model for predicting short-term passenger flow

圖5 短時客流預測結果Fig.5 Predictions of short-term passenger flow
在南京線網指揮中心系統中,不僅需要短時客流預測模型,還需要其他多種客流預測模型及評估模型,對其進行分類為:客流預測模型、元數據管理模型、評估模型、結果管理模型。如圖6 所示。

圖6 模型管理Fig.6 Model management
通過在南京線網指揮中心系統中的實際應用,可對在SPSS Modeler 環境下開發客流預測模塊做出如下總結。
1)可進行定時客流預測
短時客流預測或短期客流預測按計劃時間定時預測,可有效節省應用開發人員的時間和精力。
2)開發靈活,使用簡便
利用SPSS Modeler 可根據業務需求開發不同類型的客流預測模型,操作簡單,使用靈活,可大大提升管理人員的工作效率。
3)預測結果可報表處理
客流預測模型可生成直觀的客流數據,為運營管理提供針對性的數據支持,面向管理人員并可以利用SPSS Modeler 生成并導出客流預測的報表和報告。