宋 超
(上海鐵路局 客運處,上海 200071)
目前,鐵路客票發售和預訂系統(簡稱客票系統)有較為強大的客運營銷系統,但是缺乏對旅客購票行為的分析,為此,基于客票系統開發了鐵路旅客購票分析系統(簡稱系統)。該系統分析鐵路旅客實際購票特性:購票時間、購票方式、購票地點、售票能力以及相互間的關系等,通過數據、圖表的展現,揭示旅客的購票行為特征。
1.1.1 完整性原則
為全面剖析旅客購票行為特征,須全面收集完整的旅客購票信息,包含各種售票方式、購票時間、購票地點和車票信息等,從而保證信息的完整性。
1.1.2 準確性原則
為準確把握旅客購票特性,采用模塊化過程設計,層層驗證數據的可靠性和準確性,確保展現數據和圖表的真實、準確。在數據處理過程中記錄處理日志,便于審核數據處理的全流程,防止數據在處理過程中的缺失。
1.1.3 靈活性原則
該來的總會來。11月19日,中國證監會對天成控股(600112.SH)及5名原高管下發行政處罰決定書:認定天成控股2017年1月25日發布的2016年度業績扭虧為盈公告與實際情況嚴重不符,構成虛假記載行為,對公司和當時責任人警告并罰款。
為直觀展現分析結果,可采用報表工具,以表格、圖形等方式展現各種數據項以及相互關系。用戶可以根據自己的需求,利用系統提供的模板制作各種形式的表格,也可以根據既有的報表,直接抽取所需要分析的對象。
1.1.4 獨立性原則
系統基于客票系統進行開發和實現,其數據源為客票系統的售票信息和其他基礎信息,但其數據處理、存儲和展現應自成一體,獨立運行。
考慮到旅客購票分析系統的使用對象為客運專業人員,用戶數量有限,但具有分析數據量大、展現方式靈活等需求,因此系統采用C/S模式。系統利用既有客票營銷系統主機為服務器;為方便售票數據傳輸、轉換,降低系統開發的復雜度,數據庫采用既有客票系統的Sybase;為方便用戶接入和使用,系統網絡利用現有客票系統網絡設備,以TCP/IP為通信協議;為靈活展現分析結果,客戶端使用BO報表工具來開發模板、報表和圖形。其系統架構如圖1所示。

圖1 旅客購票分析系統架構
硬件環境:HP Superdome服務器及HP存儲。
軟件環境:操作系統為HP Unix, 數據庫為SYBASE ASE 15,客戶端開發工具采用BusinessObjects。
為分析鐵路旅客實際購票特性,需要分析旅客的購票時間、購票方式、購票地點、購票頻率以及相互間的關系等,將這些特性與車站、列車以及時間段(日常、周末、黃金周等)結合起來,展現在不同運能與需求、不同區域、不同列車類型等情況下的旅客購票傾向性選擇。因此旅客的購票屬性要包含購票時間、購票方式、購票地點、車站信息、車次信息、乘車信息等內容,為此以客票系統的旅客購票信息、列車信息、車站信息等作為系統開發、分析的基礎和數據源。
系統采用模塊化設計,包括數據采集、數據處理、數據分析、結果展現4個功能模塊。
2.2.1 數據采集
為提高數據的可靠性和準確性,系統設計了與客票系統的接口,抽取客票系統的售票、退票、改簽存根以及其他基礎信息,作為分析的數據源。
2.2.2 數據處理
根據需要分析的旅客購票特性,將售票、退票、改簽存根中數據項進行匯總、分類,分成以列車、車站、日期等屬性為分析對象的5類基礎數據庫。
2.2.3 數據分析
根據分析指標,對5個基礎數據庫進行細化計算、處理,直至達到數據直接展現的要求,并進行數據分類存儲。
2.2.4 結果展現
利用BO工具設計數據展現模板,將各數據項通過表格或圖表展現其大小及其相互間關系。
(1)車站窗口售票能力分析。可以統計車站的“站區窗口”、“代售點”、“自助售票機”每日開窗數量、售票張數、平均張數等,從而分析車站窗口能力利用情況。
(2) 車站售票分布分析。可以統計車站的“窗口售票”、“電話訂票”、“互聯網”3種售票方式的售票數量,并可查看3種出票方式的出票數量。
(3)RSA車次售票分布分析。可統計各次列車的“電子客票”、“代售點”、“互聯網換票”、“自助售票機”等方式的售票數量以上車人數和客座率。
(4)車站售票時間和分布。可以統計各車站在各時間段內售票量分布;可以統計各車站、各售票方式、各列車類型的旅客預購車票時間分布;可以統計各車站、各售票方式、各列車類型的旅客平均購票時間。時間單位為30 min。
(5)列車售票時間。可以從“按車次和車站”、“按車站”、“售票模式”3個方面對旅客購票時間分布進行統計。時間單位為60 min。
通過旅客購票分析系統的應用,實現對售票數據進行挖掘和分析,得到一些非常有價值的數據,使得上海鐵路局客運管理人員對旅客購票特性有了更深一步了解。
(1)在售票能力方面,可以一覽各車站售票能力利用情況,凸顯出代售點的售票分銷渠道作用不明顯,如表1所示。

表1 滬寧高鐵車站售票能力匯總表
(2)在預購時間上,得出平均購票時間、各預購時間段的預購分布,分別見表2和表3。

表2 平均時間(單位:h)

表3 各時間段的預購分布
通過對各車站在同一天不同時間段內售票量分布、各車次及售票方式預售分布等分析,展現出某些原先我們沒有意識到的旅客購票特性,對鐵路局和車站做好日常及高峰期的售票組織起著積極的指導作用。
該系統已應用于上海鐵路局日常的售票分析中,使客運管理部門能夠及時掌握各車站窗口、自助售票機、互聯網、電話訂票等售票情況,根據這些信息迅速對車站售票窗口和布局進行調整,實行彈性開窗售票機制,對指導車站做好高峰時期售票組織工作起著積極的作用。另外,通過該系統的數據分析,使得客運管理者首次認識到旅客購票傾向性選擇,為完善、優化售票組織提供了強有力的技術手段,也為全路客票系統的技術發展提供了數據基礎。
[1]王煒煒,賈新茹,徐東平,等.數據庫挖掘技術在鐵路客運營銷中的應用研究[M].北京:中國鐵道出版社,2005.
[2] 單杏花,汪建雄,王煒煒. 鐵路客運生產經營指標體系的構建方法研究[J].鐵路計算機應用,2012,21(9).