鄭 武 中國鐵路上海局集團有限公司收入稽查處
中國鐵路上海局集團有限公司(以下簡稱集團公司)地處我國東部經濟發達的長三角地區,覆蓋江浙滬皖三省一市,是中國鐵路總公司下屬的特大型鐵路運輸企業。2017年集團公司完成運輸收入930.9億元,其中客運收入729.6億元,旅客發送6.3億人,位居全國鐵路運輸企業首位。
集團公司客運營業收入是直接從市場取得的,凡是與旅客列車運行直接相關的客運進款原則上作為客車擔當企業的客運營業收入。旅客列車收入能效分析是對集團公司擔當的旅客列車運營經濟性的分析,從客車運能利用水平、盈利能力等角度對每一趟客運列車進行分析,對旅客列車運能安排合理性進行考量,并給出建議。
能效分析工作的目的是對集團公司擔當的各次旅客列車開行能效進行精細測算、分析,找到經營績效優劣車次,運用歷史規律預測熱點時間和熱點線路,并提供集團公司客運管理部門作為加開臨客和調整運行圖的參考,為經營管理和科學決策提供數據支撐。其意義在于:
隨著鐵路市場化改革不斷深入,鐵路運輸收入經營管理也在不斷發展并逐漸適應市場的需要。從長遠來看,鐵路運輸企業改革的目標是實現自主經營、自負盈虧,集團公司作為運輸市場的主體,必然需要充分參與運輸市場,直面來自航空和公路運輸的競爭。客運市場的靈活性和可替代性非常高,熱門時間、線路如果不及時增加運能,買不到票的旅客選擇公路及航空運輸企業,造成鐵路客運收入的流失;同時,空閑的車次跑一趟虧一趟,必須要采取有效的措施減少損失,要么對旅客進行消費引導增加客流,要么減少運力安排節約成本,真正市場化的企業,必然以追求經濟效益的最大化為目標。
對旅客列車進行能效分析需要來自多方面的信息資源,之所以長期采用手工分析,是受到客觀條件和技術水平兩方面的限制。首先,客車能效分析除了利用發售車票存根的收入數據以外,還需要客車的編組、席別、里程、票價、停站、發到時間、乘務擔當等信息,這些信息來源于客運、運輸管理部門和客運段,各自具有不同的數據接口格式和傳輸方式,而且臨客增減變化也會帶來分析數據靈活多變;還有部分數據一直采用手工采集列表填寫,在規范性、及時性和精確性等方面難以得到有效保障。近年來,隨著數據資源不斷豐富、數據接口和傳輸標準不斷規范,為平臺的構建創造了條件,橫向部門信息化管理水平的提升,對能效分析工作整合關鍵信息形成了有力的依托。
集團公司客運體量一直穩居全路第一,近十年來保持了年均10%以上的增速,2017年旅客發送量達已到了6.3億人,日均旅客發送量超過172萬人。面對海量的信息和快速提升的管理需求,傳統的運輸收入管理方式已經顯得捉襟見肘,必須找到新的突破口,在質和量兩方面進一步提高管理水平。
以科技促管理是提高運輸收入管理工作的必然選擇,財務部(收入部)是集團公司運輸收入主管部門,匯聚了第一手票據審核數據,如何加以整合運用,是擺在收入管理人員面前的一道難題。聯合客運管理部門、客運段收入科,在充分調研的基礎上,通過建設信息系統對各類數據資源進行整合,通過對旅客列車定員、席別、票價、發送量、客座利用率、收入實現率和運程率等信息進行測算及深度數據挖掘,可以直觀地找到那些運輸效率優劣的車次,對旅客運能需求進行智能化分析和預測。分析結果可以提供客運管理部門作為運力調整的參考,從而有效提升集團公司科學決策及經營管理的水平。
做好能效分析工作需要采集、存儲大量外部系統相關數據。首先,這些接口數據接口文件格式不同,采集傳輸方式各異,完成采集后還需要進行加工處理,如果通過人工完成,是不可想象的。必須為不同的接口數據設計不同的采集程序和ETL(清洗、轉換、加載)程序,并通過定時觸發機制,從源頭系統自動采集。其次,數據必須以規范的方式設計存儲方案,將來源于客票審核系統的客車收入、售票張數信息,將來源于客運段的編組、定員、席別、全程票價信息,有效匹配并合理組織,才能成為有用的分析信息,這都需要借助軟件系統自動完成。
客車能效分析需要對大量原始數據進行集中運算,普通運算方法無法實現在短時間內完成超大數據量的計算。舉例來說,某天開行的一趟客車,其售票數據會分散在預售期內的任意一天、任意車站的數據接口文件中,要精確分析其發售收入,至少需要分析開行前60日(預售期60天)的接口文件。按2017年單日平均客發170萬人口徑,日數據量4 GiB計算,需要采集、存儲1.02億條以上的售票存根記錄,按普通運算每秒處理1 000條數據計算,需要28.3 h,這種數據處理速度是不能接受的。由此可見,數據量和數據處理效率的影響直接關系到分析結果的時效性,必須提高數據處理能力,減少能效分析耗時。
對基礎數據的修改維護,需要收入管理部門和客運段、手持式補票機廠商協同工作,最終形成分析成果。傳統方式下,這些工作都是電話、郵件溝通,各單位手工作業效率十分低下。首先,基礎數據維護難以快速分派。集團公司每日開行擔當列車1 300多趟,對列車席別、票價信息核查需要采用車次清單各自認領的方法,分派效率十分低下,每月都會形成逾百趟車次無人認領的尷尬局面。收入管理部門需要逐趟查詢調度命令,再與相應客運段對接處理,過程十分繁瑣,急需采取技術手段加以解決。其次,對分析結果的確認及修正也存在類似問題,客運段維護基礎信息時,受到臨客加開、災難天氣停運等問題的影響,會產生一定誤差,因此每一條分析結果都需要進行再確認,往往要經歷多次往來才能最終糾正數據差錯,時效性和數據精度都難以保障。
積極創新信息技術手段,是目前能效分析可以采取的最恰當的選擇,集團公司收入管理部門經過充分調研、周密規劃、整合了多方面的信息資源,組織開發能效分析應用系統,完成了集團公司客車開行能效分析平臺的建設。
經過梳理,能效分析所涉及的數據主要有七大類,收入管理部門逐一聯系協調數據提供部門,明確接口格式及傳輸方式,并開發配套的ETL程序,將有效數據定期自動加載進數據倉庫。其一,各次客車實際收入及售票張數數據來源于集團公司信息技術所客票售票系統,其接口文件按站按天形成站售車票存根、站退車票存根、電子支付清單等文件,由信息所每日凌晨自動生成,自動向收入管理部門提供文件傳輸服務。其二,各次客車分席別定員數據來源于客運管理部門的營銷分析系統,由客運管理部門利用網頁程序導出,定期向收入管理部門提供。其三,各次客車分席別票價信息,客運段收入科通過能效分析平臺,定期查找本段乘務擔當客車,補充客車各席別、票價信息。其四,客車擔當歸屬及開行趟數信息,來源于運輸管理部門的列車運行圖及運輸調度管理系統中的臨客調令信息,由收入管理部門自行導出接口數據。
采用VMware云計算架構利用7臺IBM 3850服務器構建了收入處虛擬化平臺,為能效分析體系提供了硬件保障。軟件方面,采用了甲骨文VLDB解決方案,綜合利用多種技術手段有效提高了計算效率,壓縮了運算時間。具體來有以下幾個技術措施,首先,采用了并行計算(Parallel Server)技術提高硬件性能的利用率;其次,針對超大數據量特點,采用了分區表(Partition Table)技術,每次計算過程只需要提取那些需要的物理數據文件,有效降低了數據掃描的量。再次,對查詢所涉及的條件字段,有針對性地使用了分區索引(Partition Index)技術提高數據的查詢效率,以達到提高運算效率的目的。實踐證明,這套軟、硬件平臺架構,能夠滿足當前分析工作的需要,可擴展性良好,達到了平臺規劃的目標。
客車能效分析工作除了多種渠道收集原始信息以外,還需要多個部門協同工作,具體來說,日常工作主要需要集團公司客運管理部門、客運段收入科和信息技術所等部門協同配合。收入管理部門應發揮牽頭作用,建立客車能效分析平臺協作機制,以規章形式發文明確各部門的工作內容及時間要求,從技術和制度兩方面規范能效分析協同事項,真正實現能效分析系統協同管理。
客車的分席別票價信息需要客運段負責確認維護,其及時性和準確性直接關系到最終的分析結果。客車收入能效分析平臺利用審核系統的客車補票數據的車次信息,輔助分派車次維護任務到乘務擔當客運段。同時,利用歷史全程票價信息進行預填,減少客運段人員的維護量。
客車收入能效分析工作涉及橫向和縱向多個部門和單位,客車開行區間、編組、趟次靈活多變,協同管理難度大,必須加強組織領導才能順暢實施。首先,財務部(收入部)積極發揮牽頭作用,具體負責客車收入能效分析工作,落實統一組織管理,并協調外部單位理順數據渠道,形成長效機制,保障相關工作的順利進行。其次,負責數據維護工作的客運段收入部門,應高度重視,建立常態管理制度和工作流程,及時掌握運行圖變化,積極溝通客車班組,了解列車編組、定員的準確信息,按時、保質的在客車能效分析平臺上進行數據維護。
從數據來源看,客運段掌握著最準確的客車運能、運量相關數據,因此,從源頭上采集規范的客車運能、運量相關數據具有一定的科學性。實際工作中,各客運段每天開行數百趟列車,依靠人工統計匯總顯然是不現實的。解決這一問題的方法是對客車手持式補票機和數據落地程序同時進行升級優化和功能拓展。在客車開行前,由列車長對手持式補票機進行初始化,確認車次、席別、定員、票價等基礎信息。在列車班組落地后,由數據落地程序自動接收補票機中的相關信息,并按日進行整理匯總,自動形成客車基礎信息表。這一方案已著手進行試點,如全面推廣,將使客車收入能效分析工作水平提升到一個新的高度。
綜上所述,建設客車收入能效分析平臺,利用信息技術手段開展能效分析工作,是集團公司財務部(收入部)在“數據驅動生產”經營理念的一次深度實踐,符合鐵路市場化改革的發展方向,為集團公司更好地面向運輸市場、把握市場需求,奪取市場競爭優勢地位,進行地積極探索,也希望本文為相關工作提供有益的啟示。