李恒鑫
(中鐵第四勘察設計院集團有限公司,湖北武漢430063)
鐵路客貨運OD 大數據是開展鐵路網絡規劃、制定運輸組織計劃的重要依據。經過若干年的調查統計,鐵路行業部門已經積累了大量客貨運OD 大數據資源,而目前鐵路客貨OD 數據的應用仍存在應用場景深度不足[1-2]、運輸特征解析不足[3-5]、數據高效易用性較差[6-7]等問題,亟待創新研發快速高效的鐵路客貨運OD 大數據分析技術方法,充分挖掘數據價值,實現數據驅動決策,支持鐵路規劃設計科學化、精準化發展。此外,由于鐵路運輸與運營系統的專業性和特殊性,尚未形成成熟的囊括鐵路客運和貨運的分析系統[8],使得數據挖掘和分析對鐵路規劃、設計業務的支持十分有限,數據潛力亟待挖掘。
在總結大量既有研究經驗的基礎上,基于標準化、業務化、便利化原則,整合多級粒度地理信息、鐵路客貨運OD 數據資源,聯合研制開發了“鐵路OD 大數據分析和可視化平臺”(以下簡稱“平臺”),擬通過數字化、信息化、智能化手段顯著提升鐵路客貨OD 數據分析和可視化的效率,促進鐵路客貨OD 數據在鐵路規劃、綜合交通規劃中的價值發揮,為鐵路規劃人員提供一款易用、實用、常用的鐵路OD 大數據“生產力工具”。
地理空間數據是進行OD 分析的基礎,主要用于OD 起終點的定位和運量的集計統計。平臺遵循數據標準化原則預制了多級粒度的地理空間數據,包括邊界面數據和代表點數據。多級粒度分別包括縣區級、地市級、省(自治區)級、城市群級、地區級。此外,鐵路交通小區作為特殊地理空間也被納入。
鐵路客貨OD 數據是平臺使用的核心數據,包含有向的起終點信息和數量。平臺所使用的鐵路客貨OD 數據粒度為鐵路小區級(近似縣區級)OD 數據,由于鐵路小區嚴格歸屬于地級市,故可由鐵路小區向上分別集計地市級、省(自治區)級等上級粒度OD。
鐵路客貨OD 數據包含了豐富的品類信息,可分為客運、貨運兩大類,客運包含分車型客運量OD,貨運包含鋼鐵、糧食等16 種細分品類OD。
2.1.1 數據標準化原則
數據標準化的目的主要有3 個:一是確立數據標準,保障數據的易更新性;二是保障數據預處理流程的自動化;三是通過數據標準化,保障算法、功能的標準化[9]。
平臺的數據標準化的內容包含數據庫和數據表兩個層面。數據庫層面為上層框架設計,對支撐平臺各模塊、各算法的數據表進行總體設計,其中需重點考慮表與表之間的連接關系和層次。數據表設計為下層內容設計,需對各表的字段、數據類型、字段含義進行設計。
平臺在數據標準化的過程中,同時關注數據的垂直化,確保各級數據向上級粒度集計統計時的嚴謹性和便捷性。一方面要求具有歸屬關系的下級粒度面層、點層要素需繼承上級粒度的屬性,如縣區級要素需同時記錄所屬的地市、省等上級粒度信息。另一方面要求鐵路特有要素,如鐵路站點、鐵路線段起終點、鐵路小區,需同時記錄所屬行政區劃、交通小區的屬性信息。
2.1.2 功能業務化原則
功能業務化是保障平臺成為“生產力工具”的必要條件,專業化平臺研發的首要目的是支撐實際業務而非僅看重可視化效果。平臺主要從多級粒度、品類選擇、輸出圖表三個方面體現功能業務化原則。
首先,在數據標準化原則的支撐下,平臺提供了滿足不同層面業務分析的多級粒度的OD 分析功能。多級粒度包含縣區級、鐵路交通小區級、省(自治區)級、城市群級、地區級共五級粒度。
其次,平臺提供了靈活的鐵路客貨運品類、子品類OD 分析功能。鐵路OD 分析的一大特色是具備豐富的客貨品類信息,不同品類的OD 分析也是支撐鐵路規劃方案編制的重要依據。為滿足實際業務對分品類OD 分析的需求,平臺提供了客運量和貨運量的自定義品類功能。其中,客運量品類包含分車型運量子品類,貨運量品類包含煤炭、糧食等16 種子品類。
此外,平臺提供了地圖可視化、統計圖表、數據導出等業務強相關功能。在鐵路規劃日常工作中,OD數據可視化、統計圖表制作是高頻需求,為此平臺提供了靈活豐富的功能。考慮到日常業務中需大量使用數據的范式化表格制作以及數據的二次分析加工,平臺提供了高效且實用的數據導出功能。
2.1.3 使用便利化原則
在保障平臺功能對業務充分支撐的基礎上,為了提升易用性、降低使用門檻、提升使用效率,平臺對界面設計、交互設計進行充分優化,提升平臺使用的便利性。平臺主要從分析對象選擇、分析設置、工具箱三個角度體現使用便利化原則。
(1)靈活多樣的目標區域選擇方式。OD 分析目標區域是指平臺在自定義分析時所分析的對象。平臺對分析對象的選取提供了地圖點選、地圖框選、區域名稱搜索等靈活的選擇方式,提升了平臺使用的便利性。
(2)所選即所得的分析設置功能。平臺包括查詢設置和可視化設置兩種設置功能,均通過自動化手段進行了合理精簡,使用者僅需簡單設置即可得到預期分析結果。在運量統計方面提供了到達、發送、總到發、凈到發等常見分析項;在可視化設置方面提供了豐富的配色預設、端點大小、期望線粗細調整等功能,且均可在地圖可視化中即時生效。
(3)豐富快捷的工具箱功能。平臺提供了測距、測面積、半徑參考圓、圖幅書簽、設施搜索等小工具。用戶可使用半徑參考圓點擊地圖任意位置生成半徑為200km、400km 至1000km 的同心圓,便于進行距離參考;用戶可使用圖幅書簽記錄當前地圖位置和縮放等級。工具箱可在平臺各個功能下使用,有效提升了日常OD 分析的便利性。
2.2.1 總體功能設計
平臺的總體功能由分析設定組件、地圖可視化組件、統計圖表組件三大組件構成。其中,分析設定組件作為輸入端、控制端,由用戶輸入分析需求。地圖可視化組件和統計圖表組件為輸出端,輸出分析結果。在分析設定組件中,用戶可對分析時間、分析空間粒度、分析客貨品類、分析模式進行靈活便捷的設定;平臺根據分析設定的需求,從鐵路客貨OD 數據庫中查詢數據結果,并傳輸給輸出端;地圖可視化組件將使用OD 查詢結果和配套的背景數據共同生成地圖可視化結果;與此同時,統計圖表組件將生成相應的結果。
2.2.2 界面與交互設計
平臺采用清晰的分區界面設計保障了平臺的易用性和高效性。平臺總體界面包含上、下、左、右、中五部分。左面板為一級模塊選擇面板;右面板為分析設定面板;上面板為工具箱;下面板為統計圖表面板;中央最大面板為地圖可視化面板。其中,右側面板功能最為豐富,又包含上中下三個子面板:上部為分析粒度選擇面板,中部為自定義分析選擇集操作面板,下部為詳細設置面板。
3.1.1 選擇功能
為提供靈活的分析與可視化手段,平臺提供靈活的時間選擇、分析單元選擇、客貨品類選擇功能。時間選擇可以對各個涉及時間范圍的功能產生影響。粒度選擇功能包含地理區域粒度和鐵路專用粒度兩類。地理區域粒度包含縣區級、地市級、省(自治區)級、城市群級、地區級五種粒度。例如,選定地市級粒度,則OD 分析結果將以地市為單位集計統計。鐵路專用粒度包含鐵路小區、鐵路站點、鐵路線段、鐵路線四種粒度,其中鐵路小區和鐵路站點可用于鐵路OD分析平臺。品類選擇包括三級品類:一級品類為頂層品類,包含客運、貨運、行包三種類別;二級品類是對一級品類的展開,客運包含G、D、C、普車四種客運列車品類,貨運包括食品、農業、能源、材料、礦石、集裝箱、其他七種品類;三級品類是對二級品類的進一步展開,如貨運—材料品類進一步包含鋼鐵、水泥、木材、礦建材料四種品類。
3.1.2 OD 分析可視化功能
平臺提供了端點、期望線、區域面三類可視化效果,為專業人員提供了充分、靈活、易用的OD 分析出圖業務支撐。三類可視化效果以圖層形式組織,圖層可獨立開關,每類可視化提供具體設置項。
端點可視化包含運量、凈運量、結構構成三種模式。其中,運量模式提供了發送量、到達量、總到發量三種子模式,以氣泡形式渲染;凈運量為發送量與到達量的差值,主要用于體現貨運品類的凈流入、流出情況,以雙色氣泡形式渲染;結構構成模式包含發送構成、到達構成兩種模式,主要用于分析呈現各級品類的構成情況,以餅圖形式渲染。
期望線渲染模式包含發送模式、到達模式、雙向三種子模式。期望線以弧線形式根據右手規則嚴謹表達流向——從運輸的起點觀察終點,期望線位于右手邊。期望線支持彩色、單色渲染,同時支持粗細渲染,顏色和粗細隨交流量大小自動變化。
區域面渲染與氣泡渲染所使用的數據一致,主要用于突出運量差異性,彌補僅憑端點氣泡大小區分度不直觀的缺陷。區域面渲染支持不同色帶的選擇,如紅、黃、綠、藍色帶,紫、藍、綠、黃色帶等彩色色帶和單色色帶。
3.1.3 數據導出功能
為便于使用者下載數據進行文本編制或進一步分析數據,平臺提供了快捷的數據“一鍵導出”功能。數據導出將遵循分析控制組件設定的條件進行數據查詢,并將結果以Excel 格式下載至本地。數據導出功能包含基礎數據導出和定制表格數據導出兩種模式。基礎數據導出提供按選定粒度集計和原始OD 數據導出功能,如選定上海市(發送)對外省級OD 分析,則可導出上海至各省的發送量和相對應的原始OD 數據。定制表格數據導出是指按照規劃方案編制技術規程要求,導出的特定格式OD 數據表格,以規定的矩陣形式組織OD 數據,并在鑲邊行進行自動集計統計。
平臺開發定位為生產力專業工具,故對日常工作的效率提升可直接體現應用效果。平臺內測版現已投入使用,根據來自兩家大型規劃單位的兩個業務部門的日常使用反饋,相比于使用SQL、Excel、ArcGIS等工具而言,以處理“特定年份自選某一地市至全國各省特定多種貨品的運量”為例,應用平臺使OD 數據處理、查詢平均時間從18min 縮短至2min;基于桌面GIS 軟件的OD 標準化出圖(含數據處理、查詢)的平均時間從34min 縮短至4min;總體平均時耗減少約90%。
由此可見,平臺可顯著提升鐵路OD 分析工作的效率,有效減少數據處理、查詢和出圖時間,使專業規劃人員可以將更多的時間和精力投入規劃方案的編制,提升了生產力,達到了平臺預期的建設效果。
結合“鐵路OD 大數據分析和可視化平臺”的實際開發經驗,提出了鐵路大數據分析工具開發應遵循的標準化、業務化、便利化原則,從數據組織、總體設計、功能實現方面介紹了鐵路OD 分析和可視化工具的構建方法,并基于用戶的實際使用體驗對平臺的落地應用效果進行了客觀評估。評估結果表明:平臺可作為生產力工具,有效提升日常鐵路OD 分析工作的效率,使鐵路客貨OD 數據分析工作時耗相較以往手工處理減少約90%。所研究內容對鐵路規劃領域信息化系統的開發具有一定參考意義,對我國鐵路規劃領域的數字化、信息化、智能化發展起到了一定的促進作用。