周鵬程、張舒君
鐵路客運在我國交通體系中占據重要地位,其運輸里程綜合規模均為世界之最。當下階段,信息化技術對于鐵路客運的運營效率有著舉足輕重的作用,12306 客票預訂系統已被乘客普遍認可和使用。如今,廣大民眾出行,已經習慣采用手機軟件預定車票,憑身份證刷卡進站完成乘車。與普通票相比,學生票的認證仍然依賴傳統的優惠磁卡,記錄身份信息和優惠信息。
目前,火車優惠卡,主要適用的對象包括普通大學、大專院校、中等專業、技工學校在內的在校學生,用于購買固定區間的優惠價火車票。火車票的優惠時段為寒暑假的固定時間段,每年四次。除去休學、退學、未注冊等特殊情況,在校生均可享受優惠。
學生票作為客票的一種類型,其購票過程也可在12306 上完成,但其信息采集過程仍然延續傳統的模式。雖然,集成電路芯片做成的磁卡穩定性高、體積小,防偽性能不錯;但是隨著鐵路運輸信息化的發展,該方法存在一些弊端,主要集中在兩個方面:第一,學校搜集學生信息需依賴人力,由各個部門分批次逐一搜集學生的身份信息、乘車區間信息,工作量較大。第二,核驗階段煩瑣,目前鐵路運輸已全面進行電子客票推廣,原先采用的取票模式與電子客票的推廣理念不符。因此,學生票的數據采集過程以及傳統的取票、檢票流程亟須進行流程變更和技術更新。
針對學生票的研究集中在學生票的預訂、網上訂票、學生群體訂票等方面。通過信息系統進行售票,該方案起源歐美,英國在20世紀70年底就提供了相關的信息系統對運輸客車的時刻進行管理,并提供車票預定、多類型車票發售等功能。德國的鐵路運輸系統也較早進入成熟運營階段,德國研發的車輛技術先進,由德國提供技術的鐵路運輸車輛遍布各國,其提供的訂票系統:Trains,也在世界各國被廣泛使用。我國則到21世紀才開始著力發展屬于中國的在線訂票系統,并在短短幾年取得較大進步。我國鐵路系統自推出12306 訂票軟件以來,購票服務效率得到極大提升,鐵路部門的相關服務種類也越來越豐富,12306 軟件本身則逐步完善功能,先后具備了候補選票、自助選座等功能,同時提供了多樣化的支付方式。2019年以來,鐵路部門開始推廣電子客票,乘客乘車不再依賴紙質車票,而是可以選擇通過手機端的二維碼或身份證,檢驗進站。針對我國售票系統的信息化發展,學者們對學生票的訂票方式、數據采集流程等也進行了進一步的研究。王慧晶通過運用啟發式算法,根據各種優化目標和限制條件構建自動分配學生票的數學模型,實現車站學生票預訂信息處理的整體最優。屈驍勇提出一種基于中國高等教育學生信息網,進行學生身份核驗的業務流程再造方案,以替代基于優惠磁卡進行學生身份核驗的業務流程。蔣曉濤提出取消現行的優惠卡,建議借助互聯網進行前置檢驗學生票優惠方案是否滿足,借助教育部學生信息網完成檢驗。此方法將不再依賴磁卡讀取器、磁卡等設備,大大縮減了成本支出[1]。
綜上,可以看出學生票的信息采集模式較為落后,其采集信息的流程對人力、成本等消耗較多。目前的研究雖然對學生票信息采集流程、核驗方式進行了探討,但對于信息采集具體模式開展還不夠深入。本文將基于數據挖掘技術,對學生票的信息采集過程以及學生票的購票業務優化進行研究[2]。
為滿足學生票相關信息數據的采集,需有數據接口與12306 訂票系統中的個人身份信息進行補充和實時更新,方可滿足購票即核驗和出票。前文提到相關學者建議借助學信網進行信息核驗,但是學信網雖具備在校學生的基本信息,但學信網中的學生信息的更新并非實時完成,數據存在較大延遲,同時學生的乘車區間數據無法從學信網中獲取。因此,針對學生票的信息采集業務,可借助學生票業務數據平臺,依托互聯網獲取各個高校的相關數據,可從各個高校的教務系統等業務系統中獲取[3]。
學生票業務數據平臺,旨在建設一種高可用、高安全、高性能、易管理的公用技術支撐環境。借助學生票業務數據平臺中的數據中心的數據,可完成學生票的身份核驗前置,以達到目前學生票業務流程的優化。從學生票的信息來源單位出發,結合目前鐵路部門的購票信息系統做現狀分析及診斷,結合已有應用系統,規劃設計公用技術支撐環境,并基于一定的應用場景前瞻,部署合理的學生票業務數據平臺。一旦學生票業務數據平臺建成,就可完成學生票中的信息匯集,簡化原有流程,12306 訂票系統以及其他相關的業務系統產生的業務數據,將更具有價值[4]。
構建學生票業務數據平臺,應從數據安全、系統整合、災難備份為出發點,學生個人信息和乘車區間信息均為敏感信息,各個學校信息化建設程度也不同,基于此,可以以范本的形式對各個打算參與輸出數據的學校單位發出標準,具備數據安全條件的單位可接入數據處理中心。數據處理中心除了部署系統架構外,還需具備災難備份的功能,該備份中心可與原有12306 系統等信息化系統公用,以達最大化應用。學生票業務數據處理中心的設計架構,如圖1所示。
數據采集方面,將不再由學校內各個部門統計表格。而是由學校的信息化系統生成初始信息,建議該業務系統數據源從各個學校的教務系統中獲取,因為教務系統內具備準確的學生個人信息以及學籍信息,這兩大信息是學生票業務的基礎數據。各學校的教務平臺,生成初始表格,于每年規定的時間提醒學生登錄確認學生票優惠信息,學生可對生成的信息發出變更申請,可由業務管理員進行審核,完成更新。學生確認信息后,學生票的基本信息以數據包的形式通過網絡,傳輸到鐵路部門的學生票業務數據平臺。該平臺包括數據中心、集成平臺、票務門戶、統一身份和訪問管理四個組塊,通過這個四個組塊對學生票各項業務進行數據整合及業務互通,如圖2所示。
學生票相關的數據,來源于各個學校不同的信息系統,其數據還需在數據平臺中完成數據處理。從前瞻性考慮,數據平臺除了現有學生票的基本信息,還可從12306 訂票軟件等多個其他業務系統中采集業務數據,包含學生購票情況、車次的時序與區間信息等,以便對學生票業務進行多維度分析?;诖耍瑢⒉杉乃袛祿譃榻Y構化數據和非結構化數據。在結構化的數據中,學校端口采集的基本信息和12306 中注冊產生的基本信息,是最容易產生數據一致性問題的一類數據,需由單獨的管控機制對其進行管理;結構化的數據中還存在實時數據和非實時數據,其中許多實時數據主要是分級、秒級數據,例如學生登陸次數、某一趟列車被查詢次數等;此類數據內容簡單,但量級很大,在數據平臺中應實施合適存儲方案,在效率和全面性之前取得平衡。而非實時數據包括學生信息、購票記錄等,此類數據明確,數據量級的可預測性高,此類數據可用作火車票合理分配的數據參考,滿足學生在不同的時間段、最大概率購得目標車票。非結構化的數據諸如地理信息、設備模型等,可用于空間維度的分析與應用[5]。
原始數據被集成平臺采集后,來自不同數據庫的相同業務類型的數據,匯集在一起,形成集成視圖,存儲于數據操作層。這一層級中,可開辟緩沖區臨時存儲由業務應用提供的源數據,作為數據倉庫數據來源的一部分。該部分數據進行抽取和轉化,有效數據將被收集在數據倉庫中,數據倉庫包含相對穩定的數據倉庫數據模型,支撐大部分學生票系統的關聯應用。這些數據按主題存放,存放數據及歷史信息。在數據倉庫中,學生票相關的各類業務將被按主題分類;此時的數據,不管是高校系統中獲取來的信息數據,還是網上購票系統的購票記錄,都可以轉化為高度集成、高質量的標準數據,并且數據將按一定頻率更新。至此,數據倉庫中的數據已經是標準的,易用的[6]。
針對某個主題域、部門或用戶分類的數據集合,經過再次匯總、轉化后,形成可滿足用戶快速訪問的數據,在數據集市中進行呈現。數據集市的建設由業務需求驅動而形成,因此,數據集市的開發一般是迭代開發的過程。其處理過程如圖3所示。
通過建設學生票業務數據平臺,優化了原有的學生票相關業務流程,節省了成本。數據平臺的搭建,將學生票相關業務數據進行集中管理,運用數據挖掘技術,各類業務數據按需重新分類,并進行可視化的呈現,為學生票業務提供了有效的決策依據。學生票業務數據平臺可提供多協議接入、消息路由、消息映射、集成監控和安全等功能,滿足應用間的互聯互通需求,實現松耦合的應用集成。除12306 軟件外,諸多業務系統數據得到有效交互,數據集成平臺對學生票相關信息實行端到端、全過程的追蹤、運行和預警。
未來,借助平臺的數據信息和分析功能,學生票的發布將更具針對性。例如,根據往年購票數據,熱門班次的列車可根據歷史數據有序調整?;趯W生購票習慣分析,學生票的相關業務將更為智能和個性化。