馬 利
(中國鐵路北京局集團有限公司 貨運部,北京 100860)
鐵路保價和貨物損失處理工作是貨運服務的窗口,事關運輸合同覆行、企業權益,以及鐵路貨運服務形象。鐵路保價運輸信息化是適應鐵路現代化企業轉型發展、強化保價專業化管理、加強決策分析支持的重要手段。在鐵路運輸逐步向市場化管理轉型中,提升鐵路保價運輸管理水平,為客戶提供包括互聯網在內的多種服務方式的貨運全流程服務,是鐵路貨運信息化的一項重要任務。鐵路保價運輸管理系統(以下簡稱“鐵路保價系統”)作為鐵路保價運輸工作的重要組成部分,在保價運輸精細化管理,提高鐵路貨損辦賠效率,為客戶提供高效便捷的快速理賠服務等方面,發揮著日益重要的作用。
鐵路保價系統是集成管理保價運輸各業務功能的信息系統,實現了自承運保價時起至支付賠款時止的全業務過程的管控。作為鐵路保價運輸工作的重要組成部分,鐵路保價系統歷經多年建設及升級改造,目前已在全路所有開展貨運業務的車站、營業網點實現全覆蓋應用。
自2018年以來,根據鐵路向現代物流轉型發展的新要求,中國國家鐵路集團有限公司(以下簡稱“國鐵集團”)重新修訂了《鐵路保價運輸管理辦法》《鐵路貨物損失處理規則》《鐵路貨物損失處理作業標準》等規章制度[1-3],推廣電子施封鎖等新設備研發應用,持續提升鐵路保價運輸管理水平。由于鐵路保價系統開發時間較早,數據采集功能局限于當時的技術水平,基本是基于紙質文字電子化、結構化保存的思路設計開發,對于需要多人簽字的合同、協議等資料,尚不支持以圖像、文件等非結構化形式保存。因此,從強化內部貨運管理和適應外部市場需求的角度,推進鐵路保價系統對非結構化數據存儲的建設升級,完善保價綜合服務平臺,加快形成優質、高效的鐵路保價運輸服務體系,具有重要的現實意義。
近年來,隨著信息技術的飛速發展,在實際使用中,鐵路保價系統在對非結構化數據采集及存儲等功能設計方面存在與現場作業需求不匹配,與鐵路保價高質量發展的要求不適應[4]等問題,具體表現如下。
(1)對多樣化的非結構化數據采集功能設計不足。鐵路保價系統建設初期,受制于業務需求及信息資源條件,系統主要以實現紙質業務數據結構化存儲為目的,因而對于非結構化數據采集存儲的功能設計有限。如鐵路保價系統在貨物損失案卷處理功能[5-6]僅提供上傳照片功能,在合資地方鐵路收入分成、委托代辦、代理保險等協議登記功能中,只提供了結構化的摘要數據錄入功能,沒有提供上傳實際文件存儲的功能,造成系統不能完全保存查看協議文件內容的情況。鐵路保價系統在現場實際使用中,對于這些協議的登記功能使用率不高,也從另一方面反映了這部分功能上的設計不足。
(2)現有貨損案卷圖像采集功能繁瑣欠規范。鐵路保價系統目前只在貨物損失案卷處理功能中提供上傳照片功能,但在實際使用過程中,圖片從拍攝到上傳保存要經過下面一系列操作才能完成:數碼相機(手機)拍照—從相機中取出存儲卡—將存儲卡插入讀卡器—將讀卡器接入計算機—進入系統調取相關案卷—在此案卷上選擇并加載存儲卡中照片—照片歸入案卷并存入計算機中。其操作過程十分繁瑣,并且在使用數碼相機(手機)拍照的過程中,由于受拍攝設備硬件參數、拍攝光線、拍攝角度及拍攝質量等方面影響,拍攝的照片在分辨率、清晰度方面不規范,也影響貨物損失調查的準確性與實效性。
(3)現有貨損案卷圖像采集后缺少智能化處理。鐵路保價系統在貨物損失案卷處理功能中,僅能查看上傳照片,不能提取關鍵信息輔助結構化文字信息錄入,智能化不足。例如,在受理理賠時,系統需要對提賠人的身份證號、銀行卡號等信息進行錄入,同時需對身份證、銀行卡拍照上傳保存。在現有鐵路保價系統使用中,就要對結構化文字信息數據和非結構化圖像信息數據進行二次錄入操作,步驟繁瑣、容易出錯,影響作業效率。
結合業務需求及鐵路保價系統現場使用情況,針對實際應用中存在的問題,鐵路保價系統在非結構化數據處理中,亟需完善設計以下需求。
現有鐵路保價系統存儲的是結構化數據,是傳統的“程序+結構化”數據庫應用模式,很難適應大規模的非結構化數據存儲需要。從目前保價業務的需求來看,需要處理的非結構化數據應包括圖片、影像、文件三大類,圖片、影像類數據主要包括貨損處理現場勘察內容、提賠單位(人)的身份及企業資質材料、貨物價值證明等,文件類數據主要包括各種協議合同模板、正式簽署協議電子文件等。因此,鐵路保價系統應在現有結構化數據庫基礎上,引入非結構化數據存儲系統用于保存非結構化數據,同時將結構化數據和非結構化數據建立關聯,從而使鐵路保價系統支持的數據更完整,功能更完善。擴充非結構化數據后的數據架構圖如圖1所示。
目前對貨損采集是通過現場使用各種規格的數碼相機、手機進行拍攝,再將已拍攝好的照片上傳至鐵路保價系統,并不能直接通過系統進行拍照,導致拍攝的照片在分辨率、尺寸大小、清晰度等質量方面難以保證,亟需規范鐵路保價系統中的圖片采集,提高圖片采集的規范程度和質量。目前針對鐵路保價系統圖片采集,可在對應用設備進行二次開發的基礎上,無縫接入移動終端、高拍儀2種設備。
(1)高拍儀。隨著計算機圖像處理、圖像傳感器(CMOS)等技術的發展,高拍儀作為穩定、高效的辦公設備應運而生。高拍儀集傳統辦公設備功能于一身,能代替普通掃描儀、相機、攝像頭等諸多設備,可以實現拍照、錄像、復印、網絡無紙傳真等操作。在現有鐵路保價系統的基礎上擴展功能,集成參數型號一致的高拍儀,開發鐵路保價系統對高拍儀設備的接口,將高拍儀作為標準辦公設備接入鐵路保價系統,實現在鐵路保價系統中能夠自動獲取高拍儀所拍圖像信息,通過高拍儀將被拍物證拍攝成照片直接存入系統并實現自動與結構化數據信息關聯,從而直接完成拍照、存儲、歸檔全部操作過程,減少操作步驟,也保證了圖像的規范及高質量。
(2)移動終端。保價運輸工作是一項綜合性管理工作,包括貨損處理與理賠、保價業務管理、投資管理、資金管理等多項內容。由于貨損處理與理賠工作需要經常到貨損現場進行貨損勘驗,理賠時也會上門為客戶辦理服務手續,這些現場數據采集工作對于基于固定PC設備設計的鐵路保價系統來說十分不便,達不到及時處理數據的要求。近年來移動終端在快遞業、零售業等已得到廣泛應用,有效提高了企業的工作效率及數據的準確性。鐵路保價運輸工作中現場數據的采集一直以來都是通過手工方式完成,再回到辦公場所錄入系統,工作效率不高。因此,針對鐵路保價運輸工作專門研制移動終端應用,可以極大提高數據采集的工作效率及準確性。
鐵路保價系統現場數據的采集,主要內容就是貨物損失現場的情況及貨主的身份、資質材料,需要拍攝成照片和影像,通過開發基于移動終端的鐵路保價系統APP,用以實現鐵路保價系統的移動辦公。利用APP調取移動終端的拍照功能,可實現這些非結構化數據的采集與關聯,也可充分利用移動終端的后臺數據信息,加強作為保價業務處理過程中圖像資料的證據嚴謹性。
目前鐵路保價系統在沒有引入高拍儀的情況下,對于身份證信息和銀行卡賬號信息仍需要手工輸入到計算機系統中,因此需要錄入人員在錄入后反復核對信息,保證信息正確。引入高拍儀后,由于高拍儀規范了統一分辨率、拍攝角度拍照,使照片的質量得到了保證,為圖像智能識別提供了可靠的信息來源,可以自動識別身份證號碼信息和銀行卡賬號數據,最終達到簡便操作,減少人為誤差的目的,便于進一步做好理賠工作。
需要識別的身份證和銀行卡兩類證件都具有防偽背景復雜、漢字數字混排的特點,而銀行卡賬號信息也分為印刷體和凸印字兩種,識別難度較大。因此,利用光學字符識別技術(OCR)實現的工作主要包括3個方面,即:圖像預處理、識別文字區域提取、文字識別。其中文字識別可以采用AI深度學習的方法,對相關文字進行標記訓練,使識別效率及精度大大提高,滿足現場的實際需要。同時將識別出的文字自動填入到結構化的數據輸入項中,簡化錄入過程。
技術實現方案本著易用性、統一性、先進性原則,在全路統一的鐵路保價系統上擴充、完善軟件功能模塊,無縫接入經過二次開發的專用移動終端、高拍儀設備,用以采集圖像、影像數據,保證功能的實現既體現貨運理賠對信息系統的統一操作要求,又體現貨運信息化對采用新技術新設備實現自動化、智能化的要求。
鐵路保價系統部署在鐵路內部服務網上,移動終端APP部署在運營商外網上,因而,在符合網絡安全規定的前提下,與信息部門共同研究,確定使用國鐵集團信息交換平臺進行內外網數據交換的方案。實現數據交換,首先需要鐵路保價系統在內網應用服務上開放一個WebService接口,用于接收APP的調用消息,接口參數為1個,多參數使用Map集合后JSON化處理,并根據類型標識區分功能。其次,在信息平臺上將鐵路保價系統在內網開放的WebService接口url地址及參數進行注冊,注冊后會生成1個新WebService接口url地址和1個安全認證Key。最后,鐵路保價系統在外網上開發、部署APP接入服務,接入服務調用安全平臺生成的新WebService接口url地址,同時將Key傳入,實現內外網數據交換[7]。內外網數據交換應用結構圖如圖2所示。

圖2 內外網數據交換應用結構圖Fig.2 Application structure of data exchange between internal and external networks
實現方案需要在全路統一的鐵路保價系統上做功能模塊的擴充。對于移動終端,一方面要在基于安卓的專用移動終端上開發保價移動端APP,實現保價數據錄入功能;另一方面在現有鐵路保價系統的后臺業務應用服務上,針對保價移動端APP數據交互內外網數據交換接口及APP接口,完成鐵路保價系統與保價移動端APP數據的同步。對于高拍儀,則需要在鐵路保價系統的保價瀏覽器端應用中,對定制的高拍儀裝備開發高拍儀接口,以便將高拍儀作為標準辦公設備接入鐵路保價系統,實現在鐵路保價系統中能夠自動獲取高拍儀所拍圖像數據[8]。接入移動終端、高拍儀應用結構圖如圖3所示。

圖3 接入移動終端、高拍儀應用結構圖Fig.3 Application structure with mobile terminal and high-speed camera involved
結合辦理業務的實際,目前需要識別的信息主要是身份證和銀行卡兩類證件。由于前臺瀏覽器、安卓等多端應用都要使用識別功能,因而需要放在后臺業務應用中實現,具體實現的工作包括圖像預處理、圖像文字區域提取和文字OCR識別3個方面。OCR文字識別流程如圖4所示。

圖4 OCR文字識別流程Fig.4 OCR process
圖像預處理是信息識別過程中非常重要的環節,預處理的效果極大地影響到字符信息的識別率。在通常情況下,由于拍照設備、證件磨損、成像環境等因素而產生的噪聲、偏色等問題,都需要通過預處理最大限度地消除與有效信息無關的干擾,從而獲得所需要的標準二值化字符圖像,以提高將要識別的信息的可檢測性。
圖片中要識別的文字信息雖是圖片中所包含信息的一小部分,但對圖像中需識別的文字區域進行提取是十分必要的。通過采用連通域特征的文字區域提取算法,根據候選區域二值圖中連通域特征去除非文字區域,確定最終文字區域。通過對一定數量的復雜背景圖像進行實驗,證明該算法效果較好。
文字OCR識別是整個過程的關鍵環節,識別率的高低直接影響用戶的體驗。通過采用基于Tesseracr-OCR的識別技術,對特定字符(如銀行卡上凸字賬號)的訓練,使識別效率及精度大大提高,滿足現場使用需要。
保價系統引入非結構化數據方案時,應以保價業務發展的質量效益出發,在現有保價系統框架體系下的方案,充分研究新技術、新設備接入的可行性及適配性,合理安排功能,方便操作及作業。目前,基于鐵路保價系統的總體框架,正在中國鐵路北京局集團有限公司進行研發、完善及試點工作。通過試點使用,及時總結經驗,形成示范效應,使新技術、新設備在全路保價業務中得到更廣泛應用。未來隨著新技術、新設備的發展,鐵路保價系統還將不斷融合新技術,推進鐵路保價運輸服務持續創新發展。