高君 張意騰 李旭
[摘 要] 隨著大數據時代的來臨和發展,企業的傳統供應鏈管理模式正逐步向協同化管理轉變。供應鏈服務的各企業自身及各企業之間有大量的數據交換和信息共享。但是這些數據往往是通過email、傳真、紙質文件、電子文件、數據接口等各種不同形式傳遞的,而且格式千差萬別,需要大量的人力去進行分析、跟蹤處理。中海油能源物流有限公司上海分公司立足智能數據識讀,輔助構建智能供應鏈數據平臺,融合多來源數據,從而高效、準確地采集、處理、跟蹤、查詢供應鏈信息,可實現可視化管理,有利于為供應鏈業務的高效協同提供堅實的數據基礎。
[關鍵詞] 供應鏈 協同管理 數據智能識讀
中圖分類號:TP311.13 文獻識別碼:A
近期,中海油能源物流有限公司響應國家“依靠信息技術推動企業數字化轉型”的倡導,全面推進公司產業塑造和技術提升,逐步對13大類通用物資進行物流集采,啟用集采平臺統一供應鏈供應。隨著集采模式的全面運用,整個供應鏈需要協同,還需共享源于供應商、物流商、公司內部以及甲方多個部門的供應鏈環節的大量數據。這些供應鏈數據來源廣且復雜、數據量大、形式多樣且儲存方式不統一等,存在數據分散且共享度低的問題。如果收集或者處理不及時,極易造成信息溝通和跟蹤困難,會使供應鏈數據的整體關聯分析難以實現,會對業務的處理效率和結果造成不好的影響。
因此中海油能源物流有限公司上海分公司考慮使用數據智能讀取處理方案,一方面將海量供應鏈信息電子化、數字化,另一方面結合人工智能技術與流程機器人平臺,實現數據的智能匹配和處理,節省人力資源,減少事務性、重復性、低難度業務的處理頻率,促進業務協同,提高資源利用率和工作效率,從而提升企業在數據智能識讀和處理方面的技術水平。
一、智能文件識別的實現思路
OCR(Optical Character Recognition)是使用掃描儀或數碼相機把文本資料掃描成圖像文件,然后對圖像文件進行分析處理,自動識別獲取文字信息及版面信息的軟件。
OCR引擎核心技術模塊主要由下面幾個部分組成:
(1)圖像輸入:讀取不同圖像格式文件的算法。
(2)圖像預處理:主要包括圖像二值化、噪聲去除、傾斜較正等算法。
(3)版面分析:將文檔圖片分段落、分行的算法。
(4)字符切割:主要處理字符粘連、斷筆造成的字符難以簡單切割的問題。
(5)字符特征提取:對字符圖像提取多維的特征用于后面的特征匹配模式識別算法。
(6)字符識別:將當前字符提取的特征向量與特征模板庫進行模板粗分類和模板細匹配,識別出字符的算法。
(7)版面恢復:識別原文檔的排版,按原排版格式將識別結果輸出到word或pdf等格式文檔的算法。
(8)后處理校正:根據特定的語言上下文的關系,對識別結果進行較正的算法。
智能文件識別是以OCR識別為基礎的,基于深度學習的先進算法,可精準識別多種文件和票據的圖像文字信息,適用于各應用場景,可以迅速提升輸入效率,優化用戶體驗。
考慮到物流公司供應鏈數據來源廣、形式多樣、數據量大且儲存方式不統一的情況,智能文件識別通過預配置存儲的業務文件類型、文件模板,結合OCR人工智能識別技術,可實現紙質業務單據數字影像的智能識讀,以及相應的智能化分類和關鍵業務數據的抽取,從而實現最終的供應鏈數據識讀的智能化處理。智能化處理的特點主要體現為以下幾點:(1)單證類型可配置,支持不同種類的供應鏈單據類型。(2)區域可配置,設置單據中不同的識讀區域。(3)參數可配置,根據不同的單據類型設置識讀的要素并實現參數配置化。(4)輸出格式可配置,設置輸出的文件類型,如word、pdf、excel等多種類型文件。(5)供應鏈數據智能化處理,將識讀出的各類供應鏈文件進行分類存檔、核心供應鏈數據按照識讀模板進行自動化匹配及存儲,幫助建立供應鏈業務數據庫。
OCR模板定義指的是針對客戶個性化的單據需求,根據單據的格式來定義識別的規則。OCR模板定義分為:上傳設備掃描圖片、定義框選參照字段、框選識別區。識別區就是真正要識讀的區域,系統通過第二步會將圖片“擺正”,下一步就是識讀,針對定義的識別區讀取數據。每個定義框選的區域都被認為是一個單獨的區域字段,每個字段可以指定識別規則,如作為文本或字母或數字等,準確的定義類型有助于提高識別率,最后對定義后的模板進行保存發布。
二、智能數據識讀助力供應鏈協同管理
通過智能數據識讀技術,中海油能源物流有限公司上海分公司實現了供應鏈文件智能讀取、識別、和處理,并可將結果保存成供應鏈各環節需要的各種類型的業務文件,形成了核心業務數據庫。其過程主要如下:
1.通過梳理各種訂單、單證的來源及各種復雜的業務單證格式及物流要素,成功設置了多種訂單識讀模板,如標準發票數據識讀模板、潤滑油采購訂單模板、集采平臺采購訂單標準識讀模板等,從而建立了業務數據識讀標準和規范,構建了業務識讀引擎,為數據自動識讀奠定了基礎。
2.借助OCR技術實現“自動化”模式的數據采集,實現了采購訂單、發票數據等自動識讀、自動分類、自動儲存。以往甲方的銷售訂單、采購訂單、供應商的發票信息等往往以電子郵件的方式傳達,這些信息均需要現場人員手工分類、錄入、匹配,且需要保存大量的紙質文檔,不便檢索和查詢。通過智能識別,這些供應鏈數據得以從文件中自動識別出來,并實現了自動分門別類的存儲,借助信息系統實現了自動數據的匹配(如銷售數據和采購數據的自動匹配、訂單數據和收貨數據的自動匹配、采購訂單和發票的自動匹配等)。自動識讀一方面大大減少了現場人員的信息錄入工作強度,另外一方面還保證了數據的質量,提升了數據錄入的準確率,可使現場人員把更多的精力投入供應鏈的管理中。通過對供應商、客戶原始憑證及發票的電子掃描及自動識讀等協同要素的自動識讀,實現了協同關鍵要素的快速提取和共享,減少了數據傳遞節點,大大提高了協同工作效率,實現了供應商、采購商、物流商的多方協同工作。
3.將供應鏈管理過程中各環節、節點中復雜多樣化的各類原始業務憑證和文件(包括紙質文檔、word、excel、pdf、jpeg、數據庫文件等多種類型文件) 電子化、體系化,進行存檔管理,如銷售訂單、銷售合同、供應商報價文件、采購訂單、采購合同、入庫單、發貨單、供應商發票等關鍵節點的關鍵文檔,構建供應鏈協同工作的電子化業務數據庫。
4.在銷售報價及采購方案的確定過程中,借助自動識讀數據工具,提升智能化管理水平。上海物流分公司針對上百個服務商及幾千個供應商的業務邏輯及管理模型進行梳理,完善物流公司采購及供應的供應鏈業務數據管理模型。通過電子化、智能化的處理引擎,自動形成了采購及銷售的預推薦方案,供業務人員參考、借鑒、落實,極大提高了業務人員的工作效率,減少了不必要的冗余操作。
5.在解決現有規范格式文件的自動識讀和存檔處理的基礎上,可對新應用文檔進行模板設置,在自動識讀技術基礎上進行了智能化的改進,可減少采辦錄入工作量,提高了業務數據的采集效率,減少采辦人員在采購過程中的出錯率,提升業務流轉效率。針對數據中大量出現的情況進行針對性檢查,并通過數學描述與業主一并提高物資的周轉率、分攤合理性,降低物資庫存量和庫存占用資金,從而提高物流的整體運營水平。
中海油能源物流有限公司上海分公司通過將集采業務涉及的各種單據及關聯系統的數據進行數據自動識讀、智能處理、規范化的存儲,實現了數據的集中存儲、集成應用。關鍵供應鏈環節數據得以實現快速收集、處理和分析,為實現采購、物流直至供應環節的對應供應鏈數據自動匹配奠定了堅實的數據基礎,有利于提升倉儲管理服務工作,有利于為貿易物流節約成本。
中海油能源物流有限公司上海分公司目前只是實現了部分客戶需求、采辦、費控的部分環節的供應鏈管理數據的智能識讀和處理。未來我們要考慮整條供應鏈的數據協同,克服供應鏈信息孤島,解決供應鏈上下游企業間信息共享同步性差、信息不透明的問題,使整個供應鏈條實現準確敏捷的響應;要實現從客戶需求到詢價、報價、采辦、供應商發貨、收貨、開票、費控、管理分析等全供應鏈數據的快速識別、處理、共享、分析,以采集與跟蹤物資供應鏈全生命周期的數據。我們還要建立供應協同平臺,利用全面的供應鏈數據,整合上下游企業物資供應鏈信息,進行業務模型分析,滿足上海物流的供應鏈管理需求,為企業降本增效、降管理、決策提供數據支持。