白潔音 尚爾博



摘要:本文描述了基于物聯網技術的智能檔案管理軟件系統,從體系結構、功能模塊、關鍵技術等方面論述了該系統的特性。該系統包括檔案錄入、檔案掛接、檔案核驗、檔案背脊打印等功能模塊。
關鍵詞:人工智能 物聯網 SOA
引言
在智能化檔案管理系統上線后,實現了對營銷業務流程流轉中所產生的紙質檔案及電子檔案的管理。但是對于營銷檔案管理系統上線之前產生的歷史檔案,未能實現紙質檔案的電子化管理[1][2]。為有效利用營銷檔案管理系統對歷史檔案進行管理,保障營銷客戶檔案信息安全存儲,提高營銷檔案的利用率和使用價值,需要將營銷檔案管理系統上前已經形成的歷史檔案進行整理、電子化,完成檢查核對后整理入庫,進行統一管理。歷史檔案電子化工作實現對既有歷史檔案的補錄、整理和電子化,與已經上線營銷檔案管理系統相結合,實現電力客戶檔案的生成、收集、歸檔、更新等全過程與營銷各項業務辦理流程的緊密關聯,及時收集、實時更新、動態監控,確保紙質檔案與電子檔案的逐一對應及檔案內容的完整性、準確性與實時性。
本文按照國家電網公司營銷檔案管理規范的要求,為海量營銷歷史檔案提供一套高效、便捷的電子化輔助解決方案,將電子檔案納入營銷檔案信息化管理范圍內。在信息化的管理方式下,保證營銷電子檔案全生命周期的完整性、安全性,提高業務檔案的數據共享,方便各個不同崗位的業務人員進行調閱,提高檔案利用率;為營銷業務辦理提供支撐,顯著提高了營銷業務辦理效率。
需求分析
歷史檔案電子化的業務需求主要包括:〖檔案錄入〗、〖檔案掛接〗、〖檔案核驗〗、〖背脊打印〗等??傮w流程圖如下:
檔案錄入
本業務根據檔案管理規范,確定營銷業務辦理過程中產生的各類資料的收集規則,確保資料收集的規范化、合理化、階段化,具體包括供用電雙方在各類用電活動中形成的紙質文書和電子文檔,同時記錄紙質資料交接信息。
根據《國家電網公司營銷客戶檔案電子化管理規范》,按照業務要求,對資料及時進行電子文件封裝和業務信息電子化。
該業務項主要包括初始化、模板管理、選擇業務、檔案封裝。
檔案掛接
本業務描述業務人員依據檔案掛接規范,將按照指定格式整理好的資料文件和用戶進行自動掛接。
檔案核驗
本業務描述歷史檔案管理人員在檔案室及檔案庫房內對錄入、掛接后的檔案進行核對的過程,主要對檔案庫房內檔案盒、檔案袋、實體檔案資料及對應的電子化檔案信息進行核驗查詢、下達核驗結論、查看核驗記錄等工作內容。
背脊打印
本業務描述檔案電子化后紙質文件存放在檔案庫房內檔案盒背脊處信息的打印功能,通過查詢、打印等功能獲取檔案盒背脊信息并打印。背脊打印通過檢索盒條碼以及盒RFID后確認需要打印背脊的檔案盒,展示檔案盒背脊的相關信息如保管期限、檔號、案卷題名、條碼等信息。
性能需求
滿足系統能夠應對最大100注冊用戶,最大在線用戶50人,高峰并發用戶30人的應用需求,滿足系統設計的整體性能以及穩定性需求。
系統設計
總體架構
歷史檔案應用將業務中產生的基礎數據和收集的電子化資料在核準前放在歷史檔案平臺,在核準后被推送到非結構化數據管理平臺和營銷營銷檔案管理系統。歷史檔案管理應用所需的組織機構、人員信息等基礎數據需要從營銷基礎數據平臺中復制。總體架構如下:
關鍵技術
按照歷史檔案系統的應用架構和數據架構的設計,結合當前的技術要求和信息技術發展趨勢,歷史檔案應用系統采用技術先進性與成熟性相結合的J2EE的多層技術架構,以提高系統的靈活性、可擴展性、安全性以及并發處理能力;采用國網公司應用系統統一開發平臺SG-UAP,基于該平臺進行上層應用功能的開發;同時,在集成設計方面,采用基于SOA的架構策略,實現與企業內部業務應用系統、企業外部系統的集成[3][4][5][6]。
歷史檔案系統應用中涉及到大量非結構化數據的收集、存儲、管理、維護,關于非結構化電子檔案的處理有三個技術關鍵點:
異步并發存儲技術
電子文件、音視頻文件占用帶寬較大,限制上傳帶寬的情況下傳輸時間較長,需要通過異步處理上傳與續傳,并對多個終端的并發上傳任務能夠進行排隊處理。利用消息排隊機制與文件緩沖機制處理文件上傳時的異步并發問題。
智能文本識別技術
圖像文本識別技術是指高拍儀/掃描儀等終端設備檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程:即對文本資料進行掃描,然后對圖像文件進行分析處理,獲取文字及版面信息的過程。如何除錯或利用輔助信息提高識別正確率,是該技術的重點。
智能搜索技術
智能搜索引擎是以營銷業務數據資源和業務分類為基礎,對其進行采集、組織、存儲、利用,實現營銷檔案的索引庫以及豐富的搜索手段,搭建營銷全方位搜索引擎。實現人工和定時自動從歷史檔案應用數據庫和非結構化數據管理平臺中獲取數據,建立文檔采集庫和應用鏈接庫,并形成索引文檔,由搜索引擎對索引文檔的內容進行過濾、整合、分割、分類保存形成企業的索引文件庫。提供一套統一可靠的檢索入口,通過模糊匹配、全文搜索、高速索引等技術搭建搜索引擎,提供精確的搜索定位。
功能模塊設計
通過對歷史檔案應用的各項業務分析及應用功能的梳理,提煉出具體的功能主題及應用功能模塊,根據應用架構的設計方法及標準,設計滿足歷史檔案的總體應用功能藍圖。
應用功能藍圖主要包括檔案錄入、檔案掛接、檔案核驗、工作統計4個功能模塊:
本業務根據檔案管理規范,確定營銷業務辦理過程中產生的各類資料的收集規則,確保資料收集的規范化、合理化、階段化,具體包括供用電雙方在各類用電活動中形成的紙質文書和電子文檔,同時記錄紙質資料交接信息。根據《國家電網公司營銷客戶檔案電子化管理規范》,按照業務要求,對資料及時進行電子文件封裝和業務信息電子化。該業務項包括【初始化】、【模板管理】、【選擇業務】、【檔案封裝】。
檔案掛接
業務人員依據檔案掛接規范,將按照指定格式整理好的資料文件和用戶進行自動掛接,并通過OCR識別將電子化文檔數據抓取存入相關的數據庫中。包括【自動掛接】、【OCR識別】業務子項。
檔案錄入完成
檔案核驗
本業務描述歷史檔案管理人員在檔案室及檔案庫房內對錄入、掛接后的檔案進行核對的過程,主要對檔案庫房內檔案盒、檔案袋、實體檔案資料及對應的電子化檔案信息進行核驗查詢、下達核驗結論、查看核驗記錄等工作內容。包括【檔案核驗】、【查看核驗記錄】兩個業務子項。
檔案掛接完成
工作統計
本業務描述檔案電子化后過程中,為了統計各個實施業務人員或工作小組的實際工作量以及在工作過程中收集的相關信息。包括【工作統計】子項。
歷史檔案管理應用與周邊系統的集成包括數據集成、應用集成以及界面集成等三種類型,總體集成關系如下圖所示。

圖3
1)與營銷基礎數據平臺進行數據集成,歷史檔案應用通過JDBC數據庫訪問方式或WebService服務調用方式獲取基礎數據;
2)與營銷檔案業務應用之間進行界面集成,在營銷檔案業務應用中集成頁面清單。
3)與營銷檔案業務應用通過WebService方式實現應用集成;
4)通過調用非結構化數據管理平臺提供的接口實現已歸檔非結構化數據的存儲等功能;
5)向營銷電子文件系統推送受控電子文件;
6)與統一權限平臺進行應用集成,通過SG-UAP集成統一權限管理平臺實現身份鑒別、組織機構管理、權限控制、訪問控制;
7)與工作流平臺進行應用集成,通過SG-UAP集成業務流程管理平臺,支撐業務流程相關應用功能;
8)與IT運維管理系統(IMS)界面集成,通過集成IMS的監控頁面實現對歷史檔案應用運行狀況的在線監視;
9)與IT運維管理系統(IMS)進行應用集成,調用IMS的WebService數據采集接口向IMS上傳系統運行狀態數據,
物理部署方案
歷史檔案應用的物理架構視圖,分為生產環境和測試培訓環境兩部分,其中測試培訓環境可用于現場測試、仿真、用戶培訓。
歷史檔案應用生產環境構成情況如下:
1)配置一臺磁盤陣列,用于提供歷史檔案管理的結構化數據存儲、未歸檔電子文件的短期存儲;
2)配置2臺光纖交換機,組成HA模式,與磁盤陣列組成SAN網絡;
3)配置2臺PC服務器作為數據庫服務器,組成ORACLE 11.2.0.4+ASM+RAC模式,提供結構化數據管理功能;
4)配置多臺PC服務器,部署WEBLOGIC 11G,構成應用服務器集群,承擔Web應用服務。
5)配置2臺負載均衡器組成HA模式,用于提供應用負載均衡訪問;
結語
本文詳細描述了營銷歷史檔案電子化管理應用軟件系統設計與開發全過程。該軟件系統目前已基本開發完畢,并在河南等省營銷檔案管理應用中得到了實踐檢驗,系統性能滿足需要,功能配置完善靈活,得到了用戶的一致好評。
參考文獻
軟件導刊,2009年8 月第8卷第8期,《電力營銷客戶檔案管理系統設計與開發》,吳喜萍,段凡丁
農村電氣化,2010年第12期,《電力營銷客戶檔案管理系統的開發與應用》, 張學政
《GB/T 8567-2006 計算及軟件文檔編制規范》
《GB/T 5271.1—2000 信息技術》
《GB/T 11457-2006 軟件工程》
《GA/T 387-2002 計算及信息系統安全等級》