王 華 王 瑾/浙江省能源集團有限公司
馮萍萍/浙江浙能電力股份有限公司蕭山發電廠
企業重要業務平臺電子文件歸檔與電子檔案集成利用項目,是浙江省檔案局推薦、國家檔案局與國家國國家發展和改革委員會聯合發文批準的項目,也是浙江省唯一一家列入國家“企業電子文件歸檔和電子檔案管理”的第一批試點項目。該項目對浙能集團和全省檔案工作的意義十分重大,得到到國家檔案局、省政府、省檔案局、浙能集團等各方的政策支持與相關保障。
該項目主要解決浙能集團重要業務系統中辦公OA系統、合同系統、CAD系統通過接口與SEAS檔案管理系統的歸檔集成問題,著重解決業務系統電子文件歸檔與電子檔案管理問題,并通過四性檢測、CA認證等解決電子文件與電子檔案安全性保障問題,同步開展基于大數據技術的電子檔案開發利用與研究,最終形成可推廣的規范性文件,以期為集團型企業電子文件歸檔和電子檔案管理的研究與推廣起到示范作用。
合同系統、OA系統、CAD系統與檔案系統的歸檔集成通過接口方式實現。在檔案管理系統數據歸檔集成中,平臺針對結構化數據和非結構化數據的特點,分別采用Web Services接口和sFTP接口,其中元數據、指令消息、路程數據等結構化數據使用Web Services接口進行交互,電子文件、影像、圖紙等非結構化數據使用更為高效和安全的sFTP協議進行傳輸。通過調用檔案管理系統提供的Web Services和sFTP接口,數據被收集、保存到檔案管理系統中。數據交換通過標準的XML文件格式進行交互,實現業務系統電子文件在線歸檔。下面筆者以合同系統為例,描述業務系統與檔案系統的歸檔集成。
用戶在合同管理系統中辦理流程,流程結束后會形成一些結果性文件,用戶選取需要歸檔的電子文件及元數據(XML格式),通過接口歸檔到檔案管理系統預歸檔庫,進而歸檔到檔案管理系統檔案庫,由檔案管理系統對電子檔案進行管理與利用。
接口技術開發原則與技術要求主要包括以下幾點:第一,需支持多語言和基于規范的平臺,不受限于特定的操作系統或硬件平臺;第二,通信方式(訪問協議)需使用國際標準;第三,編碼采用UTF-8編碼傳輸數據;第四,能支撐高并發且運行穩定;第五,需網絡化,無需任何插件等。
Web Service使用標準技術,應用程序資源在各網絡上均可用。這是因為Web Service基于HTTP 、XML和SOAP等標準協議,所以即使用不同語言編寫并且在不同操作系統上運行,也可以進行通信。因此,Web Service適用于網絡上不同系統之間的通信。
在綜合檔案管理系統中建立具有三層結構的“合同預歸檔庫”與“合同檔案庫”,分別為合同項目級(相當于案卷級)、合同文件級(項目所包含的文件條目)、合同電子文件級,檔案系統默認將合同系統的選定字段信息全部接收,以保證合同檔案信息的完整性。合同系統與檔案系統案卷級字段對應關系如下:公司代碼—全宗、合同編號—檔號、合同名稱—案卷題名、公司名稱—立卷單位、公司名稱—主要責任者、相對方全稱—次要責任者、履行期限—履行期限、簽訂日期—日期等。
電子檔案的四性即真實性、完整性、可用性和安全性,檔案系統必須具備四性保障的功能。根據國家檔案局要求,該項目對檔案系統進行了進一步開發,著重對電子文件歸檔的四性保障進行有效檢測。制訂了OA系統、合同系統、CAD系統接口歸檔電子文件元數據標準,根據元數據項制訂詳細的四性檢測項目。
一是真實性保障。主要通過IT技術和管理相結合的方式,保證電子文件在收集、移交、檢測、整理和電子檔案保管、利用、遷移、移交進館等過程中操作的不可抵賴性、數據存儲的完整性、用戶身份的真實性,保證電子文件和電子檔案信息不被非法更改,并保證電子文件和電子檔案的內容、結構和背景信息經過傳輸、遷移等處理后與形成時的原始狀況相一致。檢測方式是檢查電子文件的背景信息以及打開文件并查看其內容,技術上通過“數字簽名”使系統自動監控和發現文件是否被修改,并結合人工方式判斷內容是否完整、是否真實。
二是完整性保障。主要是確保電子文件的內容信息、背景信息、結構信息等沒有缺損。檔案系統檢測可根據電子文件歸檔和電子檔案管理要求進行設置和調整,可自行定義檔案名稱、類別、編號、適用范圍等文檔庫的屬性信息,還可自定義哪些字段可以為空、哪些字段不可為空。管理員根據不同的檔案門類設置好相應的必輸項,系統在接收時會進行自動檢測,并提醒管理員元數據是否完整。
三是可用性保障。主要是保障電子文件和電子檔案的長期保存。一是采用PDF/A的格式作為電子文件存儲格式,通過格式轉換后進行數據封裝;二是對各種類型電子文件的瀏覽編輯軟件環境進行備份。其檢查主要是檢查電子文件是否具有可理解性和可利用性,包括軟件的完好性、信息的可識別性、存儲系統的可靠性、軟件的兼容性等,可采用檔案管理員人工檢查結合軟件系統自動檢查的方式進行。還要進行有效性檢查,即在技術上判定文件是否可讀并加以提示。
四是安全性保障。主要是對電子文件的安全性采取保障措施。對于安全性的檢查主要體現為檢查文件是否感染了病毒,因此在公司網絡內部署查殺病毒軟件是一個較好的方式。此外,建議由企業科信部定期給出查殺病毒報告。
當前,企業已不再局限于對信息進行保存和檢索,而是重視依托新時代的信息技術實現對信息的分析和加工重組,由此衍生出大數據概念。檔案是信息資源的重要組成部分,檔案工作更需要適應新時代社會的要求,從傳統的“重保管、輕利用”的模式向“重保管更重利用”的模式轉變。檔案的“重保管更重利用”模式,是在遵循檔案管理規范和保管要求的同時,對檔案進行分門別類的開發利用,并作為全新的檔案管理模式,為企業進行大數據分析提供必要的決策支持。
盡管目前集團檔案數據還達不到大數據的規模,但集團所擁有的數據來源廣泛、格式眾多,并且隨著集團下屬單位檔案系統的部署,檔案數據量快速增長。在此情形下,集團迫切要求對海量海量檔案數據進行分析,挖掘其中的信息價值。該項目除了應用大數據技術對電子檔案信息開發利用進行研究、針對檔案數據與不同屬性字段進行分組統計外,還對檔案數據進行大數據研究和分析,以OA系統、合同系統文件審批流程中流轉速度的快慢、審批所需時間的多少為研究對象,通過對單個樣本進行分析,以及與整體樣本的平均速度進行比較,分析出單個樣本的工作效率,進而分析集團的管理效率,從而提高管理效率。
根據國家檔案局電子檔案試點項目的要求,對納入檔案數據庫的歸檔文件實現數字簽名與電子簽章數字認證,同時考慮后期將數字認證在全集團進行推廣。數字認證能夠滿足對數據的完整性要求,防止數據被篡改或抵賴,確保數據私密性并實現身份認證,從而保證網上交易數據的完整性和可信性。該項目雖然可采用MD5的方法進行數據真實性校驗,但為保證數據的真實性,應采用數字簽名技術進行驗證。
該項目鑒于三個接口系統具有復雜性,選擇OA辦公系統歸檔到檔案系統的電子文件進行跨系統傳輸的數字認證,主要包括CA認證與電子驗簽、CA認證對電子簽名與電子簽章的有效性問題、電子驗簽對電子文件各種格式的有效性問題。CA認證應用跨系統傳輸,檔案系統接到文件后不再做可視化(改變源文件)處理,以避免歸檔后的文件對CA仍有依賴。
[1]李向前.論檔案工作中電子文件的“四性”保 障[EB/OL]. http://www.docin.com/p-699637273.html.