俞 輝/中國電建集團華東勘測設計研究院有限公司
當前信息技術快速發展,檔案工作數字化轉型不斷深化。新修訂檔案法明確要求企業事業單位以及其他組織應當加強檔案信息化建設,并明確“電子檔案與傳統載體檔案具有同等效力,可以以電子形式作為憑證使用”。國家檔案局下發《企業數字檔案館(室)建設指南》,并下發關于開展企業數字檔案館(室)建設試點相關文件,在全國范圍內組織實施企業數字檔案館建設,要求各企業積極申報。筆者所在的華東勘測設計研究院(簡稱“華東院”)為國家大型綜合性甲級勘測設計研究單位,近年來調整發展方向,實施“二三三”發展戰略,即提升“工程技術和數字化智慧化”為兩大核心能力,推動“水電與新能源、城鄉建設、生態與環境”三大業務工作。為更好地服務企業發展,企業檔案工作亟需轉型升級,建設企業檔案館能夠滿足企業數字化、智慧化的發展需求。2018年,華東院被確定為國家檔案局首批企業數字檔案館(室)建設試點單位。華東院積極開展試點建設工作,從組織、人力、資金等方面予以保障。經過1年多的建設,試點工作取得了豐碩的成果。2019年10月,“華東院數字檔案館建設試點項目”通過國家檔案局驗收。國家檔案局認為,華東院基本解決了電子文件四性檢測、長期保管、業務系統在線歸檔等技術難題,在三維模型+數據歸檔管理、自定義專題數據庫的數字化編研等方面有創新突破,建成了具有國際水平的企業數字檔案館,具有較高的示范效應和推廣價值,也為華東院逐步推進電子文件單套制管理奠定了基礎。
一是依托已有IT基礎設施,有針對性地建設大容量、高可靠性、高數據存儲安全性的存儲系統,配備快速整理、計算、檢索要求的高性能計算平臺;結合數字檔案館特殊應用與保護需要,對現有數據中心及機房、全球網以及華東云等IT基礎設施進行動態調整。
二是基于企業電子檔案管理系統網絡分內網和外網的實際,在內外網絡之間分別通過防火墻和入侵防御系統進行隔離和過濾,防止外部攻擊或入侵。為提高電子檔案管理系統的數據可用性、安全性、可遷移、可備份特性,系統中所有的電子檔案數據和元數據分開存儲。其中,電子檔案數據存放在文件服務器中,包含所有的圖紙、報告、文件、照片等電子文件,僅供內網訪問;電子檔案元數據存放在檔案主數據庫中,經過安全處理和相關權限驗證后可進行部分外網訪問。兩者分開存儲使得數據更加安全。
三是參照華東院多年來企業類ERP系統的開發和架構優化設計經驗,根據BMPMN2.0國際標準的相關要求,采用了Fix BPMCS企業級軟件開發平臺,具備較強的部署能力,擁有各種集群、多數據庫及多Web服務器,支持基于組件的軟件開發,具有廣泛的技術兼容性和可擴展性。采用三層Web技術架構,用戶基于企業內網或廣域網訪問系統;Web和業務服務器負責處理用戶的業務請求,并向用戶反饋處理結果數據。采用SQL Server數據庫,負責存儲相關檔案數據、業務數據、用戶數據等。
依照信息安全管理體系(ISMS)和信息技術服務管理體系(ITSMS)相關國際/國家標準,建立并完善信息安全和信息技術服務管理體系,并取得認證證書。安全保密體系方面,建立信息保護、安全審計、入侵防御等一系列主、被動安全防護系統,提高趨勢分析、風險防控和預警能力,提高故障診斷與回溯能力。技術防護方面,從物理環境、網絡、主機、應用、數據5個層面建立了較為全面的安全防護措施。
根據檔案珍貴程度、開放程度、利用率、數字化資金情況等,明確數字化范圍與順序。數字化依照《紙質檔案數字化規范》、華東院《企業傳統載體檔案數字化標準》等規范標準,應用專業修復技術、大幅面檔案掃描技術、圖像拼接技術、消藍、去污(噪)處理技術、錄音錄像切分優化技術、錄音錄像格式轉換技術、檔案復原技術。實行“三檢”制度,即印務公司數字化加工人員自檢、質量主管質檢、圖檔中心驗收,全面把控數字化工作質量。傳統載體檔案的數字化率達97.9%以上;實現OA公文在線歸檔14425件,設計流程系統在線歸檔14164件,工程項目管理系統在線歸檔310卷;建立大事記、機構沿革、典型工程等5個專題數據庫。
一直以來XML和JSON都是規范化的文件格式,其應用非常廣泛。大數據時代,數據交換的要求越來越高,近年來JSON已經超過XML成為應用最廣泛的交換語言格式,特別是在非關系型數據庫應用當中。JSON不僅減少了XML解析造成的性能問題或兼容性問題,而且對于Javascript來說非常容易使用。結合行業發展趨勢、華東院研發體系特點和工作效率考慮,采用JSON進行元數據封裝,為實現文檔跨系統共享成為可能。
華東院電子檔案管理系統的元數據有3種捕獲方式。一是系統自動采集。OA公文系統、設計流程系統、工程項目管理系統等業務系統在電子文件產生和流轉過程中,實時采集元數據的文件屬性信息;數字檔案館在電子文件歸檔和整理過程中,自動采集元數據項的檔案屬性信息,如文件題名、形成日期等。二是系統自動生成。電子檔案管理系統在電子文件歸檔和整理過程中,按照設定的規則自動生成,如錄入人、整編日期等。三是選擇著錄或手工著錄。無法通過上述兩種方式產生數據的元數據項,由檔案整編人員在電子檔案管理系統中通過預定義值域列表選擇著錄或手工著錄,如保管期限等。
一是OA公文系統與設計流程系統。基于華東院綜合信息管理系統的OA公文系統、設計流程系統與電子檔案管理系統進行對接,采用預歸檔庫作為中間數據庫,向數字檔案館歸檔。電子文件產生與流轉過程閉環時,在中間數據庫通過數據庫視圖的形式,從跨數據源的業務數據系統數據表中,自動采集電子文件屬性信息及流程處理環節信息。數據庫視圖具有視圖不可更改、數據從源表中生成的特性,由此數據安全性、有效性得到保障。此外,將業務系統電子文件的屬性信息和流轉過程固化為PDF文件,與電子文件及其元數據一并流轉至電子檔案管理系統預歸檔庫,再由檔案整編人員進行人工著錄,補充完整其他元數據信息,完成電子文件及元數據歸檔保存。
二是工程項目管理系統。工程項目管理系統與電子檔案管理系統的對接,采用總接口分發子接口的形式;接口方案整體使用UTF-8編碼;接口之間數據傳輸采用WebService技術,WebService采用HTTP協議傳輸數據;采用JSON格式封裝數據。工程項目管理系統電子文件及其元數據,在WebService中采取模擬http請求的方式,發送到中間庫進行相關檢測后由中間庫向電子檔案管理系統歸檔。在工程項目管理系統中根據配置自動采集需要歸檔的電子文件及元數據,項目檔案文控人員整編完善其他元數據信息,并提交在線歸檔審核。完成在線歸檔審核時系統自動觸發工程項目管理系統和數字檔案館對接,通過WebService中模擬http請求的形式調用相關接口,向中間庫歸檔工程項目管理系統的電子文件屬性信息和電子文件。業務系統將電子文件形成和流轉的元數據信息封裝到JSON文件中,和電子文件一并流轉至中間庫的同時啟動檢測程序。通過檢測程序的電子文件和元數據信息,再由檔案整編人員進行人工著錄補充完整其他元數據信息,完成電子文件及元數據歸檔保存。
為滿足電子文件長期保存需要,將電子文件審批流程也作為電子文件歸檔,研究電子文件自動轉PDF技術。華東院數字檔案館建設的電子文件格式轉換包括“兩類處理”“三類轉化”。“兩類處理”包括新產生電子文件的處理和歷史文件的處理。其中新產生電子文件的處理是在業務系統上流程閉環后自動將形成過程信息轉換為PDF,在中間庫中將不符合歸檔格式的文件自動轉換為PDF文件;歷史文件的處理采用電子文件自動轉換程序定時執行的方式實現,執行后將轉換成功的文件掛接到原來所屬的電子檔案記錄上并保留原文件,電子文件屬性自動標識為轉換附件。“三類轉化”指Microsoft Office文件格式轉化、AutoCAD文件格式轉化和電子文件審批流程格式轉化。
一是真實性檢測。通過MD5比對、xml文件解析比對、自動捕獲信息比對等檢測電子文件和電子檔案的來源真實性、元數據真實性、內容真實性、元數據與內容關聯真實性、歸檔信息包或移交信息包的真實性。二是完整性檢測。通過系統自動統計比對、自動檢測比對、MD5比對等檢測電子文件和電子檔案數據總數量檢測、元數據完整性檢測、內容完整性檢測以及歸檔信息包完整性檢測。三是可用性檢測。通過自動檢測比對、格式比對、人工抽檢比對等,檢測電子文件和電子檔案元數據、內容、軟硬件環境以及歸檔/移交信息包的可用性。四是安全性檢測。通過防護體系檢測、人工判斷讀取速度等進行歸檔和移交信息包病毒檢測、歸檔和移交載體安全性檢測、歸檔和移交過程安全性檢測。此外,還從功能測試、性能測試、安全保密測試、兼容性等方面進行電子檔案管理系統測試,確保電子檔案的真實性、可靠性、完整性、可用性、安全性。
采用的四性檢測方案能根據電子文件歸檔和電子檔案接收的檢測要求,對接收的電子文件四性和電子檔案有關屬性進行檢測,列表展示各份案卷/文件的四性檢測結果;還可查閱“四性檢測報告”,查看每份案卷/文件詳細的檢測報告,明確檢查結果細項。