楊晶晶
摘要:在新形勢下,建設企業高質量檔案數據中心勢在必行,我們通過檔案數據的自動歸類整合與分析,可以有效保障企業檔案數據安全及實現檔案數據應用。該文論述了企業檔案數據自動分類管理的目標、意義、規則設置、實施以及管理模式等,以期將檔案數據自動分類管理進一步推廣,使其成為企業中一項可持續、可執行的常態化工作。
關鍵詞:檔案數據 數據分類 數據管理 自動化
在數字時代背景下,企業檔案數據增長快、體量大。為充分發揮企業檔案數據的資產價值,使其能夠準確、清晰地反映業務經營成果,進而推動企業高質量發展,企業在業務經營管理過程中,就需要深入開展檔案數據管理,對檔案數據分類管理模式做進一步的研究與創新。這里需要指出的是,本文中所提及的企業檔案數據自動分類主要是借助專業系統對前端業務系統收集歸檔到數字檔案館中的數據實現自動組卷/件、分盒、添加管理標識等。
企業檔案數據自動分類管理的目標主要在于實現企業檔案數據自動整編功能,按照整理規則對整編庫中的數據進行模擬組件、裝盒,生成檔案著錄項,自動添加文件標識,比如歸檔章、條形碼、頁碼等,并由管理員進行復核審查,完成檔案的整編。
企業檔案數據自動分類管理的主要意義在于:第一,實現全程系統控制,減少了人工著錄,降低了著錄錯誤率,提升了規范化水平;第二,極大地提高了檔案整編的工作效率,降低了人力物力成本;第三,提高了檔案整編的規范性,在整編過程中規范歸檔章、頁碼、條形碼等格式及內容;第四,提升了企業檔案數據管理水平,優化了其管理、存儲、利用整體過程。
(一)企業檔案數據自動分類管理目標
1.實現檔案數據自動組卷/件,主要實現途徑為:數據組卷/件規則的設置、程序設計以及系統處理。
2.實現檔案數據著錄及編碼,主要實現途徑為:數據著錄規則設計、數據編碼規則設計以及系統處理。
3.實現檔案數據標識及歸檔管理,主要實現途徑為:數據標記及添加水印、數據檢查及處理、格式管理并生成歸檔文件。
4.實現檔案數據模擬封裝組盒,主要實現途徑為:數據模擬封裝規則設計、程序設計及系統處理。
(二)企業檔案數據自動分類規則設置
企業檔案數據自動分類管理功能應與統一管理平臺無縫對接。在改造升級時,二者可以同設計、同開發、同測試、同實施,功能建設尚未一致的應及時通過二次開發實現。
自動格式轉換是實現自動整編及打印的前提,并且有利于數據及電子文件的長期保存,統一的格式有助于模擬組件、分盒、添加頁碼標識等;自動整編是系統整體承上啟下的重要步驟,是實現自動化管理、解放人力物力的關鍵,管理員的角色也由檔案整編者向審查者轉變;全文檢索有助于提高查詢利用效率。各個分項功能互相關聯,最終助力企業實現檔案數據的自動化分類管理。以下為具體系統規則設置要求。
1.系統設置組卷題名規則為“年度+部門”,數據庫待整理中的文件按照系統分類字段自動加入各個當前卷(除合同/資料類數據外)。
2.行政發文、行政收文、行政合同類數據組件規則為:同一部門及保管期限一文一件,按照文件形成時間排序,同時設置部門順序。
3.生產合同類文件組件規則為:同一部門一文一件組件,按照文件編號排序。
4.檔案數據模擬裝盒規則為:同一部門同一保管期限內,根據文件頁面數量判定盒號,盒號編制:01、02、03、04……NN。
5.檔案編號規則為:全宗號+年度+保管期限+件號。
6.將整編庫中每條數據對應的全部電子文件進行格式轉換及文檔合并,將電子文件按照批辦單—正文—附件的順序合并為一個PDF版式文檔。
7.合并文檔命名規則為:檔案編號+文件編號+題名。
8.將合并后的PDF版式文檔添加歸檔章、條形碼、頁碼水印。
企業檔案數據及電子文件歸檔依據企業文件材料歸檔范圍和數據保管期限表執行,電子文件的背景信息和元數據的保管期限應與電子文件內容信息保管期限一致。電子文件及數據收集歸檔時間按照各類規定執行。
(三)企業檔案數據自動分類管理的實施
企業檔案數據自動分類管理的組織及實施過程如下所述。
1.系統對檔案數據進行處理前首先需要進行數據檢查,“數據檢查”功能將針對打印任務中的數據進行文件下載、文件格式轉換(將非PDF格式文件轉換為PDF格式文件),在檢查過程分別對正常的、異常的數據予以標記。
數據檢查完成之后,系統就可以進行生成歸檔文件的操作。生成歸檔文件功能,可實現將數據進行標識后按照文件順序合并生成一個版式文檔,這樣既便于數據應用,同時又便于數據的長期保存。
2.檔案自動組卷功能需將組卷規則設置到程序設計中,啟動程序后,該功能項將待組卷數據分類別歸入不同數據卷內。
3.生成數據編碼功能將會按照規則生成件號和檔案編號。其中,件號的生成規則為:同一部門同一保管期限內按照文件形成時間升序排列,順序生成三位編號(位數不夠的,在數字前用“0”補位);檔案編號的生成規則為:全宗號+年度+保管期限+件號。生成檔案編號之前,系統會對必需的字段進行檢查,當存在必需的字為空的情況時,不能進行檔案編號生成,必需的元數據項為:部門、年度、保管期限。
4.自動模擬組盒功能按照部門、保管期限、頁數的制定規則生成盒號,系統默認每盒頁數不超過300頁,不同部門、不同保管期限的數據不在同一盒中進行混裝,裝盒時按照“檔案編號”字段升序順序進行。在開始進行自動組盒之前,系統將對必需字段進行空值驗證,驗證的字段為:部門、保管期限、頁數。
5.系統設置生成審批單功能,針對檔案數據,根據數據目錄生成PDF格式審批單文件,并且自動在生成的審批單文件中添加對應的條形碼及歸檔章標識。
企業檔案數據自動分類管理系統的功能屬性如下所述。

第一,整編數據自動組卷管理,主要包括:組卷設置,即依據數據管理及分類編碼數據設置組卷信息;數據分類程序設計,即通過程序實現類別判定自動化輔助;數據組卷結果存儲使用,即對數據組卷完成結果予以查驗,查驗無誤后,應用組卷分類結果開展數據管理。
第二,數據編碼管理,主要包括:編碼設置,即依據數據分類規則設定數據編碼規則;關鍵字段驗證,即對編碼規則中必要的關鍵字段實施驗證,驗證通過后自動編碼;數據編碼實施并存儲,即實施數據編碼并將數據編碼結果設定專門字段存儲。
第三,線下登記數據管理,主要包括:數據標識,即對線下登記數據增加數據標識,便于與接口處收集的數據統一管理;數據格式維護,即將格式統一為版式文件;審批單設置及生成,即為線下登記數據設計與接口數據同類的審批單模板。
第四,數據模擬封裝及自動組盒,主要包括:模擬封裝設置,即根據數據容量的大小判定模擬封裝設置規則;數據字段驗證,即對開展模擬封裝的必要字段進行驗證,驗證無誤后開始封裝組盒;封裝盒號判定,即對封裝盒號給出系統判定;封裝依據設置,即根據實際情況修改封裝依據的設置;加入當前封裝盒,即對判定無誤的數據加入系統給出的模擬封裝盒;重新組成封裝盒,即對判定不準確的數據重新組成模擬封裝盒。
第五,數據處理,主要包括:數據檢查,即對待處理的數據開展檢查,對于檢查正常的,進行數據處理,而對于檢查異常的,待將異常數據處理完畢后再予以檢查;生成歸檔文件,即為數據對應的電子文件添加標識等必要程序后生成可用于檔案數據管理的歸檔版式文件;數據導出,即對待處理數據按照需求格式導出;數據合并上傳,即數據對應不同電子文件的合并上傳;數據格式管理,即數據格式統一轉換為PDF版式文件予以管理。
系統建設前,企業檔案管理員對于數據整編主要依靠手工操作,質量上可控度弱,影響了數據管理工作的質量及效率,因此亟須改進。隨著技術的升級及高效管理的需求,企業需要在此基礎上提升系統自動化管理水平,加強前端控制,提高管理的規范性及增強質量管控,降低人力物力成本,實現提質增效的目標。企業檔案數據自動分類管理模式如圖1所示。
企業檔案數據自動分類系統按照規則能夠實現電子文件自動組件功能,統計電子文件頁數,模擬裝盒,生成著錄項及設計標識水印,實現電子文件全文檢索等。這一系列操作大大提高了企業檔案數據管理效率,節省了人力物力,進而可以推動企業提質增效,實現高質量發展。
參考文獻:
[1]楊帆,王強.大型企業檔案資源分類體系建設實踐與思考.北京檔案,2020(10):33-34.
[2]霍光煜,張勇,孫艷豐.基于語義的檔案數據智能分類方法研究.計算機工程與應用,2021(6):247-248.
[3]王泓.電子文件自動分類方法概述.檔案與建設,2017(1):29-31.
作者單位:中交第一航務工程勘察設計院有限公司