摘要:數(shù)字時代,集團型企業(yè)建設數(shù)字檔案館(室)成為一種必然趨勢。論文從集團型企業(yè)三種不同的檔案管理模式入手,比較建設數(shù)字檔案館(室)的成本投入,提供優(yōu)選方案,同時通過分析建設過程中可能遇到的困難與挑戰(zhàn),從頂層設計、接口建設、科技賦能、安全防護等角度出發(fā),提出建設策略,以供集團型企業(yè)參考。
關鍵詞:集團型企業(yè) 數(shù)字檔案館(室) 電子檔案
隨著信息技術的不斷發(fā)展,大數(shù)據(jù)、人工智能、區(qū)塊鏈等新興數(shù)字技術帶來重大產(chǎn)業(yè)變革,檔案管理與利用正向著自動化、數(shù)字化、智能化的方向發(fā)展。2017年,國家檔案局制定《企業(yè)數(shù)字檔案館(室)建設指南》(以下簡稱《指南》),對企業(yè)建設數(shù)字檔案館(室)的標準要求做出明確規(guī)定。[1]2021年,《中華人民共和國檔案法》頒布實施,提出要加強檔案信息化建設、保障檔案信息安全、推進電子檔案管理信息系統(tǒng)建設、推進傳統(tǒng)載體檔案數(shù)字化等,為促進集團型企業(yè)數(shù)字檔案館(室)建設奠定了堅實的法律基礎。[2]近年來,“數(shù)字中國”也頻頻登上熱搜,在中共中央、國務院2023年印發(fā)的《數(shù)字中國建設整體布局規(guī)劃》中,明確要夯實數(shù)字基礎設施和數(shù)據(jù)資源體系“兩大基礎”,強化數(shù)字技術創(chuàng)新體系和數(shù)字安全屏障“兩大能力”,[3]為未來發(fā)展指明方向。集團型企業(yè)作為當今社會非常重要的組成部分,應響應國家號召,順應數(shù)字化轉型趨勢,推動數(shù)字檔案館(室)建設。
集團型企業(yè)是以一個或多個大型企業(yè)為核心,以若干個在資產(chǎn)、資本、技術上有密切聯(lián)系的企業(yè)、單位為外圍層,組合形成的一個穩(wěn)定的、多層次的經(jīng)濟組織。集團型企業(yè)各成員單位既接受統(tǒng)一領導,又保持相對獨立,多存在跨行業(yè)、跨地域情況,在業(yè)務的不斷變化發(fā)展中,兼并、重組時有發(fā)生,這就導致集團型企業(yè)形成了不同的檔案管理模式。
(一)集團型企業(yè)檔案管理模式介紹
集團型企業(yè)檔案管理模式主要有三種:集中式、分級式、分散式。
1.集中式,即建立一套檔案系統(tǒng),建立一個集團檔案館,將所有實物檔案及電子檔案都集中到一起進行統(tǒng)一管理。此種管理模式多存在于集團成員單位性質單一、數(shù)量較少的企業(yè)。
2.分級式,即建立一套檔案系統(tǒng),建立多個成員單位檔案室,對電子檔案進行統(tǒng)一管理,而對實物檔案進行分散管理。此種管理模式多存在于集團成員單位性質單一、數(shù)量多且分散的企業(yè)。
3.分散式,即建立多套檔案系統(tǒng),建立多個成員單位檔案室,對實物檔案和電子檔案都自行管理。此種管理模式多存在于通過兼并其他企業(yè)形成的集團型企業(yè),或是成員單位分屬不同行業(yè)的集團型企業(yè)。
(二)集團型企業(yè)檔案管理模式投入比較
筆者對三種檔案管理模式下集團型企業(yè)可否通過一次性投入完成數(shù)字檔案館(室)建設進行比較分析,形成表1。“一次性投入”是指主要由一個機構完成軟硬件設計、配備、測試,其他機構則可在此基礎上直接應用,或是主要由一個機構制定標準,投入一定人力、物力、財力,即可實現(xiàn)工作正常運轉。“一次性投入”占比越多,代表資源利用效率越高,并且成員單位數(shù)量越多,效果越明顯。
從表中對比情況可以看出,采取集中式、分級式管理的集團型企業(yè)通過一次性投入即可滿足建設要求的任務數(shù)量占比較多,而采取分散式管理的則占比較少。
對于采取集中式管理的集團型企業(yè)而言,“歸檔數(shù)量”和“歸檔過程”兩項任務能否通過一次性投入完成,主要取決于檔案系統(tǒng)及業(yè)務系統(tǒng)在歸檔前能否實現(xiàn)自動分類、智能鑒定等自動化功能,如能實現(xiàn),則可通過一次性投入完成;“傳統(tǒng)載體檔案數(shù)字化”“數(shù)字化場所及數(shù)字化工作安全保密”兩項任務取決于集團總部制定的政策,即檔案數(shù)字化是選擇集中一起完成,還是在業(yè)務開展過程中完成,如為前者,則可通過一次性投入完成;“專題數(shù)據(jù)庫建設”取決于制定的專題是屬于全局性的,還是某成員單位特有的,如為全局性專題,可由集團總部或獨立的集團檔案館通過一次性投入完成。
對于采取分級式管理的集團型企業(yè)而言,在與系統(tǒng)有關的任務中一般可通過一次性投入完成,而與實物檔案有關的任務則多由各級成員單位自行完成。
對于采取分散式管理的集團型企業(yè)而言,除了制度、存儲格式由總部進行統(tǒng)一外,其他大部分需由各成員單位自行建立。
綜上,在建設集團型企業(yè)數(shù)字檔案館(室)時,如各方面條件允許,集團總部可以提高系統(tǒng)自動化管理水平,統(tǒng)籌多方需求,做好整體布局,采用集中式或分級式檔案管理模式推動相關工作開展。
集團型企業(yè)數(shù)字檔案館(室)建設涵蓋總部和成員單位兩部分內容,總部在相關系統(tǒng)、設施設備、制度標準建設方面,需要以上率下,指導協(xié)調各成員單位共同推進。在此過程中,集團型企業(yè)經(jīng)常會遇到以下困難。
(一)成員單位檔案管理水平不均

集團型企業(yè)通常規(guī)模較大、駐地分散,一些政治、經(jīng)濟、文化水平相對落后地區(qū)的成員單位,其接受新思想、新技術的速度較慢,檔案管理水平相對不高。一些集團擁有橫跨不同行業(yè)領域的成員單位,檔案在其中發(fā)揮的效用不一樣,所受重視程度不同,比如軍工企業(yè)的科研檔案多是技術核心,單位對檔案的重視與保護程度高,而服務企業(yè)的文書檔案多起記錄備查作用,管理方面很容易被忽視。此外,因各成員單位的歷史背景、發(fā)展階段、所在層級不同,其檔案管理水平也往往呈現(xiàn)出不均衡的特點。例如,筆者所在單位有總行、省級分行、市級分行、縣級支行四級機構,越到基層,專職檔案人員越難配備,在檔案方面投入精力越少。有些成員單位從事檔案工作的人員頻繁更換,新來的人員缺乏專業(yè)知識和經(jīng)驗,在實際操作過程中,對標準要求掌握不準、不透,容易在檔案管理方面出現(xiàn)問題。
(二)系統(tǒng)之間數(shù)據(jù)交互存在障礙
“系統(tǒng)之間”既包含“上下級單位檔案系統(tǒng)之間”,也包含“業(yè)務系統(tǒng)和檔案系統(tǒng)之間”。而數(shù)據(jù)交互的前提是在系統(tǒng)之間建立接口,很多系統(tǒng)在早期建立時未考慮系統(tǒng)間的關聯(lián)性,彼此相互獨立,致使形成數(shù)據(jù)孤島,跨系統(tǒng)的業(yè)務流程出現(xiàn)斷裂,數(shù)據(jù)依賴手動導出或導入,耗時且易出錯。對于已建立接口的系統(tǒng),數(shù)據(jù)交互時還可能出現(xiàn)以下情況:數(shù)據(jù)傳輸失敗,如接口調用超時、網(wǎng)絡中斷、請求被拒絕等;數(shù)據(jù)格式不兼容,如數(shù)據(jù)解析失敗、字段缺失或不匹配等;數(shù)據(jù)不一致,如上游業(yè)務系統(tǒng)流程已辦結或數(shù)據(jù)進行了變更,而下游檔案系統(tǒng)數(shù)據(jù)未能及時獲取或更新;在性能方面存在瓶頸,如接口響應緩慢、高并發(fā)下檔案系統(tǒng)崩潰等。
(三)系統(tǒng)建設過程中對新技術使用不足
數(shù)字檔案館(室)系統(tǒng)建設的目的在于輔助完成檔案的收集、整理、保存、利用等。近年來,新技術層出不窮,但很多集團型企業(yè)在開展數(shù)字檔案館(室)系統(tǒng)建設時,未能充分利用好這些新技術,導致處理基礎性、事務性工作依然需要耗費大量人力,并且使用效果不盡如人意。例如,在信息采集時,系統(tǒng)不能自動分析和提取,需要人工完成篩選和著錄;在檔案整理和收集過程中,系統(tǒng)不能自動判斷,需要人工對照保管期限表判定并審核大量信息;在檔案利用時,設計的檢索工具使用起來不夠靈活,檢索結果與用戶需求差異大、檢索速度慢等。
(四)檔案面臨的安全威脅不斷增多
檔案安全主要涉及檔案載體安全和檔案信息安全。在以紙質檔案為主的時代,人們對于檔案安全的更多關注點在于如何建立一個堅固的、防護措施完備的庫房,從而預防自然災害,確保檔案載體安全。而當前建設數(shù)字檔案館(室),檔案信息所面臨的安全威脅已遠超檔案載體,“檔案數(shù)據(jù)存在信息倫理、知識產(chǎn)權保護、隱私侵犯、系統(tǒng)平臺漏洞、技術更新?lián)Q代、黑客病毒侵襲、載體壽命不確定等各種安全風險”[4]。總體來看,一是可能存在技術安全風險,如由于系統(tǒng)漏洞或隔離措施不足而遭受攻擊、加密不足而導致敏感信息泄露、缺少防護手段而無法及時有效應對新型網(wǎng)絡威脅等;二是可能存在設定機制缺陷,如權限與訪問控制設定混亂,檔案可能被無權限人員調閱等;三是可能存在物理與環(huán)境隱患,如設備與載體管理不當,造成檔案數(shù)據(jù)無法讀取等。這些隱形的風險都具有難以察覺、關聯(lián)性強、影響面大的特點。
集團型企業(yè)建設數(shù)字檔案館(室)是檔案工作轉型的必經(jīng)之路,考驗企業(yè)的協(xié)調能力、系統(tǒng)建設的設計能力、科技力量的運用能力、應對風險的防范能力。在實際操作過程中,集團型企業(yè)可從以下四個方面著手改善。
(一)做好統(tǒng)籌規(guī)劃,協(xié)調成員共同發(fā)展
集團總部發(fā)揮著頂層指導的作用,應秉承“立足現(xiàn)狀、確定目標、合理分工、有序推進”的基本思路開展工作。在建設數(shù)字檔案館(室)之前,集團總部要先進行全面系統(tǒng)的調研,可協(xié)調總部及成員單位檔案人員、業(yè)務人員、技術人員成立調研組,對集團的檔案情況(類別、數(shù)量、分布情況,是否需要遷移)、數(shù)字化情況(已完成檔案類別、數(shù)量、質量,未完成檔案類別、數(shù)量)、基礎設施設備情況(是否已配備,是否符合標準;是否經(jīng)過相關權威部門測評取得證書,是否安全)、檔案系統(tǒng)情況(功能是否滿足要求,性能是否達標,安全策略是否建立)、業(yè)務系統(tǒng)情況(業(yè)務系統(tǒng)數(shù)量,業(yè)務系統(tǒng)內需要歸檔的電子文件情況,與檔案系統(tǒng)建立接口情況)、與檔案相關的制度標準制定情況(是否全面、彼此之間是否有沖突)等進行全面摸底。在充分掌握各成員單位現(xiàn)實情況及面臨的困難后,集團總部從整體考慮,制定頂層規(guī)劃,統(tǒng)一制度標準,做好人員、資金保障工作,定期組織培訓,提高檔案人員的專業(yè)能力和技術水平,確保總部與成員單位在建設企業(yè)數(shù)字檔案館(室)時,可以實現(xiàn)同頻共振、協(xié)同發(fā)展。
(二)完善接口生態(tài)建設,搭建數(shù)據(jù)互聯(lián)通道
無論是“上下級單位檔案系統(tǒng)”還是“業(yè)務和檔案系統(tǒng)”之間,完善接口生態(tài)建設,實質上是構建數(shù)字世界的“神經(jīng)脈絡”,既可以解決當下系統(tǒng)互通的“血栓”問題,更可以為未來業(yè)務創(chuàng)新鋪設高速通道。其中,接口質量直接決定企業(yè)數(shù)字機體的“供血能力”,通過制定統(tǒng)一的接口規(guī)范,明確通信協(xié)議與請求方式、數(shù)據(jù)格式與結構、安全與權限、錯誤處理機制等,可提高數(shù)據(jù)完成自動化交互的質量。同時,接口規(guī)范要注意版本控制,避免因系統(tǒng)升級導致數(shù)據(jù)交互中斷。集團總部可以選擇1~2個關鍵業(yè)務流程,優(yōu)先開發(fā)接口,后續(xù)再逐步擴展接口范圍。在數(shù)據(jù)交互時,集團型企業(yè)要注意使用穩(wěn)定的網(wǎng)絡協(xié)議,部署負載均衡以分散請求壓力;通過建立元數(shù)據(jù)標準,在系統(tǒng)間使用統(tǒng)一的數(shù)據(jù)字段、類型,或構建語義本體庫,實現(xiàn)業(yè)務和檔案的同義詞對應,同時做好數(shù)據(jù)校驗,確保數(shù)據(jù)交互的完整性和準確性;通過消息隊列實現(xiàn)異步通信,下游系統(tǒng)定時監(jiān)測鏈路健康度,每天比對上下游系統(tǒng)間數(shù)據(jù)的一致性,設立消息反饋、錯誤重試機制,確保數(shù)據(jù)傳輸成功;進行大數(shù)據(jù)量交互時,系統(tǒng)可采用分頁傳輸,提升響應速度。此外,對于集團型企業(yè),為了提高管理效率、節(jié)約管理成本、縮短建設周期等,在上下級單位檔案系統(tǒng)建設中可以采取“統(tǒng)一建設、集中部署”的方式,即總部在搭建完成檔案系統(tǒng)后,可直接為成員單位開放檔案數(shù)據(jù)空間,實現(xiàn)標準化采集、自動化管理、跨區(qū)域利用。
(三)加強機器學習,催化科技賦能反應
“隨著信息技術的發(fā)展,數(shù)字檔案館的管理和服務模式會不斷發(fā)生變化,倒逼數(shù)字檔案館朝著智慧型、知識型方向發(fā)展,出現(xiàn)生態(tài)位變化。”[5]機器學習就是其中的一個催化劑,近年來,它在圖像識別、自然語言處理、個性化推薦等領域都取得了突破性進展。在數(shù)字檔案館(室)系統(tǒng)建設過程中,集團型企業(yè)可以提高機器學習能力,在多個環(huán)節(jié)中通過與技術的融合,實現(xiàn)自動化處理、智能分析和深度挖掘,催化科技賦能反應,變現(xiàn)科技賦能價值。在檔案著錄環(huán)節(jié),可通過計算機視覺技術,識別照片、圖紙或手寫的文檔內容,生成描述性元數(shù)據(jù);通過不斷訓練手寫體識別專用模型,識別模糊、復雜的手寫檔案;可利用自然語言處理技術,提取文字中的關鍵信息完成自動標引。在歸檔環(huán)節(jié),可在形成電子檔案的業(yè)務系統(tǒng)里,內置檔案分類方案、保管期限鑒定、歸檔格式審核等功能,減少人工判定,提高電子文件歸檔效率。在檔案檢索方面,可借助Embedding模型實現(xiàn)“以意搜文”;“基于卷積神經(jīng)網(wǎng)絡(CNN)和循環(huán)神經(jīng)網(wǎng)絡(RNN)的文本分類和檢索方法,在處理中文文本時表現(xiàn)出了優(yōu)異的性能”[6],這兩種方法在檔案的內容理解、特征提取、語義檢索等方面具有重要意義,可以提高檢索效率;對于檢索結果,可以通過提取點擊率、瀏覽時長、下載行為等動態(tài)調整排序,或者使用協(xié)同過濾,推薦相似用戶偏好的檔案。
(四)增強安全措施,構筑安全保障防線
數(shù)字檔案館(室)的安全防護措施涉及技術防御、權限控制、環(huán)境管理等,需全面考慮各個因素,從而建立數(shù)據(jù)安全保障機制,提高數(shù)據(jù)資源保護能力。集團型企業(yè)具體可從以下幾個方面著手實施:一是進行技術加固,“采取包括入侵檢測系統(tǒng)(IDS)、入侵防御系統(tǒng)(IPS)和防火墻在內的多層防護措施,構建安全的網(wǎng)絡環(huán)境以防范外部攻擊”[7],同時,對檔案本身進行安全保護,在存儲和傳輸過程中,通過加密技術進行加密,采用哈希算法等確保數(shù)據(jù)的完整性。二是嚴格控制訪問權限,可通過系統(tǒng)自身的角色設置,對文檔的瀏覽操作權限進行細粒度區(qū)分,實現(xiàn)檔案用戶權限和檔案數(shù)據(jù)權限組合控制,限制對敏感數(shù)據(jù)資源的訪問。三是對周邊環(huán)境進行監(jiān)測與管控,包括檔案保管環(huán)境、網(wǎng)絡環(huán)境、信息存儲環(huán)境等,定期對檔案數(shù)據(jù)進行掃描、比對校驗,如有異常情況,及早發(fā)現(xiàn)修復。同時,堅持數(shù)據(jù)級備份和應用級備份相結合,可采用異地、異質、實時、在線等多種備份形式,避免出現(xiàn)數(shù)據(jù)損毀丟失無法挽回的情況。
推動數(shù)字檔案館(室)建設是大勢所趨,集團型企業(yè)要以此為契機,提升檔案整體管理水平。在此過程中,集團總部要注重發(fā)揮頂層指導作用,制定清晰的戰(zhàn)略目標,全程跟蹤和控制,定期評估,根據(jù)反饋意見進行調整和優(yōu)化,從而有效推動集團型企業(yè)數(shù)字檔案館(室)的建設和發(fā)展。
注釋及參考文獻:
[1]中華人民共和國國家檔案局.國家檔案局辦公室關于印發(fā)《企業(yè)數(shù)字檔案館(室)建設指南》的通知[EB/OL].(2017-09-19)[2024-08-01]. https : //www. saac.gov.cn/daj/tzgg/201709/ 520f7404ff78448f85edc3109bb64e2b.shtml.
[2]中華人民共和國國家檔案局.中華人民共和國檔案法[EB/OL].(2020-06-20)[2024-08-01].https://www.saac.gov. cn/daj/falv/202006/79ca4f151fde470c996bec0d50601505.shtml.
[3]中共中央國務院印發(fā)《數(shù)字中國建設整體布局規(guī)劃》[N].人民日報,2023-02-28(1).
[4]金波,楊鵬.大數(shù)據(jù)時代檔案數(shù)據(jù)治理研究[J].檔案學研究,2020(4):29-37.
[5]王潔菲.數(shù)字檔案館生態(tài)位提升策略探究[J].北京檔案,2022(9):13-16.
[6]吳晨.面向內容的信息檢索模型研究[D].北京:中國科學院聲學研究所,2007.
[7]王曉萌.基于云環(huán)境的檔案安全管理及數(shù)字檔案館構建策略[J].中國信息化,2024(7):79-80.
作者單位:中國農(nóng)業(yè)發(fā)展銀行