劉志巖
摘 要:文章探究“十五”以來檔案數據工作目標任務及演進規律,在對“十五”以來各個五年計劃規劃中數據工作目標任務進行梳理比較后,指出“十五”以來檔案數據工作按照從數據庫到檔案數據再到數據檔案的節律推進,檔案數據化、數據檔案化和數據能力建設是“十四五”期間檔案數據工作高質量發展的核心內容。
關鍵詞:檔案數據;目標任務;演進節律
自2001年《全國檔案事業發展“十五”計劃》提出“完善全國明清檔案資料、民國檔案資料、革命歷史檔案資料三個目錄中心的數據庫建設”[1]的數據工作目標以來,“十一五”至“十四五”全國檔案事業發展的各個五年規劃均對檔案數據工作提出了目標、任務和要求,為規范檔案數據處理活動、保護檔案數據安全、促進檔案數據開發與利用、保護公民個人及組織機構檔案數據合法權益提供了參考依據。本文通過系統歸納、梳理、分析“十五”至“十四五”期間全國檔案事業發展的各個五年計劃規劃中有關檔案數據工作內容的變化,勾勒我國檔案數據工作發展脈絡和趨勢,探尋檔案數據工作演進規律,聚焦檔案數據工作核心內容,希望為完善我國檔案資源建設和管理提供思路。
一、 “十五”以來我國檔案數據工作發展特點及規律
檔案數據工作是檔案基礎性工作之一,始于檔案統計、檔案數字匯集。本文討論的檔案數據工作特指檔案信息化建設中的檔案數據庫、檔案數據、數據檔案三個方面。
1. “十五”——單庫·起步
所謂“單庫”,指單一的目錄數據庫建設?!度珖鴻n案事業發展“十五”計劃》中三個目錄數據庫建設[2],成為列入檔案五年計劃規劃的第一項具體數據任務,對檔案工作、檔案學研究意義重大。在檔案管理方面,表明“數據工作”已經進入管理層的視線,開始受到檔案工作計劃規劃的規制和指導。在檔案學理論研究方面,檔案“數據工作”的加入,拓展了檔案學研究領域。
2. “十一五”——多庫·進館·災備
《檔案事業發展“十一五”規劃》中數據任務分布在信息化、檔案移交進館、安全保管與保護和檔案科研四方面。檔案信息化方面,數據庫建設從“十五”期間單一的“目錄庫”擴展到“全文庫”“多媒體庫”等多種數據庫。檔案進館方面,全文數據開始成為機關、團體、企事業單位依法按期向國家檔案館移交檔案的內容。電子目錄、全文數據與紙質檔案同步進館則標志著進館檔案由單一紙質進入電子、紙質雙套制階段。檔案安全保管與保護方面,一是數據安全成為檔案安全的組成部分,二是建立數據備份和災難恢復機制。檔案數據工作從數據庫階段,開始進入檔案數據階段。數據存儲技術研究納入規劃范圍,表明檔案數據工作進入應用與研究同步的新階段。
3. “十二五”——庫管·歸檔·安全
《全國檔案事業發展“十二五”規劃》中數據任務分布在信息化、檔案館、檔案移交進館三方面。檔案信息化方面,再次聚焦“數據庫”,強調計算機網絡設備和數據庫建設,同時要求配備和開發檔案數據庫管理系統。檔案進館方面,進館內容上與“十一五”任務相同,仍要求電子目錄、全文數據與紙質檔案同步進館。但涉及的歸檔機構范圍,剔除了企事業單位,只涉及機關、團體。其調整的原因,筆者認為《檔案事業發展“十一五”規劃》和《全國檔案事業發展“十二五”規劃》中所說的檔案館,是指地方國家綜合檔案館。依照現行法律法規,只有機關、團體須依法向綜合檔案館移交檔案,而企事業單位沒有向綜合檔案館移交檔案的義務,即便是需要移交,也是向企業事業單位自身檔案館移交。全文數據進館,事實上就是數據歸檔。而數據歸檔之后成為數據檔案,全文數據進館意味著檔案數據工作從檔案數據階段進入到數據檔案階段,從檔案數據化轉向數據檔案化。《全國檔案事業發展“十二五”規劃》中數據任務最大變化有兩處:一是檔案館單獨成為任務主體和對象;二是任務指向“數據安全”。從檔案數據化轉向數據檔案化,對檔案工作來說,豐富了檔案來源。在檔案學理論研究方面,“數據”的加入,擴大了檔案的屬概念,如有學者認為“大數據都是檔案”,這也對檔案界提出了更高要求,使檔案界必須更新升級對檔案概念的認識并積極思考未來對大數據的監督管理問題。[3]
4. “十三五”——建庫·管理·建章
《全國檔案事業發展“十三五”規劃綱要》中數據任務分布在數據庫、信息化、檔案安全三個方面,較《全國檔案事業發展“十二五”規劃》略有變化。數據庫建設方面,從利用服務需求出發,提出建立國家層面的重點檔案文件級目錄數據庫和專題庫。數據庫建設從“全”“多”再上一個臺階,進入“精”“?!睂用?。信息化方面,強調應用、標準、開放。應用指大數據應用,以提高檔案館業務信息化和檔案信息資源深度開發與服務水平;標準指制定數據歸檔標準,以提升電子檔案管理水平,檔案數據工作進入數據庫、檔案數據、數據檔案同臺的新階段;開放指數據開放。檔案安全方面,強調建立檔案數據安全管理制度,表明檔案數據不再僅僅是檔案實體的附屬品,而是檔案信息的新承載形式。
5. “十四五”——體系·歸檔·攻關
《“十四五”全國檔案事業發展規劃》中數據任務分布在治理體系、資源體系、信息化、科技創新四方面。體系建設涉及治理體系、資源體系。治理體系上,一是加強重點領域檔案工作監管;二是創新檔案業務監督指導方式;三是將數據歸檔列入檔案主管部門與業務主管部門的監督指導范圍。三項工作合一說明數據已經成為檔案的重要來源,數據檔案屬于檔案的子集。資源體系上,將數據庫建設聚焦在專題數據庫中的重大歷史事件、重大活動、突發事件應對活動三個專項子庫上,邁入“專題數據子庫”階段。信息化方面,一是完善檔案信息化發展保障機制;二是加強電子文件歸檔和電子檔案移交接收,完善機制、流程,推進數據歸檔,解決歸檔難題;三是加速數字檔案館(室)建設。檔案科技創新,是《“十四五”全國檔案事業發展規劃》任務新重點:一是聚焦大數據環境中電子文件與電子檔案一體化管理、檔案數據治理研究;二是加大結構化數據歸檔等技術攻關。
總之,“十五”以來檔案數據工作目標任務,總體上沿著數據庫建設到檔案數據再到數據檔案的順序梯次推進。每一梯次又遵循由少到多,由淺入深,由單到多,由多再到專、精的規律。任務與研究互動,點面結合是最大的特點。
二、 “十五”以來檔案數據工作目標任務歸集、演進、展望
1. “十五”以來檔案數據工作目標任務歸集
通過對“十五”以來檔案數據工作目標任務的梳理,其可以歸集如下:《全國檔案事業發展“十五”計劃》是數據庫任務起始,從檔案館目錄數據庫任務起步,開啟檔案數據工作新紀元?!稒n案事業發展“十一五”規劃》是檔案數據任務起始,數據庫工作全面推進,以七項任務爆發式開啟檔案數據規劃?!度珖鴻n案事業發展“十二五”規劃》是數據檔案任務起始,數據庫、檔案數據工作持續推進?!度珖鴻n案事業發展“十三五”規劃綱要》是大數據任務起始。大數據以兩項任務進入檔案數據工作的范疇,成為檔案五年規劃新的關注點?!丁笆奈濉比珖鴻n案事業發展規劃》是數據治理任務起始。數據治理以研究性任務第一次進入五年規劃體系。檔案數據工作除了繼續深耕信息化領域,在治理體系、資源體系、科技創新和國家記憶工程上不斷拓展。
2. 檔案數據工作演進規律

從前述歸納的內容中,提煉出數據庫、檔案數據、數據歸檔、大數據、數據治理五個熱詞。由于大數據在《全國檔案事業發展“十三五”規劃綱要》《“十四五”全國檔案事業發展規劃》中屬宏觀性、研究性任務,數據治理在《“十四五”全國檔案事業發展規劃》中屬研究性任務,不具備在全國特別是基層的實際操作性,不宜列入實際任務范圍。由此,可以認為“十五”以來檔案數據工作主要圍繞開始早、數量多、持續時間長的數據庫、檔案數據、數據歸檔三個任務關鍵詞展開。表1為“十五”以來各個五年計劃規劃中數據庫、檔案數據、數據歸檔三個任務關鍵詞出現的先后順序和使用頻率列表,可以清晰地看出“十五”以來檔案數據工作具有“起始有先后、前后有疊加、內容有變化”的規律。
(1)起始有先后。從各任務關鍵詞出現的時間看,“十五”以來檔案數據工作任務,是遵循數據庫到檔案數據再到數據歸檔(數據檔案)的先后順序遞進式開展。之所以首先是“檔案數據庫”進入五年規劃,筆者以為,一是檔案工作實踐的需要。檔案信息化建設工作實踐始于檔案管理,而檔案管理離不開目錄檢索,因而檔案目錄數據庫建設進入五年規劃成為必然。二是檔案數據庫的概念含義較明晰且學界對檔案數據庫建設統一規劃多有研究探討。如早在1992年馮惠玲、李華就指出:“檔案數據庫建設無統一規劃。”[4]而此時數據檔案和檔案數據的概念含義并不清晰。雖然1981年就有學者提出:“數據檔案是科技檔案的一個重要組成部分,是科技檔案的主要內容之一?!盵5]但這與現在的數據檔案概念有相當大的差異。檔案數據與數據檔案真正進入五年規劃則是檔案信息化建設由檔案管理層面進入到檔案信息層面實踐需要的結果。檔案數據概念成熟于對計算機加工處理檔案信息,即傳統載體檔案數字化的認識;數據檔案概念成熟于對計算機產生的數據歸檔,即數據檔案化的認識。這既符合新事物發展的規律,也符合對新事物認識的規律,也是檔案工作實踐的實際反映。
(2)前后有疊加?!笆濉币詠頇n案數據工作任務,遵循數據庫、檔案數據、數據歸檔(數據檔案)、大數據、數據治理的先后順序展開,但相互之間沒有明顯的階段性劃分。先出現的任務關鍵詞在后面的規劃中與后出現的任務關鍵詞并存,相互有疊加。因為對這些內容的認識也是一個逐步的過程,這一過程并不是涇渭分明的,而是相互疊加、逐步深入。
(3)內容有變化。從檔案規劃任務內容來看,整體上是在不斷充實變化中發展。以數據庫任務為例,從目錄數據起步,經過全文數據庫、多媒體數據庫,到專題數據庫,再到專題數據庫中的專項數據庫。類型逐步增加,內容逐漸豐富。伴隨檔案數據任務的良好延續性,檔案五年規劃中的數據任務總量呈現出明顯的上升趨勢。數據檔案逐漸成為檔案的主要形式之一,檔案數據工作也逐漸成為檔案工作的重要任務。檔案大數據、檔案數據治理內容也在不斷變化充實。
3. 檔案數據工作展望
遵循檔案數據工作演進規律,聚焦檔案數據工作核心內容,是檔案事業高質量發展的重要保障。通過對“十五”以來檔案數據工作目標任務梳理歸集,總結演進規律,在厚植資源、優化管理、高效服務的愿景下,檔案數據工作應重視“一庫兩化三能”全面發展?!耙粠臁敝笖祿旖ㄔO,“兩化”指檔案數據化和數據檔案化,“三能”指檔案資源整合能力、檔案服務能力和檔案治理能力。
(1)數據庫活力不減。數據庫建設是檔案數據工作基本建設,將是一個長期甚至永久性的工作,隨著國家經濟社會發展對檔案工作的需求和數據庫技術更新發展而不斷擴充。需要有長期作戰的心理準備及充足的人力、物力、財力準備。
(2)檔案數據化持續推進。檔案數據源自存量檔案的數據化,是檔案信息化進程中的主要任務之一,工作較為繁重,存量紙質檔案目錄數字化、全文數字化是一個長期持續的過程。
(3)數據檔案化方興未艾。數據檔案源自增量數據的檔案化。在數據成為檔案重要來源的今天,對檔案工作全流程各環節發起挑戰,需要推進各級各類檔案館與其職屬范圍內的業務系統實現無縫對接。而檔案數據化與數據檔案化整體上又反映出檔案館的資源建設與整合能力。
(4)大數據應用提升服務體驗。大數據應用依托檔案數據庫建設和檔案數據化與數據檔案化兩極“加持”,反映出檔案工作者應用新技術與提供檔案服務的能力。提升大數據應用能力,可使利用者無論何時、何地、何處都能快速準確查閱所需檔案信息,大幅提升利用者的服務體驗。
(5)數據治理推動轉型升級。檔案數據治理是指檔案部門、社會組織和公民等多元主體協同合作,依據一定的法規標準,充分利用大數據等現代信息技術,對檔案數據生成、收集、管理、存儲、利用整個生命周期進行科學規范的全程管理,挖掘檔案數據價值,滿足社會利用需求,實現檔案數據善治的活動和過程。[6]其既是檔案數據工作的重要環節,也是檔案治理的組成部分。檔案數據治理能力的提升,將有效推動檔案事業轉型升級。
注釋與參考文獻
[1][2]全國檔案事業發展“十五”計劃[N].中國檔案報,2000-12-14(001).
[3]何嘉蓀,譚建月.檔案概念再認識——大數據引起的思考[J].檔案與建設,2017(8):4-6,10.
[4]馮惠玲,李華.檔案工作現代化的重大課題——論檔案計算機檢索的數據準備[J].檔案學通訊,1992(1):41-45.
[5]湯其強.談談數據檔案[J].檔案工作,1981(3):19-20.
[6]金波,楊鵬.大數據時代檔案數據治理研究[J].檔案學研究,2020(4):29-37.