何思源 劉越男 祁天嬌


摘要:檔案與數據有著千絲萬縷的聯系,但在數據如火如荼的當今社會,卻呈現割裂發展的狀態,亟待協同管理。從檔案管理與數據管理關系演變的角度來看,雖然二者在信息化發展過程中各有側重,但同根同源,協同管理有著深厚的歷史根基;從現實發展的角度來看,檔案與數據的法理聯系和現實差異以及共有的資產視角要求協同,數字化轉型發展需要理念協同,面臨的共同難題促使協同,優勢互補和方法相通支持協同,管理體系的相對割裂呼喚協同。
關鍵詞:檔案管理 數據管理 協同管理 數字轉型
Abstract:Recordsanddataareinextricably linked, but in todays society where data is in full swing, the two have developed in a fragmented manner and are in urgent need of collaborative management. From the perspective of the evolu? tion of the relationship between records manage? ment and data management, although the two have their own focus in the process of informatiza? tion development, they have the same root and ori? gin, and collaborative management has deep histori? cal roots.From the perspective of realistic develop? ment, the juridical links and realistic gaps between records and data and the common asset perspec? tive require collaboration,the digital transformation requires the concept of collaboration,the common challenges faced by both prompt collaboration,the complementary advantages and common methods support collaboration, and the relative fragmenta? tion of management systems call for collaboration.
Keywords:Records management;Data manage? ment; Collaborative management; Digital transfor? mation
在數據成為新型生產要素的數據時代,政府和企業紛紛成立數據管理部門,浙江、廣東等地率先在政府部門設立首席數據官,開展數據治理。檔案與數據有著千絲萬縷的聯系,卻呈現割裂發展的狀態。一方面,檔案部門面臨來自數據部門的沖擊與挑戰,檔案工作如何融入數據生態已成為擺在檔案工作者面前的現實問題;另一方面,紙質環境中檔案管理的線性思維模式和靜態管理方式不再適用,[1]數據管理能為檔案領域帶來新的思維和方法。檔案與數據協同管理逐漸成為檔案領域的重要議題,《“十四五”全國檔案事業發展規劃》明確提出“大力推動科學數據與科研檔案協同管理”的任務要求。
目前,檔案與數據協同管理相關研究主要涉及概念關系[2]、法律協調[3]、機構設置[4]、實施策略[5]、科研檔案和科學數據協同管理[6-7]等,但都側重應對之策,較少涉及動因分析,缺乏歷史維度的考量。本文追溯檔案管理與數據管理的發展歷程,在歷史維度探析二者關系的演變脈絡,使檔案與數據的協同管理能夠厚植歷史根基,在此基礎上從組織機構的視角出發,進一步分析協同管理的內外動因,以更深刻地認識協同管理的重要性和必要性。需說明的是,本文中出現的文件及文件管理均指英文語境下的records及records management,可在一定程度上將其作為中文語境下檔案及檔案管理的對應詞,但由于中外體制差異,無法完全對等,故將其翻譯為文件及文件管理,以示區分。
(一)傳統環境中的檔案管理與數據管理同根同源
從歷史發展的角度來看,文件管理就是前數字時代的數據管理,其起源可追溯至公元前4000年。[8]在前數字時代,現代數據管理所謂的結構化和非結構化數據都以統一的形式存儲在各類介質中,且都通過文書工作進行手工管理。[9]
在兩河流域的蘇美爾文明中,人們用楔形文字在泥板上進行刻寫,記錄數據,形成文件。這些文件通常與經濟活動有關,如記錄貿易、銷售等的數量,以跟蹤貨物交易、存儲等活動,[10]類似于現代的貨物清單或ERP系統中的數據表。隨著社會的發展,文件的制作和使用逐漸從經濟領域擴展至政治、法律等領域,包括皇家信件、官員名單、法律案卷、法律規范、外交協議及關于出生、死亡、婚姻等的記錄。[11-12]在古埃及,文件也被用于記錄土地所有權、作物產量、稅收等經濟及宗教問題。[13]
在中世紀的歐洲,王公貴族和封建領主保管著關于人口出生、死亡、婚姻、稅收、商業和銀行交易等的文件。隨著各國君主制的鞏固和強化,行政類的文件有所增加,[14]例如英國的《末日審判書》(Doomsday Book)。到17世紀,商業發展需要精確的人口和貿易數據,對留存和查閱文件提出更高的要求。[15]此時,制作文件的書寫人員的地位與當今社會的計算機系統分析師或編程人員的地位相當。[16]
從我國檔案管理的發展歷程來看,檔案也是數據的記錄形式。商朝有記錄生產、政治、軍事、譜系的甲骨檔案,西周有記載冊命、賞賜、志功、征伐的金文檔案,秦朝出現大量律法檔案和石刻檔案,隋唐時期出現關于科舉及官員的甲歷檔案,明代有專門記錄人口、土地和賦役的黃冊和魚鱗圖冊。[17]
從現代意義上的檔案與數據視角進行審視,可發現上述人類活動形成的各種原始記錄既符合檔案的要求,也符合數據的特征,既是檔案,也是數據,制作和管理這些原始記錄的業務活動既是檔案管理,也是數據管理。
(二)數字環境中的檔案管理與數據管理漸行漸遠
進入20世紀,政府職能日益擴大、商業活動更加復雜、新的文件制作工具層出不窮,文件數量激增,組織機構希望以適當的格式、在適當的時間,以盡可能低的成本獲得準確的信息,[18]開始產生有效和全面管理數據及信息的意識。[19]雖然二者都積極應對這一新挑戰,但采用了不同的思路和方法,文件管理開始分化,現代意義上的文件管理和數據管理逐漸形成。
在某種程度上,二者的分化首先表現在發展思路的差異上,文件管理采用“做減法”的思路,數據管理采用“做加法”的思路。源于美國的現代文件管理側重控制數量和文書削減,致力于留存核心的文件,維護其證據和記憶價值,消除不必要、重復或無價值的文件,核心舉措是基于文件保管期限表的鑒定與處置活動。這種傳統得到《文書削減法》等法律的強化,并一直延續至今。我國民國時期的機關檔案室管理工作,亦體現出這種思想,如文書檔案連鎖法的“目的是想通過幾道簡便的手續,把文書工作和檔案工作連鎖起來,以改變文書運轉遲緩和檔案管理分散、壟斷的狀況”[20]。數據管理則“另辟蹊徑”,構建了全新的管理體系,致力于運用現代信息技術解決信息爆炸式增長的問題,側重技術應用,逐漸脫離手工管理模式。文件管理強調文件的憑證性和文化性,從長遠角度開展生命周期管控,只有少數文件才需要永久保存;數據管理強調文件的資產性與現實性,將文件視作一種可用多種方式進行開發利用的資源,[21]傾向于管理更多的數據,致力于拓寬數據的范圍和邊界。
在數據管理獨立發展的初期,二者仍保持一定聯系,早期信息系統和數據庫中的數據通常來自傳統載體形態的檔案。但隨著信息化的深入推進,二者的差異愈發明顯。時至今日,檔案管理和數據管理相對割裂已經成為普遍現象。在宏觀層面,數據法規政策很少將檔案管理納入其中,而檔案法規政策也很少考慮數據管理的需求。在微觀層面,企事業單位等組織機構內部相繼建立數據管理體系,雖在管理對象上與現有檔案管理體系存在交叉、重疊,但在體制、制度、業務、資源、服務、技術、系統等多方面都存在相對割裂的問題。
雖然檔案管理與數據管理存在分歧,但同根同源,在數字化轉型和智能化發展走向縱深的時代,二者又一次面臨交匯融合的問題。從理論層面來看,數據與檔案之間的法理聯系和現實差異以及共有的資產視角要求協同;從實踐層面來看,數字化轉型發展需要協同理念,面臨的共同難題促使協同,優勢互補和方法相通支持協同,管理體系的相對割裂呼喚協同。

(一)檔案與數據之間的法理聯系和現實差異要求協同
從法理層面來看,檔案與數據存在天然聯系。《檔案法》規定“檔案是指過去和現在的機關、團體、企業事業單位和其他組織以及個人從事經濟、政治、文化、社會、生態文明、軍事、外事、科技等方面活動直接形成的對國家和社會具有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄”[22];《數據安全法》規定“數據是指任何以電子或者非電子形式對信息的記錄”[23]。對比發現,除檔案界所謂的“實物檔案”外,其他類型檔案都符合數據的定義,因此,可在很大程度上將檔案視為數據的一部分,即近似地認為檔案屬于數據、數據包括檔案,如圖1所示。
從現實層面來看,檔案與數據存在顯著差異。數字時代,檔案管理系統通常采用非結構化數據解決方案。即便是結構化數據,通常也會被轉為非結構化數據(如PDF等版式文件)進行歸檔保存。而在數據管理領域,雖然既包括結構化數據,也包括非結構化數據,但解決方案主要面向結構化數據,非結構化數據管理往往通過元數據等結構化數據實現。因此,實際工作中的檔案與數據各有側重、互不相同,檔案資源以非結構化數據為主,數據資源以結構化數據為主,如圖2所示。

檔案與數據的法理聯系和現實差異之間的“落差”要求協同。因為對組織機構來說,既需要非結構化數據,也需要結構化數據,需要在兩種不同類型的資源之間建立關聯,實現協同治理和開發利用。
(二)資產視角要求鏈接檔案與數據管理
在數字化轉型過程中,檔案領域和數據領域都積極引入“資產及資產管理”視角。共同的資產視角要求將檔案管理與數據管理鏈接起來。在檔案界,國家標準《信息與文獻文件(檔案)管理概念與原則》(GB/ T 26162—2021,采標自ISO 15489—1:2016)將“文件”定義為“機構或個人在履行其法定義務或開展業務活動過程中形成、接收并維護的作為憑證和資產的信息”[24],將其理解為組織機構的業務活動憑證和信息資產。在數據管理領域,“數據資產(data asset)”首次出現于1974年;[25]國際數據管理協會(DAMA In? ternational)明確指出“數據是一種組織資產,如今的組織依靠數據資產做出更高效的決定,并擁有更高效的運營”[26]。在資產視角下,檔案和數據都需要滿足權屬清晰、可流通等條件,都關注如何確權、如何增值、如何流通等問題,迫切需要展開合作與協同。
(三)數字化轉型發展需要采用協同管理理念
信息技術與經濟社會的交匯融合引發數據迅猛增長,數據已成為國家基礎性戰略資源。全球范圍內運用數據推動經濟發展、完善社會治理和提升政府能力正成為趨勢。在數字化轉型背景下,各類組織機構都面臨著巨大變化和不確定性,機構內各部門、各領域、各要素無法“單打獨斗”,亟須更新理念,迫切需要采用協同管理的思路實現跨部門合作、跨領域發展。檔案和數據都在整個組織機構范圍內形成和使用,二者應協同高效、相互配合。為服務整體數字化轉型,檔案部門需積極探索融入數據管理整體框架的路徑方法,充分發揮檔案管理在數據管理中的作用,將成熟理論、方法和工具運用到提升數據治理能力、推進數據共享等方面,激發數據要素活力,并將數據管理的方法、技術與工具引入檔案管理活動中,釋放檔案管理與數據管理的協同價值,助力更高層級的數字化與智慧化發展。
(四)面臨的共同難題促使檔案與數據管理協同
檔案管理和數據管理面臨著共同難題,需要合力應對,共商發展策略和解決方案。
首先,二者都面臨外在驅動力不足的難題。檔案部門和數據部門的職能定位具有相似性,既不是數據形成者,也不是利用者,而是以第三方的角色為業務部門提供信息支撐和數據服務。二者都屬于“成本中心”,無法直接創造經濟效益,其價值需要經過轉化才能實現,即通過賦能業務發展和經營決策推動效率提升和效益增加。因此,二者都面臨來自組織機構的壓力,需要得到高層領導的支持,并通過檔案和數據的開放共享和利用服務等方式實現資產化增值,從而證明自身價值和效益。
其次,二者都面臨與業務發展相融合的難題。在實際工作中,一方面,數據的歸檔采集難以融入業務流程,業務部門承擔著較重的數據歸檔采集負擔,從而影響業務開展效率;另一方面,檔案和數據管理也存在不能充分釋放數據資源價值,未能在業務部門需要時及時提供真實、準確、有效的數據支持的短板,使業務部門有“付出大于收獲”之感,容易產生抵觸和排斥心理。
再次,檔案質量和數據質量普遍存在不足,難以有效滿足業務需求。二者均對數據提出了較高的質量要求,但由于并不是數據的直接形成者,很難從源頭保障數據質量。雖然檔案部門在20世紀90年代就已提出前端控制、全程管理等理念與原則,但在實際操作過程中仍然受到各種因素的影響和制約。
最后,二者都需要平衡開放與保密、流通與安全的挑戰。檔案和數據的價值在于開放和流動,但前提是保障安全。近年來,黨和國家實施網絡空間安全戰略,出臺《網絡安全法》《數據安全法》等法律,高度重視網絡安全、數據安全等問題,強調自主可控,大力推進軟硬件等信息基礎設施的國產化,檔案和數據工作都面臨著巨大的安全保障壓力。
(五)檔案管理和數據管理的優勢互補和方法相通支持協同
檔案管理和數據管理各有優勢、各有劣勢,能夠相互借鑒、取長補短。檔案管理的優勢在于,經過長期歷史積累,已建立起完整的檔案管理體系,有《檔案法》《檔案法實施條例》(修訂中)等法律法規的保障,有國家檔案局等發布的部門規章、規范性文件、標準規范等作為依據和參考,有完善的組織架構(檔案局、檔案館、檔案室等)和人才隊伍,有配套的獎懲機制,有與檔案事業發展相適應的檔案學科建設,在檔案質量管控、價值鑒定、歸檔保存、真實性保障、元數據、連續性管理等方面形成較成熟的管理策略、流程與方法;其劣勢在于信息能力較弱,缺乏完整的信息化人才隊伍,在有效應對數字化變革和數據化發展帶來的沖擊與挑戰方面面臨嚴峻挑戰。而數據管理恰好相反,其優勢在于信息化能力和數據開發能力;其劣勢在于仍處于起步階段,缺乏健全完善的管理機制和制度體系,尚未普遍理清哪些數據需作為資產進行管理,面臨著數據質量不高、難以發現、利用不便、流通不暢等問題。
在管理目標上,檔案管理和數據管理具有相似性和互補性,檔案的“四性”(真實、完整、可用、安全)與數據的“六性”(完整、及時、準確、一致、唯一、有效)既有互通之處,也有互補之處。在管理環節和方法上,檔案管理與數據管理都遵循生命周期的理論與原則,在業務流程中涉及許多共性管理活動和相通的工作方法,為協同管理奠定了基礎。在形成獲取階段,二者均需精準識別管理對象,可同步開展排查工作,納入歸檔范圍的數據必然是重要數據資產,而具有保存價值的數據資產也應被納入歸檔范圍。在數據組織階段,二者均需建立目錄體系,用元數據對資源進行描述,以便于發現、定位和檢索。在數據存儲階段,二者均需考慮數據的長期保存和持續可用,確保數據在需要時可發現、可讀取、可解釋。在數據使用階段,二者均涉及數據檢索、開放共享、利用服務等工作,且需要對數據進行分級分類,旨在平衡開放與保密的不同訴求。在數據處置階段,二者均需基于數據價值,對數據的保管期限進行判定,并采取適當的措施對數據進行處置。此外,在管理人員設置、治理、風險管理、應急規劃、合規性等方面,二者也有著共性的管理要求和方法。[27]
(六)檔案管理與數據管理的相對割裂呼喚協同
在相對割裂的情況下,如果檔案部門和數據部門的職能定位和工作邊界不清,將會面臨管理資源重復投入帶來的資源浪費和效率低下等問題,業務部門也將“無所適從”。例如,在數據采集階段,業務數據應歸檔至檔案管理系統,還是進入數據部門的數據管理平臺?如果既要歸檔,又要入湖,業務部門將重復工作。當數據不一致時,應以檔案管理系統的數據為準,還是以數據管理平臺中的數據為準?再如,在數據獲取階段,當業務人員需要利用數據時,應在檔案管理系統中檢索,還是在數據管理平臺中檢索?業務人員如何能夠知道該從哪里獲取數據?現有的兩套管理體系常常使業務部門感到困惑和不解,迫切需要考慮如何更好地實現檔案與數據的協同管理。一方面,檔案管理的概念和方法可融入數據管理體系,并將在多年探索中形成的體系化知識貢獻于剛剛起步的數據管理,彌補數據管理長期保存視角的不足;另一方面,數據管理的方法和工具也應融入檔案管理體系,支撐數智賦能的檔案知識服務。
雖然檔案管理與數據管理在信息化發展過程中各有側重,逐漸形成相對獨立的管理體系,但二者同根同源,協同管理有著深厚的歷史根基;與此同時,在大數據時代,二者面臨著又一次的交匯融合,受到多種內外動因的綜合作用,協同管理勢在必行。2022年3月,美國國家檔案與文件署(NARA)發布評估報告——《機構首席數據官與文件管理項目的協調》,明確指出“以前認為文件管理和數據管理是不同的領域,彼此不同,現在應將其視為相關領域,需要在機構信息管理框架內進行協作、互惠和更緊密的整合”[28]。數據管理的興起既是挑戰,更是機遇,檔案部門應將檔案與數據協同管理作為推動檔案事業轉型升級的契機,將其視為未來檔案工作發展的重要方向,并予以規劃實施。
*本文系中國石油天然氣集團有限公司軟科學研究課題“企業檔案與數據資產協同管理研究”(中油研20210211)的階段性研究成果之一。
注釋及參考文獻:
[1]何思源,安小米.文件信息學:起源發展與批判反思[J].圖書情報知識,2022(4):92-100;151.
[2]MCDONALD J. Records management and data management : closing the gap [J]. Records Management Journal, 2010, 20(1):53-60.
[3]王玉玨,吳一諾.檔案法律融入數據法律體系的內在邏輯、問題與路徑[J].檔案學研究,2022(3):28-35.
[4]徐擁軍,張臻,任瓊輝.國家大數據戰略背景下檔案部門與數據管理部門的職能關系[J].圖書情報工作, 2019(18):5-13.
[5]蔡盈芳.數據管理業務與檔案融合管理研究[J].檔案學研究,2021(3):40-46.
[6]劉越男,何思源.科學數據與科研檔案的管理協同:調查與思考[J].圖書情報工作,2022(1):96-105.
[7]何思源,劉越男.科學數據和科研檔案的管理協同:框架和路徑[J].檔案學通訊,2021(1):49-57.
[8]GRAY J. Data management: past, present, and fu? ture [EB/OL]. [2022-08-25]. https : //www.microsoft. com/en-us / research / publication /data-managementpast-present-and-future/.
[9] [19]DOGIPARTHI H. History of information governance [R/OL]. [2022-08-25]. https : //www. re? searchgate.net/publication/330844911_History_of_Infor? mation_Governance.
[10][11][15][16]COX R J. Closing an era: historical perspectives on modern archives and records management[M].Westport: Greenwood Press, 2000:25,29,31,36.
[12] [13]FRANKS P C.Records and information management [M] . 2nd. Chicago: American Library Asso? ciation, 2018:2.
[14][18]JULIUS S D.Evolution of records manage? ment and archive administration in Swaziland[D].Lon? don: University of London, 1991: 42,48.
[17]周雪恒.中國檔案事業史[M].北京:中國人民大學出版社,1994:18-253.
[20]傅榮校.論三十年代南京國民政府的文書檔案改革[J].檔案學通訊,2005(1):87-90.
[21]DRAKE M A.Encyclopedia of library and infor? mation science[M]. 2nd.Boca Raton: Taylor & Francis Group, 2005:137.
[22]中華人民共和國檔案法[EB/OL]. [2022-08-08].http : // www. npc. gov. cn / npc / c30834/202006/ 14a5f4f6452a420a97ccf2d3217f6292.shtml.
[23]中華人民共和國數據安全法[EB/OL].[2022-05-24]. http : //www. npc.gov.cn/npc/c30834/202106/ 7c9af12f51334a73b56d7938f99a788a.shtml.
[24]ISO 15489-1:2016Information and documenta? tion—Records management—Part 1: Concepts and principles [S/OL]. [2022-05-22]. https : //www.iso.org/ standard/62542.html.
[25]PETERSON R E. A cross section studyofthede? mandformoney: the United States, 1960-62[J].The Jour? nal of Finance, 1974,29(1):73-88.
[26]DAMA國際.DAMA數據管理知識體系指南[M].DAMA中國分會翻譯組,譯.2版.北京:機械工業出版社,2020:4.
[27][28]National Archives and Records Administra? tion. Agency chief data officer coordination with records management programs[R/OL].[2022- 08- 26].https:// www.archives.gov/files/records-mgmt/resources/cdorm-assessment-report.pdf.
作者單位:1.中國人民大學信息資源管理學院
2.中國人民大學電子文件管理研究中心