趙躍 王俊慧
摘要:從數字化到數據化是檔案工作轉型的重要表現,也是帶動檔案管理思維轉變的重要動力。文章通過比較檔案數字化和檔案數據化所體現的檔案管理思維,提出數據轉型時期要推進存取導向思維向開發導向思維的轉變、信息服務思維向知識服務思維的轉變、信息管理思維向智慧管理思維的轉變、開放檔案思維向開放數據思維的轉變的觀點。
關鍵詞:數據時代;檔案管理思維;檔案數據化;檔案數字化
分類號:G271
From Digitalization to Datafication: The Transformation of Archival Management Thinking
Zhao Yue1, Wang Junhui2
(1.School of Public Administration of Sichuan University, Chengdu, Sichuan, 610065; 2.School of Information Management of Wuhan University, Wuhan, Hubei, 430072)Abstract:From digitalization to datafication is an important phenomenon of archival work, and also an important driving force for the transformation of archival thinking. By comparing the archival thinking embodied in the digitization of archives and the datafication of archives, this paper puts forward the view of promoting the transformation of preservation-oriented thinking to developmentoriented thinking, information service thinking to knowledge service thinking, information management thinking to intelligent management thinking, and open archive thinking to open data thinking.
Keywords:Data Era; Archival Thinking; Datafication; Digitization
檔案管理思維是人們對檔案及檔案工作的理性認識,對檔案管理實踐的開展具有導向作用。作為一種存在于人腦的主觀認識,檔案管理思維具有時代性特征,同人類的檔案管理實踐及其相關認識活動和文化發展水平是一致的[1],而在眾多推進現代檔案管理實踐發展并決定檔案管理思維轉變的因素當中,信息技術無疑是最具影響力的因素。20世紀90年代,我國檔案信息化建設正式拉開序幕,檔案工作開始從模擬時代邁向數字時代,檔案數字化成為數字時代檔案工作的重要內容。21世紀初,大數據、人工智能等新一代信息技術開始推動檔案信息化向縱深發展,檔案工作也開始從數字時代邁入數據時代,檔案數據化逐漸引起檔案界的關注[2]。作為兩個時代的產物,檔案數字化和檔案數據化也體現出不同時代的檔案思維。為揭示從數字化到數據化所體現出的檔案管理思維變化,筆者基于檔案數字化所體現的檔案管理思維,結合數據時代下檔案及檔案工作的新形勢、新變化和新動向,論述檔案管理思維的具體轉變,以期對檔案界認識新時期的檔案與檔案工作有所啟示。
“存”是檔案工作之本,檔案館最重要的職能就是安全、長久、可持續地保存檔案。1980年,中央書記處做出開放歷史檔案的決定后,檔案工作開始走向開放、走向社會,檔案館職能向“取”拓展,檔案開放獲取與利用編研等工作受到重視。由此,存取導向思維成為改革開放后我國檔案管理實踐中的一種典型檔案管理思維。存取導向思維影響下的檔案數字化關注檔案原件的安全保護與檔案信息資源的保存、獲取,但這種思維存在“重存輕取”的偏見。一方面,為加快檔案數字化進程,檔案機構往往過度追求館藏檔案數字化率,將傳統載體檔案的“轉換”和“存儲”作為檔案數字化工作的首要任務和工作重點,從而忽視了對檔案開發價值和用戶需求的把握;另一方面,數字化后的檔案雖然改變了檔案的存在形式、拓寬了檔案信息獲取渠道,但并沒有實現對檔案信息資源的深度開發。檔案數字化為計算機檢索提供了基礎,但淺層次的檔案數字化往往只能實現對檔案的計算機化識別和讀取,無法實現對檔案信息的計算機理解和分析,檔案數字化仍停滯于更細粒度的檔案數據化處理與開發之外。
相比之下,開發思維導向下的檔案數據化則更加關注對檔案數據資源的開發與挖掘,這使檔案信息資源的開發深度與開發層次發生了變化,開發的重點也從檔案信息資源本身走向了細粒度檔案數據資源所包含的知識,這推動了檔案數據和信息內容向知識的轉化。2014年,計算機科學家Sara Klingenstein和Simon Dedeo協同歷史學家Tim Hitchcock在《美國國家科學院院刊》上刊發文章《倫敦老貝利的文明進程》,利用大數據技術繪制出法律詞匯在當時社會背景下的演變趨勢,揭示了刑法中至今仍然有效的幾個重要趨勢[3],他們將天體物理推理應用到數據庫分析中,挖掘法律文獻并進行社會分析,使法律文獻獲得了新的意義和價值。而這項研究對于檔案館和圖書館等館藏機構而言,意味著對其館藏資源的重新定位,通過數據化以及數據開放服務,在數據驅動下可實現對傳統館藏資源價值的重新發現[4]。
數據轉型時期,數字化依然是檔案工作的重要內容,但檔案數據化為檔案管理帶來了數據態的管理對象,這將有力推動計算技術、計算思維與檔案數據資源開發的結合,即在數據時代,檔案數據化開發會逐漸成為檔案工作的重點。總之,推進存取導向思維向開發導向思維的轉變,有助于實現檔案資源在數據層級的開發,可為當下檔案機構開展國家重點檔案的保護與開發提供新思路。
檔案服務是連接檔案資源與檔案用戶的中間環節,檔案服務的好壞將直接影響用戶滿意度以及檔案價值的實現[5]。20世紀90年代,如何借助信息技術、應用不同的服務方式為檔案用戶提供所需檔案內容信息引起了各級檔案部門的關注。此后,檔案用戶需求、檔案價值實現與檔案信息服務的“信息服務思維”逐漸在檔案實踐中發揮作用。檔案數字化工作的推行凸顯了檔案工作中的信息服務思維,它推動檔案服務從基于實體的服務轉向基于信息的服務,實現“線下”至“線上”、“一對一”至“一對多”、“定點尋找”到“異地獲取”的轉變,但不可否認的是,信息服務思維的本質仍是檔案用戶主動索取所需檔案內容信息的過程。基于數字檔案所提供的檔案信息服務仍存在以下局限:其一,數字化后的檔案內容仍需要用戶有意識地進行查詢與檢索,并未形成檔案信息內容間完整的關聯網絡;其二,數字化后的檔案內容依然只有經過人的閱讀理解,才能為人所感知并轉化成有用信息,進一步呈現出完整的檔案知識體系。
知識服務理念自21世紀后便被引入檔案領域,但長期停滯于理念層面,未能在檔案實踐中發揮出應有的作用。檔案數據化強調將數字檔案轉化成數據資源,進而實現對檔案數據資源的深度挖掘與開發。通過引入知識組織、知識發現、知識可視化等領域的技術,對檔案數據資源以新的方式組織、開發和可視化呈現,可真正實現基于檔案知識的服務,改變檔案服務對實體和信息的依賴,發揮檔案在知識層次的價值。例如,為實現檔案知識發現,就要在考慮檔案內容與載體特征的基礎上,在檔案資源的收集、分類、提煉、整合的過程中,以數據化—結構化—語義化—網絡化—智慧化為主軸,通過數據源—數據集成—數據存儲—數據處理—數據可視化—知識應用—評價反饋等環節,經由知識關聯、知識聚合、知識共享等處理,形成由知識元、知識鏈、知識域、知識網所構成的多層檔案知識體系[6][7]。
總之,在數據時代,推進信息服務思維向知識服務思維轉變,有助于提升檔案部門對館藏數字檔案資源內容層面的把控能力,促進檔案信息服務向知識服務的轉型,同時也為檔案部門進一步開展數據服務、智庫服務提供動力。
自20世紀90年代起,為迎合檔案信息化建設浪潮,檔案部門開始部署檔案管理信息系統,將很多手工操作的流程和環節轉移到計算機當中,逐步實現檔案管理由實體管理向信息管理的轉變,信息管理思維也逐漸在檔案工作中得以形成。檔案數字化工作受信息管理思維的影響,對紙質檔案數字化后所形成的數字檔案資源的管理依賴于檔案管理系統或第一代數字檔案館系統,而這些管理系統的功能多停留在“收、存、管、用”相關的基本業務環節。可見,檔案數字化促進了對紙質檔案的信息化管理,這對于紙質和數字檔案的科學管理、規范管理和安全管理具有重要價值。然而,這與近年來興起的智慧管理還有很大差距,智慧管理作為未來數據時代和智能時代檔案管理的一種全新模式,不僅需要依靠云計算、大數據、人工智能等技術,還需要樹立“數據驅動”的理念,推進檔案數字化向數據化的轉型。
在數據時代和智能時代,檔案部門首先需要關注的不是相關技術的引入問題,而是需要認真思考哪些業務環節亟須通過自動化和智能化來提升工作效率和質量,哪些業務環節可以借助智能技術來達到更好的效果,以此確定檔案管理智能化建設需求和目標。在此基礎上,再與相關技術部門或第三方探討論證應該應用哪些成熟技術、通過哪些方式方法、做好哪些資源準備、梳理哪些流程和業務規則才能推進檔案管理工作智能化的實現,如智慧收集、智慧歸檔、智慧鑒定、智慧編研等。作為推動智慧管理實現的重要技術支撐,人工智能在國外文件保管領域的應用包括文本分類與分析、文件鑒定、選擇、處置與敏感性審查等,并且已有一些檔案領域的實踐案例可論證其應用的可行性。例如,澳大利亞維多利亞公共檔案館基于Proof of Concept項目,利用機器學習技術實現對維多利亞州政府大量非結構化電子郵件的鑒定、處置和敏感性審查,致力于提高政府信息的透明度和可問責性,通過政府信息公開,滿足人民對公共事務相關信息的需求。同時,該國政府財政部門在Proof of Concept項目的基礎上還繼續深入開展文件管理自動化實踐,目的在于將該類技術拓展應用至文件管理工作全流程[8]。
但正如Gregory Rolan等學者所言,人工智能應用于文件保管工作仍面臨一些障礙:其一,目前人工智能技術在文件保管領域應用的可行性大小尚未可知,仍缺乏相關案例的佐證;其二,機器學習方法產生的工作方案對技術提出極高要求,即需結合其他新技術進行融合應用,否則將失去人文關懷;其三,人工智能技術與人文關懷的融合還較為不成熟,如對文件的鑒定和銷毀,不僅要注重文件本身的內容質量,還需結合文件背景資料和關聯網絡,甚至對數據價值重組再生進行預測,這都將影響最終判斷[9]。可見,檔案數據化以及數據化后的檔案數據治理是人工智能技術成功應用的重要保證。
總之,在數據時代和智能時代,推進信息管理思維向智慧管理思維轉變,有助于檔案智慧管理的實現,推進數字檔案向智慧檔案、數字檔案館建設向智慧檔案館建設的轉變。
開放檔案曾被認為是檔案史上具有劃時代意義的一場革命,因為這意味著全體公民都享有了利用檔案的權利[10]。檔案管理單位必須依法向社會各界及時公布和開放可以被利用的信息,以防館藏檔案信息錯過最佳價值實現時機[11]。可以說,開放檔案是我國國家檔案館的法定義務,也是各項檔案開發利用工作的大前提,但一直以來,在開放檔案思維的作用下,檔案開放利用的形式較為有限,一般檔案館對所有已到開放期限的檔案,經鑒定無需繼續保密或控制使用后便進行系統整理,編制提供利用者自行檢索的案卷或文件級開放檔案目錄,并向社會開放利用,但利用者通常只能前往檔案館查閱大廳進行現場利用,不僅查閱數據有限,而且一般情況下只能以摘抄為主。數字化以及數字時代的到來,雖擴大了開放檔案信息的獲取途徑,如通過網站發布開放檔案目錄信息,但并未真正實現檔案開放利用工作的變革與創新。
近年來,全球掀起的科學數據、社會科學數據、政府數據等領域數據開放運動引起了極大反響。以政府開放數據為例,政府開放數據是指任何人都可以訪問、使用和共享的公共數據,是經過開放鑒定且在政府開放許可范圍內的,不受著作權、專利權等的限制,可以面向社會公眾開放供自由獲取的數據[12]。在這場聲勢浩大的開放運動影響下,各國檔案部門都開始了對檔案數據開放的探索。無論是國際檔案理事會還是美國、英國等歐美發達國家,都在關注并加緊探索檔案部門以及檔案工作者在數據開放中應該扮演的角色和承擔的義務,很多國家檔案館也積極參與到數據開放運動當中。例如,新西蘭檔案館在其官網上開設了“開放數據”欄目,為用戶提供已開放的檔案數據集[13]。當前,國內檔案部門也參與到政府數據開放當中,但其發布的數據大多是檔案部門的“政務數據”,這并非是真正意義上的檔案數據。有學者從政府數據開放的角度出發并認為,檔案數據開放可以簡單理解為將檔案機構收集保存的所有原始數據向公眾開放[14]。
2016年國家檔案局發布《全國檔案事業發展“十三五”規劃綱要》并提出:要制定檔案數據開放計劃,優先推動與民生保障服務相關的檔案數據開放[15]。2020年6月20日發布的修訂后的《中華人民共和國檔案法》第二十八條規定:“檔案館應當通過其網站或者其他方式定期公布開放檔案的目錄,不斷完善利用規則,創新服務形式,強化服務功能,提高服務水平,積極為檔案的利用創造條件,簡化手續,提供便利。”可見,所謂國家層面的檔案數據開放目前更多是指檔案目錄數據的開放。因而筆者認為,檔案數據開放與檔案部門參與政府數據開放不能等同。檔案部門參與政府數據開放,開放的數據多為檔案部門的政務數據;而開放數據思維下,檔案數據開放應更加強調“開放與檔案相關的數據”,因而應重點考慮開放包括目錄數據以及檔案數據化后從檔案內容中提取的細粒度的內容數據。
因此,從開放目錄數據到開放內容數據的轉變,將會成為新時期開放檔案思維的又一次變革,而這次思維變革是建立在檔案數字化向數據化轉型的基礎之上的。在檔案數據化的基礎上,檔案部門設計檔案數據開放平臺,以數據集的形式發布人物、活動等專題類檔案數據,這將會帶來檔案數據價值發現和檔案數據重用的重大創新。
國家大數據、數字中國、智慧社會等戰略愿景的提出,推動著重要信息資源高度數據化、互聯化和智能化[16]。檔案資源作為輔助黨委政府決策,服務社會和群眾生產生活的重要信息資源,具有數據化處理與開發的必要性。檔案數據化是檔案與檔案工作在新興信息技術影響下形成的新趨勢,它反映了外部技術和方法輸入后,檔案界面對機遇和挑戰的積極應對。面對檔案管理實踐的時代變化趨勢,能否及時更新檔案管理思維,關乎數據時代檔案工作和檔案學研究的整體規劃和總體戰略。文章通過比較檔案數字化和檔案數據化所體現的檔案管理思維,提出數據轉型時期要推進存取導向思維向開發導向思維的轉變、信息服務思維向知識服務思維的轉變、信息管理思維向智慧管理思維的轉變、開放檔案思維向開放數據思維的轉變。在數據轉型的背景下,檔案界應更新檔案管理思維,積極尋求檔案工作與檔案學研究的轉變方向,找尋數據環境下,檔案在數據治理和社會管理中的角色與定位。結合國家重點檔案保護與開發工作,以試點開發為手段,推進檔案數據化進程,不斷探索檔案工作與國家戰略的切合點,以積極應對數據時代檔案工作的挑戰。
*本文系2019年四川大學創新火花項目庫項目“檔案4.0:智慧社會的檔案認知與檔案工作趨勢研究”(項目批準號:2019HHS-06)階段性研究成果。
[1]丁海斌.檔案管理思維論[J].檔案,2014(2):47-52.
[2]趙躍.大數據時代檔案數據化的前景展望:意義與困境[J].檔案學研究,2019(5):52-60.
[3]Klingenstein S,Hitchcock T.DeDeo S.The civilizing process in Londons Old Bailey[J].Proceedings of the NationalAcademy of Sciences,2014(26):9419-9424.
[4]Huwe T K.The Value of Data-Driven Special Collections[J].Computers in Libraries,2014(9):23-25.
[5]周耀林,趙躍.檔案資源建設與服務聯動模式探析[J].檔案學通訊,2015(5):51-57.
[6]朱令俊.數據驅動下檔案知識發現的路徑研究[J].檔案與建設,2020(2):30-34.
[7]牛力,袁亞月,韓小汀.對檔案信息知識化利用的幾點思考[J].檔案學研究,2017(3):26-33.
[8][9]Rolan G,Humphries G,Jeffrey L,et al.More human than human?Artificial intelligence in the archive[J].Archives and manuscripts,2019(2):179-203.
[10]陳永生.檔案開放利用情況的數據分析——檔案充分利用問題研究之二[J].檔案學研究,2007(4):15-17.
[11]陳兆祦,和寶榮,王英瑋.檔案管理學基礎[M].北京:中國人民大學出版社,2005:307.
[12]呂顏冰.論檔案部門參與開放數據建設的問題與途徑[J].檔案管理,2016(1): 20-23.
[13]董芳菲.開放數據環境下新西蘭檔案館的角色定位及其啟示[J].檔案與建設, 2018(10):24-28.
[14]馬海群.檔案數據開放的發展路徑及政策框架構建研究[J].檔案學通訊,2017(3):50-56.
[15]全國檔案事業發展“十三五”規劃綱要[J].中國檔案,2016(5):14-17.
[16]向立文,李培杰.檔案部門實施檔案大數據戰略的必要性與可行性研究[J].浙江檔案,2018(10):10-12.