夏寧萱 向立文
(湘潭大學公共管理學院 湘潭 411105)
近年來,數據開放已成為世界各國的大趨勢,大數據已經上升成為各大國之間的博弈新戰場,各國紛紛進行國家層面的大數據戰略布局。本文通過對英國檔案數字化建設的兩個典型項目進行分析,總結出英國在檔案數字化建設方面的典型經驗,并探討了對我國檔案大數據建設的啟示。
中國數字化建設整體還處于一個起步階段,特別是檔案大數據方面存在起步較晚、發展速度較慢等問題。而英國作為全球大數據浪潮的領頭羊,其國家層面的檔案大數據戰略布局已經走在了世界各國的前列。為了使英國國家大數據戰略更好地融入進檔案工作中以及為了推進英國大數據檔案事業的穩定快速發展,英國國家檔案館有計劃地制定并頒布了一系列檔案大數字化戰略項目。本文挑選了英國國家檔案館頒布的兩個具有代表性的典型項目,從宏觀層面入手,結合典型案例進行剖析,從而進一步了解英國檔案數字化建設的工作特點,以及我國的檔案大數據工作可以借鑒和吸收的英國先進的理論和方法,使得我國檔案數字化建設機制得到優化和完善,推動我國檔案數字化建設工作順利進行。
2015年10月,英國國家檔案館館長杰夫·詹姆斯在 Discovering Collections Discovering Communities(發現館藏,發現社區)大會上正式發起了Archives Inspire(檔案激勵)戰略[1],Archives Inspire戰略也是英國國家檔案館在接下來四年的一項檔案工作新計劃,該計劃旨在2015年-2019年間,從提高工作效率和提供高效服務的角度,通過多種方式進一步加強國家檔案館的管理工作。從推廣檔案大數據的方向來解讀該戰略,其主要內容有以下幾點:
第一,加強對檔案大數據資源的挖掘與利用。國家檔案館將通過大數據技術向政府提供實時的專業意見,以確保檔案數據得以良好保存和有效利用。檔案部門將通過收集的海量數據和大數據挖掘技術快速判斷當前市場趨勢,以此在一定程度上彌補統計部門在收集數據和發布數據上存在的滯后性,為政府提供更加精準的宏觀信息。同時,英國國家檔案館倡導各部門之間應大力加強數據交流以及各項合作,以確保創新意識,豐富經驗和專業知識能得到更廣泛更及時的分享,為政府實施更加有效的政策提供更為準確的數據指導。
第二,不斷完善檔案數據化頂層設計。通過推進檔案數字化能力促進形成以國家檔案館為中心的檔案管理網絡。英國國家檔案館處在這個國家多元化檔案管理網絡的核心地位,檔案館旨在通過提供相關高層政策建議以及領導相關工作,幫助更廣泛的公共部門推動一系列積極措施來參與檔案管理活動;通過推進檔案數字化能力戰略,解決各檔案部門之間工作技能、專業理論和實踐能力等方面的差距。英國國家檔案館將積極促進與其他檔案機構的合作來保證館藏的規模和檔案大數據的實現,致力于更好地維護和發展國家館藏,使檔案成為國家遺產的重要組成部分之一[2]。
第三,保證檔案工作人員的職業技術能力,通過數字化手段的不斷發展促進知識的廣泛傳播。英國國家檔案館的研究人員要求在歷史研究、數字記錄保存和專門檔案研究的眾多領域具有相當扎實的專業知識,研究人員們精湛的專業技術與超強的學習能力將為檔案館的數字化發展增添無限活力;研究人員還需要不斷追蹤數字技術的最新趨勢,以便及時響應學術界和科研部門不斷變化的需求。
第四,促進數字化檔案館的形成。面對大數據技術的快速發展,豐富的檔案館館藏在更進一步地滿足社會需要的同時,也增加了對信息的提取儲存以及對信息的處理方式的難度,陳舊的檔案數字化管理手段已經很難跟上檔案大數據時代的技術要求,為了滿足最新檔案數據信息處理方式的技術要求,國家檔案館將不斷更新數字記錄基礎設施的硬件設施,以便更好地保護和保存數字記錄。英國國家檔案館將發展其作為世界領先的數字檔案館的能力,改進把生成的數字和數字化記錄引入到數字記錄基礎結構中的工作流程,從而可以更快地加載更多記錄;開發一個Digital Preservation Risk model(數字保存風險模型),以便檔案館更好地理解和應對檔案數字化的保存風險;通過多種學習活動,培養工作人員在云計算和機器學習等新技術方面的技能;同時發展其作為世界領先的數字檔案館的號召力,將與英國和世界各地的其他檔案館合作,分享關于數字化檔案實踐的最新想法、知識和技能[3]。
英國國家檔案館部長于2017年3月29日在檔案館網站上發布了英國檔案的最新戰略規劃《Archives Unlocked》(檔案解鎖),這是一個綜合性的戰略規劃,強調檔案行業對整個社會的重要性,承認并頌揚檔案在更廣泛的文化部門和整個社會中的價值,同時重點關注數字技術是如何從根本上改變了人們使用檔案的方式。數字化轉型是《Archives Unlocked》核心所在[4]。
《Archives Unlocked》中規劃了三個主要目標,分別是:信任、豐富和開放[5]。這三個目標在文件中通過相對應的案例研究將其核心闡述得非常簡潔明了,并且通過案例思考展現了檔案部門現有的良好實踐和對未來的新想法:
第一,強調建設數字能力。如何在保證檔案系統數字化后的安全能力同時也能夠直接滿足檔案用戶的需求這是檔案數字化中的一大難題。“信任”即指人們和機構信任檔案的保存方式、呈現途徑以及本身的真實性:通過對檔案記錄、持有單位和個人的審查,加強了民主和社會的建設;檔案用戶對記錄的完整性和真實性以及支持他們研究的專業人員都抱有信心;把握住技術變革的機會,確保檔案領域抱有對數字和物理記錄的信心。
為進一步提升檔案系統的安全性能,提高用戶對檔案的信任,英國國家檔案館開發了E-ARK項目。E-ARK是一個開創性的全球研究項目[6]。它搜集和匯合了各國的實踐經驗,研發出了第一個端到端的數字檔案系統。這種獨立、可擴展、強大的系統可供所有公共和私人、大型和小型存儲機構使用,以應對新生成的電子文件的挑戰。每個檔案館都可以共享一個完整的系統,而不是只具有一點專業知識。這意味著各類存儲機構在成本和技能方面能擁有很大的改進。
第二,強調檔案利用的多樣化。“豐富”即指檔案部門應在智力、文化、經濟等方面不斷增強和豐富我們的社會:通過發現和使用檔案數據的多種方法來擴展我們所學習的知識和文化;通過對檔案材料的多重使用來使得企業的價值在變革和創新手法下得以增長;通過參與檔案數據的收藏、整理和使用,使人們的生活能夠得到改善。檔案的力量既在于其證據的力量,也在于其情感的力量。
巴拿諾斯(Barnardos)檔案館創立于1867年,創辦以來一直致力于改變英國弱勢兒童的生活。巴拿諾斯檔案館在1995年開放了他們的檔案數據,這一舉動改變了以前的居民獲取他們個人檔案的方式,也使人們認識到了解他們的過去意味著什么。在這個項目中,檔案館投資了12萬英鎊,將50萬張照片數字化。檔案的可用性是最重要的,所以巴拿諾斯檔案館正在與Wellcome Trust合作開發檔案目錄并改進查找工具。巴拿諾斯檔案館開放檔案數據后幫助了很多人了解各種各樣的護理經驗,以及從檔案記錄的過去中不斷學習、質疑和改進他們現在支持和保護孩子的方式,這是非常重要的一件事。有人會問,檔案與社會的幸福度有聯系嗎?其實,檔案是國家責任的核心部分之一。對于檔案部門來說,現在面臨的挑戰是如何通過檔案大數據技術和優質服務,來發展檔案系統與社會效益的聯系,同時將這些聯系納入政策中,及時給予關注并采取行動,以此達到利用檔案數據來增加社會的幸福感的目的。
第三,強調檔案服務的開放性。“開放”即指檔案館應培養一種開放的方式使人們來獲取知識并且這種方式對所有人都開放:檔案館應提供極好的用戶體驗,使人們能夠發現、訪問和解釋數字以及物理檔案記錄;檔案網絡在全球范圍內聯網以保持良好的檔案實踐,并為各類機構和用戶打開新的可能性。
Know Your Place(了解你的位置)是一個數字地圖項目,它允許用戶在網絡上瀏覽他們本地區域[7]。Know Your Place是布里斯托爾檔案和城市規劃團隊的一次優秀合作,在這張地圖上,你可以了解當地充滿了歷史故事的名勝古跡;欣賞各種美景照片、海報和傳單;聆聽當地人的傳奇故事;探索本地吃喝玩樂的好去處。數字地圖項目將數字專業知識深入到傳統的檔案技能中,把紙質媒體、數字媒體和其他媒體的信息收集后進行集成,利用線上可獲取的數字化檔案內容水平的提高以及虛擬應用等新技術提供的機會,把跨越了不同格式和不同載體的地圖與歷史相關材料整合之后以可視化的方式進行呈現,以生動多彩的形式方便用戶隨時隨地獲取他們需要的相關信息。檔案大數據戰略下的檔案領導者不應該只專注于檔案數字化技術的提升,而是需要懂得通過對檔案獲取方式的創新來吸引新的受眾者從而實現自身的效益目標。
隨著“數字化革命”浪潮的到來,數字技術從多方面改變了現代社會的生產和生活方式,同時也使檔案領域發生了深刻變革。英國政府明確認識到數字檔案資源利用的核心在于如何利用最新的數字化技術挖掘出數字檔案資源的最大潛在價值。而數字技術為檔案工作打開了大門的同時也對檔案的真實性、完整性和合法性提出了嚴峻挑戰,因此需要通過完備的頂層設計建設出高質量的數字檔案管理系統。為此,英國國家檔案館開發了端到端的E-ARK系統來保證檔案數字化建設中的安全性,數字地圖項目借助數字技術展現了各類檔案材料集合之后的生動運用,希爾斯堡調查中借助數字技術則證明了歷史檔案材料是追究責任的有力工具。可見,檔案數字化過程中,需要重視利用好數字技術開發手段,只有這樣才能最大限度地激活檔案的數據價值。
基于《Archives Inspire 2015-2019》戰略的提出,英國檔案館在2017年3月又提出了《Our digital strategy 2017-2019》(我們的數字戰略2017-2019年)[8],這個數字戰略的規劃圖分為了三個階段,每一個階段都有檔案館的明確數字人才培養目標:[9]第1階段-重塑(2017年1月至2017年6月):我們將重新構建一個專業的數字團隊,使我們能更好地實施這一戰略。我們將做出重要任命,特別是數字服務主管、數字檔案主管、網絡檔案主管和數字保存技術架構師,以及其他四項新任命,以便更好地發展英國檔案館的數字領導能力。第2階段-成長(2017年7月至2018年9月):我們將極力發展我們的專業數字團隊,并且壯大我們未來的員工隊伍。第3階段-加速(2018年10月至2019年12月):我們將加快步伐,通過對數字團隊的擴展更快更好地發展檔案館的技術能力。英國檔案館一直在不斷加強數字技術人員的職業發展。
英國作為大數據的積極擁抱者,其數據公開和數字資源再利用戰略早已走在了世界前列。英國由政府帶頭建立了“英國數據銀行”,并且以此為契機,努力把英國打造成為國際上大數據開放和利用的領頭者。英國政府于2012年5月投入10萬英鎊,建立了全球首個開放式數據研究所ODI(The Open Data Institute ),ODI是個非營利性組織[11],人們所需要的各種數據都被ODI集合在一起進行多種融合,這樣能更方便的使不同的領域在產生各種不同數據的同時又可以有效利用這些數據。ODI為社會公眾、科研機構以及政府相關部門的工作帶來了極大便利。英國國家檔案館官方頁面還設有專門的公共部門信息再利用版塊,對檔案信息資源再利用的框架、原則和方法等進行了簡單介紹, 增進了公眾對數字檔案資源再利用的認知。
面對體量龐大的各類數據,面對廣泛的社會需求,檔案大數據工作如何開展?英國的檔案數字化項目啟示著我們,以項目為抓手,推動檔案大數據建設,這是值得借鑒的寶貴經驗。因為檔案數據化建設千頭萬緒,需要統籌規劃,穩步推進,而其過程中,通過適時推出一些關鍵的示范性項目,來實現人財物以及技術的聚焦,解決檔案大數據建設過程中的難處和核心處,這樣可以做到對癥下藥,而不是眉毛胡子一把抓。相比于實力雄厚、走在世界前列的英國檔案數字化建設,我國的檔案數字化建設存在起步較晚、技術不夠成熟等問題,要想全面跟進英國, 必然會出現多方面的問題。這種情況下,我們選取一些具有戰略性、引導性和針對性的重點項目為突破口,擴大影響力,以點帶面、有序推進。同時,可以通過重點項目的建設,開發檔案數據建設新思路,創新檔案數據建設方式,從而提升檔案大數據建設的效能。在國家未來重點發展行業中選取具有代表性的項目,從行業特殊性出發, 強化特色檔案的資源整合,是推動檔案大數據建設高質量發展的重要載體,如中國石油天然氣管道工程有限公司(管道設計院)進行的大數據時代油氣管道設計企業檔案信息化建設,管道設計院通過運用檔案信息化系統功能和管理方式,實現了企業電子檔案的有效利用、安全存儲,為油氣管道設計企業提供了重要參考。[12]圍繞國家重點支持領域組織并支持實施相關產業重大項目,著力檔案信息的開發利用, 是促進檔案大數據建設創新發展的基礎工作,如浙江廣播電視集團進行的干部人事檔案管理信息化建設,涵蓋了干部人事檔案數字化采集、業務流程、檔案閱覽等功能模塊,實現了干部人事檔案的信息化、智能化應用,為電視媒體行業建設數字檔案室、人事檔案管理系統提供了一定的參考。[13]
檔案工作的開展,歸根到底需要人去做。尤其是檔案大數據建設,技術性強且復雜,需要大量綜合素質相對較高的人才。而現有的檔案從業人員的知識水平、技能結構還不一定能夠完全滿足現實工作的需要。據中華人民共和國檔案局公布的數據來看,截至2018年底,各級檔案行政管理部門和綜合檔案館現有專職人員中,博士研究生和碩士研究生加起來占總人數的4.8%;研究生班研究生和雙學士共占總人數的3%;大學本科學歷背景人數最多,占總人數的61.7%;大專及以下學歷者占總人數的30.5%。而從專業程度來看,具有博士研究生和碩士研究生的檔案專業背景的人數加起來占總人數的1%,而所有具有檔案專業程度的專職人員加起來也才占總人數的17.6%。[14]由此可見,我國檔案人員的專業程度還有很高的提升空間,現階段存在的主要問題集中在突出型檔案專家較少,檔案復合型人才缺乏,檔案從業人員專業背景薄弱、知識構架較為單一等方面。

表1 各級檔案行政管理部門和綜合檔案館專職人員文化程度(人數)
因此,為了順利推進檔案大數據建設,需要在人才培養上下功夫。一方面,需要完善專業人才培養的課程體系,加大現代信息技術課程的開設力度,通過積極開設《數據導論》、《數據挖掘與分析》、《人工智能》、《大數據技術》等方面的專業課程,逐步提升學生的專業知識與專業素養;另一方面,加強在職人員的培訓教育,通過專題培訓與講座,普及大數據知識與技術,幫助在職人員提升檔案數據領域的專業知識和專業技能,提升其技術素養,從而使之勝任檔案大數據的相關工作。
在當今大數據時代,人們對檔案資源的利用不再是停留在原件或復制件層面,而是逐漸轉向對檔案數據的深度挖掘和有效利用上,而檔案資源開發利用的效果是由檔案信息資源的挖掘與利用來決定的。英國在2012年建立了世界第一個數據研究所,花費約10萬英鎊。大數據技術創造的價值在英國已經頗有成效,英國政府通過高效使用公共大數據技術每年可節省約330億英鎊[15]。為了加強檔案大數據資源的挖掘與利用,我國可以鼓勵社會各界參與案大數據資源建設,加強產學研合作,創新方式方法應用大數據技術,構建檔案數據資源共享服務平臺,為檔案大數據的資源建設添磚加瓦,提升數據挖掘與利用的效能。
為推進檔案數字化建設,英國形成了一套較為完善的國家檔案法律體系,以《公共檔案法》為基礎,《信息自由法》《環境信息條例》和《數據保護法》為分支[16],檔案法律與政府開放條例或相關數據法規之間做到了相互配合、保持一致,從而為檔案數字化建設工作提供了堅實的保障。而我國現行的檔案法律較為單一,僅有一部1987年9月5日制定的《中華人民共和國檔案法》, 分別在1996年、2016年和2020年經過三次修訂,而在2020年6月最新修訂的《中華人民共和國檔案法》中才正式新增了包含了七個法條的“檔案信息化建設”章節,這一章節涵蓋了電子檔案管理信息系統建設、數字檔案館建設、檔案數字資源共享等有關檔案大數據建設的重要方面,“檔案信息化建設”章節的新增對于推進我國檔案大數據建設必將產生重大影響。在數據治理方面則有近日出臺的專門保障數據安全的法案 《中華人民共和國數據安全法(草案)》與《網絡安全法》、《個人信息保護法》,雖然我國對于數據治理方面推出了多條法規,但是還沒有一條專門的法律政策來給予檔案數據化建設足夠的安全感,并且一些相關的政府數據治理條例與專業的檔案法律之間沒有做到緊密銜接、互通有無,導致檔案數字化建設的實踐過程中容易出現主體權責劃分不清、政府工作信息化與檔案業務工作脫節等問題。為了進一步推進檔案大數據建設,我國需要盡快出臺一些專門促進檔案大數據建設的法規與政策,通過構建起一套完善的法律制度體系,為檔案信息化建設保駕護航,從而保障檔案大數據建設健康可持續發展。
面對體量龐大的各類數據,檔案數字化的布局更顯得尤為重要。檔案大數據的成功建設一方面能滿足公眾對于檔案數據收集和公開等方面的需求,另一方面也能充分激發檔案數據的活力,有利于檔案數據的不斷優化。英國作為一個老牌資本主義強國,其政府早已開始指導全國各行各業積極地推進檔案大數據建設工作,且一一落實在具體行動方案上。筆者選取了英國檔案數字化建設中的兩個耀眼成果進行分析,可以看出英國政府在進行檔案數字化建設的過程中不斷強調大數據技術對于檔案管理的重要性、培養檔案部門人員有適應時代不斷發展的專業能力的重要性以及充分利用數字檔案資源的重要性。在此基礎上提出我國在推進檔案數字化建設時應該加強項目建設,為檔案大數據建設提供抓手,加強人才培養,為檔案大數據建設提供智力支持,加強技術應用,為檔案大數據建設賦能,加強法制建設,為檔案大數據建設保駕護航。