尹 鑫
(中國人民大學信息資源管理學院 北京 100872)
隨著新興信息環境進入大數據時代,以區塊鏈技術為代表的信息技術成為新型生產范式,在檔案界掀起了新的技術革命,不僅對現有檔案業務和產業秩序發起挑戰,逐漸更新了傳統檔案行業的業務規則和流程,也在一定程度上改變了用戶對檔案行業的認知和行為模式,并引致了檔案業務和制度層面的變革。2018年12月15日,京東集團報告,已在文檔管理系統全面布局區塊鏈技術[1]。2019年1月10日,國家互聯網信息辦公室發布《區塊鏈信息服務管理規定》[2],從區塊鏈的信息安全風險角度規定了信息服務提供者的信息安全管理責任,標志著在大數據時代,區塊鏈應用及其數據安全問題已經引起國家高度關注。
區塊鏈是一種去中心化、無需信任、防篡改性強的分布式記賬本技術,綜合利用了密碼學、概率論、共識機制和分布式網絡等多種計算機技術,是互聯網發展史上的一次偉大創新。區塊鏈由許多個區塊構成,每個區塊由區塊頭和區塊體構成,許多區塊鏈接在一起形成區塊鏈。檔案數據就存儲在區塊體中,許多個檔案區塊鏈接在一起,形成檔案區塊鏈。區塊鏈技術的特點是公開透明性、不可變性、非中介性、數據冗余性,被Alexander Savelyev(2018)譽為“新經濟中最有前途的技術之一”,很好地體現了大數據時代跨界融合場景下的主導力量去中心化和服務對象去專業化的特征,區塊鏈技術繼大數據技術、物聯網技術的興起而逐漸進入公眾視野,因其普適性、可信性而成為時下前沿學術概念。區塊鏈基礎架構模型由數據層、網絡層、激勵層、合約層以及應用層構成,研究區塊鏈技術在檔案數據管理中的應用,可以為大數據環境下的檔案數據管理搭建底層技術框架和逐步實現系統架構。在傳統檔案管理情境下,檔案具有唯一屬性,即實體的唯一性、所含信息的唯一性、檔案形成過程的唯一性和檔案積累方式的唯一性。檔案信息收集場所統一,檔案信息處理加工程序統一,流轉的信息內容真實獨一等唯一性特征奠基了檔案規范保密可信的基礎。在數據態環境下,檔案信息量呈現海量化特征,傳統的管理方式已經不能有效解決檔案信息管理中信息收集、檔案利用等環節存在的制約矛盾。在數字檔案管理的八大業務環節,受限于中心化的數據庫技術,且檔案依據內容區分為涉密級、重要非涉密級、無必要對外公布級、依申請公開級四個保密級別,因此,電子檔案文件的安全性和真實性問題一直沒有得到較好解決,仍然有檔案偽造、竊取和篡改等惡性事件不斷發生。目前,數字檔案管理模式是“中心化數據庫+分布式終端”為主,而區塊鏈是分布式存儲方式,“集中式+分布式”是區塊鏈技術應用于檔案管理的發展前景之一。在符合檔案數據管理需求、保密性、內向性、封閉性基礎上,逐步引進、吸收、借鑒、試點區塊鏈技術,并建立和完善制度和技術層面的配套措施,是檔案學界和實務界必須認真思考的時代課題。
根據對國內外相關研究的回顧,發現國外的研究較之國內數量更多、與區塊鏈涵攝的各核心概念結合更為密切,在技術設計上更為前沿、精細、具體,研究涉及的計算機科學專業概念更多更領先,且多發表于計算機科學類國際權威學術期刊和會議論文集上,體現了檔案數據安全和區塊鏈、大數據、物聯網的融合式研究。
國外文獻對于區塊鏈技術對檔案數據安全管理的作用主要圍繞區塊鏈與物聯網[3]、區塊鏈與RFID系統、區塊鏈與用戶隱私保護[4]、區塊鏈與基因數據保護[5]、區塊鏈與hadoop[6]、區塊鏈與高精度數據歸檔[8]、區塊鏈與大數據流安全機制[9]等方面展開。譬如,Lemieux V L(2016)認為區塊鏈技術在采用適當的安全體系結構和基礎設施管理控制的前提下可用于解決歸檔信息完整性問題。García-Barriocanal E,Sánchez-Alonso S,Sicilia M A(2017)認為,區塊鏈已經成為一種部署分散數據庫的方法,這種數據庫不受篡改,開啟了數字檔案系統開發與運營的新方式。
國內文獻對于區塊鏈技術對檔案數據安全管理的作用主要圍繞區塊鏈應用于檔案數據安全的基本模式、區塊鏈保障檔案數據全生命周期安全管理模式、區塊鏈保障檔案數據全程可追溯管理模式、區塊鏈保障電子檔案安全模式、區塊鏈的聯盟鏈和私有鏈模式在單套制管理中應用等方面展開。譬如,劉越男、吳云鵬(2018)[9]以英國ARCHANGEL項目和InterPARES Trust歐洲團隊信任鏈模型項目作為案例,通過分析區塊鏈在數字檔案長期保存方面的長處、不足和風險,得出區塊鏈在數字檔案保存中成功應用需要解決尋找到保證哈希值持續有效的方法等7大關鍵問題,未來需要在推動區塊鏈檔案應用的標準化、完善生態系統等方面繼續發展。孫大東、楊晗(2018)[10]從區塊鏈的公共鏈、聯盟鏈和私有鏈三種安全應用模式出發探討了區塊鏈技術在檔案信息安全、實體安全、載體安全管理中的作用;應用區塊鏈時間戳技術可全面有效記錄電子檔案形成、流轉、改動、保存、移交的生命周期管理過程和連續、完整、可證的檔案保管鏈;應用區塊鏈時間戳技術可使電子檔案數據實現安全信任背書和來源可追溯;非對稱加密技術可通過橢圓曲線加密、RSA、Elgamal等算法產生的一對非對稱公開密鑰和私有密鑰滿足電子檔案身份驗證和數據安全需求;區塊鏈的聯盟鏈和私有鏈的完全和部分去中心化功能適用于各種類型的不開放電子檔案,譬如健康、人事、學籍檔案的管理。王發明、朱美娟(2017)[11]從文獻計量學角度,研究我國區塊鏈研究的時間空間分布特征、熱點主題、最新前沿。
國內外現有研究成果初步從區塊鏈技術對檔案數據安全管理可實現的全生命周期和全程可追溯管理、身份驗證管理、不開放管理、單套制管理方面取得了一定進展,但是較為缺乏基于檔案實踐部門具體認知和應用情況的實證研究,故本文嘗試推進這一研究領域。
本調研采用實地訪談方式,聽取國內檔案事業發展較為領先的不同類型實務部門負責人對于檔案數據安全的已有業務布局和區塊鏈技術應用于檔案數據態管理的意見,可以有效克服僅使用單一問卷方式產生的隨意性及樣本缺乏代表性問題,提高調研的針對性與代表性。選擇的調研對象有三類,一是黨政機關,譬如青島市公共檔案局(館)、深圳市公共檔案局(館);二是事業單位,譬如深圳市文檔服務中心;三是大型檔案服務企業,譬如深圳市萬維博通有限公司。這些意見,有助于標準和規則制定部門深入了解實務部門的需求,有助于改進實務部門對于技術標準和規則制定的參與,使技術標準和規則在前期設計和全面形成過程中能更好聽取、考慮、吸納實務部門的意見,從而更具針對性、價值性和可接受性,提高技術標準和規則質量與效率,筑牢技術標準和規則制定的社會基礎。
筆者分別對青島市公共檔案局(館)信息技術處負責人進行實地訪談和跟蹤訪談,對深圳市公共檔案局(館)監督指導處負責人以及信息技術處業務骨干、深圳市文檔服務中心工作組進行實地訪談和跟蹤訪談,對深圳市萬維博通有限公司工程檔案項目負責人進行實地訪談和跟蹤訪談,對深圳市羅湖區公共檔案局(館)負責人進行實地訪談和跟蹤訪談。訪談的主要方式為半結構式訪談。訪談主要圍繞區塊鏈技術認知、區塊鏈技術應用、區塊鏈技術與檔案數據安全管理工作布局等三個方面展開,訪談提出的主要問題編碼如表1,訪談所獲數據來源于檔案局(館)和企業的工作實踐,并根據跟蹤訪談數據進行更新完善,數據全部可靠可信,具有準確性、科學性和信度效度。
一是已經在檔案數據管理工作中密切關注區塊鏈技術。青島市檔案局(館)認為區塊鏈技術在檔案數據管理中的作用主要為來源可靠、管理可信、長期可用,檔案數據管理的全流程以及授權管理均無法篡改。深圳市公共檔案局(館)表示已密切關注區塊鏈技術,認為在檔案數據管理工作中可以嘗試應用區塊鏈技術。深圳市萬維博通優先公司表示已在文檔數字簽名、文檔數字加密技術中考慮嘗試應用區塊鏈技術。二是對區塊鏈技術在檔案數據中的應用持保守態度。青島市檔案局(館)認為由于區塊鏈技術屬于新興先進技術,檔案館不應用最先進的技術,而應用最成熟的技術,對于區塊鏈技術是否可以應用于實現檔案數據全程可追溯管理,要看是否會降低檔案工作效率。深圳市檔案局(館)認為區塊鏈技術應用,應考慮應用中檔案數據安全保障的高、低、徹底性問題。深圳市羅湖區檔案局(館)是表示對區塊鏈技術認知不多且目前文檔管理系統尚未用到區塊鏈技術。深圳市文檔服務中心表示對區塊鏈技術應用于檔案數據管理存疑,因為區塊鏈的分布式管理與檔案的封閉式管理相反,與圖書館的開放式管理相近。深圳市文檔服務中心表示就檔案實務來看,區塊鏈技術對大型企業較之公共檔案館更為適用,因為大型企業的檔案信息量更大。深圳市萬維博通有限公司表示對區塊鏈技術認知不多,目前公司文檔管理系統尚未用到區塊鏈技術。
一是表示已試點應用區塊鏈技術。青島市檔案局(館)表示計劃在青島、黃島、紅島館先試點區塊鏈技術,推進三城聯動和組團發展。二是表示需等待國家政策法規的指導。深圳市公共檔案局(館)表示不會率先應用區塊鏈技術,要看制度上和技術上,國家檔案局(館)是否認可該技術。提出從實務部門的角度看,區塊鏈技術的可信功能不一定能夠成功保障檔案數據安全,即記錄文件的每一步不可否認,不可更改,具體的實施要符合《數據安全法》的標準和要求。深圳市文檔服務中心表示要等國家層面先行開展區塊鏈技術應用后,文檔中心才會跟隨應用區塊鏈技術。如果國家檔案局提出推廣區塊鏈技術在檔案數據管理系統的應用,深圳市文檔服務中心愿意立即跟隨應用。三是對檔案數據管理中應用區塊鏈技術的建議。深圳市文檔服務中心提出可應用區塊鏈技術架構檔案進館之前超過50個節點的集中共享平臺。青島市檔案局(館)建議健全區塊鏈立法和因地制宜應用區塊鏈技術,建議通過法律保障區塊鏈技術在檔案數據的全生命周期管理中的應用,建議在《檔案法》中增加對檔案數據采集、鑒定、整理、保管、檢索、編研、統計、傳播、利用過程中的泄密風險的規制內容,并提示技術應用應符合時當時當地的檔案工作發展情況。
一是表示檔案部門可以為保障區塊鏈技術應用布局良好的數據安全環境。青島市檔案局(館)表示已開展信息劃控工作,并已采用RFID技術,可以將全文、目錄、照片、音像數據庫按照用戶需求進行一站管理,確保檔案的真實完整性。青島館對開放的檔案信息按照涉密級、重要非涉密級、無必要對外公布級、依申請公開級四個級別實行控制。對于涉密檔案信息安排專人接觸和保管。青島館按照其布局的檔案數據安全管理方式,已成功實現對青島珍貴歷史記憶的保存。深圳市公共檔案局(館)建立了“三塊制”檔案數據安全保障機制,同時,通過采用物聯網技術和RFID技術實現對特藏室檔案信息資源的定位和移動報警功能,解決文書檔案數據進出庫的數據漏讀問題。二是提示檔案數據管理中應用區塊鏈技術需要充分考慮相應的數據安全問題。青島市檔案局(館)表示,由于檔案管理已從傳統的紙質管理拓展演化至網站管理、數據庫管理、手機終端管理、微信等移動APP模式管理,檔案管理的依托、核心、更新、維護模式均發生變化,對檔案數據安全提出了更高要求。為確保檔案利用整體流程運行順暢,保障用戶的隱私和安全,檔案的“四性監測”工作必不可少。三是對檔案數據安全工作的建議。深圳市公共檔案局(館)建議綜合檔案館的檔案數據安全工作重點應考慮提供利用中的國家秘密保護、隱私保護、著作權保護問題。如保護國家領導人涉密照片檔案數據、保護具有珍貴歷史文化價值的民俗檔案數據、保護具有隱私聲明和保密約定的個體檔案數據等。同時,較之綜合檔案館,企業檔案數據安全工作更應充分考慮檔案數據的知識產權保護問題。
區塊鏈技術應用于檔案數據管理的理論優勢在于,一是區塊鏈技術可以實現檔案數據的全生命周期管理和全程可追溯管理;二是區塊鏈技術的可信機制可以有效避免檔案數據的篡改、竊取和泄密風險;三是區塊鏈的聯盟鏈和私有鏈模式可以推進封閉期電子檔案數據管理。未來結合國家大力發展區塊鏈技術的重大需求,可集中開展區塊鏈技術的應用研究,提出區塊鏈技術保障檔案數據安全的初步路線和底層架構,推進電子檔案數據單套制安全管理,具體研究方向主要有區塊鏈技術對于檔案數據全生命周期管理的作用研究,區塊鏈技術對于檔案數據全程可追溯管理的作用研究,區塊鏈技術、人工智能技術、物聯網技術在檔案數據管理中應用的比較研究,區塊鏈技術、人工智能技術、物聯網技術在建設檔案數據管理系統中應用的數學證明機制研究、互聯網+時代移動APP對傳統檔案社交媒體的創新與沖擊研究等。
區塊鏈技術應用于檔案數據管理的理論困境在于,區塊鏈的分布式原理與檔案的封閉式管理原理相反,與圖書館系統的開放式管理相近。區塊鏈技術應用于檔案數據管理的現實困境在于,一是實務部門對區塊鏈技術了解甚少,未深入思考和運營數據態環境下檔案數據安全管理,對檔案數據安全管理仍相當程度上停留在傳統紙質檔案布局層面;二是對在檔案數據管理系統應用區塊鏈技術存疑,甚至對區塊鏈技術在檔案數據安全管理中的應用持觀望態度;三是需要考慮區塊鏈技術應用于檔案數據管理的成本問題,以區塊鏈技術應用于檔案安全管理為例,采用類似于比特幣的工作量證明機制,由于共識機制需要大量用戶一起參與驗證,極為耗費網絡中各個節點的計算資源和經濟資源,故應該考慮計算成本和經濟成本問題;四是需要考慮檔案的相對封閉期過后區塊鏈技術過時問題,譬如,現行《檔案法》第二十七條規定,縣級以上各級檔案館的檔案,應當自形成之日起滿二十五年向社會開放。二十五年期間以共識算法為代表的區塊鏈技術不斷更新,軟硬件環境不斷變化,屆時區塊鏈技術是否還能適用于此類檔案數據的管理需要慎重探討。
宏觀層面,一是可以進一步完善檔案數據管理應用區塊鏈技術的政策法規、技術標準,開展信息環境較優越地區的技術試點應用,借助示范效應推進全國技術應用工作的開展;二是可以研發降低區塊鏈技術應用成本的補強技術。如在制度層面,可以完善區塊鏈技術應用于檔案數據管理的制度,構建制度與技術的雙軌制保障,加強事前規制和事中把控,從而實現檔案數據安全管理的高屋建瓴和無縫對接,其中,制度層面,可以根據國家網信辦已發布的《區塊鏈信息服務管理規定》,制定如何應用區塊鏈技術記錄、制作、存儲、復制、傳播、發布檔案數據信息的配套制度,以及禁止或限制應用區塊鏈技術記錄、制作、存儲、復制、傳播、發布檔案數據信息的范疇,或者在時機成熟時將相關規范的位階提升為行政法規或法律;又如在技術層面,可在區塊鏈技術應用于檔案數據管理的可信任機制、防篡改機制、分布式存儲機制的優化分析方面繼續優化。微觀層面,可以提升地方檔案實務部門對區塊鏈技術的認知和認可程度,促進檔案部門適應和融入數字社會,推進區塊鏈技術服務于檔案數據的異地存儲與異地備份,推進區塊鏈技術服務于文檔生命周期上鏈管理,進而服務數字中國建設總體進程。
一是區塊鏈技術在檔案數據可信任機制中應用的優化。譬如,早期信息系統安全技術中的防火墻技術,通過防止受信任服務器或客戶機與不受信任的主機間建立直接聯系,在內外網之間形成安全隔離屏障,同樣,區塊鏈技術可模擬防火墻技術可信任機制的核心功能,并加以拓展延伸,構建區塊鏈可信任機制。再如,區塊鏈技術可以提供檔案數據管理環境條件下檔案數據科學歸檔的技術基礎,即任何發生在同一個區塊鏈系統上的交易都會被既定的算法記錄到該區塊鏈上,具體來說,按照時間順序保存、查閱、記錄檔案的技術基礎在于區塊鏈“賬本”的各個區塊包含交易記錄,后區塊均會記錄前一區塊的標識,形成鏈條狀結構,當每筆區塊鏈交易發起的時候,只需把相關的交易信息傳播到區塊網絡中,“礦工”便會把該筆交易信息詳情記載到新的“區塊”并連到區塊鏈上,該項交易至此就完成了。同時,可以設置私有鏈管理涉密級檔案數據,設置聯盟鏈管理重要非涉密級檔案數據和無必要對外公布密級檔案數據,設置公開鏈管理依申請公開密級檔案數據。可信機制優化場景的實現,可在機構規范文檔建構領域實現。具體而言,可在以機構為單元的信息檢索、知識導航、科研評價等工作中構建區塊鏈規范文檔系統,應用區塊鏈的可信機制實現對機構知識資源的規范控制。
二是區塊鏈技術在檔案數據防篡改機制中應用的優化。首先,區塊鏈技術可以提供自動實現檔案監管的技術基礎,即可以實現具有極高安全性的“去中心化”的集約管理,有效減少甚至規避由檔案行政管理人員人工監管的局限性,減少因人為失誤、職務犯罪、疲憊等弊端,應用區塊鏈技術的去中心化、自動監管功能介入檔案數據系統建設過程,行使類似公共檔案館的監督指導功能。其次,可由國家檔案局制定統一的規則,運用區塊鏈技術提供“工作量證明”的機制,讓系統中的每個節點均參與存檔的審批,同時設置內部檢查和平衡程序,確保系統中的每個節點被真實記錄下來,所有的這些審查和監督完全由算法自動完成。現在出現的其他共識模型也都保留了任何客戶端或者節點都可實現點對點管理系統的這一核心理念。防篡改機制的優化,可關注區塊鏈電子存證領域。在互聯網法院試點應用區塊鏈存證中的防篡改技術保障電子證據的真實完整性。具體而言,可將區塊鏈技術的防篡改機制應用到檔案數據的全生命周期管理和全程可追溯管理中,結合刑事技術偵查手段,對證據檔案的來源和生命周期各階段的發展進行技術鑒定和印證推理,從而完善證據檔案的鑒定工作。
三是區塊鏈技術在檔案數據分布式存儲機制中應用的優化。首先,可以從新檔案創建、網絡廣播新檔案、共識機制、網絡廣播驗證結果、記錄區塊鏈五個環節應用區塊鏈生成檔案。具體來說,在新檔案創建環節,檔案所有者用自己的私鑰對新檔案進行數字簽名,然后將簽名附加在新檔案后;在網絡廣播新檔案環節,檔案所有者將簽名后的檔案廣播到全網,每個節點將收到信息納入新區塊中;在共識機制環節,在區塊的每個節點通過相當于解一道數學題的工作量證明機制,從而獲得創建新區塊的權力,并爭取得到數字貨幣的獎勵;在網絡廣播驗證結果環節,當一個節點找到解時,就向全網廣播蓋有時間戳的區塊,并由全網其他節點核對;在記錄區塊鏈環節,全網核對正確,就將該合法區塊加入區塊鏈。
其次,可以應用區塊鏈的聯盟鏈和私有鏈模式推進各相對封閉期內的檔案數據安全管理。檔案數據開放利用服務是數據態環境下檔案數據管理的工具載體,必須回應和處理好檔案數據的開放獲取與與檔案的內向性特征問題。價值擴展律認為文件價值形態通過機關、單位向檔案館移交檔案實現由第一價值向第二價值過渡,我國這一過渡一般需經歷10至20年時間,而且檔案進館后還要再過若干年,待其形成滿25年后,方能向社會開放,而在數據態環境下,如何解決大數據開放環境和檔案文件封閉期的矛盾,是檔案數據開放利用服務必須思考的問題。鑒于檔案數據管理具有傳統檔案管理固有的內向性與封閉性特點,應利用區塊鏈技術的聯盟鏈和私有鏈模式管理處于封閉期內的電子檔案數據,以實現真正意義上的檔案價值擴展。