連曉曉 唐松 姚利彬 左北辰



引言
檔案作為重要信息資源和獨特歷史文化遺產,價值日益凸顯,傳統紙質檔案雖然具有直觀反映歷史面貌的優點,但也存在收集整理難、儲存空間大、易損壞、利用難等弊端。隨著數字技術的飛速發展,信息資源越發成為一種重要的戰略性資源,檔案事業在迎來新的發展機遇的同時也面臨著前所未有的挑戰。適應并立足新發展階段,推進檔案數字轉型和智能升級,推進檔案工作適應黨政機構日常工作成為一項必不可少的研究課題。2021年國家檔案局進一步明確了檔案信息化發展工作要點及加快推進檔案數字化轉型工作[1]。
一、區塊鏈技術研究現狀
(一)區塊鏈技術概述
比特幣的底層技術就是區塊鏈,自此區塊鏈技術走入國內外學者研究領域,隨后區塊鏈技術被應用于以太坊,直到出現了企業級開發平臺超級賬本,區塊鏈才真正脫離了電子貨幣的束縛,為其他各行各業應用服務提供了可能[2]。區塊鏈本質上是塊鏈式數據存儲結構、共識算法、智能合約來驗證、存儲、保護數據安全的,目前成果應用于物聯網、醫療健康、供應鏈等領域。
(二)區塊鏈在檔案領域應用分析
作為一種安全的分布式賬本,區塊鏈意味著任何輸出都要經過網格內所有人的驗證。張奇文提出一種基于Gossip協議的信任收集共識算法,即通過評估鄰近節點的信息度選擇通信節點,消息在通信過程中不斷收集信任值,以超過全網臨界受信閾值時確認為達成共識,提高傳統算法的穩定性和效率[3]。區塊鏈技術在解決傳統檔案管理方面具有巨大潛力,越來越多的基于區塊鏈的應用研究旨在提高檔案管理的安全性。王洋以中國電力建設集團有限公司電子文件單套歸檔和電子檔案單套管理試點為例,結合區塊鏈技術進一步保障當前電子文件真實性[4]。聶勇浩以廣州互聯網法院為例,基于區塊鏈技術針對電子證據的可采、可信、可控和可用問題構建生態系統,保證電子證據安全可靠[5]。宋世昕為解決電子數據易攻擊性,很容易被篡改或破壞的問題,基于區塊鏈及IPFS技術,提出了一套基于區塊鏈和IPFS的去中心化電子存證方案[6]。梅勝以健康檔案為研究對象,以區塊鏈技術為基礎,構建了健康數據跨域共享業務模型,分析了健康檔案的跨域共享業務和可信安全需求,旨在通過對數據源節點的 CA 認證,提高數據源的真實性和安全性[7]。基于區塊鏈的業務檔案存證溯源由電子檔案生命周期牽涉到的各單位構建聯盟鏈,共同打造檔案存證溯源和防偽技術認證平臺,可提供業務檔案數據存證、防偽驗證、檔案溯源、數據查驗等功能,目前多應用于司法領域。除此之外區塊鏈技術還可應用于互聯網數據存證、溯源[8]、身份認證等領域。
二、基于區塊鏈的電子檔案管理系統構建
(一)電子檔案管理系統技術要點
1.基于國密 SM3 和雪花算法,構建高效鏈上電子檔案標識碼。
2.基于 leveldb、merkle tree、HBase 構建電子檔案分級存證,實現高效電子檔案多中心存儲、多方背書,實現檔案實時業務數據快速讀取、查詢和驗證。
3.基于智能化合約分權機制,實現電子檔案隱私數據管理,結合用戶業務和檔案管理角色,聯動封裝內部調用智能合約和外部調用合約,給檔案數據提供不同級別的保護,內部調用合約不對合約外暴露接口,用于檔案隱私數據管理。
(二)電子檔案管理系統簡介
本系統建設擬采用B/S體系結構,基于J2EE規范開發,采用SOA、WEB2.0技術、工作流、知識管理、互聯網等核心技術,同時采取多層安全技術認證和安全管理機制,全面保障信息數據安全可靠。在應用平臺方面既可支持Windows和Linux操作系統,也可支持Unix操作系統,來最大可能符合所有檔案管理設備,且兼容性較好,支持目前市場上IE8以上及各大主流的瀏覽器,支持HTTP、HTTPS、JMS、WebServices、TCP/IPSocket、SOAP、FTP、本地文件等傳輸協議。在適配性滿足的情況下,對檔案文件等數據信息以及訪問權限控制度高,確保檔案信息資源的安全可靠。
本系統檔案信息資源數據庫具備數據采集、數據組織與管理、數據處理、查詢統計、數據更新、輸出等集中管理功能,便于各職能部門、業務系統跨平臺交流,提高檔案利用效率。支持TCP、HTTP、SSL及HTTPS多種傳輸協議。多措并舉保證檔案信息資源安全,一是對登錄系統用戶進行身份鑒別。二是嚴格控制訪問權限。三是通過壓力測試確保系統具有一定抗攻擊性和訪問壓力。四是通過配置和應用SSL證書來啟用HTTPS協議,保證互聯網數據傳輸的安全,實現系統管理數據、鑒別信息和重要業務數據在通信過程中的完整性,防止數據在傳輸過程中被篡改、竊取或破壞。五是分區存儲數據,嚴格管理數據庫密碼及權限,定期備份數據。
(三)電子檔案標識碼生成算法
電子檔案標識碼生成算法是實現檔案管理的基礎,需實現對電子檔案進行唯一標識碼編碼,初步定義標識碼包括電子檔案的完整性校驗值、校驗算法和用戶信息、電子簽名和可信時間標識等。包括將檔案信息上傳并存儲至區塊鏈網絡;基于區塊鏈網絡,使用預設私鑰對所述檔案進行加密得到數字簽名,根據預設規則基于國密SM3和雪花算法,構建高效鏈上電子檔案標識碼。結合檔案管理應用場景制定電子檔案標識碼算法規則,標識碼共有211bit組成,首先使用國密SM3算法對電子檔案進行計算輸出128bit摘要值,基于雪花算法對初次上傳的電子檔案進行分配相應的56bit唯一標識碼編碼,然后取當前機器物理地址8bit,取可信授時服務器時間19bit(精確到納秒)。將此標識碼寫入區塊鏈世界狀態數據庫,實現在整個生命周期對檔案進行反向追溯綁定。
將所述關鍵信息作為鍵,數字簽名作為與鍵對應的值生成鍵值對,并將所述鍵值對上傳并存儲至所述區塊鏈網絡,同時將所述關鍵信息與所述校驗位順序連接生成所述唯一標識碼。利用區塊鏈的去中心化、可信任特性,從根本上避免了唯一標識碼在生成和校驗過程中被篡改的可能性,從而確保檔案電子數據的可信度和真實性,提升檔案管理技術層面和業務層面的協調效率。
(四)智能化合約機制規范文檔管理模型
智能合約是區塊鏈網絡中去中心化應用程序,基于智能化合約分權機制,實現電子檔案隱私數據管理。結合用戶業務和檔案管理角色聯動封裝內部調用智能合約和外部調用合約,給檔案數據提供不同級別的保護。利用區塊鏈技術打通各檔案館,構建安全有效的檔案共享渠道,實現多方參與,支持電子文檔的自動處置。系統的智能合約(又叫做鏈代碼)跟Peer節點主要通過gRPC通道來通信,運行在虛擬機內,鏈碼與Peer節點之間的交互過程(圖1)[9]。
智能合約可以根據檔案共享業務事先制定的規則保證交易的執行,是在檔案管理業務鏈上產生并且編譯的軟件代碼,并由所有節點持有。根據合約自動執行的特點,用戶部署在區塊鏈上的合約,是在虛擬機中執行的,因此,無需第三方干預,具備安全性和可靠性的優勢,電子檔案流轉的各個環節不再需要依賴中央網絡節點進行數據信息傳輸,完成共識操作,且具有可擴展性。虛擬機,是智能合約代碼的執行器,智能合約被編譯成二進制文件后,被部署到區塊鏈上[10]。
電子檔案的獲取、歸檔、跨機構調取均通過調用智能合約的Inrstance接口(節點調用EVM的接口)和Callback接口(EVM回調節點的接口),來觸發智能合約的執行操作,區塊鏈網絡中節點共識后,會將記錄追加存入區塊鏈中,后續不可再更改(圖2)。
有檔案查詢需求不同業務端口通過和區塊鏈支撐平臺之間建立智能合約接口來實現檔案信息共享。依托智能合約接口可將相關業務系統內電子檔案的形成、修改、審核和提交等環節所形成的檔案上鏈。此外,還可用于將接收、檢測、利用和銷毀等電子檔案上鏈。區塊鏈支撐平臺包括平臺支撐服務、聯盟鏈、數據庫等部分,其中平臺支撐服務使用基于聯盟鏈的智能合約和數據庫所提供的服務,構建身份管理、檔案保護、檔案驗證等服務,為業務系統和電子檔案管理系統提供檔案真實性保障支持[11],圖3為我們基于此技術獨立研發設計的電子檔案管理原型中部分改能展示。
參考文獻:
[1] 國家檔案局.“十四五”全國檔案事業發展規劃[EB/OL].[2022-08-15]. https://www.saac.gov.cn/daj/toutiao/ 202106/ecca2de5bce44a0eb55c890762868683.shtml.
[2] 白伊瑞,田寧,雷虹等.基于DID的跨鏈身份認證研究綜述[J/OL].計算機科學與探索:1-17[2023-07-29].http:// kns.cnki.net/kcms/detail/11.5602.TP.20230712.2207.004.html.
[3] 張奇文,王志強,張逸謙.基于Gossip協議的信任收集共識算法研究[J].計算機科學,2020,47(S1):391-394.
[4] 王洋.基于優化共識的區塊鏈在電子文件全生命周期真實性保障中的應用—以中國電力建設集團有限公司電子文件單套歸檔和電子檔案單套管理試點為例[J].檔案學研究,2022,No.185(02):89-96.
[5] 聶勇浩,張炘.基于區塊鏈的電子證據保全模式研究—以廣州互聯網法院為例[J].檔案學研究,2021,No.182(05):28-36.
[6] 宋世昕.基于區塊鏈和IPFS的去中心化電子存證系統的研究與實現[D].北京工業大學,2019.DOI:10.26935/d.cnki. gbjgu.2019.000382.
[7] 梅勝,王曉麗,孔斌等.基于區塊鏈的健康檔案跨域共享可信安全機制研究[J].中國數字醫學,2023,18(05):94-99.
[8] 朱季希凝,王杰華,丁衛平等.基于雙鏈結構和國密算法的疫苗溯源方案[J].計算機工程與設計,2023,44(07):1961- 1968.
[9] 于澤偉. 基于區塊鏈的農產品追溯系統設計與實現[D].大連理工大學,56,2019.DOI:10.26991/d.cnki.gdllu.2019.001907.
[10] 姚超,唐松.區塊鏈技術在冷鏈食品溯源中應用的研究[J].河北省科學院學報,2021,38(01):78-83.DOI:10.16191/j.cnki.hbkx.2021.01.011.
[11] 袁嘉新,楊安榮.基于區塊鏈技術的電子檔案管理應用實踐——上海信聯信息發展股份有限公司成功實踐[J].中國檔案,2020(10):28-30.
基金項目:河北省檔案科技項目“基于區塊鏈技術的檔案管理體系構建”(2022-X-27)
作者單位:河北省科學院? 河北省科學院應用數學研究所? 河北省信息安全認證技術創新中心