閔婕 肖秋會
摘要:該文分析了我國檔案信息資源共享面臨的主要困境及區塊鏈技術用于檔案信息共享的優勢,提出了基于“雙鏈”模式的檔案信息共享平臺,從信息共享主體及職責權限、“公有鏈+聯盟鏈”雙鏈模式、共享內容與層次、共享檔案信息利用方式四個方面加以闡述,為區塊鏈技術運用于區域性檔案信息共享提供參考。
關鍵詞:檔案信息共享 區塊鏈技術 雙鏈結構
為了加強區域檔案機構之間的溝通與合作,提高檔案工作的效率和質量,更好地滿足人們對檔案使用的需求,檔案信息資源的共享至關重要。《“十四五”全國檔案事業發展規劃》明確指出:“各省(自治區、直轄市)綜合檔案館加強本區域檔案信息資源共享平臺建設,實現本區域各級綜合檔案館互聯互通,推動共享平臺向機關等單位延伸,促進檔案信息資源館際、館室共建互通,推進檔案信息資源跨層級跨部門共享利用。”[1]區塊鏈技術因其去中心化、安全加密、資源共享等特性,不僅為可信電子文件管理及歸檔保存提供了有利條件,而且為檔案信息資源共享提供了技術可行性。本文分析了我國檔案信息資源共享面臨的主要困境,探討了區塊鏈技術用于檔案信息資源共享的可行方案。
(一)共享數字檔案資源規模較小,范圍有限
我國的共享數字檔案資源主要為政務檔案資源,而且大多為檔案目錄級別的內部共享。例如,南京市現有的民生檔案資源僅在幾個部門之間達到了部分互聯共享。民生檔案和開放檔案信息共享平臺就是典型的系統內部的共享,參與單位只有市綜合檔案館和各區綜合檔案館。[2]此外,因我國現階段開放檔案資源數量有限,技術條件和法律制度環境不夠完善,區域性的綜合檔案館數字檔案資源共享尚處于初步探索階段。
(二)統籌協調不力,跨部門共享困難
雖然我國已經建立了以政府部門信息中心、公共圖書館、綜合檔案館等為主體的政府信息資源利用體系,但由于資源的統籌協調不一致,檔案信息資源的組織和整合,仍存在“各司其職”和“部門私有”的現象。面對公眾需求,政府信息資源仍存在交叉、重疊、缺少關聯、缺乏規范處理等問題,[3]安小米等人于2016年得出的調研結果表明,80個信息惠民建設試點城市中沒有一個城市的民生檔案信息體系被納入信息惠民工程,使民生檔案信息體系的建設工作脫離信息惠民建設工程而成為“信息孤島”,這種“孤島性”同時限制了民生檔案建設與信息惠民建設工程的推進。[4]不同政府部門之間檔案資源共享受到了行政管理體制、利益保護、權限歸屬、技術標準不統一等諸多因素的影響而不能全面落實。檔案管理軟硬件平臺異構、數據格式和接口技術不統一等導致各部門檔案信息共享無法深入開展,而且不同平臺之間檔案信息資源共享存在信息安全風險。
(一)去中心化存儲,拓展共享檔案資源類型和范圍
引入區塊鏈技術,將傳統的集中式存儲方案轉變為多中心分布式存儲,解決了技術層面和業務層面難以協調的問題。同時我們也可以通過有條件地增加文件資源共享的主體,不斷擴大文件資源共享的類型和范圍。[5]加入區塊鏈的檔案館(室)構成了檔案信息資源共享的各個節點,各個節點之間實現互聯和互通,權利和義務對等。隨著上鏈節點的增加,共享檔案資源的類型和數量會隨之拓展。
(二)采用聯盟鏈加強協調,統一標準
區塊鏈依據訪問及管理權限可分為公有鏈、私有鏈、聯盟鏈。其中,聯盟區塊鏈的部分去中心化特點與檔案信息資源共享的契合度最高。[6]每一個聯盟成員負責一個節點,主要負責管理和上傳具有館藏特色的檔案信息,利用智能合約和非對稱加密技術實現聯盟內的檔案信息共享。區塊鏈技術可以規范不同組織的元數據描述系統,實現數據共享,使異構的檔案管理系統標準統一化,保證檔案館與其他相關機構的相互可操作性。
(三)非對稱加密,減少信息安全風險
傳統的中心化系統容易受到外力的攻擊,安全性較差。并且,信息共享系統的不確定性風險導致高度集中的系統信息安全能力較低。區塊鏈采用非對稱加密技術,通過算法保證身份和數據的一致性,從而形成信任,為檔案等機構提供相對穩定可靠的運營平臺。當公眾需要利用社會基本信息時,他們可以直接通過基于區塊鏈技術的檔案信息共享平臺,從區塊鏈庫中獲取認證,省去相關權威機構提供信息佐證這一步驟。[7]
筆者設計了基于區塊鏈技術的雙鏈結構檔案信息共享平臺。該平臺采用“聯盟鏈+公有鏈”兩個區塊鏈結構,聯盟鏈用于各主體之間進行檔案信息共享與管理,公有鏈用于公眾對共享檔案信息中可以公開的檔案信息進行訪問與利用,如圖1所示。
(一)檔案信息共享主體及職責權限
在基于雙鏈結構的檔案信息共享平臺中,可以由n(n≥3)個檔案館組成聯盟,為便于理解,現選取A、B、C、D四個省級檔案館作為聯盟成員進行說明。如圖1所示,四個檔案館各掌握一個授權節點,它們之間實現點對點的信息交互,通過共識機制和智能合約機制共同維護聯盟區塊鏈的運行。不僅如此,各省級檔案館還可以根據需求,縱向深入基層,依次向市級檔案館、區級檔案館和機關檔案館傳達指令,進行系統的信息資源整合,為共享平臺提供有力的信息支撐。檔案信息共享平臺中的聯盟檔案館依據相關法律法規制定共享標準,將共享檔案信息的分類方式、鑒定標準、歸檔格式等進行統一規范以后再整理上鏈。
(二)“公有鏈+聯盟鏈”雙鏈模式
雙鏈結構的檔案信息共享平臺將檔案管理與檔案利用的功能有機串聯起來。通過檔案聯盟鏈,可以在每個授權節點上共享和管理文件資源,并對存儲在數據庫中的文件元數據進行管理,包括進行電子文檔元數據的創建、修改、刪除、壓縮、審查和其他操作。檔案公有鏈可對公眾提供利用服務,通過檢索檔案元數據信息對云存儲的電子文件進行查閱、下載和驗證等操作。
在聯盟鏈中,A、B、C、D四個檔案館作為聯盟成員節點參與,每個節點通過共識機制生成相應的區塊。機構之間可以通過聯盟鏈相互聯合,形成區塊鏈網絡。各節點共同制定統一的管理規則后,將可共享的文件信息上傳到鏈上。每個節點存儲一個完整的數據庫,所有業務數據都是開放、透明、完全一致的,后期不需要再進行數據集成,且每個節點的操作都可以從其他節點看到,節點與節點之間可以相互驗證身份,以保證沒有具備主觀惡意的節點,共同維護系統的穩定性和可靠性。
在公有鏈中,A、B、C、D四個檔案館作為主要節點負責審核并上傳開放檔案至鏈上,并對需要公眾遞交申請的部分檔案設置密鑰以及對遞交的申請進行審核。公眾作為次要節點,允許其對鏈上有訪問權限的檔案信息進行檢索、查閱、下載操作,對于有條件訪問的檔案則需填寫申請,待審核后方可使用。

(三)檔案信息共享內容與層次
運用區塊鏈的分布式賬本技術,在各個共享主體即各個省級檔案館之間建立一個多節點的分布式數據信息系統。在此系統中,每一個主體節點形成連續且完整的賬目信息,包括以下幾類:(1)各共享主體寫入數據系統的檔案信息;(2)對已寫入系統的檔案信息進行的增加、刪減、更改等操作信息;(3)更新后的檔案信息等。其中,各共享主體寫入數據系統的檔案信息根據系統的預設條件進行自動確認,出于對區塊鏈在使用成本及功能實現方便上的考慮,并不是所有檔案數據都需上鏈。[8]考慮到對檔案信息共享過程有防篡改的需求,我們可以采取將電子檔案哈希值和關鍵元數據提交區塊鏈的存儲方式。另外,節點對系統中記錄的檔案信息進行的添加、刪除、修改等操作信息受區塊鏈監控,并被打上時間戳。智能合約可以根據時間戳的實時監控判斷檔案信息是否完整,形成可追溯的不可逆記錄,并永久保存,為日后的問責提供全面的保障。一旦檔案信息在區塊鏈上被確認,任何試圖篡改、刪除檔案信息的惡意行為都會被察覺并自動拒絕,并且記錄實施該惡意操作的用戶信息,擁有三次及三次以上惡意操作記錄的用戶將會進入用戶黑名單,被限制訪問檔案信息共享平臺。對于已通過更新確認的檔案信息,則會保留其更新的所有操作,并將更新后的檔案信息元數據上鏈。
根據提交給區塊鏈處理并存儲的電子檔案數據范圍的不同,可以將基于區塊鏈的檔案信息共享分為三個層次:(1)僅哈希值上鏈共享;(2)哈希值和關鍵元數據上鏈共享;(3)哈希值加全部元數據上鏈共享。其中,哈希值上鏈共享的成本較低,同時還可以保障檔案信息真實可靠,適于電子檔案產生數量多的機構;哈希值和關鍵元數據上鏈共享成本中等,全文及上鏈的元數據真實性有保障,適于電子檔案數量中等機構,或用于存儲有需求的電子檔案;哈希值加全部元數據上鏈共享是指電子檔案全文及全部元數據上鏈,雖然全文及元數據真實性均得到較好保障,但是管理成本高,適用于電子檔案數量少的企業,或用于存儲特別重要的檔案。[9]綜合考慮,本文認為第二個共享層次更具適用性,將檔案的哈希值與關鍵元數據上鏈共享,在保證檔案信息安全的同時,還可以滿足檔案信息共享過程中防篡改的需求。
(四)共享檔案信息利用方式
聯盟鏈傳到公有鏈的檔案信息需要進行密級鑒定。使用智能合約技術,可以對檔案信息進行歸類、整理。[10]根據智能合約上標注的主要參數如檔案類型、密級等內容和電子簽名進行查驗,整理歸檔并進行編碼。根據檔案信息的密級,我們將可公開檔案信息內容上傳到公有鏈上,利用者可直接檢索訪問。
對于需要開放審核、控制利用的檔案信息,只將其目錄記錄、索引、注解等描述性元數據信息與利用申請書上傳到公有鏈上。對于有利用需求的檔案信息,其所屬的主體單位擁有一對密匙。公鑰驗證身份并對其加密,私鑰驗證身份并對信息解密。當用戶提交的利用申請通過時,文件發送方使用公鑰對文件信息進行加密,并根據文件信息生成密文。信息以密文的形式在網絡上傳輸,由于私鑰不會暴露在網絡上,大大降低了信息泄露的風險;接收方在接收到信息后,必須用私鑰對信息進行解密,才能訪問和利用加密的文件信息。用戶需要鏈上遞交申請,等待其所申請利用檔案的負責主體進行審批,利用申請若未通過將無法訪問,用戶可以提出質疑,負責主體應予以解釋;如果利用申請通過,用戶將會收到私鑰,對檔案進行解密后方可進行訪問與利用。并且每個用戶查閱檔案后,都將在區塊鏈上添加一個區塊,記錄相關的使用信息,既可用于檔案使用率的調研又可追蹤溯源以備問責。
區塊鏈技術的去中心化、鏈式數據結構、不可變革和撤銷等特性,為數字信任機制的搭建以及檔案信息共享提供了有力的技術支撐。然而,區塊鏈的非對稱加密算法并非絕對安全,該技術還處于發展階段,存在信息存儲和信息處理速度較慢等技術瓶頸,因此,區塊鏈在檔案信息共享中的成功運用有待進一步實驗和論證。展望未來,隨著區塊鏈技術趨于成熟,其可以在不同的區塊鏈聯盟之間進行跨鏈交流,構建由圖情檔等多個領域區塊鏈聯盟構成的共享體系,使信息和數據的共享體量不斷提升,發揮更大的社會價值。
注釋及參考文獻:
[1]本刊訊.中辦國辦印發《“十四五”全國檔案事業發展規劃》[J].中國檔案,2021(6):18-23.
[2]孫如鳳.區域民生檔案資源共享機制研究[D].南京:南京大學,2017.
[3]蔡盈芳,樊凡,虞香群.基于公民生命歷程的政務檔案信息整合利用模型設計[J].檔案學通訊,2020(1):80-86.
[4]安小米,加小雙,宋懿.信息惠民視角下的地方民生檔案資源整合與服務現狀調查[J].檔案學通訊,2016(1):48-54.
[5]劉洪,羅茜.關于新技術熱潮下在檔案領域應用區塊鏈技術的冷思考[J].北京檔案,2020(9):15-18.
[6]馬仁杰,沙洲.基于聯盟區塊鏈的檔案信息資源共享模式研究——以長三角地區為例[J].檔案學研究,2019(1):61-68.
[7]聶云霞,何金梅,肖坤.基于區塊鏈的政務檔案信息共享策略[J].浙江檔案,2019(6):31-33.
[8]蔡盈芳.電子檔案管理應用區塊鏈存儲方式探析[J].檔案學研究,2020(4):104-109.
[9]尹潔.電子檔案元數據標準化管理方案探討[J].中國標準化,2021(7):105-108;113.
[10]李鑫,劉沛琦.區塊鏈技術在法律信息融合中應用的前景與路徑[J].經濟與社會發展,2019,17(6):54-63.
作者單位:武漢大學信息管理學院檔案與政務信息學系