余子丹 范智新


摘要? 區塊鏈技術的去中心化、防篡改、數據透明等特點,在當今電子檔案管理需求中具有較高的適應性。文章從區塊鏈的概念入手,闡述分布式賬本、非對稱加密、共識機制和智能合約四大區塊鏈技術,并結合電子檔案發展存在的典型問題,探討該技術在電子檔案前端控制與全程管理、分布式存儲、電子檔案利用和權限控制方面中的創新性應用,為電子檔案管理融合新技術提供一些思考。
關鍵詞? 區塊鏈 電子檔案 分布式存儲 智能合約
近年來,區塊鏈技術的應用成為國內外研究機構及技術團體關注的熱點。據麥肯錫研究報告[1]指出:區塊鏈技術是繼蒸汽機、電力、信息和互聯網科技之后,最有潛力觸發第五輪顛覆性革命浪潮的核心技術。該技術的特點與電子檔案管理需求特性之間有著較高的匹配性,有可能為電子檔案管理提供一種創新性技術升級方案。本文在介紹區塊鏈概念及技術特點的基礎上,探索性地提出該技術在電子檔案管理應用中的思路。
一、區塊鏈
區塊鏈是一種按照時間順序將數據區塊以順序相連的方式組合成的一種鏈式數據結構, 并以密碼學方式保證的不可篡改和不可偽造的分布式賬本。區塊鏈由最小單位區塊構成,包含兩部分:區塊頭用來鏈接到前一個區塊;區塊體用來記錄事件更新的數據,具有去中心化、匿名性、不可篡改及自治性特點。
二、區塊鏈技術
區塊鏈技術并不是一種創新型技術,而是將許多已有的學科整合形成的,一種實現數據公開、透明、可追溯的產品架構設計方法[2],其核心技術有以下幾種。
1.分布式賬本。分布式賬本展現了區塊鏈去中心化特點。所有數據存儲于系統的所有節點中,系統中的任意節點都有可能完成一筆新的交易,每筆新交易由完成節點采用分布式結構廣播至全網其他所有節點中。系統通過分布式存儲、分布式記賬、分布式傳播的方式,保證每個節點都可以參與監督交易的合法性。
2.非對稱加密技術。非對稱加密技術保障了區塊鏈匿名性特點。存儲在區塊鏈上的交易信息是可公開的,而賬戶身份信息是高度加密的。為了保障節點隱私,非對稱加密技術需要密鑰——公鑰和密鑰私鑰成對出現。節點之間進行數據交易時,無需公開身份,只有在數據擁有者授權的情況下才能訪問,保證數據安全和個人隱私。
3.共識機制。共識機制給予了區塊鏈不可篡改性特點。它主要解決系統節點之間如何對記錄的有效性達成共識。目前區塊鏈共識機制主要有工作量證明、權益證明、股份授權證明[3]。以比特幣為例,采用的是工作量證明。據分析,只有在控制了全網超過51%的記賬節點情況下,才有可能偽造出一條不存在的記錄,杜絕了造假的可能。
4.智能合約——自治性。智能合約顯示了區塊鏈自治性特點。系統可以不依賴于任何“人”或機構,自動地執行一些預先定義好的規則和條款。區塊鏈帶來的去信任、不可篡改、不可逆特性避免了惡意行為對合約正常執行的干擾。將智能合約以編碼形式寫入區塊鏈中,由區塊鏈技術的特性保障存儲、讀取、執行的整個過程,透明可跟蹤。
區塊鏈技術最早在金融領域具有較高的應用價值。2015年12月,美國納斯達克Linq系統通過其基于區塊鏈的平臺完成了首個證券交易,標志著區塊鏈技術在主流金融系統中的成功應用[4]。國內方面,2017年2月,央行推動的基于區塊鏈的數字票據交易平臺測試成功。2018年3月,騰訊公司與中國物流、采購聯合會簽署區塊鏈戰略合作協議。2018年9月,浙江大學在全國范圍內首次開設區塊鏈課程,預示著我國在區塊鏈技術人才培養建設方面邁出了實質性的一步。《2017年國家檔案局科技項目立項選題指南》首次將“區塊鏈技術在電子檔案管理中的應用”列為選題,標志著電子檔案管理領域已開啟對區塊鏈技術的探索。
三、電子檔案管理存在的問題
電子檔案是電子信息技術在檔案管理中的應用, 一方面體現在檔案載體的過渡,檔案載體在大數據時代的推動下由傳統紙質轉向各類非結構化的電子存儲;另一方面是管理方式的過渡,電子檔案在收集、保管、利用環節都能大大提高工作效率, 同時也存在諸多不確定性。
在收集方面,不同于紙質檔案,電子檔案的生命周期包括電子檔案的形成過程和管理過程。如果檔案部門只收集電子文件本身的信息,則會丟失大量電子文件的背景信息,即元數據信息。電子文件的元數據是描述電子文件背景、內容、結構及其整個管理過程的數據[5],能為驗證電子檔案的真實性、完整性提供有效證明。目前對于元數據的收集存在類型復雜、格式多樣、管理分散等問題。
在保管方面,國內應用較多的“雙套制”是指,文件歸檔后紙質版本與電子版本共存。隨著以各類載體為依托的電子檔案占據主導,紙質形式逐漸成為電子形式的一種“硬拷貝”,無法體現電子檔案的全部信息,產生了資源浪費、檔案完整性失效等問題。“單套制”成為檔案管理發展的趨勢,即電子檔案取代紙質檔案,其發展的關鍵問題在于如何保障電子檔案的真實性、完整性及長期可讀性,從而確保電子檔案的社會公信力。
在利用方面,電子檔案具有易傳送、易檢索等優勢。近年來,檔案部門在服務建設中逐漸向著“辦事少見面”“零跑腿”等方向努力,迫使加大電子檔案的開放利用程度。由于網絡環境中的檔案信息需求用戶不僅包括可控的傳統檔案利用人員,還包括來自社會各個層面不可控的專業型、利益用戶型等新型人員[6]。復雜的利用對象與環境給電子檔案的安全帶來了挑戰。
四、區塊鏈技術在電子檔案管理中的應用
電子檔案的不安全、不完整、不可用,會影響公眾的合法權益,進而可能會導致政府甚至整個社會的信任崩塌。目前電子檔案管理需要解決四個方面的問題:內容真實,電子檔案在形成、歸檔、利用過程中,如何保證檔案內容真實可靠;存儲安全,電子檔案存儲過程中如何防止數據被篡改和盜取,保持其存證效力;利用高效,在安全可信的前提下,如何讓電子檔案在管理單位、利用單位和個人之間高效使用;管理分級,對于不同類別的電子檔案根據其開放程度,設計管理權限。筆者認為區塊鏈技術在以上方面具有一定的可操作空間。
1.推進電子檔案前端控制與全程管理。前端控制與全程管理已經成為業界普遍提倡和認同的原則和理論,尤其是前端控制被稱為“電子文件時代的新思維”[7],它主張從電子文件形成、系統設計開始,將電子檔案管理的邏輯起點盡可能地向前延伸,實際操作中由于部門間管理方式不同、權責不同,檔案部門很難將管理工作深入電子檔案形成部門,然而基于區塊鏈技術的電子檔案管理系統可以嘗試去做。
區塊作為區塊鏈的基本結構單位,區塊頭可以記錄電子文件的元數據信息,如文件受理部門、受理時間、受理人系統賬號等;區塊體用來記錄從上一區塊到本區塊創建的電子文件主體信息,如簽批意見、辦理結果等。如圖1所示,文件每流轉到一個受理節點,將文件元數據信息封裝在區塊頭,文件主體信息存儲在區塊體,同時產生一個區塊哈希值,用于跟下一區塊鏈接,形成可追溯的鏈式結構。塊狀結構能夠將電子檔案和元數據封裝在一個區塊里,融為一體,解決電子檔案與元數據收集相分離的難題。
電子文件在形成階段,封裝在區塊中的元數據與文件主體信息將被固化,不允許改變,作為靜態元數據。文件歸檔后成為電子檔案,進入保管、利用、銷毀階段,期間產生的元數據可繼續封裝在區塊頭中,例如存址、利用人、利用時間、利用次數、銷毀時間等,作為動態元數據,靜、動態元數據組成了電子檔案元數據集。利用區塊鏈技術統一設計的電子檔案管理系統,可以完成電子文件生命周期的無縫連接,實現電子檔案全程管理。
2.保障電子檔案存證效力。電子檔案是具有憑證、查考和保存價值并歸檔保存的電子文件[8],是由個別部門,即中心機構產生的,各類權限相對集中。電子簽章是目前廣泛應用的電子防偽技術之一,其核心技術為數字證書,是由合法的證書授權中心(CA機構)頒發的,也被掌握在中心機構中。在復雜多變的網絡環境下,中心機構容易被鎖定為攻擊目標,威脅電子檔案憑證效力。基于區塊鏈技術的電子檔案管理系統,享有去中心化分布式存儲,這種存儲結構為電子檔案提供了可信性保護框架。系統中每個節點都擁有同等的權限,既參與記錄數據,同時負責認證數據。節點完成電子檔案數據記錄工作后,將新的信息發布到其余節點,所有節點同步更新。當需要對電子檔案認證時,若共識機制設定所有節點參與,則只有所有節點完成數據認定核實工作后,才能決定數據真實有效,意味著要攻破系統所有節點才有可能完成文件篡改,有效瓦解了中心化控制隱患。
另一方面,分布式存儲中的每個節點保存有完整的電子檔案區塊鏈,也是對電子檔案的多重備份,即使部分節點硬件損壞或者遭受攻擊,其余節點仍能提供完整的電子檔案,使得電子檔案長期有效,保障了其存證能力。
3.提供電子檔案全自助利用服務。目前國內某些檔案機構實現了檔案利用自助服務,但存在一定局限性。例如,只公開電子檔案數據條目,不包含全文;采取終端機的查詢形式,也是在可控制區域,受限于地域、網絡等條件,實現的是半自助服務。
智能合約是一種可以自動化執行的簡單交易,在區塊鏈結構的控制下能夠充分發揮其自治性,它本身也保存在區塊鏈中,在各節點間同步,保證了合約的一致性。智能合約包括一個完備的狀態機以及事件處理和保存的機制[9]。基于區塊鏈技術的全自助檔案服務系統可以預先制定好智能合約,擴散存入每個節點中。當系統用戶即利用者輸入的個人信息和利用需求(數據與事件),滿足狀態機中某個動作的響應條件時,系統按照預設的事件處理方式自動執行。如圖2所示,用戶提交利用申請,如檔案借閱、打印,當用戶提供的個人信息,如部門信息、工作證號、身份證號等,符合節點數據查閱和打印的要求時,系統執行對應的規則動作,輸出電子檔案或打印電子檔案。對于需要收費的檔案利用,狀態機中可以增加繳費狀態,繳費環節觸發繳費狀態值改變,系統從而執行對應的規則動作。
基于區塊鏈智能合約的電子檔案利用服務,可以脫離檔案管理機構的監管,節約管理人成本,檔案管理機構也可簡化查檔、借閱制度,依據智能合約維持雙方的可信度。檔案服務依賴制度達成的信任將逐步轉變為依靠技術,“制度信任”也將因“技術信任”而得到強化。
4.實現電子檔案分權管理。電子檔案作為重要記錄、取證材料,經常涉及個人隱私、敏感信息,尤其是人事檔案、財務檔案。檔案機構并不是將所有的電子檔案對外公開。區塊鏈分為三種:公有鏈、私有鏈和聯盟鏈,可滿足類似需求。公有鏈是任何人都可以參與的公共區塊鏈網絡;私有鏈的對象是一個機構或者個人,不對外公開。聯盟鏈是指由若干個機構共同參與管理的區塊鏈,并且共同來記錄交易數據。
檔案機構內部可以部署一套私有鏈電子檔案管理系統,服務于檔案工作管理人員,防止檔案部門內部誤操作或數據丟失等情況發生。機構同時部署一套公有鏈電子檔案發布系統,將可開放的檔案公開利用,在公有鏈絕對的去中心化模式下,無需人為監管,可防止數據被篡改。若干個檔案機構或地區之間還可將電子檔案管理系統設計在聯盟鏈上,實現區域之間的互聯互通,擴大區域電子檔案管理系統服務范圍。
五、結束語
區塊鏈技術自誕生以來發展非常迅速,除了在金融行業,在其他領域依然缺乏落地式成熟產品。其去中心化、防篡改、自治性等特性與電子檔案管理需求有著高契合度,應得到檔案界同仁的關注與研究,聯合云計算、大數據、人工智能等技術,為電子檔案管理提供整體的技術解決方案。