文/黑龍江八一農墾大學 郭昱 康忠偉
2021年6月,中辦國辦印發的《“十四五”全國檔案事業發展規劃》指出:檔案事業發展處于重要戰略機遇期,同時也面臨嚴峻挑戰。新一代信息技術廣泛應用,檔案工作環境、對象、內容發生巨大變化,迫切要求創新檔案工作理念、方法、模式,加快全面數字轉型和智能升級。提出了“檔案信息化建設再上新臺階”及“檔案科技創新實現新突破”等發展目標,部署“推進檔案信息資源共享平臺建設、完善檔案科技創新和應用機制、重點開展新一代信息技術在檔案管理中的應用”等工作任務。檔案管理數字化、檔案化以及實現上網、上云、上鏈是大家共同期待的目標。
信息共享的網絡信息時代,檔案數字化程度直接影響著檔案數據的傳輸效率和工作效率。國家檔案局印發的“十三五”規劃綱要和“十四五”發展規劃提出,加快檔案資源數字轉型,加速數字檔案館(室)建設,加快推進檔案信息化建設,引領檔案管理現代化,加快推進信息技術與檔案工作深度融合。還提出,加快提升電子檔案管理水平:在有條件的部門開展電子檔案單套制(即電子設備生成的檔案僅以電子方式保存)、單軌制(即不再生成紙質檔案)管理試點。
目前,一些檔案管理部門雖然引進了檔案管理系統,但應用程度不高。檔案管理數字化不是簡單地將紙質材料掃描或實物拍照,無序存儲在計算機內。電子檔案信息必須經過檔案化管理歸檔處理后才能稱為電子檔案。否則,只能稱其為電子文件。檔案化過程主要是將每件電子信息封裝成為以卷或件為單位的檔案基本單位,并且每個卷或件都有一個標準的元數據。把應用系統的電子信息進行憑證化處理后,形成電子檔案,將電子信息從應用系統中獨立出來,形成與應用無關的,可追溯的,能夠直接閱讀的帶樣式的文檔、檔案化的電子信息、結構化的數據庫。經過電子化、檔案化、結構化的數據才有利于檢索、傳輸、分享、快速導入導出和網絡間可交互驗證的信息化數據。
區塊鏈技術具備去中心化、不可篡改、防止抵賴、全程留痕、可以追溯、集體維護、公開透明等應用特點。區塊鏈技術提供了一種在不可信網絡中進行信息與價值傳遞交換的可信通道,逐漸在各領域展現出豐富的應用場景。區塊鏈技術將為云計算、大數據、移動互聯網等新一代信息技術的發展帶來新的機遇,有可能引發新一輪的信息技術創新和產業變革。
(一)區塊鏈機器信任特征讓檔案數據公信力在網絡節點所及范圍發揮作用。從前開具證明,需要到相關的組織機構所在檔案管理部門辦理。這種信用關系是建立在社會群體之上,是人為主導,證明是否可以開具或者開具證明的真實性都會受到人為因素的主觀影響,證明的公信力受到出具證明部門的類型、規模、級別等因素影響。證明信任在一定區域內會被承認,涉及跨區域、跨省、跨國,可信度會受到影響。而區塊鏈網絡則打破這種限制,數據一旦在區塊鏈上進行記錄,這種具有數據元不可篡改、數據變動全程留痕特性的加密數據,在任何區塊鏈網絡節點存在的地方都可以獲得數據信任驗證。以區塊鏈技術加密數據代碼為信任基礎出具的證明,是排除人為因素影響的數據關系型的機器信任。從前信任關系是建立在鋼筋水泥的大廈之中,信任關系需要較高的經濟基礎來維護,導致信任成本大大增加,而區塊鏈技術的機器信任,只需要互聯網和加密數據代碼的支持,最大幅度降低了信任成本。
(二)區塊鏈的鏈式結構讓檔案數據在上下游之間實現價值傳遞。1.檔案數據在高效傳遞的情況下才能真正實現利用價值。檔案管理部門將檔案數據電子化、檔案化并記錄在標準格式檔案數據庫中,并不是終點,而是新的起點。檔案數據只有在上下游之間按照一定規則高效傳遞,形成無縫銜接的數據流并加入高效利用的信息數據鏈條的情況下,才算實現其真正價值。以高等學校為例:省級招生辦的新生錄取名冊檔案數據直接可導入高校新生檔案錄入系統;高校畢業生在校檔案直接可以導入國家人力資源部門,用于企事業單位招聘和個人社會就業信息查詢。2.統一檔案數據傳輸格式標準提高數據利用效率。隨著檔案系統應用主體不斷推動,檔案管理信息傳輸技術不斷提高,檔案行業需要制訂統一的數據傳輸接口標準,規范業務系統與區塊鏈系統間的對象傳輸協議,使得檔案業務系統之間表現出最好的兼容性。如果上游數據符合數據格式化要求,那么下游數據使用主體就可以將標準化的數據(或經簡單的數據轉換)直接導入數據庫加以利用,節省人力物力的同時,提高工作效率,降低了數據出錯機率。3.區塊鏈智能合約的應用能顯著提高檔案管理工作效率。區塊鏈智能合約有別于現實法律合同,是通過計算機語言的邏輯判斷,當預先編寫的邏輯條款滿足時,自動執行相應合約條款,智能合約所執行的合約條款又與現實世界相關,將虛擬世界與現實世界連接在一起。智能合約最大的優點是當滿足條件時自動執行,這樣大大降低了執行成本。在檔案管理行業中,查詢、錄入、出證等多個方面都可以利用區塊鏈智能合約提高工作效率。區塊鏈技術智能合約的進一步應用,促使可編程經濟得到進一步發展,推動社會從現有的“契約社會”向前過渡到智能合約社會,也就是可編程社會。
區塊鏈技術是已有的計算密碼學、分布式存儲及網絡通信等技術的組合。區塊鏈是點對點傳輸、共識機制、分布式數據存儲、時間戳、梅克爾樹結構、散列函數、非對稱加密和智能合約等計算機技術的新型應用模式。特別是點對點分布式技術(P2P)、非對稱加密技術、哈希算法、共識機制被稱為區塊鏈技術的四大核心技術。
(一)去中心化的分布式對等網絡優勢。“去中心化”是指網絡系統的歸屬關系。系統歸屬于整個社區和所有參與者,則是去中心化的;系統歸于公司和個人,則是中心化的。而分布式網絡是指網絡部署分布結構和數據分布式存儲結構,是物理性的。區塊鏈通過分布式存儲技術實現各通信節點對數據的完整存儲,各節點數據彼此相同、實時更新,免去數據備份工作,降低資料遺失的風險,系統也不會因為單點崩潰而引發數據災難風險。區塊鏈系統也可以有效防范黑客、病毒等攻擊。某節點可以根據設備性能或工作需要,申請為輕節點(比如手機用戶),不存儲完整數據,只保留自身相關數據。
(二)采用共識機制來對新生數據區塊達成共識。區塊鏈的所有節點運行于去中心化的對等網絡系統中,那么如何在沒有中心化權威機構管理的情況下,讓區塊鏈系統不斷運行下去?共識機制是一種區塊鏈治理體系,是通過結合經濟學、博弈論等多學科設計出來的一套保證區塊鏈中各節點都能積極維護區塊鏈系統的方法,逐漸發展成為一種維護分布式賬本多中心化的重要機制,是保持區塊鏈安全穩定運行的核心。共識機制主要遵循“少數服從多數”和“人人平等”兩個哲學原則,通過一定規則,約束去中心化網絡中的每一個分散的節點,維護系統的運作順序與公平性,使每一個互不相干的節點能夠驗證、確認網絡中的數據,進而產生信任,達成區塊鏈網絡每個節點的數據共識。使系統中各個參與者快速將系統中記錄的數據達成一致。在網絡系統遭受攻擊時,只要被同時控制(或有害)的節點達不到一定的數量(與所選用的共識機制相關,例如POW、POS不超過50%,PBFT不超過1/3),那么對整個網絡系統就無法形成實質性危害。
(三)檔案數據通過散列(哈希)函數值首尾相接形成鏈式結構。區塊鏈網絡中通過對某一時間段內發生的檔案數據,按相應共識機制對數據內容進行打包形成新的數據區塊,每一區塊內容通過逐級哈希運算形成哈希值存儲在區塊當中,使區塊數據與哈希值產生映射關系。哈希函數是一種數字摘要技術,把消息或數據壓縮成摘要,使得數據量變小,將信息數據的內容固定下來。哈希值通常用一個隨機字母和數字組成的字符串來代表,例如:SHA256進行哈希“指紋”運算,產生256位的數二進制哈希值,通常用一個長度為64位的十六進制字符串來表示,Hash算法很難找到逆向規律。一個區塊內存儲本區塊和上一區塊哈希值(父哈希),使檔案數據通過具有密碼學特征的散列(哈希)函數值首尾相接形成鏈式結構。如果區塊鏈檔案數據被篡改將無法完成Hash值驗證,在此機制下,事務請求是不可偽造和防篡改的,保證了檔案數據安全。使用Hash算法可以提高存儲空間的利用率,可以提高數據的查詢效率,也可以做數字簽名來保障數據傳遞的安全性。
(四)采用密碼學的方法來完成檔案數據的加密和用戶身份認證。一般檔案管理系統能夠采用數字證書、電子印章及數據加密技術實現用戶對數據訪問的身份控制,這樣的管理模式離不開第三方機構認證和中心化的賬戶密碼信息管理。而區塊鏈采用非對稱加密技術的公私鑰來完成數據的加密和解密過程。每個用戶都有一對鑰匙,如果用公開密鑰對數據進行加密,只有用對應的私有密鑰才能解密;如果用私有密鑰對數據進行加密,那么只有用對應的公開密鑰才能解密。數字簽名技術是非對稱加密技術與數字摘要技術的結合,一般包括數字簽名和簽名驗簽兩個具體操作。數字簽名功能組件被接收者用以確認數據單元的完整性以及不可偽造性,即:確定消息確實是由簽發方簽署的。向區塊鏈寫入數據的事務請求需附有發起方私鑰簽名,該簽名隨事務請求在網絡參與節點間廣播并進行驗證,完成數據加密和身份認證。
區塊鏈具有不可篡改和不可偽造、數據變動全程留痕的技術特點。從廣義上講,區塊鏈數據本身已經具有電子數據檔案的部分特征。再加上區塊鏈在網絡應用方面所展現出來的機器信任、價值傳遞、智能合約等功能,區塊鏈技術應用已擴展到物聯網、智能制造、供應鏈管理、數字資產交易、司法存證、電子發票等多個領域。
2018年8月,全國范圍內首個“區塊鏈+發票”生態體系應用——區塊鏈電子發票在深圳亮相;2018年海南省海口市上線運行全國首個區塊鏈電子繳存證明平臺;2019年3月29日,將區塊鏈技術應用到信用檔案管理一體化公共平臺“誠信檔案——全國社會一體化公共平臺”UfileChain正式發布,Ufile Chain框架結構實現了“區塊鏈+信用檔案”的高效結合;2020年6月,北京技術創新示范區利用區塊鏈技術完成了“中小微企業檔案管理云平臺”項目,成為國內首個區塊鏈電子檔案平臺;2021年3月,由深圳市稅務局和騰訊主導推進的《基于區塊鏈技術的電子發票應用推薦規程》成為全球首個基于區塊鏈的電子發票應用的國際標準。
檔案區塊鏈管理系統,根據主流區塊鏈系統設計理念,基礎層提供了區塊鏈系統運行的軟硬件、數據存儲及網絡通信環境(見圖1)。
圖1 檔案區塊鏈管理系統功能架構圖
數據層的主要作用確定區塊鏈技術的物理形式。應用層提供安全代碼執行環境、共識機制、區塊鏈的安全驗證工作、賬本記錄及點對點安全通信機制等;業務層封裝了檔案管理相關業務應用組件在內的區塊鏈的各種應用場景和案例;用戶層提供用戶應用和運維應用,也為跨層功能提供應用;外部交互層為鏈外數據或跨鏈、側鏈數據提供通信通道。API(應用編程接口)是用戶層及外部交互層提供訪問和節點管理的接口。