文·李景
自2008年比特幣誕生,區塊鏈技術的應用逐漸被世界各國布局研究。我國高度重視區塊鏈的發展,尤其是在2019年10月24日,習近平總書記在中共中央第十八次集體學習中強調,要把區塊鏈作為核心技術自主創新的重要突破口,加快推動區塊鏈技術和產業創新發展。目前,我國區塊鏈產業蓬勃發展,產業規模和企業數量不斷增加,國際競爭力顯著提升,垂直行業應用落地項目不斷涌現,國家各部委及各地方政府先后推出近300余條政策,鼓勵區塊鏈技術和產業創新發展。國內互聯網巨頭企業也紛紛布局區塊鏈應用,阿里、華為、百度、騰訊、京東等企業紛紛推出區塊鏈平臺,包括央行和四大國有商業銀行在內的36家銀行機構也紛紛開展區塊鏈應用,并取得優異成果。
檔案數據是國家各行業的重要信息資源,隨著技術的革新和社會的發展,檔案數據共享成為主流趨勢,但在共享過程中,存在中心化存儲整合效率低、孤島現象嚴重、信任度低、安全性差、隱私保護難等問題,無法適應社會對檔案數據共享的發展要求。區塊鏈技術的出現和應用,有效解決了以上問題,因此,深化區塊鏈技術在檔案數據共享中的應用勢在必行。
區塊鏈作為一項創新的技術架構,是一種分布式記賬技術,其核心是去中心化。它是可以在眾多參與方之間共享和復制的數據庫,并且這個數據庫只能通過遵循預先建立的規則進行更新,一旦更新它將與所有各方共享,實現價值的傳遞。諸如在銀行卡、支付寶、Paypal等電子現金的交易過程中,區塊鏈不需要任何中心化記賬人,而是通過被稱為共識機制的算法再結合一系列密碼學與博弈論的巧妙設計,實現透明化的共同記賬。由于區塊鏈是一個點對點網絡,它為事件設置時間戳,因此不需要第三方來驗證記錄,這種形式的記錄暗示了共識和信任,并且是無法篡改的,確保了賬本數據庫的一致性與準確性。
區塊鏈包含三個部分:區塊、鏈和網絡。區塊包含事件列表,這些事件可以是任何類型的活動,記錄的規則是在首次創建網絡時建立的,例如限制事件的大小或數量。當塊達到最大時,它就會被通過哈希值連接成鏈。哈希值是一種從可變數據字符串生成固定長度值的算法,就是將一個塊的哈希值插入到下一個塊中,再將新塊與前一個塊鏈接起來。對未修改的數據塊重復使用,哈希值連接將始終生成相同的固定長度的值,如果數據塊被更改,哈希值的輸出將會不同。因此,不同的哈希值輸出表明原始塊已被篡改,不值得繼續信任,可以將多個哈希值組合在一起并再次賦予哈希值,從而創建一個新的哈希值或Merkle根,附加的哈希值被添加到根目錄中,從而創建一個Merkle樹。區塊鏈網絡由節點組成,每個節點包含所有事件的完整記錄,不存在集中式副本,也不存在比其他節點更受信任的節點,數據完整性由所有節點上復制的區塊鏈維護。
區塊鏈網絡有三種類型:公共的、得到許可的和私有的。公共網絡通常是一個大型網絡,它允許任何人參與,比如用于加密貨幣交換的網絡。一個得到許可的網絡僅限于某些方面,但也可能很大;最小的網絡是私有網絡,它受到嚴格控制,通常在可信實體之間建立以共享機密信息。
支持使用區塊鏈技術應用到檔案管理,其原因在于區塊鏈技術可以提供一種對記錄有效性建立信任的方法。檔案記錄的關鍵在于公眾的信任,擔心政府權力的濫用有可能破壞檔案數據的真實性,而區塊鏈技術的特征卻能夠證明記錄的真實性,并使逃脫記錄的篡改嘗試變得不可能。需要指出的是,區塊鏈在檔案管理中的應用并非能夠解決一切難題,自身不存在任何問題的靈丹妙藥,通過閱讀研究國外實踐的經驗,區塊鏈技術在應用的道路上需要解決以下兩點重要問題:
其一,區塊鏈技術只能說明在添加到區塊鏈之后的記錄沒有被修改過,在鏈接到區塊鏈之前,它無法說明記錄內容的有效性的真實性。對于區塊鏈技術本身而言,提供完全信任的存儲記錄仍然是十分必要的。
其二,區塊鏈技術減少了驗證憑證的文書處理量,并且增加了對機構的信任。然而,這也引發了新的擔憂,區塊鏈實現可能會解決短期問題,但是需要仔細考慮將這些記錄與這種類型的技術綁定在一起的長期可行性,包括考慮如何在必要時將記錄從區塊鏈遷移出去而不使其失去可信度。
區塊鏈遷移數據的能力越來越重要。以歐盟(EU)和加州的新數據隱私法為例,歐盟《一般數據保護條例》(GDPR)和加州《消費者隱私法案》(CCPA)都允許個人直接控制他們的部分個人數據,允許他們從網上刪除這些數據,這將給鏈本身帶來潛在風險。系統的真實性意味著數據的刪除需要某種版本的硬分叉(hard fork)才能滿足數據刪除的請求。區塊鏈上有兩種“叉子”,軟叉和硬叉,兩者都是對管理區塊鏈操作規則的更改。軟叉是向后兼容的,而硬叉不是。硬叉是一種激進的措施,可以通過改變網絡上的規則,并指定網絡在前進時將訪問哪些舊數據,從而使區塊鏈網絡上以前有效的數據無效。然而,雖然硬分叉可以改變數據塊的有效性狀態,但無法將它們從網絡上刪除,要完全刪除數據,需要從運行該區塊鏈的每個節點進行刪除,這將使區塊鏈無法存儲任何受隱私法約束的數據。
以上是區塊鏈技術應用到檔案管理中可能出現的問題,需要在未來的實踐和應用中通過技術研究加以解決。最重要的是,目前對區塊鏈的研究主要來自計算機科學和金融行業,這對于一種根本上只是記錄保存形式的技術來說,它的開發明顯缺乏來自記錄人員和檔案管理人員的參與。本文通過對國外此類實踐經驗進行總結介紹,以期對我國檔案管理的實踐應用和技術研究提供有效經驗。
愛沙尼亞是前蘇聯加盟共和國,1991年獲得獨立。從1940年到1991年的51年時間里,愛沙尼亞一直作為前蘇聯加盟共和國的身份,參與國際政治大家庭。當年獨立的時候,整個國家只有一條電話線是通向外部世界的,甚至連這個國家獨立的信息,還是由芬蘭政府幫助向外部世界發布的。但是2017年在克羅地亞舉行的In Future會議上,愛沙尼亞代表報告說,區塊鏈技術已經在愛沙尼亞的公共系統中使用了,每個愛沙尼亞人都可以隨時在任何公共機構訪問他的電子數據,區塊鏈系統也會記錄訪問的歷史,從而確保了數據的透明性、安全性和真實性。在2017年DLM論壇會議上,愛沙尼亞國家檔案館電子檔案(Kuldar Aas)副館長Kuldar也談到了在電子健康系統、地籍管理、法律登記、遺囑等領域使用區塊鏈技術的經驗,而且他提出建議,檔案工作者現在也應該了解這項技術,并評估其解決數字資料長期保存的問題。
愛沙尼亞已經將所有公民的檔案記錄數字化,并連接了區塊鏈系統,因此愛沙尼亞是世界上第一個在區塊鏈上建立數字公民身份的國家。甚至,德國總理默克爾、法國總統馬克龍、日本首相安倍晉三等都是該國的數字公民。愛沙尼亞曾提出了名為e-Estonia的項目,即“數字愛沙尼亞”計劃。該計劃有三個支柱:X-Road、數字身份證和區塊鏈系統。X-road是一個跨國家、跨部門的信息共享基礎設施,打通了愛沙尼亞、芬蘭、瑞典等數百個不同的政府部門、大型公關企業和銀行機構的數據庫,實現數據的互聯和互通。數字身份證項目使愛沙尼亞公民皆能擁有屬于自己的電子身份證卡,用于服務公民在生活中各方各面的需求,如在網絡上投票、自動化報稅、申請社會福利、銀行服務等方面。愛沙尼亞曾宣布將數字公民身份向全世界公民開放,推出了e-Residency 項目,區塊鏈系統項目則是愛沙尼亞兩位教授2007年開發的KSI無簽名區塊鏈系統,目前已在國家的行政、司法、商業、醫療、交通體系中得到充分應用。
加拿大不列顛哥倫比亞大學電子財務文件研究中心主任、著名專家Victoria Lemieux提出了一個問題,“使用區塊鏈技術進行文檔管理是幫助還是炒作?”從檔案學的意義上講,區塊鏈技術是一種文檔管理技術,提供了從形成、使用到存儲控制文檔的新方式,通過分布式記賬以實現記錄不可篡改的目的。例如改變對文檔進行身份驗證的方式,從依賴受信任的第三方到基于系統自身的身份驗證方法。但是在某些情況下,人們高估了區塊鏈技術用于文檔管理的期望值,例如我們認為可以運用區塊鏈技術長期確保電子文檔的真實性和完整性,但實際上區塊鏈并不提供長期的數據可用性。顯然,人們對區塊鏈應用于檔案管理的理論和實踐知之甚少。盡管區塊鏈技術的本質是一種文檔技術,并且有許多新項目專注于在檔案管理中使用該技術,但是關于區塊鏈技術對檔案管理影響的研究相對較少,我們需要檔案管理領域的研究者與區塊鏈技術的研究者之間更緊密的互動,這將有助于雙方的發展。
為了了解區塊鏈對檔案管理的潛在影響,美國國家檔案與文件署(NARA)在2018年專門開展了一項研究,隨后NARA將主要的研究發現匯集并在2019年2月發布了《區塊鏈白皮書》。該白皮書旨在幫助聯邦檔案管理人員更好地了解區塊鏈技術,并考慮其所在機構使用它。
NARA指出,數字簽名作為一種常見的數據交流形式,可以存儲在區塊鏈上。目前,當我們對電子文本文檔(如PDF)進行數字簽名時,簽名存儲在文檔本身中,這些簽名必須按順序進行,如果證書過期,文檔的有效性可能會被質疑。區塊鏈技術一方面可以消除順序簽名和對證書的要求,從而保證文檔的有效性,這對于土地契約和遺囑等需要長期保存的文件尤其有用;另一方面區塊鏈可用于確定實物或不動產的真實性,比如在藝術界,由于真品證書保留在區塊鏈中無法偽造,因此能夠確保購買的畫是真實的;第三,區塊鏈可用于檔案真實性檢驗,當組織向用戶提供文件時,通常可以提供出處和認證,證明它是真實準確的副本,之后如果有任何問題,則必須將其與原件進行比較,但如果真實性證書保留在區塊鏈中,則可以重新對文件進行哈希運算以確定文件是否被更改或調整。
英國的ARCHANGEL項目是薩里大學與英國國家檔案館和開放數據研究所(ODI)合作建設的區塊鏈檔案管理項目,其目的是通過設計、開發、試用區塊鏈技術來確保數字檔案的長期可持續性,以促進可訪問性和確保內容的完整性。同時通過新穎的商業模式最大程度地發揮其影響力,例如英國國家檔案館是世界上最大、最古老的檔案和記憶機構(AMI)之一,負責保存英國政府的數字記錄,包括官員做出的重要決定和收到的建議。這些信息中有些是公開的,有些則一直秘密封存數十年。AMI是建立在公眾信任和中立的基礎之上,其不可篡改性和完整性對于維持其客觀性至關重要。通過使用區塊鏈來記錄和校驗數據,此項目允許在長達100年的時間跨度內驗證它們的完整性,這些數據來自于掃描的物理記錄或原本就以數字形態記錄的數據,通過點對點分布和一致性檢查永久保存,從而不需要可信的第三方。
從技術角度來看,ARCHANGEL利用尖端的機器學習技術,收集物理的和原生數字化數據進行存儲。用于呈現內容并驗證其來源和完整性的簽名和程序代碼都將在區塊鏈中進行編碼。新型的商業模式將成為支撐此項目的基礎,例如利用多個AMI在創建和使用ARCHANGEL中的貢獻建立商業運營模型。這種方案可以移植到任何數字檔案中,如大學的數據存儲庫,跨國公司的財務和法規記錄,科技公司中的技術記錄等。
通過對國外實踐經驗的了解,筆者發現,區塊鏈技術在檔案管理中應用的程度存在相當大的國別差異,愛沙尼亞作為波羅的海三小國之一,其人口和經濟科技實力并非出類拔萃,但在此一方面卻世界領先。這說明發展區塊鏈技術的應用關鍵之處在于理念上的重視,另外,產學研相結合也十分重要。以英國為例,高校和國家機構的合作研究成果卓著,ARCHANGEL已經十分成功,并探索出了可持續運營的商業模式,這一點對于一項新興技術的生命力和可復制性來說至關重要。
在這方面,我國也進行了大量實踐,比如,2019年,中石化開展了電子文件歸檔管理區塊鏈應用試點,拉開了實踐層面的探索序幕。中科院合肥分院、沈陽市檔案館等多家單位緊隨其后,開展了各有特色的應用。從2020年國家檔案局科技項目申報情況來看,涉及區塊鏈技術的推薦項目占信息化和現代化項目總數的24.4%。從立項情況看,涉及區塊鏈技術的立項項目共14項,占信息化與現代化項目立項總數的17.5%,占各類科技項目立項總數的11.7%。獲得立項的14個具體項目中,除了1個軟課題外,其余均聚焦具體的應用場景或系統建設。可以預計,檔案界的區塊鏈應用將在未來一段時間內迅速發展。
