陳臻鈺
(湘潭大學(xué) 公共管理學(xué)院,湖南 湘潭 411105)
2016年,國(guó)務(wù)院印發(fā)了《“十三五”國(guó)家信息化規(guī)劃》,正式將“區(qū)塊鏈技術(shù)”納入國(guó)家規(guī)劃[1]。2020年新修訂的《中華人民共和國(guó)檔案法》對(duì)數(shù)字檔案館和檔案信息資源管理、共享服務(wù)建設(shè)提出了新的要求[2]。這兩項(xiàng)條例和法案體現(xiàn)了區(qū)塊鏈技術(shù)應(yīng)用于國(guó)家信息化建設(shè)中的更多可能,也體現(xiàn)了國(guó)家層面對(duì)于檔案館數(shù)字化轉(zhuǎn)型與電子檔案資源共享的深層次需求。自2017年起,國(guó)家檔案局的科技研究項(xiàng)目一直出現(xiàn)區(qū)塊鏈應(yīng)用于電子檔案管理、利用等,體現(xiàn)了區(qū)塊鏈技術(shù)在電子檔案中應(yīng)用的活力。
理論上,區(qū)塊鏈技術(shù)不可篡改、透明可溯源、安全性高的優(yōu)勢(shì)與在傳輸共享電子檔案前后需要保障其真實(shí)、完整、安全的需求有較高的適配度。實(shí)踐中,區(qū)塊鏈不斷被各級(jí)檔案局、館應(yīng)用于電子文件歸檔、管理、跨館利用等,說明區(qū)塊鏈技術(shù)在管理使用電子檔案的各流程中能夠適配不同的應(yīng)用場(chǎng)景,也說明了區(qū)塊鏈技術(shù)是當(dāng)前檔案館數(shù)字化、智慧化轉(zhuǎn)型過程中保障電子檔案安全可信度相對(duì)較高、成熟度較高的技術(shù)。因此,在實(shí)現(xiàn)電子檔案跨部門共享過程中,運(yùn)用區(qū)塊鏈技術(shù)解決其中可能存在問題有一定的理論和實(shí)踐的基礎(chǔ)。
學(xué)界對(duì)于區(qū)塊鏈的定義并未達(dá)成共識(shí),因?yàn)槠鋺?yīng)用于不同學(xué)科和行業(yè)表現(xiàn)出的特性有所不同。從數(shù)據(jù)傳輸共享的角度出發(fā),可以說區(qū)塊鏈?zhǔn)且环N比較安全的數(shù)據(jù)傳輸和存儲(chǔ)的方式。區(qū)塊鏈最重要的特性是去中心化和分布式,這代表不需要任何權(quán)威組織對(duì)區(qū)塊鏈中傳輸、存儲(chǔ)的數(shù)據(jù)進(jìn)行集中管理、維護(hù),其依靠的是每個(gè)上傳數(shù)據(jù)的用戶節(jié)點(diǎn)進(jìn)行共同維護(hù),同時(shí)每個(gè)用戶節(jié)點(diǎn)都有權(quán)對(duì)節(jié)點(diǎn)上每個(gè)數(shù)據(jù)進(jìn)行查看和復(fù)制,保障了其在存儲(chǔ)空間足夠大、存儲(chǔ)量大的情況下能使數(shù)據(jù)維護(hù)成本保持較低,還能使用戶間方便快捷地進(jìn)行數(shù)據(jù)共享。區(qū)塊鏈技術(shù)在保障每個(gè)用戶節(jié)點(diǎn)能方便快捷地訪問海量數(shù)據(jù)庫(kù)時(shí),能使用哈希算法、Base58編碼和零知識(shí)證明等加密算法保護(hù)每個(gè)節(jié)點(diǎn)上的數(shù)據(jù),使數(shù)據(jù)被上傳后不可被更改,保障數(shù)據(jù)在不同用戶節(jié)點(diǎn)間傳輸?shù)陌踩?而在每個(gè)節(jié)點(diǎn)上的數(shù)據(jù)被傳輸?shù)搅硪粋€(gè)用戶節(jié)點(diǎn)后還需進(jìn)行解密才能獲得原有形式的數(shù)據(jù),保證了傳輸后數(shù)據(jù)仍然可靠。
根據(jù)區(qū)塊鏈上用戶上傳和訪問數(shù)據(jù)的權(quán)限不同、去中心化的程度不同,區(qū)塊鏈被分為公有鏈、私有鏈和聯(lián)盟鏈,而不同類型的區(qū)塊鏈能夠適配不同的數(shù)據(jù)管理利用場(chǎng)景。
公有鏈:公有鏈中,公有代表該鏈對(duì)每一個(gè)想進(jìn)入?yún)^(qū)塊鏈的數(shù)據(jù)所有者都是開放的,也意味著每個(gè)數(shù)據(jù)所有者都能上傳數(shù)據(jù)形成一個(gè)數(shù)據(jù)節(jié)點(diǎn),成為區(qū)塊鏈中的用戶,其數(shù)據(jù)節(jié)點(diǎn)的數(shù)據(jù)能被鏈上的其他用戶隨時(shí)訪問,而該用戶也能隨時(shí)訪問節(jié)點(diǎn)上的其他數(shù)據(jù)。公有鏈的去中心化程度高,任意用戶都能上傳數(shù)據(jù)并訪問鏈上所有數(shù)據(jù)。也正因?yàn)槊總€(gè)用戶都能上傳數(shù)據(jù),公有鏈上的數(shù)據(jù)量相對(duì)較大,對(duì)于存儲(chǔ)、訪問數(shù)據(jù)的服務(wù)器硬件性能要求高,數(shù)據(jù)處理速度也相對(duì)較慢。
私有鏈:私有鏈僅對(duì)單個(gè)用戶開放上傳和訪問數(shù)據(jù)的權(quán)限,只有獲得授權(quán)的節(jié)點(diǎn)才能接入,進(jìn)入該鏈后,用戶可以按照其規(guī)則參與數(shù)據(jù)的讀寫。私有鏈速度快、成本低、抗惡意攻擊能力強(qiáng),但由于其完全不開放,對(duì)私有節(jié)點(diǎn)的控制高度集權(quán)化。
聯(lián)盟鏈:對(duì)特定的一組用戶開放上傳和訪問數(shù)據(jù)的權(quán)限,只有獲得授權(quán)的節(jié)點(diǎn)才能接入,進(jìn)入該鏈后,用戶可以按照其規(guī)則參與數(shù)據(jù)的讀寫。通過控制用戶的數(shù)量,聯(lián)盟鏈在一定程度上兼?zhèn)淞斯墟湹娜ブ行幕潭雀吆退接墟渹鬏斝矢叩膬?yōu)點(diǎn)。
在國(guó)外,區(qū)塊鏈應(yīng)用于電子檔案共享早已有實(shí)例。愛沙尼亞曾提出了名為e-Estonia的項(xiàng)目,即“數(shù)字愛沙尼亞”計(jì)劃[3],這一計(jì)劃通過記錄公民檔案,將一個(gè)個(gè)公民化身為一個(gè)個(gè)數(shù)字公民的身份,通過數(shù)字身份識(shí)別在區(qū)塊鏈系統(tǒng)實(shí)現(xiàn)跨部門乃至跨國(guó)家的電子檔案資源的共享。美國(guó)國(guó)家檔案部門發(fā)布的《區(qū)塊鏈白皮書》中提出用區(qū)塊鏈保障電子文檔在傳輸利用時(shí)的有效性與時(shí)效性,相比于數(shù)字簽名保障電子文檔有效性而無(wú)法保障時(shí)效性,區(qū)塊鏈上的數(shù)據(jù)難以篡改并能很好地長(zhǎng)時(shí)間保障其真實(shí)性與時(shí)效性。英國(guó)的薩利大學(xué)同英國(guó)國(guó)家檔案館和開放數(shù)據(jù)研究所設(shè)計(jì)運(yùn)用區(qū)塊鏈技術(shù)保存電子檔案,同時(shí)保障其內(nèi)容的完整性與可靠性,從而促進(jìn)電子檔案能更好地被訪問、更好地被共享。
相較于國(guó)外已將區(qū)塊鏈技術(shù)應(yīng)用于電子文件共享水平成熟,我國(guó)對(duì)于區(qū)塊鏈應(yīng)用于電子文件共享研究理論上,賀智明等[4]提出了區(qū)塊鏈與可搜索加密結(jié)合的電子病歷共享方案,該方案將原始電子病歷保存在私有鏈上,最大限度地保障了電子病歷數(shù)據(jù)的安全性,降低了數(shù)據(jù)泄漏的風(fēng)險(xiǎn),而將電子病歷的索引詞保存于聯(lián)盟鏈中,使數(shù)據(jù)訪問更加細(xì)化,也減少了通信的消耗。岳征祥[5]提出的區(qū)塊鏈文件系統(tǒng)實(shí)現(xiàn)了電子病歷共享,以區(qū)塊鏈技術(shù)中心的聯(lián)盟鏈為核心,解決了醫(yī)療數(shù)據(jù)在共享過程中的信任問題。電子文件共享研究實(shí)踐中,我國(guó)將此類技術(shù)主要應(yīng)用于民生檔案的異地共享利用。
與國(guó)外已經(jīng)較為成熟落地的基于區(qū)塊鏈的電子檔案共享案例相比,我國(guó)關(guān)于區(qū)塊鏈在電子檔案中的應(yīng)用主要側(cè)重于管理和安全層面,應(yīng)多將意識(shí)提升到共享利用層面,提升我國(guó)電子檔案跨部門共享的水平,以提高電子檔案利用效能。在進(jìn)行電子檔案跨部門共享研究與具體落實(shí)時(shí),可以參考國(guó)外跨部門、跨國(guó)家共享的經(jīng)驗(yàn),結(jié)合我國(guó)電子檔案體量與具體分布情況,充分了解區(qū)塊鏈不同類型鏈的特點(diǎn),推進(jìn)我國(guó)電子檔案跨部門共享具體機(jī)制和模式的建立。
數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、網(wǎng)絡(luò)環(huán)境不相同和基礎(chǔ)平臺(tái)有差異等技術(shù)原因已成為阻礙數(shù)據(jù)資源整合共享的重要因素[6]。而電子檔案資源要實(shí)現(xiàn)便捷的跨部門共享,首先就需要專有的共享平臺(tái)。各部門都擁有自身的電子檔案管理系統(tǒng),使得在互聯(lián)網(wǎng)背景下政府和社會(huì)不斷增長(zhǎng)的數(shù)據(jù)共享需要的情況下,業(yè)務(wù)辦理效率大打折扣,響應(yīng)共享需求的時(shí)間變長(zhǎng)。
在電子檔案的共享過程中,會(huì)存在各共享參與部門在進(jìn)行共享電子檔案上傳時(shí)有所保留,甚至可能出現(xiàn)不愿參與共享的情況,而導(dǎo)致不愿共享的原因是擔(dān)心部門利益受到影響。大數(shù)據(jù)時(shí)代,人們對(duì)于數(shù)字化資產(chǎn)的保護(hù)意識(shí)逐漸提高,電子檔案是資產(chǎn)的一種,關(guān)乎利益,而經(jīng)濟(jì)利益又是部門對(duì)自身各方面進(jìn)行升級(jí)改造的基礎(chǔ),是關(guān)乎部門發(fā)展主導(dǎo)地位的重要影響因素。電子檔案的共享過程中可能因?yàn)閿?shù)據(jù)安全等原因?qū)е陆?jīng)濟(jì)利益的受損,也許是檔案部門和其他政府機(jī)構(gòu)不愿主動(dòng)推動(dòng)電子檔案共享最直接的原因。而問題的本質(zhì)其實(shí)是政府機(jī)構(gòu)的風(fēng)險(xiǎn)規(guī)避文化[7]。互聯(lián)網(wǎng)環(huán)境下電子檔案在共享過程中的確存在著許多安全隱患,在電子檔案采集、存儲(chǔ)、處理、傳輸、交換、銷毀的全生命周期6個(gè)階段都存在不同程度的安全風(fēng)險(xiǎn)。若是在此過程中造成了數(shù)據(jù)的泄露,不僅可能給部門帶來(lái)安全威脅,還可能會(huì)因此被問責(zé)。各參與共享的部門,特別是檔案體量較大的綜合檔案館,為了規(guī)避這種數(shù)據(jù)安全威脅,思想上不敢于共享,對(duì)于共享的積極主動(dòng)性不高,行為上表現(xiàn)為提供共享的電子檔案數(shù)據(jù)不全,從而導(dǎo)致電子檔案共享內(nèi)容和共享范圍上的受限。
目前,檔案的電子化大多數(shù)停留在對(duì)檔案目錄數(shù)據(jù)化的階段,缺少對(duì)檔案內(nèi)容的數(shù)字化與數(shù)據(jù)化,不利于對(duì)電子檔案的內(nèi)容進(jìn)行數(shù)據(jù)層面的提取和集成,也不利于對(duì)檔案內(nèi)容的深入高效挖掘而提升檔案價(jià)值。我國(guó)按部門對(duì)檔案進(jìn)行管理的原則一定程度上限制了學(xué)者對(duì)于某種類型檔案搜集、整理和研究的完整性,如果形成數(shù)據(jù)化檔案庫(kù),通過關(guān)鍵詞檢索能很好地解決這一問題。檔案數(shù)據(jù)化程度不高在很大程度上是由檔案原始記錄性的特性所決定的。紙質(zhì)檔案和紙質(zhì)檔案經(jīng)過掃描形成的圖片形式的數(shù)字化檔案與數(shù)據(jù)化檔案相比,篡改難度較大,檔案被數(shù)據(jù)化上傳到數(shù)據(jù)庫(kù)中是以數(shù)據(jù)的形式存在的,非常容易被篡改,很容易使檔案的原始性受到破壞。因此,如何保障電子檔案不被篡改,保護(hù)電子檔案的安全是從技術(shù)層面解決檔案數(shù)據(jù)化程度不高這一問題的關(guān)鍵。
電子檔案資源共享平臺(tái)的建設(shè),首先需要建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),因?yàn)閿?shù)據(jù)標(biāo)準(zhǔn)是數(shù)據(jù)治理的基礎(chǔ),能很好地保障數(shù)據(jù)質(zhì)量。電子檔案跨部門共享能與區(qū)塊鏈技術(shù)中聯(lián)盟鏈的應(yīng)用場(chǎng)景相適配,而進(jìn)入聯(lián)盟鏈的前提除了是被授權(quán)用戶,還需按照各節(jié)點(diǎn)用戶共同制定的規(guī)則寫入數(shù)據(jù),這為制定電子檔案共享平臺(tái)的數(shù)據(jù)標(biāo)準(zhǔn)提供了契機(jī)。同時(shí),由于有檔案館這類數(shù)字化、數(shù)據(jù)化的主要實(shí)踐部門和其他政府機(jī)構(gòu)這類對(duì)檔案查詢及利用需求高的部門作為節(jié)點(diǎn)用戶共同制定數(shù)據(jù)標(biāo)準(zhǔn),能夠很好解決單機(jī)構(gòu)制定數(shù)據(jù)標(biāo)準(zhǔn)帶來(lái)的元數(shù)據(jù)屬性制定得不夠?qū)嵱玫膯栴},強(qiáng)化電子檔案的流轉(zhuǎn)能力,讓其能在各政府職能部門被充分地共享利用,解決政府職能部門間存在的“信息孤島”問題。
一般說來(lái), 區(qū)塊鏈技術(shù)適用于“新型數(shù)據(jù)庫(kù)、多業(yè)務(wù)主體、彼此不互信、業(yè)務(wù)強(qiáng)相關(guān)”的場(chǎng)景[8]。聯(lián)盟鏈作為區(qū)塊鏈技術(shù)的一種類型,兼?zhèn)淞斯墟溤试S不止一個(gè)用戶在區(qū)塊鏈上進(jìn)行數(shù)據(jù)的讀取寫入以及私有鏈只允許授權(quán)用戶在區(qū)塊鏈上進(jìn)行數(shù)據(jù)讀取寫入的特性。電子檔案作為信息資源的一種,其共享需要相關(guān)利益方一同參與,才能保證電子檔案共享的安全。在聯(lián)盟鏈應(yīng)用到電子檔案跨部門共享時(shí),表明共享數(shù)據(jù)的開放只針對(duì)授權(quán)用戶,而授權(quán)用戶指的就是作為自身數(shù)據(jù)節(jié)點(diǎn)和電子檔案利益代表方的政府部門。一方面,政府是社會(huì)中可信度高的機(jī)構(gòu)組織,另一方面,在電子檔案跨部門共享的過程中只有政府部門能寫入、讀取共享區(qū)塊鏈上的數(shù)據(jù),這兩點(diǎn)能有效防止電子檔案在傳輸過程中泄漏,同時(shí),因?yàn)楣餐臄?shù)據(jù)利益,政府部門會(huì)增強(qiáng)自身數(shù)據(jù)節(jié)點(diǎn)安全意識(shí),防止電子檔案從自身所在數(shù)據(jù)節(jié)點(diǎn)泄漏,以此建立起聯(lián)盟鏈內(nèi)部參與電子檔案共享的各政府部門間的相互信任。出于數(shù)據(jù)利益的交換與相互間信任度的提升,各用戶節(jié)點(diǎn)能逐步全面上傳和共享所擁有的電子檔案,一同共享海量的檔案資源。
區(qū)塊鏈中運(yùn)用復(fù)雜的加密算法,如哈希算法、Base58編碼和零知識(shí)證明等,加密算法能夠?qū)?shù)據(jù)轉(zhuǎn)換成一串隨機(jī)的數(shù)字,用密鑰解密后才能將其還原成原有的數(shù)據(jù)形式。此類加密算法能保障區(qū)塊鏈上數(shù)據(jù)的不可篡改性,也保障了數(shù)據(jù)在不同用戶節(jié)點(diǎn)之間的安全傳輸。電子檔案是檔案的另一種形式,檔案經(jīng)過數(shù)據(jù)化變成電子檔案后在存貯、傳輸過程中仍然需要保有其原始性的特征,而區(qū)塊鏈中使用的加密算法能很好地保障電子檔案不可被篡改,從而保障其原始性,讓更多政府機(jī)構(gòu)進(jìn)行檔案的數(shù)據(jù)化形成更多的電子檔案在不同層級(jí)政府部門間進(jìn)行流通共享,不僅從技術(shù)層面解決了檔案數(shù)據(jù)化程度不高的問題,同時(shí)強(qiáng)化了電子檔案在各部門跨層級(jí)流通能力。
其一,區(qū)塊鏈信用性好、安全性高、透明性強(qiáng)、可拓展性好的優(yōu)點(diǎn)非常利于區(qū)塊鏈上的機(jī)構(gòu)、部門進(jìn)行電子檔案的跨層級(jí)共享,但其優(yōu)點(diǎn)是在電子檔案上傳到區(qū)塊鏈上后才能保障的,也就是說其強(qiáng)加密性可以保證已經(jīng)存于一個(gè)個(gè)區(qū)塊上的電子檔案的不可篡改性,但在其保存于區(qū)塊前的電子檔案真實(shí)性并不能得到保障,在其存儲(chǔ)之前,電子檔案是否可信、是否完整,這些需要各部門在檔案管理階段就應(yīng)做好并保障。其二,目前區(qū)塊鏈作為賬本數(shù)據(jù)庫(kù), 存儲(chǔ)的數(shù)據(jù)類型多為文本, 單個(gè)文件的數(shù)據(jù)量都不是很大[9],但在數(shù)據(jù)化時(shí)代,區(qū)塊鏈若是作為信息資源共享中心,而各節(jié)點(diǎn)發(fā)展程度又不一樣,一些區(qū)塊即共享節(jié)點(diǎn)的承載程度將受到很大挑戰(zhàn)。其三,當(dāng)今默認(rèn)區(qū)塊鏈能保障節(jié)點(diǎn)上的信息不可更改,但也只能說運(yùn)用區(qū)塊鏈進(jìn)行電子檔案資源共享的模式是具有較高安全性的,并不存在絕對(duì)的安全。隨著計(jì)算機(jī)計(jì)算能力的高速發(fā)展,區(qū)塊鏈運(yùn)用的加密算法被快速解出的情況也不是沒有可能出現(xiàn)的。其四,任何一種技術(shù)如若離開了標(biāo)準(zhǔn)化, 便很難推廣和發(fā)展下去[10]。雖然中國(guó)區(qū)塊鏈技術(shù)和產(chǎn)業(yè)發(fā)展論壇先后發(fā)布了《區(qū)塊鏈參考架構(gòu)》和《區(qū)塊鏈數(shù)據(jù)格式規(guī)范》兩項(xiàng)團(tuán)體標(biāo)準(zhǔn),但區(qū)塊鏈的標(biāo)準(zhǔn)化仍然處于成長(zhǎng)階段,不夠成熟,區(qū)塊鏈的發(fā)展過程會(huì)對(duì)電子檔案的共享模式造成一定的影響,而這種影響的好壞也是未知的。
隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)字化、數(shù)據(jù)化深刻地影響著每一個(gè)行業(yè),檔案部門、各政府職能部門的檔案室也受到了很大的影響,電子檔案出現(xiàn)不僅方便了檔案資源的存儲(chǔ),更方便了對(duì)其進(jìn)行共享利用與價(jià)值挖掘。但如何運(yùn)用現(xiàn)代化技術(shù)保障電子檔案在各跨層級(jí)共享過程中的完整性、可靠性是當(dāng)今一個(gè)重要的課題。區(qū)塊鏈技術(shù)的出現(xiàn)帶來(lái)了信用性好、安全性高、透明性強(qiáng)、可拓展性好的數(shù)據(jù)保護(hù)技術(shù),為電子檔案這一對(duì)完整性、真實(shí)性有極致要求的信息資源在進(jìn)行跨部門共享利用上提供技術(shù)支持,促進(jìn)了我國(guó)數(shù)據(jù)治理能力與治理水平的提升。但是,區(qū)塊鏈?zhǔn)且揽繌?fù)雜算法保障區(qū)塊上的信息資源不被破壞的,因此,在計(jì)算機(jī)更新迭代快速的今天,區(qū)塊鏈上的信息資源仍然有被篡改甚至刪除的風(fēng)險(xiǎn),選擇提升區(qū)塊鏈算法的復(fù)雜性還是顛覆原有基于區(qū)塊鏈的電子檔案跨部門共享方式是今后電子檔案跨部門共享發(fā)展過程中需要深思熟慮的問題。