欒國春
我國當前正處于數字經濟高速發展時期,數字經濟作為高質量發展的“穩定器”和“驅動器”作用將日益凸顯。數據作為新型生產要素,是整個數字經濟發展的基礎,數據只有流通交易和共享才能創造更多價值。因此,如何更好地保障數據流通、交易和共享是構建數據基礎制度的重點,也是充分釋放數據要素價值、發展數字經濟的關鍵。
一、當前數據流通、交易和共享存在的主要問題
一是確權難,存在數據主體多元,數據流通、交易和共享過程多變,對數據的貢獻不明確等問題。在數據市場實際應用場景中,判定數據歸屬以及數據是否被限定的用戶使用,屬于數據所有權中的重要內容。當前大多隱私保護技術一般由數據擁有者制定相關的訪問規則,然而接收方一旦獲得數據,數據擁有者就對這些數據失去了控制。為此,在數據流通、交易和共享之前,應該明確數據資產的各項權利,包括數據的所有權和使用權。當前數據行業大多用服務換數據,這種方式混淆了數據的所有權和使用權,使得數據所有者無法管控自身數據的使用情況。個人日常活動所產生數據的所有權毫無疑問屬于個人,然而,數據不同于傳統的商品,具有看過就等同于擁有的特征,難以清晰地界定所有權。
二是互信難,數據來源不可信、質量不可靠、隱私安全風險較高。真實可信的數據是數據流通、交易和共享的基石。由于有些數據源單位之間缺乏相互信任,導致不愿或不敢主動共享核心數據,目前也無有效手段推動數據自由地跨區域流動,數據要素價值得不到充分挖掘,而且數據易被復制的特性使得數據主體擔心用戶隱私泄露,導致不愿共享數據。此外,很多數據中包含著大量的敏感信息,數據市場的隱私保護對于敏感數據的流通、交易及共享尤為重要。隱私保護問題誕生自數據共享場景中,制訂數據的安全防護措施時,需要在充分地考慮數據使用場景及數據主體知情的前提下,發揮數據使用價值,但這可能會降低對隱私的要求。攻擊者可能會在數據傳輸的過程中竊取用戶的隱私信息,造成數據用戶的敏感信息泄露等問題。目前由中心節點集中存儲數據信息的方法,可能存在存儲節點單點故障,一旦被攻擊導致服務器宕機,整個系統將不再可用,同時,管理員的權限比較高,有可能從內部造成數據泄露。
三是監管難,數據流通、交易及共享的過程比較復雜,對其進行有效的監管面臨著較大挑戰。在傳統的數據市場模式下,由于中心化系統的黑盒特性,數據流通、交易及共享記錄容易被篡改和刪除。數據應限定使用范圍并保證被有限次使用。然而由于無法對數據的使用進行有效地監管,可能存在數據被二次售賣、并造成數據無法追溯的情況。因此,對數據流通、交易及共享進行有效監管是一個亟需解決的問題。
二、基于區塊鏈技術的數據流通、交易及共享安全保障體系
(一)建立數據流通、交易及共享安全保障體系
區塊鏈技術具有去信任化、去中心化、不可篡改性、可追溯性、密碼算法安全性和不可否認性等安全特征,可以有效解決確權、互信等問題。筆者以區塊鏈技術為基礎,結合訪問控制、加解密等多種數據安全保護方法,設計建立一個保障數據安全流通、交易和共享的體系。主要是利用聯盟區塊鏈對用戶身份進行認證與管理,實現用戶身份注冊、證書管理、公鑰管理、身份認證等功能。同時區塊鏈網絡提供的數據信息存儲與搜索過程,記錄數據的摘要信息、數據流通、交易和共享過程等信息。通過智能合約機制驗證搜索的密文所需要的屬性和數據請求者的權限。采用分布式文件系統IPFS(Interplanetary File System),能夠降低區塊鏈上數據存儲的成本,當數據擁有者將數據文件上傳至 IPFS以后,它就會為每個數據文件分配唯一的哈希值,具體如圖1所示。接下來以此圖為基礎架構,分別就如何保障數據流通、交易和共享安全進行說明闡述。
(二)數據流通安全保障
據統計,單個組織或機構一般僅僅存儲15%與其業務關聯的數據,其他所需的數據是來自于其它組織或機構。聯盟式的數據流通系統不斷出現,加入聯盟系統的用戶提供數據信息,同時能夠獲取其他用戶提供的數據。通過數據流通能夠打破“數據孤島”,從而深度挖掘數據的價值。
目前我國數據流通面臨著數據隱私保護不足、數據權屬界定不清晰、流通各階段標準缺乏共識等問題。因此,對流通的數據建立完善的追溯體制非常重要,即在機構之間的數據流通過程中,在跨不同利益主體之間追溯與控制數據流轉。利用區塊鏈技術可以解決以上問題。一是完成對敏感行為的記錄與控制,為數據流通系統提供可審計性。二是分布式數據存儲結合區塊鏈審計能夠保證數據隱私。三是清晰地界定數據權屬,在不同系統之間統一身份認證,使得數據訪問的行為被正確地審計。四是通過區塊鏈技術保證數據的流通可追溯、不可篡改,促進安全可信的數據流通的生態建設。
(三)數據交易安全保障
數據交易是指以數據作為商品進行分類定價、流通和買賣的行為,它將有效發揮數據價值,實現從數據資源到數據要素到數據資產再到數據資本的多重轉變。隨著數據需求的存在,數據交易的市場也在逐步形成。目前市場上主要存在兩種數據交易方式:第三方數據交易平臺和雙方定向交易。其中第三方數據交易平臺,我國現存有兩種較主流的形式:一種是由政府主導的政府或國企獨資或政府和民營合資的大數據交易中心;另一種是以企業獨資或合資運營為主導的數據交易平臺。
當前數據交易市場處在初步發展階段,整體還不夠成熟完善,存在數據定價機制不明確、數據價格與其價值不符、數據存儲缺乏安全性、數據交易過程不透明且難以追溯等問題。此外,數據交易是一種新興商品交易方式,與傳統的商品交易存在明顯的區別,數據擁有可見即可得、易獲取、易被復制、易傳播等特征,且復制前后的數據在本質上并無太大差異,數據一旦被復制甚至被傳播后,會大幅度降低其價值,因此在數據交易過程中安全問題至關重要,如何保證數據隱私不被泄露是亟待解決的一大問題。
根據區塊鏈的不可篡改性、可追溯性、去中心化、匿名性等特點,若將區塊鏈技術用于數據交易平臺的數據存儲部分,將極大程度上解決目前數據交易面臨的問題。不可篡改性確保數據在定價之后不被人為惡意修改;可追溯性能夠對平臺上價格變動、交易過程全記錄等信息進行溯源;去中心化確保各主體的權益得到充分保護等;匿名性可用于保護數據交易平臺用戶隱私。
數據交易過程中主要包括三大類主體:數據擁有者、數據消費者、數據交易平臺。數據擁有者首先將隱私數據上鏈,然后根據某種定價策略對上傳的數據商品進行定價。加入區塊鏈技術后,區塊鏈網絡主要用于存儲各種數據信息,包括數據商品概要信息、數據價格、數據內容和數據交易記錄等信息。數據存儲采用將真實數據內容存放在 IPFS 網絡中的存儲方式,將 IPFS 返回的哈希值地址,同數據信息一起存儲在區塊鏈。但存儲在IPFS中也并不能完全保證數據的安全性,為了降低內容被泄露的風險,運用對稱加密算法、非對稱加密算法、代理重加密算法對數據訪問進行有效控制,從而保障數據內容的安全性。數據消費者購買數據商品后,可請求下載數據,經過一定過程,生成加密密鑰和解密密鑰,最后數據消費者即可獲取到明文數據。
(四)數據共享安全保障
現在各行業中均存在“數據孤島”“數據煙囪”等現象。究其原因主要是無法保證數據隱私性、保密性和數據的確權。目前應用最廣泛的數據共享方法是以第三方平臺作為中介,數據所有者將數據上傳到第三方平臺后,其他用戶再獲取。然而,這種傳統的數據共享方式采用中心化服務器和中心化存儲,主要存在以下問題:一是管理員權限過高,如從內部主動作惡,竊取用戶的隱私數據,容易造成數據泄露;二是中心化服務器容易被黑客攻擊,從而導致單點故障,一旦中心化服務器宕機,整個數據共享系統將不可再用;三是傳統的數據共享方式共享過程不透明、數據所有權歸屬難以確定。
將區塊鏈技術與數據共享結合起來,能有效解決傳統中心化數據共享方案存在的問題。區塊鏈技術可以將用戶間共享數據過程在智能合約中實現,能夠將用戶的共享數據的記錄呈現在區塊鏈賬本上,實現用戶數據確權和數據共享過程透明可追溯。數據申請者從基于區塊鏈的數據安全共享平臺中獲取所需數據信息,并輸入自身屬性對稱密鑰解密,只有當數據申請者擁有該數據的訪問權限時,才能夠獲得解密密鑰。經過一定流程,數據申請者可獲得密文并解密密文,從而獲得所需數據。當申請者發出申請并執行搜索時,基于區塊鏈的數據安全共享平臺會將用戶的行為記錄到區塊鏈上,便于追溯及監管。
(作者為國家公共信用信息中心副處長、高級工程師)