張靜波
(遼寧石化職業技術學院,遼寧錦州,121000)
近年來,隨著大數據的蓬勃發展,數據交易成為新興的熱門領域。以貴陽、北京、上海等地為代表的多個地區,一批大數據交易所(或中心)快速興起,引發了社會各界的廣泛關注。數據交易是大數據發展到一定階段的必然需求,對推動我國數據公開化、共享化,建立健全以數據為基礎的科學化社會體系具有重要意義。數據交易依賴于完善的數據治理體系,進而確保良好的數據質量和安全的交易環境。而我國現有的大數據交易體系面臨兩個方面的主要問題:
(1)源數據和目標數據難以匹配的問題。數據產生和應用的環境不同直接導致數據的提供方與需求方對數據的要求不一致,較大程度的影響了數據交易的效率。因此,現有數據交易過程是提供方(或第三方交易場所)列出能夠提供的數據清單,需求方根據自身需要進行有限的選擇。
(2)數據交易過程中的安全保障問題。不同于其他的實體物品交易,數據的只能在網絡上進行,這就為數據交易過程中進行數據篡改提供了可能。
解決上述兩個問題的關鍵是建立一種協同共治、安全可信的數據治理體系,區塊鏈技術為建立這樣的體系提供了技術可能。
區塊鏈是一種新型的數據庫技術,具有去中心化、防信息篡改等典型特征,使其在金融、征信等領域得到廣泛應用[1]。區塊鏈技術適用于相關方互相不互信,而又對信息安全要求比較高的環境。因此,是解決數據交易現存問題的一種理想技術手段。
區塊鏈技術采用鏈式結構組織數據存儲節點,也即區塊的概念,采用時間的先后順序,利用密碼學的技術建立起鏈式結構[1]。相比原傳統數據庫的“增刪改查”操作,區塊鏈形式組織的“數據庫”僅具有“增”和“查”的操作,且增加的數據需要各參與方的共同認可,有效的保障了數據的安全性和可靠性。
按照系統是否具有準入管理機制,區塊鏈的可以分許可鏈和非許可鏈。在許可鏈中,加入和查詢需要經過系統的許可。根據擁有許可權限的范圍,許可鏈又可進一步分為聯盟鏈和私有鏈,加入和讀取的權限分別控制在“聯盟”和少數私有人手中。非許可鏈式完全開放的,又稱為共有鏈,加入和查詢等相關操作在符合系統規則的前提下完全自由。
區塊鏈技術已經應用在金融、征信、醫療等諸多領域。部分學者已經開始將區塊鏈技術應用在政府數據管理、數據一致性等相關領域[2,3,4]。部分學者開始關注區塊鏈技術在隱私保護領域的應用[5,6]。這些研究都為在數據交易領域引入區塊鏈技術奠定了良好的基礎。
參與交易的數據需采用區塊鏈的技術進行存儲,僅有鏈內可以參與交易。圖1為用于交易的數據區塊鏈結構,每個區塊鏈具有以下幾項關鍵要素:
a.基礎功能組件。實現數據庫的基本功能,如與其他區塊節點建立聯系,數據的讀取、加密、接口等,實現數據管理的基礎功能,確保數據數據可以按照安全的、按照指定的形式由賣方轉移至買方,確保數據交易過程順利完成。
b.數據校驗(賬本)。所有參與交易的數據必須滿足交易雙方以及數據管理方共同約定的數據格式與存儲要求,可以采用現有的元數據管理方式,建立相應的數據字典。也可以更廣泛的對數據清洗、隱私保護等提出約定。賬本功能是對本節點是否滿足事先的約定進行校驗,通過校驗方可建立相應的區塊,并存儲相應的數據。
c.共識,管理存儲數據和獲取數據的操作過程。參與數據交易的各方,是區塊鏈的管理與使用方。共識要素用來確保滿足條件的數據是經各方認可后存儲,也是經各方認可后進行查詢和讀取。

圖1 區塊鏈模型
d.操作指令集合。用于實現區塊鏈操作過程中的各項指令。如文獻[1]所述,指令集合既可遵循圖靈完備性,也可不遵循圖靈完備性,需要根據雙方交易的數據類型和交易之前的約定確定。指令集合是具體交易的編碼實現。
e.數據存儲區。用于存儲交易所需的數據。考慮到現有交易的數據種類多樣,不僅局限于原有的關系數據類型,采用NoSQL技術對數據進行存儲,將數據存儲為對象的范式,建立適用于多種數據類型的數據庫體系。
基于上述區塊鏈模型的數據交易,改變了傳統數據交易的基本流程,主要涉及三個方面:
a.數據交易不再是基于現有數據,而是采用預約交易的方式。數據買賣雙方與數據交易平臺實現對相關數據達成共識,形成約定。相關數據的產生、清洗、存儲、交易等多個環節均由數據交易參與方共同參與管理。區塊鏈模型可確保參與交易的數據產生、交易全流程能夠符合事先的約定。
b.數據交易平臺職能弱化,交易平臺僅是區塊鏈數據庫系統的建設者和維護者,其雖參與交易過程,但并不實質性的參與交易,更多的承擔交易監督者的職能。
c.交易重心不再是交易本身,而是交易之前的約定,約定一旦達成,不能更改,參與交易的各方均是遵從合約的行為,各方的地位更加平等,交易更加公平。

圖2 系統模型結構
系統模型,也即數據交易場所的管理系統模型。基于前述的區塊鏈模型和數據交易流程模型,系統模型重點是實現對多個區塊鏈存儲系統的綜合管理,其基本架構如圖2所示。
系統模型邏輯上可分為三層,即應用層、區塊鏈層以及基礎設施層。
應用層。通過調用區塊鏈層和基礎設施層相應的功能,為系統的使用各方提供基礎的展示功能和簡單的數據應用。例如,提供數據樣例的展示、較為簡單的數據分析功能等。
區塊鏈層。基于上述區塊鏈模型,為每個交易行為建立對應的區塊鏈數據庫。交易行為與區塊鏈數據唯一對應。區塊鏈采用聯盟鏈的形式,只有交易相關方和平臺的管理方是聯盟的成員,可以對鏈數據庫進行相應的操作。交易完成后,其對應的區塊鏈隨即刪除。
基礎設施層。包括CPU、GPU、網絡、I/O、存儲等基礎硬件,以及使用云平臺所需的中間件等基礎軟件。
區塊鏈技術突破性的解決了安全環境和可靠交易的問題,具有良好的發展前景和廣泛的應用領域。目前,對區塊鏈技術的研究還處于起步階段。本文是基于區塊鏈技術的通用技術特征,對應用區塊鏈技術建立數據交易模型,解決數據交易面臨的問題,進行了有益的探索。長遠來看,隨著區塊鏈技術的不斷發展和應用的逐步成熟,其與云計算、大數據等關鍵技術將有機結合,成為促進我國數據交易環境不斷完善,數據共享能力不斷提升的有效途徑。