曹迪龍,楊文暉,苗 放
(1.成都理工大學 信息科學與技術學院,四川 成都 610000;2.成都理工大學,四川 成都 610000;3.成都大學大數據研究院,四川 成都 610000)
傳統著作者維護作品版權一般是通過實體憑證,或第三方機構認證,如通過出版社出版實體作品等。資產的流通也普遍依賴于實體書籍的售賣,這不僅導致著作者本人不能全部得到其作品所獲取的所有利益,同時也面臨著盜版、侵權等一系列問題。5G時代的來臨,使得互聯網越來越多地應用于日常生活,加之互聯網技術的快速發展,資產數字化也在不斷增速。理論上一切可標準化數字化的實體作品都會逐步成為數字資產,常見的數字資產包括數字積分、虛擬貨幣、電子優惠券、虛擬游戲道具等[1]。作品數字化實現了著作者本人與其數字作品之間形成直接聯系,避免了像出版社這樣的第三方代理機構對作品進行管理、出版和售賣等操作的現象。但同時也加大了著作者本人對其作品權屬認定的難度,由于網絡開放程度大,且沒有統一的數字作品存儲地,這使得數字作品存在被篡改的風險,直接導致數字資產的流失。
根據統計數據顯示,2019年全國著作權登記總量達4 186 549件,同比增長21.09%。作品登記總量達2 701 564件,同比增長14.86%。其中科技文化領域內容被侵權最嚴重,每兩位作者里就會有一位被侵權。從作者層面看,2019年被侵權的作者占全體作者的23%,從內容層面上看,平均每篇內容的被侵權量為3.64次。由此可見,數字作品權屬的保護仍面臨著不小的困難,如何保障著作者本人的權益成為當前網絡環境中作品數字化所面臨的難題。
2008年中本聰首次發表論文《比特幣:一種點對點電子現金系統》[2],并且于2009年發布首個比特幣區塊鏈系統。區塊鏈技術具有去中心化、可追蹤可溯源,以及分布式架構等特點,形成一種沒有中心機構,多方協作且無需信任的分布式系統。由于各方互不信任,且維護同一賬本,極大地降低了出現錯誤記錄的風險。
基于區塊鏈的數字作品自動定價和交易系統,允許任何有資格的個人或機構在系統中發布和管理數字作品。該系統采用區塊鏈的一致性機制、分布式分類賬和鏈式數據塊存儲技術,具有以下優點:①交易雙方無需信任即可實現數字作品的安全交易;②系統自動制定數字作品價格,避免出現惡意交易虛擬貨幣,或惡意提高作品價格的現象;③利用鏈接存證,減小了區塊鏈的存儲壓力;④實時同步分布式分類賬,實現實時對賬和交易結算;⑤交易數據具有安全、不可篡改的特點,且能夠追蹤溯源,避免了出現交易抵賴的現象。
從本質上講,區塊鏈是一個共享數據庫,其中存儲的數據或信息具有“不可偽造”、“全程跟蹤”、“可追溯”、“公開透明”和“集體維護”的特點[3]。由于區塊鏈具有這些特點,它奠定了堅實的“信任”基礎,創造了可靠的“合作”機制,使得其在金融等領域中有著廣闊的應用場景。區塊鏈技術是近年來出現的一種新技術,由去中心化和非對稱數據加密、時間戳、分布式計算、共識算法等經典計算機技術組成[4-6]。區塊鏈將加密技術與分布式消息傳輸協議相結合,將對賬過程簡化為共享的分布式總賬形式,通過分散式協作隊總賬進行維護不僅提高了數據處理效率,還完成了信息的共享,同時確保了數據的安全,避免數據被篡改。區塊鏈技術與傳統技術相比,在持續性、兼容性、共享信息和互聯性等方面具有顯著優勢[7]。
區塊鏈基礎架構模型如圖1所示。

圖1 區塊鏈基礎架構模型
區塊鏈有三種類型,即公有區塊鏈、聯合(行業)區塊鏈以及私有區塊鏈,其主要特點如下:
公有區塊鏈(public block chains):世界上所有的個人和團體都可以進行交易,交易可以得到有效的確認,并且所有人都可以參與到共識過程中來。
聯合(行業)區塊鏈(consortium block chains):預先選擇一些節點作為記賬人,節點選擇權是由某一個群體內部決定,這些節點的具有決定區塊生成的權利,其他節點可以參與到交易過程,但不過問記賬過程。
私有區塊鏈(private block chains):僅僅利用區塊鏈的總記賬技術進行記賬,可以是某個團體或是某個人,獨享該區塊鏈的寫入權限。
共識機制是通過特殊的節點投票,在很短的時間內完成對事務的驗證和確認,是使區塊鏈成為一種自信任體制的核心前提。區塊鏈的自信任主要體現在不需要存在一個可信的中心化機構,用戶在區塊鏈中不需要信任交易的對方,只需要信任軟件系統在區塊鏈協議下實現交易即可。
現今區塊鏈中的共識機制主要分為四類:工作量證明機制(proof of work,PoW),主要應用于比特幣網絡,但由于PoW在比特幣網絡中的應用已經吸引了全球計算機大部分的算力,同時基于PoW的挖礦行為還造成了大量資源的浪費,達成共識所需要的周期也較長,因此該機制并不適用于其他應用場景。權益證明機制(proof of stake,PoS),與PoW的區別在于不需要證明人執行一定的計算工作,只要求證明人提供一定數量加密貨幣的所有權即可。但本質上與PoW一樣,需要網絡中的節點進行挖礦運算。股份授權證明機制(delegated proof of stake,DPOS),是一種新的保障網絡安全的共識機制,類似于董事會投票,通過全體節點選出具有代表資格的一定數量的節點進行確認區塊、維持系統有序運行。同時全體節點也具有罷免代表的權利,從而實現實時民主。DPOS可以大大縮小參與驗證和記賬節點的數量,從而達到秒級的共識驗證。Pool驗證池是在傳統分布式一致性技術的基礎上建立的,輔以數據驗證機制,是當前區塊鏈廣泛使用的一種共識機制。但其也存在一些不足,該共識機制實現的分布式程度不如PoW機制等[8]。
分布式賬本是基于計算能力和密碼學的突破,并結合一些新的有趣算法的發現和使用,所形成的一種由大型網絡中的全部參與者共享、復制和同步的數據庫。該分布具有唯一性:不通過某個中心機構與各節點通信完成記錄,而是有各個節點獨立地構造和保持。網絡中的每個用戶處理同一個事務,得出各自結論,然后對結論進行投票,采用少數服從多數的方式,得到最終結論,一旦達成共識,分布式賬本就會更新,所以節點都會保留自己的賬本副本。
分布式賬本技術顛覆傳統的賬本模式。第一,分布式賬本是基于分布式共識算法建立的,其記錄的非簡單的一串數字,而是數據流;第二,記賬方法屬于第三方記賬;第三,共享記賬,所有節點在同一賬本上共享及共同管理賬目信息;第四,它是一種不僅可以記錄資金流,同時也可以記錄信息流的全信息賬本。
深度學習算法通過對海量數據進行分割,提取出大量的隱性元素,并根據多維標簽對數據進行分類,得到具有參考意義的摘要信息。根據深度學習算法可以設計一種針對數字作品的自動定價模型。模型架構如圖2所示。

圖2 自動定價模型架構
把數字作品的相關特征輸入模型的輸入層,然后對不同類型的數據進行處理和嵌入。具體方法是先將數字作品標題和數字作品描述這種非結構化數據進行預處理,即分詞操作,獲得每個單詞的索引,然后將每個詞的索引轉換為嵌入層中相應的詞向量。對于標題長度和描述長度等這種結構化數據則轉化為相應的數值,在嵌入層中轉化為對應的嵌入向量[9]。
通過雙向門控循環單元[10](bi-directional gated recurrent unit,BiGRU)對得到的數字作品標題和數字作品描述的詞向量序列中的文本語義進行建模,再結合其他輸入數據的詞嵌入進行拼接得到完整的矩陣[11],最后使用深度人工神經網絡進行特征的提取和組合[12-14]。
區塊鏈作為一種去中心化數據庫,其數據是存儲在每一個區塊中,雖然區塊鏈的賬本在每個節點中都留有副本,但是區塊鏈上的存儲空間仍舊是極其寶貴和有限的。存儲較大內容的數據會占用區塊鏈的存儲空間。因此對于數字作品這類可能占用空間較大的數據,采用鏈接存證的方式將其存儲在區塊鏈上。
鏈接存證是將數字作品的內容的哈希值和數字作品的URL地址一同進行保存上鏈[15]。數字作品內容的哈希值通常稱為“數字指紋”,因為哈希值的長度是有限的,無論內容多大,其哈希值長度是不會改變的,因此存儲這樣一個哈希值對區塊鏈來講毫無壓力。雖然數字指紋可以驗證數字作品是否被篡改,但無法查看到其原文是什么,因此將數字作品的URL地址與數字指紋一同上鏈,這樣既能減小區塊鏈的存儲壓力,驗證數字作品真實性,同時也能夠得到原文。
區塊鏈數字作品自動定價與交易系統主要實現個人發行、管理以及交易流通數字作品的功能。根據與數字作品的關聯程度,系統業務可以分為兩類:
(1)核心業務:數字作品的登記、存儲、交易等業務。
(2)非核心業務:系統使用者的注冊、瀏覽、管理等業務。
該系統分為客戶端和區塊鏈節點服務器兩部分。客戶端主要完成非核心業務,以及遞交核心業務到區塊鏈節點服務器處理。區塊鏈節點服務器主要完成核心業務,即執行交易過程,將交易結果打包成塊,通過共識機制以后寫入區塊鏈分類賬。用戶注冊系統時,會隨機分配到一臺區塊鏈節點服務器成為該服務器中的一個節點,隨著用戶的增多,可以組成一個分布式的區塊鏈節點網絡。系統整體架構如圖3所示。

圖3 系統整體架構
與傳統的集中式管理系統相比,該系統在客戶端采用傳統架構,而區塊鏈服務器節點網絡采用分布式架構,因此具有如下優勢:
(1)節點網絡采用去中心化架構,實現每個用戶對其所有的數字作品進行自主管理,用戶之間直接交易,無需第三方信任機構。
(2)利用PoS共識機制,在一定程度上減少了數字運算帶來的消耗,不需要消耗大量能源挖礦,性能也得到了相應的提升,縮短了達成共識的時間,且與PoW有相同的容錯性,更加環保。
(3)區塊鏈節點網絡執行核心業務,廣播整個網絡交易信息,并進行一致確認,以確保交易數據的有效性和透明度。
(4)非核心業務采用傳統中心化架構,與核心業務分開管理,互不影響。
系統的邏輯層可分為應用層、服務層和區塊鏈層。應用層主要負責系統用戶注冊/登錄、數字作品注冊和交易操作。服務層連接應用層和區塊鏈層,提供一些用戶服務功能和接口等。區塊鏈層主要包括區塊鏈服務器、共識機制、網絡通信模塊等。三層結構組成一種自下而上的以區塊鏈為核心的邏輯層次,系統整體邏輯層次如圖4所示。

圖4 系統整體邏輯層次
該系統中的非核心業務與一般中心化管理系統相類似,即用戶注冊登錄等信息保存數據庫中,調用接口執行相應命令。核心業務主要有兩部分,一是數字作品的登記上鏈,用戶將數字作品在客戶端上傳存儲到區塊鏈節點區塊中,這時區塊鏈系統會接收消息并廣播全網,達成共識后,記錄該數字作品到賬本中;二是數字作品的交易流程,用戶在客戶端提交交易申請,區塊鏈系統接收到申請后會執行交易流程,并廣播全網達成共識,記錄交易信息到賬本中,返回交易結果給客戶端。客戶端處理非核心業務,并獲取交易結果,將最終的交易信息返回給用戶。具體業務邏輯如圖5所示。

圖5 系統業務邏輯
3.2.1 用戶注冊
當用戶在客戶端注冊時,將生成一對公鑰和私鑰,私鑰用戶自己留存,公鑰由系統直接編碼形成用戶ID,記錄在客戶端數據庫中,同時將公鑰發送給某個區塊鏈服務器。區塊鏈服務器對用戶的注冊信息進行驗證,驗證通過以后,簽名并存儲用戶信息到區塊鏈中,成為鏈上的一個節點塊,區塊鏈系統廣播整個網絡,達成共識并記錄到賬本中,完成用戶注冊。
3.2.2 數字作品登記
用戶需要在客戶端對數字作品進行登記,登記信息包括:數字作品標題、數字作品描述(簡介)、作品類型和大小。系統會根據用戶輸入的數據使用自動定價模型,得到數字作品的價格,該價格不可更改。同時,還需要用戶上傳數字作品,客戶端會將數字作品進行哈希加密(SHA256),并上傳至文件存儲服務器,返回文件URL地址。然后客戶端會將數字作品的哈希值和URL地址,即數字作品的鏈式存證,提交給區塊鏈系統。區塊鏈系統收到數據后進行全網廣播、共識,并記錄到賬本中,完成數字作品登記。
3.2.3 數字作品交易
用戶提交交易申請到區塊鏈系統,系統會首先驗證交易發起者的身份,然后查詢其賬戶余額是否充足,如果余額不足則交易失敗;如果余額充足則返回交易結果。交易流程如圖6所示。

圖6 系統交易流程
系統測試主要是對系統性能和業務流程進行測試。采用黑盒測試技術對系統業務流程進行測試,模擬從用戶注冊到交易完成一系列操作,以檢驗系統業務流程是否完整。系統性能測試則采用實驗的方式,得到從并發交易開始到完成交易時,系統的交易處理率和交易平均延時。
利用三臺虛擬機搭建分布式測試環境,每臺虛擬機采用相同操作系統和系統設置。在局域網中測試了系統的性能,并采用了相同的算法機制,以減少網絡環境和算法對實驗結果的影響。
系統在一定時間內成功完成和提交的事務數與事務總數的比值即為事務處理率。系統完成一個事務所花費的平均時間就是該事務的平均延遲。計算公式如下:
事務平均延時=事務總延時/事務筆數
事務處理率=正常通過事務數/總事務數
根據測試得到的數據結果可知,在具有三個節點的分布式區塊鏈網絡中,當使用PoS共識機制時,平均事務延遲隨著并發事務數量的增加而增加,同時交易處理率隨之下降。當并發交易數在350筆時,交易處理率開始下降,交易平均延時開始增加。綜上所述,該系統在接收并發交易數據小于350筆時,系統性能達到最好的效果,此時系統的單筆交易延時為5 s~10 s。
針對傳統的中心化系統存在的信任依賴度高、透明度低、維護成本較高等缺點,設計了一種基于區塊鏈的數字作品自動定價與交易系統,在保障數字作品著作人權益的同時,能夠實現用戶之間直接交易。對系統所使用的技術及其設計框架和業務流程進行了介紹,該系統具有無需第三方信任機構、自動制定數字作品價格、使用鏈接存證等特點。最后對系統性能進行了測試和分析,由測試結果可知雖然系統可以達到預期的效果,但距離實際應用的要求仍然有著不小的距離。因此,下一步將在充分發展系統優勢的同時,解決系統所存在的問題,實現更加理想的交易處理能力。