999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

區塊鏈交易網絡研究綜述*

2021-10-21 08:09:12吳嘉婧劉潔利林丹鄭子彬
關鍵詞:用戶

吳嘉婧,劉潔利,2,林丹,2,鄭子彬,2

1. 中山大學計算機學院,廣東廣州 510006

2. 中山大學軟件工程學院,廣東珠海 519082

隨著區塊鏈技術的發展,區塊鏈加密貨幣在近年來也受到了廣泛的歡迎和關注。截至2021年1月,區塊鏈加密貨幣的總市值已超1萬億美元,其中市場占比第一的是比特幣,其市值高達7 000 億美元。在區塊鏈加密貨幣平臺上,所有交易記錄具備不可篡改的特性,并按照時間順序鏈接記錄在區塊鏈中。同時,區塊鏈加密貨幣的交易無需依賴可信第三方,具有去中心化的特點。目前,電子支付和區塊鏈加密貨幣支付是主要的兩種支付方式,現金流通的減少已成為不可扭轉的趨勢,各國亦在積極探索法定數字貨幣的發行方案。在此背景下,中國人民銀行提出了發布央行數字貨幣DCEP(digital currency electronic payment)的 計劃。央行數字貨幣的發布將一方面降低紙幣發行和流通的成本,提升交易的便利性,另一方面增強國家對交易的監管和對貨幣的控制力,從而維護國家金融體系的穩定和安全。

由于區塊鏈的開放性和透明性,包含豐富信息和完整金融活動痕跡的加密貨幣交易數據可以被公開獲取,這為金融交易數據挖掘領域提供了前所未有的機會。對區塊鏈交易數據進行分析和挖掘的主要價值有兩個:1) 通過對區塊鏈交易數據的分析和挖掘,可以廣泛探究交易系統中的用戶行為、財富分配和交易網絡的演化過程,推測加密貨幣金融市場波動的原因,作為其他金融活動的參考;2) 近年來區塊鏈系統中各種類型的網絡犯罪現象層出不窮,區塊鏈交易數據分析有助于識別其中的非法交易,為構建更健康的區塊鏈生態提供有效的監管方案,相關技術亦可作為法定數字貨幣交易監管的參考。總而言之,對區塊鏈加密貨幣交易數據進行分析不僅可以提升復雜網絡、數據挖掘等技術在金融系統中的理論價值和應用價值,而且有利于增強加密貨幣平臺的金融安全和監管。

網絡是描述現實世界中交互系統的通用語言,而復雜網絡科學被廣泛認為是分析網絡系統的有效工具。在現有的區塊鏈加密貨幣交易數據分析文獻中,有相當一部分是從網絡的角度進行研究,即在分析時先將加密貨幣系統中的對象(如賬戶、智能合約等) 抽象為節點,將對象之間的關系抽象為連邊。不同的加密貨幣平臺可能存在一些不同的交易活動,例如轉賬、智能合約的創建及調用等,因而我們可以從不同的角度對加密貨幣的交易活動進行網絡構建,然后基于網絡性質分析、節點分類、鏈路預測等網絡科學方法完成下游的數據挖掘任務。

作為一個新興的跨學科的研究領域,區塊鏈加密貨幣的交易網絡分析引起了大量學者的關注。本文旨在全面回顧和總結這一領域的現有文獻和最新技術,重點討論加密貨幣交易網絡的建模、交易網絡的分析和交易網絡上的識別問題。其中,在進行區塊鏈加密貨幣的交易網絡研究時,我們首先要將交易數據建模為交易網絡,通過交易網絡分析我們可以了解交易網絡上一些特有的性質,最后,我們可以結合交易網絡的性質為交易網絡上的識別任務設計檢測工具。本文內容的順序安排如下:第1節介紹區塊鏈交易及交易數據來源的預備知識,第2節從交易網絡建模、交易網絡分析和交易網絡上的識別技術對區塊鏈加密貨幣交易網絡的研究現狀展開綜述,第3節為本文的總結與展望。

1 區塊鏈及其交易

區塊鏈加密貨幣類型多樣,且不同加密貨幣的數據結構互不相同。具體而言,區塊鏈加密貨幣的交易主要基于以交易為中心的模型和以賬戶為中心的模型。本節將對這兩種常見的交易模型進行介紹,并且介紹區塊鏈交易數據的收集方式,從而為第2節的交易網絡分析打下基礎。

1.1 區塊鏈交易模型

區塊鏈交易可被視為加密貨幣平臺上的用戶操作。當一個新交易被用戶發起時,它將被廣播到點對點(P2P,peer-to-peer) 網絡中的所有節點,經由驗證后可被添加到區塊鏈的新區塊中。區塊鏈技術最早可追溯于中本聰在2008 年發布的比特幣白皮書[1],隨后在2009 年,第一條區塊鏈伴隨著比特幣系統的發布和挖礦操作而誕生。自比特幣誕生以來,區塊鏈技術得到了廣泛的關注,并被應用于智能金融、物聯網等多個領域[2-4]。同時,許多被稱為altcoins 的替代幣迅速出現,例如第一個去中心化的域名系統Namecoin[5];在交易確認速度上得到提升的Litecoin[6];提出采用股權證明(PoS, proof of stake) 作為工作量證明(PoW,proof of work) 的替代方案的Peercoin[7]。根據CoinMarketCap. com 的統計,到2021 年初,市場上已有超過8 000 種區塊鏈加密貨幣,總市值一度超過1 萬億美元。其他著名的加密貨幣包括Monero[8]、Zerocash[9]、EOS[10]和Libra[11]等,其中,以太坊[11]是最大的具備圖靈完備的智能合約的區塊鏈系統,其主要的貨幣被稱為Ether (簡稱ETH),是僅次于比特幣的全球第二大加密貨幣。在眾多區塊鏈加密貨幣中,它們的交易模型主要可以分為以交易為中心的模型和以賬戶為中心的模型,其中,比特幣和以太坊分別是這兩類交易模型的典型代表。

在比特幣系統中,作為一種用戶標識,比特幣地址是由用戶公鑰經過一系列單向的哈希算法得到的,單個用戶可以擁有多個交易地址。比特幣系統采用的交易模型是以交易為中心的模型,其中單個交易可以具有多輸入和多輸出,并且可以與多地址關聯。交易的輸入由一組未花費的交易輸出(UTXO,unspent transaction output) 組成,其總金額需不小于交易支付金額。交易輸入方的用戶可以指定一個新地址來接收找零,用于接收找零的地址又被稱為找零地址(change address)。此外,比特幣中沒有賬戶余額的概念,可以通過用戶錢包中UTXO 的金額總和來計算該用戶的余額。

以太坊中的交易模型是以賬戶為中心的模型,它包含兩種賬戶,即外部賬戶(EOA,externally owned account) 和合約賬戶。其中,EOA類似于銀行賬戶,它具有存款、取款和記錄一些動態狀態信息(如賬戶余額) 的功能。合約賬戶關聯著一個可執行的字節碼,其交易行為由用戶編寫的智能合約代碼所控制,并會對一些狀態信息進行維護,如字節碼哈希值及合約賬戶的余額等。與比特幣不同,以太坊中的交易是從一個賬戶到另一個賬戶的簽名數據包,它僅包含一個輸入和一個輸出。此外,以太坊交易可以完成包括轉賬、合約創建和合約調用在內的3種主要功能。根據交易發送方,以太坊交易可以分為由EOA 發起的外部交易和由合約調用觸發的內部交易。圖1給出了一個以太坊外部交易和內部交易的典型示例,其中交易1 和交易2 都是由EOA 發起的交易,因此它們是外部交易,而交易3、交易4 及交易5 是由智能合約觸發的交易,因此它們是內部交易。外部交易可能會導致許多內部交易的產生,比如在交易2中,一個EOA 調用了一個合約賬戶,繼而觸發了后續的3個內部交易。

圖1 以太坊的外部交易和內部交易Fig. 1 Examples of the external transactions and internal transactions in Ethereum

1.2 區塊鏈交易的數據源

區塊鏈加密貨幣交易網絡分析的數據源主要包括區塊鏈交易數據和標簽數據。最原始的獲取區塊鏈交易數據的方法是通過區塊鏈客戶端(例如BitcoinCore和Geth) 去訪問區塊鏈網絡并同步區塊數據,從而獲得區塊鏈的原始數據。但是,對于許多加密貨幣而言,它們的原始區塊鏈數據以二進制格式存儲,需要解析為可讀的格式以進一步分析。因此,我們可以根據區塊鏈數據結構構建解析器,從獲取的原始數據中提取交易記錄。另外,一些區塊鏈客戶端為用戶提供了JSON-RPC接口以便獲取交易數據。然而,對于一些啟用智能合約功能的區塊鏈系統,其內部交易記錄并未存儲在區塊鏈系統中。這些內部交易記錄可以通過區塊鏈瀏覽器檢索獲取,也可以通過使用自定義客戶端重演所有外部交易來獲取有關內部交易的詳細信息。部分客戶端亦提供獲取內部交易信息的接口,例如以太坊OpenEthereum 客戶端的“trace” 模塊能提供在以太坊虛擬機中生成的詳細運行時數據,是訪問內部交易記錄的便捷工具。

在一些交易網絡挖掘任務中,利用標簽信息能進一步輔助方法的設計和驗證。但是,區塊鏈用戶在交易過程中無需暴露真實的身份信息,因此很難找到其對應的標簽信息。隨著區塊鏈生態的日益成熟,我們可以從一些區塊鏈論壇、區塊鏈瀏覽器上找到部分人工標記的標簽數據。例如,Walletexplorer. com 是一個具有地址自動聚類能力,能提供豐富地址標簽的智能區塊鏈瀏覽器;比特幣論壇Bitcoin Forum 記錄了一些跟比特幣搶劫、盜竊、詐騙有關的地址①https://bitcointalk.org/index.php?topic=83794.0;區塊鏈瀏覽器Etherscan 的標簽詞云模塊②https://etherscan.io/labelcloud提供了由用戶標記的以太坊賬戶標簽;此外,CryptoScamDB. org提供了一個開源數據集,用于跟蹤與區塊鏈系統有關的惡意網址及相關加密貨幣地址。

此外,一些研究者還發布了經過清洗和整理的區塊鏈數據集以供研究。例如XBlock. pro 是一個旨在助力區塊鏈良性發展和數據研究的數據集共享平臺,它收集了當前主流的區塊鏈加密貨幣的相關數據,并對數據進行了清洗和歸類,是目前學術界數據量最大、覆蓋面最廣的區塊鏈數據平臺之一,可支持科研人員進行區塊鏈鏈上數據分析、區塊鏈反欺詐、智能合約分析、區塊鏈性能分析等方面的研究。

比特幣是最典型的采用以交易為中心的模型的區塊鏈交易系統,目前已有一系列的對比特幣交易數據進行網絡建模的工作。文獻[12] 首先介紹了比特幣交易網絡建模的概念,并提出將比特幣的交易過程建模為將交易作為節點的交易網絡和將用戶作為節點的用戶網絡,分別代表交易之間和用戶之間的比特幣資金流。在比特幣交易過程中, 由于交易的輸入是來自先前交易的UTXO,因此交易網絡的構建非常直觀及簡單,即用節點代表交易,用包含金額和時間戳信息的有向邊表示比特幣資金流。考慮到用戶擁有多個比特幣地址的可能,文獻[12] 首先將屬于相同用戶的地址以聚類的方式進行聚合,然后構建以用戶為節點、用戶之間的資金流關系為邊的用戶網絡。這兩種比特幣交易網絡建模方法被廣泛應用于后續區塊鏈交易網絡分析的研究中[13-14]。此外,文獻[15] 將比特幣交易數據建模為以交易和地址為節點的帶權有向超圖,可以表示地址和交易之間的輸入和輸出關系。

以太坊是基于以賬戶為中心的交易模型的區塊鏈系統的典型代表。在以太坊的相關研究中,文獻[16] 介紹了3種以太坊交易數據網絡建模方式,即資金流網絡、智能合約創建網絡和智能合約調用網絡。在這3個網絡中,EOA 和合約賬戶均被抽象為網絡的節點,但是3個網絡中邊的語義有所不同。在資金流網絡中,邊表示資金流向,而在智能合約創建網絡和智能合約調用網絡中,邊分別表示合約的創建和合約調用。同時,只有合約賬戶才能作為智能合約創建網絡和智能合約調用網絡中邊的終點。考慮到兩個賬戶之間會發生多個交易,文獻[17] 提出將以太坊交易記錄建模為時序多重網絡。其中,賬戶被表示為節點,每個交易被表示為一條由交易發送方指向交易接收方的有向邊,每條邊包含了時間和金額信息,具體如圖2所示。

圖2 基于以太坊交易的時序加權多重有向網絡[17]Fig. 2 Temporal weighted multidigraph in Ethereum[17]

作為網絡分析的基本步驟,網絡建模直接影響上層算法的設計和效果,因此它非常關鍵。目前的交易網絡建模方式有許多種,但是在進行網絡構建時,我們會面臨區塊鏈交易操作種類繁多、信息多源異構的問題及不同的下游任務。因而如何找到適用于各種區塊鏈數據和不同區塊鏈任務的通用建模方式和建模標準是一個重要的研究方向。

2 研究現狀

現有的區塊鏈加密貨幣交易網絡分析工作具體可以總結為3個緊密相關且逐層遞進的部分:交易網絡建模、交易網絡分析和交易網絡上的識別技術。其中,交易網絡建模主要涵蓋將交易數據以網絡形式存儲的方法和討論;交易網絡分析從網絡科學的角度對交易網絡的特有屬性進行了討論;交易網絡上的識別技術主要包括賬戶地址背后的歸屬識別、交易模式識別和區塊鏈上非法活動的識別。本節將分別對這3個部分的研究現狀進行介紹和總結。

2.1 交易網絡建模

區塊鏈加密貨幣交易網絡研究的第一步是根據區塊鏈的交易特性將區塊鏈交易數據建模為網絡。目前區塊鏈系統的交易模型可大致分為兩類,即以交易為中心的模型和以賬戶為中心的模型。基于這兩種不同的交易模型的區塊鏈系統,其交易數據的網絡建模亦有很大差別。

2.2 交易網絡分析

復雜網絡理論已經被廣泛地證明是一種建模和描述各類復雜系統的有效工具。近20 年來,復雜網絡相關的研究者提出了各種各樣的研究指標以對網絡特征進行描述和度量。本小節將簡要介紹一些重要的網絡指標以及區塊鏈在這些指標上的表現,以助了解區塊鏈加密貨幣交易網絡的特有性質。

1) 節點和邊的數量。網絡中節點和邊的數量是衡量網絡規模和密度的常用指標。在對區塊鏈加密貨幣交易網絡進行分析的過程中,Maesa等[18]觀察到比特幣交易網絡的網絡規模增長速度比線性增長更快。Alqassem 等[19]也注意到了這一現象,并發現比特幣交易網絡正在變得越來越密集,且其度分布遵循冪律分布。Chen 等[16]統計了以太坊的資金流網絡、智能合約創建網絡和智能合約調用網絡中節點和邊的數量,發現在以太坊中用戶的轉賬行為比創建智能合約及調用智能合約的行為更頻繁。

2) 度分布。在無向網絡中,節點的度是指節點的邊數。而在有向網絡中,節點的度分為入度和出度,起始于節點的邊的數量稱為該節點的出度,終止于節點的邊的數量稱為該節點的入度。度分布可以表示網絡中節點度的概率分布,計算公式如下

在復雜網絡中,一個有趣的現象是許多從真實系統建模而來的網絡的度分布符合冪律分布,即滿足

其中C和α是常數,k是度的值。Kondor等[20]發現比特幣地址網絡入度和出度分布都具有高度異構性。Motamed 等[21]對5 種加密貨幣的交易網絡進行了度分布分析,發現這些交易網絡的度分布都符合冪律分布,且冪律參數α經過一定的波動后會收斂到穩定狀態。

3) 路徑長度。網絡中兩個節點之間的路徑長度定義為連接這兩個節點時必須經過的最少的邊數,通常可以采用廣度優先搜索的方法找到兩個節點間的最短路徑。網絡直徑是網絡中所有節點對最短路徑中值最大的路徑長度。Lischke 等[22]指出,不同國家比特幣用戶子網絡的平均最短路徑在同一范圍內。根據交易網絡直徑隨時間的變化,Gaihre 等[23]推斷出比特幣用戶對系統匿名性的擔憂。Alqassem 等[19]分析了比特幣交易網絡直徑增加的4個可能原因,即匿名性、竊賊、找零地址和比特幣混幣服務。此外,許多研究通過計算平均最短路徑來評估比特幣和以太坊中的 “小世界”現象[4]。

4) 聚類系數。聚類系數描述了網絡中節點的聚集程度。聚類系數的兩種度量方法包括局部聚類系數和整體聚類系數。局部聚類系數量化了共享同一鄰居的兩個節點本身也是鄰居的概率。全局聚類系數是網絡中所有長度為2的路徑中閉合路徑所占的比例[24],可通過以下公式計算

其中n是節點數,kv是無向網絡中節點v的度數,tv是包含節點v的三角形數。Baumann 等[13]觀察到比特幣用戶網絡具有較高的平均聚類系數和典型的 “小世界” 特性。在以太坊的資金流網絡中也發現了類似的結果[16]。然而,最近的研究表明,Ripple 和Namecoin 的交易網絡的聚類系數相對較小[8]。

5) 中心性。網絡中計算節點中心性的方法有很多種。其中,最簡單的中心性度量是節點度,其他被廣泛應用的中心性度量包括特征向量中心性、katz中心性、PageRank算法、介數中心性和接近度中心性。Lischke 等[22]使用度中心性識別比特幣交易網絡中的主要樞紐。 Chen 等[16]通過PageRank 算法獲得了資金流網絡、智能合約創建網絡和智能合約調用網絡中最重要的10 個節點。他們發現,交易所等金融應用在資金轉移、合約創建和合約調用方面發揮著重要作用。

6) 同配性系數。同配性系數是用來衡量節點是否趨向于和與之相似的其他節點進行連接的指標。度同配性系數表示網絡中的節點是否愿意與具有相似度的其他節點進行連接,其最大值是1,最小值是-1。值為正表示網絡是同配性的,值為負說明網絡中節點對的度是負相關的,也稱為異配,取0代表網絡結構不存在相關性。一系列的研究表明,許多區塊鏈系統,如比特幣、以太坊、萊特幣和達世幣,其加密貨幣交易網絡是異配的。

7) 連通分量。在無向網絡中,定義一個連通分量為一個子圖,該子圖中每對節點間均有一條路徑。而在有向網絡中,連通分量的概念包括弱連通分量和強連通分量。弱連通分量的定義類似于無向網絡中連通分量的定義。強連通分量是指對于所有節點集,每對節點之間至少存在一條有向路徑。在計算弱連通分量時,有向網絡的邊的方向信息將被忽略。對連通分量進行統計和分析有助于我們了解網絡結構,其中在區塊鏈交易網絡的分析上,Gaihre 等[23]觀察到,比特幣交易網絡中連通分量的數目在2011 年之前激增,但后來有所減少。他們分析得到這是因為許多交易所在2010年和2011年前后興起,促進了比特幣的流通。文獻[19] 提到,大多數比特幣地址包含在比特幣交易網絡的最大連通分量中,這個性質與其他網絡類似。Guo 等[25]發現,在以太坊中連通分量的大小分布可用冪律分布來近似,并且存在重尾特性。

8) 社區。社區是內部節點連接緊密而與外部節點少有連接的網絡模塊。一個網絡可以經過社區檢測算法劃分為多個社區,不同的社區可以近似反映網絡中功能或者結構的劃分。 Alqassem等[19]研究了比特幣中社區結構的性質,發現社區規模的分布可以用指數截斷的冪律分布來擬合,且大多數比特幣社區都具有樹狀結構。Moreno-Sanchez 等[26]研究了Ripple 中社區是如何形成的,他們發現用戶社區是動態的,是通過連接到同一地理區域的網關而形成的。

9) 網絡模體。網絡模體是指在復雜網絡中出現次數顯著高于在隨機網絡中出現次數的子圖模式,它是揭示網絡中高階組織的有效工具,被稱為復雜系統中的基礎構件。Moreno-Sanchez 等[26]從最常見的模體出發,將錢包分為網關、交易所和用戶,并分析得出網關是Ripple 中的關鍵角色,這與低聚類系數和異配性的網絡特性是一致的。Bai 等[27]研究了以太坊資金流網絡中13 種包含3個節點的模體,并將這些模體分為閉合的和開放的三角形。他們發現雖然閉合的三角形數量有所增加,但其比例呈下降趨勢。Paranjape 等[28]觀察到,比特幣中循環三角形模體的比例比Stack-Overflow等任何其他數據集都要高得多。

除了上述眾所周知的網絡特性外,一些研究者還從幾個新的角度對區塊鏈交易網絡進行了研究。例如,不同于以往只關注全局網絡性質的研究,Ron 等[29]主要研究比特幣交易網絡上的用戶行為,包括用戶如何使用比特幣,如何在不同賬戶之間轉移比特幣,并分析了比特幣系統中發生的最大交易。他們發現大部分比特幣處于休眠狀態,且網絡中有許多看起來奇怪的結構,如二叉樹結構、長鏈。Lischke 等[22]結合鏈下數據(包括商業標簽、IP 地址和地理位置) 對比特幣系統的用戶網絡和經濟狀況進行了分析。他們深入了解了不同國家的業務分布和交易分布,以及不同的業務和不同的國家分別涉及的交易子網絡的網絡性質。Maesa 等[30]分析了比特幣用戶網絡中度分布的異常值,發現了一些異常的交易模式。通過網絡分析,Gaihre 等[23]回答了比特幣用戶是否關心匿名性的問題,他們發現大多數用戶對匿名性的關注度很弱,但一個重要的影響因素是用戶擁有的比特幣的價值。Chen 等[31]通過交易網絡分析研究以太坊ERC20 代幣的創建者、持有者和代幣交易活動。Liang 等[32]研究了3 種區塊鏈加密貨幣的交易網絡性質,并從這些性質分析了這3種加密貨幣的競爭力。

盡管目前的研究已經充分涵蓋不同時間段主流區塊鏈加密貨幣交易網絡的網絡性質分析,但是在網絡性質的時序分析及交易網絡的生成和演化方面,現有研究討論非常初步。同時,鮮有研究揭示區塊鏈加密貨幣交易網絡與傳統引文網絡、社交網絡的異同。未來可對區塊鏈加密貨幣交易網絡的網絡性質進行更深入的討論,并結合交易網絡的特性輔助下游任務的進行。

2.3 交易網絡上的識別技術

由于區塊鏈交易無需真實的用戶身份信息,許多區塊鏈加密貨幣平臺已成為各種網絡犯罪和非法金融活動的溫床。基于區塊鏈交易網絡的發展的檢測和識別技術,可以幫助我們識別區塊鏈上的異常交易行為。接下來將從實體識別、交易模式識別和非法活動檢測展開介紹。其中,實體識別可以幫助找到屬于同一用戶或組織的賬戶地址,它通常是后續分析任務的基礎,交易模式識別對不同類型用戶的交易行為進行區分與識別,為后續的非法活動檢測提供依據。

2.3.1 實體識別大多數區塊鏈加密貨幣平臺創建新的賬戶或地址的成本很低,且無需驗證用戶真實的身份信息。因而用戶可以很方便地使用多個賬戶地址來增強區塊鏈交易活動的隱蔽性,這種操作在涉及區塊鏈交易的犯罪案例中很常見。Ron 等[29]第一次提出用 “實體” 來描述這種多個賬戶地址的擁有者,其中實體可以是一個用戶,也可以是一個組織。為了挖掘區塊鏈賬戶地址背后真實的身份信息,首先要對屬于同一個實體的多個賬戶地址進行關聯,又被稱為實體識別。現有的實體識別方法大致分為3種類型:基于交易屬性的實體識別、基于行為的實體識別和基于鏈下信息的實體識別。

基于交易屬性的實體識別主要利用區塊鏈交易的特有屬性來判斷賬戶地址是否屬于同一實體。在比特幣系統中,交易具有多個輸入和多個輸出,由于花費一個地址的比特幣需要提供該地址的私鑰,正常情況下用戶不會共享他們擁有的比特幣地址的私鑰。因此,Reid 等[12]認為比特幣交易的多個輸入地址處于同一實體控制之下,并通過這種方法對比特幣系統的地址進行實體識別,這種方法被稱為多輸入啟發式方法。Harrigan 等[33]進一步調查了這種啟發式方法的有效性,并發現多輸入啟發式方法可能會導致漏檢和誤判誤差。而兩種誤差可能是由于地址重用、超級集群和持續增長的地址簇等多方面因素造成的。Remy等[34]結合多輸入的啟發式方法和社區檢測技術提出了一種新的實體識別方法,該方法能以精確度為代價增加召回率,因而在實際應用中可以自行進行調整。比特幣系統中利用交易屬性進行實體識別的另一種典型方法是找零地址啟發式方法,該方法由Reid 等[12]提出。在比特幣交易中,會使用額外的找零地址接收找零,因此我們可以識別交易輸出方的找零地址并將其與對應的輸入地址進行關聯。Klusman 等[35]指出,多輸入啟發式和找零地址啟發式方法并不適用于以太坊等基于以賬戶為中心的交易模型的區塊鏈系統。為解決這個問題,Victor[36]提出了3 個在以太坊上的啟發式規則:存款賬戶重復使用,空投多參與以及自我授權。存款賬戶重復使用規則是以交易所為背景設計的。事實上,交易所通常會為用戶生成存款賬戶,一旦用戶將資金轉入其存款賬戶,這筆錢稍后會自動轉入屬于交易所的熱錢包。當存款賬戶被重復使用,就可以將使用相同存款賬戶的一系列其他賬戶識別為同一個實體。空投多參與規則為空投情況而設計,其中,空投是一種通過分發代幣來為ICO籌集資金的常用營銷方式。由于一些用戶將注冊多個賬戶參加空投并將代幣匯總到一個賬戶,因此可以將這些賬戶識別為同一實體。自我授權規則基于以下假設:代幣消費者和代幣所有者在調用授權函數時可以被識別為同一實體。經過實驗分析和驗證,Victor[36]認為存款賬戶規則是實驗中最有效的方法。

基于行為的實體識別是利用用戶在交易過程中特有的行為偏好來判斷多個賬戶地址是否屬于同一實體,因而一些研究者將實體識別問題視為基于交易行為特征的分類或聚類問題。Androulaki等[37]考慮了一些交易行為特征,包括交易時間、交易方的索引、交易金額等,并通過基于特征的聚類揭示了近40%的用戶身份。Jourdan等[38]探索了5種類型的特征,包括地址特征、實體特征、時間特征、中心性特征和模體特征,并研究了這些特征在比特幣地址分類任務的效果。Harlev 等[39]將交易行為特征作為監督學習的輸入,以實現比特幣地址的去匿名。此外,Shao 等[40]通過網絡嵌入的方法將比特幣地址在交易網絡中的交互活動轉換為低維特征向量,并結合深度學習方法進行實體識別。

區塊鏈鏈下數據指未存儲在區塊鏈中的相關數據,它可以用來協助去匿名化過程。典型的鏈下數據包括節點的IP 地址、公開的標簽等。一些用戶會在論壇整理發布帶欺詐性的交易地址、混幣服務地址等,這為我們創造了一個通過爬蟲采集這些信息的機會。同時,如果一位用戶暴露了自己的地址信息,可以通過分析用戶的交易行為找到其所擁有的其他地址。Reid 等[12]首先在實體識別中應用了這種方法,并利用鏈下信息識別了一些參與盜竊的實體。根據比特幣論壇上提供的鏈下信息,Fleder 等[41]將比特幣地址鏈接到其對應的真實身份,并發現一些論壇用戶參與過暗網交易和賭博活動。M?ser 等[42]通過使用混幣服務來獲取相關的地址信息,并通過分析這些地址信息的交易構建了混幣服務識別模型。

2.3.2 交易模式識別在區塊鏈加密貨幣生態中,不同用戶的交易行為大相徑庭,例如交易所的交易活動遠比普通用戶的交易活動活躍。交易模式識別旨在揭示交易網絡的特殊結構并進一步分析用戶的交易行為,相關方法可總結為:可視化方法、跟蹤分析和模體分析。

網絡可視化是一種強大的分析方法,可直觀了解交易網絡及其內部的交易模式。McGinn 等[43]通過可視化某些特定區塊中的比特幣交易網絡,發現了包括洗錢和拒絕服務攻擊在內的異常交易模式。Chen 等[44]對異常地址的每日交易網絡子圖進行可視化,發現了一些與比特幣市場價格操縱相關的異常交易模式,如自環、雙向、三角形等。McGinn等[45]將比特幣交易的源區塊和目標區塊視為鄰接矩陣進行可視化,并發現這種可視化方法很容易揭示出一些重復交易行為,方便將具有相似行為的交易關聯在一起。

在已知特定賬戶地址身份的情況下,對賬戶地址的交易進行跟蹤分析有利于總結出該類型賬戶的交易模式。Maesa 等[30]分析了比特幣交易網絡中度分布的離群點,通過對這些離群點進行分析,他們注意到一種類型刷屏行為的交易。經過進一步分析后,他們總結出這些異常的刷屏交易可能是區塊鏈上的假名攻擊、垃圾郵件攻擊或者廣告行為。Ron 等[29]跟蹤了比特幣系統中超過50 000 BTC的大額交易,并分析了這些交易在長鏈和分叉合并模式下背后隱藏的交易意圖。

分析加密貨幣的交易模式的一系列研究是通過對交易網絡模體的分析展開的。Ranshous 等[46]使用有向超圖對比特幣交易網絡進行建模,并在有向超圖中引入網絡模體來揭示交易所的交易模式。Wu 等[47]在時序有向的比特幣交易網絡中提出了時序異構模體的概念,并將其用于比特幣混幣服務的地址檢測。Zola 等[48]使用網絡模體特征設計了一種實體識別方法,同時,他們也研究了不同實體交易模式隨著時間推移的相似性,并探索是否有一些交易模式在不同批次的比特幣交易中重復進行的問題。Jourdan 等[38]利用網絡模體來揭示實體的交易模式信息,并通過實體識別任務說明交易模式可以被看作實體的指紋。

2.3.3 非法活動檢測區塊鏈系統的去中心化和交易無需真實身份的特性不僅吸引了大量的投機者,也吸引了許多犯罪分子的注意,因而區塊鏈也成為了詐騙、黑市貿易、洗錢等違法犯罪活動的溫床。與傳統金融場景不同,區塊鏈系統在進行交易之前不能通過執行 “了解你的用戶”(KYC,know your customer) 流程來驗證用戶的身份。但是,區塊鏈系統中公開和不可篡改的交易記錄為我們提供了非法活動的檢測機會。接下來,我們將重點回顧基于交易網絡上的識別技術進行的區塊鏈金融詐騙和洗錢的檢測工作。

區塊鏈系統上的金融詐騙給加密貨幣生態的健康發展帶來了巨大威脅。在Vasek 等[49]的研究中,報告了包含龐氏騙局、采礦詐騙、詐騙錢包和欺詐性交易在內的多種比特幣詐騙方式,并發現在192 起與比特幣交易有關的詐騙案中,1. 3 萬名潛在受害者損失了約1 100 萬美元。此外,其他區塊鏈系統中也發現了豐富的欺詐類型,如ICO詐騙[50]、蜜罐釣魚合約詐騙[51]等。由于區塊鏈詐騙不僅損害了交易人和投資人的利益,同時也影響了區塊鏈交易的可靠性和人們對區塊鏈的信任,一些研究者展開對區塊鏈詐騙檢測的研究。目前的檢測方法不僅包含一些基于特征提取的方法[52],亦包括了一些基于智能特征提取的檢測方法。文獻[53] 提出了一種基于圖卷積神經網絡的Edge-Prop 方法來學習大規模交易網絡中節點和邊的嵌入。與傳統的基于圖卷積神經網絡的方法不同,EdgeProp 能學習到多重邊的邊信息,進而有效地識別以太坊上的非法賬戶。Wu等[54-55]提出了兩種基于隨機游走的嵌入方法,它們在學習節點嵌入時考慮了交易網絡的交易量、時間戳和多重邊等特性,并在下游釣魚檢測任務中驗證了方法的有效性。

在區塊鏈系統中,洗錢也是一個需要得到監管和重視的問題。洗錢通常分為3 個步驟:首先,將黑錢注入金融體系;其次,將黑錢混入合法的貨幣中,與非法來源脫鉤;最后,這些黑錢被犯罪分子整合和收回,并處于一種看似合法的狀態[56]。由于區塊鏈具有去中心化、交易匿名的特性且存在許多可用的隱私保護技術,加密貨幣已成為洗錢過程中隱藏非法資金流向的選擇之一。著名的加密貨幣情報公司Elliptic 在關于比特幣的洗錢報告中指出,交易所、混幣服務和賭博網站是比特幣洗錢的主要流向[57]。因此,近年來對加密貨幣交易網絡上的洗錢檢測的研究,主要集中在混幣業務和交易所的可疑交易模式上。比特幣混幣服務最初是為了通過混淆交易輸入方和接收方的關系來增強交易的匿名性,使資金來源更加不可追蹤,但它同時也成為了協助非法洗錢的一大利器。Prado-Romero 等[58]首先強調了混幣服務檢測的重要性,并將混幣服務檢測視為一個社區離群點檢測問題來解決。因為一旦檢測到混幣服務,我們就可以進一步分析與這些服務交互的賬戶地址是否參與了非法活動。然而,這項工作的解決方案缺乏對不同類型混幣服務的自動適用能力。Wu 等[47]進一步提出了一種基于網絡模體檢測方法,從而自動刻畫不同混幣服務的交易模式。除了混幣服務識別以外,Hu等[59]通過特征分析對比特幣洗錢交易模式進行特征刻畫,并利用deepwalk[60]和node2vec[61]等網絡嵌入方法,構建了識別洗錢交易的分類器。Battista 等[62]提出了純度的概念以理解比特幣是何時以及如何混幣的,并建立了一個名為BitConeView 的比特幣資金流可視化系統。Ranshous 等[46]指出,交易所提供了匿名身份與真實身份之間的聯系,因此研究交易所的交易模式是反洗錢的重要步驟。他們將交易所涉及的可疑洗錢模式用網絡模體進行刻畫,并利用網絡模體作為交易所的識別特征。

除了金融詐騙和洗錢問題,研究者還基于交易網絡識別技術提出了其他檢測區塊鏈非法活動的方法。Weber 等[57]提供了一個比特幣系統上的Elliptic 數據集,其中包含超過20 萬個交易節點、23. 4萬條交易信息以及166個節點特征。此數據集中的交易根據真實實體信息被標記為合法類別(如交易所、錢包提供商、礦工和合法服務)、非法類別(如詐騙、惡意軟件、恐怖組織和勒索軟件) 和未標記類別。基于該數據集,研究者使用EvolveGCN[63]方法對交易進行識別和分類。由于加密貨幣在勒索軟件支付中的廣泛應用,Akcora等[64]提出了一種基于拓撲信息的勒索軟件檢測框架,用于檢測已知勒索軟件和新出現的勒索軟件的地址。Conti等[65]從比特幣支付的角度研究了最近的勒索軟件及其經濟影響,并結合共同輸入交易和找零地址信息提出了兩種聚類啟發式算法,以識別與勒索軟件相關的地址。在對黑市調查過程中,Foley等[66]對比特幣中的非法交易活動進行了量化,并基于社區檢測和分類模型提出兩種識別方法。此外,作者通過分析結果指出約有一半的比特幣交易與非法活動有關。

總而言之,現有的這些交易網絡識別技術不可避免地會受到區塊鏈上隱私保護技術的干擾,這兩類技術就像矛與盾的較量和比拼,互相促使各自的技術創新與發展。目前令人棘手的區塊鏈非法活動檢測任務也僅僅做到了事后檢測,可實際應用的非法活動預警和非法資金追蹤與攔截方案較少。因此就未來而言,區塊鏈交易網絡上的識別技術仍有非常大的發展空間和應用潛力。

3 總結與展望

由于區塊鏈系統的透明性和開放性,區塊鏈加密貨幣的大多數交易數據可被公開獲取。通過將加密貨幣系統中不同的對象抽象為節點,并將對象之間的交易關系抽象為連邊,區塊鏈加密貨幣的交易數據可被建模為大規模的復雜網絡。在過去的10 年里,研究者們已從網絡的角度進行了大量有關區塊鏈交易分析的研究。本文對區塊鏈交易網絡研究的相關工作進行了全面的回顧,并將現有技術和結果歸納為3個緊密相關且逐層遞進的部分,即區塊鏈加密貨幣的交易網絡建模、交易網絡分析和交易網絡上的識別技術。從總體來看,目前的區塊鏈加密貨幣分析領域已有了初步的發現和理論成果,同時也推動了復雜網絡理論和圖挖掘技術的發展。通過對現有工作的總結與思考,我們提出一些在區塊鏈加密貨幣交易網絡分析領域未來的研究方向:

1) 動態信息建模與處理。現有的區塊鏈交易網絡分析和挖掘工作通常會忽略時間信息,但是,區塊鏈網絡是一個不斷增長的網絡,新交易的發生伴隨著新節點或新連邊的出現。這些新節點和新連邊可能會改變原有網絡的性質,同時也讓基于原有交易網絡設計的數據挖掘模型的效果受到影響。因而,未來的工作可以進一步探索如何對動態的區塊鏈交易數據進行建模,分析網絡的動態特性和演化規律,設計能自適應網絡變化的識別技術。

2) 交易網絡數據擴充。區塊鏈加密貨幣交易網絡的數據擴充將是區塊鏈交易數據分析中值得期待的一大研究方向。一方面,近年來許多用于提升區塊鏈可擴展性的鏈下交易方案已被提出并得到了初步的應用,比如閃電網絡、雷電網絡等,而這些方案會使我們無法獲取全部的區塊鏈交易數據。另一方面,區塊鏈加密貨幣的交易數據存在著標簽數量少、各類別標簽數量不均衡的問題。通過網絡數據擴充,可以還原部分缺失的網絡結構信息,對交易網絡進行有效的信息補全,并且在一定程度上緩解標簽獲取困難的問題,從而輔助區塊鏈交易數據分析。

3) 交易審計與追蹤。在區塊鏈交易中,用戶無需使用真實的身份信息,且可利用一些服務和工具來增強交易的匿名性。雖然這能為用戶更好地實現隱私保護,但也吸引了很多犯罪分子利用區塊鏈交易來逃避監管。現有的交易去匿名和追蹤技術非常有限,因此,如何利用交易網絡分析在強匿名性、去中心化的區塊鏈上實現交易的可審計、非法交易的可追蹤與可攔截是一個重要的研究方向,不僅可以加強區塊鏈交易的合規性,還可以減少用戶和潛在投資者的財務風險。

猜你喜歡
用戶
雅閣國內用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網新媒體用戶之間有何差別
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應用
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 色悠久久久久久久综合网伊人| 激情综合婷婷丁香五月尤物| 亚洲一道AV无码午夜福利| 无码乱人伦一区二区亚洲一| 国产日韩欧美中文| 国产精品成人第一区| 国模私拍一区二区| 99视频免费观看| yy6080理论大片一级久久| 亚洲AV成人一区二区三区AV| 中文精品久久久久国产网址| 国产在线第二页| 青青青国产在线播放| 午夜视频免费试看| 欧美色综合久久| 日韩精品成人网页视频在线| 在线国产你懂的| 精品无码专区亚洲| 伊人色在线视频| 免费a级毛片视频| 一本一道波多野结衣av黑人在线| 亚洲欧美成人| 亚洲第一成人在线| 青青草欧美| 丁香六月激情综合| 亚洲天堂精品在线| 茄子视频毛片免费观看| 欧美视频在线第一页| 亚洲一区波多野结衣二区三区| 国产精品污污在线观看网站| 成人国产精品网站在线看| 就去色综合| 国产在线观看91精品| 九九这里只有精品视频| 国产综合欧美| 久久精品中文字幕免费| 亚洲开心婷婷中文字幕| 91亚洲精选| 国产精品亚洲综合久久小说| 国产高清在线丝袜精品一区| 不卡国产视频第一页| 国产成人综合亚洲欧洲色就色| 视频二区国产精品职场同事| 免费观看国产小粉嫩喷水| 噜噜噜久久| 亚洲一区二区三区中文字幕5566| 亚洲中文字幕在线一区播放| 91色在线观看| 一区二区日韩国产精久久| 91麻豆精品国产高清在线| 污网站在线观看视频| 国产第一福利影院| 成人免费一区二区三区| 日本国产在线| 中国国语毛片免费观看视频| 成人免费网站在线观看| 亚洲精品中文字幕午夜| 国产成人无码AV在线播放动漫| 在线观看亚洲成人| 成人福利在线视频免费观看| 精品一区二区三区水蜜桃| 拍国产真实乱人偷精品| 久久人人97超碰人人澡爱香蕉| 亚洲一级毛片免费看| 亚洲视频黄| 国产在线观看91精品亚瑟| 在线欧美日韩| 99久久精品国产麻豆婷婷| 中文字幕亚洲专区第19页| 久久综合久久鬼| 中文字幕永久在线观看| 亚洲小视频网站| 九九这里只有精品视频| 国产国产人成免费视频77777| 美女高潮全身流白浆福利区| jijzzizz老师出水喷水喷出| 国产91线观看| 99精品免费在线| 香蕉国产精品视频| 广东一级毛片| 都市激情亚洲综合久久| 亚洲综合婷婷激情|