朱會(huì)娟,陳錦富,李致遠(yuǎn),殷尚男
(1.江蘇大學(xué)計(jì)算機(jī)科學(xué)與通信工程學(xué)院,江蘇 鎮(zhèn)江 212013;2.江蘇省工業(yè)網(wǎng)絡(luò)安全技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 鎮(zhèn)江 212013)
科技的飛速發(fā)展促使金融行業(yè)從實(shí)體金融走向互聯(lián)網(wǎng)金融,反洗錢的外部環(huán)境和內(nèi)在邏輯均發(fā)生了深刻而復(fù)雜的變化。尤其是隨著區(qū)塊鏈技術(shù)的出現(xiàn),以比特幣為代表的虛擬“數(shù)字貨幣”涌入金融市場(chǎng)[1-2]。借助比特幣實(shí)現(xiàn)低成本、點(diǎn)對(duì)點(diǎn)的跨境交易成為可能,比特幣交易在一定程度上降低了金融行業(yè)的準(zhǔn)入門檻[3]。比特幣屬于公有鏈,其用戶參與讀取、交易以及共識(shí)機(jī)制等是開(kāi)放的,其用戶規(guī)模是動(dòng)態(tài)的,參與者身份是匿名的[4],這將導(dǎo)致洗錢犯罪的過(guò)程更加隱蔽,洗錢方法也更趨向于復(fù)雜化和智能化,從而給傳統(tǒng)的反洗錢監(jiān)管制度體系,如KYC(know your customer),帶來(lái)新的問(wèn)題和挑戰(zhàn)。雖然比特幣交易場(chǎng)景很難實(shí)現(xiàn)KYC 監(jiān)管,但是其完整的交易數(shù)據(jù)在區(qū)塊鏈上是公開(kāi)透明的。順應(yīng)反洗錢形勢(shì)的新變化以及迎接這些公開(kāi)數(shù)據(jù)提供的新機(jī)遇,一些加密貨幣情報(bào)公司應(yīng)運(yùn)而生,例如著名的Elliptic 公司對(duì)鏈上的交易數(shù)據(jù)進(jìn)行挖掘,建立了多維度的數(shù)據(jù)模型,使利用大數(shù)據(jù)和人工智能等技術(shù)實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的智能化反洗錢監(jiān)管方案成為可能。
該類智能化反洗錢監(jiān)管方案的首要目標(biāo)是精準(zhǔn)識(shí)別區(qū)塊鏈上的異常交易,其難點(diǎn)和問(wèn)題在于:從錯(cuò)綜復(fù)雜的區(qū)塊鏈交易中抽取的原始特征不可避免地存在部分重要關(guān)聯(lián)信息缺失的問(wèn)題,且受時(shí)間、市場(chǎng)行情或惡意攻擊等諸多不可控因素影響,原始特征對(duì)合法/非法交易的表征能力和區(qū)分能力較弱;需要從持續(xù)增長(zhǎng)的海量交易中準(zhǔn)確高效地對(duì)少量非法交易進(jìn)行分類(即正負(fù)樣本數(shù)量極端不平衡)。深度學(xué)習(xí)憑借其強(qiáng)大的自動(dòng)特征學(xué)習(xí)能力給此類問(wèn)題提供了新的解決方向[5]?,F(xiàn)有的一些研究表明,深度學(xué)習(xí)技術(shù)可以模擬人腦的分層模型結(jié)構(gòu),從原始輸入數(shù)據(jù)中挖掘越來(lái)越抽象的且具有良好泛化能力的特征,深度學(xué)習(xí)模型得到的特征往往具有一定的語(yǔ)義特征和更強(qiáng)的區(qū)分能力[6-7]。本文對(duì)經(jīng)典深度學(xué)習(xí)模型的構(gòu)造方法、逐層特征變換以及模型訓(xùn)練等方面的關(guān)鍵問(wèn)題和難點(diǎn)進(jìn)行研究。例如,深度學(xué)習(xí)優(yōu)化過(guò)程中隱含層的個(gè)數(shù)設(shè)定目前尚未有明確的規(guī)則或規(guī)律可循,深層網(wǎng)絡(luò)較淺層網(wǎng)絡(luò)具有更強(qiáng)的數(shù)據(jù)擬合能力,但是層數(shù)太深會(huì)導(dǎo)致網(wǎng)絡(luò)退化現(xiàn)象。因此,本文結(jié)合殘差網(wǎng)絡(luò)(ResNet,residual network)在解決網(wǎng)絡(luò)性能退化方面的天然優(yōu)勢(shì),設(shè)計(jì)了一種殘差網(wǎng)絡(luò)結(jié)構(gòu)ResNet-32,用來(lái)學(xué)習(xí)交易行為隱含的且具代表性的高層抽象特征。
ResNet-32 提取的高層抽象特征包含了豐富的語(yǔ)義信息,但低層原始特征更傾向于對(duì)交易細(xì)節(jié)本身的描述,如何充分結(jié)合兩者的優(yōu)勢(shì)以進(jìn)一步提升異常交易檢測(cè)的性能成為一個(gè)迫切需要解決的問(wèn)題。因此,本文提出了3 種特征融合方法,即RRCF(ResNet and raw concat fusion)、RRSF(ResNet and raw supervised fusion)和RRUF(ResNet and raw unsupervised fusion),以期自適應(yīng)地橋接高層抽象特征與原始特征,自動(dòng)去除不同級(jí)別特征結(jié)合帶來(lái)的噪聲和冗余信息等,并挖掘兩者的交叉特征信息以獲得最具區(qū)分能力的特征,使后續(xù)異常交易檢測(cè)性能的提升成為可能。本文的主要貢獻(xiàn)如下。
1) 設(shè)計(jì)了一種殘差網(wǎng)絡(luò)結(jié)構(gòu)ResNet-32,用于挖掘孤立特征間錯(cuò)綜復(fù)雜的關(guān)聯(lián)關(guān)系,以期自動(dòng)學(xué)習(xí)包含豐富語(yǔ)義信息的高層抽象特征。
2) 提出了一種提升區(qū)塊鏈異常交易檢測(cè)性能的觀點(diǎn),即通過(guò)自適應(yīng)特征融合方法充分挖掘高層抽象特征和原始特征各自的優(yōu)勢(shì)。
3) 基于本文提出的3 種自適應(yīng)特征融合方法,提出了一種新的區(qū)塊鏈異常交易檢測(cè)(BATDet,det block-chain abnormal transaction detection)模型,并在Elliptic 數(shù)據(jù)集[3,8]上驗(yàn)證了所提模型在區(qū)塊鏈異常交易檢測(cè)方面的有效性。
區(qū)塊鏈技術(shù)的快速發(fā)展促使信息互聯(lián)網(wǎng)向價(jià)值互聯(lián)網(wǎng)轉(zhuǎn)型,其應(yīng)用場(chǎng)景廣泛,但由于監(jiān)管機(jī)制的缺乏衍生出許多風(fēng)險(xiǎn)或違法違規(guī)行為,如洗錢、逃稅和非法ICO 融資等。各國(guó)紛紛擬將區(qū)塊鏈技術(shù)納入監(jiān)管體系,其中異常交易檢測(cè)對(duì)區(qū)塊鏈產(chǎn)業(yè)的健康發(fā)展起到了積極的推動(dòng)作用,例如,余春堂等[9]基于異常交易檢測(cè)提出了一種分級(jí)多層智能服務(wù)交易監(jiān)管架構(gòu),是針對(duì)具體應(yīng)用實(shí)現(xiàn)的可監(jiān)管區(qū)塊鏈系統(tǒng)。同理,異常交易檢測(cè)作為反洗錢監(jiān)管的首要目標(biāo),對(duì)保證金融市場(chǎng)的穩(wěn)定發(fā)揮著重要作用。在基于KYC 的傳統(tǒng)金融監(jiān)管體系中,異常交易檢測(cè)的常規(guī)方案是首先設(shè)計(jì)基于固定閾值規(guī)則的警報(bào)系統(tǒng)來(lái)檢測(cè)和標(biāo)記可疑交易,然后對(duì)可疑行為進(jìn)行人工決策或判斷[10]。例如Demetis 等[11]提出了一套適用于銀行業(yè)的反洗錢系統(tǒng)理論概念模型,以英國(guó)一家銀行的交易記錄作為案例進(jìn)行研究,提取了一組反洗錢評(píng)估指標(biāo)供反洗錢決策者使用。但是此類監(jiān)管方案面臨的挑戰(zhàn)包括:1) 如何從海量異構(gòu)的交易數(shù)據(jù)中構(gòu)建有效規(guī)則,并保持規(guī)則的先進(jìn)性和相關(guān)性;2) 如何設(shè)置洗錢嫌疑交易行為標(biāo)定的告警閾值。
虛擬“數(shù)字貨幣”等互聯(lián)網(wǎng)金融的出現(xiàn)導(dǎo)致基于規(guī)則的監(jiān)管方案面臨巨大挑戰(zhàn)。打破傳統(tǒng)的反洗錢監(jiān)管思維,構(gòu)建以數(shù)據(jù)為基礎(chǔ)、以人工智能和大數(shù)據(jù)分析等技術(shù)為手段的智能化反洗錢監(jiān)管方案已成趨勢(shì)。例如,Weber 等[3]將比特幣交易映射為龐大、復(fù)雜的圖結(jié)構(gòu),并提取交易數(shù)量、交易金額等相關(guān)特征,然后采用圖卷積網(wǎng)絡(luò)(GCN,graph convolutional network)算法區(qū)分非法和合法交易;Jullum 等[10]利用發(fā)送方/接送方的背景、交易早期行為和交易歷史等信息訓(xùn)練XGBoost 有監(jiān)督預(yù)測(cè)模型,以識(shí)別金融交易中潛在的洗錢行為,并應(yīng)用于銀行。Paula 等[12]從注冊(cè)信息、金融交易及電子發(fā)票等相關(guān)類別中提取18 個(gè)重要特征并結(jié)合自編碼器(AE,auto-encoder)算法訓(xùn)練無(wú)監(jiān)督深度學(xué)習(xí)模型,以檢測(cè)和反洗錢相關(guān)的出口欺詐。
智能化反洗錢監(jiān)管中異常交易檢測(cè)的研究工作目前主要集中在有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)[10,13]。有監(jiān)督學(xué)習(xí)通過(guò)使用標(biāo)注數(shù)據(jù)(訓(xùn)練集)來(lái)學(xué)習(xí)區(qū)分的二分類(如合法與非法交易)或多分類機(jī)器學(xué)習(xí)檢測(cè)模型,從而預(yù)測(cè)未知數(shù)據(jù)樣本(測(cè)試集)的分類。無(wú)監(jiān)督學(xué)習(xí)則探索未標(biāo)注數(shù)據(jù)的結(jié)構(gòu)及特征,找出簇或類的最優(yōu)劃分,將遠(yuǎn)離其他樣本點(diǎn)的孤點(diǎn)視為離群點(diǎn),即異常數(shù)據(jù)[14]。但是在反洗錢監(jiān)管中,異常交易往往隱藏于大量正常交易中且可能刻意模仿正常交易行為[3,15],導(dǎo)致合法與非法(異常)交易界限不明顯且兩者的特征值差異較小,因此無(wú)監(jiān)督方法檢測(cè)的非法交易不一定是實(shí)際場(chǎng)景中的真正非法交易,即存在高誤報(bào)率和漏報(bào)率。
通過(guò)以上的分析總結(jié),本文對(duì)比分析了目前反洗錢監(jiān)管領(lǐng)域中異常交易檢測(cè)相關(guān)方法的優(yōu)勢(shì)和不足,如表1 所示。
數(shù)據(jù)和特征一定程度上決定了智能檢測(cè)模型的性能上限[16],特征學(xué)習(xí)作為提升特征質(zhì)量的重要手段,近年來(lái)伴隨深度學(xué)習(xí)的興起,實(shí)現(xiàn)了從基于領(lǐng)域?qū)<抑R(shí)的人工構(gòu)建到從大數(shù)據(jù)中自主學(xué)習(xí)的轉(zhuǎn)變[17]。例如,王勇等[18]將網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行歸一化處理后映射成灰度圖片,輸入深度卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)提取更加抽象的特征,以提高流量分類的精度;劉燁等[19]探索卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制等方法各自的優(yōu)勢(shì)來(lái)學(xué)習(xí)軟件缺陷報(bào)告的重要文本特征和序列特征。得益于深度學(xué)習(xí)技術(shù)的結(jié)構(gòu)優(yōu)勢(shì),基于深度學(xué)習(xí)的特征融合逐漸被提出,進(jìn)一步推動(dòng)了檢測(cè)領(lǐng)域的發(fā)展[20-22]。例如,Pang等[20]提出的Libra R-CNN 通過(guò)整合不同級(jí)別的特征,生成更均衡的語(yǔ)義特征;Zhang 等[23]通過(guò)融合預(yù)先訓(xùn)練的卷積網(wǎng)絡(luò)的低層和高層特征來(lái)提高語(yǔ)義分割的性能。
針對(duì)智能化反洗錢監(jiān)管方案的現(xiàn)狀及發(fā)展趨勢(shì),本文在特征學(xué)習(xí)部分充分發(fā)揮有監(jiān)督學(xué)習(xí)的優(yōu)勢(shì),設(shè)計(jì)了一種殘差網(wǎng)絡(luò)結(jié)構(gòu)ResNet-32,用于自動(dòng)挖掘區(qū)塊鏈交易數(shù)據(jù)中孤立特征間隱含的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)對(duì)交易數(shù)據(jù)更本質(zhì)的刻畫(huà);在特征融合部分,本文旨在消除高層特征與低層特征整合后可能存在的信息沖突或噪聲,自適應(yīng)地調(diào)整兩者特征權(quán)重以充分挖掘它們各自優(yōu)勢(shì),從而提升異常交易檢測(cè)性能。
本文提出的BATDet 模型框架如圖1 所示??紤]經(jīng)深度學(xué)習(xí)逐層非線性變換后學(xué)習(xí)到的高層抽象特征包含更強(qiáng)的語(yǔ)義信息,低層特征(例如原始特征)則側(cè)重于事物本身的描述,本文提出了3 種特征融合方法,分別是RRCF、RRSF 和RRUF。其中,RRCF 將原始交易特征與ResNet-32 輸出的高層抽象特征進(jìn)行拼接(C,concat),拼接后的特征作為L(zhǎng)R(Logistic regression)分類器的輸入。RRSF在RRCF 的基礎(chǔ)上,將拼接后的特征輸入兩層堆疊去噪自編碼機(jī)(SDAE,stacked de-noising auto-encoder)[24],并利用反向傳播(BP,back propagation)算法進(jìn)行有監(jiān)督微調(diào)。與RRSF 不同,RRUF僅采用SDAE 前向網(wǎng)絡(luò),是一種無(wú)監(jiān)督特征融合方法。RRSF 與RRUF 的目標(biāo)在于,自適應(yīng)地調(diào)整高層抽象特征與低層原始特征融合時(shí)的權(quán)重。本文通過(guò)Ellipict 數(shù)據(jù)集驗(yàn)證了這3 種特征融合方法提升BATDet 模型性能的有效性。

表1 反洗錢監(jiān)管領(lǐng)域中異常交易檢測(cè)方法對(duì)比分析

圖1 BATDet 模型框架
Elliptic 數(shù)據(jù)集[3]將原始比特幣(BTC,bitcoin)交易信息映射為圖結(jié)構(gòu),節(jié)點(diǎn)表示比特幣交易,邊代表不同交易間的比特幣流向。它共包含203 769 個(gè)節(jié)點(diǎn)和234 355 條邊,節(jié)點(diǎn)上同時(shí)攜帶時(shí)間戳信息。在Elliptic 數(shù)據(jù)集里,比特幣交易主體被納入合法實(shí)體(如交易所、錢包提供商、合法服務(wù)等)和非法實(shí)體(如詐騙、惡意軟件、勒索軟件等)。合法實(shí)體發(fā)起的交易被標(biāo)記為合法交易,非法實(shí)體發(fā)起的交易被標(biāo)記為非法交易。采用啟發(fā)式的推理過(guò)程,該數(shù)據(jù)集共標(biāo)注了4 545 筆非法交易和42 019 筆合法交易,其余交易的標(biāo)記未知。依據(jù)節(jié)點(diǎn)的時(shí)間戳信息,這些已標(biāo)記的交易被劃分為49 個(gè)獨(dú)立的時(shí)間片。每筆交易包含166 個(gè)特征,其中94 個(gè)特征是比特幣交易(節(jié)點(diǎn))的本地信息,記為局部特征,如時(shí)間步長(zhǎng)、交易手續(xù)費(fèi)、輸入/輸出數(shù)、輸出量和一些合計(jì)數(shù)據(jù)(如平均接收/轉(zhuǎn)出的BTC 數(shù)量等);其余72 個(gè)特征是從中心節(jié)點(diǎn)向前/向后一跳聚合事務(wù)信息統(tǒng)計(jì)出的最大值、最小值、標(biāo)準(zhǔn)差和相關(guān)系數(shù)等,標(biāo)記為聚合特征。
針對(duì)比特幣交易特征間存在高度非線性關(guān)聯(lián)的特點(diǎn),本文采用深度學(xué)習(xí)算法進(jìn)行特征學(xué)習(xí)和融合。深度學(xué)習(xí)作為人工智能的一個(gè)重要分支,與淺層學(xué)習(xí)方法相比,能夠自動(dòng)地學(xué)習(xí)復(fù)雜非線性變換函數(shù),提取更抽象和有效的隱含特征[5,25],使原始數(shù)據(jù)信息利用率大幅提升。這些包含數(shù)據(jù)豐富內(nèi)在規(guī)律的深層特征已在諸多領(lǐng)域取得顯著成效,例如目標(biāo)分類檢測(cè)、語(yǔ)義分割和行為識(shí)別等領(lǐng)域[26]。但是大多數(shù)深度學(xué)習(xí)方法往往面臨參數(shù)多、訓(xùn)練難度大、梯度消失和網(wǎng)絡(luò)退化等問(wèn)題[27-28],從而影響或限制后續(xù)檢測(cè)或分類任務(wù)的性能。深度學(xué)習(xí)常規(guī)架構(gòu)包含輸入層、隱含層和輸出層,在硬件環(huán)境和原始數(shù)據(jù)許可的情況下深度學(xué)習(xí)往往通過(guò)加深隱含層數(shù)來(lái)提升特征學(xué)習(xí)能力。但是,大量實(shí)驗(yàn)證明當(dāng)層數(shù)到達(dá)一定深度(即最優(yōu)結(jié)構(gòu))后,性能反而會(huì)隨層數(shù)的增加而下降(并非由過(guò)擬合導(dǎo)致,可能是梯度消失等原因?qū)е拢?,即網(wǎng)絡(luò)退化問(wèn)題[28-29]。在深度學(xué)習(xí)優(yōu)化過(guò)程中隱含層的層數(shù)設(shè)置目前尚未有明確的規(guī)則或規(guī)律可循。
He 等[28]提出的ResNet 通過(guò)引入恒等映射來(lái)解決網(wǎng)絡(luò)退化問(wèn)題。ResNet 中最基本單元是殘差塊。每個(gè)殘差塊均包含2 個(gè)具有相同核大小和過(guò)濾數(shù)的卷積,將其輸入記為x,輸出(即學(xué)習(xí)到的特征)記為H(x),殘差網(wǎng)絡(luò)中通過(guò)疊加非線性層來(lái)擬合一個(gè)殘差函數(shù)F(x):=H(x)?x。假設(shè)網(wǎng)絡(luò)結(jié)構(gòu)(共l層)達(dá)到n層(n 為了獲得包含更多語(yǔ)義信息的深層次特征,交易的特征提取網(wǎng)絡(luò)通過(guò)級(jí)聯(lián)如圖2 所示的殘差塊構(gòu)成。 每個(gè)殘差塊的輸出可定義為 在本文的ResNet-32 中,第一層輸入為交易的原始特征,共166 維;F(x,{Wi})為需要學(xué)習(xí)的殘差映射。如圖2 所示,本文采用的跳躍連接設(shè)置為2,可得 圖2 殘差塊 其中,δ表示非線性激活函數(shù)Relu[30],因?yàn)橄啾萻igmoid 或tanh 激活函數(shù),它具有更快的收斂速度和更好的性能[17,31]。恒等映射通過(guò)跳躍連接完成,并與指定輸出層做加法操作,此時(shí)需要x和H(x)形狀(包括維度等)相同,如果不相同,則式(1)轉(zhuǎn)換為 其中,Ws采用1×1卷積操作實(shí)現(xiàn),用于調(diào)整x的維度。另外,在每一層卷積之后引入了批歸一化(BN,batch normalization),以避免梯度消失和加快收斂[32]。用于交易數(shù)據(jù)深層次特征學(xué)習(xí)的殘差網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示,對(duì)應(yīng)的參數(shù)設(shè)置如表2 所示。 針對(duì)上述問(wèn)題,本文提出了自適應(yīng)特征融合方法,以探索高層抽象特征與淺層原始特征的不同級(jí)別信息之間的優(yōu)勢(shì)互補(bǔ)。首先,本文提出RRCF,即通過(guò)連接操作將殘存網(wǎng)絡(luò)輸出的深層次特征與原始特征映射到統(tǒng)一的特征表示空間,記為xinputf,如式(4)所示。 但是,拼接后的特征面臨如下問(wèn)題:1) 噪聲數(shù)據(jù),即原始特征raw_features 與殘差網(wǎng)絡(luò)學(xué)習(xí)到的特征resnet32_features 這2 組不同層次的特征拼接后,在后續(xù)分類階段可能存在干擾、沖突或不一致信息,從而產(chǎn)生數(shù)據(jù)噪聲;2) 如何界定這2 組特征各自的重要程度,即相應(yīng)的權(quán)重如何分配才能獲取更具有區(qū)分能力的高品質(zhì)特征。 鑒于SDAE 逐層貪婪訓(xùn)練及從噪聲數(shù)據(jù)中學(xué)習(xí)穩(wěn)健性和強(qiáng)泛化的緊湊不變特征的能力,在特征融合階段,本文設(shè)計(jì)了基于SDAE 的特征融合方法RRSF 和RRUF,以自動(dòng)學(xué)習(xí)xinputf中不同特征的權(quán)重,并有效抑制特征間的沖突和不一致等噪聲信息。RRSF 和RRUF 的差異在于,RRSF 中加入了Softmax 層利用標(biāo)簽對(duì)其進(jìn)行有監(jiān)督微調(diào),RRUF采用的是無(wú)監(jiān)督前向網(wǎng)絡(luò)。SDAE 是通過(guò)堆疊多個(gè)DAE(DAE,de-noising auto-encoder)構(gòu)成的。DAE是一種三層神經(jīng)網(wǎng)絡(luò)模型(包含輸入層、隱含層和輸出層),給定輸入數(shù)據(jù)xf(輸入層),隨機(jī)將xf中的部分元素置0 以獲得噪聲數(shù)據(jù),則隱含層hf表示為 圖3 用于交易數(shù)據(jù)深層次特征學(xué)習(xí)的殘差網(wǎng)絡(luò)結(jié)構(gòu) 表2 殘差網(wǎng)絡(luò)參數(shù)設(shè)置 殘差網(wǎng)絡(luò)學(xué)習(xí)到的深層次抽象特征經(jīng)過(guò)逐層的非線性變換及有監(jiān)督微調(diào),不再孤立地考慮交易信息中的各個(gè)特征,而是有效捕獲表征交易信息的各個(gè)特征間錯(cuò)綜復(fù)雜的內(nèi)在非性關(guān)聯(lián)關(guān)系,挖掘其蘊(yùn)含的語(yǔ)義信息。與深層次抽象特征包含豐富語(yǔ)義信息不同,淺層次特征(例如原始特征)更忠于事物本身的描述,例如交易的細(xì)節(jié)信息等。如何橋接這2 種特征并挖掘兩者優(yōu)勢(shì),以增強(qiáng)特征區(qū)分能力與抗噪性能,是異常交易檢測(cè)面臨的另一挑戰(zhàn)。 其中,?是非線性激活函數(shù)LeakyReLU,W為編碼器的權(quán)重矩陣,b為偏差,hf的維度小于xf的維度。在解碼器部分對(duì)hf進(jìn)行線性或非線性變換,獲得輸出層為 其中,W′為隱含層到輸出層的權(quán)值矩陣,b'為偏差,?'為非線性激活函數(shù)。在BATDet 模型中,為了加快訓(xùn)練速度,融合階段解碼器采用線性變換。計(jì)算輸入層xf與輸出層之間的誤差,通過(guò)誤差反向傳播算法不斷調(diào)整權(quán)值和偏差W、b、W′、b',使重構(gòu)誤差最小,即轉(zhuǎn)化為解決式(7)所示問(wèn)題。 本文設(shè)計(jì)的SDAE 為二層結(jié)構(gòu),即2 個(gè)DAE的級(jí)聯(lián),融合后的特征xoutputf可表示為 針對(duì)傳統(tǒng)特征融合方法無(wú)法伴隨特征集的變化進(jìn)行動(dòng)態(tài)優(yōu)化的問(wèn)題,BATDet 模型集深層抽象特征與淺層原始特征各自優(yōu)勢(shì)于一體,提出了新的區(qū)塊鏈交易自動(dòng)特征學(xué)習(xí)和融合方法,以自動(dòng)捕獲交易行為全方位的且具代表性的特征,該方法具有一定的通用性和普適性,可移植和擴(kuò)展到其他應(yīng)用領(lǐng)域。 本節(jié)基于Elliptic 數(shù)據(jù)集對(duì)BATDet 模型的性能進(jìn)行綜合評(píng)估和分析??紤]區(qū)塊鏈異常交易檢測(cè)是一個(gè)與時(shí)間信息密切相關(guān)的任務(wù),且在Elliptic 數(shù)據(jù)集中將已標(biāo)注的交易記錄依據(jù)其發(fā)生的時(shí)間點(diǎn)劃分為49 個(gè)獨(dú)立的時(shí)間片。為了盡可能保持?jǐn)?shù)據(jù)分布的一致性,本文采用留出法,依據(jù)時(shí)間片比例70:30 劃分訓(xùn)練集和測(cè)試集,即前34 個(gè)時(shí)間片的交易記錄用于訓(xùn)練特征學(xué)習(xí)、融合以及后續(xù)的分類模型,第35 個(gè)~第49 個(gè)時(shí)間片的交易記錄將用于測(cè)試和評(píng)估模型的性能。 首先,采用經(jīng)典的LR 分類器評(píng)估Elliptic 數(shù)據(jù)集中166 維原始特征(包括比特幣交易的局部特征和近鄰聚合特征)對(duì)正常交易和異常交易的區(qū)分能力,以其作為基準(zhǔn),評(píng)估了本文設(shè)計(jì)的ResNet-32殘差網(wǎng)絡(luò)的特征學(xué)習(xí)能力和所提不同層次的多特征自適應(yīng)融合方法對(duì)區(qū)塊鏈交易異常檢測(cè)性能的提升;其次,針對(duì)區(qū)塊鏈交易具有較強(qiáng)時(shí)效性的特點(diǎn),進(jìn)一步評(píng)估了BATDet 模型在新發(fā)生異常交易檢測(cè)時(shí)的穩(wěn)健性;最后,在同等實(shí)驗(yàn)條件下,將BATDet 模型與經(jīng)典智能檢測(cè)模型,如k 最近鄰(KNN,k-nearest neighbor)、決策樹(shù)(DT,decision tree)、多層感知機(jī)(MLP,multilayer perceptron)、樸素貝葉斯(NB,naive Bayesian)、Adaboost 和梯度提升樹(shù)(GBDT,gradient boosting decision tree)進(jìn)行對(duì)比,以評(píng)估其整體有效性。BATDet 模型中各特征學(xué)習(xí)與融合方法均采用LR 分類器進(jìn)行驗(yàn)證。 為了客觀評(píng)估和度量BATDet 模型在區(qū)塊鏈異常交易檢測(cè)方面的性能,考慮本文區(qū)塊鏈異常交易檢測(cè)的目的是區(qū)分正常交易和異常交易,屬于二分類問(wèn)題。因此,本文引入機(jī)器學(xué)習(xí)領(lǐng)域經(jīng)典的二分類評(píng)估指標(biāo),包括準(zhǔn)確率 Accuracy、精確率Precision、召回率Recall、F1 值F1-score、馬修斯相關(guān)系數(shù)(MCC,Matthews correlation coefficient)等,其詳細(xì)定義如下 其中,TP(true positive)、FP(false positive)、TN(true negative)和FN(false negative)分別表示真正例數(shù)、假正例數(shù)、真反例數(shù)和假反例數(shù)。 本文在Pytorch 深度學(xué)習(xí)框架下實(shí)現(xiàn)了BATDet模型,具體的參數(shù)設(shè)置如下。1) 高層抽象特征通過(guò)ResNet-32 獲取,網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表2 所示,epoch設(shè)置為200(讀取訓(xùn)練集中全部樣本完成一次訓(xùn)練即為1epoch),學(xué)習(xí)率為0.000 1。2) 高層抽象特征與底層特征融合階段,級(jí)聯(lián)的2 個(gè)DAE 的隱含層神經(jīng)元個(gè)數(shù)分別為416 和256,epoch 為100,學(xué)習(xí)率為0.000 1,為了加快特征融合階段的訓(xùn)練過(guò)程,本文將訓(xùn)練集分割成小批量來(lái)更新模型參數(shù),其中,批大小為300,epoch 為100。BATDet 模型中均采用Adam 優(yōu)化器[33]更新網(wǎng)絡(luò)參數(shù)。另外,本文采用基于Python 的機(jī)器學(xué)習(xí)算法庫(kù)Sklearn0.19.0 實(shí)現(xiàn)LR、KNN、DT、NB、Adaboost 和GBDT。 為了直觀展示BATDet 模型中各組成部分對(duì)區(qū)塊鏈異常交易檢測(cè)性能的影響,本節(jié)首先將BATDet模型分解為如下5 個(gè)步驟進(jìn)行評(píng)估,檢測(cè)結(jié)果如表3所示。 1) 評(píng)估Elliptic 數(shù)據(jù)集中166 維原始特征在LR分類器上的異常交易檢測(cè)性能,記為Raw。 2) 測(cè)試BATDet 模型中設(shè)計(jì)的ResNet-32 網(wǎng)絡(luò)結(jié)構(gòu)提取的高層抽象特征對(duì)異常交易檢測(cè)性能的提升,記為ResNet-32。 3) 驗(yàn)證高層抽象特征與底層原始特征經(jīng)簡(jiǎn)單拼接后的檢測(cè)性能,即RRCF。 4) 評(píng)測(cè)高層抽象特征與底層原始特征經(jīng)有監(jiān)督微調(diào)的SDAE 進(jìn)行融合后的異常交易檢測(cè)性能,即RRSF。 5) 評(píng)估經(jīng)無(wú)監(jiān)督SDAE 進(jìn)行融合特征權(quán)重學(xué)習(xí)后的檢測(cè)性能,即RRUF。 首先,利用Elliptic 數(shù)據(jù)集中166 維原始特征訓(xùn)練LR 分類器,以評(píng)估原始特征在異常交易檢測(cè)中的表現(xiàn),以此作為基準(zhǔn)評(píng)估本文所提出的ResNet、RRCF、RRSF 和RRUF 的有效性。從表3 可知,在相同的實(shí)驗(yàn)環(huán)境及參數(shù)設(shè)置下,本文設(shè)計(jì)的ResNet-32 學(xué)習(xí)到的特征作為L(zhǎng)R 分類器的輸入特征可以顯著提高異常交易檢測(cè)性能。較基準(zhǔn)方法Raw,Accuracy 提升了8.76%,Precision 提升了53.32%,Recall 提升了1.67%,F(xiàn)1-score 提升了19.41%,MCC提升了34.59%。ResNet-32 帶來(lái)的檢測(cè)性能大幅度提升的主要原因在于:1) 殘差網(wǎng)絡(luò)通過(guò)引入恒等映射等概念有效解決了網(wǎng)絡(luò)退化問(wèn)題,使優(yōu)化較深層的網(wǎng)絡(luò)以提升特征學(xué)習(xí)能力成為可能;2) ResNet-32 學(xué)習(xí)到的深層非線性網(wǎng)絡(luò)結(jié)構(gòu)可以有效擬合輸入數(shù)據(jù),以組合和關(guān)聯(lián)區(qū)塊鏈交易中各孤立特征,并逐層進(jìn)行非線性特征變換,展現(xiàn)了從訓(xùn)練樣本集中學(xué)習(xí)區(qū)塊鏈交易高級(jí)語(yǔ)義特征的強(qiáng)大能力,從而使異常交易檢測(cè)性能得以大幅度提升。 表3 區(qū)塊鏈異常交易檢測(cè)結(jié)果 然而,特征變換的過(guò)程中不可避免地會(huì)丟失一些交易的細(xì)節(jié)信息,低層原始特征雖然稀疏且可能含有噪聲或語(yǔ)義歧義干擾,導(dǎo)致其區(qū)分能力較弱,但它是對(duì)交易細(xì)節(jié)的最直觀表述。因此,為了充分挖掘兩者的互補(bǔ)優(yōu)勢(shì),本文提出了3 種特征融合方法。其中,RRCF 為底層原始特征與高層語(yǔ)義特征的拼接。通過(guò)表3 的結(jié)果可知,相較于ResNet-32,除召回率以外,RRCF 的各項(xiàng)評(píng)價(jià)指標(biāo)均有提升,實(shí)驗(yàn)結(jié)果進(jìn)一步說(shuō)明融合底層與高層特征可以帶來(lái)檢測(cè)性能的提升。但不同級(jí)別特征簡(jiǎn)單的拼接,可能會(huì)帶來(lái)信息冗余或噪聲,且很難界定它們?cè)诋惓z測(cè)場(chǎng)景中的重要程度。因此,本文結(jié)合SDAE(本文采用級(jí)聯(lián)兩層DAE)從噪聲數(shù)據(jù)中學(xué)習(xí)穩(wěn)健性和強(qiáng)泛化特征的優(yōu)勢(shì),進(jìn)一步提出了2 種特征融合方法RRSF 和RRUF。在RRCF 的基礎(chǔ)上,RRSF與RRUF 通過(guò)縮小輸入與輸出誤差自動(dòng)調(diào)整對(duì)應(yīng)的網(wǎng)絡(luò)權(quán)重,最大限度地保留不同層次特征各自的差異和優(yōu)勢(shì),并挖掘兩者的交差信息,以獲得更具區(qū)分能力的特征。 Elliptic 數(shù)據(jù)集中非法交易(即異常交易)數(shù)與合法交易數(shù)的比值為4 545:42 019,這種樣本分類極度不平衡的情況在異常交易檢測(cè)場(chǎng)景中是普遍現(xiàn)象。由表3 中實(shí)驗(yàn)結(jié)果可知,在特征融合階段,與較簡(jiǎn)單的RRCF 特征拼接方法相比,RRSF 和RRUF 的Precision 分別提升了5.4%和7.1%(不平衡數(shù)據(jù)集的重要參考指標(biāo))。由此可見(jiàn),本文提出的自適應(yīng)特征融合方法可有效提升區(qū)塊鏈異常交易檢測(cè)性能。其中,RRUF 優(yōu)于RRSF 主要原因在于高層抽象特征學(xué)習(xí)與融合特征學(xué)習(xí)階段,由于訓(xùn)練數(shù)據(jù)相同,因此它們均采用了相同的標(biāo)簽進(jìn)行有監(jiān)督微調(diào),故融合階段學(xué)習(xí)到的特征在重要性上會(huì)更傾向于高層抽象特征而弱化底層特征。 為了評(píng)估BATDet 模型對(duì)新發(fā)生異常交易檢測(cè)的有效性,本文采用時(shí)間片1~時(shí)間片34 的交易記錄為訓(xùn)練集,分別評(píng)估了時(shí)間片35~時(shí)間片49 中發(fā)生的交易,如圖4~圖8 所示。從Accuracy、Precision、Recall、F1-score 和MCC 這5 個(gè)指標(biāo)分別對(duì)BATDet 模型中的檢測(cè)方法進(jìn)行評(píng)估和比較。從實(shí)驗(yàn)結(jié)果來(lái)看,本文提出的BATDet 模型中的ResNet-32 以及3 種特征融合方法RRCF、RRSF 和RRUF 在時(shí)間片35~時(shí)間片42 中,極大地提升了區(qū)塊鏈異常交易檢測(cè)性能中除Recall 外的其他指標(biāo)。Precision 和Recall 是一對(duì)矛盾的度量標(biāo)準(zhǔn),通常Precision 高時(shí),Recall 會(huì)偏低。 圖4 不同時(shí)間片中異常檢測(cè)的Accuracy 比較 從圖5~圖8 的對(duì)比可以看出,在時(shí)間片43 及其后的部分時(shí)間片中,BATDet 模型中所提方法并未使異常交易檢測(cè)性能明顯提升,這是由于在時(shí)間片43 發(fā)生了黑市突然關(guān)閉現(xiàn)象[3],即在這個(gè)時(shí)間片的共1 370 筆交易中只有24 筆交易被標(biāo)注為非法交易,從而導(dǎo)致所有檢測(cè)方法均無(wú)法捕獲黑市關(guān)閉后發(fā)生的非法交易,這是異常交易檢測(cè)在反洗錢應(yīng)用領(lǐng)域需應(yīng)對(duì)的一個(gè)重要挑戰(zhàn)。本文認(rèn)為在時(shí)間片43~時(shí)間片49 中,所有模型的檢測(cè)性能均欠理想,極大可能是隨著時(shí)間的推移及交易數(shù)據(jù)分布的變換,導(dǎo)致預(yù)訓(xùn)練的模型不適用于新發(fā)生交易的檢測(cè),即發(fā)生了概念漂移現(xiàn)象。針對(duì)此類問(wèn)題,本文下一步工作擬結(jié)合深度學(xué)習(xí)優(yōu)異的特征學(xué)習(xí)能力,以及遷移學(xué)習(xí)在解決數(shù)據(jù)分布差異及標(biāo)注數(shù)據(jù)過(guò)期等問(wèn)題上的優(yōu)勢(shì)展開(kāi)進(jìn)一步的研究。 圖5 不同時(shí)間片中異常檢測(cè)的Precision 比較 圖6 不同時(shí)間片中異常檢測(cè)的Recall 比較 為驗(yàn)證所提BATDet 模型在區(qū)塊鏈異常交易檢測(cè)上的整體性能,本文在Elliptic 數(shù)據(jù)集上選擇與經(jīng)典的分類模型如KNN、DT、MLP、NB、Adaboost和GBDT 進(jìn)行比較,結(jié)果如表4 所示。實(shí)現(xiàn)方式均采用Python 語(yǔ)言實(shí)現(xiàn)的機(jī)器學(xué)習(xí)算法庫(kù)Sklearn0.19.0,所有分類器均采用默認(rèn)參數(shù)。 圖7 不同時(shí)間片中異常檢測(cè)的F1-score 比較 圖8 不同時(shí)間片中異常檢測(cè)的MCC 比較 從表4 可以看出,在正負(fù)樣本數(shù)量極度失衡的現(xiàn)實(shí)情況下,本文的特征學(xué)習(xí)方法ResNet-32 和特征融合方法RRCF、RRSF 和RRUF 獲得的特征更適用于區(qū)塊鏈異常交易檢測(cè),其Precision 大大提高。其他指標(biāo)如Accuracy、Recall、F1-score 和MCC也得以大幅度提升。實(shí)驗(yàn)結(jié)果進(jìn)一步表明BATDet模型可以有效擬合比特幣交易數(shù)據(jù),通過(guò)挖掘特征間關(guān)聯(lián)關(guān)系以及自適合融合多級(jí)別特征來(lái)提高原始數(shù)據(jù)信息利用率,保證了在數(shù)據(jù)極度不平衡的條件下異常交易檢測(cè)的可靠性和穩(wěn)定性。 表4 與經(jīng)典智能檢測(cè)模型的比較 伴隨區(qū)塊鏈等新興技術(shù)的興起,基于虛擬“數(shù)字貨幣”的在線交易降低金融行業(yè)的準(zhǔn)入門檻和提供便捷金融服務(wù)的同時(shí),也因其匿名性等特點(diǎn)為不法分子提供了更隱秘的洗錢途徑,這給目前金融行業(yè)通用的基于KYC 的反洗錢監(jiān)管機(jī)制帶來(lái)了極大的挑戰(zhàn)。區(qū)塊鏈上數(shù)據(jù)的公開(kāi)透明和不可篡改等特性,結(jié)合人工智能和大數(shù)據(jù)分析及挖掘等技術(shù),為反洗錢監(jiān)管提供了新的契機(jī)。本文首先以區(qū)塊鏈異常交易檢測(cè)為切入點(diǎn),提出深度殘差網(wǎng)絡(luò)結(jié)構(gòu)ResNet-32 學(xué)習(xí)交易特征間的非線性關(guān)聯(lián)關(guān)系,以解決受時(shí)間、市場(chǎng)行情或惡意攻擊等諸多不可控因素影響而導(dǎo)致的交易原始特征表征能力和區(qū)分能力較弱的問(wèn)題;其次,提出了自適應(yīng)特征融合方法RRCF、RRSF 和RRUF,以提升信息利用率為目的橋接高層抽象特征與原始特征和挖掘兩者優(yōu)勢(shì),進(jìn)一步提升區(qū)塊鏈異常交易檢測(cè)的性能;最后,通過(guò)Elliptic 數(shù)據(jù)集分步驟評(píng)估了本文提出的BATDet 模型的可靠性和有效性,表明本文方法可為虛擬“數(shù)字貨幣”背景下的反洗錢監(jiān)管提供新的解決方案。






3.4 多特征融合




4 性能測(cè)試與分析
4.1 評(píng)估標(biāo)準(zhǔn)

4.2 實(shí)現(xiàn)及參數(shù)設(shè)置
4.3 性能評(píng)估及比較







5 結(jié)束語(yǔ)