[摘要] 我國反洗錢金融監(jiān)管面臨的突出問題反映在,現(xiàn)行反洗錢數(shù)據(jù)報(bào)告制度的海量數(shù)據(jù)、高誤報(bào)率、缺乏自適應(yīng)性和易于被規(guī)避等問題。針對(duì)這些問題,本文提出需運(yùn)用數(shù)據(jù)挖掘技術(shù)來構(gòu)建金融機(jī)構(gòu)中可疑交易行為的識(shí)別方法。本文回顧了幾種常見的數(shù)據(jù)挖掘技術(shù)在反洗錢領(lǐng)域中的應(yīng)用,并從兩個(gè)維度提出了基于金融賬戶的反洗錢可疑交易的識(shí)別方法的理論框架。
[關(guān)鍵詞] 數(shù)據(jù)挖掘反洗錢
反洗錢的情報(bào)收集和分析工作,就目前的實(shí)踐來看,尚未能夠起到顯著的指導(dǎo)作用。20 世紀(jì)90 年代數(shù)據(jù)挖掘技術(shù)的產(chǎn)生和發(fā)展, 為可疑交易數(shù)據(jù)分析工作提供了嶄新的思路,極大地促進(jìn)了反洗錢信息情報(bào)部門對(duì)報(bào)告數(shù)據(jù)的使用,數(shù)據(jù)挖掘技術(shù)必將在反洗錢實(shí)踐中發(fā)揮重要作用。
一、洗錢的概念及我國反洗錢工作中的不足
目前關(guān)于洗錢的定義有很多種,國際上并沒有一個(gè)統(tǒng)一的定義。《中華人民共和國反洗錢法》中第二條中關(guān)于的洗錢定義是:通過各種方式掩飾、隱瞞毒品犯罪、黑社會(huì)性質(zhì)的組織犯罪、恐怖活動(dòng)犯罪、走私犯罪、貪污賄賂犯罪、破壞金融管理秩序犯罪、金融詐騙犯罪等犯罪所得及其收益的來源和性質(zhì)的洗錢活動(dòng),依照本法規(guī)定采取相關(guān)措施的行為。
我國反洗錢工作主要是通過可疑交易報(bào)告制度完成的,而金融機(jī)構(gòu)的反洗錢的情報(bào)收集和分析工作中目前存在主要問題為:(1)工作量大,誤報(bào)率高;(2)預(yù)設(shè)標(biāo)準(zhǔn)易于為洗錢分子所規(guī)避;(3)無法自動(dòng)適應(yīng)洗錢形式的變化等。這就使得洗錢可疑交易行為的識(shí)別存在巨大的困難。
二、數(shù)據(jù)挖掘技術(shù)在反洗錢中的應(yīng)用
數(shù)據(jù)挖掘是指從大量數(shù)據(jù)中提取或“挖掘”有趣的知識(shí)。目前,發(fā)達(dá)國家的反洗錢系統(tǒng)都充分利用了數(shù)據(jù)挖掘工具。在反洗錢領(lǐng)域中,人工智能、聚類分析、歸納算法、神經(jīng)網(wǎng)絡(luò)等都具有較強(qiáng)的適應(yīng)性,具有廣闊的應(yīng)用前景。
1.人工智能在反洗錢調(diào)查中得到了快速發(fā)展。美國的FAIS系統(tǒng)綜合使用了人工智能技術(shù)和基于案例的推理、黑板(blackboard)等人工智能技術(shù),其獨(dú)特的分析能力主要得益于其數(shù)據(jù)視角的轉(zhuǎn)變:從交易導(dǎo)向轉(zhuǎn)為對(duì)象(如人或者組織)導(dǎo)向。每一筆交易、對(duì)象、賬戶都要用336條規(guī)則去測(cè)試,每條規(guī)則都給出是否為非法或合法的判定證據(jù),最后用貝葉思推理對(duì)每一個(gè)項(xiàng)目的可疑性進(jìn)行評(píng)定。
2.聚類分析是一種非監(jiān)督的數(shù)據(jù)挖掘技術(shù)。在反洗錢領(lǐng)域,聚類分析技術(shù)特別適用于從大量的交易數(shù)據(jù)中產(chǎn)生及時(shí)、準(zhǔn)確的線索。由于洗錢方式多種多樣,數(shù)據(jù)對(duì)象表現(xiàn)出來的分布也就各式各樣,并不是所有的可疑賬戶都可以聚成一類。因此,在洗錢行為識(shí)別中,簇的數(shù)量是未知的,因洗錢方式的不同而不同。聚類分析中“簇的數(shù)量未知”這個(gè)特點(diǎn)剛好滿足洗錢行為識(shí)別的這個(gè)要求。而且,由于其聚類分析的自動(dòng)處理、非監(jiān)督學(xué)習(xí)等特性使得其可以動(dòng)態(tài)地適應(yīng)洗錢手段的變化,也可以在一定程度上規(guī)避洗錢犯罪活動(dòng)的自適應(yīng)問題。
3.神經(jīng)元網(wǎng)絡(luò)是一種從人工智能領(lǐng)域發(fā)展起來的,模仿人腦神經(jīng)元結(jié)構(gòu),用神經(jīng)網(wǎng)絡(luò)連接的權(quán)值表示知識(shí),,過反復(fù)學(xué)習(xí)訓(xùn)練數(shù)據(jù)集,建立預(yù)測(cè)和分類模型的技術(shù)。神經(jīng)網(wǎng)絡(luò)方法可以用于加強(qiáng)反洗錢的調(diào)查工作,節(jié)省跟蹤洗錢活動(dòng)的時(shí)間。并能通過自動(dòng)學(xué)習(xí)制定出最為有利的反洗錢整體分析方案,提高數(shù)據(jù)分析效率。特別是調(diào)查人員可以學(xué)習(xí)相關(guān)的策略,這對(duì)于分析將來的案例是十分有益的。
4.歸納算法,此方法可以用來產(chǎn)生決策樹,樹的每個(gè)分支都是一個(gè)分類問題。這種方法提供給反洗錢調(diào)查人員一系列彼此相互分離的獨(dú)特路徑,這些路徑為分析者提供一個(gè)推理框架,幫助理解洗錢過程以及解決金融洗錢犯罪。反洗錢調(diào)查人員可據(jù)此總結(jié)出洗錢活動(dòng)的共性和模式,然后通過對(duì)老的規(guī)則集進(jìn)行改進(jìn)建立起新的規(guī)則集,。并也可提供與反洗錢調(diào)查緊密相關(guān)的框架、結(jié)構(gòu)。
三、基于數(shù)據(jù)挖掘技術(shù)的金融賬戶洗錢調(diào)查方法
金融機(jī)構(gòu)在洗錢活動(dòng)中處于極其重要的地位,常常被洗錢犯罪分子所利用。筆者認(rèn)為要想判別一個(gè)金融賬戶交易行為是否正常,應(yīng)從兩個(gè)維度上來判斷,一是縱向上,與自身過往歷史行為模式比較;二是,橫向上,與其他賬戶之間做比較分析,從而發(fā)現(xiàn)此賬戶是否存在洗錢活動(dòng)。
在橫向上,本文認(rèn)為,橫向上應(yīng)該采取聚類分析和孤立點(diǎn)探測(cè)相結(jié)合的方法。首先,通過采集一些與待識(shí)別客戶身份與業(yè)務(wù)特征類似的正常客戶的樣本信息,建立參照組。然后,對(duì)樣本數(shù)據(jù)集進(jìn)行聚類分析,分析結(jié)果中將出現(xiàn)聚類數(shù)據(jù)和離群數(shù)據(jù),刪除其中的聚類數(shù)據(jù)。經(jīng)過上述數(shù)據(jù)準(zhǔn)備處理后,對(duì)于剩下樣本,采用局部孤立點(diǎn)算法,對(duì)每個(gè)樣本計(jì)算其孤立值。最后,根據(jù)孤立值的大小對(duì)這些樣本進(jìn)行排序。根據(jù)孤立值排序的結(jié)果也就是每個(gè)賬戶在相關(guān)屬性上的可疑程度順序表,監(jiān)管中心可以根據(jù)自身資源情況和這個(gè)順序表決定深入調(diào)查的賬戶對(duì)象。
在縱向上,判斷賬戶的即時(shí)交易行為是否符合其一慣的交易模式,如果該即時(shí)交易行為符合其一貫的交易模式,則被認(rèn)為是正常的,否則,則被認(rèn)識(shí)是可疑的。在縱向上,本文提出斷點(diǎn)分析技術(shù)構(gòu)建反洗錢調(diào)查方法。其主要思想是:建立一個(gè)移動(dòng)的窗口,窗口中裝有一定數(shù)量的交易時(shí)序數(shù)據(jù)。基于交易連續(xù)統(tǒng)一體理論,利用斷點(diǎn)分析,判別新進(jìn)入窗口的若干數(shù)據(jù)與窗口內(nèi)的“舊”數(shù)據(jù)相比較是否表現(xiàn)異常。這樣通過斷點(diǎn)分析確定的異常點(diǎn)或點(diǎn)的集合對(duì)應(yīng)的就是值得懷疑的交易,這些異常的交易行為便是我們所要挖掘的可疑洗錢行為。
四、結(jié)束語
利用數(shù)據(jù)挖掘技術(shù)進(jìn)行反洗錢數(shù)據(jù)監(jiān)測(cè)和分析,無論國內(nèi)和國際的相關(guān)研究都是新穎的。本文在對(duì)常用的數(shù)據(jù)挖掘技術(shù)在反洗錢領(lǐng)域應(yīng)用的述評(píng)基礎(chǔ)上,針對(duì)金融賬戶反洗錢問題從兩個(gè)維度上提出了兩種基于數(shù)據(jù)挖掘技術(shù)的反洗錢調(diào)查方法。下一步的工作將主要圍繞基于我國現(xiàn)行銀行業(yè)務(wù)條件下的特征提取、算法的實(shí)際應(yīng)用效果反饋分析等方面展開。
參考文獻(xiàn):
[1]楊勝剛王鵬:基于數(shù)據(jù)挖掘技術(shù)的人民幣反洗錢系統(tǒng)設(shè)計(jì).財(cái)經(jīng)理論與實(shí)踐,2005,11:105-110
[2]常樹民:金融業(yè)反洗錢問題研究.江西財(cái)經(jīng)大學(xué)碩士學(xué)位論文,2004
本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。