陳 強,代仕婭
(1.興業銀行 信息科技部,上海 201201;2.興業數字金融服務股份有限公司,上海 201210)
隨著商業銀行的業務范圍不斷拓展,經營環境日趨復雜,會計風險案件的發生也日益頻繁,涵蓋了資金詐騙、虛假交易、惡意刷單、非法集資等多種多樣的作案方式。會計風險事件一方面風險案件涉及金額通常較大,一旦發生將給商業銀行帶來嚴重的資金損失并產生較負面的社會聲譽影響;另一方面各類風險事件的作案方法越發復雜,內外部勾結、團伙合作等案件較難及時察覺,銀行往往缺乏有效的識別手段。這些都對銀行傳統的風險管理模式提出更嚴峻的挑戰,需要借助新技術、新方法來實現更有效的應對。
近年來,金融科技蓬勃發展,驅動金融業務經營與管理模式的創新變革。央行《金融科技發展規劃(2019-2021年)》明確指出,金融科技已成為防范化解金融風險的新利器,是新形勢下金融風險管理的內在需求和重要選擇。以大數據、人工智能、知識圖譜等為代表的前沿技術能夠對更多類型、更豐富的數據進行處理計算,從紛繁的信息中提煉、挖掘出潛在的風險特征,實現早識別、早預警、早管控,從而降低風險事件的損失,提升風險管理的時效性、前瞻性與精準性。
該文將金融科技相關的思維、理念與技術融入會計案件防控業務中,提出一種將傳統的會計案防業務規則與金融知識圖譜相結合的會計案防智能化平臺建設方案。該文將重點介紹平臺的整體架構,闡述大數據、知識圖譜等技術在平臺不同層面的交互應用,以及在此支撐下形成的全流程、自動化運作體系。最后,基于真實的金融行業會計欺詐案件以及多維業務數據,展示該平臺的智能化運行及對風險案件的識別效果。
商業銀行在防范會計欺詐案件時往往基于業務經驗以人工方式進行排查,一是經驗規則組合的覆蓋范圍有限,較難發現全局性、關聯性的特征,對團伙這類復雜的欺詐模式識別力度不夠;二是核查方式多偏向于事后檢查,時效性較低,且需耗費大量的人力,難以對風險事件進行及時的管控,故需要充分借助信息科技手段來提升會計案件風險防范的智能化水平。姜增明等(2019)指出商業銀行反欺詐的關鍵在于建立以大數據為支撐的風控體系,采用知識圖譜、社交網絡分析等技術以更有效地防范復雜模式下的欺詐風險;吳建光(2020)指出金融科技在會計非現場監控工作中的應用實現了對會計異常數據的自動監控、自動預警、自動通知,能有效提升會計監控的效率。
大數據平臺、人工智能平臺等作為重要的新型技術基礎設施,推動著各行業各領域的數字化、智能化轉型。康波等(2019)提出了面向行業應用場景的大數據、人工智能等基礎平臺融合建設方案,實現數據的整合共享、高性能計算和統一數據建模,并基于平臺推出了面向智能診療、智能輔助駕駛等多領域的應用。曹峰等(2018)指出金融等傳統行業對人工智能應用的需求不斷提升,相關計算平臺和應用服務平臺的統籌建設,是垂直行業智能化產品落地的重要基礎,能有效推動社會經濟智能化水平的提升。工商銀行基于大數據、人工智能技術搭建了新一代反洗錢智能平臺,對海量金融交易進行監測,在降低異常交易預警的同時,也極大地提高了欺詐交易的命中率。
該文將傳統會計案防領域的業務規則與大數據、知識圖譜等技術相結合,構建了面向金融行業的會計案防智能化平臺,將金融業務中實際發生過的15個代表性會計欺詐案件為設計藍本,對行業規則進行指標化拆解與計算,并構建金融知識圖譜以提取與挖掘關聯風險特征。實驗結果表明,所構建的智能化平臺實現了全流程、自動化的會計案件防范規則配置,并能對會計風險事件進行有效的甄別、預警與監控。
會計案防智能化平臺主要由數據處理層、智能分析層、業務應用層等部分組成,能對會計案件核查規則進行自動化配置,以實現風險的智能化核查、分析、預警等功能。平臺的整體架構如圖1所示。

圖1 會計案防智能化平臺架構
整個會計案防智能化平臺最底層連接各業務領域的數據系統,采集賬戶、企業、個人等會計案件多維度信息,為風險識別提供基礎數據來源。
數據處理層集成了多種主流大數據相關功能組件,實現了從原始數據采集、轉換、加工、各式處理及復雜業務計算的全過程。該平臺主體采用Hadoop分布式系統架構,在MapReduce批量處理的基礎上,通過Hbase和Phoenix解決統一查證準實時查詢性能問題;基于Spark生態系統,借助Spark Streaming對會計案防業務中的賬戶交易等實時信息進行處理,依托采用Spark mllib滿足案防場景中機器學習建模的需求,通過SparkSQL實現案防場景復雜規則計算和靈活的數據探索。同時,將會計案防相關主體和關系以節點、邊的圖數據模式存儲在圖數據庫中,供進一步的圖查詢與圖計算。
智能分析層在數據存儲及加工的基礎上,對行業知識與金融知識圖譜關聯特征進行提煉、展示與配置。其中,指標體系是對金融行業知識充分歸納、沉淀的結果,將會計案防業務邏輯進行解析,形成基礎指標庫,是識別會計案件風險的重要基礎知識。金融知識圖譜平臺依托各類圖計算引擎,采用多種圖分析方法,在關聯圖譜的基礎上結合業務分析經驗挖掘提取關聯規則,能更充分地識別隱藏的深層語義聯系。決策配置平臺將基礎指標與關聯風險特征相結合,構建出完整的規則指標體系,并通過規則的組合、嵌套進行靈活調整配置,實現對風險案件進行動態、有效地查詢、識別與監測。
在商業銀行會計案防工作中,基于長期業務經驗積累形成的風險規則邏輯,是識別欺詐案件的重要行業知識。而會計案防業務中原始的規則邏輯大都以文本的形式描述,不利于更新迭代,需要先對規則文本進行進一步拆解,形成指標化的規則集。以一條大額定期存款賬戶交易的規則邏輯為例,原始的規則邏輯描述為“近一年在原存期內,本行對公定期存款賬戶發生借方出賬金額達到單筆>=7 000萬元,且交易對手為銀行內部賬戶(原存期是指,在賬戶到期之前提前進行資金的支取)”,基于該文本描述的方式無法實現規則的線上自動化識別,需要對其進行分拆解耦。
首先對這條規則進行拆解,提取出關鍵的識別因素,如“賬戶類型”、“借貸標志”、“資金提取類型”、“交易金額”、“對手賬戶類型”等,再基于數據處理平臺的計算引擎對指標進行加工計算,得到具體的指標值。在業務應用中,對每一條規則設置相應的閾值以及組合邏輯,以形成指標化的規則策略。拆解方法如表1所示。

表1 指標規則化拆解示例
金融知識圖譜主要是通過大規模語義網絡,將金融領域中結構化、半結構化、非結構化等不同類型的數據進行整合,并以圖連接的形式加以展現。知識圖譜以實體或者概念作為節點,節點之間以關系為邊相連接,通過知識推理、算法建模等技術挖掘實體之間的關聯關系特征,探尋出業務現象背后隱藏的深層邏輯,使分析預測、搜索推薦、查詢決策等金融服務更加智慧、精準,進而增強金融機構業務的智能化水平。
2.3.1 金融知識圖譜子平臺的相關架構
金融知識圖譜相關子模塊主要由圖存儲、圖計算、圖分析、圖規則等部分構成,各個子模塊和子平臺之間相互獨立,又在業務流程上有一定的連通,整體架構如圖2所示。

圖2 金融知識圖譜子平臺相關技術架構
來自各個業務系統的會計案防相關數據信息一方面被加工、計算成業務指標,即用于生成最終的指標體系;另一方面經預處理后以圖結構的數據形式存儲于neo4j、Janus Graph等分布式圖數據庫中以供后續的圖計算與分析,同時預處理數據也通過構建索引的形式存儲于ElasticSearch搜索分析引擎中,實現高靈活性、高準確性、低延時及大規模并行化的檢索查詢。基于構建并存儲好的會計案防知識圖譜,采用GraphX、Gremlin等圖計算引擎進行全局的圖分析與圖推理,提取出圖結構中的關聯風險特征,并依托Spark mllib、python機器學習庫以及TensorFlow深度學習框架構建圖預測模型,能夠更深入地挖掘出關鍵節點、團伙關聯等隱藏特征,挖掘出群體作案風險。這些圖分析、圖模型結果最終融入傳統的業務規則指標,共同構成完整的知識規則體系,實現了淺層經驗知識與深層挖掘知識的結合,從而有助于提升會計案件防范的智能化效果。
2.3.2 金融知識圖譜的計算與分析
在平臺方案中,通過語義框架,確定圖網絡中的實體及實體間的關系;然后從多源異構數據中提取出實體、關系及屬性,并識別語義進行關系與屬性匹配,最終以“關系-實體-關系”三元組的形式存儲在圖數據庫中,形成會計案防領域金融知識圖譜。通過對知識圖譜的網絡結構的分析與挖掘,識別隱藏的關聯風險特征,是更深入預判會計案件欺詐行為的有效手段。
金融知識圖譜的關系挖掘主要指采用知識推理、圖算法等圖技術,從交易路徑、關聯強弱、單個賬戶、團伙賬戶等多維度挖掘出賬戶交易關系中隱藏的高風險特征,大致如下:
(1)面向賬戶關系挖掘的圖計算。
資金交易比重分析主要用來測算某一賬戶與各交易賬戶之間資金轉移金額的占比情況,當某一賬戶出現異常交易行為時,能夠迅速對資金交易份額較大的主要關聯賬戶進行重點關注與核查,及時預防與管控風險。
賬戶關聯強度分析主要從路徑排序、交易權重等方面探索兩個賬戶之間關聯交易的密切程度,尤其是對于兩者之間無直接的資金交易,但經過一系列中間賬戶后形成資金往來的賬戶,通過關聯強度的分析,可以挖掘出賬戶之間隱藏的交易聯系。
PageRank最初是通過網頁的鏈接數量來判斷某一網頁的重要性,運用在知識圖譜中,其思想的核心在于一個節點的影響力能通過與其相連節點的影響力來綜合衡量,故可通過用知識圖譜中每個節點的重要程度來計算,找到會計案件中的關鍵賬戶。
聚類算法根據賬戶在各個維度的特點進行類別劃分,將具有相同特征的賬戶歸集為同一類別,有利于發現行為相似的賬戶群體。
(2)面向賬戶關系挖掘的知識推理。
賬戶分層模式識別主要通過圖模式探索資金在各個賬戶之間轉移的路徑,通過對交易路徑的追蹤,找到資金最終的流向,特別適用于挖掘多層復雜場景下資金通過中間賬戶過渡轉移的現象,有助于判斷賬戶是否存在違規使用資金、進行高風險投資等行為。
資金轉移模式識別主要用來判斷兩種典型的可疑賬戶交易模式,一種是分散轉入、集中轉出,該模式常常蘊含非法集資的風險;另一種模式是集中轉入、分散轉出,與前一種模式正好相反,該模式通常存在較大程度的洗錢嫌疑,也可將交易模式圖轉換為交易波形圖,以波形的相似程度來定量評估賬戶交易模式的相似程度。
決策配置平臺將行業經驗生成的規則指標以及從知識圖譜中提煉的關聯特征進行匯集,形成完整的指標體系,并根據風險特征對指標進行靈活的配置與應用,同時根據指標配置后的規則在業務中的實際運行效果,對指標進行再開發與調試,以不斷適應業務的發展演變。其運行流程如圖3所示。

圖3 決策配置子平臺規則配置流程
在實驗中,以銀行內部的賬戶、企業、個人、機構等多維度信息作為數據基礎,構建賬戶知識圖譜,提取出關聯風險特征,并以實際金融活動中真實發生的15起會計風險案件作為欺詐樣本,將風險案件特點與行業知識經驗結合形成規則邏輯,依托智能平臺,對規則邏輯拆解加工后形成基礎指標規則,并與關聯風險特征相結合,形成完整的會計案件欺詐識別規則體系。最后,以安徽同業、齊魯銀行等銀行內外部的風險案件作為測試樣本,實際驗證會計案防智能化平臺的功能運行及風險識別的有效性。
智能化平臺金融知識圖譜用于對交易賬戶關聯關系的分析,圖網絡結構所標識的實體主要包含兩類,一類是賬戶實體,包含企業、個人開立的可發生資金交易行為的銀行賬戶;另一類是非賬戶實體,如經營機構、操作設備等。對應的實體之間的關系也主要分為兩類,一是賬戶與賬戶之間,主要是交易關系,由是否有資金往來確定,若發生過轉賬、支付等交易行為,則有交易關系;二是賬戶與非賬戶之間,具體關系需要根據非賬戶實體確定,如賬戶與經營機構之間是開戶關系,賬戶與操作設備之間是使用關系。構成的知識圖譜如圖4所示,箭頭表示資金的流向,箭頭的粗細表示資金轉移金額的大小。

圖4 賬戶交易關聯關系知識圖譜示例
采用前述知識圖譜挖掘方法,并結合關聯圖譜的基礎網絡關聯關系,智能化平臺更全面、深入地提取出了一些具有較高欺詐風險的關聯特征,如表2所示。

表2 知識圖譜關聯特征示例
通過對行業知識經驗的拆解分析,構建了涵蓋客戶、賬戶、交易、員工、營業機構等不同維度的基礎指標。由于在會計欺詐案件防范中,單個指標難以起到精準識別的效果,需要根據業務風險特點對指標設置合理的閾值并進行靈活的組合,以形成相應的業務規則。智能化平臺將基礎指標與基于知識圖譜提取的關聯風險特征相整合,并對各類指標進行靈活的多樣化組合配置(如圖5所示),在豐富規則體系的同時,能夠根據會計案件風險特征的變化及時調整預警規則,提升案件識別的動態性、前瞻性。

圖5 規則組合配置示例
3.3.1 風險識別精準性
以安徽同業、齊魯銀行等金融詐騙事件以及銀行內部違規操作案件作為代表性的測試樣本,驗證智能化平臺對風險特征識別的精準性,測試表明這些案件均觸發了多條規則組合,及時生成高風險預警提示,充分體現了智能化平臺在防范會計案件風險上的有效性。
以“資金流入高風險賬戶”這一高風險行為篩選為例,首先基于資金轉移模式進行第一道過濾,找出歸集賬戶(約800個);然后通過資金穿透模式進行第二道過濾,通過刻畫資金流向,尤其是多層復雜場景下的資金轉移路徑,更精準地定位出歸集賬戶及相關的風險賬戶(約100個),將其作為風險目標,如圖6所示。

圖6 資金流向圖模式
可以看出歸集賬戶吸收了諸多零散賬戶的資金,而這些歸集的資金最終主要流向了股票、基金、房地產等高風險賬戶;最后對第二道過濾后的賬戶進行人工排查,發現85%為高度可疑賬戶,排查結果充分表明了圖模式分析的精準性,大幅降低了人工核查的范圍。
3.3.2 規則運行效率
經過對計算精度、業務效果、系統性能等多方面的測試和實際業務檢驗,會計案防智能化平臺實現了從數據采集、指標生產、圖譜構建、關聯特征提取、規則配置到欺詐預警等全流程的自動化運行,極大提升了風險規則配置的效率,并最終在業務場景成功上線推出。
以規則配置流程為例,傳統的規則配置基于數據庫進行,對于一條預警規則,需要根據業務描述通過SQL進行規則編寫,然后再轉換成Perl文件格式投入到生產環境,每當規則邏輯發生調整或產生新的規則時,都需要重新編寫SQL并進行Perl文件的轉換,規則配置的效率較低,一個案例通常耗時2-3個月,且不利于規則體系的靈活調整。基于自動化的規則配置平臺,在指標體系建立后,只需要通過邏輯關系的組合和閾值的調整即可生成相對應的規則策略,同樣的案例只需要2周左右時間,配置效率得到極大提高,有力促進了風險管控的及時性。
3.3.3 平臺運行效果
平臺上線后,在運行近一年的時間里,對近3 000萬個個人活躍交易賬戶進行了監控排查,檢測出疑似問題交易流水上萬筆,挽回的損失金額達上百億元,為內控合規建立了一道有效的智能化風險防線。
針對商業銀行會計風險事件日益頻發且越趨復雜的現狀,該文將會計案防領域的行業知識與大數據、知識圖譜等技術相結合,提出了會計案防智能化平臺的建設方案,以實現會計風險事件的自動化、高精度識別。平臺采用Hadoop分布式架構,結合Spark生態系統進行高效的數據處理與指標計算,借助Neo4j等圖數據庫以圖結構的形式存儲數據并完成。
金融知識圖譜的構建及可視化展示,依托GraphX等圖計算引擎實現對知識圖譜中多維關聯特征的分析提取。基于銀行賬戶交易、企業、個人等多維數據,以及金融行業的真實欺詐案例信息,智能化平臺最終構建了數百個基礎指標與關聯風險特征,形成了較完整、豐富的會計案件欺詐風險規則體系,實現了淺層經驗知識與深層挖掘知識的結合。實驗測試結果表明,智能化平臺能實現全流程的自動線上運行,并有效識別與預警會計案件的欺詐風險。