李艷東
導語:大數據審計的研究和應用是近年來審計領域的熱點。大數據時代的到來給商業銀行內部審計帶來機遇和挑戰。筆者首先介紹商業銀行計算機輔助審計系統的演進過程,然后分析大數據審計的意義和特點。在此基礎上,重點研究大數據審計在商業銀行應用的創新思路,最后給出大數據審計的實施要點和相關建議,為今后大數據在商業銀行內部審計的應用提供借鑒和參考。
2020年10月發布的《中共中央關于制定國民經濟和社會發展第十四個五年規劃和二三五年遠景目標的建議》明確提出,要發展數字經濟,推進數字產業化與產業數字化。如何利用好大數據資源,全面揭示風險,推動商業銀行的數字化轉型,服務好實體經濟,是商業銀行內部審計部門一直研究和思考的課題。本文結合大數據審計系統的建設經驗,探索大數據在商業銀行內部審計的應用實踐。
商業銀行計算機輔助審計發展回顧
商業銀行的計算機輔助審計系統建設經歷了三個階段。第一階段是“配備裝備”,將主要的賬務數據、交易數據進行T+1日采集、轉換和加載,實現了線上分析疑點數據,解決了傳統審計人海戰術的弊端。第二階段是“推廣裝備”,改善系統可拓展性及可用性,增強數據加載和處理能力,接入包括對公信貸、零售信貸、國際業務在內的更多業務數據,并向審計分支機構進行推廣。第三階段是“升級裝備”,借以A(人工智能)、B(大數據)、C(云計算)為標識的信息技術蓬勃發展之勢,統籌行內外一切可用的數據資源,充分挖掘數據的內在價值,為實現內部審計的“風險警示、監督評價、管理增值”三大職能保駕護航。第三階段的系統一般稱為大數據審計系統,其邏輯如圖1所示。
大數據對商業銀行內部審計的意義
美國國家科學基金會(NSF)將大數據定義為“由科學儀器、傳感設備、互聯網交易、電子郵件、音視頻軟件、網絡點擊流等多種數據源生成的大規模、多元化、復雜、長期的分布式數據集”。大數據技術有四個基本特征(4V特征),即規模巨大(Volume)、類型巨多(Variety)、增長速度巨快(Velocity)、蘊含價值巨高(Value)。大數據審計是指依照法律權限采集各公共管理部門、社會公開的海量數據,利用跨領域、跨層次、跨行業、跨系統的全維度數據開展智能化的數據挖掘與分析,進行綜合審計判斷,形成審計結論。
商業銀行利用大數據進行審計的意義。一是借助更全面、更真實、更準確、更實時的大數據,形成新的審計模型,使審計更加科學、準確、客觀、統一、公正,提高審計發現問題的廣度和深度,提升審計能力和審計價值。二是解決傳統審計簡單重復勞動多、出差多、投入人力多的“三多”難題,實現對現場審計從支持、補充到替代的轉型。三是探索科技強審的路徑,推進審計工作的數據引領作用,增強風險防控的實時性、前瞻性和系統性,推動業務管理向信息化、精細化轉型。
商業銀行具備實施大數據審計的優勢。一是銀行存儲了客戶基本信息、交易流水、信貸明細、客服電話錄音、網點視頻錄像、網銀地理位置、信息系統登錄日志等多種格式、多種來源的數據。二是銀行在交易處理、風險防范、管理決策等過程中積累了豐富的數據處理經驗。三是銀行富有競爭力的薪酬待遇能夠吸引高端人才。四是銀行非常重視高新技術在金融業的研究和應用。
大數據背景下商業銀行內部審計的轉變
大數據審計的特點有“五多”:一是數據來源多,如財務數據、業務數據、管理數據、監管數據、客戶行為數據等。二是審計方式多,如既可與現場審計項目相結合,又可獨自開展遠程實時審計。三是技術手段多,如在數據采集、存儲、管理、分析、演示等環節,需要多種技術配合協作。四是協調關系多,如需要協調跨部門的資源,多個被審計單位支持配合。五是分析維度多,既能客觀、真實、實時對被審計單位畫像,又能從全行甚至全行業的角度進行宏觀判斷。大數據審計為商業銀行內部審計工作帶來思維模式的重要轉變,主要有以下幾點。
全樣非抽樣
全體樣本是指在大數據環境下,要分析與某事物相關的所有數據,而不再僅僅是依靠少量的樣本數據。其優勢是深入挖掘了數據的額外價值,避免了傳統做法的抽樣風險。
大數據的這個特點不僅降低了商業銀行內審部門的抽樣風險,而且能夠更具體、更精確、更全面、更及時、更多維度地分析和掌控審計對象,實現從“審計抽樣模式向”向“總體審計模式”、從“間斷性審計”向“持續性審計”的轉型。
相關非因果
相關關系是指從大量數據中揭示事物之間的關聯聯系,雖然其無法準確告知事情發生的起因,但是會提示我們這件事情正在發生。如大額欺詐交易之前往往會有小額試探性交易出現,而且這些交易發生的時間往往是深夜,發生的地點往往人跡罕至。
“尋找相關關系”這種思維方式,使得商業銀行內部審計部門不再局限于尋找因果關系,不再等待事件發生后去亡羊補牢,而是改變視角,通過抓“苗頭性”風險,推進審計關口前移,進而實現從“問題揭示型審計”向“價值增值型審計”的轉型。
輪廓非精確
大數據中只有約5%的數據是結構化并適用于傳統數據庫進行處理的,剩下的95%數據都是諸如日志、視頻、音頻等非結構化(NoSQL)或半結構化的數據。這使得我們沒有必要對每個細節刨根問底,只要掌握整體脈絡方向即可。
在微觀層面上適當忽略精細度,使得商業銀行內審部門能夠從更加宏觀的視角去把握系統性、趨勢性、區域性的風險,為經營管理決策提供有價值的建議。
長尾非二八
傳統帕累托法則指出,企業80%的利潤來自20%的高價值客戶。但互聯網時代更信賴長尾理論,即只要能以足夠低的成本覆蓋足夠廣的客戶,那么小眾客戶群對市場的貢獻將不容忽視。
由于資源有限,商業銀行內審部門過去將80%的精力投入到20%的高風險領域。而被忽略的剩余80%領域往往能夠帶來前所未有的、爆炸性、災難性后果的“黑天鵝”事件。依托大數據,商業銀行內審部門可以進行“大膽懷疑”,輔以現場查證進行“小心求證”,才能控制好已知的未知,最大程度防范未知的未知帶來的風險。
柔性非剛性
剛性生產是指為滿足大量社會需求的規模化的生產方式;而柔性生產是指為了滿足個性化需求而進行的多品種、小批量、智能化的生產方式。
商業銀行內部審計部門經常會面臨各種領域、各種類型的審計任務,會有五花八門、紛繁復雜的疑點數據分析需求。利用分門別類的大數據資源和便利的工具,審計人員可以通過研發規則靈活的審計模型來提取針對性強的審計線索,實現“風險提示、監督評價、管理增值”的審計目標。
遠程非現場
遠程審計是指商業銀行內部審計部門運用各種數據分析技術找出數據背后隱匿的規律,鎖定疑點線索,確定需要深入排查的人和事,并最終交由現場審計人員進行面對面溝通和確認的審計過程。
通過遠程審計,商業銀行大幅節約了投入到現場的審計資源,并且減少了對被審計單位的正常工作的影響。同時,在被審計單位沒有察覺、沒有準備的情況下開展分析與檢查工作,商業銀行內審部門會得到更加獨立、客觀、公正的結果。
商業銀行大數據審計創新應用
伴隨著大數據技術應運而生了諸如分類、邏輯回歸、聚類、關聯、決策樹、神經網絡、支持向量機、WEB數據挖掘等高級算法,使得商業銀行內部審計人員可以通過研發更加復雜和深入的模型,來提取審計線索,降低審計機構與被審計機構的信息不對稱。目前經典的大數據審計應用有以下幾種。
用網絡爬蟲技術實現審計對象全景畫像
在傳統的審計中,審計人員通過登錄國家企業信用信息系統或者啟信寶、企查查等平臺,手工查詢企業信息。但當批量査查詢企業信息時,這種做法將制約審計工作的時效性和審計人員的積極性。在大數據審計中,審計人員可以通過編寫Python腳本,自動獲取wbe頁面信息,并將數據標準解析、存儲和呈現,從而實現批量查詢的功能。通過互聯網爬蟲獲取的可供商業銀行內部審計使用的數據還包括司法、公安、稅務、公積金、國土資源、股票交易、社交活動、消費行為等數據。在遵循法律的前提下,利用互聯網資源,拓展了審計的數據源,豐富了數據分析的維度,使得審計人員能夠更加清晰地對審計目標進行畫像。審計對象全景畫像如圖2所示。
用關系圖譜技術識別審計對象的資金流轉情況
傳統數據庫是基于二維表的關系型數據庫。而當審計人員多次鏈接多個大表查詢交易流水的對手時,傳統數據庫的笛卡爾積處理方式嚴重制約了交易對手的多手查詢。
而關系圖譜技術引入了關系和節點的思想,把兩兩之間的關系以圖的方式展現,再對兩兩關系圖進行連接,直觀地變成關系群組。除了識別各個主體之間的相互關系外,關系圖譜技術還能將原來不存在直接關系的各個節點進行關系延伸,對當前節點的父節點、子節點、兄弟節點等多層次關系再進行深度挖掘拓展。
商業銀行內部審計通過運用關系譜圖技術,生成資金流轉網絡圖,能夠輕松展現資金多層流轉關系,發現重要節點之間存在的聯系,揭露現象背后深層次的原因。
用中文分詞技術挖掘文本文件的關鍵信息
審計人員經常會調閱被審計單位的會議記錄、工作總結報告、貸前調查、貸中審查報告、貸后管理報告等電子文檔資料,來分析和識別風險。這些文件的存儲格式五花八門,肉眼查看費時費力,分析效果主要依賴于審計人員的職業判斷能力,非常容易遺漏某些重要信息,造成審計風險。
中文分詞是一種將沒有詞的界限的中文句子切分成一個一個單獨的詞的語言處理技術,可以基于字典、詞頻度統計和知識理解來進行。通過該技術手段對文件進行識別和處理后,審計人員只要對需重點關注的名稱、地址、事件或其他關鍵詞進行詞權重提取,便能夠對文件的重要性進行排序,進而集中力量抓住重點文件進行突破,節省非結構化資料分析的時間和精力。
使用地理位置信息識別欺詐事件
地理位置定位是指通過特定的技術來獲取用戶的經緯度坐標信息,進而分析出其地理位置信息。定位技術有兩種,一種是基于GPS/北斗衛星系統的定位,另一種是基于移動運營網的基站的定位。前者是利用手機上的定位模塊將自己的位置信號發送到定位后臺來實現手機定位的,后者是利用基站對手機的距離測算來確定手機位置的。
傳統審計手段難以對審計對象的動態軌跡進行跟蹤分析。而借助于地理位置信息的變動,商業銀行內部審計能夠針對抵押品、客戶、員工的行為信息開展進一步的分析并及時發起風險預警。如某單位規定員工如果在辦公大樓附近租房,可每月獲得固定金額的租房補貼。該機構內部審計部門可利用App定位功能發現員工虛假申報租房信息、違規獲取補貼的行為。
商業銀行大數據審計的保障措施
高素質隊伍是大數據審計的關鍵。大數據審計首先需要既熟悉業務又精通技術,既善于溝通又樂于創新,既思維敏銳又敢于擔當的人才。而這種綜合性、復合型的人才的培養是非常缺失、無法速成以及難以招募的。商業銀行內審部門一方面應當借助于培訓、外招、外聘等手段,做好長遠的人才儲備;另一方面應加強對基礎理論和新型風險領域審計方法的研究,促進審計人員專業素養的提高。此外,商業銀行內審部門還需以審代訓,在審計實戰中通過不斷摸爬滾打,持續推動審計人員的專業能力和實戰能力的提升。
高質量數據是大數據審計的基礎。在信息化時代,數據是寶貴的資源。但無論是外部數據還是內部數據,都不同程度地存在重復、缺失、不一致等問題,嚴重制約了大數據審計工作的效果。商業銀行應當按照《銀行業金融機構數據治理指引》的要求,建立覆蓋全部數據的標準化規劃,遵循統一的業務規范和技術標準;持續完善信息系統,覆蓋各項業務和管理數據;加強數據采集的統一管理,明確系統間數據交換流程和標準,實現各類數據有效共享;建立數據安全策略與標準,依法合規采集、應用數據,依法保護客戶隱私。
高性能系統是大數據審計的引擎。商業銀行的大數據審計平臺不僅囊括了銀行的內外部數據,而且面向不同場景的數據需求配備了各種機器學習的復雜算法。因此,其應當構建企業級的數據平臺,實現一、二、三道防線共商共建、共享共贏、聯防聯控。只有借助全行大數據平臺的搭建,引進先進的數據分析工具,商業銀行才能充分挖掘半結構化和非結構化數據的價值,才能按照數據化、線上化的審計創新理念,強化互聯網時代信息技術對審計的引領和支撐作用。
(作者單位:中國財政科學研究院)