□文/劉 莎 楊會樸
(河北金融學院 河北·保定)
金融是現代經濟的核心,金融安全是保證國家經濟安全的防火墻,它關系到國家經濟與社會的整體發展。現階段,我國金融機構的監管體系主要由“一行三會”以及審計機關、社會審計組織、金融機構內部稽核、財政部、國家和地方稅務局、司法部門等共同構成。國家審計署2003年12月12日第一次實行審計結果公告制度至今,涉及金融業的共有20個公告,涵蓋了人民銀行、銀監會、國家開發銀行、農業發展銀行、中國出口信用保險公司、中國人壽保險(集團)公司、中國人民保險集團股份有限公司、四大國有商業銀行以及交通、光大、中信、招商等股份制銀行等。從這些金融審計結果公告及移送給公安部的重大金融違法犯罪案件可以看到,金融審計在揭露金融領域存在的重大違法犯罪問題和風險隱患方面發揮了重要的作用。然而,伴隨著銀行等金融機構業務處理高度電子化、數據海量化、控制隱形化、產品衍生化,問題越來越隱蔽,審計環境發生重大變化,審計人員面對海量數據無從下手,審計線索少了,審計經驗進入“尾隨”狀態。
長期以來,金融審計工作基本上全部由國家審計署及駐各地的18個特派員辦事處來承擔。相對我國地域廣闊、金融機構眾多,金融審計特有的復雜性和專業程度而言,金融審計面臨著審計任務繁重和審計力量薄弱的矛盾。近10年來審計署及特派員辦事處對4大國有商業銀行進行了審計,絕大多數銀行目前只進行了一個年度的資產負債損益審計。審計頻率最高的中國農業銀行,審計間隔一般在2年左右,審計公告又要延后兩年才能報出,審計監督不連續,對及時發現和揭露銀行經營中的問題和風險隱患顯得勢單力薄。
近年來,金融創新不斷增加,代收代付、基金托管業務、資產管理等中間業務大力發展,中資銀行業務向海外擴展,正如前美聯儲主席格林斯潘指出的那樣:新的技術、工具不斷出現和流行帶來了金融市場的急劇變化,這意味著一些金融機構資產負債表的墨跡未干,就已經過時了。隨著金融業務范圍不斷擴大,復雜程度加深,金融審計的重點從過去主要摸清家底、關注財務收支的合法合規性,轉變為關注銀行業務經營、內部控制、有無重大風險隱患等。而我國的金融審計卻主要集中在對金融傳統業務的審計上,著眼點仍集中在具體類別的經濟業務或賬戶記錄及余額。審計范圍的急劇變化,使其難以更早地預知金融領域的重大風險。因此,如何提高金融審計效率,對防范金融風險、保障國家金融安全至關重要。
數據挖掘,比較公認的定義是:“從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。”它區別于當前審計中利用SQL語句、ACL軟件等進行數據分析的方法。傳統數據分析主要依賴數據庫技術、審計經驗和電子數據的顯著特征來創建索引、檢索信息,提取有效的數據。而數據挖掘技術則是在沒有明確假設的前提下去挖掘隱含的、未知的信息,幫助審計人員進行數據分析,發現異常信息。
1、收集審計數據。根據審計對象和審計范圍對被審計單位的信息系統中數據文件進行采集,得到數據格式、文件大小等滿足要求的數據。對采集到的數據要進行確認,排除遺漏和失誤。比較常用的數據傳輸方法和工具有采取專用導入導出工具將審計所需的數據從對方的大型服務器導入到審計服務器中、在數據量很小的情況下通過網絡進行采集、通過移動存儲介質進行采集。需要注意的是,審計前對被審計單位業務流程、信息系統及數據庫結構的深入了解至關重要。通常在一個數據庫中會有很多數據表,各表之間會存在一些必要的關聯關系,在對被審計單位業務了解充分的基礎上可以根據需要只采集審計人員關注的數據表。否則,可能遺漏一些關鍵性的數據表,例如數據庫系統中有些表雖小,但卻是一些代碼型文件,這些表是形成審計中間表的基礎。
2、數據預處理。數據預處理是把采集到的審計數據轉換到審計中間表的一系列操作。原始數據中可能存在的問題有很多種,譬如缺失的或不完整的數據、不一致的數據、重復的記錄等,有必要在數據挖掘前對數據進行清洗。主要包括不完整數據和空值的處理、冗余數據的清理、錯誤值的檢測等。識別數據表名、字段名、記錄值代碼以及表間關系的經濟含義,將來源于一個或多個源數據的數據,按照審計目標和審計中間表的要求,進行數據字段層面和數據關系層面的變換、分拆或合并,映射到審計中間表,為實施數據挖掘技術做好數據準備。對數據轉換和清理過程要進行驗證,以保證數據清理和轉換工作沒有損害數據的完整性、正確性。
3、數據挖掘技術的具體運用。廣義的數據挖掘技術有:決策樹方法、神經網絡方法、相關規則方法、聚類分析、遺傳算法、孤立點分析等。
運用關聯分析利用不同會計科目及數據項目之間可能存在的某種對應關系,以及資產負債表、利潤表、現金流量表之間的勾稽關系,查找挖掘“不合邏輯”的信息。比如,資金收付金額與企業經營規模明顯不符的賬戶、交易金額、筆數異常的賬戶,進而審查客戶是否通過銀行賬戶從事不法活動、銀行是否存在審核不嚴、違規辦理結算業務等問題。
聚類分析是一種無指導的學習,受審計人員的主觀影響較小。它將數據分組成多個類,同一個類別中的對象之間具有較高的相似度。對于特定交易記錄群的聚類分析可以不同特征劃分為不同的特征群,從而描述各個群的特征,得到違反規律特征的類,找出離群孤立點,對其重點分析,確定審計風險,發現審計線索。比如,對銀行不良貸款的審計,通過將影響貸款質量的因素以定性或定量的指標加以描述,再借助于建立數據挖掘模型,從中發現其規律性和普遍的特征,區分貸款的級別,發現人為操縱貸款分類結果的現象。
孤立點分析用來發現數據源中顯著不同于其他數據的對象,例如部分極端值等。在被審計單位的數據源中經常含有一定數量的異常值,它們與審計數據源的其他部分數據不同或不一致,這些數據很可能就是一些可疑的數據,如可利用孤立點分析對信用卡客戶歷史用卡行為進行分析,如果檢測到不尋常的信用卡使用情況,及時確認交易是否存在欺騙,銀行是否予以授權、凍結資金等操作。
決策樹法,先根據訓練集數據構造決策樹,核心是歸納算法,從特殊到一般的過程,這是一種有指導的學習方法。譬如,在商業銀行個人貸款業務審計中,利用有問題的個人消費貸款數據,選取所在地區、收入、年齡、婚姻狀況、住房情況、是否違約等因素,應用決策樹方法進行挖掘,生成客戶貸款違約路徑規則,該分類規則作為審計的索引。
4、審計處理。審計人員對利用數據挖掘技術發現的可疑數據,進行重點核查,查找交易記錄,總結得出審計經驗,建立審計經驗庫,如果有新知識,就更新到知識庫中,作為日后新交易數據審計的經驗。數據挖掘工作是一個不斷重復執行的過程。
數據挖掘技術在金融審計中深入應用,首先離不開銀行等金融機構信息系統數據結構的標準化,其次需要利用銀行業務處理邏輯、數據間的勾稽關系、內部數據與外部數據的關聯,把有效的審計思路轉化為計算機程序語言,有效統一在分析框架內,使數據挖掘分析方法不再零散而成為體系。目前,數據挖掘技術在商業銀行審計中的研究相對較多,而在保險、證券等領域涉及較少,在銀行審計方面也主要集中在信貸業務和存款業務中,如理財產品、國際結算、系統內往來等諸多方面沒有統一的理論基礎和分析框架,尚未形成系統的數據審計方法。
數據挖掘技術對被審計單位的數據數量和質量要求較高,而目前對銀行系統內部控制缺少分析、測試和評價,信息系統內部控制的合理性、健全性和有效性又直接影響著數據的真實性、完整性和正確性,進而影響數據挖掘結果的可靠性。因此,亟待探討針對信息系統本身的審計方法。
[1] Jiawei H,Michel line K.范明譯.數據挖掘概念與技術.北京:機械工業出版社,2004.
[2] 陳艷嬌,易仁萍.金融審計免疫系統功能實現的路徑研究——基于審計結果公告的實證分析[J].審計研究,2009.3.
[3] 常法亮.基于數據挖掘的智能審計系統的設計與實現 [D].電子科技大學,2010.6.
[4] 程廣華.數據挖掘技術在商業銀行內部審計中的應用研究 [J].新會計,2011.3.
[5] 盧家輝,文華宜,張海燕等.商業銀行計算機審計模型研究.北京:中國時代經濟出版社,2009.