潘德寶
摘要:近年來,人民銀行各項業務信息化水平不斷提高,推廣使用了大量業務系統,積累了海量數據,但傳統內部審計手段難以有效揭示海量數據背后隱藏的舞弊信息,本文將數據挖掘技術引入基層央行內部審計工作,構建基于數據挖掘的基層央行內審模型,以改進傳統內部審計方法,適應信息化快速發展需求。
關鍵字:數據挖掘基層央行內審模型
一、數據挖掘技術概述
數據挖掘(DM)是一種計算機輔助技術,用于從海量的、不完全的、有噪聲的、模糊的、隨機的數據中抽取出潛在的、有效的、新穎的、有用的和最終可以理解的知識的過程,又稱數據庫知識發現(KDD )。數據挖掘既能針對特定數據庫進行簡單的檢索和查詢,又能進行多層次、全方位的統計、分析、綜合和推理,越來越多的組織開始對記錄交易活動、經營狀況和市場信息的海量數據進行數據挖掘,從而獲得有價值的信息,提高組織的盈利水平和競爭能力。數據挖掘技術主要功能有:概念描述、分類預測、估值分析、關聯分析和聚集分析等。
(一)概念描述。概念描述是依據分析對象的內涵,挖掘其普遍性、表征性、高層次和宏觀知識,以反映同類對象的共同屬性,是對數據的概括、精煉和抽象。審計人員可用概念描述的方法總結概括審計數據,并在概念層次進行呈現。
(二)分類預測。數據分類是針對分析對象的某一特定屬性建立分類模型,利用該模型將數據庫中分析對象劃分成若干組,達到“物以類聚”的目的,分類可為某對象提供預測值,分類預測是數據挖掘中發展最充分的領域。
(三)估值分析。估值分析能測算出連續性變量的值,輸入一些特定的數據,通過估值分析,得到其他難以直接獲取的變量的值,然后根據分類規則進行分類。審計人員可以通過估值分析尋找異常的財務收支線索。
(四)關聯分析。關聯分析可以挖掘數據庫中頻繁出現的模式知識,即關聯規則,反映了不同屬性間依賴或關聯關系。審計人員對審計對象數據庫中的數據進行關聯分析,發現異常聯系,尋找審計線索,發現審計疑點。
(五)聚類分析。聚類分析面向未明確分類的數據,將數據中較接近的劃歸一類,同一類別數據間的相似性盡可能大,不同類別的數據間相似性盡可能小。審計人員可將具有相似性的會計數據進行聚類分組,從而發現異常賬目。
二、基層央行內部審計引入數據挖掘技術的必要性
目前,中國人民銀行廣泛使用的業務系統有國家金庫會計集中核算系統(TCBS)、貨幣金銀信息系統和中央銀行會計集中核算系統(ACS)等40余個,伴隨而來的是業務處理高度電子化、控制隱性化、數據大集中、數據海量化,海量數據可能隱藏了大量的舞弊和違規信息,引入數據挖掘技術可以有效降低審計風險、提升審計能力、拓展審計范圍和提高審計效率。
(一)降低審計風險。各類業務系統的普及推廣,導致審計對象從傳統的紙制賬簿到種類繁多的電子數據的轉變,審計責任和審計風險隨之加大,將數據挖掘引入基層央行內部審計,對海量數據進行采集、處理和分析,能夠有效發現審計線索,顯著降低審計風險。
(二)提升審計能力。隨著央行各項業務和管理活動信息化的進一步普及,內審部門在審查紙質材料的同時,對各類業務數據進行挖掘,能有效識別各類風險,發現控制缺陷,壓縮審計成本,進而更好的服務于人民銀行各項業務目標的實現。
(三)拓展審計范圍。數據挖掘依托數據庫技術通過計算機實現,具有高速、快捷、準確的特點。審計人員利用數據挖掘能積極開展事前審計、事中審計和效益審計,擴大審計范圍、提高審計質量,逐筆進行審計、降低抽樣風險,使全面審計成為可能。
(四)提高審計效率。數據挖掘使得部分審計資料的審查與分析工作依靠計算機完成,有效實現持續審計和聯網審計,擺脫“數據豐富,信息貧乏”的尷尬局面,及時監測和預警各項業務風險,查找風險隱患,控制業務漏洞,審計效率顯著提高。
三、基于數據挖掘的基層央行審計模型
本文根據基層央行業務實際和數據挖掘技術處理要求,構建了由數據收集、數據整理、數據挖掘和審計發布四階段構成的基于數據挖掘的基層央行審計模型,其流程如圖1所示。
(一)數據收集階段
基層央行內審部門應結合轄區業務實際,積極開展風險評估工作,確定各業務風險排序,擬定審計項目,針對特定的審計目標和審計內容進行廣泛而深入的審前調查,掌握審計的范圍、審計的內容、審計所需的信息。根據審前調查情況,審計人員有目的性的收集和整理與審計相關的數據,服務于審計項目。該階段審計人員在保證不影響被審計單位業務系統的平穩、持續運行前提下,采取諸如Microsoft SQL Server 2000數據轉換工具,獲取、更新和維護審計相關數據。
(二)數據整理階段
圖1基于數據挖掘的基層央行審計模型流程圖
該階段審計人員在充分分析數據質量的情況下,運用數據庫各表之間的勾稽關系,剔除垃圾數據,清理、轉換、載入和驗證提取的數據,建立審計數據倉庫,數據倉庫中的審計數據是是集成的、一致的、高質量的,便于后續審計工作的開展。數據倉庫是面向特定審計主題的,不同被審計單位的審計主題不盡相同,因此審計人員要為不同審計對象設計不同的數據倉庫,設計數據倉庫包括數據倉庫模型設計及數據處理設計,是一個循環往復、不斷優化的過程,需要不斷地反饋不斷地完善。該階段審計人員主要任務是為采集到的審計數據建立一個獨立與被審計單位數據庫的數據倉庫,提供適合聯機分析處理和數據挖掘的數據存儲環境。
(三)數據挖掘階段
該階段審計人員可以使用簡單分析和多維分析工具對數據倉庫進行數據分析,如:采用聯機分析處理的切塊、切片、旋轉和鉆取等技術,對審計數據進行比較分析、比率分析、趨勢分析等。但在海量數據情況下,審計人員必須采用諸如統計分析、決策樹、人工神經網絡和關聯規則等數據挖掘算法,對數據倉庫進行數據挖掘。
1.選擇數據挖掘算法。不同數據挖掘算法的思路、步驟、功能和應用領域不盡相同,審計人員應根據審計主題選擇挖掘方法,以得到對審計有指導意義的知識。
2.建立數據挖掘模型。選擇數據挖掘算法后,從分析數據入手,從數據倉庫中提取主要變量,剔除無關變量,建立適合該算法的數據挖掘模型。
3.驗證數據挖掘模型。從數據倉庫中選取多個樣本數據,對挖掘模型進行驗證,確保數據挖掘模型實現既定審計目的。
4.運行數據挖掘模型。挖掘模型的運行由專業計算機工具完成,審計人員要認真評估挖掘結果,判定挖掘結果的準確性和有效性,保證挖掘結果得出正確審計結論。評估結果可能導致退回到之前的階段,重新選擇數據集合、數據挖掘算法或調整挖掘算法參數。
5.構造審計知識庫。數據挖掘模型運行后,會呈現隱藏在數據倉庫中的一些規律或者展示異常審計數據,這些規律或者異常稱之為審計知識,不同的審計知識存儲在一起即構成了審計知識庫,審計人員利用審計知識提取審計線索或違規及風險情況。
6.循環利用審計知識庫。在以后開展審計項目時,審計人員首先查看審計知識庫,采用可以直接使用的審計知識,否則按照上述步驟構造適合本次審計的挖掘模型,并將新的審計知識存入審計知識庫。審計知識庫的循環使用提高了審計的效率,實現了資源共享,提高了審計質量。
(四)審計發布階段
審計人員利用掌握的審計證據,對提取的審計線索、審計違規及風險狀況進行解釋和驗證,評估形成審計結論,對審計結論進行一致性和效用性處理。主審人組織獲得的審計結論,以事實確認書的形式向被審計單位征求意見,最終形成審計報告。
四、基層央行應用數據挖掘審計模型相關建議
(一)大力宣傳數據挖掘理念。2012年,具有數據挖掘功能的人民銀行計算機輔助審計系統正式上線運行,且在國庫和貨幣發行業務領域進行了應用,取得了顯著成效;2013年,下發了《中國人民銀行辦公廳關于計算機輔助審計工作的指導意見》,進一步規范計算機輔助審計相關事項。基層央行要以此為契機,大力宣傳數據挖掘審計理念,集中力量開展數據挖掘審計模式攻關研究,為數據挖掘審計模式的推廣應用營造氛圍。
(二)著力搭建溝通協調機制。基層央行內審部門要推廣數據挖掘審計模型,必須建立溝通協調機制。技術部門要按照權限提供相關業務系統的系統需求、數據庫設計和數據字典等信息,并在系統研究、數據采集和數據挖掘等方面提供必要的支持和配合;相關業務部門要積極提供內審部門開展數據挖掘審計所需相關數據,不得以任何借口和理由拒絕或踢皮球;內審部門要不斷探索應用數據挖掘技術的方法和路徑。
(三)全力培養專業審計人才。基層央行內審部要推廣數據挖掘審計模型,亟需具備數據挖掘和信息技術創新應用能力的“數據分析師”和負責業務知識研究及分析思路構建的“業務分析師”兩種專業審計人才,因此,要全力加強人才培養和人員培訓,統籌專業分析人才與數據分析人才、普通應用人才與高層次人才全面發展,鍛造一支理論水平高、實踐能力強的復合型人才隊伍,推進數據挖掘技術在基層央行內部審計中的廣泛應用。
參考文獻:
[1]曾德勝等.基于數據挖掘的審計系統研究[J].《長春工程學院學報》,2011.12.1:124-127。
[2]白濤.“大數據”時代內部審計發展策略的理論思考-以“信息化審計”引領未來發展[J].《西南金融》,2013.2: 7-9。
[3]陳寶等.數據挖掘技術在財產保險行業非現場內部審計中的應用[J].《合作經濟與科技》,2013.11:76-77。
[4]程廣華.數據挖掘技術在商業銀行內部審計中的應用研究[J].《金融視角》,2011.3:47-49。