[提 ?要]隨著信息技術的發展和網絡的廣泛普及,審計數據和網絡數據以驚人的速度增長。審計過程中利用計算機技術的程度越來越高,審計人員面對大量的財務數據或非財務數據。在審計系統中引入數據挖掘技術,顯示出了巨大的優勢,本文介紹了審計中引用數據挖掘技術的程序和方法,并指出了這一技術應用于現代審計中的一些局限。
[關鍵詞]數據挖掘;審計;技術
作者簡介 ?胡珊珊(1982-),女,江西經濟管理干部學院講師、審計師、碩士,研究方向為審計。(江西南昌 330000)
隨著經濟的發展,企業活動的日益錯綜復雜,交易數量的龐大對各項交易進行記錄、分析的過程如果仍然依靠手工操作,會導致工作效率嚴重低下,并且工作成本大大增加。與此同時,隨著計算機技術和網絡的普及,人工智能系統已經被引入企業管理,如供應鏈管理系統(SCM)和企業資源計劃系統(ERP),這些系統使企業的眾多交易活動都可以通過計算機實時在線錄入,形成大量的數據,現代審計面臨著數據庫中的海量數據,如何從中尋找出一定的數據特征,發現可疑數據,以提高審計效率和降低審計風險,是審計人員面臨的嶄新課題。
一、數據挖掘技術在現代審計中的應用
數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的但又是潛在的信息和知識過程。這一概念要求數據源必須是真實的、海量的、有噪聲的。數據挖掘是一個完整的過程,該過程從大型數據庫中挖掘先前未知的、有效的且可用的信息,并利用這些信息做出決策或者豐富知識。
數據挖掘改變了審計實踐的方式。由于信息技術的普及,很多企業引入人工智能系統,這些系統使企業的眾多交易活動都可以實時在線錄入,各種事件包含大量會計數據和經營管理數據。審計人員通過對數據的分析獲得審計線索,獲取有用的審計證據,并發表適當的審計意見。數據挖掘可以從大量的數據中發現隱藏于數據中的新的或者不可預見的模式,可以回答審計人員可能根本沒有想過的問題。
在審計過程中運用數據挖掘技術的基本思路是這樣的:首先接受日志收集信息系統各部件提交的統一格式的審計數據,然后對這些數據進行預處理,比如轉換格式、數字提煉等。接下來運用合適的數據挖掘算法對審計數據進行處理,提取數據中隱藏的知識,并對實踐進行統計。最后系統地進行審計數據的分析處理及趨勢預測。
目前應用于現代審計業務的數據挖掘技術主要有以下幾種方法:
(一)離群點挖掘
離群點挖掘是從大量復雜的數據中挖掘出存在于小部分異常數據中新穎的、與常規數據模式顯著不同的數據模式。利用離群點挖掘,一方面可以對審計數據進行有效的預處理,減少審計數據量,快速定位數據,從而提高審計效率;另一方面可以自動的從數據中提取難以發現的業務模式和管理模式行為,減少人工參與,減輕審計人員工作負擔。
(二)孤立點檢測
孤立點是在數據源中與眾不同的數據,使人懷疑這些數據并非隨機偏差,而是產生于完全不同的機制。由于審計中可疑數據往往表現為孤立點,所以通過檢測并去除數據源中的孤立點可以達到數據清理的目的,從而提高數據質量,以達到審計目的。
(三)異常點檢測
異常點檢測是數據挖掘技術中重要的研究內容。它是從大量審計數據對象中挖掘少量具有異常行為模式的數據對象,很多情況下,這些審計數據對象包含了跟多審計人員感興趣的信息。
(四)聚類分析
數據聚類是將審計資料數據中較為接近的數據劃為一類,根據不同數據的特征,將對象分成幾個群體。聚類分析可應用于控制測試階段,為測試各控制環節的執行情況將具有相似特征的交易分組。繼而更有利于審計人員對相似數據進行分析、挖掘。
(五)關聯規則
關聯規則發現是通過分析資料,找出某一事件或資料中會同時出現的東西。關聯規則挖掘用于發現大量數據集合間有意義的關聯,它側重于數據中不同領域之間的聯系。審計信息系統運用關聯規則提取數據之間的聯系,能有效的分析經濟業務中數據的相關性,從而使審計人員更準確的發現數據之間的聯系。
隨著信息技術的迅猛發展和審計實踐的變化,這些技術還在實踐中不斷的完善和發展,將來必定有更多更有用的數據挖掘方法應用于審計實踐。
二、數據挖掘技術應用于現代審計工作的意義
隨著信息技術的發展和網絡的廣泛普及,審計數據和網絡數據以驚人的速度增長。審計過程中利用計算機技術的程度越來越高,很多大型組織已經建立并運行著特大數量級的應用數據庫,并積累了大量的歷史數據。審計人員面對的也不再是紙質的會計資料,每一個被審計單位的計算機系統和網絡系統中都存在著大量的財務數據或非財務數據。在審計系統中引入數據挖掘技術,顯示出了巨大的優勢,尤其是在大規模網絡環境下進行的數據挖掘,不但可以提高系統的運行效率,還能增強系統的智能性。
數據挖掘作為一種新興的技術,與以往的單純的統計方法相比,其優勢在于它能從數據中發現人們未知的知識和規律。我們引入數據挖掘技術的目的是建立一種系統化和自動化的創建入侵檢測系統的方法,這種方法采用以數據為中心的視點,將入侵檢測視為一個數據分析過程。這種方法符合現代審計的需要,其核心是將數據挖掘技術應用于審計數據,從中分別提煉出正常和入侵情況下的用戶行為模式,再由生成的模式庫匹配入侵檢測系統所采集到的數據以捕獲網絡入侵。它不僅可以處理大規模的數據,而且不需要審計人員提供主觀評價信息,這種技術能發現容易被審計人員主觀忽視和隱藏的信息,有利于避免有價值的線索被人為的主觀因素所忽略的情況。
三、數據挖掘技術應用的局限性
數據挖掘技術在西方審計中還處于初級階段,它的應用還有一定的局限性。
1.數據質量難以保證
數據挖掘技術的基礎在于數據本身的質量,如果數據本身是虛假的、錯誤的,特別是作為審計對象的那些數據如果被審計單位篡改了,那么再先進、再成熟的數據挖掘技術也無法得出有意義的結論。
2.使用成本高
數據挖掘技術要應用于實際工作中,必須要產生相應的數據編制成本、維護成本、分析成本和人員培訓成本,一些數據軟件的成本費用更是高的驚人。成本因素也是數據挖掘技術應用于審計工作中的一個局限。
3.對審計人員的素質要求高
由于審計數據特征和測度是根據建模者的經驗和知識選擇的,因此數據挖掘技術要真正應用到現代審計工作中來,不僅需要審計人員具有豐富的審計理論知識和實踐經驗,而且還要求他們掌握計算機的專業知識,熟悉數據庫和數據挖掘的技能。他們不僅要能識別、運用挖掘技術,而且還要對結果做出有效的分析和評價。
四、結論
盡管數據挖掘技術應用于現代審計技術還處于初級階段,但它的巨大優勢是傳統審計方法無可比擬的,相信在不久的將來隨著審計人員技術水平的提高和對數據挖掘技術研究的深入,數據挖掘技術必定將在現代審計中有更廣闊的應用前景。
參考文獻
[1]李博羅,良辰.中觀信息系統審計風險控制體系研究[J].審計研究,2013,(11).
[2]曾德勝澎燦明.基于數據挖掘的審計系統研究[J].長春工程學院學報:自然科學版2011,(1).
責任編輯:程文燕endprint