錢楚云
[摘 要]在大數據的時代背景下,傳統常規的審計手段逐漸失效,面臨著空前的挑戰。為了適應現代化發展,改革創新審計方法,并與其他學科領域相結合,成了一種必然的發展趨勢。而數據挖掘技術作為信息時代的一個典型代表,順勢出現在審計人員的眼前。挖掘數據,提取其中的有效信息,建立數學模型,最后進行結果分析,使審計憑從感覺,從大規模審計開始到現在從數學模型的異常信息中發現問題,進行有目的審計,減少了審計人員的工作量,極大提高了審計效率和準確度。但同時也需要在現代的審計方法中,規避新方法帶來的風險,從而從根本上保障判斷的準確性,降低審計整體風險。基于此,本文通過一個案例對數據挖掘審計模型進行簡單分析,闡述了數據挖掘審計模型的作用,并對數據挖掘技術對于現代審計的一些優勢和其中可能存在的一些弊端進行了分析。
[關鍵詞]數據挖掘;審計;模型;財務舞弊
doi:10.3969/j.issn.1673 - 0194.2019.20.028
[中圖分類號]F275.5[文獻標識碼]A[文章編號]1673-0194(2019)20-00-02
1 ? ? 財務舞弊數據挖掘的相關概念和意義
1.1 ? 相關概念
1.1.1 ? 數據挖掘概念
數據挖掘這一概念出現于20世紀80年代末,最早發展于數據庫領域,被稱為數據庫中的知識發現(KDD)。數據挖掘是KDD過程中的一個環節,雖然歷史不長,但發展比較迅速。數據挖掘這一專有名詞最早在1995年由美國計算機年會提出。數據挖掘是一門交叉性學科,涉及統計學、數據庫理論技術、機器學習、網絡科學、人工智能和數據可視化等多個學科領域的知識和技術。
綜上所述,數據挖掘還沒有形成一個完全統一的定義。而目前大部分學者較認同的定義是:數據挖掘就是從龐大的數據信息量中獲取有用的信息,即從大量的、無規律的、不完整且模糊的數據中發現有規律的、事先未知的、隱蔽的且潛在有效的最終可以被理解的信息。
1.1.2 ? 財務舞弊相關概念
美國注冊會計師協會(AICPA)對于財務舞弊的定義為:“是一種蓄意通過修改財務報告,產生不真實財務數據的行為。此行為包含以下各種情況:報告上記載沒有發生的交易;公司利益被管理者侵吞;從財務報告刪除重要的信息;漏列或錯誤反映經濟業務;偽造記錄或文件。”我國《獨立審計具體準則第8號——錯誤與舞弊》中對舞弊的定義是:舞弊指被審計單位的管理層、治理層、員工或第三方使用欺騙手段獲取不當或非法利益的故意行為。
雖然各國對于財務舞弊的定義存在差異,但都體現了舞弊的特點,即以欺詐、隱瞞等不正當手段謀取非法利益或隱瞞錯誤。財務舞弊是目前是比較普遍的現象,也是經濟社會中的一個“毒瘤”,對現代經濟發展造成了重大影響。相對于財務欺詐強烈而明確的目的性而言,財務舞弊從某種程度上來說,隱蔽程度更高,發現難度更大。
1.2 ? 意義
數據挖掘技術通過使用計算機來輔助人們從大量的信息數據中發現那些重要且十分隱秘的線索,以此手段輔助審計人員對相關領域的數據進行挖掘、審計、分析,降低審計風險,提高發現財務舞弊線索的概率。數據挖掘技術與普通的審計手段存在較大的不同,主要在數據發現方式上存在不同,數據挖掘主要通過運用模型和一些算法來發現數據間的關聯程度等,擴展了審計人員可以運用的手段,減少了審計可能存在的盲點。運用數據挖掘技術,可以利用統計、聚類、關聯、序列分析、群集分析等方法來對財務數據和類似性質的文件資料進行更深地分析和研究。
2 ? ? 國內外研究現狀
目前,對于數據挖掘的研究主要圍繞理論、技術和實際運用3個方面展開。國外在數據挖掘領域的發展主要是拓寬知識發現的途徑,進一步研究知識發現的方法。例如,近年來,對于Bayes、Boosting等算法的一些優化。相較于國外而言,國內對于數據挖掘的研究起步較晚,但發展速度較快,目前已經廣泛應用于審計、金融、客戶服務管理等領域。審計方面的研究主要是關于數據挖掘在審計數據分析中的應用、在審計過程的應用、在審計風險決策的研究等方面。
在數據挖掘審計方面,最早在2003年,《基于數據挖掘的審計模型框架》一文中就已經提出了需要在審計模型框架下,運用現代化的技術手段,即數據挖掘來輔助開展審計工作,以提高審計質量,降低審計中的風險,為現代化的審計提供了新思路。截至目前,數據挖掘在審計方面的應用已經有了許多細化研究,包括持續審計、財務舞弊、商業銀行內部審計等多個方面。
3 ? ? 數據挖掘在審計中的應用
數據挖掘在審計中的具體應用主要包括了確定審計對象、準備數據,對數據進行預處理、建立數據挖掘模型(以決策樹為例)、聚類,結果分析4個步驟。數據挖掘技術的一個重要的功能是從大量的數據中挖掘出有用的信息,但審計時一定要按照需求對信息進行篩選,有選擇性和目的性地挖掘數據。在該過程中,需求可能發生變動,不完全是固定不變的,是一個不斷優化和改進的動態過程,有可能在過程中發現和暴露一些問題。
3.1 ? 準備數據,對數據進行預處理
數據準備就是在確定審計對象后,開始進行數據采集、挖掘。數據挖掘技術主要是對數據進行統計與整理,主要運用了統計學和概率論的原理。在進行審計時,通過運用統計和分析等方法途徑,建立一個數學模型,用真實數據來驗證是否符合最初的數學模型。以一家商場為例,利用商場歷年已有年份的銷售和財務數據構建一個數學模型,對比各年銷售數據和查無實據與數據模型的數據有無異常波動,若有不正常的波動,就對商場進行相應審計調查,調查該商場是否存在虛報營業額、偷稅漏稅以及謊報銷售業績的情況。
對數據進行預處理時,要對已有數據的質量進行判斷,并處理其中無效的空值、異常值;對于缺值應該有針對性地對其進行再挖掘或者在分析過程中處理該缺值。分析各屬性中存在的缺失值個數以及缺失率,最終將其作為數據質量好壞的一個數據指標,在必要時,還需要轉變數據格式來滿足數據挖掘算法需求。此外,需要注意的是,因為數據來源非常廣泛,格式、形式都有所不同,因此,需要做好數據整合工作。
3.2 ? 建立數據挖掘模型——以決策樹為例
企業進行審計時,在擁有良性、有效數據的條件下,建立數據挖掘模型就成了決定數據挖掘技術在審計時能否發現財務舞弊的重要條件。決策樹是一種用于選擇決策的樹狀結構,每個決策結點都代表一個問題或者決策選項,不同分支分別指不同的決策輸出,最后的葉結點用以表示最終的決策結果。由于決策樹不需要通過前期學習來獲取其他領域的知識,進行一些特殊參數設置,且能夠從煩瑣、雜亂無章的數據中發現以及推理分類的可能性。由于算法本身的原因,計算量相對較小且成功率高,被廣泛應用于數據挖掘中。因此,在審計時,決策樹可以通過算法分類數據,并建立關鍵節點,從而發現那些可能存在異常的數據。
3.3 ? 結果分析——聚類分析
在結果分析中,企業通常使用聚類分析的方法,目的是找出數據中的關鍵節點,實際上就是建立一個模型對數據進行分析,通過該模型發現其中的異常數據,也就是與模型規律有差異甚至相反的數據。在審計中,通常而言,這類不符合模型的數據往往隱藏了許多重要信息,甚至可以反映出被審計單位可能存在的財務舞弊問題。但值得注意的是,通過數據挖掘技術構建的模型不一定是完全正確的,還需要審計人員根據被審計機構的實際情況進行分析,始終保持專業的角度以及懷疑的態度面對整個審計過程。
3.4 ? 實證分析
數據挖掘是大數據技術的一個基礎。以湖北省審計廳為例,該審計廳應用了大數據審計技術,構建了可以并行處理大規模數據的集群和在線數據集成工作站,在此基礎上構成了“一大網絡、四大中心、六大系統”大數據審計平臺,為數據傳輸、管理、共享和數據分析提供了一個基礎的平臺。
大數據審計的出現改變了原有的審計觀念,較為側重審計前的數據分析,通過審計之前的數據統計與數據分析,以此確定了審計的疑點和側重點,極大地促進了審計效率提高。在未使用大數據審計之前,審計15個左右一級預算單位的財務部門需要耗費15個審計組大概2個月的時間。而自從使用了大數據審計平臺后,15個審計小組1個月可以審計40個一級預算單位的財務部門。現在,只需要對整體財務數據進行統計分析、建模分析,重點審計其中的存疑數據,核實其中是否真的存在財務舞弊的問題。目前,大數據審計平臺的建立幫助湖北省審計局基本實現了審計全面覆蓋,基本上掃清了舊時審計存在的審計盲點,且提高了審計方向的準確度,減少了審計人員的工作量。在大數據審計的優勢下,企業、財政部門實施財務舞弊被發現的可能性增加,從根本上降低了財務舞弊發生的可能性,促進財務健康正向發展。
4 ? ? 數據挖掘在審計中的利弊
數據挖掘在審計中存在的優勢十分明顯。首先是數據挖掘技術對數據挖掘、處理和分析的能力十分強大,在技術層面上能夠給審計領域提供強力支持,類似于數據挖掘中的關聯技術和聚類技術,可以通過關聯技術由一個點牽連出一個面,幫助審計人員從看似毫無聯系的數據之間找到其中的隱藏關系,也可以利用聚類分析從一個廣泛分散的點中找出重要、關鍵的節點。由此,通過一系列數據挖掘技術,可以對數據進行充分整合,從而建立模型,以此進行審計預判,從而提高審計的效率和成功率,節省人力物力以及相關資源,提高了財務舞弊等財務問題的發現概率,幫助審計人員掃除了一些容易存在的思維盲點,提高了審計質量。
但數據挖掘運用于審計時也存在很多缺陷。其中最明顯的一點在于數據挖掘是多學科交叉的一種技術,要求審計人員在統計學、數據庫技術、機器學習、網絡科學、人工智能和數據可視化等多個學科領域都要具有一定的知識儲備,這對現在審計人員的專業素養提出了新的挑戰。如果審計人員的相關知識儲備不足,那么數據挖掘技術將會變得十分有局限性,所提供的幫助也非常有限。此外,數據挖掘技術始終是一種輔助手段,截至目前,還要依靠人來做最終判斷。
但從總體來看,數據挖掘技術給審計帶來了積極作用,為審計提供了一種新的思路和平臺,但也不可忽視其中的缺陷。因此,相關審計人員應盡可能地學習各個領域的知識,彌補數據挖掘技術的不足,盡可能地挖掘數據挖掘技術的潛能,為審計帶來更多便利。
主要參考文獻
[1]陳國欣.財務報告舞弊識別的研究——基于中國上市公司經驗數據[J].審計研究,2007(3).
[2]文柯芳,辛佳穎.基于數據挖掘技術的金融審計風險防范研究[J].經濟論壇,2013(7).