葉曾靜
摘 要:通過數據挖掘技術,不僅可以發現數據的顯現關系還可以發現數據的潛在關系,節約了大量人力物力,極大便捷了審計工作。
關鍵詞:數據挖掘;審計數據分析
一、引言
以前,審計人員基本是運用決策樹、線性回歸等方法,再結合MATLAB、R語言等進行結構化數據分析,卻忽略了對非結構化數據的分析;并且,一般采用的是因果關系的思考方法,但數據之間的關系極其復雜,深入分析會消耗大量的人力與物力。而數據挖掘不僅可以進行非結構化數據分析,還能自動發現潛在問題,增強審計的客觀性與可靠性。在大數據環境下,平臺提供數據挖掘模型,審計人根據審計目標的不同,進行多維數據的挖掘與分析,節省人力物力,轉換審計數據分析的思維。
二、傳統的審計實施框架
首先,審計準備階段。在開始審計前,審計人員核查被審計單位的內部以及外部文件,包括紙質和電子等形式的文件,對財務報表上所包含的信息進行審查。然后,檢查被審計單位的有形資產,例如存貨的盤點、固定資產的盤點等。詢問相關人員后,了解被審計單位的信息以及內部控制的運行情況。通過函證了解被審計單位的財務信息及相關披露信息,以及了解被審計單位現存情況。最后,對于一些數據化的文件借助計算機輔助審計技術驗證其準確性。
其次,審計實施階段。一般,通過對企業的會計憑證、會計賬務與財務報告進行核查,對于有形資產實地進行勘查等,審計人員自身實施審查和取證。目前,對于中小企業,普遍的情況是自身會計制度不健全,對于憑證、賬本等資料的保存并不完善,雖然大部分的企業已經采用會計電算化,但電算化與非電算化的信息的結合還不是很好,導致審計人員很難將兩者結合運用,增加了審計時間;對于大企業,會計制度比較健全,但數據繁多,靠審計人員人工審查將耗費大量的時間。
最后,審計終結階段。審計人員依據之前的實施階段審計出的情況反映在工作底稿上最終給出審計意見。
三、傳統審計程序下會出現的風險
通過上一部分,我們可以了解到整個審計程序,但從中也能發現,現在的審計實施階段還存在著大量的風險。比較明顯的幾點。第一,被審計單位文件數據保存不完善,沒有最初的會計憑證,審計人員很難判斷被審計單位的會計分錄與財務報告中的數據是否真實可靠。第二,非財務信息很難真實了解,傳統程序下,非財務信息一般是通過被審計單位內部人員來了解,而這些人員一般基于心理壓力,很難真實反饋甚至是不配合。第三,數據繁雜審計人員難以在短時間內了解清楚,在繁雜的數據下,審計人員只能憑經驗著重審查某些地方,被查出的地方一般是表面的問題,難以追其根源,且被審計單位可能存在虛假數據的情況,加大了審計難度;隨著數據總體的增加,手工審計明顯力不從心了。
四、數據挖掘技術有效避免大部分傳統下的風險
目前,大部分運用的是Hadoop框架。第一階段,審計數據采集階段。審計人員一般從三個方面采集。第一,結構化數據,是指被審計單位的財務數據和業務數據,是審計數據的基礎。第二,通過互聯網、各大社交網站等尋找非結構數據。第三,內部審計資料和內部管理數據,通過內部控制管理了解被審計單位。采集到上述的資料,整合到數據庫為下一階段的數據處理做準備。第二階段,這一階段是運用數據挖掘與人工審計和單節點審計的最大區別點,首先對數據進行預處理,把數據集成,進行清洗去除冗余的數據最后進行數據質量檢查,在這期間數據會通過基礎數據庫、標準數據庫到達數據倉庫,這樣,整個數據都已準備完畢,接下來結合統計分析、數據挖掘、數據可視化到達數據分析階段。
在第二階段與第三階段中間的數據分析是對最后審計人員能找到審計疑點的重要一環。審計人員運用不同的方法進行挖掘分析,找出其中的異常關系,作為判斷舞弊的有效審計證據。在此部分,介紹兩種方法。第一種關聯分析。關聯分析將各個知識進行關聯,運用推理規則和語義分析等技術來展現文本信息之間是否存在某種隱含的關系。第二種則為文本聚類。首先,采用文本聚類的算法找出以特殊形式藏在大數據之中難以發覺的信息,推測是否有舞弊和違規行為;其次,進行文本聚類,將每一類文本進行具體的分析、比較和總結,找出異常數據的原因。最后再進行結果可視化,以簡單便于理解地方式表達出來,結果可視化通過可視化的視覺符號,例如網狀圖、樹狀圖、思維圖、坐標等,將各文本之間的關系清晰地展示出來,審計人員根據不同的審計目標,進行多維度分析。
由此可見,大數據時代下的數據挖掘技術,能夠提高審計數據分析能力,找出隱藏的問題,降低審計風險。
參考文獻:
[1]胡珊珊.數據挖掘技術在現代審計中的應用研究[J].老區建設,2015(08):44-45.
[2]程平,張雅頔.大數據時代基于云會計的審計實施框架構建[J].會計之友,2015(24):134-136.
[3]謝志明,蔡琴,李俊杰.云計算與大數據體系下的審計模式轉變[J].財會月刊,2016(04):68-70.
[4]胡洪斌.大數據時代數據式審計方法重構[J].財會通訊,2017(19):117-119.
[5]張志恒,成雪嬌.大數據環境下基于文本挖掘的審計數據分析框架[J].會計之友,2017(16):117-120.
[6]賴麗珍.大數據背景下云審計平臺系統的構建[J].財務與會計,2017(03):43-45.
[7]肖雅文,王佳.基于數據挖掘的審計體系構建[J].現代商業,2018(25):140-141.
[8]陳天佑. 數據挖掘技術在稅務審計中的應用研究[D].江西財經大學,2019.
[9]張娟. 大數據環境下內部審計信息化研究[D].北京交通大學,2019.
[10]霍欣.大數據審計下統計分析方法研究[J].財經界,2020(10):227-228.
[11]王良,鮑喜,王云,周建成,張海超.基于數據挖掘算法的審計數據分析及案例應用[J].中國注冊會計師,2020(06):101-105.
[12]太自紅.關聯規則算法在審計數據分析中的運用[J].審計與理財,2020(05):18-19.