吳勇 何長(zhǎng)添 方君 張超



【摘要】準(zhǔn)確識(shí)別客戶可能存在的異常行為和舞弊風(fēng)險(xiǎn)是財(cái)務(wù)報(bào)表審計(jì)中的關(guān)鍵步驟, 面對(duì)審計(jì)過(guò)程中的海量數(shù)據(jù), 審計(jì)人員亟需使用新的理論方法和技術(shù)工具, 系統(tǒng)地挖掘和分析數(shù)據(jù)背后隱藏的反映公司舞弊的規(guī)律和特征。 為了指導(dǎo)審計(jì)人員將相關(guān)數(shù)據(jù)挖掘技術(shù)高效地應(yīng)用于具體審計(jì)活動(dòng), 在系統(tǒng)總結(jié)和梳理審計(jì)大數(shù)據(jù)的本質(zhì)內(nèi)涵與特征分類的基礎(chǔ)上, 明晰審計(jì)大數(shù)據(jù)挖掘分析與傳統(tǒng)數(shù)據(jù)分析的差異, 探尋數(shù)據(jù)挖掘技術(shù)在財(cái)務(wù)報(bào)表舞弊審計(jì)中的最佳應(yīng)用模式, 建立數(shù)據(jù)挖掘技術(shù)應(yīng)用于財(cái)務(wù)報(bào)表舞弊審計(jì)中的整合性框架。
【關(guān)鍵詞】大數(shù)據(jù);財(cái)務(wù)報(bào)表;舞弊審計(jì);數(shù)據(jù)挖掘;數(shù)據(jù)分析
【中圖分類號(hào)】 F230? ? ?【文獻(xiàn)標(biāo)識(shí)碼】A? ? ? 【文章編號(hào)】1004-0994(2021)03-0090-9
一、引言
伴隨著云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、區(qū)塊鏈、數(shù)據(jù)分析與可視化、流程自動(dòng)化以及人工智能等創(chuàng)新技術(shù)在會(huì)計(jì)、審計(jì)和財(cái)務(wù)領(lǐng)域的廣泛應(yīng)用, 數(shù)字化信息呈爆發(fā)性增長(zhǎng), 大數(shù)據(jù)已成為企業(yè)獲取競(jìng)爭(zhēng)優(yōu)勢(shì)的關(guān)鍵性基礎(chǔ), 也是未來(lái)企業(yè)提高生產(chǎn)率、創(chuàng)新以及進(jìn)行價(jià)值創(chuàng)造的重要源泉。 在對(duì)大型組織實(shí)施審計(jì)的過(guò)程中, 審計(jì)人員雖然可以獲取客戶組織內(nèi)、外部的大量數(shù)據(jù), 但同時(shí)也易于被這些數(shù)據(jù)所淹沒(méi)[1] , 因此系統(tǒng)地挖掘和分析大量數(shù)據(jù)背后公司的行為特征, 特別是準(zhǔn)確識(shí)別客戶可能存在的異常行為和舞弊風(fēng)險(xiǎn)就顯得尤為重要[2] 。 此外, 在高度自動(dòng)化的環(huán)境下, 財(cái)務(wù)報(bào)告使用者對(duì)報(bào)告時(shí)效性的要求越來(lái)越高, 這就需要對(duì)大量自動(dòng)生成、即時(shí)可訪問(wèn)的海量數(shù)據(jù)實(shí)施持續(xù)性審計(jì)。 為此, 審計(jì)人員亟需使用新的理論方法和技術(shù)工具, 實(shí)現(xiàn)由傳統(tǒng)人工審計(jì)到大數(shù)據(jù)分析的轉(zhuǎn)化, 從而進(jìn)一步拓展審計(jì)的深度和廣度, 提高審計(jì)工作效率, 提升審計(jì)質(zhì)量和價(jià)值。
數(shù)據(jù)挖掘是指運(yùn)用專業(yè)的工具、技術(shù)、模型和方法, 對(duì)大量無(wú)序的數(shù)據(jù)進(jìn)行采集、加載、分析和集成, 以便從海量數(shù)據(jù)中發(fā)現(xiàn)隱含的、有效的、有價(jià)值的、可理解的模式、規(guī)則和知識(shí), 并對(duì)結(jié)果加以解釋, 從而為解決相關(guān)復(fù)雜決策問(wèn)題提供依據(jù)和輔助支持。 舞弊偵測(cè)是數(shù)據(jù)挖掘技術(shù)在財(cái)務(wù)報(bào)表舞弊審計(jì)中的重要應(yīng)用, 然而其在實(shí)際運(yùn)用過(guò)程中面臨著一系列挑戰(zhàn)。 一般而言, 當(dāng)發(fā)現(xiàn)某一審計(jì)客戶存在舞弊行為時(shí), 審計(jì)人員會(huì)面臨三方面決策:特定客戶的審計(jì)計(jì)劃中應(yīng)涵蓋哪些具體類型的舞弊行為(如收入確認(rèn)、高估資產(chǎn)、少計(jì)負(fù)債等)? 哪些數(shù)據(jù)來(lái)源(如日記賬、系統(tǒng)工作日志、電子郵件等)可以為識(shí)別各類舞弊提供證據(jù)? 采取何種數(shù)據(jù)挖掘技術(shù)(如定向技術(shù)或非定向技術(shù))才能最有效地找到潛在的舞弊證據(jù)?
為了解決上述三方面問(wèn)題, 本研究在系統(tǒng)總結(jié)和梳理審計(jì)大數(shù)據(jù)的本質(zhì)內(nèi)涵與特征分類的基礎(chǔ)上, 明晰了審計(jì)大數(shù)據(jù)挖掘分析與傳統(tǒng)數(shù)據(jù)分析的差異, 探尋數(shù)據(jù)挖掘技術(shù)在財(cái)務(wù)報(bào)表舞弊審計(jì)中的最佳應(yīng)用模式, 建立了數(shù)據(jù)挖掘技術(shù)應(yīng)用于財(cái)務(wù)報(bào)表舞弊審計(jì)中的整合性框架, 以便指導(dǎo)審計(jì)人員將相關(guān)數(shù)據(jù)挖掘技術(shù)高效地應(yīng)用于具體審計(jì)活動(dòng)。
二、審計(jì)大數(shù)據(jù)的內(nèi)涵
(一)審計(jì)大數(shù)據(jù)的定義
近年來(lái), 學(xué)術(shù)界和產(chǎn)業(yè)界基于不同的視角, 對(duì)大數(shù)據(jù)做出了不同的定義。 大數(shù)據(jù)作為組織中一類重要的信息資產(chǎn), 是與固定資產(chǎn)和人力資本類似的生產(chǎn)要素, 對(duì)經(jīng)濟(jì)社會(huì)發(fā)展具有重要價(jià)值。 大數(shù)據(jù)具有規(guī)模性(Volume)、高速性(Velocity)、多樣性(Variety)和真實(shí)性(Veracity)等技術(shù)特征(被稱為“4V”特征)。 基于大數(shù)據(jù)資源觀視角, 可以認(rèn)為大數(shù)據(jù)是企業(yè)的戰(zhàn)略性資源, 其來(lái)源多樣、特征復(fù)雜, 企業(yè)如果能夠快速有效地進(jìn)行大數(shù)據(jù)分析, 并通過(guò)直觀、可視化的方式獲得大數(shù)據(jù)分析背后隱藏的知識(shí)和規(guī)律, 增強(qiáng)管理洞察力和價(jià)值發(fā)現(xiàn)能力, 那么大數(shù)據(jù)將成為支持企業(yè)管理決策的一類重要資源, 具有重要的決策價(jià)值。 但是, 如果企業(yè)看不懂或不會(huì)用大數(shù)據(jù), 那么其決策有用性的價(jià)值將受限[3] 。
對(duì)于審計(jì)工作而言, 通過(guò)分析、挖掘發(fā)現(xiàn)被審計(jì)單位大量交易數(shù)據(jù)背后隱藏的信息, 特別是通過(guò)對(duì)大量交易數(shù)據(jù)的統(tǒng)計(jì)特征分析、分類、聚類和關(guān)聯(lián)特征分析, 能夠有效識(shí)別潛在的異常交易和舞弊特征信息, 從而為舞弊風(fēng)險(xiǎn)偵測(cè)、審計(jì)風(fēng)險(xiǎn)評(píng)估等提供有益的決策支持。
(二)審計(jì)大數(shù)據(jù)的分類
大數(shù)據(jù)環(huán)境下, 企業(yè)在經(jīng)營(yíng)管理過(guò)程中會(huì)產(chǎn)生各類數(shù)據(jù)信息, 大數(shù)據(jù)的形式和特征極其復(fù)雜, 不僅表現(xiàn)在其數(shù)量規(guī)模大、來(lái)源廣、形態(tài)結(jié)構(gòu)多樣, 還表現(xiàn)在其狀態(tài)變化和開(kāi)發(fā)方式等具有不確定性。 就審計(jì)工作而言, 可以從數(shù)據(jù)來(lái)源、數(shù)據(jù)類型和數(shù)據(jù)獲取三個(gè)方面對(duì)審計(jì)大數(shù)據(jù)進(jìn)行分類。
就數(shù)據(jù)來(lái)源而言, 大數(shù)據(jù)環(huán)境下審計(jì)人員能夠獲得企業(yè)內(nèi)部眾多數(shù)據(jù)資料, 例如:ERP系統(tǒng)、財(cái)務(wù)處理系統(tǒng)、交易處理系統(tǒng)以及客戶關(guān)系管理系統(tǒng)提供的交易數(shù)據(jù), 從企業(yè)生產(chǎn)制造設(shè)備、各類傳感器中采集的生產(chǎn)、倉(cāng)儲(chǔ)、運(yùn)輸?shù)壬a(chǎn)運(yùn)營(yíng)過(guò)程中的業(yè)務(wù)數(shù)據(jù), 企業(yè)內(nèi)部辦公系統(tǒng)中的電子郵件、公文處理和會(huì)議檔案等數(shù)據(jù)。 同時(shí), 審計(jì)人員還能從外部網(wǎng)站及社交媒體平臺(tái)中獲取包括對(duì)被審計(jì)單位的各種分析評(píng)論、網(wǎng)絡(luò)輿情以及分析研究報(bào)告。 就數(shù)據(jù)類型而言, 審計(jì)人員不僅能夠獲得傳統(tǒng)的數(shù)值型、文本型數(shù)據(jù), 還能夠獲取諸如圖像、音頻、視頻等多種類型的數(shù)據(jù)。 就數(shù)據(jù)獲取而言, 審計(jì)人員可以從物聯(lián)網(wǎng)平臺(tái)、ERP系統(tǒng)、各類傳感器、網(wǎng)絡(luò)平臺(tái)和社交媒體以及視頻監(jiān)控設(shè)備上獲取數(shù)據(jù)。 對(duì)于上述多種類型、多種來(lái)源、多方采集的多源異構(gòu)的海量數(shù)據(jù), 需要建立數(shù)據(jù)分析處理模型, 以提取出相關(guān)信息、識(shí)別潛在關(guān)系、建立內(nèi)在關(guān)聯(lián), 有效識(shí)別數(shù)據(jù)背后隱藏的規(guī)律性認(rèn)識(shí), 增強(qiáng)數(shù)據(jù)洞察力, 從而為相關(guān)舞弊識(shí)別、風(fēng)險(xiǎn)評(píng)估等審計(jì)決策提供依據(jù)。
(三)審計(jì)大數(shù)據(jù)分析
審計(jì)大數(shù)據(jù)分析是指審計(jì)人員為了實(shí)現(xiàn)既定的審計(jì)目標(biāo), 通過(guò)數(shù)據(jù)抽取、轉(zhuǎn)換、裝載(Extract-Transform-Load, 縮寫(xiě)為ETL)程序獲取內(nèi)、外部多種類型的數(shù)據(jù), 運(yùn)用大數(shù)據(jù)分析模型、方法和技術(shù), 分析全部交易及不同來(lái)源數(shù)據(jù)背后隱藏的異常情況, 有效識(shí)別舞弊、錯(cuò)誤以及違反內(nèi)部控制等情形。 例如, 通過(guò)計(jì)算數(shù)據(jù)的平均數(shù)、標(biāo)準(zhǔn)差、最大值及最小值等統(tǒng)計(jì)參數(shù), 有效識(shí)別異常交易, 或通過(guò)數(shù)據(jù)分類、聚類及關(guān)聯(lián)分析, 有效識(shí)別數(shù)據(jù)的特征及其內(nèi)在關(guān)聯(lián)等, 從而為舞弊識(shí)別、審計(jì)風(fēng)險(xiǎn)評(píng)估、審計(jì)報(bào)告出具等提供有效的決策支持。
傳統(tǒng)的信息系統(tǒng)僅僅能夠獲取及分析企業(yè)內(nèi)部的結(jié)構(gòu)化數(shù)據(jù), 編制靜態(tài)報(bào)表, 基于有限的數(shù)據(jù)進(jìn)行有限的分析。 在數(shù)據(jù)具有海量、實(shí)時(shí)與多元特征的大數(shù)據(jù)環(huán)境下, 大數(shù)據(jù)分析工具已經(jīng)成熟, 其可以快速向下挖掘數(shù)據(jù)特性, 為使用者實(shí)時(shí)提供適應(yīng)各種營(yíng)運(yùn)變化的解決方案, 采取交互式儀表盤的操作, 快速洞析數(shù)據(jù), 且通過(guò)可視化分析與展示技術(shù), 以更加直觀、更易于理解的方式呈現(xiàn)大數(shù)據(jù)分析的結(jié)果。 大數(shù)據(jù)分析與傳統(tǒng)數(shù)據(jù)分析的對(duì)比如表1所示。
雖然大數(shù)據(jù)和數(shù)據(jù)分析是兩個(gè)獨(dú)立的概念, 但兩者緊密關(guān)聯(lián), 圖1就表明了審計(jì)領(lǐng)域中兩者之間的內(nèi)在聯(lián)系。
多年來(lái), 會(huì)計(jì)師事務(wù)所習(xí)慣于在路徑A中使用傳統(tǒng)的數(shù)據(jù)分析工具(如Excel、ACL和Case-Ware IDEA)來(lái)分析會(huì)計(jì)數(shù)據(jù)的樣本。 美國(guó)會(huì)計(jì)學(xué)會(huì)對(duì)相關(guān)從業(yè)人員的最新調(diào)查結(jié)果顯示, 會(huì)計(jì)師事務(wù)所已開(kāi)始進(jìn)入路徑B并遠(yuǎn)離抽樣審計(jì)方法, 數(shù)據(jù)可視化的審計(jì)工具(如Tableau)越來(lái)越受到審計(jì)人員的歡迎, 但審計(jì)的重點(diǎn)仍然是傳統(tǒng)的會(huì)計(jì)數(shù)據(jù)和審計(jì)程序, 如查找重復(fù)的發(fā)票。 調(diào)查結(jié)果也提及社交媒體分析已經(jīng)作為審計(jì)的一部分, 并開(kāi)始向路徑C方向發(fā)展, 而路徑D才是真正地將大數(shù)據(jù)和高級(jí)數(shù)據(jù)分析工具進(jìn)行有機(jī)融合, 在傳統(tǒng)審計(jì)注重會(huì)計(jì)與財(cái)務(wù)數(shù)據(jù)的描述性分析基礎(chǔ)上, 引入非財(cái)務(wù)數(shù)據(jù)以及外部的宏觀經(jīng)濟(jì)、制度環(huán)境、社交媒體等海量的多源異構(gòu)大數(shù)據(jù), 更加關(guān)注現(xiàn)狀背后的問(wèn)題與成因分析、未來(lái)的趨勢(shì)預(yù)測(cè)以及如何針對(duì)問(wèn)題給出優(yōu)化解決方案和處置策略。
三、數(shù)據(jù)挖掘分析技術(shù)的概念和分類
(一)數(shù)據(jù)挖掘技術(shù)的概念
在闡述數(shù)據(jù)挖掘的概念內(nèi)涵時(shí), 需要明晰數(shù)據(jù)抽取與查詢、數(shù)據(jù)分析和數(shù)據(jù)挖掘三者之間的關(guān)系。
1. 數(shù)據(jù)抽取與查詢。 在財(cái)務(wù)報(bào)表審計(jì)中, Excel、ACL和Case-Ware IDEA等計(jì)算機(jī)輔助審計(jì)工具和技術(shù)(CAATTs)是審計(jì)人員檢查客戶數(shù)據(jù)時(shí)最常用的工具, 其內(nèi)置的多種函數(shù)功能等可以進(jìn)行描述性統(tǒng)計(jì)和簡(jiǎn)單的數(shù)據(jù)分析, 有效地識(shí)別客戶數(shù)據(jù)集中的可疑數(shù)據(jù)模式, 而且還能作為進(jìn)一步審計(jì)程序的樣本選擇工具。 例如, 如果某公司的內(nèi)部控制制度規(guī)定支付給供應(yīng)商超過(guò)50000元的貨款需要財(cái)務(wù)總監(jiān)簽字, 為了防止存在開(kāi)出低于50000元的舞弊性支票以避免財(cái)務(wù)總監(jiān)審查的情形發(fā)生, 可以利用數(shù)據(jù)提取工具抽取金額在49000 ~ 49999元之間的支票, 以確定是否有違反內(nèi)部控制的舞弊行為存在。
2. 數(shù)據(jù)分析。 數(shù)據(jù)分析工具集為審計(jì)人員提供了從簡(jiǎn)單到復(fù)雜的一系列分析技術(shù)。 例如, 簡(jiǎn)單的數(shù)據(jù)分析包括基本的描述性統(tǒng)計(jì)(如計(jì)數(shù)、最小值、最大值、平均值和離散度等)以及比率分析, 而相對(duì)復(fù)雜的數(shù)據(jù)分析包括單變量和多變量回歸等推理統(tǒng)計(jì)以及相關(guān)分析等。 數(shù)據(jù)分析可以進(jìn)一步分為描述性分析、診斷性分析、預(yù)測(cè)性分析和處方式分析。
(1)描述性分析(Descriptive analysis)。 描述性分析主要回答過(guò)去發(fā)生了什么, 通過(guò)將過(guò)去和當(dāng)前數(shù)據(jù)轉(zhuǎn)換為總結(jié)性、概括性的報(bào)告、圖表、數(shù)據(jù)透視表等形式, 幫助審計(jì)人員全面、高效地了解被審計(jì)單位當(dāng)前的經(jīng)營(yíng)狀況和財(cái)務(wù)業(yè)績(jī)。 例如, 將營(yíng)業(yè)收入增長(zhǎng)率與前期數(shù)據(jù)相比可以幫助管理會(huì)計(jì)師了解公司的成長(zhǎng)能力, 與行業(yè)基準(zhǔn)相比可以看出公司是否保持了競(jìng)爭(zhēng)優(yōu)勢(shì)。 除此之外, 描述性分析在顧客、企業(yè)、員工層面也有助于管理會(huì)計(jì)師發(fā)揮職能。 例如:退貨率和保修索賠率可以反映客戶對(duì)公司新產(chǎn)品的滿意程度; 研發(fā)費(fèi)用占比可以衡量公司對(duì)開(kāi)發(fā)新產(chǎn)品或服務(wù)的重視程度; 員工技能、生產(chǎn)力等特征可以識(shí)別高效率的員工。
(2)診斷性分析(Diagnostic analysis)。 診斷性分析旨在分析為什么會(huì)發(fā)生, 詮釋當(dāng)前結(jié)果的原因。 例如:相比于同行業(yè)的其他企業(yè), 為什么企業(yè)的經(jīng)營(yíng)費(fèi)用、銷售費(fèi)用和管理費(fèi)用會(huì)增加? 為什么平均有效所得稅率會(huì)變化? 為什么應(yīng)收所得和凈收益之間的差異會(huì)越來(lái)越大等? 與同期相比, 為什么銷售收入會(huì)下降? 診斷性分析可以進(jìn)一步細(xì)分為兩類:識(shí)別異常, 以及發(fā)現(xiàn)兩個(gè)或多個(gè)變量之間未知的連接、模式和關(guān)系。
(3)預(yù)測(cè)性分析(Predictive analysis)。 預(yù)測(cè)性分析旨在回答未來(lái)可能會(huì)發(fā)生什么, 它利用各種統(tǒng)計(jì)、建模、數(shù)據(jù)挖掘工具對(duì)某段時(shí)間內(nèi)累積的歷史數(shù)據(jù)進(jìn)行研究, 計(jì)算未來(lái)事件發(fā)生的可能性, 從而對(duì)未來(lái)進(jìn)行預(yù)測(cè)。 預(yù)測(cè)性分析采用的數(shù)據(jù)大部分是定量的數(shù)據(jù), 主要的算法有分類分析、回歸分析和時(shí)間序列分析等。
(4)處方式分析(Prescriptive analysis)。 處方式分析(或稱為規(guī)范性分析)是在前述分析的基礎(chǔ)上, 給出相應(yīng)問(wèn)題的解決方案和行動(dòng)建議, 主要回答如何做得更好或該朝哪個(gè)方向努力。 它是在描述性和預(yù)測(cè)性分析結(jié)果的基礎(chǔ)上, 通過(guò)探尋一個(gè)或多個(gè)解決方案, 并分析每個(gè)解決方案的可能結(jié)果, 給出最優(yōu)解決方案, 以便有效地指導(dǎo)我們?nèi)绾尾拍苋〉酶玫慕Y(jié)果。 具體的分析方法主要包括情景假設(shè)分析、單變量分析、邊際分析、現(xiàn)金流量分析、敏感性分析, 以及機(jī)器學(xué)習(xí)、仿真優(yōu)化等智能決策和優(yōu)化算法。
3. 數(shù)據(jù)挖掘。 數(shù)據(jù)挖掘是基于海量數(shù)據(jù)來(lái)揭示、發(fā)現(xiàn)有意義的關(guān)系、規(guī)則、模式或趨勢(shì)的過(guò)程, 它融合了人工智能、數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)技術(shù)、模式識(shí)別、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)可視化和高性能計(jì)算等多個(gè)領(lǐng)域的理論和技術(shù), 是數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)的核心步驟。 針對(duì)財(cái)務(wù)報(bào)表舞弊審計(jì)而言, 超出正常范圍或預(yù)測(cè)范圍的數(shù)據(jù)挖掘結(jié)果能為審計(jì)人員提供重要的風(fēng)險(xiǎn)信號(hào)。
(二)數(shù)據(jù)挖掘技術(shù)的分類
數(shù)據(jù)挖掘的模型、工具和技術(shù)手段多種多樣, 按照數(shù)據(jù)挖掘技術(shù)中變量之間關(guān)系的不同, 可將其分為定向(或自頂向下的方法)和無(wú)定向(或自底向上的方法)兩大類。 其中: 定向數(shù)據(jù)挖掘用于識(shí)別感興趣的特定目標(biāo)變量, 探究該變量與選定的其他變量之間的關(guān)系; 而無(wú)定向數(shù)據(jù)挖掘沒(méi)有特定的目標(biāo)變量(因變量), 可用于探尋數(shù)據(jù)總體中任何變量之間的關(guān)系。 換言之, 定向數(shù)據(jù)挖掘適用于檢驗(yàn)特定的假設(shè), 而非定向數(shù)據(jù)挖掘適用于檢驗(yàn)新的假設(shè)。
1. 定向數(shù)據(jù)挖掘。 定向數(shù)據(jù)挖掘技術(shù)包括:
(1)分類(Classification)。 分類的核心目的是把具有某些特征的數(shù)據(jù)項(xiàng)映射到特定類別上, 它通過(guò)對(duì)帶有類標(biāo)號(hào)的訓(xùn)練數(shù)據(jù)集的學(xué)習(xí)來(lái)建立分類模型, 常以分類規(guī)則、決策樹(shù)或數(shù)學(xué)表達(dá)式的形式予以表達(dá), 并利用分類模型將新對(duì)象準(zhǔn)確劃分到相對(duì)離散的類別中。 分類的準(zhǔn)確性、魯棒性以及對(duì)分類結(jié)果的解釋能力是衡量分類質(zhì)量的重要指標(biāo)。 常用的分類技術(shù)包括決策樹(shù)歸納、貝葉斯信念網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和遺傳算法等。 例如, 針對(duì)財(cái)務(wù)報(bào)表審計(jì), 可以依據(jù)財(cái)務(wù)報(bào)表相關(guān)信息、股價(jià)波動(dòng)和成交量等變量的特征, 將審計(jì)客戶劃分為低風(fēng)險(xiǎn)、中風(fēng)險(xiǎn)和高風(fēng)險(xiǎn)三大類。
(2)估計(jì)(Estimation)。 估計(jì)模式的函數(shù)定義與分類模式相似, 主要差別在于分類模式采用離散預(yù)測(cè)值(如類標(biāo)號(hào)), 而估計(jì)使用的是連續(xù)的預(yù)測(cè)值。 此種觀點(diǎn)下分類和估計(jì)都是預(yù)測(cè)問(wèn)題, 但數(shù)據(jù)挖掘界普遍認(rèn)為:用預(yù)測(cè)法預(yù)測(cè)類標(biāo)號(hào)為分類, 預(yù)測(cè)連續(xù)值(如使用回歸方法)則為估計(jì)。 例如, 針對(duì)財(cái)務(wù)報(bào)表審計(jì)而言, 估計(jì)技術(shù)不是將客戶風(fēng)險(xiǎn)劃分為低、中、高三類, 而是給出一個(gè)風(fēng)險(xiǎn)評(píng)分(例如0 ~ 10), 估計(jì)值適用于對(duì)象的總體排序, 并生成閾值得分, 隨后可以通過(guò)類似于邏輯回歸的技術(shù)實(shí)現(xiàn)對(duì)象分類。 例如, 將風(fēng)險(xiǎn)評(píng)分超過(guò)7.5分的客戶界定為高風(fēng)險(xiǎn)客戶, 對(duì)其實(shí)施更加嚴(yán)格的審計(jì)程序。
(3)預(yù)測(cè)(Prediction)。 “描述”和“預(yù)測(cè)”是數(shù)據(jù)挖掘的兩個(gè)重要目標(biāo), 描述性數(shù)據(jù)挖掘的任務(wù)主要是找到描述數(shù)據(jù)的可理解模式, 以便更好地刻畫(huà)目標(biāo)數(shù)據(jù)中數(shù)據(jù)的一般性質(zhì), 例如分類和估計(jì)等數(shù)據(jù)挖掘技術(shù)通常用于揭示數(shù)據(jù)集中先前確定的變量的特征。 而預(yù)測(cè)性挖掘的任務(wù)是對(duì)當(dāng)前數(shù)據(jù)進(jìn)行歸納以便做出預(yù)測(cè)。 因此, 數(shù)據(jù)挖掘領(lǐng)域的學(xué)者經(jīng)常將預(yù)測(cè)技術(shù)與分類和估計(jì)技術(shù)區(qū)分開(kāi)來(lái)。 預(yù)測(cè)技術(shù)主要是利用歷史數(shù)據(jù)建立模型來(lái)找出變化規(guī)律, 并用此模型預(yù)測(cè)數(shù)據(jù)集中其他感興趣的變量或字段的可能值或一個(gè)數(shù)據(jù)集合中某種屬性值的分布情況。 與分類技術(shù)類似, 預(yù)測(cè)技術(shù)也使用訓(xùn)練集來(lái)構(gòu)建初始模型。 在財(cái)務(wù)報(bào)表審計(jì)中, 若找出某一因素超出預(yù)測(cè)范圍的異常值, 則能為識(shí)別審計(jì)疑點(diǎn)和確定重點(diǎn)審計(jì)領(lǐng)域和方向提供重要支持。
2. 非定向數(shù)據(jù)挖掘。 非定向數(shù)據(jù)挖掘技術(shù)的典型應(yīng)用主要包括:
(1)關(guān)聯(lián)規(guī)則(Affinity grouping)。 關(guān)聯(lián)規(guī)則是指在沒(méi)有特定的因變量和自變量的情形下, 尋找數(shù)據(jù)集中相關(guān)變量之間的關(guān)聯(lián)關(guān)系和相關(guān)關(guān)系。 最著名的關(guān)聯(lián)規(guī)則挖掘算法是Apriori算法, 該算法的基本思想是:統(tǒng)計(jì)多種商品在一次購(gòu)買中共同出現(xiàn)的頻數(shù), 然后將出現(xiàn)頻數(shù)多的搭配轉(zhuǎn)換為關(guān)聯(lián)規(guī)則。 在財(cái)務(wù)報(bào)表審計(jì)應(yīng)用中, 審計(jì)人員可以利用數(shù)據(jù)挖掘技術(shù)分析收入與成本費(fèi)用以及資產(chǎn)、廠房、設(shè)備和工廠維護(hù)費(fèi)等分類賬之間的關(guān)聯(lián)規(guī)則, 那些不在預(yù)期關(guān)聯(lián)分組之內(nèi)的分類賬將是審查的重點(diǎn)。 此外, 關(guān)聯(lián)規(guī)則分析還能應(yīng)用于遵循特定序列(如時(shí)間模式)的數(shù)據(jù)上。 例如, 銀行針對(duì)洗黑錢的審查, 可以根據(jù)相關(guān)事件發(fā)生的順序查找潛在的關(guān)系, 有助于識(shí)別出一系列不正常的、但金額相對(duì)較小的賬號(hào)間轉(zhuǎn)賬的舞弊行為。
(2)聚類(Clustering)。 聚類是數(shù)據(jù)挖掘中用來(lái)發(fā)現(xiàn)數(shù)據(jù)分布和隱含模式的一項(xiàng)重要技術(shù), 其核心目的是根據(jù)數(shù)據(jù)集中的變量關(guān)系將數(shù)據(jù)項(xiàng)聚為多個(gè)子類或簇。 按照“最小化類間的相似性、最大化類內(nèi)的相似性”原則, 使得類內(nèi)的數(shù)據(jù)差異盡可能小, 類間的數(shù)據(jù)差異盡可能大。 聚類技術(shù)包括層次方法、基于神經(jīng)網(wǎng)絡(luò)的自組織映射和基于密度的技術(shù)。 與分類模式不同的是, 聚類中要?jiǎng)澐值念悇e是未知的, 它是一種不依賴于預(yù)先定義的類和帶類標(biāo)號(hào)的訓(xùn)練數(shù)據(jù)集的無(wú)監(jiān)督學(xué)習(xí)(Unsupervised learning), 無(wú)需背景知識(shí), 其中類的數(shù)量由系統(tǒng)按照某種性能指標(biāo)自動(dòng)確定。 例如, 在一組分類賬集合中, 審計(jì)人員可以按照銷售收入、應(yīng)收賬款、產(chǎn)品成本和庫(kù)存聚類為幾個(gè)子類。
(3)描述和可視化(Description & Visualization)。 數(shù)據(jù)挖掘的重要目標(biāo)是在數(shù)據(jù)庫(kù)中發(fā)現(xiàn)“有趣的、有價(jià)值的”知識(shí), 并利用可視化技術(shù)將其以圖形、圖像等易于理解的方式予以呈現(xiàn), 以便用戶更加直觀、清晰地理解數(shù)據(jù)挖掘的結(jié)果。 當(dāng)然, 對(duì)數(shù)據(jù)挖掘結(jié)果潛在含義的解釋有賴于審計(jì)人員所掌握的專業(yè)知識(shí)以及對(duì)客戶業(yè)務(wù)模型的深刻理解。
(三)不同數(shù)據(jù)分析工具之間的內(nèi)在關(guān)系
圖2列示了數(shù)據(jù)抽取與查詢、數(shù)據(jù)分析和數(shù)據(jù)挖掘三個(gè)概念之間的關(guān)系。
隨著審計(jì)人員對(duì)審計(jì)技術(shù)工具的應(yīng)用從數(shù)據(jù)抽取與查詢轉(zhuǎn)向數(shù)據(jù)分析和數(shù)據(jù)挖掘, 軟件在功能方面變得更加復(fù)雜, 診斷性分析和預(yù)測(cè)性分析能力也更強(qiáng)。 通過(guò)系統(tǒng)的文獻(xiàn)梳理可以發(fā)現(xiàn), 審計(jì)人員使用以上三種技術(shù)的頻率存在差異, 數(shù)據(jù)抽取和查詢工具的使用頻率很高, 而數(shù)據(jù)挖掘工具的復(fù)雜性及對(duì)審計(jì)相關(guān)知識(shí)的要求更高, 使其應(yīng)用受到制約。
四、基于全生命周期的大數(shù)據(jù)挖掘技術(shù)在審計(jì)中的應(yīng)用
注冊(cè)會(huì)計(jì)師發(fā)表的無(wú)保留審計(jì)意見(jiàn)是對(duì)財(cái)務(wù)報(bào)表不存在由錯(cuò)誤或舞弊引起的重大錯(cuò)報(bào)的合理保證。 針對(duì)財(cái)務(wù)報(bào)表舞弊審計(jì), 美國(guó)注冊(cè)會(huì)計(jì)師協(xié)會(huì)(AICPA)發(fā)布的第99號(hào)審計(jì)準(zhǔn)則《財(cái)務(wù)報(bào)表審計(jì)中對(duì)舞弊的考慮》(SAS第99號(hào))將舞弊分為財(cái)務(wù)報(bào)表舞弊和資產(chǎn)侵占舞弊兩類, 雖然后一類舞弊發(fā)生的頻率可能更高、涉及面更廣, 但其重要性并不如財(cái)務(wù)報(bào)告舞弊。 SAS第99號(hào)將財(cái)務(wù)報(bào)表舞弊定義為“在財(cái)務(wù)報(bào)表中故意錯(cuò)報(bào)或遺漏金額, 旨在欺騙財(cái)務(wù)報(bào)表使用者, 導(dǎo)致財(cái)務(wù)報(bào)表在所有重大方面均無(wú)法按一般公認(rèn)會(huì)計(jì)原則(GAAP)公允列報(bào)”。 審計(jì)準(zhǔn)則體系要求審計(jì)人員制訂周密的審計(jì)計(jì)劃、執(zhí)行嚴(yán)格的審計(jì)分析以及實(shí)質(zhì)性審計(jì)程序, 以便檢查財(cái)務(wù)報(bào)表中出現(xiàn)的錯(cuò)誤, 按照“審計(jì)計(jì)劃—審計(jì)實(shí)施—審計(jì)報(bào)告”的審計(jì)業(yè)務(wù)全生命周期[4] , 審計(jì)各個(gè)階段的步驟可列示為圖3。
本文基于審計(jì)業(yè)務(wù)全生命周期各階段的地位、目的和性質(zhì), 探討數(shù)據(jù)挖掘技術(shù)在各階段可能發(fā)揮的潛在作用。
(一)審計(jì)計(jì)劃階段
審計(jì)計(jì)劃階段應(yīng)聚焦于企業(yè)利益相關(guān)者關(guān)注的領(lǐng)域, 并衡量使用大數(shù)據(jù)分析技術(shù)、方法的可行性, 同時(shí)識(shí)別企業(yè)各作業(yè)流程所存在的風(fēng)險(xiǎn), 制訂合理的審計(jì)計(jì)劃。
1.了解被審計(jì)單位。 無(wú)論被審計(jì)單位財(cái)務(wù)報(bào)表是否出現(xiàn)錯(cuò)誤或舞弊, 對(duì)重大錯(cuò)報(bào)風(fēng)險(xiǎn)的評(píng)估都是審計(jì)計(jì)劃階段的重要工作, 而了解被審計(jì)單位是審計(jì)計(jì)劃早期階段的關(guān)鍵內(nèi)容。 審計(jì)人員必須了解各種與客戶相關(guān)的風(fēng)險(xiǎn)因素, 包括所有權(quán)結(jié)構(gòu)和組織架構(gòu)、價(jià)值創(chuàng)造過(guò)程的本質(zhì)、與業(yè)務(wù)合作伙伴和關(guān)聯(lián)方的關(guān)系, 以及客戶運(yùn)營(yíng)的監(jiān)管環(huán)境。 鑒于被審計(jì)單位在業(yè)務(wù)流程、組織結(jié)構(gòu)以及與業(yè)務(wù)合作伙伴關(guān)系方面的復(fù)雜性, 審計(jì)人員有可能利用數(shù)據(jù)挖掘工具和技術(shù)提高對(duì)被審計(jì)單位績(jī)效、外部關(guān)系和網(wǎng)絡(luò)數(shù)據(jù)的分析能力。 通常, 在預(yù)審計(jì)環(huán)節(jié), 可以利用數(shù)據(jù)挖掘技術(shù)對(duì)被審計(jì)單位的外部數(shù)據(jù)(如公布的財(cái)務(wù)報(bào)表、新聞報(bào)道、分析報(bào)告、股價(jià)、監(jiān)管文件等)以及內(nèi)部的財(cái)務(wù)數(shù)據(jù)等進(jìn)行多維度分析, 并選擇行業(yè)數(shù)據(jù)進(jìn)行對(duì)標(biāo)分析, 以有效識(shí)別風(fēng)險(xiǎn)。
2.制訂審計(jì)計(jì)劃。 被審計(jì)單位評(píng)估的風(fēng)險(xiǎn)越高, 越需要制訂更詳細(xì)的基于風(fēng)險(xiǎn)導(dǎo)向的審計(jì)計(jì)劃。 作為審計(jì)計(jì)劃的一部分, 審計(jì)人員通常會(huì)采取各種分析性程序來(lái)制訂預(yù)期的賬戶余額, 如債務(wù)水平、現(xiàn)金水平和應(yīng)計(jì)水平。 審計(jì)人員還會(huì)對(duì)財(cái)務(wù)報(bào)表核心數(shù)據(jù)進(jìn)行比率分析, 以得到預(yù)期值。 同時(shí), 國(guó)家和行業(yè)的產(chǎn)出、收入和盈利水平是一個(gè)重要的比較基準(zhǔn), 將國(guó)家和行業(yè)的外部數(shù)據(jù)分析與被審計(jì)單位內(nèi)部數(shù)據(jù)相結(jié)合, 利用內(nèi)、外部數(shù)據(jù)集的有效組合進(jìn)行數(shù)據(jù)挖掘, 有助于制訂更加有效的審計(jì)計(jì)劃, 提升審計(jì)效率和質(zhì)量。
在基于大數(shù)據(jù)審計(jì)的過(guò)程中, 審計(jì)計(jì)劃階段最具挑戰(zhàn)性的工作是采集與準(zhǔn)備所需的數(shù)據(jù)資料, 包括向企業(yè)信息部門提出具體的數(shù)據(jù)需求以及從外部獲取相關(guān)審計(jì)大數(shù)據(jù)。 如何確保所取得數(shù)據(jù)的準(zhǔn)確性和完整性, 如何對(duì)多種來(lái)源和類型的審計(jì)大數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理等都會(huì)影響審計(jì)工作的有效性。
3.與舞弊相關(guān)程序的計(jì)劃。 舞弊風(fēng)險(xiǎn)作為審計(jì)計(jì)劃的一部分, SAS第99號(hào)要求審計(jì)人員系統(tǒng)地解決因舞弊而產(chǎn)生重大錯(cuò)報(bào)的風(fēng)險(xiǎn)。 審計(jì)人員必須以謹(jǐn)慎的方式(包括審計(jì)團(tuán)隊(duì)進(jìn)行積極的頭腦風(fēng)暴)討論審計(jì)計(jì)劃中的財(cái)務(wù)報(bào)表舞弊風(fēng)險(xiǎn), 完成各種分析性程序。 例如, 針對(duì)可能存在舞弊的收入報(bào)告, 在審計(jì)計(jì)劃階段, 審計(jì)人員應(yīng)執(zhí)行與收入相關(guān)的分析性程序, 如將收入、銷售量與企業(yè)的生產(chǎn)能力進(jìn)行比較, 若銷售量超過(guò)產(chǎn)能, 則表明可能存在虛假銷售。 此外, 在報(bào)告期間和報(bào)告結(jié)束后一段時(shí)間內(nèi), 對(duì)月銷售收入的趨勢(shì)分析有助于識(shí)別出可能存在與客戶簽訂未公開(kāi)的合同, 以及退回已確認(rèn)收入的商品等收入賬戶舞弊的異常情形, 這種基于時(shí)間維度的數(shù)據(jù)挖掘分析, 為大數(shù)據(jù)環(huán)境下審計(jì)風(fēng)險(xiǎn)評(píng)估提供了新的有效思路。 例如, 不是對(duì)已知指標(biāo)(如庫(kù)存周轉(zhuǎn)率和產(chǎn)品盈利能力)直接進(jìn)行比率分析, 而是通過(guò)對(duì)多個(gè)指標(biāo)的數(shù)據(jù)挖掘開(kāi)發(fā)更復(fù)雜的客戶增值流程和風(fēng)險(xiǎn)概況模型, 有效識(shí)別潛在的舞弊風(fēng)險(xiǎn)。
此外, 審計(jì)計(jì)劃階段的另一個(gè)重要內(nèi)容是考慮內(nèi)部控制缺陷所帶來(lái)的風(fēng)險(xiǎn), 要求審計(jì)人員評(píng)估內(nèi)部控制的設(shè)計(jì)和執(zhí)行情況。 被審計(jì)單位通常會(huì)準(zhǔn)備大量的會(huì)計(jì)流程文件來(lái)證明其內(nèi)部控制設(shè)計(jì)和執(zhí)行的有效性, 審計(jì)人員可以對(duì)這些會(huì)計(jì)流程進(jìn)行系統(tǒng)的數(shù)據(jù)分析, 以評(píng)估風(fēng)險(xiǎn)和后續(xù)測(cè)試的關(guān)鍵控制點(diǎn)。
(二)審計(jì)實(shí)施階段
在審計(jì)實(shí)施過(guò)程中, 需要利用所獲取的審計(jì)大數(shù)據(jù)進(jìn)行審計(jì)測(cè)試, 傳統(tǒng)審計(jì)抽樣及抽查等技術(shù)方法已無(wú)法有效發(fā)現(xiàn)錯(cuò)誤及異常交易, 審計(jì)人員需要利用大數(shù)據(jù)分析技術(shù), 基于特定審計(jì)目標(biāo), 開(kāi)發(fā)出相應(yīng)審計(jì)測(cè)試的大數(shù)據(jù)分析處理模型和方法來(lái)分析所有交易數(shù)據(jù), 以便發(fā)現(xiàn)異常情形, 幫助審計(jì)人員聚焦高風(fēng)險(xiǎn)審計(jì)范圍和領(lǐng)域。
1.關(guān)于控制的審計(jì)證據(jù)。 審計(jì)實(shí)施階段的重點(diǎn)工作是通過(guò)符合性測(cè)試和實(shí)質(zhì)性測(cè)試, 收集充分、適當(dāng)?shù)膶徲?jì)證據(jù)。 符合性測(cè)試旨在評(píng)估內(nèi)部控制設(shè)計(jì)和運(yùn)行的有效性, 對(duì)控制過(guò)程進(jìn)行過(guò)程挖掘是數(shù)據(jù)挖掘在此階段的重要應(yīng)用。 過(guò)程挖掘通常在ERP系統(tǒng)的系統(tǒng)日志上運(yùn)行, 對(duì)控制過(guò)程進(jìn)行過(guò)程挖掘是數(shù)據(jù)挖掘技術(shù)應(yīng)用于內(nèi)部控制測(cè)試收集審計(jì)證據(jù)的一種重要方法。
2. 關(guān)于會(huì)計(jì)判斷的審計(jì)證據(jù)。 隨著“輕資產(chǎn)”類型公司的大量涌現(xiàn),無(wú)形資產(chǎn)在企業(yè)資產(chǎn)結(jié)構(gòu)中的比重越來(lái)越高,與此相關(guān)的會(huì)計(jì)要素的確認(rèn)、計(jì)量、記錄和報(bào)告的過(guò)程等涉及復(fù)雜的價(jià)值評(píng)估和判斷,科學(xué)合理利用大數(shù)據(jù)資源能夠?yàn)橄嚓P(guān)價(jià)值判斷提供更好的審計(jì)證據(jù)。
3.關(guān)于舞弊的審計(jì)證據(jù)。 現(xiàn)場(chǎng)審計(jì)中, 審計(jì)人員會(huì)開(kāi)展大量的實(shí)質(zhì)性測(cè)試, 其中的一些程序涉及舞弊審計(jì)。 例如, 關(guān)于收入的實(shí)質(zhì)性分析程序可能會(huì)利用分類數(shù)據(jù), 如按月比較產(chǎn)品線或業(yè)務(wù)部門報(bào)告的收入。 實(shí)質(zhì)性測(cè)試作為舞弊相關(guān)分析程序的一部分, 對(duì)公司績(jī)效數(shù)據(jù)、收入數(shù)據(jù)庫(kù)以及其他客戶數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘?qū)⒕哂兄匾臐撛谝饬x。
(三)審計(jì)報(bào)告階段
審計(jì)人員應(yīng)評(píng)估“在現(xiàn)場(chǎng)工作完成時(shí)或接近完成時(shí)”因舞弊行為導(dǎo)致重大錯(cuò)報(bào)的可能性, 并做出適當(dāng)回應(yīng)。 回應(yīng)可能包括重新評(píng)估在審計(jì)計(jì)劃階段被拒絕使用的數(shù)據(jù)挖掘程序, 或在審計(jì)實(shí)施階段觀察到的異常情況而開(kāi)展的新數(shù)據(jù)挖掘程序。 例如, 實(shí)質(zhì)性分析程序或其他收入測(cè)試可能表明需要數(shù)據(jù)挖掘。 之后, 對(duì)審計(jì)證據(jù)進(jìn)行最終審查, 從而決定審計(jì)報(bào)告最終的性質(zhì)。
綜上, 本文構(gòu)建的基于大數(shù)據(jù)挖掘分析的財(cái)務(wù)報(bào)表舞弊審計(jì)應(yīng)用框架如圖4所示。
針對(duì)上述審計(jì)計(jì)劃、數(shù)據(jù)準(zhǔn)備、審計(jì)實(shí)施過(guò)程的大數(shù)據(jù)分析程序及結(jié)果, 應(yīng)加強(qiáng)審計(jì)復(fù)核和質(zhì)量監(jiān)控, 以確?;诖髷?shù)據(jù)分析結(jié)果的可靠性。 同時(shí), 充分利用可視化分析和儀表盤展示平臺(tái), 構(gòu)建風(fēng)險(xiǎn)預(yù)警機(jī)制, 增強(qiáng)洞察力, 提高審計(jì)效率和效果。
五、面向?qū)徲?jì)全生命周期的各類大數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用
伴隨著數(shù)據(jù)量的爆炸式增長(zhǎng)以及數(shù)據(jù)挖掘技術(shù)和工具的出現(xiàn), 會(huì)計(jì)師事務(wù)所亟需從客戶的海量數(shù)據(jù)中發(fā)現(xiàn)更有價(jià)值的信息和知識(shí), 以便為制訂審計(jì)計(jì)劃、評(píng)估審計(jì)風(fēng)險(xiǎn)和內(nèi)部控制的有效性、確定重點(diǎn)審計(jì)領(lǐng)域和方向、識(shí)別舞弊行為等提供有益的支持。 相關(guān)研究表明, 數(shù)據(jù)挖掘技術(shù)已成功應(yīng)用于財(cái)務(wù)報(bào)表虛假信息披露、日記分類賬挖掘分析、公司內(nèi)部業(yè)務(wù)流程分析和角色建模分析、公司內(nèi)外部文本信息的挖掘分析以及其他舞弊欺詐檢測(cè)模型等。
對(duì)財(cái)務(wù)報(bào)告披露信息進(jìn)行挖掘分析以便識(shí)別出可能存在舞弊的公司報(bào)告, 是數(shù)據(jù)挖掘在財(cái)務(wù)報(bào)表審計(jì)領(lǐng)域的典型應(yīng)用[5,6] 。 Ravisankar等[7] 利用支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和遺傳算法等數(shù)據(jù)挖掘技術(shù), 分析財(cái)務(wù)報(bào)表的重要數(shù)據(jù)(如凈利潤(rùn)和毛利潤(rùn))和核心比率(如長(zhǎng)期債務(wù)/總資產(chǎn)), 識(shí)別出虛假報(bào)告。 Alden等[2] 利用進(jìn)化遺傳算法(Evolutionary Algorithms, EAs)識(shí)別財(cái)務(wù)報(bào)表中的舞弊行為。 Perols[8] 的研究表明, 邏輯回歸和支持向量機(jī)(SVM)分類技術(shù)在財(cái)務(wù)報(bào)表舞弊識(shí)別中有很好的表現(xiàn)。 Glancy和Yadav[9] 建立了一種新型的欺詐檢測(cè)模型, 能夠生成具有典型數(shù)據(jù)挖掘特征的奇異值分解向量(SVD), 用于分析財(cái)務(wù)報(bào)表附注中的欺詐行為。
現(xiàn)代會(huì)計(jì)信息系統(tǒng)的基礎(chǔ)業(yè)務(wù)流程特性決定了日記分類賬能夠完整地列示業(yè)務(wù)的所有方面, 因此, 目前審計(jì)人員對(duì)大規(guī)模數(shù)據(jù)集進(jìn)行最多分析的領(lǐng)域是客戶的日記分類賬。 Debreceny和Gray[10] 將數(shù)據(jù)挖掘技術(shù)應(yīng)用于客戶日記分類賬分析, 挖掘了29套分類賬。 Argyrou[11] 使用自組織映射(Self Organizing Map,SOM)識(shí)別單個(gè)公司的一組會(huì)計(jì)分錄中存在的可疑交易。
近年來(lái), 數(shù)據(jù)挖掘技術(shù)在審計(jì)領(lǐng)域的另一個(gè)重要應(yīng)用是過(guò)程挖掘[12] 。 該技術(shù)從企業(yè)信息系統(tǒng)(通常是ERP系統(tǒng)的工作流和角色分析)生成的事件日志中提取業(yè)務(wù)流程知識(shí), 對(duì)企業(yè)決策過(guò)程[13] 、合規(guī)與風(fēng)險(xiǎn)管理[14] 和控制結(jié)構(gòu)[15] 等進(jìn)行過(guò)程挖掘。 了解用戶在企業(yè)系統(tǒng)中的作用與角色是對(duì)企業(yè)內(nèi)部控制和具體交易進(jìn)行審計(jì)的前提, 在有關(guān)角色挖掘的研究中, Colantonio等[16] 建立了角色建模方法, 并成功應(yīng)用于某大型企業(yè)員工舞弊行為偵測(cè)。 針對(duì)員工舞弊問(wèn)題, Jans等[17] 采用單變量和多變量聚類技術(shù)用于識(shí)別潛在的舞弊交易。
大數(shù)據(jù)環(huán)境下, 被審計(jì)單位充斥著大量的內(nèi)、外部文字信息, 文本挖掘技術(shù)在審計(jì)中的應(yīng)用日益受到關(guān)注。 電子郵件是企業(yè)內(nèi)部員工之間以及企業(yè)與外部供應(yīng)商、客戶等溝通的重要工具。 而且電子郵件也為相關(guān)法律訴訟以及監(jiān)管要求提供了重要的證據(jù)信息, 組織也會(huì)更加重視保存結(jié)構(gòu)良好的電子郵件信息。 電子郵件涵蓋日期、收件人和主題字段等信息, 此種半結(jié)構(gòu)化特性為電子郵件的數(shù)據(jù)挖掘添加了重要的時(shí)間和社交網(wǎng)絡(luò)維度。 Debreceny和Gray[4] 將文本挖掘和社交網(wǎng)絡(luò)分析成功應(yīng)用于電子郵件數(shù)據(jù)挖掘。 Humpherys等[18] 建立了一個(gè)涵蓋慣用語(yǔ)言、情感、單詞長(zhǎng)度和句子復(fù)雜度等特征的財(cái)務(wù)報(bào)表欺詐識(shí)別模型, 實(shí)驗(yàn)數(shù)據(jù)結(jié)果顯示模型對(duì)財(cái)務(wù)報(bào)表欺詐行為識(shí)別的準(zhǔn)確率達(dá)到67%。
大數(shù)據(jù)環(huán)境下, 眾多公司利用商業(yè)分析(Business analytics)來(lái)服務(wù)于其戰(zhàn)略決策和運(yùn)營(yíng)管理。 審計(jì)人員在審計(jì)過(guò)程中, 也應(yīng)該拓展傳統(tǒng)的審計(jì)分析方法, 更多地采用商業(yè)分析工具來(lái)提升審計(jì)工作效率以及審計(jì)工作質(zhì)量。? Appelbaum等[19] 、Vasarhelyi等[20] 構(gòu)建了數(shù)據(jù)挖掘分析技術(shù)在審計(jì)業(yè)務(wù)全流程的應(yīng)用框架, 系統(tǒng)總結(jié)和梳理了審計(jì)過(guò)程中應(yīng)該運(yùn)用哪些商業(yè)分析技術(shù)方法, 以及審計(jì)過(guò)程的不同階段應(yīng)該選用哪些合適的商業(yè)分析技術(shù)方法, 具體如表2所示。
在審計(jì)計(jì)劃階段, 簽訂審計(jì)業(yè)務(wù)約定書(shū)時(shí), 審計(jì)人員可以查閱經(jīng)審計(jì)的財(cái)務(wù)報(bào)表、其他公共信息以及其他外部數(shù)據(jù)來(lái)源, 并從定量和定性數(shù)據(jù)中得出預(yù)期模型。 在此過(guò)程中, 常用的大數(shù)據(jù)挖掘分析技術(shù)主要包括:比率分析、文本挖掘、可視化、回歸模型和描述性統(tǒng)計(jì)等。 在制定計(jì)劃與風(fēng)險(xiǎn)評(píng)估的過(guò)程中, 審計(jì)人員可以在獲取未經(jīng)審計(jì)財(cái)務(wù)報(bào)表的基礎(chǔ)上, 構(gòu)建可能發(fā)生和應(yīng)該發(fā)生的風(fēng)險(xiǎn)預(yù)測(cè)模型。 此時(shí)除了比率分析, 還可以使用聚類、可視化、回歸模型、信度網(wǎng)絡(luò)、專家系統(tǒng)和描述性統(tǒng)計(jì)等。
審計(jì)實(shí)施階段的重要工作是執(zhí)行審計(jì)測(cè)試, 可以考慮根據(jù)客戶的環(huán)境, 選擇將抽樣測(cè)試與全樣本測(cè)試的結(jié)果進(jìn)行比較, 并根據(jù)基準(zhǔn)和預(yù)期結(jié)果的差異, 聚焦確定符合性測(cè)試和實(shí)質(zhì)性測(cè)試的范圍和重點(diǎn)方向, 如果測(cè)試結(jié)果顯示有問(wèn)題或預(yù)示著需要進(jìn)一步調(diào)查, 可能需要進(jìn)一步測(cè)試和收集證據(jù)。 該階段除了會(huì)用到所有目前常用的審計(jì)檢查技術(shù), 還會(huì)使用聚類、文本挖掘、過(guò)程挖掘、可視化、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、專家系統(tǒng)、信度網(wǎng)絡(luò)、回歸模型、本福德定律、描述性統(tǒng)計(jì)、結(jié)構(gòu)模型以及假設(shè)檢驗(yàn)。
在審計(jì)報(bào)告階段, 進(jìn)行審計(jì)復(fù)核時(shí), 需要使用不同的技術(shù)對(duì)異常結(jié)果進(jìn)行交叉驗(yàn)證測(cè)試和分析, 前述實(shí)質(zhì)性測(cè)試階段用到的所有技術(shù)方法都適用。 在此過(guò)程中, 還會(huì)用到專家系統(tǒng)、概率模型、信度網(wǎng)絡(luò)、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等。 隨著2016年審計(jì)報(bào)告準(zhǔn)則的頒布實(shí)施, 如何提高審計(jì)過(guò)程透明度、增加審計(jì)意見(jiàn)和審計(jì)報(bào)告的信息含量和價(jià)值有用性顯得尤為重要。 在確定審計(jì)意見(jiàn)時(shí), 主要使用的大數(shù)據(jù)挖掘分析方法包括時(shí)間序列回歸、概率模型、信度網(wǎng)絡(luò)、專家系統(tǒng)和蒙特卡洛模擬等。 此外, 如何應(yīng)用數(shù)據(jù)挖掘分析技術(shù)以得到更細(xì)致、定量化的審計(jì)意見(jiàn), 以及拓展目前無(wú)保留審計(jì)意見(jiàn)和非無(wú)保留審計(jì)意見(jiàn)的二分法結(jié)果, 也是值得探究的重要領(lǐng)域。
六、結(jié)論
基于大數(shù)據(jù)的挖掘分析已經(jīng)在財(cái)務(wù)危機(jī)預(yù)警、財(cái)務(wù)欺詐檢測(cè)、股票市場(chǎng)預(yù)測(cè)和量化投資決策等會(huì)計(jì)與財(cái)務(wù)領(lǐng)域有著廣泛的應(yīng)用, 然而其在審計(jì)領(lǐng)域的應(yīng)用稍顯滯后。 基于客戶內(nèi)、外部海量大數(shù)據(jù)的深度挖掘分析, 為審計(jì)功能的發(fā)揮提供了一個(gè)補(bǔ)充的證據(jù)來(lái)源, 而且審計(jì)人員能夠分析客戶公司財(cái)務(wù)報(bào)告相關(guān)數(shù)據(jù)的生成過(guò)程, 洞察被審計(jì)單位經(jīng)營(yíng)管理過(guò)程中的各類問(wèn)題, 有助于使審計(jì)行業(yè)向價(jià)值鏈上游移動(dòng), 真正成為客戶公司的商業(yè)伙伴。 基于海量數(shù)據(jù)的挖掘分析將改變審計(jì)人員的工作方式, 同時(shí), 海量數(shù)據(jù)涉及的諸如信息超載、信息相關(guān)性、可靠性、模糊性等問(wèn)題也會(huì)影響審計(jì)人員的職業(yè)判斷, 這里尤為關(guān)鍵的是面向具體審計(jì)領(lǐng)域和工作內(nèi)容選擇最合適的數(shù)據(jù)挖掘技術(shù)工具。
本研究通過(guò)系統(tǒng)的文獻(xiàn)梳理, 旨在探尋數(shù)據(jù)挖掘技術(shù)工具在財(cái)務(wù)報(bào)表舞弊審計(jì)中的最佳應(yīng)用模式, 構(gòu)建數(shù)據(jù)挖掘技術(shù)應(yīng)用于財(cái)務(wù)報(bào)表舞弊審計(jì)的整合性框架, 以便指導(dǎo)審計(jì)人員將相關(guān)數(shù)據(jù)挖掘技術(shù)高效地應(yīng)用于具體審計(jì)活動(dòng)中。 未來(lái)的研究中, 一方面, 基于大數(shù)據(jù)挖掘分析的審計(jì)范式變革, 會(huì)改變審計(jì)人員的行為方式、工作流程和執(zhí)業(yè)風(fēng)險(xiǎn), 而相關(guān)會(huì)計(jì)和審計(jì)準(zhǔn)則并沒(méi)有跟上技術(shù)變革的步伐; 另一方面, 大數(shù)據(jù)挖掘分析為審計(jì)人員提供了補(bǔ)充的證據(jù)來(lái)源, 然而由于海量數(shù)據(jù)的多源異構(gòu)特征, 使得在數(shù)據(jù)質(zhì)量、可靠性等方面存在巨大差異, 如何依據(jù)充分性、可靠性和相關(guān)性的審計(jì)證據(jù)標(biāo)準(zhǔn)框架對(duì)其適用性進(jìn)行科學(xué)評(píng)估值得探究。
【 主 要 參 考 文 獻(xiàn) 】
[1] Eppler M. J., Mengis J.. The concept of information overload:A review of literature from organization science,accounting,? marketing, MIS,? and related disciplines[ J].The Information Society,2004(5):325 ~ 344.
[2] Alden M., Bryan D., Lessley B., et al.. Detection of financial statement fraud using evolutionary algorithms[J].Journal of Emerging Technologies in Accounting,2012(1):71 ~ 94.
[3] 楊善林,周開(kāi)樂(lè).大數(shù)據(jù)中的管理問(wèn)題:基于大數(shù)據(jù)的資源觀[ J].管理科學(xué)學(xué)報(bào),2015(5):1 ~ 8.
[4] Debreceny R. S., Gray G. L.. Data mining of electronic mail and auditing:A research agenda[ J].Journal of? Information System,2011(2):195 ~ 226.
[5] Green B. P., Choi J. H.. Assessing the risk of management fraud through neural network technology[ J].Auditing a Journal of Practice & Theory,1997(1):14 ~ 28.
[6] Feroz E., Kwon T., Pastena V., et al.. The efficacy of red flags in predicting the SEC's targets:An artificial neural networks approach[ J].Intelligent Systems in Accounting,F(xiàn)inance & Management,2000(3):145 ~ 157.
[7] Ravisankar P., Ravi V., Raghava Rao G., et al.. Detection of financial statement fraud and feature selection using data mining techniques[ J].Decision Support Systems,2010(2):491 ~ 500.
[8] Perols J.. Financial statement fraud detection:An analysis of statistical and machine learning algorithms[ J].Auditing,2011(2):19 ~ 50.
[9] Glancy F. H., Yadav S. B.. A computational model for financial reporting fraud detection[ J].Decision Support Systems,2010(3):595 ~ 601.
[10] Debreceny R. S., Gray G. L.. Data mining journal entries for fraud detection:An exploratory study[ J].International Journal of Accounting Information Systems,2010(3):157 ~ 181.
[11] Argyrou A.. Auditing journal entries using self-organizing map[A].18th Americas Conference on Information Systems[C].Seattle:Association for Information Systems,2012.
[12] Jans M., Alles M., Vasarhelyi M.. The case for process mining in auditing:Sources of value added and areas of application[ J].International Journal of Accounting Information Systems,2013(1):1 ~ 20.
[13] van der Aalst W., van Hee K., van der Werf J. M., et al.. Conceptual model for online auditing[ J].Decisin Support System,? 2010(3):636 ~ 647.
[14] Caron F., Vanthienen J., Baesens B.. Comprehensive rule-based compliance checking and risk management with process mining[ J].Decision Support Systems,2013(3):1357 ~ 1369.
[15] Elsas P.. X-raying segregation of duties:Support to illuminate an enterprise's immunity to solo-fraud[ J].International Journal of Accounting Information Systems,2007(2):82 ~ 93.
[16] Colantonio A., Di Pietro R., Ocello A., et al.. A new role mining framework to elicit business roles and to mitigate enterprise risk[ J].Decision Support Systems,2010(4):715 ~ 731.
[17] Jans M., Lybaert N., Vanhoof K.. Internal fraud risk reduction:Results of a data mining case study[ J].International Journal of Accounting Information Systems,2009(1):17 ~ 41.
[18] Humpherys S. L., Moffitt K. C., Burns M. B., et al.. Identification of fraudulent financial statements using linguistic credibility analysis[ J].Decision Support Systems,2010(3):585 ~ 594.
[19] Appelbaum D. A., Kogan A., Vasarhelyi M. A.. Analytical procedures in external auditing:A comprehensive literature survey and framework for external audit analytics[ J].Journal of Accounting Literature, 2018(6):83 ~ 101.
[20] Vasarhelyi M. A., Rozario A. M.. How robotic process automation is transforming accounting and auditing[ J].The CPA Journal,2018(6):46 ~ 49.