陳 偉
審計監督作為國家監督體系的重要組成部分,傳統手工審計是通過對紙質賬簿的檢查來實現這一職責的。20世紀80年代,以查賬為主要手段的審計職業遇到了信息技術的挑戰。隨著被審計單位信息化普及,審計對象的信息化使得審計信息化成為必然,審計人員必需借助信息技術幫助他們開展審計工作,計算機輔助審計技術(Computer Assisted Audit Technologies,簡稱CAATs)成為審計領域研究與應用的重點(國家863 計劃審計署課題組,2006;Lambrechts 等,2011;陳偉等,2012)。根據相關文獻的研究(Harold,2003 ;INTOSAI,2004 ;Lambrechts 等,2011),CAATs 可以概括為:為了滿足信息化環境下審計的需要,基于計算機的應用來對信息系統,或被信息系統處理的數據進行審計的技術,其分類可總結為如圖1 所示(陳偉等,2007;陳偉,2012;Chen 等,2012)。概括來說,常用的計算機輔助審計技術可以分成兩類:一類是用于驗證程序/系統的計算機輔助審計技術,即面向系統的計算機輔助審計技術;另一類是用于分析電子數據的計算機輔助審計技術,即面向數據的計算機輔助審計技術,也可以稱之為電子數據審計技術。
我國高度重視審計信息化工作,對我國來說,信息化環境下如何審計被審計單位的電子數據,發現大案、要案是一項最重要任務,特別是政府審計的一項重要任務(國家863 計劃審計署課題組,2006)。因此,電子數據審計是目前我國開展審計信息化的重點。2014年12月,國家審計署機構調整,增設了電子數據審計司充分說明電子數據審計在目前我國審計工作中的重要性。國際上也高度關注電子數據審計問題,國際內部審計師協會(Institute of Internal Auditors,IIA)2011年發 布的全球技術審計指南——《數據分析技術》中重點分析了面向數據的CAATs在審計數據分析中的應用(Lambrechts等,2011)??梢?,電子數據審計是目前國內外審計領域關注的重點。
隨著信息技術的發展,為了適應信息化環境下審計事業發展的需要,國內外政府、高校、培訓機構高度重視計算機輔助審計技術的教育與培訓工作,眾多高校、政府培訓機構開設了IT(信息技術)審計的相關課程。作為一門交叉、新興課程,如何開設好這一課程成為困擾大家的難題。目前,實踐教學成為教學與培訓方式改革的發展方向和趨勢,在開設IT 審計課程時,國外在實驗軟件上一般采用國際上兩大著名審計軟件IDEA 或ACL。對國內來說,在實驗軟件的選擇上,一些是直接選用實際的審計軟件,例如現場審計實施系統(AO)、用友審易、IDEA 和ACL等,一些則是選用SQL Server、MS Access 等比較實用的通用軟件作為實驗教學的實驗軟件,甚至一些軟件公司專門開發了一些用于審計教學的審計實驗軟件(陳偉,2009;陳偉等,2013)。為了能更好地適應審計實踐教學的需要,審計模擬實驗室建設已成為一項重要工作。
SQL查詢是目前最常用的審計數據分析方法。SQL查詢是指審計人員針對實際的被審計對象,根據自己的經驗,按照一定的審計分析模型,在通用軟件(如MS Access)中采用SQL語句來分析采集來的電子數據?;虿捎靡恍徲嬡浖ㄟ^運行各種各樣的查詢命令以某些預定義的格式來檢測被審計單位的電子數據。這種方法既提高了審計的正確性與準確性,也使審計人員從冗長乏味的計算工作中解放出來,告別以前手工翻賬的作業模式。
綜上所述,電子數據審計在目前我國審計工作中越來越重要,審計人員掌握電子數據審計技術成為必然,為了能更好地適應電子數據審計實踐教學的需要,電子數據審計模擬實驗室的建設成為一項重要工作。本文結合目前電子數據審計,以及審計模擬實驗室的研究與應用現狀,設計了一個為用戶學習和掌握電子數據審計方法的模擬實驗平臺,稱之為電子數據審計模擬實驗室軟件。
為了便于理解電子數據審計模擬實驗室,首先需要掌握電子數據審計的原理。對于電子數據審計,目前還沒有給出明確的定義,根據目前對該術語的使用情況,電子數據審計一般可以理解為“對被審計單位的電子數據進行采集、預處理以及分析,從而發現審計線索,獲得審計證據的過程。”在實際的審計工作中,為了避免影響被審計單位信息系統的正常運行,并保持審計的獨立性,規避審計風險,審計人員在開展電子數據審計時,一般不直接使用被審計單位的信息系統進行查詢分析和檢查,而是將所需的被審計單位的電子數據采集到審計人員的計算機中,利用相關軟件進行分析,其原理如圖2 所示。
“電子數據審計模擬實驗室”是一個形象的比喻,用戶可用這個軟件來練習電子數據審計方法,就好比是一個虛擬實驗室。通過本軟件,用戶可以練習掌握以下電子數據審計方法:(1)數據采集(數據準備)。(2)數據查詢,包括SQL模擬查詢器、正負快速查詢、條件快速查詢。(3)數值分析,包括重號分析、斷號分析、Benford 定律。(4)統計分析,包括一般統計和分層分析。(5)審計抽樣,包括間隔抽樣和隨機抽樣。(6)數據匹配,包括一般匹配和長度過濾匹配。(7)數據相似查詢:SQL相似查詢和SQL長度過濾相似查詢。概括來說,電子數據審計模擬實驗室軟件目前已有的主要功能如圖3 所示。


該功能主要是實現把要分析的電子 數據采集到電子數據審計模擬實驗室軟件中來,為后面的審計數據分析練習打下基礎。
SQL查詢是目前最常用的審計數據分析方法。SQL查詢是指審計人員針對實際的被審計對象,根據自己的經驗,按照一定的審計分析模型,在通用軟件(如MS Access)中采用SQL語句來分析采集來的電子數據?;虿捎靡恍徲嬡浖ㄟ^運行各種各樣的查詢命令以某些預定義的格式來檢測被審計單位的電子數據。這種方法既提高了審計的正確性與準確性,也使審計人員從冗長乏味的計算工作中解放出來,告別以前手工翻賬的作業模式。另外,運用SQL語句的強大查詢功能,通過構建一些復雜的SQL語句,可以完成模糊查詢以及多表之間的交叉查詢等功能,從而可以完成復雜的審計數據分析功能(陳偉,2012)。
本系統根據用戶練習數據查詢方法的需要,主要實現了SQL模擬查詢器、條件查詢、自定義查詢等功能。
1.SQL模擬查詢器功能。SQL模擬查詢器主要是提供一個供用戶練習如何采用SQL語句分析電子數據的模擬環境。
2.正負快速查詢功能。正負快速查詢功能主要對電子數據中的某個查詢字段所包括的正值或負值提供快速查詢功能,這樣可以避免用戶在一些最基本、最簡單的查詢問題上去寫一些SQL語句。
3.條件快速查詢功能。條件快速查詢功能主要是根據給定的查詢范圍和查詢值,來對電子數據中的某個查詢字段提供快速查詢功能,這樣可以避免用戶在一些最基本、最簡單的查詢問題上去寫一些SQL語句。
數值分析是根據被審計數據中某一字段具體的數據值的分布情況、出現頻率等指標,對該字段進行分析,從而發現審計線索的一種審計數據分析方法。這種方法是從“微觀”的角度對電子數據進行分析,審計人員在使用時不用考慮具體的被審計對象和具體的業務。在完成數值分析之后,針對分析出的可疑數據,再結合具體的業務進行審計判斷,從而發現審計線索,獲得審計證據。相對于其它方法,這種審計數據分析方法易于發現被審計數據中的隱藏信息(陳偉,2012)。
本系統根據用戶練習數值分析方法的需要,主要實現了重號分析、斷號分析、Benford 定律等功能。
1.重號分析功能
重號分析用來查找被審計數據某個字段(或某些字段)中重復的數據。例如,檢查一個數據表中是否存在相同的發票被重復多次記賬。本系統中,重號分析功能是為了滿足用戶練習重號分析方法的需要。
2.斷號分析功能
斷號分析主要是分析被審計數據中的某字段在數據記錄中是否連續。本系統中,斷號分析功能是為了滿足用戶練習斷號分析方法的需要。
3.Benford 定律功能
概括來說,Benford 定律是指數字及數字序列在一個數據集中遵循一個可預測的規律。因此,如果被分析的審計數據不符合Benford 定律的標準概率分布曲線,則表明在被分析的審計數據中可能含有“異?!钡臄祿?。本系統中,Benford 定律功能功能是為了滿足用戶練習Benford 定律方法的需要。

統計分析的目的是探索被審計數據內在的數量規律性,以發現異?,F象,快速尋找審計突破口(陳偉,2012)。本系統根據用戶練習統計分析方法的需要,主要實現了一般統計和分層分析功能。
1.一般統計功能
一般統計常用于具體分析之前,以對數據有一個大致的了解,它能夠快速地發現異?,F象,為后續的分析工作確定目標。一般統計對數值字段提供下列統計信息:全部字段以及正值字段、負值字段和零值字段的個數,某類數據的平均值,絕對值以及最大或最小的若干個值等。本系統中,一般統計功能是為了滿足用戶練習一般統計方法的需要。
2.分層分析功能
分層分析是通過數據分布來發現異常的一種常用方法。其原理一般為:首先選取一個數值類型的字段作為分層字段,然后,根據其值域將這一字段劃分為若干個相等或不等的區間,通過觀察對應的其它字段在分層字段的各個區間上的分布情況來確定需要重點考察的范圍。本系統中,分層分析功能是為了滿足用戶練習分層分析方法的需要。


審計抽樣是指審計人員在實施審計程序時,從被審計對象總體中選取一定數量的樣本進行測試,并根據樣本測試結果,推斷總體特征的一種方法。本系統根據用戶練習審計抽樣方法的需要,主要實現了間隔抽樣和隨機抽樣等功能。
1.間隔抽樣功能
間隔抽樣是從被審計數據中按相等的間隔提取一些記錄。有兩種方法確定抽樣:一種是輸入要抽取的記錄個數,系統將計算抽樣間隔量;另一種是輸入抽樣間隔,系統將計算要抽取的記錄個數。本系統中,間隔抽樣功能是為了滿足用戶練習間隔抽樣方法的需要。
2.隨機抽樣功能
隨機抽樣是通過輸入抽樣量以及要從抽樣中提取的記錄范圍,然后,使用一個隨機數種子,系統將生成一系列隨機數并選取同這些數相關的適當記錄。本系統中,隨機抽樣功能是為了滿足用戶練習隨機抽樣方法的需要。
在多個被審計數據源中可能含有相似重復實體,這些相似重復實體可能就是審計過程中要查找的可疑數據。例如,聯網審計環境下從不同地方采集來的被審計數據中,被審計數據A 中出現的數據不應該出現在被審計數據B 中。通過數據匹配技術可以有效地發現舞弊案件。國內外對數據匹配技術的研究多用來檢測數據源中的相似重復數據,達到提高數據質量的目的,直接把數據匹配技術應用于審計中的研究還不常見(陳偉,2012)。

基于這一需要,本系統實現了一種基于數據匹配技術的審計證據獲取方法,滿足用戶練習數據匹配方法的需要。該方法主要包括一般匹配和長度過濾匹配兩種方法。
1.一般匹配功能
本系統中,一般匹配功能是為了滿足用戶練習基本的數據匹配方法的需要。
2.長度過濾匹配功能
大數據環境下,由于被審計數據是海量的,因此,必須提高數據相似檢測效率。由數據匹配方法中數據相似檢測算法的流程可以知:數據間的相似檢測依賴于數據中每個字段的相似檢測,因此字段的相似檢測是一個相當重要的原子操作,其效率直接影響整個算法的效率。對于字符型數據的相似性檢測,一般采用編輯距離算法。由于編輯距離算法的復雜度為,當數據量很大時,如不采用一種高效的過濾方法來減少不必要的編輯距離計算,則會導致相似檢測時間過長。因此,為提高數據檢測效率,提出了一種基于長度過濾方法優化的相似檢測算法(陳偉,2012)。長度過濾方法基于以下定理:
定理1: 長度過濾。任給兩個字符串x,y,其長度分別為|x|,|y|。如果x和y的編輯距離最大為,則兩個字符串的長度之差最多不能超過,即:||x|-|y||≤k。
從定理1 可以看出,在計算字段的編輯距離之前,如能利用此定理對所要比較的記錄字段進行過濾,則可大大減少不必要的編輯距離計算,從而提高相似重復記錄的檢測效率。
本系統中,長度過濾匹配功能就是為了滿足用戶練習以上長度過濾匹配功能。
為了實現對被審計數據的相似查詢功能,解決數據查詢(包括SQL模擬查詢器、正負快速查詢、條件快速查詢)功能的不足,筆者提出了一種基于編輯距離算法的SQL相似查詢方法。本系統實現了這種方法,從而滿足用戶練習數據相似查詢功能的需要。
1.SQL相似查詢功能
SQL相似查詢方法主要是在SQL查詢功能中嵌入基本的編輯距離算法,本系統中,SQL相似查詢功能滿足用戶練習SQL相似查詢方法的需要。
2.SQL長度過濾相似查詢功能
SQL長度過濾相似查詢方法主要是針對SQL相似查詢功能,在SQL查詢功能中的編輯距離算法中嵌入長度過濾算法,從而提高SQL相似查詢的速度。本系統中,SQL長度過濾相似查詢功能滿足用戶練習SQL長度過濾相似查詢的需要。
基于以上功能分析,采用Visual C#實現了“電子數據審計模擬實驗室軟件”,其主界面如圖4 所示。
以SQL模擬查詢器功能的使用為例,采用本軟件練習數據查詢方法在稅收征收數據分析中的應用,其過程簡述如下:
現有某稅收征收電子數據(文件名為“稅收征收.mdb”,數據表名為“征收表”),現對提供的稅收征收電子數據進行分析處理,檢查征收表中有無“負納稅”數據。
通過分析,檢查稅收征收數據中有無“負納稅”數據,其SQL語句如下:

假設稅收征收數據已被采集到電子數據審計模擬實驗室軟件中,打開“SQL模擬查詢器”,如圖5 所示。
在圖5 中輸入以上SQL語句,或借助SQL模擬查詢器中的SQL語句關鍵詞生成以上SQL語句,然后在圖5 中點擊“執行SQL語句”命令,運行以上SQL語句,可以很容易地查找出稅收征收數據中的“負納稅”數據。其查詢結果如圖6 所示。
總之,通過以上功能,用戶可以方便地練習并掌握數據查詢方法的應用。
本文根據目前開展計算機輔助審計的需要,研究并設計了電子數據審計模擬實驗室軟件,實現了目前常用的以及一些最新的電子數據審計數據分析方法,從而滿足了電子數據審計實踐教學的需要。本軟件安裝方法簡單,占用空間小,便于實驗操作。本軟件除了具有目前流行的電子數據審計數據分析方法外,還增加了一些筆者關于電子數據審計最新的研究成果,如數據匹配、數據相似查詢等。另外,筆者將根據電子數據審計的發展,在電子數據審計模擬實驗室軟件不斷增添新的電子數據審計方法,從而更好地滿足用戶學習電子數據審計的需要。
1.陳偉.計算機輔助審計實驗教學探析.中國管理信息化.2009(1)
2.陳偉.計算機輔助審計原理及應用(第二版).清華大學出版社2012
3.陳偉, 牛艷芳, Wally Smieliauskas.國內外IT 審計教育比較及其對我國的啟示.中國注冊會計師2013(11)
4.陳偉, Smieliauskas W.云計算環境下的聯網審計實現方法探析.審計研究.2012(3)
5.陳偉, 張金城, Qiu R.計算機輔助審計技術(CAATs)研究綜述.計算機科學.2007(10)
6.王曉崢, 馬施.審計模擬實驗室建設探討.審計研究.2013(6)
7.國家863 計劃審計署課題組.計算機審計數據采集與處理技術研究報告.清華大學出版社.2006
8.國家審計署.2014.http://www.audit.gov.cn
9.Alali A F,Pan F.2011.Use of audit software: review and survey[J].Internal Auditing, 26(5): 29-36
10.Chen W, Liu S F, Smieliauskas W, etc.2012.Influence factors analysis of online auditing performance assessment: a combined use between AHP and GIA[J].Kybernetes:The International Journal of Cybernetics, Systems and Management Sciences, 41(5/6): 587-598
11.INTOSAI audit committee.2004.Principles of computer assisted audit techniques - student notes
12.James P A, Bruce H, Gabrielle L, etc.2011.Data-intensive science in the us doe: case studies and future challenges[J].Computing in Science and Engineering, 13(6): 14-24
13.Lambrechts A J, Lourens J E, Millar P B,etc.2011.Global technology audit guide(GTAG):Data analysis technologies[M].The Institute of Internal Auditors
14.Robert L B, Harold E D.2003.Computer-assisted audit tools and techniques: analysis and perspectives[J].Managerial Auditing Journal, 18(9):725-731
15.The 6th ASOSAI Research Project.2003.IT Audit Guidelines[EB/OL].http://www.asosai.org