魏祥健(教授)
2015年8月31日,國務院正式印發《促進大數據發展行動綱要》,系統部署大數據發展工作。而審計作為一種對數據進行識別和分析的鑒證活動,必然會受到大數據及其相關技術的影響。傳統的抽樣審計技術和事后審計模式在大數據環境下不僅實施困難,而且效率低下、監督滯后,降低了審計鑒證質量,弱化了審計監督職能。大數據作為新興產業技術,具有實時數據傳遞、大量數據分析、快速數據處理等功能,不僅能增強審計信息化水平,還能在當前審計力量不足的情況下提高審計效率,減輕國家審計全覆蓋的壓力。因此,在大數據環境下,如何借助大數據技術對經濟業務事項進行事前、事中、事后的全方位監督,實現以預防、控制、檢查為一體的持續審計,達到國家審計參與國家治理全覆蓋的監督目標,是學者們目前迫切需要研究的課題。本文基于大數據時代的現實背景,利用大數據處理技術推動審計技術的革新,借助大數據思維探討事前預防、事中監控、事后檢查的持續審計模式,重構審計實施流程,以期推動我國大數據審計建設,促進審計監督服務效能的發揮。
1.關于大數據的研究。大數據(Big data)亦稱海量數據,顧名思義就是數據量大,其體量可以達到數百TB 甚至PB 級。對大數據的研究最先來自于實務部門。最先系統研究和應用大數據的是麥肯錫公司,其認為大數據是無法用傳統的軟件工具在短時間內被獲取、分析和管理的海量數據,并首先在商業中開展應用。之后IBM 公司、微軟公司、EMC 公司、惠普等互聯網巨頭紛紛跟上,高度關注大數據的潛在商業價值,并投入大數據的研究和技術應用。隨后,金融界和政府部門也開始關注大數據。在美國,奧巴馬政府于2012年率先公布了“大數據研究和發展計劃”,將大數據應用上升為國家戰略;英國、日本、法國等也紛紛制定了大數據國家發展戰略計劃;2015年我國印發了《促進大數據發展行動綱要》,開始從國家戰略層面系統部署大數據發展計劃。
隨著大數據在商業領域的應用發展并逐漸擴展到會計、審計領域,其對審計技術、審計方法、審計模式產生了巨大影響,眾多學者開始探討和研究大數據審計理論框架和實務應用。如秦榮生[1]研究了大數據技術、云計算技術對審計的影響;王歡、許暖和沈波[2]研究了大數據環境下智能審計平臺的搭建;顧洪菲[3]研究了大數據環境下的審計數據分析方法;魏祥健[4]研究了大數據環境下的審計模式變更等。至此,有關大數據的理論研究和實務應用開始蓬勃發展。
2.關于大數據對審計影響的研究。秦榮生[1]提出,隨著大數據的產生和發展,大數據技術必然對審計產生重要的影響。一是對審計技術的影響。包括:平臺搭建技術,如王歡、許暖和沈波[2]提出通過運用大數據技術可以搭建大數據審計平臺;全量分析技術,如朱玲玲[5]提出大數據環境下傳統的抽樣分析會轉變為大數據的全量分析。此外,嵌入審計技術、聯網審計技術、智能分析技術、數據挖掘技術也得到了廣泛的研究。二是對審計方法的影響。朱玲玲[5]還提出大數據促使抽樣審計向總體審計轉變、現場審計向遠程審計轉變;韓強[6]提出應創新大數據環境下的現代化審計方法和工具。近年來,大數據方法創新在國外也受到了高度重視,如美國在推動政府開放數據方面做出了巨大的努力,英國國家審計署尤其重視可視化分析方法在政府審計中的應用。三是對審計模式的影響。牛艷芳等[7]、魏祥健[8]研究了大數據環境下云審計模式的構建;張俠、劉軍[9]探討了大數據環境下國家審計從傳統的事后審計、定期審計、現場審計向事前、事中、事后相結合的遠程審計、實時審計的轉變。
3.關于大數據持續審計的研究。持續審計(CA)又稱連續審計、實時審計。1991年,Vasarhelyi、Halper對開票數據進行持續監督和控制的執行報告,是國外持續審計研究的開端。1999年,美國注冊會計師協會(AICPA)和加拿大特許會計師協會(CICA)對持續審計進行了定義,認為持續審計是實時生成審計報告的一種審計鑒證方法。在持續審計技術方面,Groomer、Murthy[10]提出了嵌入式審計模塊技術,Bill Franks[11]提出了實驗系統的設計,證明了持續審計技術的可行性。
國內持續審計研究起步較晚、相對滯后。何芹[12]探討了我國推行持續審計的理論基礎,設計了持續審計流程,并分析了持續審計適合的對象和恰當的審計時間;王玉華[13]分析了我國推行持續審計存在的主要障礙,并提出了相應的對策與建議。隨著XBRL技術在國外的興起和應用以及在我國上市公司的逐步試行,一些學者開始把目光投向XBRL 與持續審計的結合,認為XBRL 的自動財務報告生成技術與持續審計要求的環境非常接近,有助于持續審計的開展[14]。隨著大數據技術的興起、發展和應用,在大數據環境下如何構建大數據持續審計模式也逐漸引起了業界關注。華博風控創始人張孝昆[15]提出利用大數據技術顛覆傳統審計模式,由事后審計轉變為事前管控、事中管控、事后管控的三維一體管控模式;何芹[12]、張俠和劉軍[9]也認為基于大數據的技術支持,傳統的事后審計模式應逐漸向大數據實時審計模式轉變。
以上研究表明,大數據技術是審計的重要技術支持已得到學者們的共識,在大數據環境下開展數據平臺支撐的大數據審計也逐漸得到大家的關注。但目前對于大數據環境下持續審計的研究還處于理論探討階段,持續審計模式的理論架構和實踐應用方法體系還未形成,基于大數據思維導向和技術支持的持續審計流程設計和實現路徑,是推動大數據理論研究和實踐應用的關鍵。
隨著大數據的發展與應用,大數據技術必然能夠為持續審計提供源源不斷的技術創新支持,從而推動審計的技術革新,大數據審計技術是實現持續審計發展的關鍵要素。
1.大數據采集技術。大數據采集與傳統手工數據采集有著本質的區別,它主要是利用采集工具遠程獲取被采集對象的各種類型的數據,包括結構化數據、半結構化數據及非結構化數據。根據采集與被采集雙方的網絡架構情況,大數據采集方式可以分為軟件接口方式、數據庫接口方式和底層數據直接交換方式等。
軟件接口方式一般通過現場采集進行。由數據采集員定期攜帶筆記本電腦到被采集單位,使用與被采集對象軟件接口標準相容的采集軟件,與被采集數據庫建立連接,現場采集所需數據,經過建立中間表將所采集的數據轉換成采集方所需的有用數據形式。軟件接口方式要求采集雙方的軟件要兼容,所以擴展性不高,如果出線接口標準不一致,就無法實現數據采集。此種數據采集方式類似于傳統意義上的手工現場數據采集,只不過在數據采集的方法上不同。
數據庫接口方式一般通過遠程采集進行。這種方式是采集方與被采集方Inter網、內部專網或政府政務外網等建立網絡連接,采集方事先在被采集方數據庫安裝數據接口軟件,通過該軟件接口的訪問權限可以直接訪問被采集單位數據庫,從而實現數據采集。此種采集方式不僅可以實現對數據的實時采集,還可實現大規模的數據采集,是大數據環境下最直接、最便利的一種數據采集方式,但時時開放的數據庫對于被采集方來說,數據安全會存在很大的隱患。
底層數據直接交換方式是指通過引擎軟件或仿真技術,對被采集對象的底層數據交換進行偵聽,對目標軟件客戶端和數據庫之間的網絡流量進行分析,從而采集或自動寫入所需數據。這種方式不需要軟件廠商的配合,就能夠自動建立數據間的關聯,實現獨立抓取,源源不斷地獲取所需的精準、實時的數據。
2.大數據存儲技術。傳統的紙質數據存儲在檔案室,時間一長容易發霉變質和毀損。電子數據一般存儲在U 盤、移動硬盤或本地服務器中,這種存儲方式存在的最大問題是其存儲介質容易感染病毒而導致數據毀損,而且數據無法實現共享。大數據存儲技術充分利用Inter網和云計算技術來實現安全、大容量存儲。一是以太網硬盤存儲,即采取以太網連接的動能硬盤形式,數據直接經過以太網接口存儲到硬盤中,精簡了數據存儲到硬盤中的傳輸環節,而且以太網硬盤的存儲容量和性能比現有的硬盤高達四倍。二是云端存儲,即通過專業的服務商建設云存儲中心,采用大量的專業服務器來存儲數據,數據客戶與云存儲中心以網絡連接,依據客戶權限允許訪問、下載和使用數據。云存儲中心由專業的服務商運營,其不僅具有高容量和高擴展性,而且可使數據安全得到保障。
3.大數據分析技術。大數據分析是指在大數據處理環節,運用大數據分析工具和分析方法,對獲取的數據進行計算分析、比較分析、指標分析、趨勢分析等。此外,還有預測分析、并行計算、數據倉庫、可視化分析技術等。預測分析是指通過計算分析、指標分析、比較分析、趨勢分析等方法估計、推算未來結果或發展趨勢,為進行決策、預報模擬等提供信息支撐。并行計算是通過將問題分解,協同解決大型復雜問題的方法,即把同一個問題分解成若干組成部分,每個組成部分均由一個獨立的處理器來并行計算,這樣多個處理器并行運行協同求解同一個問題,從而提高處理速度和效率。數據倉庫是聯機數據分析和多維數據挖掘系統,即為了方便企業了解數據全貌以及對數據進行多維分析和處理而建立的關系型數據庫決策支持系統,能夠幫助決策者快速地從大量的數據中挖掘出有價值的信息,構建商業智能。可視化分析是指將數據以簡單、直觀的圖形、圖像呈現給用戶,使用戶更容易接收和理解數據信息。當前西方國家如英國大力推進可視化分析在審計中的應用,以提高審計效率和質量[16]。
4.大數據挖掘技術。數據挖掘是大數據分析的核心技術,是指運用數據挖掘方法對大量數據進行分析處理,揭示其中隱含的、先前未知的且有潛在價值的信息。主要包括數據清理、數據轉換、數據分析、知識表示等步驟。數據清理是指剔除數據中一些無用的冗余數據,如數據文件建立過程中的人為誤差以及數據文件中一些對統計分析結果影響較大的特殊數值,常用的方法包括可編碼式清理和聯列式清理。數據轉換是指通過轉換工具建立中間表,把不同格式、不同類型的數據轉換成系統能夠識別的格式。數據分析就是通過運用分類、估值、預測、聚集、描述和可視化等方法,對大量的數據進行處理,從中提取出輔助決策的關鍵知識。知識表示是指將數據挖掘的結果以便于人們識別和理解的形式呈現給用戶,供其使用。
隨著大數據技術對審計的影響和推動作用,傳統的事后審計抽樣分析、微觀分析以及單一審計主體獨立作戰的審計方法積聚了越來越多的弊端,必然促使審計向全量分析、宏觀評價、分工協作等方面轉變,為持續審計提供方法支撐。
1.數據分析方法:從抽樣分析到全量分析的轉變。傳統審計方法下,由于受審計機關人員數量、報告時間、固定地點等的限制,難以對被審單位數據進行全面、細致的分析,往往采取統計抽樣方法選取部分樣本量估計總體特征,這就是傳統審計方式下的抽樣審計。抽樣審計的結果雖然也具有一定的代表性,但樣本規模畢竟只是審計對象的一部分,存在不可避免的風險,會對審計結果的準確性造成影響。隨著大數據數據采集技術、資源共享技術在審計中的應用,關聯數據、外部數據在審計中得到了充分利用,使得審計范圍不再受制于抽樣樣本,而是著眼于單位的全部數據。從全量的角度進行審計,可以實現被審計單位財務數據、業務數據、外部關聯數據信息的全面覆蓋,審計對象更具全面性、整體性、延伸性,審計結果也更具有代表性、精準性。
2.審計評價方法:從微觀評價到宏觀評價的轉變。傳統的審計大都以原始憑證為起點,通過檢查業務發生過程中的原始資料記錄,從中發現疑點,尋找突破點,為具體的業務人員提供審計線索;或者根據審計目標等提出具體審計需求,分析人員進行針對性的查詢分析。總之,傳統審計評價就是從數據的微觀、細節入手,進而得到個體性結論。而在大數據環境下,通過數據獲取技術、數據分析技術、資源共享技術,能夠實現對審計對象的內部數據和外部關聯數據的獲取和分析,進而了解公司自身、行業整體的情況,對部門、行業、國家的制度出臺及發展戰略做出前瞻性思考和全局性分析。因此,在大數據環境下,審計評價工作實現了從點到面、從微觀到宏觀的轉變,從而推動審計職能由服務于企業治理轉變為參與國家治理。
3.審計工作方法:從“一對一”的孤立審計到“多對一”的協同審計的轉變。傳統的審計工作方法是各個審計主體針對各自的審計任務,從審計準備到審計實施的過程中都采取現場“一對一”審計方法,即一個審計主體對一個被審計單位。這種方法由于受人力、時間的限制,在大數據環境下顯得力不從心,很難對數據進行全面分析;此外,由于技術的限制,對復雜問題也難以進行深入分析,往往審計效率不高,審計成效不大。在大數據環境下,通過資源匯集技術和資源協同效應,可以有機地把相關審計機構聯系起來,整合集成互補審計資源,優化利用各個方面的專業人才,共同協作完成一項審計任務,從而提高審計效率和質量。這樣,傳統的“一對一”現場審計方法就演變為“多對一”的各個審計機構協同的審計方法。
4.審計模式:從事后審計到事前、事中、事后持續審計的轉變。傳統的審計模式一般是在被審計單位經濟事項完成后進行的,通過審計被審計單位已經完成的賬務處理和報表編制的合法合規性、正確性、合理性來分析問題,糾正錯誤弊端,挽回已造成的損失和改進工作。這種事后審計模式能夠達到事后監督和糾正錯誤的目的,但并不具備事前預防和事中管控的效果。大數據環境下的審計通過事先在被審計單位嵌入審計軟件或者利用數據接口與大數據分析中心互聯互通,利用嵌入式審計技術分析用戶界面的行為特征,識別當前操作中存在的風險,及時防止錯誤的發生,從而推動審計端口前移,形成事前監控、事中分析、事后檢查三維一體的持續審計模式。
基于大數據的技術支持和方法支撐,開展大數據持續審計必須先搭建涵蓋數據分析、數據存儲和資源集成共享功能的云服務平臺[2]。
由國內外的研究和實踐來看,大數據平臺搭建技術可以采用云平臺搭建的Iass、Paas、Saas技術和大數據平臺搭建的Hadoop技術。Iass、Paas、Saas技術是在云計算環境下基于云供應商—客戶的服務模式的平臺架構方法,云平臺包括底層(Iass 層)、中間層(Paas層)和上層(Saas層)。Iass層即硬件服務層,主要架構電腦、服務器、數據庫、中間件、業務引擎、網絡體系等硬件基礎服務平臺,向上提供業務調度服務;Paas 層即技術服務層,主要架構功能模塊、技術方法、系統應用、流程優化等技術服務平臺,向上提供技術服務;Saas層即軟件服務層,主要架構平臺所需的應用軟件和特殊需求的程序段等,為平臺提供軟件資源服務。云平臺架構技術是云計算環境下快速響應用戶需求的開發技術,一般由專業的云服務商建設和維護,再以服務的形式提供給客戶使用。
Hadoop 技術是大數據環境下搭建大數據處理平臺或數據中心的一種平臺構建方法,它的特點是:①硬件部署價格低廉;②數據訪問高吞吐量;③能夠進行分布式處理。用戶可以在不了解底層架構細節的情況下,開發分布式處理程序,充分利用集群的威力進行高速運算和存儲,因此,Hadoop 適用于超大數據集的應用程序部署和處理。正是由于超大數據的分布式處理能力,Hadoop迅速發展成為大數據分析和處理的領先技術。基于Hadoop 的優勢和特點,本文采用Hadoop技術搭建大數據持續審計平臺,實現資源統一調度、數據集成共享。該平臺的功能結構如圖1所示。

圖1 大數據持續審計平臺功能結構
大數據持續審計平臺的功能模塊主要有四個:①數據處理系統,包括數據采集、數據分析、數據存儲;②數據監測系統,包括事前監控、事中監控、事后檢查;③知識系統,包括審計法規庫、審計案例庫、專家系統、會商系統;④審計評價系統,包括審計查證、審計評價、成果運用。
傳統的審計大都是事后審計或周期性審計,審計流程具體包括:審計準備→數據采集→數據整理與轉換→數據分析→查找疑點→疑點求證→分析評價→得出結論。這種審計過程耗費了大量的人力、時間和精力,審計效率低下,且這種事后審計模式有一定的滯后性,嚴重削弱了審計應該達到的預防效果和監督效果。
在大數據環境下,依托大數據審計平臺,審計主體與被審計單位可以通過聯網建立數據接口、嵌入審計模塊、部署監控端口鏡像等,從事前、事中、事后持續開展審計工作,達到三維一體的監督效果。這種模式使得審計端口前移,審計流程的起點從事前預防就已開始,審計人員的工作重心不再是數據采集和數據分析(這些工作都由審計平臺系統智能完成),而是轉移到對審計疑點的分散查證上,從而使審計人員從繁重的體力勞動中解放出來,節約了審計時間,提高了審計效率。這樣,傳統的有著明確起點和終點邊界的具體審計流程變得簡單和抽象,轉變為大數據環境下事前預防、事中控制、事后檢查的持續審計流程。大數據持續審計流程如圖2所示。

圖2 大數據持續審計流程
1.事前審計。事前審計的主要作用是預防,是大數據持續審計流程的起點,通過嵌入審計技術、可視化技術、數據檢測技術、風險評估技術實現事前預防。通過在被審計單位數據庫系統的主機和核心交換機上部署網絡監控的端口鏡像模式和嵌入審計接入模塊與大數據審計平臺互聯,實現對被審計單位的監控。
數據監測主要用來評估被審計單位內部控制的有效性。對于被審計單位提供的交易規則、交易過程和相關內部控制制度等,通過數據實時監測技術,可以判斷會計信息系統是否對進入系統的交易事項信息都做了過程處理和輸出了處理結果,以及處理過程是否正確、結果輸出是否完整,以評估內部控制的有效性。
模擬運行和風險評估主要針對被審計單位經濟業務實施之前的測試和風險監測。在被審計單位的業務計劃、方案、預算制定、經營決策、可行性報告和經濟合同批準之前,通過快照技術把相關數據傳輸到大數據云平臺的虛擬業務運行系統進行模擬運行,根據事先設定的預判規則,對模擬運行結果進行智能風險評估,并自動生成評估報告來評價業務的執行風險,從而達到事前預防的效果。
2.事中審計。事中審計是指在被審計單位經濟事項發生過程中所進行的控制活動,通過嵌入審計技術、可視化技術、在線監控技術、風險識別技術來實現。
傳統的事中審計一般以工程項目的跟蹤審計為主,大數據事中審計可以擴展到各種類型的審計。在大數據審計平臺的支持下,運用嵌入審計技術嵌入審計程序,對被審計單位的系統交易處理過程進行持續的監督,運用可視化技術把在線監督影像傳輸到大數據審計平臺,運用風險識別技術對交易數據進行在線分析、技術判斷,以及評價該業務處理的合規性、合法性、正確性和完整性,從而識別審計風險,生成審計預警,達到事中監控的目的。通過大數據事中審計方式,可以實現審計監督關口前移,及時發現問題并采取改進措施,有效推動交易行為執行的質量和績效,避免事后監督的滯后性風險。
3.事后審計。事后審計屬于審計疑點查證階段,也就是通常意義上的事后審計階段。其主要功能是數據分析、疑點匯總和分散查證,通過大數據采集技術、挖掘技術、分析技術和智能評價技術來實現。
利用大數據跨平臺、跨系統的數據采集技術,被審計單位的財務數據、業務數據和外部關聯數據可以實時采集并傳輸到大數據處理平臺,大數據處理平臺通過專業的審計智能分析軟件對原始被審計數據進行整理、轉換、篩選和挖掘,剔除海量數據中的錯誤數據、冗余數據,形成有用的被審計數據并進行關聯分析、對比分析、預測分析、可視化分析等,從中查找審計疑點并形成分析報告數據庫和審計疑點匯總數據庫。
根據大數據處理平臺的數據采集和分析結果,按照地域管轄權原則和項目性質分類原則,由省級審計機關統一指揮、統一部署,各個基層審計機關協同工作,根據審計人員的專業特長和項目需求組建臨時的項目工作小組,按照匯總的審計疑點進行分散核查,逐一證實,然后根據核查的結果進行會商,由專家進行評估,得出審計結論。這種處理方式把審計人員從傳統審計繁重的審計取數、審計分析等高強度工作中解放出來,把精力主要放在審計查證上,從而大大提高了審計效率,增強了審計結果的可靠性。
在大數據環境下,探索大數據審計的技術革新和方法創新,搭建大數據持續審計平臺和流程再造,是推動國家審計效率和質量提升的現實需求。大數據環境下的持續審計研究和實踐是各國理論界和實務界當前探索的重點課題,亦是我國未來審計發展的一種新趨勢。構筑完善的大數據持續審計理論框架體系,加強實例應用的落地實施,是該領域突破發展的關鍵。