【摘要】? 隨著大數據的產生和發展,大數據和大數據處理技術必然對審計行業產生重大的影響,傳統的審計技術和審計流程面臨巨大的挑戰。在虛擬化、海量化的大數據環境下,傳統的手工審計技術和孤立的“一對一”審計流程已不能適應審計發展的本質需求。文章基于對大數據的本質特征和對審計影響的深入分析,利用大數據處理技術推動審計的技術革新和制度創新,重構大數據環境下的審計實施流程,搭建大數據持續審計模式的基本框架,推進我國審計信息化建設,增強審計監督服務的效能發揮。
【關鍵詞】? 大數據;大數據審計;流程再造
【中圖分類號】? F239? 【文獻標識碼】? A? 【文章編號】? 1002-5812(2019)03-0029-04
一、引言
大數據作為互聯網發展中的新興產物,正在逐漸影響和改變人們的思維模式,在各個行業、各個領域得到廣泛運用。審計作為一種數據分析的鑒證活動,正需要大數據的大量、快速處理技術來提高審計效能,大數據給審計工作的飛躍發展帶來了不可多得的機會。但是另一方面,在大數據環境下,審計面臨的情況更加復雜:數據呈現海量化、虛擬化、分布散亂等特征,傳統的審計技術、審計流程可能面臨取數困難、分析困難、查證困難。因此,2015年12月9日中辦、國辦印發的《關于實行審計全覆蓋的實施意見》提出,要構建大數據審計工作模式,提高審計效率和質量。那么,什么是大數據審計工作模式?如何開展大數據審計?目前都還處于探討之中。本文以此為契機,利用大數據處理技術推動審計技術的革新,重構審計實施流程,搭建大數據持續審計的工作模式,推動審計信息化建設,有效發揮審計監督服務的效能。
二、大數據與大數據技術
(一)大數據
大數據(Big data)也稱海量數據,顧名思義就是數據量大,其體量可以達到數百TB甚至PB級。最先系統研究和應用大數據的先驅者麥肯錫公司從工具處理角度把大數據定義為無法用傳統的軟件工具在短時間內進行獲取、分析和管理的海量數據。維基百科從人工處理的角度將大數據定義為在一定時間內人工無法進行采集、處理、分析并從中獲取有用信息的大體量數據集合。從審計的角度看,大數據應是被審計對象的海量數據集合,包括傳統的財務賬套數據、臺賬明細賬形式的業務數據以及外部相關聯的結構化和非結構化數據。
從以上定義可以看出,大數據的內涵已經超出了傳統意義上數據的標準。不僅表現在體量上的“大”,而且還在于傳統的工具對其處理的難度上的“大”,且在本身性質上還出現非結構化等不規則的特征。一是數據體量巨大。數據不僅在形式上由紙質向電子數據轉變,而且在體量上也呈幾何速度的增長,數據計量單位也從傳統的Byte、KB、MB、GB發展到TB、PB、EB、ZB、YB,甚至用BB、NB、DB來衡量。二是數據結構復雜。類型多樣,呈現多元化、非結構化特征,如虛擬技術產生的虛擬數據中心數據,以文本、圖像、聲音、影視、超媒體等形式的非結構化數據等。三是數據處理難度較高。對數據的采集方式、傳輸方式、存儲安全提出了更高的要求,也加大了數據的分析難度和管理難度,傳統的手工處理方式和一般的軟件工具在規定的時間要實現整個過程的處理是難以實現的。
(二)大數據技術
1.大數據采集技術。大數據采集和傳統手工數據采集有著本質的區別,根據采集與被采集雙方的網絡架構情況,可以分為軟件接口方式、數據庫接口方式和底層數據直接交換方式等。
軟件接口方式一般采取現場采集方式進行。通過與被采集對象軟件接口標準相容的采集軟件與被采集數據庫建立連接,現場采集所需數據,然后經過建立中間表轉換成采集方所需的有用數據形式。此種數據采集方式類似于傳統意義上的手工現場數據采集,只不過在數據采集的方法上產生了變化。
數據庫接口方式一般以遠程采集方式進行。這種方式是采集方與被采集方以因特網、內部專網或政府政務外網等方式建立網絡連接,采集方事先在被采集方數據庫安裝數據接口軟件,通過該軟件接口的訪問權限可直接訪問被采集單位數據庫從而實現數據采集。
底層數據直接交換方式是指通過引擎軟件或仿真技術對被采集對象的底層數據交換進行偵聽,對目標軟件客戶端和數據庫之間的網絡流量進行分析,從而采集或自動寫入所需數據方式。
2.大數據存儲技術。大數據存儲技術是充分利用因特網和云計算技術來實現安全、大容量存儲。一是以太網硬盤存儲,即采取以太網連接的動能硬盤形式,數據直接經過以太網接口進而存儲到硬盤中,精簡了數據到硬盤之間的傳輸環節,且其存儲容量和性能比現有的硬盤高達四倍。二是云端存儲,即通過專業的服務商建設云存儲中心,采用大量的專業服務器來存儲數據,數據客戶與云存儲中心通過網絡連接,通過權限訪問、下載和使用數據的方式。云存儲中心不僅具有高容量和高擴展性,而且數據安全得到了保證。
3.大數據分析技術。大數據分析技術是通過大數據分析工具和分析方法對獲取的數據進行計算進而實現預測分析、并行計算、數據倉庫、可視化分析等。預測分析是指通過計算、指標分析、比較分析、趨勢分析等分析方法估計、推算未來結果或發展趨勢的一種分析技術,為決策優化、預報模擬等用途提供支撐信息;并行計算是通過問題分解協同解決大型復雜問題的方法,即把同一個問題分解成若干組成部分,每個組成部分均由一個獨立的處理器來并行計算,這樣多個處理器并行運行協同求解同一問題,從而提高處理速度和效率;數據倉庫是聯機數據分析和多維數據挖掘系統,即為了便于讓企業了解整個數據全貌和進行多維分析和處理而建立的關系型數據庫決策支持系統,能夠幫助決策者快速地從大量的數據中挖掘出有價值的信息,構建商業智能;可視化分析是指以簡單、直觀的圖形化、圖像化的形式呈現給用戶,直觀地展示數據,讓數據說話,讓觀眾聽到結果。
4.大數據挖掘技術。數據挖掘是大數據分析的核心技術,是指通過數據挖掘方法對大量的數據進行處理,揭示其中隱含的、先前未知的并有潛在價值的信息。主要包括數據清理、數據轉換、數據分析、知識表示等步驟。數據清理是剔除數據中一些無用的冗余數據,解決數據文件建立中的人為誤差以及數據文件中一些對統計分析結果影響較大的特殊數值,常用的方法包括可編碼式清理和聯列式清理。數據轉換是通過轉換工具建立中間表,把不同格式、不同類型的數據轉換成系統能夠識別的格式。數據分析就是通過分類、估值、預測、聚集、描述和可視化等方法對大量的數據進行處理,從中提取輔助決策的關鍵知識。知識表示是將數據挖掘的結果以人們能識別和理解的形式呈現給用戶,供其使用。
三、大數據推動審計的技術革新
隨著大數據和大數據技術的產生和應用,大數據必然對審計技術進行深入滲透和影響,推動審計技術革新和審計方式轉變,以適應現代社會對審計的本質需求。
(一)大數據對審計的影響
1.對審計范圍的影響。傳統審計方式下,由于審計機關受審計力量、審計技術、時間、地點的限制,難以獲取審計對象的全部數據,特別是外部數據,所以制定審計計劃時,要確立審計重點和規定重要性水平,實行抽樣審計。即選取部分樣本量估計總體特征,從而縮小審計范圍。隨著大數據的實時數據采集技術、智能數據分析技術在審計中的應用,最終會拋棄傳統的受制于工作量的抽樣審計,轉而著眼于全量數據,甚至延伸到外部的關聯數據, 實現被審計單位數據信息的全面覆蓋,大大擴展了審計范圍。
2.對審計技術的影響。在傳統審計中,審計技術主要表現為現場手工審計技術。審計人員常常不得不親自前往被審計單位獲取并查看庫存被審計單位的會計賬簿和原始憑證等審計證據,再通過審閱法、查詢法、函證、重新計算、重新執行、分析程序等方法來分析審計數據,從而得出審計結論。在大數據環境下,數據的形式、數量、結構都發生了巨大的變化,數據電子化、海量化、半結構化和非結構化的存在,已經遠遠超越了傳統數據庫的管理邊界,許多傳統的審計技術和方法顯得效率低下和無法實施,必須使用新的大數據收集、存儲、處理和分析方法。圍繞大數據,一批新興的數據挖掘、數據存儲、數據處理與分析技術將不斷涌現。
3.對審計流程的影響。傳統的審計基本都是事后審計或周期性審計。審計流程是:進駐被審計單位→現場取數→數據分析→查找疑點→疑點求證→分析評價→得出結論。這種審計過程耗費大量的人力、時間和精力,審計效率低下,且這種相對滯后的審計模式影響了審計工作的及時性,嚴重削弱了審計可以達到的預防效果和監督效果。而在大數據環境下,審計主體與被審計單位可以通過聯網建立數據接口,實時、持續采集被審計單位數據信息并傳輸匯總到大數據中心,不需要實施審計時單獨去被審計單位采集數據,這樣,審計流程起點就由數據采集轉變到數據分析。且在大數據協同審計模式下,多個審計項目可以通過數據中心的智能軟件同時進行自動分析,然后審計人員對審計疑點進行分散查證,傳統的單個項目的獨立處理流程就變成了多個項目協同進行的協同處理流程,實現了審計模式由階段性向持續性轉變。
4.對審計風險的影響。傳統的審計風險主要來自于審計師的主觀職業判斷偏差造成的認識風險,審計人員根據預設的風險評估程序以及先驗的假設來進行風險評估,確定審計風險的高低和可接受水平。如果當審計證據取得范圍受到限制時,審計人員發表的審計結論就可能失當,從而加大審計風險。再者,抽樣審計降低了審計結果的精準性,也增加了審計人員發表不當結論的風險。在大數據環境下的全量審計,審計人員不再局限于抽樣審計,而是將審計范圍擴大到以前因為人員力量和技術力量限制無法取得的證據,使審計樣本更大、證據更充分,以減少抽樣審計以點到面估計的不確定性,從而降低審計風險。但是另一方面,大數據環境下的數據開放性也帶來了數據被未知用戶訪問和篡改的風險。審計風險的重點也從數據收集階段轉移到數據傳輸與存儲階段,數據安全風險加大。
(二)大數據推動審計的技術革新
隨著大數據和大數據技術對審計的影響和推動作用,傳統的事后審計抽樣分析、單一審計主體獨立作戰的審計模式顯露出越來越多的弊端,必然催生審計向整體分析、宏觀分析、分工協作等方面轉變,審計技術、審計方式呈現新特征。
1.數據收集:從抽樣審計到全量審計的轉變。傳統審計方式下,由于審計機關受審計力量、時間、地點的限制,難以對審計數據進行全面的對比分析,往往采取抽樣審計方式選取部分樣本量估計總體特征,這就是傳統審計方式下的抽樣審計。抽樣審計的結果雖然也具有一定的代表性,但樣本規模畢竟只是審計對象的一部分,必然存在不可避免的風險,對審計結果的準確性造成影響。隨著大數據數據采集技術、資源共享技術在審計中的應用,關聯數據、外部數據在審計中得到充分利用,使審計范圍不再受制于抽樣樣本,而是著眼于全量數據,從整體的角度進行審計,實現被審計單位數據信息的全面覆蓋,審計項目更具全面性、延伸性、整體性,審計結果更具有代表性、準確性。
2.審計分析:從微觀分析到宏觀分析的轉變。傳統的審計數據分析,大都以原始憑證為起點,通過檢查業務發生過程中的原始資料記錄從中發現疑點,尋求突破點,為具體的業務人員提供線索;或者根據舉報、審計目標等提出審計需求,分析人員進行有針對性的查詢分析。總之,就是從數據的微觀、細節入手得到個體性的結論。而在大數據環境下,通過數據獲取技術、數據分析技術、資源共享技術能夠實現對審計對象的內部數據和外部關聯數據的獲取和分析,實現對公司自身、行業整體或制度實施效果等宏觀層面的了解,進而對部門、行業、國家的制度出臺及發展戰略做出前瞻性的思考和全局性分析。所以,在大數據的環境下,數據分析工作實現了從點到面、從微觀到宏觀的轉變,從而推動審計職能從服務于公司治理到參與國家治理的轉變。
3.工作方式:從“一對一”的孤立審計到“多對一”的協同審計轉變。傳統的審計模式是各個審計主體針對各自的審計任務從審計準備到審計實施結果都采取現場“一對一”審計模式。這種審計模式由于時間、地點、人力的限制,使得審計范圍受限,難以通過數據庫進行數據對比分析,所以審計效率不高,審計質量低下,審計監督效能未能得到有效發揮。大數據環境下,通過建立大數據收集、存儲、分析數據平臺,利用數據平臺的協同性效應,可以有機地把各個相關審計機構聯系起來,組成臨時的審計項目實施小組,優化利用各個方面的專業人才,共同完成一項審計任務,以此提高審計效率和質量。這樣,傳統的“一對一”現場審計模式就演變為“多對一”的各個審計機構協同的審計模式。
4.審計模式:從事后審計到事前、事中、事后持續審計的轉變。傳統的審計模式一般是在被審計主體經濟事項完成后進行的,通過審計被審計單位已經完成的賬務處理和報表編制的合法合規性、正確性、合理性,來研究分析問題。這種事后審計模式能夠達到事后監督和糾正錯誤的目的,但達不到事前預防和事中管控的效果。大數據環境下的審計,通過事先在被審計單位嵌入審計軟件或者通過數據接口與大數據分析中心互聯互通,通過嵌入式審計技術分析用戶界面的行為特征,識別當前操作中存在的風險,及時防止錯誤的發生,從而推動審計端口前移,形成事前監控、事中分析、事后檢查的三維一體的持續審計模式。
四、大數據環境下的審計流程再造
根據協同工作原理和大數據實時采集技術可以看出,傳統的審計流程起點——數據采集不再需要項目實施時單獨去采集,在事前審計階段就已完成;傳統的數據分析也不需要審計人員親歷親為,而是由大數據中心的智能分析承擔;審計人員的工作重心不再是憑證檢查,而是轉移到對審計疑點的分散查證上。且大數據環境下的審計從事前就開始了,是事前、事中、事后的三維一體持續審計過程,審計流程發生了巨大的變化。如下頁圖所示。
(一)事前監控
事前監控是指在被審計單位的經濟業務活動發生之前的一種檢測和控制活動。事前監控可以起到預防作用,減少失誤,有助于嚴格執行財經紀律,預防錯弊,保證經濟活動的合理性、有效性和會計資料的正確性,實現決策的科學化。
事前監控是通過嵌入審計技術來實現的。嵌入審計技術就是通過編寫特殊的審計程序嵌入被審計單位的系統中,當業務流經審計程序設定的控制點時,控制閥門就會捕捉該業務流程的映像,從而通過審計程序中事先設定的合理、合法、合規等判斷標準評價該業務處理的合理合法性、真實性、正確性和完整性,識別審計風險,生成審計預警,達到事前監控的目的。
在大數據環境下,嵌入審計還可以通過另一種方式來實現,即不需要在被審計系統嵌入審計程序,可以通過大數據處理中心與被審計單位聯網建立數據接口,在大數據處理中心端口處嵌入審計程序,被審計數據實時傳輸到大數據處理中心時,通過數據端口處達到實時監控的目的。
(二)審計分析
在大數據環境下,數據量巨大且并不都是有效的數據,它包含了錯誤的數據和冗余的數據,如果用傳統的人工分析無異于大海撈針。大數據分析通過專業的計算機審計分析軟件,利用專業的數據挖掘和數據篩選技術根據算法和標準挖掘和篩選出有用的審計數據,對原始審計數據進行初步的數據清洗,以確定審計分析重點。傳統的“一對一”審計模式下,審計機關各自為政,在“信息孤島”狀態下幾乎無法獲取被審計對象的關聯數據。大數據處理平臺的關聯數據庫,跨系統跨平臺獲取數據的能力實現了這一目標,大數據處理利用數據中心的關聯數據庫資源或聯網獲取外部數據資源進行對比分析與數據查詢,對財務數據和業務數據進行深入的多角度的關聯分析,通過信息(數據)流向追查資金、業務、實物流向,揭示隱藏在數據項之間的關聯關系,從而發現存在的異常情況, 在此基礎上通過進一步分析,從而發現審計疑點。
(三)分散查證
通過審計分析的異常情況,生成審計疑點并進行疑點匯總,根據協同工作小組的分工原則,對各個審計項目的審計疑點進行專業和技術分類,落實相應的審計人員進行分散核查、逐一證實。再根據查證的結果進行會商,專家評估,得出審計結論。最后根據審計評價和結論加強審計結果的利用。這樣,使審計人員從傳統審計繁重的審計取數、審計分析等高強度工作中解放了出來,把精力主要放在審計查證上,從而大大減輕了基層審計機構在數據采集和數據分析上耗時耗力的負擔,提高了審計效率,保證了審計質量,增強了審計事前監督、事后檢查的效能發揮。
五、結語
在大數據環境下,探索大數據對審計的影響和技術革新,推動大數據持續審計建設是當前時代發展的迫切要求,也是審計主體提高審計效率,加強審計質量的內在需求。本文根據大數據的發展對審計的影響分析,論證了大數據技術對審計技術的革新和推動作用,重塑了大數據環境下的審計流程,為我國的大數據審計建設與實施提供了初步的思路。大數據審計是未來審計發展的一種新趨勢,加強大數據審計技術的創新和開發是未來研究的重點。而另一方面,審計數據存放在網絡中,就會面臨被大量訪問的安全風險,因此,數據安全也是一個不能忽視的領域。其次,推動大數據環境下審計的法律法規和標準體系建設,也是未來大數據審計發展的關鍵。Z
【主要參考文獻】
[ 1 ] 魏祥健.云平臺架構下的協同審計模式研究[J].審計研究,2014,(06).
[ 2 ] 彭安鑫,石磊.云計算技術概述[J].網絡安全技術與應用,2011,(06).
[ 3 ] 宋美霞.大數據背景下數字檔案館信息服務研究[J].檔案管理,2015,(03).
[ 4 ] 楊剛,楊凱.大數據關鍵處理技術綜述[J].陜西理工學院數學與計算機科學學院,2016,(04).
[ 5 ] 吳磊.浙江電信存儲云化進行時[J].IT經理世界,2014,(09).
[ 6 ] 王婭紛.數據挖掘淺談[J].電腦知識與技術,2009,(09).
[ 7 ] 韓強.大數據環境下的審計模式創新研究[J].創新科技,2015,(06).
[ 8 ] 魏祥健.云計算環境下云審計平臺架構與實現[J].財會通訊,2015,(04).
[ 9 ] 魏祥健.大數據環境下政府審計模式轉變[J].財會月刊,2016,(08).
【作者簡介】
魏祥健,男,重慶科技學院,教授;研究方向:審計。近年來出版專著一部,主編教材4本,主持國家重點研發、國家社科基金、省部級重點項目等十余項,發表論文四十余篇。