■黃 王君 王建輝
大數據環境下的審計取證初探
■黃 王君 王建輝
大數據具有海量(Volume)、多樣(Variety)、高頻(Velocity)和商業價值大(Value)的特點。利用大數據技術進行數據分析、開展審計工作能夠有效提升審計的效率和保障審計的質量。審計取證是在審計目標的指引下不斷獲取審計證據的過程,不斷發展的大數據技術推動了大數據審計的實踐,也促使著審計取證思維和取證方式的轉變。就目前而言,審計人員如何運用更為經濟的方式,在新的審計環境下充分挖掘審計取證的價值和防范審計取證風險,進而保障審計質量,是大數據審計發展中值得思考的重要命題。
大數據的產生得益于云計算、數據挖掘等信息技術的發展,數據的采集、儲存、交叉和分析能力不斷提升。數據信息呈現了爆炸式的增長,使得審計取證環境由“小數據”向“大數據”轉變,也改變了審計證據的衡量方式。
(一)大數據對審計取證的影響
大數據之于小數據,其實界限十分模糊,前者海量、多樣及商業價值高的特點,小數據同樣也具備,真正使得兩者不同的是大數據的高頻(Velocity)和詳盡(exhaustivity)。高頻性是指數據生成和處理速度突飛猛進,這是大數據時代的一個突出特點,而詳盡性是指數據的采集量巨大,往往接近于總體。正是這兩種差異,使得大數據下的審計取證環境在數據采集、取證范圍、審計手段和審計證據上與小數據下的取證環境區別開來。
在大數據時代,幾乎所有的事物都能得以數據化,企業的業務數據也不例外。這些數據不僅僅產生于企業內部,也可能由企業外部的信息網絡和數據庫進行側面的電子記錄,通常不為個別的企業所影響和控制,具有較強的可信度及可獲得性,是大數據環境下審計取證的重要數據來源。事實上,大數據使得審計取證過程中的數據采集更為便捷與可靠,因為即使相關業務信息未被企業內部記錄、丟失或保護,審計人員依然可以從外部數據庫中獲取大量側面的信息碎片,進行交叉比對、融合和分析,進而還原整個業務的畫面。
與此同時,大數據時代企業的所有信息都變得更為豐富,它們不僅僅是規則的結構化數據,也可以是無固定范式的非結構化數據,如音頻、文檔、圖片等,這客觀上要求審計取證工作擴大數據搜集范圍。審計取證的范圍從單一的憑證、賬簿、報表等財務信息拓展到多樣化的非財務信息,極大地豐富了審計證據,為審計人員進行全面綜合的審計分析、提升審計效率提供了充分的數據保障。
大數據同樣影響著審計取證的手段,使之實現了實時、精準與客觀。一來,大數據下企業的業務數據是動態的,使得審計人員能夠在云會計平臺上實時處理具體的業務數據,而不必在分析業務結束之后去統計整理的信息;二來,由于大數據詳盡性的特征,審計人員可以運用大數據技術對接近于總體的業務數據進行審計,相比于小數據時代的抽樣審計而言,審計效率和質量都將大大提升;三來,大數據審計下數據分析系統的運用,使得審計取證的自動化成為可能。由于任何主觀隨意因素的出現都有可能影響大數據審計系統的自動化運作,因此審計人員的主觀判斷在大數據環境下很有可能讓位于自動化的信息化分析系統,而這種審計過程中主觀因素的弱化在一定程度上保證了審計取證方式的客觀。
(二)大數據下審計證據的特征
審計證據是審計取證的“成果”,它具有充分性和適當性兩大衡量標準,如圖1所示,充分性是對審計證據“量”的要求,而適當性是對審計證據“質”的要求,只有同時保證審計證據的充分性和適當性,才算充分挖掘了審計取證的價值,才能支持得出的審計結論。隨著大數據審計的推進,審計證據的這兩大衡量標準進行了相應的變化,而把握它的動態變化,也是了解大數據下審計取證環境轉變、促進審計取證工作充分合理發展必不可少的部分。

圖1 審計證據衡量標準
1.充分性。
充分性是對審計證據數量的要求,從大數據下的審計取證環境看,取證的范圍更廣,不僅包括結構化的數據,還包括大量非結構化的數據,并且非結構化數據隨著電子記錄的深入而愈發重要,構成了大數據審計的主要組成部分。大數據下,審計證據充分性的特征也主要體現在非結構化數據的利用上。
審計取證的非結構化數據主要是非財務數據,包括內部和外部兩個部分。內部非財務數據包括客戶、銷售、供應商、采購、人力資源等各類系統的信息,它們與企業內部的財務系統相結合,能夠幫助審計人員從整體上把握企業的基本情況,了解業務開展的各個流程。外部非財務信息指的是諸如宏觀政策、行業動態、郵件通訊、新聞報道等從外部網絡和數據庫中采集的信息,它們作為傳統審計證據的補充而存在,能夠更好地提升審計證據的充分性。在大數據環境下,數據采集和存儲的成本降低,審計取證的效率由于信息技術的利用而提升,內外部非財務信息的利用更為經濟有效,必然使得審計證據越加豐富、更易獲得。
2.適當性。
適當性是對審計證據質量的要求,它包括可靠和相關兩個方面,只有保證審計證據的適當性,審計證據的數量才是有效的,二者才能更好地支持審計結論。
可靠性是指審計證據必須是真實可信的,它包括可驗證性、客觀性和真實完整性三個方面,這也是大數據對審計證據影響最深的幾個方面。首先,可靠性要求審計證據具備可驗證性,即審計證據可以由其他證據從側面驗證,大數據環境下,審計取證渠道越來越豐富,審計人員不僅僅關注企業內部信息,同樣關注外部信息,不僅利用財務信息,也越來越重視非財務信息,多元化的數據交匯融合,能夠進行相互印證,使得審計證據的可驗證性提升;其次,可靠性要求審計證據具備客觀性,傳統審計由于技術和資源的限制,一般通過函證、檢查、詢問等方式獲取審計證據,審計人員的主觀意識很容易影響證據的客觀性,而在大數據下,審計分析系統的自動化數據采集與分析大大減少了人為因素的干擾,多樣化的外部數據來源也使得審計的獨立性得到提升,這都使得審計證據的客觀程度大為提高;最后,可靠性還要求審計證據具備真實完整性,由于審計取證的大數據并非是經過精挑細選、層層分篩的數據,雖然它們具備客觀性,但數據持續不斷的增長和“魚龍混雜”的現狀也可能導致數據不準確甚至數據造假的發生,這將影響審計證據的真實完整性,這也是大數據審計下難以消除的一個弊端。但由于大數據在充分、可驗證及客觀性上對審計證據的提升,在一定程度上也抵消了審計取證數據真實完整性不夠精準的缺陷。
相關性是指審計證據和審計目標、具體項目之間具有實質性的聯系,它主要體現在審計證據的及時性和確認能力兩方面。大數據很好地契合了審計證據的相關性,一方面,大數據實時、持續的特征使得業務信息能夠得到快速采集和及時應用,另一方面,大數據分析系統通過相關模型讓審計數據進行交叉比對、相互印證,拓寬了審計確認的渠道,使得審計證據的確認價值更高。
可以看出,大數據時代,隨著海量信息和大數據技術的不斷發展與創新,審計取證在渠道上有所增長、范圍上有所拓寬,審計取證環境的獨立性和客觀性也有所提升,所獲取審計證據的充分性已然不是問題,值得審計人員關注的是如何保障所采集數據的真實完整性,充分挖掘審計取證的價值。
面對新的審計取證環境,要充分挖掘審計取證的價值,得出高質量的審計成果,轉變審計取證思維將是關鍵的一步。在大數據環境下,審計取證思維將發生三大轉變,分別是從抽樣思維轉變為整體思維,從追求精確轉變為容納混雜,從因果思維轉變為相關思維。
1.整體思維。
由于企業規模等客觀因素及審計資源的限制,傳統審計通常采用隨機抽樣的方式進行審計,用樣本數據推斷整體情況,并據此得出審計結論。在大數據時代到來之前,抽樣審計的確是審計人員進行審計的理性選擇。但是隨著大數據的推進,企業轉變了財務管理模式,構建起財務共享服務平臺,使得企業內部各業務環節的數據聚集在同一個數據庫當中,通過大數據技術,能夠很容易地以一種較為經濟的方式實現大量數據的實時采集、清洗、存儲和分析。因此,在大數據時代,審計取證的數量越來越接近于總體,審計取證思維也得以從過去的抽樣審計向詳細審計邁進。整體思維即“樣本即總體”的一種思維,審計人員在該思維的指引下,開放式地接納與審計業務相關的所有信息,從不同的數據渠道進行審計取證的數據采集工作,從而形成對審計對象更為系統和全面的認識。
整體思維是其他取證思維的前提,只有審計人員秉持審計取證的整體思維,才能從根本上保障取證數據的完整,為獲取更為充分、可靠的審計證據打下基礎。
2.容錯思維。
審計取證環境的轉變使得審計證據的衡量方式也有所改變。大數據時代信息呈現指數式的增長,更新的頻率越發頻繁,動態的數據和多樣化的渠道使得取證環境更為復雜。傳統的審計取證追求所搜集信息的精確性,在抽樣審計的基礎上還要對抽樣審計結果進行不斷地驗證,反復地確認,從而耗費了巨大的資源。在大數據環境下,審計取證面向總體,面對所搜集的混亂、隨意甚至可能虛假錯誤的數據,大數據審計的數據清洗、存儲和分析工作變得越來越沉重,追求傳統審計中精確信息的方式顯然是不夠理性的,要充分挖掘審計取證的價值,需要從過去追求精確數據的思維中跳出,向接納混亂數據的容錯思維轉變。
容錯思維是建立在整體思維之上的,它要求將審計抽樣排除的混亂數據納入總體進行分析。大數據時代,非結構化數據可信度更高、可獲得性更強,真正有價值的信息其實都蘊含在一些稍顯混亂復雜的非結構化數據當中,在進行審計取證工作時,也難免會囊括各種雜亂、無序、主觀、無效的信息,利用大數據進行審計線索整理時可能出現錯誤,但包容一定程度的錯誤并不會影響大數據審計中以總體為審計對象、以非結構化數據為數據主要組成部分的取證工作,對審計結果也產生不了重大影響,反而有可能提升審計人員的洞察力。
3.相關思維。
由于海量數據的存在和聚合,數據間相互聯系,傳統審計取證中探尋數據間一對一因果關系的一貫方式將變得十分困難。審計工作所分析的審計數據之間的關系將逐漸從因果關系轉變為相關關系,審計人員能夠將大數據審計模型固化在數據分析系統當中,并在此基礎上,對審計疑點進行預測、匯總和處理,從而得出審計結論,本質上這屬于一種對相關關系的探尋。因而,審計取證思維在大數據環境下應當從因果思維向相關思維進行轉變。
相關思維是建立在整體思維與容錯思維之上的,屬于審計取證的核心思維。相比于傳統審計中因果關系的證明,相關思維更注重于碎片化信息的整體重現,它耗時更短、成本更低,并且還有利于審計人員對審計對象的整體把握。雖然相關思維指導下的審計取證精確度不一定高,但它克服了因果關系證明中預設條件的弊端,最大限度地弱化了審計人員主觀因素的影響,一切用數據說話,為審計取證提供了視野更為廣闊、更為豐富的審計線索。
大數據時代為審計提供了廣闊的數據來源和先進的技術手段,也改變著審計取證的思維,人們對信息的認知程度隨著大數據的發展不斷提升。在對大數據認識越來越深入的同時,審計取證的相應風險也隨之出現。
1.信息風險。
審計取證的信息風險是伴隨著信息化而來的,大數據在給審計取證提供海量、多樣的動態數據的同時,也帶來了信息質量和信息安全方面的風險。一方面,取證所搜集的數據較為廣泛,幾乎所有與審計業務相關的信息都納入了取證的范圍,這難免造成審計數據的相對混亂和無序,即使是在進行了數據清洗之后,也仍舊可能存在一些低質量的信息,雖然取證的容錯思維促使審計人員容納一定數量的低質量信息,但若是質量過低,必將影響后續的審計分析,因此容錯思維不能成為放松對信息質量把控的擋箭牌,審計人員應該結合對審計環境和目標的要求,實時關注審計取證的信息質量風險。另一方面,審計人員利用大數據技術對海量數據進行搜集、融合和交叉分析,這些數據中除了企業提供的信息,也必然包含了許多從企業內外部獲取的相關個體私密的信息,如果未能遵循審計的獨立性和保持相應的職業謹慎,極有可能引發審計取證的信息安全風險。
2.技術風險。
大數據時代,利用大數據技術進行審計取證是歸納審計線索、搜集審計證據的一大突出手段,這必然引發審計取證的技術風險。事實上,在大數據下這種風險是貫徹整個審計過程始終的,由于非結構化信息的存在,在如何進行對它的精確和自動化處理、結合審計環境和信息背景方面,現有的數據處理技術已經出現了明顯的不適應。同時,由于大數據環境下不可消除的低質量信息的存在,審計取證所運用的信息技術也難免會對相應的低質量數據進行分析。所以,技術風險隨著信息質量風險的存在而客觀存在著。
3.認知風險。
大數據時代的到來對審計人員的技能和知識水平提出了要求,但由于涉及面廣、技術能力要求高,大數據超越了審計人員現有的認知水平,對審計取證工作帶來了認知風險。審計人員不僅要有豐富的業務知識,還需要掌握較高的信息技術知識,有一定數學和統計學的基礎,熟練掌握計算機審計的工作流程,否則便無法順利完成審計取證工作。同時,大數據帶來的另一種認知風險是在一切信息都轉化為數據之后人性部分的缺失,當業務轉化為數據時,有關人性的部分卻很難量化,如經辦人內心的想法、行為背后的潛意識等等。在這種情況下,審計取證工作趨于標準化,得出的審計結論難免機械化,但審計恰恰是一種交互的工作,必須將數據與人性、環境等相結合,才能把握事物的本質,重現事件的因果。
[1]劉星,牛艷芳,唐志豪.關于推進大數據審計工作的幾點思考[J].審計研究,2016,(5):3-7.
[2]陽杰,孟里應.大數據時代的審計證據與審計取證研究[J].財會月刊,2017,(1):115-124.
[3]Kitchin R.,Mc Ardle G..WhatMakes Big Data?Exploring the OntologicalCharacteristics of26 Datas?ets[J].Big Data&Society,2016,(1).
南昌工學院)