陽秋林 唐倩倩


[摘? ? 要] 大數據審計的研究與應用是近年來審計領域的熱點,數據的井噴式增長以及技術的更迭對傳統的審計監督而言無異于當頭棒喝。因此如何在海量數據中獲取與審計相關的數據以及選擇適應時代的審計方法是目前開展大數據審計的關鍵環節。本文首先闡述了開展大數據審計的必要性,分析了目前大數據審計在數據采集過程中存在的問題,提出了基于python的大數據審計原理,其次通過梳理大數據審計的研究現狀,剖析傳統審計在數據存儲,審計程序的轉型,最后研討大數據技術和方法對審計的支撐作用。
[關鍵詞] 大數據審計;Python;審計方法
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 01. 032
[中圖分類號] F239? ? [文獻標識碼]? A? ? ? [文章編號]? 1673 - 0194(2020)01- 0070- 04
1? ? ? 引? ? 言
隨著信息技術的發展,被審計單位的運行越來越依賴于信息化,審計工作環境發生了翻天覆地的變化,以傳統的審查賬簿為主要手段的審計面臨著巨大的困境。2015年,國務院印發《促進大數據發展行動綱要》。2016年金磚國家最高審計機關領導人在會議上指出:要加強頂層設計和戰略規劃,加大大數據技術的應用,創新審計方式方法,提升審計效能,更好發揮審計作用[1]。2018年,習近平總書記在中央審計委員會第一次會議上指出,要堅持科技強審,加強審計信息化建設。與此同時,國內外學術界也對大數據技術在審計上的研究給予高度重視,Earley(2015)分析了大數據技術給審計工作帶來的機遇和挑戰,研究了大數據技術在CPA審計中的應用[2];陳偉(2017)分析了大數據審計的現狀與發展,以及大數據環境下電子數據審計的機遇、挑戰與方法。縱觀學術界與實務界,研究大數據審計具有重要的現實意義與應用價值。
2? ? ? 研究現狀
2.1? ?大數據的內涵及特點
早在2008年,《Nature》就推出了“Big Data”專刊,首次提出了大數據的概念。2011年,麥肯錫(2011)發布了《Big data: The next frontier for innovation, competition, and productivity》,將大數據定義為大小超出常規數據庫工具獲取、存儲、管理和分析能力的數據集。
概括來說,大數據主要具有以下四個特點。
(1)大量: 數據量大,非結構化數據的超大規模和增長比結構化數據增長快10~50倍;另一方面,計算量較大。
(2)多樣性:大數據的形式多樣,如文字、圖片、視頻等。
(3)迅捷:一方面,數據量增長速度快;另一方面,大數據要求實時分析,處理速度要快。
(4)真實性:數據必須是準確的、可靠的、一致的,具有可追溯性。
2.2? ?大數據審計的內涵
目前,國外有關大數據審計的學術研究還比較零散。Lohr(2011)認為,應用大數據技術以后,審計判斷更多的是依據數而非經驗,這將提高審計的質量 。Moffitt etal(2013)也認為, 大數據將改變審計判斷的方式[3]。國內學者大都認為大數據審計是基于大數據技術發展而產生的一種新的審計方式,其主要內容包括電子數據審計和計算機信息系統審計兩方面。
2.3? ?大數據對審計的影響研究
(1)加大對外部數據的依賴:經濟活動的日益復雜,加大了審計的難度,傳統的“一對一”的審計獲取數據不夠全面,大數據環境下,審計更加依賴于電子數據,對紙質數據的需求減少,更多的是需要外部數據。
(2)加強相關關系證據的應用:大數據技術下的審計不再依賴于審計證據之間的因果關系而是基于數據間的相關性進行分析和驗證, 利用計算機可以提取并分析相關性較弱的審計證據。
(3)力推審計質量和審計效率的提升:在大數據環境下,注冊會計師不必采用抽樣審計調查,而是全面調查,這樣可以避免抽樣誤差,從而提高審計質量。利用大數據審計,審計證據將會更多、更全面。
3? ? ? 大數據環境下審計的技術支持
3.1? ?大數據審計的數據采集
3.1.1? ?大數據審計的數據來源分析
大數據審計數據采集過程中的挑戰主要集中在兩方面,一方面,在數據生成過程中,有許多可以人為控制的環節,增強了舞弊的可能性,再者單位之間用的軟件不同也可能影響審計的有效性,例如A公司使用金蝶,審計單位使用用友,那么這兩者之間所產生的數據格式將會有所不同,審計人員在沒有有效的手段驗證數據真實性的情況下轉換不同格式之間的數據,可能產生不可預見的錯誤,增大審計風險。另一方面,隨著經濟活動復雜程度的提高,企業數據呈幾何級增長,數據所呈現形式也豐富多樣,不僅僅局限于數值,還包括文字、圖片等多種形式,數據類型也不僅僅局限于結構化數據還包括非結構化數據。因此審計人員在采集數據時,可能導致數據采集查全率低,不能真正反映有效的審計信息。
3.1.2? ?現有的數據采集方法
(1)Direct replication。當審計單位與被審計單位使用相同的數據庫時,直接復制到審計人員的計算機中。
(2)ODBC接口采集。即審計人員通過ODBC數據訪問接口直接訪問被審計單位信息系統,轉化成審計所需的格式。
(3)辦公軟件數據采集。使用如Excel,MS Access,MS SQL Server 等辦公軟件完成數據采集。
(4)專屬模板采集。一些審計軟件在被設計時,根據審計單位不同的特點設置了相應的模板,審計人員在進行數據采集時,通過選擇相應的模板,即可自動實現數據的采集。
四種采集方式各有利弊,如表1所示。
3.1.3? ?大數據環境下的審計數據采集方法——以Python為例
目前,審計數據的采集主要依托于被審計單位的數據庫,但在大數據環境下,審計人員也應積極搜集第三方數據,增強審計數據的全面性。然而這些信息大多以網頁的格式存在,難以被審計人員直接分析,這就影響查全率,造成了一定的審計風險。因此,審計人員可以采用計算機輔助工具抓取網上數據。
Python(網絡爬蟲),是一種按照特定規則抓取網絡信息的程序或腳本。因此,網絡爬蟲技術可以幫助審計人員獲得各類與審計相關的數據,利用爬蟲技術采集數據的過程主要有以下幾步:第一步,確定目標。審計人員確定所需要獲取的數據。第二步,網頁分析,為獲取第一步所需的數據對相關網頁進行分析。第三步,數據獲取,根據上一步對網頁的分析,抓取數據。第四步,數據過濾和清洗。對取得的數據利用可視化工具進行分析,再借助SQL查詢、Excel分析等進行建模和分析,進一步獲得審計數據。
3.1.4? ?基于Python的審計大數據采集
常用的網絡爬蟲軟件主要有以下五種,其優缺點如表2所示。
3.2? ?大數據環境下的審計數據存儲
傳統的審計數據有兩種存儲方式,一是以紙質文檔的形式儲存,采用這種方式存儲,一旦文件數據過多,就需要占用大量的空間。造成空間上的而浪費。且時間一長,文檔可能發霉變質。二是以電子數據的形式存儲,以U盤或者移動硬盤為載體, 這種存儲方式雖然相對便捷,但存儲介質易受病毒感染且數據不能共享。郭紅建(2017)大數據環境下的云端存儲相較于上述兩種存儲方式有著絕對的優勢, 云端存儲通過集群應用、網絡技術或分布式文件系統等功能,將云端數據的存儲設備協同工作,共同對外提供升級數據存儲和審計作業訪問[4]。
3.3? ?大數據環境下的審計程序分析
3.3.1? ?審計程序分析方法
審計程序方法主要有趨勢分析、比率分析、回歸分析以及時間序列分析這四種方法。
(1)趨勢分析法。簡單來說,趨勢分析是通過各期指標對基期指標的變化趨勢分析,看看這種趨勢的變化是否合理,進一步可以發現異常或為預測未來發展提供幫助。
(2)比率分析法。此種方法是財務分析最常用的工具,通過財務報表上若干重要項目的相關數據相互比較分析企業獲利能力、償債能力、成長能力以及周轉能力,從而評價公司的經營活動。
(3)回歸分析法。回歸分析法是一種統計方法,通過構建因變量與自變量之間的回歸方程式來預測與其有相關關系的隨機變量值。回歸分析法的難點在于需要收集企業大量的基礎數據并且要確定變量之間是否存在相關關系,如若不然,預測結果將出現嚴重偏差。
(4)時間序列分析法。將經濟發展、購買力大小、銷售變化等同一變數的一組觀察值,按時間順序排列并結合數學方法來預測市場未來的發展變化趨勢。
3.3.2? ?大數據引進審計分析程序的方式
引入大數據后,審計分析程序具體的分析方法也發生了一點改變,但基本流程是一致的。可以分為確定分析程序對象、明確期望值、可認同差異運算和分析差異合理性四個步驟。
(1)確定分析程序對象。大數據環境下的審計分析程序不再選取預期關系作為關鍵點,而是采用多角度的方式將數據概念抽象化,降低低概念層次的數據,擴大高概念層次的數據并運用一定的分析技術處理數據,提升數據的價值并且詳盡地描述財務數據,使財務報告更全面、客觀,為下一步打好基礎。
(2)明確期望值。大數據環境下的審計,行業內的審計數據共享在大數據平臺,審計程序分析數據也不例外。依托于大數據平臺不僅可以量化相似企業數據,還能從大數據平臺獲取各種行業數據,并且能夠利用大數據處理技術,使得數據更加的客觀準確,擺脫了傳統審計獲取程序分析數據難、數據不準確的困境。
(3)可認同差異運算。大數據下的審計分析程序,將同行業的審計數據以不同的屬性進行差異性和相似性的劃分,選取與被審計單位相似的企業為標準,計算差異值范圍,但要保證審計分析的準確性就必須確保被選取企業的審計數據真實,這在一定程度上提高了審計人員對數據收集和篩選的要求。
(4)分析差異合理性。傳統審計下,執行被審計單位分析程序時,依賴于注冊會計師的經驗去分析和判斷重大差異,主觀性較強,削弱了分析程序的功能,而引入大數據技術后,深度挖掘差異存在的根本原因,重新執行分析程序同時有效識別差異,排除干擾數據,為進一步執行審計程序打好基礎。
3.4? ?大數據下的數據挖掘
數據挖掘即是運用一定的方法對數據進一步的分析處理,挖掘隱含的數據及其價值。主要包括以下幾個步驟。
(1)數據清理:篩選并剔除重復多余的數據。
(2)數據轉換:即是指將數據從一種形式變為另一種形式,在實務中,由于每一個軟件對數據庫的架構和存儲形式是不同的,我們為了軟件能夠更好地識別數據而進行數據轉換。
(3)數據分析:運用統計的方法對數據進行處理,提取出有用的數據用于輔助決策。
(4)知識表示:將數據挖掘的結果以通俗易懂的方式描述出來。
4? ? ? 大數據環境下審計的方法支撐
伴隨著經濟活動的日益復雜,傳統審計的弊端逐漸凸顯,人們迫切需要傳統審計升級轉變,大數據審計應運而生。大數據審計為傳統審計向全量分析、宏觀評價、分工協作等方面轉變提供方法支撐。
4.1? ?數據分析方法
從樣本數據分析到全面數據分析。傳統審計下,由于人員、技術、地點等多方的限制,若要對被審單位所有的數據進行分析,難度太大且耗時太久,因此在傳統審計方法下往往選擇對樣本數據進行分析,不可否認的是,對樣本數據分析結果的確有一定的代表性, 但偶然性因素較大,影響審計結果的準確性。大數據環境下的審計,范圍廣、內容全,可以從全量的角度進行審計,審計對象更全面、更整體,審計結果也更具有代表性。
4.2? ?審計評價方法
傳統審計評價是從微觀和細節入手,得到也只是個體性的結論。而在大數據環境下可以對獲取和分析審計對象內外部的數據,從而對公司進行全局性的分析。
4.3? ?審計工作方法
傳統的審計工作方法就是從審計的準備階段開始,一個審計主體對一個被審計單位,各自完成各自的審計任務,而實際上,被審計單位并不是一個孤立的主體,往往有多個相關的單位與之發生經濟業務。基于此,一旦經濟業務比較復雜,傳統的審計方式就難以深入分析。而大數據審計可以讓多個審計單位可以共同完成一項審計任務,資源互補,優化利用各個方面的專業人才,提高審計效率和質量。
4.4? ?審計模式
傳統的審計模式為事后審計,僅審計被審計單位已經完成的賬務處理和報表,判斷是否正確、合法合規,只能達到事后監督和糾正錯誤的目的,而沒有預防的作用。大數據環境下的審計貫穿審計的整個過程,是一種事前監控、事中分析、事后檢查“三位一體”的持續審計模式。
5? ? ? 結? ? 語
大數據時代的到來,給傳統審計帶來了巨大的挑戰,大數據環境下如何獲得與審計相關的數據,探索大數據審計技術與方法的革新是推動傳統審計轉型的現實需求。本文通過以上幾個方面對大數據審計進行探析,為進一步的審計流程再造、審計平臺搭建奠定了基礎。
主要參考文獻
[1]劉家義.充分發揮國家審計在促進經濟和社會發展中的作用[Z].2016.
[2]Earley CE.Data Analytics in Auditing: Opportunities and Challenges[J].Business Horizons,2015(5).
[3]MOFFITT K C,VASARHELYI M A.AIS in an Age of Big Data[J].Journal of Information,2013,27(2).
[4]郭紅建.基于審計云的大數據審計技術與方法[J].管理觀察,2017(36).