陳偉 張慧汶 周紅



【摘 要】 目前可視化審計方法在大數據審計中得到廣泛應用。為了更好地方便審計人員應用大數據可視化審計方法,探索簡單易用的大數據可視化審計工具與方法越來越重要。文章首先分析了大數據審計的重要性以及大數據審計方法與工具的研究和應用現狀;其次提出了基于Power BI和R語言組合應用的大數據可視化審計方法,并分析了該組合應用方法的優勢與原理;最后結合案例探討了該方法的應用。研究表明采用Power BI和R語言組合應用的大數據可視化審計方法可以充分發揮二者的優勢,回避其不足,該研究為今后審計人員開展大數據審計提供了技術方法和經驗參考。
【關鍵詞】 大數據審計; 數據可視化; Power BI; R語言
【中圖分類號】 F239.1;C931.6? 【文獻標識碼】 A? 【文章編號】 1004-5937(2023)07-0128-06
一、引言
近年來,大數據審計成為審計行業研究與應用的熱點,引起國內外學術界和實務界高度重視。中共中央辦公廳、國務院辦公廳2015年12月印發的《關于實行審計全覆蓋的實施意見》,要求構建大數據審計工作模式。審計署辦公廳2019年4月印發的《2019年度內部審計工作指導意見》,要求“積極創新內部審計方式方法,加強審計信息化建設,強化大數據審計思維,增強大數據審計能力,綜合運用現場審計和非現場審計方式,提升內部審計監督效能”。中國注冊會計師協會2021年4月發布的《注冊會計師行業信息化建設規劃(2021—2025年)》,提出“大型會計師事務所要綜合運用大數據、人工智能、云計算和區塊鏈等前沿信息技術,圍繞數據采集、底稿編輯、風險評估、審計策略、審計計劃、審計抽樣、審計測試、審計報告復核等審計環節,打造全流程的智能審計作業平臺及輔助工具,實現遠程審計、大數據審計和智能審計”。國務院辦公廳2021年8月印發的《關于進一步規范財務審計秩序 促進注冊會計師行業健康發展的意見》,提出“加強財會監督大數據分析,對財務造假進行精準打擊”。財政部2021年12月印發的《會計信息化發展規劃(2021—2025年)》指出“鼓勵會計師事務所積極探索全流程的智能審計作業平臺及輔助工具,逐步實現遠程審計、大數據審計和智能審計”。大數據審計應用方面:關于政府審計,世界審計組織(INTOSAI)大數據工作組于2016年12月成立;關于內部審計,國際內部審計師協會2017年發布了《理解與審計大數據》指南[ 1 ];關于社會審計,美國注冊會計師協會(AICPA)高度重視大數據審計,分析了大數據環境對審計工作的影響[ 2 ]。大數據審計學術研究方面:Gepp等[ 3 ]研究了大數據在審計研究和實踐中的現狀與未來機遇;一些文獻分析了大數據審計的現狀與發展[ 4 ],大數據環境下電子數據審計的機遇、挑戰與方法[ 5 ],研究了基于大數據可視化技術的審計線索特征挖掘方法[ 6 ]和基于大數據可視化技術的大數據審計案例[ 7 ]等;還有一些文獻針對信息系統審計研究了基于大數據技術的應用控制風險審計[ 8 ]和業務連續性管理風險審計[ 9 ]等問題;章軻等[ 10 ]分析了大數據背景下國家審計的新變化,提出從理論、法規、管理、技術和安全等方面進行創新的路徑。
綜上所述,隨著大數據審計的廣泛應用,大數據審計在審計工作中越來越重要。其中,大數據可視化分析技術成為目前開展大數據審計的重要技術。為了更好地開展大數據可視化分析,選擇合適的可視化分析軟件工具非常重要。目前,常用的大數據可視化分析工具主要包括:(1)商業化軟件工具,如Power BI、Tableau、SAS等;(2)開源工具,如R語言、Python等??紤]到工具的易用性和功能,本文探索基于Power BI和R語言組合應用的大數據可視化審計方法。
二、Power BI在大數據審計應用中的可行性分析
Microsoft Power BI是微軟公司(Microsoft)為其Office組件提供的一套商業智能工具軟件,于2017年正式發布,其功能是在Excel的基礎上增加了查詢增強版(Power Query)、建模增強版(Power Pivot)、視圖增強版(Power View)和地圖增強版(Power Map)。Power BI可以對相關數據進行分析,并生成可視化的分析結果。審計人員不需要強大的信息技術背景,只需要掌握Excel這樣簡單的電子表格工具就能容易地進行數據可視化分析。微軟公司提供了完全免費的Power BI Desktop版本,這為審計人員使用該工具開展審計數據可視化分析提供了便利。
根據大數據審計原理和特點,Power BI應用于大數據審計的可行性主要表現如下。
(一)Power BI能方便地實現審計數據采集
采用Power BI進行大數據審計時,需要把相關數據采集到Power BI中。Power BI的數據采集功能很強大,可以采集多種類型的數據,如電子表格數據(Microsoft Excel等)、數據庫數據(SQL Server、Oracle、My SQL等)、文本文件數據(CSV、XML等),以及從Web網頁上抓取數據,很好地滿足了開展大數據審計時數據采集的需求。Power BI可以采集的數據類型如圖1。
不難發現,Power BI在數據采集方面突出的優點是數據采集功能強大、操作方便,且在進行數據采集時不需要編寫相關程序代碼。
(二)Power BI能方便地實現審計數據預處理
Power BI具有操作簡單、功能強大的數據預處理功能。審計人員可以在審計采集數據的過程中根據需要同時進行審計數據預處理操作,即選擇“轉換數據”功能進入Power Query編輯器,對數據進行簡單的預處理,如刪除或更改數據內容、更改數據類型、新建字段等;審計人員也可以在完成審計數據采集(把需要審計的數據導入到Power BI中)之后,再在Power BI中進行審計數據預處理操作。
(三)Power BI能方便地實現審計數據分析
Power BI具有操作簡單、功能強大的數據可視化分析功能,提供了“可視化”“篩選器”等快捷功能。借助這些快捷功能,審計人員可以很方便地對采集來的審計數據進行可視化分析。
三、基于Power BI和R語言組合應用的大數據審計方法優勢分析
(一)R語言簡介
R語言是誕生于1980年左右的S語言的一個分支。新西蘭奧克蘭(Auckland)大學的Ross Ihaka和Robert Gentleman開發了R語言,由于Ross Ihaka和Robert Gentleman兩人名字的首字母都是R,因此稱為R語言。相比其他編程語言來說,其操作難度要低很多。作為開源工具,R語言廣泛應用于數據分析與統計等領域。目前流行的R語言軟件有R、RStudio等。R語言的主要優點如下。
1.數據采集功能強大
R語言能實現讀取各種不同類型的被審計數據,例如Microsoft Excel、SPSS、SAS等,以及從網頁上抓取的數據,完全能滿足審計人員開展大數據審計工作的需要。
2.數據分析功能強大
R語言包含眾多不同功能的函數、程序包,可滿足審計人員的需要;作為免費開源工具,用戶還能不斷創建新的包來更新豐富R語言的使用功能;R語言軟件強大的數據可視化功能可以滿足審計人員在可視化分析方面的各種需求。以上這些優點為審計人員應用R語言提供了方便。
(二)R語言與Power BI組合應用的優勢分析
1.增強Power BI的審計數據采集功能
審計人員在開展大數據審計時,盡管采用Power BI可以有多種方式直接采集所需要分析的審計數據,在Power BI中還可以通過借助R腳本采集所需要分析的審計數據,從而使Power BI的數據采集功能更強大。當需要采用R腳本采集數據時,可在Power BI中通過“獲取數據”菜單,選擇“其他-R腳本”,在此基礎上,輸入數據采集所需要的R腳本,Power BI在運行審計數據分析時就可以自動執行該腳本完成采集數據。因此,R語言與Power BI組合應用可以增強Power BI的審計數據采集功能。
2.增強Power BI的審計數據預處理功能
在Power BI中使用R腳本完成數據采集后,審計人員根據審計需要可以在Power BI中編寫R腳本對已采集到Power BI中的數據進行轉換操作,從而完成所需要的審計數據預處理工作。因此,R語言與Power BI組合應用可以增強Power BI的審計數據預處理功能。
3.增強Power BI的審計數據分析功能
Power BI的數據可視化分析功能與R語言相比,操作更簡便。審計人員在進行數據可視化分析時,直接將相關字段添加到相應位置就可以得到對應的可視化分析結果;而審計人員直接采用R語言進行數據可視化分析時,則需要編寫相應的可視化分析程序代碼。但是,有時對于一些復雜的問題,僅僅使用Power BI難以實現數據可視化分析。因此,R語言與Power BI組合應用可以增強Power BI的審計數據分析功能。
四、基于Power BI和R語言組合應用的大數據審計原理
根據前文分析,如何對Power BI和R語言進行組合使用,發揮各自的優勢對審計人員開展大數據審計非常重要。對直接采用Power BI就可以完成的審計數據采集、審計數據預處理和審計數據分析工作,審計人員可以把需要審計的數據直接采集到Power BI中,然后借助其可視化分析功能直接進行分析。對不能直接采用Power BI完成的審計數據分析工作,審計人員可以采用Power BI中的R語言接口,擴展Power BI的數據采集與分析功能,從而增強大數據采集與可視化分析能力。一般來說,采用基于Power BI和R語言組合應用手段進行大數據可視化分析的流程為:借助Power BI中的R語言接口,采用R語言編寫數據采集和數據可視化分析程序代碼,執行所編寫的R語言程序代碼,便可采用Power BI和R語言完成審計數據采集與分析,并將分析結果通過Power BI的可視化功能轉化為便于審計人員分析觀察的圖形;在這些分析圖形的基礎上,審計人員利用自己的相關審計專業知識,通過對采用Power BI分析的可視化結果進行觀察和進一步分析,從總體上系統掌握被審計大數據中存在的規律和問題,從而發現可疑的審計線索。另外,審計人員還可以根據需要,通過更改所編寫的R語言數據可視化分析程序代碼或直接在Power BI中設置可視化顯示參數(如采用篩選器功能),改變輸出的可視化分析結果,幫助審計人員從不同的視角分析被審計大數據,從而全面、系統地發現可疑的審計線索;審計人員在基于Power BI和R語言組合應用手段進行大數據可視化分析發現的審計線索的基礎上,進行延伸取證,最終獲得相關審計證據。
相比直接應用R語言進行大數據可視化分析,采用Power BI及其快捷功能,可以減少R語言的復雜代碼編寫工作。概括來說,基于Power BI和R語言組合應用的大數據可視化審計方法原理如圖2。
五、基于Power BI和R語言組合應用的大數據可視化審計方法案例
(一)案例背景簡介
以某證券公司經濟責任審計為例,該公司股票交易數據中是否存在內幕交易的違規現象是經濟責任審計中的一項重要審計內容。假設現已獲得的、經過脫密處理的相關股票交易數據[ 7 ]示例如圖3。
(二)簡單問題的可視化分析
根據審計經驗,對股票交易數據中是否存在內幕交易的違規現象,一般具有以下幾個特征:客戶購買股票的類型比較單一;客戶的某種購買股票獲利大;客戶購入的某種購買股票在短時間內賣出。審計人員可以根據以往經驗,分析該股票交易數據中是否存在具有以上特征的數據,從而發現相關內幕交易線索,獲得審計證據。對一些簡單問題的可視化分析,可以直接采用Power BI應用柱狀圖、散點圖、條形圖、折線圖、直方圖等方法進行數據可視化分析,審計人員不需要編寫任何代碼就可以輕松完成。以條形圖為例,條形圖是數據可視化分析中常用的方法之一。
審計人員通過條形圖,可以把被審計數據表中的列或行數據生成條形圖,從而可以直觀地顯示被審計數據中各項目之間的比較情況。條形圖的主要特點是方便審計人員查看各個項目數據的大小,審計人員很容易比較各項目數據之間的差別。根據以上分析,在本案例中,為了查找購買股票類型比較單一的客戶,審計人員可以采用條形圖分析該股票交易數據。基于以上分析,直接采用Power BI進行分析的結果示例如圖4。
圖4中的Y軸表示被審計股票交易數據中客戶所購買的股票類型總數,X軸表示被審計股票交易數據中的客戶編號。由圖4可以很容易地看出客戶編號為C024、C038、C046、C064的條形高度較短,這意味著其代表的客戶購買股票的類型比較單一,符合股票內幕交易違規的特征之一,這類客戶比較可疑,是審計人員關注的重點。
(三)復雜問題的可視化分析
對較復雜問題的可視化分析,有時僅采用Power BI無法實現,這種情況下,審計人員可以采用Power BI和R語言組合應用,通過R語言編寫相應的功能代碼,從而增加Power BI的數據采集和數據可視化分析功能。在本例中,通過簡單的圖形雖然可以幫助審計人員分析客戶購買股票的類型是否比較單一,但不能整體了解客戶購買股票的獲利情況,僅靠這一個特征,仍不能很好地發現審計線索。為了更精準地發現審計線索,審計人員可以對這些數據做更多維度的分析。以被審計股票交易數據的氣泡圖分析為例,氣泡圖分析結果除了可以表示X、Y軸坐標之間數據的變化關系之外,還可以通過氣泡圖中氣泡圖的大小直觀地表現出其所代表的數據值大小。通過氣泡圖,審計人員可以整體了解客戶購買股票的獲利情況。因此,審計人員可以采用氣泡圖分析方法對股票交易數據進行分析。但僅僅采用Power BI不容易實現氣泡圖分析,R語言可以擴展Power BI的可視化分析功能。
綜上分析,審計人員可以采用Power BI和R語言組合應用實現對客戶購買股票及獲利金額大小情況的氣泡圖分析,其結果如圖5。
在圖5中,X軸表示被分析股票交易數據中的客戶編號字段,Y軸表示被分析股票交易數據的客戶所購買股票的代碼字段。
通過圖5的分析結果,審計人員可以很容易地發現購買股票的類型比較單一,同時客戶購買的股票獲利較大。但大數據環境下,當被分析數據較多時,分析結果可能不清晰。為了更清晰地察看相關分析結果數據,在圖5分析結果的基礎上,審計人員可以采用Power BI的篩選器功能,方便地選擇部分分析結果做進一步詳細分析。例如,通過采用Power BI的篩選器功能,對分析結果僅選擇客戶編號為C024和C064的客戶,如圖6所示。
由圖6可以更清晰、容易地看出編號為C024和C064的客戶對應的氣泡數量較少且氣泡較大,這意味著其代表的客戶購買股票的類型比較單一,且客戶購買的股票獲利金額較大(如標的為B1318的股票),符合股票內幕交易違規的兩個特征,這類客戶更可疑,是審計人員關注的重點。
以上應用不難發現:采用Power BI的篩選器功能做進一步分析時,審計人員可以避免使用R語言編寫復雜的程序代碼,從而方便了審計人員的應用。
同理,采用Power BI和R語言組合應用,審計人員可以容易地進行被審計股票交易數據的熱力圖可視化分析,其結果如圖7。在以上組合應用的基礎上,審計人員可以采用Power BI的篩選器功能,方便地選擇部分分析結果做進一步詳細分析。
六、總結
本文根據目前國內外開展大數據審計的實際需要,探索了基于Power BI和R語言組合應用的大數據可視化審計方法,并結合案例分析了該方法的應用。通過本文的研究,不難發現:采用Power BI和R語言組合應用,可以充分發揮二者的優勢,規避其不足。例如,對簡單問題的數據可視化分析,審計人員直接采用Power BI完成,無需編寫相關程序代碼;對復雜問題的數據可視化分析,可以借助R語言通過編寫簡單的代碼完成數據可視化分析?;赑ower BI和R語言組合應用的大數據審計可視化分析方法,審計人員無需系統地掌握R語言的詳細功能和復雜的編程操作,方便了一般審計人員的使用。
【主要參考文獻】
[1] GTAG.Understanding and auditing big data [EB/OL].http://www.theiia.org,2017.
[2] AICPA.Reimagining auditing in a wired world[EB/OL].http://www.aicpa.org,2014.
[3] GEPP A,LINNENLUECKE M K,O'NEILL T,et al.Big data techniques in auditing research and practice:current trends and future opportunities[J].Journal of Accounting Literature,2018,40(1):102-115.
[4] 陳偉,居江寧.大數據審計:現狀與發展[J].中國注冊會計師,2017(12):77-81.
[5] 陳偉,SMIELIAUSKAS W.大數據環境下的電子數據審計:機遇、挑戰與方法[J].計算機科學,2016(1):8-13.
[6] 陳偉,居江寧.基于大數據可視化技術的審計線索特征挖掘方法研究[J].審計研究,2018(1):16-21.
[7] 陳偉.基于可視化分析技術的大數據審計案例研究[J].中國注冊會計師,2019(6):61-64.
[8] 陳偉,詹明惠.基于大數據可視化技術的信息系統AC審計[J].會計之友,2021(1):120-125.
[9] 陳偉.基于大數據技術的BCM審計方法研究[J].會計之友,2019(11):113-116.
[10] 章軻,張冬霽,梁軒瑞,等.大數據審計中要做到的“三個把握”[J].審計研究,2018(5):30-34.