何超



隨著信息技術發展,大數據審計的方法逐漸得到廣泛應用。論文以本福特定律為數據分析模型,嘗試構建一個大數據審計的路徑。通過分析費用發生額的首位數分布,與本福特定律的分布概率進行比對,并對不符合本福特定律的發生額進行重點審計,從而提高抽樣審計的效率和準確度。
根據《審計署辦公廳關于印發數據審計相關標準用語(試行)的通知》:大數據審計是指審計機關遵循大數據理念,運用大數據技術方法和工具,利用數量巨大、來源分散、格式多樣的經濟社會運行數據,開展跨層級、跨地域、跨系統、跨部門和跨業務的深入挖掘與分析,提升審計發現問題、評價判斷、宏觀分析的能力。[ 山西省審計廳,《山西省審計廳關于轉發《審計署辦公廳關于印發數據審計相關標準用語(試行)的通知》的通知》http://www.linfen.gov.cn/shenji/contents/1616/38074.html]在審計過程中,利用大數據審計方法能迅速幫助審計人員快速讀懂紛繁復雜的數據,找到審計需要關注的重點區域,進一步拓展內部審計的廣度和深度,提高審計效率和質量。
一、本福特定律概述
本福特定律,也稱為本福特法則。1938年,美國電氣工程師本福特發現:在b進位制中,以數n起頭的數出現的概率為。具體到我們常用的十進制而言,在一群不規則的數列中,首位數是1的概率為lg(2/1),即約為30.1%;首位數是2的概率為lg(3/2),即約為17.6%......以此類推,首位數為9的概率為lg(10/9),即約為4.6%。具體概率分布如圖1。
本福特定律被認為是可以通過自然規律驗證不規則數據真偽的工具,被廣泛應用于數學、金融等領域。如有人為編造數據,就會出現不符合本福特定律分布規則的現象。2020年5月,央視新聞網報道:牛津大學商學院學者岡村健與美國達拉斯聯邦儲備銀行研究部高級經濟師克里斯托弗·科赫聯合發表了一篇名為《本福特定律和新冠疫情數據報告》的論文。作者從中國政府官方渠道篩選出疫情數據,通過統計該疫情數據首位數符合本福特定律分布,并得出中國的疫情數據不存在操縱可能的結論。[ 央視網新聞,《英美學者:中國疫情數據“不存在被操縱可能” 重要結論有三點》,https://xw.qq.com/cmsid/20200504A070GQ00?f=newdc]由此可見,本福特定律的應用范圍之廣泛。
二、基于本福特定律的大數據審計路徑
根據本福特定律,審計人員可以借助計算機輔助審計手段建立大數據審計分析模型,并將調取的電子數據與首位數分布概率比對,從而分析出需要重點關注的審計線索,從而提高了審計抽樣的科學性和效率,節約了審計成本和審計時間。本文以審計2019年某市煙草公司管理費用辦公費為例,詳細解析如何利用本福特定律構建大數據審計路徑。
(一)數據采集
一般而言,大數據審計采集的數據來源廣泛。根據審計需要采集的數據可以是專業財務管理系統的數據,也可以是從政府公開發布的經濟統計數據,亦可以是各種行業協會發布的行業內部數據。目前,H省煙草商業系統普遍使用用友NC財務系統。審計人員利用審計賬號登錄NC系統后,通過NC系統主界面,審計人員可以很快直達相關業務界面,有效采集與審計相關的財務、業務和管理數據。以審計抽樣2019年管理費用辦公費為例,審計人員通過查詢輔助明細賬,可以保存輸出一張EXCEL表格(如圖2),共計1109行電子數據。
(二)數據處理
采集所需要的審計數據后,需要對采集的數據進行預處理。對數據處理的手段或流程包括數據集成、數據清洗和冗余消除等方式。通過數據處理,將大量的、雜亂無章的、充滿干擾的數據中,抽取出對于審計工作有價值、有意義的數據。接上例,通過查詢電子數據,審計人員發現部分電子數據存在借方發生額為負數的情況。查詢摘要和詢問經辦人得知,被審計單位2019年對以前年度的部分發生的辦公費進行了調賬沖回,審計人員判斷這些業務與抽樣2019年實際發生的辦公費關聯不大。此外,部分數據存在貸方發生額,查詢摘要發現貸方發生額為月末對辦公費結轉本年利潤科目導致。根據以上判斷,審計人員需要對采集的數據進行清洗,具體清洗方式為在借方欄表格中設置大于0的篩選條件(如圖3),可將借方負數發生額、貸方發生額從統計數據中剔除。最后刪除本月合計、本年累計行,最終得到需要審計抽樣的593個樣本。
(三)數據分析
數據分析主要是對預處理和結構化的數據的宏觀趨勢、散度、分布等進行解析,從而快速恢復被審計項目的歷史原貌。在時間及空間維度下的大數據分析可以更多采用統計分析、數據挖掘和數據可視化等方法,以擴大大數據審計分析能力。接上例,經過處理后的辦公費數據已全部顯示為符合抽樣條件的數據。根據本福特定律,數據的首位數分布應當符合相應的概率比例。在表格中,設置函數LEFT(字符串,1)對符合篩選后的數據首位數進行統計,并設置函數COUNTIF(區域,“=N”)(N=1,2...9)對首位數相同的數據進行匯總統計,并進行可視化處理,得到一張首位數概率分布圖(如圖4)。期望值為本福特定律首位數分布概率,測試值為經篩選的593個樣本的辦公費首位數分布概率。
(四)分析結論及抽樣應用
審計抽樣是對具有審計相關性的總體中低于百分之百的項目實施審計程序,使所有抽樣單元都有被選取的機會,為審計人員針對整個總體得出結論提供合理基礎。接上例,通過分析性程序審計人員可以得出結論:除首位數為1的辦公費發生額偏離度較大以外,X市煙草公司管理費用辦公費總體偏離指數不大,發生差錯或舞弊風險較低,整體風險在可控范圍之內。在審計抽樣過程中,審計人員可以重點抽取重要性水平較高的樣本和辦公費發生額首位數為1的樣本。
三、結語
隨著信息化建設的不斷推進,大數據審計不再是“陽春白雪”高不可攀,利用本福特定律為我們的內部審計工作提供了新的方法和思路,但本福特定律的本身并不是萬能,需要我們在今后的大數據審計工作中不斷改進。
一是本福特定律存在使用限制條件。需要指出的是,本福特定律應用條件為一列不規則的數字,數字本身不能存在人為限制的因素。但在實際工作中,很多開支項目可能存在內設的最高值或最低值。如湖北省商業系統普遍對重點采購或工程項目的開支設置了項目預算、攔標價等。相比之下,費用發生額的范圍更廣、數據更多、更有分析性,一般也比較符合本福特定律的條件。此外,審計人員發現某一組數據分部概率不符合本福特定律,不能直接得出這組數據一定存在問題的結論,只能判斷這組數據出現差錯的概率相對較大,具體審計結論需要配合其他審計程序進一步驗證。
二是內部審計有重要性原則。內部審計準則與規范是審計人員進行內部審計工作時必須遵循的行為規范和要求,是審計人員執行內部審計業務,獲取審計證據,形成審計結論,出具審計報告的專業標準。作為一種分析性程序,本福特定律也必須遵循內部審計準則與規范,不能違背內部審計重要性原則。應用本福特定律也必須結合內部審計的重要性原則,在審計抽樣過程中既要抽取重要性水平以上的樣本,也要抽取不符合本福特定律分布概率的樣本。
三是要善于從工作中總結經驗。本福特定律雖然提供了數據分析的模型,但審計線索的判斷和挖掘還在一定程度上需要依賴審計人員的職業判斷和專業素養。古希臘哲學家蘇格拉底曾說過:“承認自己的無知乃是開啟智慧的大門。正因為我們的淺薄,所以我們一生都要有學習的動力。”在日常的工作中,審計人員不能僅僅滿足于“工作慣性”,要善于總結審計中的技巧和經驗,保持較高水平的職業技能水平。既要“博觀”,又要“厚識”,只有這樣才能破解大數據審計的“本領恐慌”。
(作者單位:咸寧市煙草專賣局,審計科)