劉鳳委 楊月



【摘要】大數據技術正在重塑和變革現有審計理念與方法。與傳統基于會計信息實施審計監督不同, 大數據審計開辟了從原始數據直接獲取知識的新方式。實踐中比數據挖掘技術更重要的是找到具體審計業務應用場景, 本文提出現金軌跡數據理念, 將現金在企業與銀行賬戶間頻繁流動所沉淀的多維電子數據加以運用, 基于數據挖掘技術發現審計線索并形成審計判斷。
【關鍵詞】現金軌跡數據;數據挖掘;大數據審計
【中圖分類號】F239? ? ? 【文獻標識碼】A? ? ? 【文章編號】1004-0994(2023)01-0102-6
一、 引言
數字經濟時代環境下, 技術創新和應用與時俱進, 大數據、 人工智能、 區塊鏈等新興技術的發展對審計監督活動產生了前所未有的深刻影響。一方面, 大數據等新興技術在經濟活動中廣泛應用, 使得審計對象的形態、 特征發生了前所未有的變化; 另一方面, 作為經濟監督活動的審計自身也在發生深刻的變革, 傳統審計手段逐步被新興審計手段所取代(姜江華,2022)。傳統審計模式也已經不能適應大數據環境下的審計工作, 審計需要從傳統的審計思維向持續審計思維、 全量信息思維、 以人為本思維和智能審計思維轉變, 以大數據技術為核心開展審計工作成為審計發展的新趨勢(王海洪等,2021)。2014 年, 國務院發布《關于加強審計工作的意見》, 提出將大數據技術應用于國家審計, 提高信息化技術應用程度。2015 年, 國務院在《促進大數據發展行動綱要》中提出國家大數據戰略, 進一步強調大數據的重要性。面對大數據等數字技術的產生和發展, 審計人員需要應時而變來適應由此帶來的變化, 面對日益龐大的數據量以及復雜的數據環境, 利用更加高效的審計手段對被審計對象進行審計(秦榮生,2014), 新時代信息技術下審計技術與方法的研究已經成為當下以及今后一段時期亟需研究的重大問題。
近年來, 我國資本市場頻繁出現嚴重的上市公司資金舞弊問題, 顯著干擾了資本市場的有序運行, 影響了注冊會計師行業的聲譽。2021年12月31日, 中國注冊會計師協會(簡稱“中注協”)發布的《關于做好上市公司2021年年報審計工作的通知》中指出: “貨幣資金項目屬于五個高風險審計領域之一, 注冊會計師應當予以高度關注, 以更有效地識別、 評估和應對財務報表重大錯報風險。”由于貨幣資金項目的固有風險較高, 注冊會計師在審計過程中應當設置較低的重要性水平, 并通過監盤庫存現金、 檢查銀行對賬單和余額表、 函證銀行存款余額等實質性程序降低檢查風險。但在實務中, 這些程序由于執行力度不夠或方法欠佳, 尚不能完全應對企業的貨幣資金舞弊問題。在對涉及貨幣資金造假的上市公司的審計機構出具的行政處罰決定書中, 經常性指出會計師事務所“貨幣資金審計程序存在缺陷”“實質性程序執行不到位”, 進而未能識別出虛假銀行流水、 大額未達賬項等。由于現有審計程序更多地側重于審查與庫存現金、 銀行存款相關的余額, 而對每筆交易的來源、 發生額的關注度不夠, 在針對貨幣資金項目進行審計時很可能忽略潛藏的漏洞。
傳統審計注重從會計報表項目出發追尋審計線索, 然而財務報表項目是對海量原始數據聚合壓縮后的信息, 這一過程也遺漏了很多有價值的內容, 注冊會計師僅通過財務報表獲取的科目余額所呈現的信息有限且準確性不足, 如果不對背后的原始現金流水予以足夠關注, 在針對貨幣資金項目審計時很可能忽略潛藏的漏洞。2019年中注協發布的《審計準則問題解答第12號 —— 貨幣資金審計》(簡稱《問題解答第12號》)中也提到“要關注貨幣資金的發生額, 包括銀行交易流水、 交易憑證等”, 更加肯定了現金流水的價值。現金流水數據屬于企業的原始數據, 是編制財務報表的原材料之一, 由于其具有海量、 難以被篡改、 管理頻率高等特點, 比財務報表的顆粒度更加細致, 能夠更加真實、 準確地刻畫出企業的資金全貌。但傳統審計模式不僅無法獲取這些數據, 方法上也無法實現對海量數據的全覆蓋, 而當前大數據技術的蓬勃發展為處理海量現金流水數據提供了有力的技術支撐。中注協在《問題解答第12號》中明確提出利用數據分析等技術, 核查銀行收付款流水的可行性。針對現金流水數據的處理, 數據挖掘技術是不容忽視的工具, 在連續五年發布的影響中國會計從業人員的信息技術評選中, 數據挖掘技術一直位居前列。本文以此為切入點, 利用數據挖掘技術對企業的原始現金流水數據展開分析, 以探索大數據時代下貨幣資金審計的新思路。
二、 現金軌跡數據與審計思維模式轉型
1. 現金軌跡數據源于軌跡數據思想。軌跡數據屬于計算機應用技術領域的概念, 源于位置感知應用, 又稱為“軌跡大數據”“時空軌跡數據”等, 它是指通過對某一物體運動過程進行采樣而獲得的數據, 一般包含物體運動的位置、 時間、 速度等信息, 該物體可以是單一個體, 也可以是基于某一特征而劃分的群體。軌跡數據具有時空、 運動、 語義、 異頻采樣特征, 同時符合大數據的 “5V” 特征(Volume、Velocity、Variety、Veracity、Value), 往往通過數據挖掘技術對此類數據進行處理分析(高強等,2017)。如果將企業現金作為研究對象, 現金在不同賬戶間的流入與流出可以看作是現金的運動過程, 以賬戶為節點, 就能夠模擬出現金運動軌跡; 同時, 由于每條銀行流水都記錄了交易時間、 賬戶名稱、 交易原因等信息, 與軌跡數據的時空、 運動、 語義特征具有較高的重合度, 因此在利用數據挖掘技術分析原始現金流水的研究中, 本文借鑒了軌跡數據的思想, 提出“現金軌跡數據”的概念。現金軌跡數據指的是以企業現金總體為研究對象, 記錄現金在各個賬戶間運動軌跡的數據①, 如圖1所示。
2. 現金軌跡數據比傳統的現金流水概念更具優越性。現金流水屬于傳統財務領域中的概念, 現金軌跡數據則是大數據時代背景下的產物。從外延來看, “現金流水”與“現金軌跡數據”所反映的客觀事物都是現金, 二者等同; 但從內涵來看, 二者的側重點不盡一致。現金流水體現的是現金的體量屬性, 即金額多少。在現代漢語詞典中, “流水”一詞的引申義為銷售額, 如流水收入。古人云: “流水者, 按日挨登如流水之盈科漸進也②。”從會計的角度來看, 它體現了流水賬就是每日登記入賬金額的過程, 如同流水不斷充盈, 奔涌向前。現金軌跡數據的內涵更為豐富。“軌跡”一詞與“流水”不同, 它指的是以時間為尺度, 記錄物體在空間上的運動過程。從物理學的角度來看, 這一運動過程包括了路程(長度)、 方向、 速度、 曲率等許多特征; 同時, 在軌跡數據的可視化中, 如果研究對象為群體, 繪制線條的粗細、 密集程度還能反映出體量大小。可見, 現金軌跡數據這一概念涵蓋了現金的體量(金額)、 時間、 空間等多個屬性(如圖2所示)。針對同一對象, 現金流水與現金軌跡數據兩種概念的背后體現的是兩套不同的范式: 在不同的時代背景下, 借助不同的概念引導人們對同一事物轉變思考角度, 再借助不同的算法, 從而最終加工出不同的信息產物(李琳等,2021)。
3. 現金軌跡數據概念引領數據挖掘新角度。在自然科學領域, 新概念的提出往往需要經歷嚴謹的實驗才能得出結論; 而在會計等人文社會科學領域, 新概念的產生建立在思辨的基礎之上。概念是思維的基本因素(孫建中,1988), 定義概念體現了認識客觀事物的方式, 同時引導新的思維方式, 切換概念意味著轉變思考的角度。在傳統會計中, 由于現金流水具有金額屬性, 滿足貨幣計量的會計基本假設之一, 通過既定的會計準則, 能夠輸出會計的最終產品 —— 現金流量表, 為報表使用者服務。在當前大數據時代背景下, 數據挖掘技術是不同于會計準則的另一套方法, 在分析數據的過程中, 為提煉出更多隱藏的信息, 不應當僅關注現金的金額屬性。以現金軌跡數據③概念作為引領, 有助于分析者跳出傳統范式的框架, 從數據挖掘本身出發, 充分利用時間、 空間、 語義等更多維度的特征, 使貨幣資金信息不是停留在靜態余額上, 而是動態探索每筆交易的運動軌跡, 更好地發現數據之間的往來關系, 從而更有助于發現潛藏問題。
4. 現金軌跡數據影響審計思維與模式。基于知識管理理論DIKW模型(Ackoff,1989), 數據是信息的原料, 信息是具備結構化和指向性的數據集合, 是數據提煉出的產品, 人類大腦特質決定了很難直接處理數據, 而是先對數據進行降維, 并從信息中獲取知識和智慧。會計信息生產系統運行的本質, 也是利用特定規則算法對會計數據實現數據降維的過程(李琳等,2021)。傳統財務報表審計對象, 往往是從會計信息出發來探尋審計線索, 而會計信息本身在生產加工過程中并不是對所有數據的完整記錄, 數據降維到會計信息過程中丟掉了本來很有價值的數據。在大數據技術應用普及的時代, 隨著記錄、 存儲、 處理數據能力的不斷提高, 可供記錄的數據顆粒度更細、 體量更大, 那些原本被拋棄的“無用”的數據現在不僅能夠被記錄, 而且可以被納入計算。大數據審計可以有效利用數據挖掘和處理技術, 直接從財務原始數據出發去獲得關鍵審計線索, 放棄以往的抽樣審計邏輯, 直接基于全樣本數據, 利用大數據技術處理海量數據并獲得關鍵審計結論。因此, 相較于傳統會計信息觀所強調的現金流水定義, 現金軌跡數據概念存在顯著不同, 它是對資金流動過程中在虛擬電子賬戶中存留的所有數據信息進行全方位記錄并直接用于審計活動, 改變了原有的審計思維與模式, 體現了數字技術在審計領域的創新應用。
三、 現金軌跡數據挖掘流程設計
大數據審計工作需要將數據、 分析和審計工作三方面綜合起來進行, 通過數據采集、 數據預處理、 數據存儲等技術對數據進行加工處理以獲得價值密度更高的數據集。現金軌跡數據來源于企業內部, 是整個數據挖掘流程的原材料, 會計師事務所承接審計業務后, 可以要求被審計單位提供原始的現金軌跡數據。海量繁雜的原始數據難以直接有效地加以利用, 需要經過層層數據挖掘步驟, 對數據提純, 最終為注冊會計師提供有價值的盡調分析報告。因此, 數據挖掘的流程設計至關重要, 完整的數據挖掘流程包括數據預處理、 自動校驗數據質量、 數據標簽化處理、 多維度數據分類與聚類、 風險預警、 數據可視化六步④。
1. 數據預處理。原始數據的質量直接影響到數據挖掘的結果, 也會進一步影響審計質量和效率。由于財務人員專業水平、 公司系統規范、 開戶銀行提供的流水字段要求不一致或者被審計單位刻意隱瞞等, 會計師事務所獲得的原始數據往往存在著關鍵字段缺失、 數據記錄重復、 存在異常值、 偽造對賬單等問題, 為保證數據的準確性、 完整性、 一致性、 時效性和可信性等, 必須進行數據預處理, 這是數據挖掘的第一步。結合現金軌跡數據的特點, 數據預處理階段的工作主要包括數據選擇、 數據集成、 數據清洗和數據變換。
2. 自動校驗數據質量。數據預處理完成后, 系統能夠自動識別每條數據, 為進一步提升審計數據質量, 保證后續數據挖掘結果的可靠性, 需要對數據的完整性、 重復性、 真實性進行校驗。
完整性校驗主要基于連續性特征, 這一特征也是現金軌跡數據比財務報表信息真實性更高的原因之一, 如果僅關注貨幣資金的余額, 那么現金的連續性特征往往容易被注冊會計師忽略。
重復性校驗的原理與數據預處理階段中的數據清洗相同, 出于數據挖掘準確性的考量以及審計要求, 被審計單位提供的原始現金軌跡數據的時間跨度一般為一年甚至更長, 涉及上萬條記錄, 而這些記錄往往是經由日度、 月度數據匯總后產生的, 在匯總過程中, 難免會出現數據重疊的情況。重復性校驗能夠補充初次數據清洗時的遺漏, 通過系統自動捕捉高度相似的記錄, 經由人工確認后剔除重復記錄, 從而避免二次計算對結果產生影響。
真實性校驗主要是根據各銀行的數據特性來校驗數據質量, 防止虛假的交易記錄。真實性檢驗可以利用數據規律發現問題, 譬如可以進行利息檢查, 活期利息與賬戶的每日余額強相關, 基于對賬單數據所覆蓋的時間范圍及各個銀行活期利息結算規律, 系統可以重新計算活期利息。如果數據被篡改過, 錯誤的活期利息就會像滾雪球一樣被不斷疊加, 進而影響到后期余額, 造成真實與賬面的余額差異越來越大。此外, 采用Benford相關系數檢驗, 也可以發現潛在的問題。Benford定律認為, 自然界中大部分數據(包括財務數據)的首位數字n出現的概率大致服從P(n)= log(1+1/n)的分布, 當數據的分布不滿足該定律時, 將存在人為修改數據的可能。通過Benford定律進行檢驗, 當相關系數低于0.76時, 需要進一步檢查數據的真實性。
總的來說, 自動校驗環節可以基于數據本身進行, 而不依賴于任何人的經驗判斷, 數據檢驗的客觀性和準確性將會提高。
3. 數據標簽化處理。在對原始數據進行預處理和多次校驗之后, 數據的質量又將進一步提高, 但海量的現金軌跡數據依然不能為注冊會計師提供直觀的審計證據, 下一步將根據每條數據的特征以及審計重點、 重要性水平等, 給每條數據打上專屬標簽, 便于后續從不同維度進行分類處理。現金軌跡數據的標簽化處理是分類和聚類分析的前提, 標簽的類型主要分為客觀標簽和智能標簽兩類。客觀標簽依據的信息較為明確, 主要包括交易的時間、 金額以及對方名稱。智能標簽針對的是現金軌跡數據中文本字段的內容, 主要運用自然語言處理(NLP)技術, 對對手方名稱、 企業備注、 銀行備注進行關鍵詞的自動抽取, 按照每個關鍵詞出現的權重進行分類。
4. 多維度數據分類與聚類。在每條數據都打上標簽之后, 系統可以根據這些特征對數據進行分類。比如根據重要性水平, 定義大額交易, 將標簽為100萬~300萬元、 300萬元以上的數據都分類為大額交易。從邏輯關系上來說, 每一種分類均由滿足幾個共同標簽的數據組成。
數據聚類是指將數據劃分成組或簇的過程, 與數據分類不同, 選擇聚類方法的數據的類標簽是未知的。由于部分數據反映的信息有誤或者模棱兩可, 無法確定合適的標簽進行分類, 對于這部分數據, 可以通過相關性聚類的方法, 利用計算機的無監督或半監督學習, 挖掘數據之間的內在聯系, 從而建立新的標簽或者添加到已有標簽中去, 以確保每條交易記錄都貼上相應的標簽, 便于后續檢索。
總的來說, 基于歷史現金軌跡數據建立數據模型進行預測, 可以得到相應的類標簽結果, 根據類標簽結果可以對交易記錄進行分類預測; 而對于缺少類標簽的交易記錄, 可借助聚類分析的方法挖掘隱藏的內部規律, 進一步輔助分類。值得注意的是, 每條數據的類標簽并不是唯一的, 因為每個字段能夠反映出數據的不同維度, 從不同維度出發都將獲得不同的標簽號, 這些標簽號組合在一起, 將形成每條數據與眾不同的特征。
5. 風險預警。在對多維的現金軌跡數據進行分類與聚類處理后, 數據檢索將變得切實可行, 系統可以通過設置不同的算法檢索出可能存在異常的數據, 從現金流層面評估被審計單位在貨幣資金項目中存在的風險。
首先是異常值預警。現金軌跡數據層面的異常值不僅包括金額上的極大值和極小值, 還包含數據的周期性波動, 比如穩定的供應商付款頻率發生變化, 租金、 快遞費用等日常經營支出在某月突然中斷等, 都屬于異常值預警的范疇。其次是大額收支預警。系統在所有的支出記錄—供應商支付這個類別的交易中, 針對交易時間為90天以內的數據進行如下條件的篩選預警: 滿足單筆交易金額≥50萬元的供應商付款數據, 且該筆交易金額≥企業對該供應商3年內所有支出金額的P75⑤×2, 則這筆交易默認為大額支出。如果篩選出數據對應的供應商在3年以內的交易筆數<10筆,? 則不參與預警計算提示, 付款失敗后的重新支付也不計算在內。大額收入的篩選方法與支出預警相同。最后是疑似挪用公款預警。系統對超過1條的數據進行如下邏輯的篩選并預警: 在90天的時間范圍內, 針對同一個交易對手方,? 如果對該對手方(個人)有一筆支出交易發生后, 30天內又發生了一筆同樣對手方和同樣金額的收入交易, 且單筆交易金額≥5萬元, 則系統預警此類交易為疑似挪用公款交易。付款失敗后的重新支付不計算在內, 同時排除非整數金額。
6. 數據可視化。數據可視化隱藏了數據挖掘背后復雜的數據和算法, 最終以直觀、 淺顯易懂的圖表形式向用戶展現所需的信息, 注冊會計師可以通過圖表了解被審計單位在完整審計期間內資金的變化情況。根據注冊會計師的審計需要, 現金軌跡數據挖掘的可視化產品是盡調分析報告。盡調分析報告中主要通過基本的統計描述圖表反映不同維度下的企業現金分布情況, 包括直方圖、 散點圖、 分位數圖、 餅狀圖等, 根據適用的圖表類型繪制, 比如: 根據交易發生時間(分鐘級別數據), 繪制交易時間頻率分布圖, 觀察各時段交易發生的頻率分布; 根據公司賬戶支出/收入/余額(時間序列數據, 人民幣為記賬本位幣), 繪制收入支出頻數對比圖, 觀察各時段賬戶進出賬金額分布, 尋找異常金額值, 并分析收支關聯信息; 根據企業和銀行的備注, 推測出每筆交易的用途, 判斷款項類型, 繪制出收入(支出)類型餅狀圖。
四、 審計實例分析
A公司是一家致力于研發和銷售特色甜品的餐飲企業, 經營范圍內的許可項目為食品銷售, 一般項目包括餐飲企業管理、 品牌管理、 餐飲服務和工藝禮品銷售等。A公司下設一家子公司a, 其上游公司主要涉及乳業、 食品、 物業、 廠房租賃、 塑料制品等幾十家公司, 下游公司以外賣平臺和第三方支付平臺為主。
A公司聘請Z會計師事務所為其進行上市審計, 在獲取了A公司的原始數據后, 由于數據體量龐大、 時間跨度長、 涉及跨銀行條目眾多, Z會計師事務所利用現金軌跡數據挖掘的流程與方法, 從海量數據中層層抽絲剝繭, 發現A公司的某筆貸款行為和供應商付款情況疑似異常。
1. 識別疑似騙取貸款。在對A公司(被審計方)及a公司(A公司的子公司)的銀行交易記錄實施一系列數據挖掘流程后, 大額收支預警提示, 系統鎖定出其中兩條大額現金軌跡數據。第一條數據是金額為1000萬元的現金支出, 由A公司付款給B公司(根據其他信息顯示, B公司為A公司穩定的上游供應商), 識別出該條數據的算法為: 系統在所有支出記錄—供應商支付這一類別的交易中, 針對交易時間為90天以內的交易進行篩選預警, 篩選條件為單筆交易金額≥50萬元的供應商付款支出, 且該筆交易金額≥企業對該供應商3年內所有支出金額的P75×2, 滿足以上條件的交易默認為大額支出。第二條數據是現金流入, 金額也為1000萬元, 由未知賬戶X流入A公司, 識別出該條數據的算法與第一筆類似: 在所有現金流入的交易中, 針對交易時間為90天以內的交易進行篩選預警, 篩選條件為單筆交易金額≥50萬元的客戶收款記錄, 且該筆交易金額≥企業對該客戶3年內所有收入金額的P75×2, 滿足以上條件的交易默認為大額收入。
根據銀行提供的信息, A公司支付給供應商B公司的貨款1000萬元系銀行貸款所得, 在按照既定程序完成了信用風險評估后, 銀行批準了該項以償付貨款為目的的企業貸款。有明確的銀行交易記錄證明, A公司在獲取1000萬元貸款后第一時間將資金匯入了B公司賬戶, 但就在該筆交易發生3天之后, 又存在未知賬戶X匯入1000萬元到A公司賬戶。由于兩筆交易金額相同, 現金流入與流出的時間間隔相近, 初步懷疑A公司的貸款行為存在異常, 因此, 需要對該1000萬元貸款相關的現金軌跡展開進一步核查。
首先, 確定核查的時間范圍。根據以往的審計經驗和現金軌跡的運動規律, A公司潛在的非正常資金運作極可能發生在鎖定的兩筆現金流出與流入之間, 因此以這兩筆1000萬元支出與收入發生的時間分別為起、 止點, 明確核查的時間跨度為3天。其次, 確定核查的賬戶范圍。在已獲取的A公司及其子公司a公司的所有銀行交易記錄中, 選取對方賬戶名稱為B公司、 A公司(對a公司而言)、 a公司(對A公司而言)及X賬戶的記錄條目。最后, 確定核查的金額范圍。對于金額維度, 系統設定的篩選條件為單筆或拆分后總金額與1000萬元差異在5%以內的交易⑥, 包括現金的支出與收入, 該篩選方法考慮了拆分收付款的可能性。在執行了上述核查程序后, 結果發現: 在a公司的交易記錄中, 存在一筆來自B公司1000萬元的現金流入和兩筆匯入X賬戶的現金流出, 金額分別為100萬元和900萬元。在查找了有向圖中的所有環路之后⑦, 最終重構出完整的現金運動軌跡, 如圖3所示。
2. 識別客戶異常付款。A公司在日常經營活動中發生的付款事項主要包括供應商采購、 日常運營(租金、 維修費、 水電能源費)等, 一般來說, 在正常經營狀態下, 這些支出在時間維度上會呈現出周期性規律, 且金額也穩定在一定區間內。利用現金軌跡數據的時間特征, 將付款信息與A公司的歷史數據進行縱向比較, 識別出違背以往周期性規律的單筆付款數據。
考慮到識別客戶異常付款記錄的準確度, 需要根據付款方及付款理由的不同, 分別查看。一般來說, 根據原始數據中的備注字段以及后續數據的預處理, 所有對手方的付款記錄都對應了各自不同維度的標簽, 比如由付款理由劃分的貨款結算、 借款利息收入等, 由賬戶名稱和賬戶號區分出的不同付款方, 包括公司和個人。
在調查A公司客戶的付款情況時, 在所有客戶付款記錄下, 選取了A公司較為穩定的客戶B公司一年內的付款情況, 據此生成B公司付款周期散點圖, 見圖4。
根據散點分布情況, 可以看出: B公司對A公司的付款周期為半個月, 且每次付款時間主要集中在月中(每月15日前后)和月末(每月30日前后), 這些規律在Z會計師事務所與A公司溝通后得到了初步證實。此外, 由于涉及銀行轉賬等資金往來, 企業間的交易一般發生在工作日(周一到周五)。結合以上規律, 可觀察到a、 b、 c三點存在一定異常, a點交易發生在月初, b、 c點交易發生在非工作日, 值得審計人員進一步關注。
同時, 根據大量的企業實際調研, 從每日24h內交易發生的次數來看, 企業的交易發生時間段主要集中在工作時間內, 且呈現出雙駝峰或三駝峰的趨勢, 具體分布如圖5所示。
圖5顯示, A公司的交易發生時間段大體滿足規律分布, 7點為交易高峰期, 10 ~ 11點、 13點為交易次高峰, 6點之前和18點之后, 交易次數呈現斷崖式下降。凌晨尤其在0點前后的交易, 多為銀行自動處理。根據上述規律, 查看付款周期中識別出的a、 b、 c三點具體的交易時間, 可進一步判斷B公司付款的合理性。在調出原始記錄后發現, a點交易發生在工作時間內, A公司在收到款項后當天, 即發生了大額采購支出, 據此推測A公司可能要求B公司提前付款, 以滿足自身資金周轉需求; b、 c點交易均發生在周末18點之后, 僅從現金軌跡數據的層面無法得到合理解釋, 因此應當作為重點關注的付款交易, 由注冊會計師結合其他審計程序進一步查明。
3. 實例應用評價。相比于傳統的審計方法, 利用數據挖掘技術的好處在于: 核查范圍有能力涵蓋企業全部原始現金交易記錄, 識別過程中的篩選算法沒有割裂每條數據間的勾稽關系, 而是通過篩選條件一步步將相互關聯的現金軌跡數據從海量數據中選取出來, 推測出合乎邏輯的現金流動關系, 同時還能利用歷史數據驗證新數據, 推測出不符合歷史規律的異常值, 有效地彌補了人工審計的短板。
對于騙貸行為的識別, 本質上抓住了企業正常消耗貸款后, 一般會假借多個關聯方將資金轉回的心理, 以1000萬元為線索追蹤現金在幾個賬戶間往來的蛛絲馬跡, 蘊含了經驗總結而來的審計邏輯, 但也存在一定偶然性, 一旦1000萬元在更長的時間跨度內被拆分成更多筆更小金額的交易在更多賬戶間流入與流出, 核查的難度將大大增加。
在識別客戶異常付款行為中, 客戶的回款能力主要體現為基于時間特征的及時性和周期性, 這些付款規律也是識別異常的主要依據。面對海量的付款數據, 如果沒有明確的規則指引, 僅靠人工將無從查起。當然, 這些規律受制于企業及其客戶本身的規模和內部控制的嚴格程度, 一些管理混亂的企業本身的對外付款情況很可能是雜亂無章的, 因此, 如果客戶付款的散點分布情況無規律可循, 也值得企業特別關注。
由此可見, 利用現金軌跡數據挖掘的方法能夠在很大程度上幫助審計人員發現問題, 但挖掘方法本身的設定也離不開審計經驗和規律總結, 計算機技術是輔助手段, 審計人員仍需參考其他審計證據, 作出理性判斷。因此, 無論是疑似騙取貸款還是客戶異常付款問題, 上述流程設計都僅從數據角度對異常現象提出疑問, 并不能百分百確定A公司存在隱瞞欺詐行為, 若要進一步證實結論, 還需挖掘每條數據背后更深層的語義特征。具體來說, 在Z會計師事務所獲取大數據分析報告后, 針對疑似騙貸的事項, 審計人員需要大量調取相關交易的原始憑證, 詢問貸款銀行、 供應商B公司等, 針對客戶異常付款情況, 需要向A公司及其供應商詢問, 評價每項交易商業理由的真實性和合規性, 才能得出更加可靠的審計結論。
五、 大數據技術的審計應用前景展望
由于上市公司財務報表質量不佳、 貨幣資金舞弊行為頻繁出現, 社會公眾以及監管機構對于獨立第三方會計師事務所的審計責任要求越來越高。盡管如此, 實際審計過程中, 注冊會計師依然面臨重重“內憂外患”: 被審計單位資金流水體量龐大, 數據真實性與完整性難辨; 許多會計師事務所依然采用傳統的審計方式進行人工核查, 不僅效率極低, 而且難以發現問題。由于技術手段的欠缺以及上市公司的刻意隱瞞, 為免于擔責, 會計師事務所有時只能被迫辭任。否則, 對于上市公司的貨幣資金舞弊行為, 接受審計業務委托的會計師事務所總是難辭其咎, 在證監會給會計師事務所開出的一張張“罰單”中, 往往明確指出: “針對貨幣資金審計程序, 注冊會計師未勤勉盡責。”當前, 大數據技術的發展為會計師事務所擺脫這一困境提供了良好的契機, 越來越多的會計師事務所逐步將數據采集、 數據挖掘以及分析預測技術等應用到審計業務中, 以注冊舞弊審查師協會(ACFE)為代表的機構, 也積極開展大數據反舞弊、 大數據審計等業務交流活動, 用大數據技術助力未來的審計行業發展。
本文認為, 未來會計、 審計領域的變革必將借助大數據技術的東風, 實現質變的飛躍。如何利用好原始的現金軌跡數據乃至未來的其他財務數據, 運用數據挖掘等諸多技術將這些數據加工為有價值的信息, 是未來會計與審計重點的發展應用方向之一。未來大數據技術在會計、 審計領域的應用過程中, 應注重以下幾點:
1. 擴大數據源, 提升數據感知能力。從數據到信息的加工處理過程中, 數據是基礎的原材料, 是整個系統的起點, 數據量越豐富, 最終獲取的信息量很可能越大。對企業來說, 現金軌跡數據只是眾多原材料中的一種, 還有更多的原始數據亟待深入挖掘, 無論是財務數據還是非財務數據, 都可以運用更敏銳的數據感知設備選擇并采集有價值的數據并納入系統, 這對拓展會計、 審計領域應用實踐具有重要作用。
2. 優化算法, 推動系統迭代升級。算法是由數據形成信息的工具, 由于整個系統的要素一直隨著環境和使用者需求的變化而處于不斷變化之中, 算法也需要順勢而變, 不斷優化升級。一方面, 針對同樣的原材料, 不同的算法會導致不同的信息產物, 這就要求算法具有多樣性; 另一方面, 隨著數據量的增加, 原有的算法很可能不再適用, 需要面對新的原材料, 設計新的算法, 這就要求算法具有更新性。
3. 發揮人力在系統中的協調作用。在計算機日益發達從而取代大量人工的時代, 人力仍然是整個會計系統中最靈活的要素, 其在系統中發揮的協調、 把控作用是無可取代的。無論是識別有價值的數據, 還是制定匹配的算法, 都離不開人的參與, 數字技術在會計與審計領域的嵌入并不意味著對人的替代, 不斷提升人力的專業素質, 以及在人際協同發展中更好地發揮各自的價值將是更為有效的發展方向。
【 注 釋 】
① 需要指出,本文現金軌跡數據聚焦于銀行交易記錄,企業內部庫存現金直接收付較少,因此忽略不計。此外,由于現金具有同質性,現金軌跡數據研究的是現金總量的變化情況,而非對某一貨幣的追蹤。比如,從企業某賬戶中流入的100元與流出的100元盡管并非同一貨幣,但由于二者是同質的,在研究時將被作為企業現金的一部分,無差別地納入考量。
② 出自清朝縣令黃六鴻的《福惠全書·錢谷·流水收簿》一書,為“流水”一詞引申義的由來。
③ 由于筆者已詳細闡釋了本文的核心概念 —— 現金軌跡數據,為避免混淆,下文將不再出現“現金流水”“軌跡數據”等概念,統一由“現金軌跡數據”代替。
④ 本文數據獲取方法、處理技術及案例應用均來源于“見知數據公司”,該公司建立了現金流盡調平臺,可智能核查每一條流水信息,讓數據缺失、流水造假無所遁形,并且通過對數據的分析梳理,可以發覺核心客戶、關聯交易以及隱性負債等盡調風險,及時發現隱藏漏洞。
⑤ P75表示上四分位數金額。
⑥ 疑似拆分付款的篩選算法在流程設計中已詳細說明,5%為根據以往案例總結得出的安全邊際。
⑦ 每個賬號之間的交易,即識別出的每一條數據本質上可以看作賬戶到賬戶之間的一條路徑,將所有路徑連接起來,利用算法判斷是否存在閉合的環路,上述案例中有環路則表示最初流出企業的貸款極有可能又回到了企業。
【 主 要 參 考 文 獻 】
高強,張鳳荔,王瑞錦,周帆.軌跡大數據:數據處理關鍵技術研究綜述[ J].軟件學報,2017(4):959 ~ 992.
姜江華.《審計監督運用大數據技術與方法的研究》書評[ J].會計之友,2022(5):167.
李琳,劉鳳委,李扣慶.會計演化邏輯與發展趨勢探究 —— 基于數據、算法與算力的解析[ J].會計研究,2021(7):3 ~ 16.
秦榮生.大數據、云計算技術對審計的影響研究[ J].審計研究,2014(6):23 ~ 28.
孫建中.科學概念的辯證法和教授程序[ J].科學、技術與辯證法,1988(3):39 ~ 42.
王海洪,呂登輝,任美,王婧,王盈盈.我國大數據審計研究綜述 —— 基于中文核心期刊文獻研究[ J].會計之友,2021(14):134 ~ 139.
Ackoff R. L.. From data to wisdom[ J].Journal of Applied Systems Analysis,1989(1):3 ~ 9.
【作者單位】1.上海國家會計學院, 上海 201702;2.安永華明會計師事務所(特殊普通合伙)安徽分所, 合肥 200120