陳祺琳 李云強 黃紅 邱錦



[摘要]本文結合四川長虹建設嵌入式智能持續審計系統的實踐,探討在大數據、云計算背景下實施關鍵風險領域嵌入式智能持續審計的重要性和可行性,介紹建設過程中形成的實施方法、主要效果及智能嵌入模型的數據挖掘流程。
[關鍵詞]大數據? ?嵌入式? ?持續審計? ?風險導向? ?實施框架虹智能審計平臺分為審計管理、風險預警、
長嵌入式審計和大數據分析四個相對獨立的部分,采用搭積木的方式建設,2018年完成嵌入式審計系統(Embedded Audit System,簡稱EAS)建設并試運行,未來計劃建設大數據分析系統、審計云,使審計工具向智能化、云服務轉型。
一、嵌入式持續審計
長虹現有風險預警系統定期或不定期地從業務系統和會計系統取數,通過運行模型發現和評估風險。與傳統審計相比,具有審計成本低、效率高的優勢,但只能在業務發生后進行審計,不能實時監控及時中斷高風險業務,不能進行事中審計,所以持續審計(Continuous Auditing,簡稱CA)被提上日程,其根本優勢在于報告時隔短、追蹤事件及時和風險控制強。
(一)嵌入式持續審計的定義
1.長虹嵌入式持續審計的定義。在審計對象IT系統的關鍵控制環節或領域嵌入控制監控模塊,通過該模塊持續對審計對象的業務數據實時監控。當系統處理與審計設定的界限和參數不一致時,監控程序按預定義的風險處置方式實時干預業務流程。嵌入式持續審計框架如圖1所示。
2.創新風險處置方式。長虹嵌入模塊的風險處置方式是設定風險級別,實行紅黃兩級風險處置。對低中風險,在業務系統中實時提示業務,預警數據推送到EAS備查;對高風險,直接在業務系統中凍結業務,審計在EAS審核通過后解凍或進入專項審計。
(二)實施嵌入式持續審計的意義
在交易界面頻發風險點和業務管控能力不足的控制點嵌入使用兩級風險處置方式的審計模塊,一方面可強制業務主動自查、整改以保證業務開展;另一方面可分析業務熔斷或預警原因,跟蹤解凍情況,邊聽取業務單位意見、邊提出報告、邊督促整改,提高業務整改的及時性和有效性。通過嵌入式審計,審計監督既融合又分離,實現了由事后審計向事中與事后審計相結合的轉變,由靜態審計向動態與靜態審計相結合的轉變,最終在審計能力、層次和水平上實現有效提升,審計監督效能得以充分發揮。
(三)實施嵌入式持續審計的可行性分析
1.文獻概述。在中國知網搜索關鍵字“持續審計”“連續審計”或“嵌入式審計”,發現相關文獻較少,尚未發現嵌入式持續審計實務方面的文獻。侯佳利等在《新常態下嵌入式審計的創新研究》(2017)中,以審計局對行政事業單位的審計為出發點,提出信息化嵌入式審計的建設思路,同時也指出“目前關于嵌入式審計的文獻很少,有些只是提出在審計工作中運用嵌入的思想,至于怎么運用、如何實施都沒有具體的思路和方案”。在政府審計方面的嵌入式審計文獻相對較多,姜江華(2016)總結提出嵌入式審計具有更強的時效性、持續性和更高的參與性。其特征是審計監督既獨立又融合,既事中又事后,既靜態又動態。胡鎮鑫(2017)結合近年來在東莞農村集體經濟審計運用嵌入式審計理念的實踐,分析嵌入式審計新模式的理論和實踐,為內部審計部門踐行嵌入式審計提供借鑒。《高級審計技術方法》(2013)指出持續審計技術實現模式分為三種類型:嵌入式、分離式、混合式。嵌入式持續審計適合內部審計,具有實時審計、時間同步性好的優點,但存在通用性不足、降低系統性能、設計不合理產生垃圾信息等缺點以及影響審計獨立性的風險。
2. IT技術的快速發展使嵌入式持續審計變得可
行。(1)系統性能和通用性方面。與Groomer & Murthy在2003年提出系統性能問題相比,現在計算機的軟件技術和硬件性能已有了很大提升,合理的設計可以把影響降低到可接受的水平。在長虹云架構下,借助微服務技術和云計算,通過把嵌入模型的控制邏輯和計算邏輯分離,從而減少與業務系統的耦合度來提高通用性。計算邏輯在EAS統一建立和管理,通過修改計算邏輯適應常規業務變化。控制邏輯放在業務系統,根據EAS發送的風險閾值判斷業務流程正常通過、預警或中斷。(2)審計嵌入模塊設計合理性方面。若嵌入模塊設計不合理,會給審計和業務產生大量誤報信息,影響審計效果。但大數據和人工智能的產生和發展,采用基于統計學、機器學習的數據挖掘技術構建審計嵌入模型,可以提高審計分析的廣度和深度,提高模型預測的準確度和精準度。
3. 嵌入式持續審計不影響審計實質上的獨立性。審計獨立性包括實質上的獨立性與形式上的獨立性。長虹嵌入式持續審計要求內部審計人員凍結或解凍高風險業務,由于程度深、時間長,使得審計行為的獨立性在形式上受到影響,但因審計在組織、人員、薪酬等方面獨立于業務單位,從而保證內部審計的客觀性。
(四)智能審計云平臺的架構
1. 建設策略。維系現有審計系統(已完成的審計管理模塊、風險預警模塊)技術架構不變,并對其進行優化開發、完善功能,之后逐步擇機遷移到云架構。2018年開發的嵌入式審計、未來建設的審計大數據分析系統均基于云架構設計及開發。
2. 系統架構。基于分布式互聯網IT架構,能夠快速構建審計業務,滿足審計中長期需求;能夠利用大數據、云計算及數據挖掘技術,實現底層數據顆粒化、平臺功能及分析模型的動態擴展,如圖2所示。其中,LaaS為基礎設施;DaaS基于大數據平臺構建審計數據中心,利用大數據豐富的算法庫,搭建審計挖掘模型;PaaS基于長虹云平臺搭建審計云,采用Docker容器、Spring Cloud微服務等技術實現審計應用的容器化、微服務化,提供數據可視、能力輸出、數據分析等服務能力;SaaS可實現審計管理、風險預警、嵌入式審計和大數據分析等智能審計云平臺應用功能。
(五)影響制約因素
1.信息系統建設管理水平的影響和制約。若信息系統一般控制和應用控制不足、信息化流程不完善、業務流程不規范,會降低嵌入模塊的可靠性和持續性;若信息系統存在孤島或無有效關聯、業務數據不完整,會降低模型的通用性,甚至導致不能成功建立模型;若系統數據質量差,則不僅增加數據清洗工作量,還會直接影響模型的準確度和精準度,產生大量異常的垃圾信息。
2.對審計人員的勝任能力提出更高要求。審計不僅參與業務時間長、介入程度深,而且需熟悉數字化審計,同時還需通過內部審計咨詢服務實現審計增值功能,這對內部審計人員的素質、能力和作風必然提出更高要求和標準。
二、長虹嵌入式持續審計的實施方法
EAS實施方法有五大步驟,具體包括:風險識別與評估、選擇嵌入點、開發審計嵌入模型、異常數據管理和處置、風險閉環管理,如圖3所示。
(一)風險識別和評估
參考2017版COSO-ERM (企業風險管理框架)的5個風險要素,結合歷年審計案例識別公司交易界面日常經營活動的風險控制水平,發現采購和銷售業務子流程存在的高風險點或薄弱環節。
(二)選擇嵌入點
選擇合適的嵌入點是實現嵌入式審計有效的關鍵因素之一,業務單位因自身原因控制不力的高風險點是首選嵌入目標,而數據質量不高、業務流程未信息化的關鍵控制風險點及事后檢查性控制都不適合作為嵌入點。在確定嵌入點時,應對該業務流程的信息系統控制進行應用控制審計,對存在的控制缺陷進行完善或建立補償性控制,防止因IT控制缺陷影響嵌入審計模塊效果。
(三)開發審計嵌入模型
審計嵌入模型主要由EAS的計算邏輯和嵌入業務系統的控制邏輯組成,兩者通過數據接口實時交互。計算邏輯的核心功能是測算業務的預警和熔斷閾值,并據此計算每筆業務的風險等級;控制邏輯根據計算邏輯傳送的風險等級執行紅黃兩級風險控制。嵌入模型由兩種方法構建,如圖4所示。一種是利用審計經驗建立規則;另一種是通過大數據技術創建和訓練模型。數據源除業務數據外,還應拓展其他渠道的數據源。
(四)異常數據管理和處置
異常數據是指審計嵌入模塊實時將預警和熔斷數據發送到EAS的數據,審計和業務人員對熔斷和預警數據分析后進行處置。對于誤報異常,審計需要完善模型以提高精準度和準確度;對于真實異常,除因內外部經營環境發生變化產生的熔斷數據由業務發起解凍申請、審計審核同意后解凍外,其他事項則由業務自查整改或進入專項審計,如圖5所示。
(五)風險閉環管理
EAS自動逐筆建立審計熔斷和預警臺賬,并根據后續處理結果逐一銷賬:申請解凍成功的數據通過解凍流程自動銷賬;業務熔斷后,業務人員主動完成整改后通過EAS銷賬;審計人員判斷需要啟動專項審計的,轉入審計項目管理后銷賬;對于未按期完成解凍或整改的,將自動生成審計整改未完成報表。同時,審計人員還需對熔斷數據和預警數據進一步分析,持續完善模型,以提高審計模型的精準度;結合現場審計,對業務流程提出優化或整改建議,對相關人員提出問責建議。
三、嵌入式持續審計系統指標構建和運行
(一)搭建嵌入式持續審計指標體系
以采購指標為例,根據風險矩陣、風險頻繁程度,結合長虹已建的預警系統指標體系和功能,選擇降價不同步、價格漲幅異常和超配額下單三個風險點作為嵌入審計指標,如表1所示。
(二)基本算法和運行流程
在機器學習的眾多算法中,統計分析是最基本的算法,包含許多重要模型,并為其他機器學習算法提供訓練樣本等,其中概率分布模型是統計分析中最重要的組成部分。正態分布是許多統計方法的理論基礎。檢驗、方差分析、相關和回歸分析等多種統計方法均要求分析的指標服從正態分布。有的統計方法雖然不要求分析指標服從正態分布,但相應的統計量在大樣本時近似正態分布,因而大樣本時這些統計推斷方法也是以正態分布為理論基礎的。基于以上依據,將采購價格的絕對值波動轉化為價差比后,可通過正態分布模型設計降價不同步、價格漲幅異常指標模型,給出合理的預警值和熔斷值。需要說明的是:
差價比=(時間區間模型內價格-時間區間模型內最小價格)/最小價
1.機器學習算法運行流程。首先,對采購信息記錄進行數據預處理和清洗,引入格拉布斯檢驗法進行異常值剔除。其次,使用正態分布模型計算得到預警值和熔斷值。實際過程中,引入偏度和峰度模型修正正態分布模型,降價不同步指標引入時間區間模型,從而更加準確計算預警值和熔斷值。最后,進行模型驗證,辦法是引入實時接口,使用智能化模型調參界面供EAS審計人員進行驗證,減少人為出現的失誤等,如圖6所示。
2.數據分析工具框架。使用Python作為數據分析框架核心工具,實現離線與實時接口輕量級化,滿足不同的業務場景,如圖7所示。
(三)采用格拉布斯檢驗法處理異常值
對采購信息記錄數據進行清洗、基礎分析后,發現部分物料存在不同程度數據異常,其中異常情況有:貨幣代碼不一致、計量單位不一致等。對此,為不影響后續數據分析結果,采取格拉布斯檢驗法剔除異常值。具體步驟如下:第一步,從小到大順序排列數據。第二步,計算平均值和標準差。第三步,使用雙邊測試方法計算G值:G=。對于雙邊
測試,異常值的假設在顯著級別α級被拒絕的
值為G大于? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?,
表示上臨界值的t分布與N-2自由度和顯著水平α/(2N),其中t分布可用于構建真實均值的置信區間。第四步,定檢出水平α, 判定數據值是否為異常。多次樣本數據選擇發現,有95%的概率模型計算的區間包含真實參數值,即大概有95個置信區間包含真實值。可見,格拉布斯檢驗法能精準找到數據中的異常值,且經過數據驗證準確率可達97%以上。為確保所有的異常值都能被找出,可按數據不同屬性類別進行多元格拉布斯檢驗。