雷洋昆 劉芝瑋



【摘 要】 大數據時代背景下,審計信息化是審計工作的重要思路,也是新時代審計發展的必然路徑。文章基于高校數據和內審人員計算機應用水平現狀,結合高校業務運行模式和業務活動特征,提出“數據式審計”是高校審計信息化的重要手段,明確了數據式審計“是手段而非目的、是分析而非統計、是整體而非局部”的基本理念。在此理念上,文章圍繞“數據挖掘”技術構建了高校數據式審計框架,并結合高校辦學業務、科研業務案例,深入探討了審計框架的實務應用,為高校切實推進開展數據式審計提供了具有操作性的實現路徑和應用范例。
【關鍵詞】 內部審計; 數據式審計; 數據挖掘; 高校; 審計信息化
【中圖分類號】 F239.45? 【文獻標識碼】 A? 【文章編號】 1004-5937(2021)12-0025-06
近年來,隨著信息技術的飛速發展,數據信息的數量、類型、流轉渠道等迎來了爆發式的增長或轉變,審計信息化成為了審計工作的重要思路。習近平總書記在中央審計委員會第一次會議中明確指出,要“善于運用新技術、新手段,堅持科技強審,加強審計信息化建設,積極推進大數據審計”。審計信息化也將成為新時代審計發展的必然路徑。因此,如何充分收集信息、有效利用信息,緩解“信息不對稱”的困境,切實提高審計效率、拓展審計范圍、突破審計深度是審計工作當前乃至今后長期的重大課題。
一、高校數據式審計研究及應用現狀
審計信息化一般包括信息系統審計、數據式審計和審計信息管理系統建設。審計署原審計長劉家義曾指出:“審計出路在于信息化,信息化關鍵在于數字化”。因此,當審計對象、審計內容以及其所有的載體都信息化、數字化時,數據式審計也勢在必行。
“數據式審計”的概念最早由石愛中等[1]提出,是指以數據為直接對象的審計方式,以系統內部控制測評為基礎,通過對電子數據的收集、轉換、整理、分析和驗證,來實現審計目標。以此為基礎,諸多學者也探討了數據式審計的內涵及價值,如黃型君[2]通過辨析數據式審計與信息系統審計的區別,提出數據式審計的客體是電子數據,是直接與審計目標相關聯的審計方式;劉汝焯[3]提出對底層數據開展審計的價值遠大于加工處理后的信息;秦榮生[4]提出數據式審計能夠為各類常規審計和風險管理提供多維度、多樣化、多種類的數據。同時,還有部分研究者提出建設審計數據中心、采用文本挖掘技術和多維數據分析等方法均可以助力開展數據式審計[5-7]。
隨著數據式審計的概念在商業審計中逐漸得以廣泛應用,高浩瑋[8]首先將其引入高校內審業務范疇,提出數據式審計是解決高校內部審計覆蓋面與審計深度雙重壓力的上佳選擇。2017年,教育部正式出臺《關于推進直屬高等學校內部審計信息化建設的意見》(教財〔2017〕10號)[9],要求“加快推進數字化審計方式,提升運用信息化技術發現問題、評價判斷、宏觀分析、支撐決策的能力”“探索創新審計模式方法,推動內部審計科學發展”。在教育部文件的指導下,各高校積極開展數據式審計的探索與研究,例如劉曉晨[10]總結了高校開展數據式審計在數據采集、分析、安全、平臺支持及成果運用方面面臨的問題,錢金金[11]提出了以“數據采集、轉換、分析”為思路的高校數據式審計實施路徑。
但從研究現狀來看,對于高校開展數據式審計的研究仍較為寬泛,對于其實質和理念的剖析不夠,對于實踐的指導性和可操作性不強。從實踐現狀來看,客觀方面,當前高校數據數量和質量還不夠好,存在數據格式不統一,不同業務系統之間孤立割裂、沒有形成數據的閉環,數據冗余和數據缺失共存等問題,與理想狀態的數據式審計要求還存在一定差距;主觀方面,高校審計人員對數據式審計的理念認知存在偏差,專業水平也有待提高。
本文將基于高校業務運行模式、業務活動特征,結合高校信息化現狀,以高校辦學業務、科研業務為具體實例,探討高校如何運用“數據挖掘”技術開展數據式審計,以供高校推進審計信息化建設參考。
二、高校數據式審計的基本理念
借鑒以往研究者思路,本文提出的“數據式審計”是指以被審計單位底層數據庫原始數據為切入點,在對信息系統內部控制測評的基礎上,通過對底層數據及其他相關外部數據進行采集、轉換、整理、分析和驗證,以發現疑點、發現趨勢的審計方法。
近年來,盡管高校審計信息化工作宣傳和培訓力度較大,但實際業務中切實開展數據式審計的并不多。主要原因在于高校認為數據式審計需要有完善的數據和高深的計算機應用技術,而這與目前高校信息化基礎薄弱、內審人員計算機運用水平普遍不高的現狀相矛盾。實際上,認為必須要在數據和技術齊備完善的基礎上才能開展數據式審計,是對數據式審計的一種誤解。高校只有首先正確理解數據式審計內涵,才能突破數據和技術的約束,充分利用現有雖不完善但也充分的數據推進數據式審計。
(一)明確數據式審計是一種審計手段,而非審計目的
目前,不管科研文獻還是經典實務案例呈現出來的數據式審計都側重于技術模型的介紹,看起來高端、復雜的技術模型讓大部分高校內審人員誤認為數據式審計是一種高深、費解的審計,是一種突破以往審計理念和思路的新型審計。因此,部分高校雖心心念念但不敢觸碰;部分高校費時費力大動干戈,卻收獲甚少。其實,數據式審計僅僅是一種審計方法,是審計對象變化帶來的審計分析方法的變化。從本質來講,數據式審計并非新生事物,它是在各類信息更充足、更有效銜接的背景下,做出的一種深化的審計程序。例如,為了分析總體風險,在過去數據未信息化時代,內審人員一直采用抽樣手段,以部分數據來預測總體;而在信息化時代數據充分的情況下,就可以通過采集底層數據,直接對總體數據進行分析,規避了以局部推測總體的偏差,進而挖掘了更多隱蔽的信息。但究其本質,這僅僅是分析手段和樣本數量的改變,分析的思路和目的是沒有變化的,還是為了發現問題、解決問題。
(二)堅持數據式審計是基于業務的數據分析,而非數據統計
高校因其目標多元、部門繁多,且各單位、各業務模塊、各業務流程及其控制機制較為復雜,與其他行業信息化建設相比,還存在數據信息未實現全覆蓋;數據標準、數據格式不統一;各數據庫之間未銜接,未實現數據共享和數據閉環;數據冗余和數據缺失共存等問題。同時,高校內審人員計算機運用水平也普遍不高。在這種現狀下,高校推進數據式審計一是要關注數據,而不是關注讓內審人員望而生畏的信息系統;二是要挖掘數據,要善于在海量的數據中挖掘更多有價值的信息。這就需要內審人員在充分了解高校業務運行模式和業務特點的基礎上深入分析數據,而不是對所有數據按照固有的流程進行標準化處理,或者是統計出幾個固化的比率。數據式審計不是數據處理,也不是數據統計,而是需要根據審計需求,結合各單位類型性質、各業務特點規律進行靈活的調研式數據分析。如圖1所示,經過數據統計,盡管數據看起來有序了,但脫離了具體業務的數據僅僅是一個個符號,無法反映數據之間的關系、突出數據的重要性及風險點。而經過數據分析,將原始雜亂無章的數據通過有效分類排序后,能做到聚焦重點、精準取證。因此,基于業務開展數據分析,緊密結合各被審單位的性質、業務特點規律及風險點,靈活考慮數據分析對象、數據分析方式及分析側重點,是高校數據式審計有效實施的關鍵點。
(三)力爭數據式審計立足整體,突破單個和局部思維
高校資金量龐大,2021年75所部屬高校預算收支總數超過4 700億元,龐大的業務量及資金流轉亟須更加高效、精準的審計方式。傳統審計往往只是對財務數據進行抽樣審核,缺乏從宏觀整體角度進行分析。數據的數量代表業務的規模,數據的結構代表業務的質量。在開展數據式審計的過程中,內審人員首先應該突破單個、局部思維,從總體層面對海量數據進行整合,了解數據的規模,掌握整體情況;其次,內審人員應進一步對數據結構進行分析,探索業務管理質量,以精準發現問題和風險點。通過“總體分析、發現疑點、分散核實、系統研究”,實現“突破局部立宏觀、問題導向理業務、把握應然判實然、提升價值做前瞻”的高校內審目標。
三、基于數據挖掘的高校數據式審計框架分析
數據挖掘是指從大量的數據中,通過統計學、人工智能、機器學習等方法,挖掘出未知的且有價值的信息和知識的過程。基于對高校數據式審計的分析,從高?,F有的財務、業務數據信息化程度出發,構建了基于“數據挖掘”技術的高校數據式審計框架,如圖2所示。
借助數據挖掘工具,內審人員不僅能夠實現從抽樣數據到全量數據、從結構化數據到非結構化數據的挖掘整合以獲取全面實時數據,還能挖掘數據之間因果、相關甚至是隱含的關系,分析數據內部潛在的規律和本質,揭示異常數據,進而達到整體分析、重點提煉、凸顯疑點和風險、總結規律的審計目的,以下將以高校繼續教育短訓班辦學業務和科研業務為例進行闡述。
(一)審計數據的采集和預處理
1.審計數據的采集和預處理要點
數據采集是數據式審計工作的起點,采集數據的范圍、數量、質量將直接影響審計效益,是數據式審計有效開展的基礎和保障。高校內部審計涉及的業務面廣、種類繁多,內審人員在開展數據式審計時需要結合審計目的、審計重點,有針對性、有選擇性地獲取審計數據,既要避免數據冗余導致費時、費力且無效,又要避免數據太少無法獲取有效信息。一般而言,審計數據包括結構化數據、非結構化數據和半結構化數據。傳統審計方式往往局限于結構清晰、易于分析的結構化數據,如財務系統數據、人事系統數據、科研系統數據等等,而忽略了大量以其他形式存儲的數據信息。事實上,面向風險、基于內部控制、以“管理+績效”為導向的高校內部審計更多需要從非結構化數據(例如會議記錄、合同協議、規章制度、網頁信息等)或者介于以上兩種類型之間的半結構化數據(例如各種XML、HTML文檔等)中獲取信息。此外,在采集信息時,高校內審人員還需拓寬數據來源,除獲取單位內部信息之外,應充分利用網絡爬蟲、Web鏈接分析等技術廣泛從互聯網上采集外部信息,通過內、外部數據的相互印證、相互補充,提供更為全面的視角。
2.審計數據的采集和預處理示例——以高校辦學業務為例
例如,在對二級學院舉辦繼續教育短期培訓班辦班情況進行審計時,結合短期培訓班的業務風險(主要為亂合作、亂招生、亂收費、亂發證、亂分成),內審人員應該獲取下列有關數據(如圖3所示)。
(1)審計是否存在未經審批就辦班(亂辦班)、未按審批價格收費(亂收費)的情況,應收集的數據包括學院舉辦短期培訓班的項目材料、經學校審批的培訓項目材料、互聯網上的招生信息等。
(2)審計是否存在未收費就發證(亂發證)的情況,應收集的數據包括學院舉辦短期培訓班發放的結業證書情況、每個培訓班的財務收入數據等。
(3)審計合作是否存在關聯(亂合作),合作分成是否合理(亂分成)的情況,應收集的數據包括短期培訓班合同、企業信用信息、人事系統信息、財務支出數據等。
以上數據既包括結構化數據,也包括非結構化數據;既包括可以直接由被審計單位提供的內部數據,也包括需要通過其他部門或者互聯網獲取的外部數據。其中,班級項目材料、培訓合同等數據可以直接由被審計單位提供,財務收支數據、結業證書數據等需要通過學校財務部門、繼續教育部門獲取,互聯網招生信息則可以通過互聯網進行廣泛的檢索搜集。特別地,在互聯網進行信息檢索過程中,除了進行隨機手動檢索外,還可以利用Web鏈接原理,以學院網址、培訓信息發布網頁等特定網站為中心點進行外鏈分析,抓取與該網站相鏈接的其他網站,發現正在進行招生宣傳但未經過學校授權審批的培訓班。采集企業信用網信息可以事先利用Python網絡爬蟲工具,從企業信息查詢平臺中批量采集企業相關信息(如法人、股東、公司地址、聯系方式等公開信息)并存儲為SQL格式的企業信息庫,進而為后續實現批量化的關聯關系審查做好準備。
完成數據挖掘后處理后,內審人員應結合業務知識及專業判斷,進行數據使用。數據使用環節包括對數據分析結果的提煉歸納,以及審計結果的可視化呈現。一方面,內審人員需要提煉數據挖掘結果、歸納審計結論,對數據所反映出的問題進行深入調查和專業判斷,以揭示問題和風險;另一方面,內審人員可以借鑒創新的技術方法,對審計結果進行進一步提煉和可視化呈現,從而更加直觀、迅速地揭示現存問題和潛在風險,有助于高校管理者提綱挈領、有的放矢,持續提升管理質量。
綜上所述,高校數據式審計框架包括數據采集、數據預處理、數據挖掘、數據后處理、數據使用五個環節,五個環節的劃分只是理論上的歸納,在高校數據式審計實務操作中,整個過程并不是一個單向、一蹴而就的過程,各個環節間之間并非完全割裂獨立,而是相輔相成、循環聯動的。例如在數據挖掘的過程中發現了新的數據需求或挖掘到了新的審計線索,就需要回到流程初始階段進行更加精準的數據采集工作。在數據后處理過程中通過對初步數據挖掘結果進行分析總結,可以選擇更加適合的挖掘算法重新進行二次挖掘。在整個數據挖掘流程完成、得出審計結論后,又可以將審計結論作為新的文本數據、審計規范數據作為新的數據訓練集重新回到數據輸入環節,從而開啟新一輪更深度的數據挖掘,為今后的工作提供經驗和思考。
四、總結與思考
當前,高校內審人員對數據式審計的理念理解不夠深入,開展數據式審計仍“舉步維艱”。本文基于對數據式審計理念的剖析,以辦學業務、科研業務為例展示了運用“數據挖掘”技術開展高校數據式審計的流程、內容和方法。在高校目前信息化環境未健全、內審人員信息化專業技術不完善的雙重約束下,運用“數據挖掘”技術開展數據式審計的首要之道是要結合高校業務運行模式、業務發展規律和特征對數據進行分析。其次,要對現有數據進行分類分析、聚類分析(結構分析)、關聯分析、孤立點分析以充分挖掘數據背后存在的信息。最后,內審人員還需“以審促建,以審促學”,一方面通過逐步開展數據式審計,促進高校管理信息化加強頂層設計,進一步完善各類財務數據、業務數據,提高數據質量,加強各部門間的信息對接和共享,形成數據閉環,為開展數據式審計打好客觀基礎;另一方面,高校內審人員還需在推進數據式審計時,熟悉掌握高校業務特征和發展規律,增強調研分析能力和計算機應用水平,充分發揮綜合性思維和主觀能動性對數據進行采集、整理和提煉、挖掘和分析,以更好地發現問題、解決問題,促進完善和提升高校治理水平。
【參考文獻】
[1] 石愛中,孫儉.初釋數據式審計模式[J].審計研究,2005(4):3-6.
[2] 黃型君.信息系統審計與數據式審計的比較及建議[J].商業會計,2010(11):44-45.
[3] 劉汝焯.信息環境下的計算機審計方式[J].審計與經濟研究,2008(1):14-19.
[4] 秦榮生.我國內部審計的新使命與發展新路徑[J].會計之友,2019(8):2-5.
[5] 劉星,牛艷芳,唐志豪.關于推進大數據審計工作的幾點思考[J].審計研究,2016(5):3-7.
[6] 張志恒,成雪嬌.大數據環境下基于文本挖掘的審計數據分析框架[J].會計之友,2017(16):117-120.
[7] 鮑朔望.大數據環境下政府采購審計思路和技術方法探討[J].審計研究,2016(6):13-18.
[8] 高浩瑋.基于高校財務信息平臺的數據審計模式及實務探究[J].審計研究,2010(6):59-65.
[9] 教育部.關于推進直屬高等學校內部審計信息化建設的意見[A].教財〔2017〕10號,2017.
[10] 劉曉晨.大數據背景下高校數據式審計模式的創新與變革[J].時代金融,2020(9):134-135.
[11] 錢金金.信息化環境下高校數據式審計模式運用的探索[J].經濟師,2019(7):112-117.