[摘 要] 隨著企業財務數據越來越多地與ERP#65380;CRM等系統中的經營數據有機地交織在一起,僅僅局限于部分財務數據的靜態單機版審計輔助軟件已經力不從心#65377;建立審計數據倉庫,并在此基礎上對海量的企業財務數據及相關數據進行審計,是解決目前通過單機版軟件和手工查賬的審計方式效率低下的有效途徑#65377;本文提供了詳細的針對審計領域的數據倉庫的設計思路#65377;審計數據倉庫設計是決定新型審計軟件成功與否的最關鍵因素#65377;
[關鍵詞] 數據倉庫;審計,審計軟件
[中圖分類號]F239.1[文獻標識碼]A[文章編號]1673-0194(2007)10-0077-04
1 引 言
近年來,數據倉庫在電信等多個海量數據分析處理領域的應用都取得了巨大的成功#65377;把數據倉庫技術與傳統審計軟件技術相結合,是大大提升審計效率,增強審計能力的重要途徑#65377;
從世界范圍來看,基于數據倉庫技術的審計軟件在加拿大等西方國家得到了迅速的發展,取得了巨大的經濟效益和社會效益#65377;
從我國國內情況看,隨著企業財務數據越來越多地與ERP#65380;CRM等系統的經營數據有機地交織在一起,僅僅局限于部分財務數據的靜態單機版審計輔助軟件已經無法對海量財務信息及經營信息進行有效的審計,傳統審計軟件必須有全新的突破,使用數據倉庫作為業務審計的有效數據源,才能滿足對海量財務數據進行審計并真正發現問題的要求#65377;
在實踐中可以看到,看似平淡無奇的審計數據倉庫設計與應用決定是新型審計軟件成功與否的最關鍵因素#65377;
2 建立審計數據倉庫的必要性
通過把財務數據和業務數據按審計主題進行組織,構建審計數據倉庫#65377;并在此基礎上,利用OLAP聯機分析處理技術,實現對數據的深度分析,從大量的數據中發現有價值的審計線索,可大大提高審計效率#65377;
(1)提供靈活的OLAP動態聯機分析能力
基于數據倉庫技術,利用動態聯機分析工具,為審計人員提供靈活的動態聯機分析#65377;審計人員可以根據需要,進行數據的動態立體探查,比如進行數據的層鉆#65380;下鉆#65380;上鉆等#65377;這樣,審計人員可以對企業的財務數據進行由表及里的#65380;由匯總數據到明細數據查看的多角度#65380;多層次的數據分析#65377;數據分析完全是基于一張OLAP 分析報表進行,不需要進行多次查詢,提高了審計人員分析數據的能力和效率#65377;
(2)提供多樣的數據統計功能
除了提供各種排序,以及最大值#65380;最小值#65380;平均值#65380;分組合計和總計等計算功能外,還提供了多種統計分析方法,比如:絕對值分布分析#65380;趨勢分析#65380;比重分析#65380;異常值分析#65380;基比分析#65380;環比分析#65380;增長率分析等#65377;審計人員可以根據需要,選用不同的統計分析方法#65377;
(3)提供計算指標的派生功能
在原有財務指標的基礎上,系統提供計算指標的派生功能#65377;審計人員可以根據審計需要,進行各種計算指標的再定義,比如速動比率#65380;固定資產周轉率等指標的定義和計算等#65377;
顯然,要滿足以上審計需求,首先有賴于審計數據倉庫的建立#65377;
3 基于動態聯機分析的審計信息系統簡介
基于動態聯機分析的審計信息系統的詳細情況可以參考筆者發表在《中國管理信息化》2007年第8期(會計版)上的《基于動態聯機分析的審計信息系統》一文#65377;概括地說,基于動態聯機分析的審計信息系統主要包括審計數據倉庫#65380;審計聯機分析處理#65380;審計業務管理#65380;審計告警#65380;專家經驗庫等五大子系統#65377;
(1)審計數據倉庫子系統
審計數據倉庫子系統為整個系統提供有效的數據來源,雖然對用戶它是不可見的,但從系統運行的角度來看,事實上它是整個系統中具有核心實用價值的重要基礎#65377;本文所提到的數據倉庫子系統包含數據倉庫本身#65380;OLAP引擎#65380;規則引擎等三大部分#65377;
(2)審計聯機分析處理子系統
主要包含審計分析#65380;審計計算#65380;查詢#65380;抽樣等數據分析功能,數據完全來源于數據倉庫#65377;
(3)審計業務管理子系統
包括形成審計日記#65380;工作底稿#65380;審計報告等業務管理功能,為用戶提供一個完整的審計業務處理環境#65377;
(4)審計告警子系統
審計告警子系統是對從企業動態采集到的數據,應用數據分析規則,對異常反應的數據向審計人員發出警報;幫助審計人員大幅度縮小可疑的審計范圍,大大提高審計效率#65377;
(5)專家經驗庫子系統
專家經驗庫子系統是將企業的歷史采集數據#65380;有關告警內容#65380;計算指標#65380;審計形成的有關文檔和結論等保存下來,為新的審計告警指標提供參考的依據,并在此基礎上逐步提高系統的智能化程度#65377;
4 審計數據倉庫的設計
目前對OLAP與數據倉庫的關系有3種觀點:一種觀點是把OLAP與數據倉庫視為不相交的,OLAP是在數據倉庫基礎上進行更進一步的工作;另一種觀點認為數據倉庫是OLAP的數據層,數據倉庫是OLAP的一部分;第三種則認為OLAP是數據倉庫的表現層#65377;
本文并不認為這些觀點有任何本質的不同,都表明了數據倉庫與OLAP既相對獨立,又存在千絲萬縷的緊密聯系#65377;為了方便敘述,本文在不同的段落語境中,3種觀點都有運用#65377;
在對企業的審計過程中,最重要的一個環節是對企業的財務數據進行各種類型的分析#65377;數據倉庫是專門用于支持數據分析型的應用的,因此可以很好地滿足審計對數據分析的需求#65377;
審計數據倉庫是在各企業財務基礎數據的基礎上建設的,它的數據存儲方式采用星型模型設計,更適合于審計人員對其進行各種分析#65377;數據倉庫對數據采取雙粒度或多粒度方式存儲,有目的有選擇地存儲需要的歷史數據,提高了計算機資源的有效利用率;在數據倉庫之上可以建立多種數據分析主題,利用OLAP動態聯機分析工具,可以為審計人員提供強大的數據分析工具#65377;
本文認為,審計數據倉庫子系統包含數據倉庫本身#65380;OLAP引擎#65380;規則引擎等三大部分#65377;其中數據倉庫本身主要包括各種與審計相關的事實表和維表,存放各種數據信息#65377;這是系統成敗的核心,也是本文討論的重點#65377;OLAP引擎為系統其他部分提供操作和實現數據倉庫多維數據的方法和途徑,沒有它,系統其他部分將無法利用數據倉庫中的有效數據#65377;規則引擎則提供一種供用戶管理和控制數據倉庫以及調度整個系統的機制#65377;因篇幅所限,這兩部分內容都不作為本文討論的重點#65377;
4. 1數據倉庫模型設計思路
按照W.H.Inmon的說法,“數據倉庫是一個面向主題的#65380;集成的#65380;時變的#65380;非易失的數據集合,支持管理部門的決策過程”#65377;這個簡短而又全面的定義指出了數據倉庫的主要特征:面向主題的#65380;集成的#65380;時變的#65380;非易失的,將數據倉庫與其他數據存儲系統(如關系數據庫系統#65380;事務處理系統和文件系統)相區別#65377;下面進一步看看這些關鍵特征#65377;
(1)面向主題的(subject-oriented)
數據倉庫圍繞一些主題,在審計領域關注的主題有科目余額#65380;輔助核算余額#65380;資產負債表#65380;經濟效益指標#65380;利潤報表等#65377;數據倉庫關注決策者的數據建模與分析,而不是集中于組織機構的日常操作和事務處理#65377;因此,數據倉庫排除對于決策無用的數據,提供特定主題的簡明視圖#65377;
(2)集成的(integrated)
通常,構造數據倉庫是將多個異種數據源,如關系數據庫#65380;一般文件和聯機事務處理記錄,集成在一起#65377;使用數據清理和數據集成技術,確保命名約定#65380;編碼結構#65380;屬性度量等的一致性#65377;
(3)時變的(time-variant)
數據存儲從歷史的角度(例如過去5~10年)提供審計基礎信息#65377;審計數據倉庫中的關鍵結構隱式或顯式地包含時間元素#65377;
(4)非易失的(nonvolatile)
審計數據倉庫總是物理地分離存放數據,這些數據源于操作環境下的應用數據#65377;由于這種分離,審計數據倉庫不需要事務處理#65380;恢復和并發控制機制#65377;通常,它只需要兩種數據訪問:審計數據的初始化裝入和審計數據訪問#65377;
一般地,審計數據倉庫的設計過程包含如下步驟:
①選取待建模的審計處理項目#65377;例如,庫存#65380;記賬管理#65380;銷售和一般分類賬#65377;如果一個審計過程涉及整個組織,涉及多個復雜的對象,應當選用建立審計數據倉庫模型#65377;
②選取審計業務處理的粒度#65377;對于審計業務處理,該粒度是基本的,在事實表中是數據的原子級,例如,是否需要審計原始憑證等#65377;
③選取用于每個審計事實表記錄的維#65377;典型的維是科目編碼#65380;會計時間#65380;期初值#65380;期末值和狀態等#65377;
④選取將安放在事實表中的度量#65377;典型的審計度量是可加的數值量,如借方發生額和貸方發生額等#65377;
審計數據倉庫基于多維數據模型,該模型將數據看作數據立方體(data cube或cube)形式#65377;數據立方體是對多維數據存儲的一種比喻,這種數據的實際物理存儲不同于它的邏輯表示#65377;重要的是,數據立方體是n維的,而不限于3-D#65377;多維數據模型圍繞中心主題(例如sales)組織#65377;該主題用事實表表示#65377;事實是數值度量的#65377;把它們看作數量,是因為需要根據它們分析維之間的關系#65377;
數據倉庫為整個系統提供有效的數據來源,雖然對于用戶它是不可見的,但從系統運行的角度來看,數據倉庫處于整個系統非常關鍵的位置#65377;本系統中的數據倉庫采用了多維數據模型方式,設計建立了由各種與審計相關的事實表和維表構成的多個星型模式(star schema),存放各種數據信息#65377;每個星型模式包含了一個包含大量有用數據的#65380;不含審計冗余數據的中心事實表,以及多個描述事實表屬性的維表#65377;星型模型中,事實表主要包括每個維表的關鍵字及其相關的度量,每個維表只能用一張表表示,每張表包含了一組相關的審計屬性#65377;正確地分析#65380;選擇事實表與維表,并建立起合適的多維數據星型模型,對數據倉庫的運行效率和數據的濃縮抽象具有決定性的作用,是影響系統設計成敗的關鍵點之一#65377;
經過多次實際應用的實踐考驗,提煉精簡出以下具有廣泛共性的審計數據倉庫設計模型#65377;它是決定新型審計軟件成功與否的最關鍵因素#65377;
4. 2為賬分析而建立的科目余額分析星型模型
審計的目的是希望發現問題,因此必然需要對賬進行分析#65377;而在電子化的環境下,各類賬主要是從余額表中生成的,只是對外的表現形式不同而已#65377;因此,對賬的分析,主要是圍繞科目余額表進行分析#65377;
為了達到此目的,需要建立科目余額分析星型模型以及輔助往來分析星型模型#65377;
科目余額分析的星型邏輯模型如圖1所示#65377;

科目余額分析星型模型說明:
事實表:余額信息表;維表:科目維和時間維#65377;其中,科目維針對不同的企業其維表數據需要更新#65377;
4. 3為賬分析而建立的輔助往來分析星型模型
輔助往來分析的星型邏輯模型如圖2所示#65377;

輔助往來分析主要是對企業與客戶#65380;供應商的賬目往來進行核算,對企業與部門之間#65380;企業與職員之間的賬目進行核算分析以及企業在建(或已建)項目的核算分析等#65377;
輔助往來分析模型的說明:
事實表:輔助核算余額信息表;維表:科目維#65380;客戶維#65380;供應商維#65380;部門維#65380;職員維#65380;項目維#65380;時間維#65377;其中,除時間維以外,其他的維表數據需要根據不同的企業進行更新#65377;
4. 4為報表分析而建立的資產負債報表分析星型模型
在電子化環境下,報表分析主要是對資產負債報表中的數據以及利潤報表中的數據進行分析#65377;因此也需要建立起相關的星型模型#65377;
資產負債報表分析星型邏輯模型如圖3所示#65377;

在電子化環境下,資產負債報表中的數據主要是從余額表中生成的#65377;資產負債報表的格式和指標有統一的規定,但是針對不同的行業,資產負債報表的指標會略有不同#65377;
資產負債報表分析模型的說明:
事實表:資產負債報表信息;維表:時間維和資產報表指標維#65377;其中,資產報表指標維中的數據需要根據不同企業所在行業的不同進行更新#65377;
4. 5為報表分析而建立的利潤報表分析星型模型
利潤報表分析的星型邏輯模型如圖4所示#65377;

在電子化環境下,利潤報表中的數據主要是從余額表中生成的#65377;利潤報表的格式和指標有統一的規定,但是針對不同的行業,利潤報表的指標會略有不同#65377;
利潤報表分析模型的說明:
事實表:利潤報表信息;維表:時間維和利潤報表指標維#65377;其中,利潤報表指標維中的數據需要根據不同企業所在行業的不同進行更新#65377;
4. 6責任審計指標分析星型模型
在審計中涉及的經濟指標評價主要包括對責任審計指標和經濟效益指標的評價,因此也需要建立起對應的星型模型#65377;
責任審計指標分析的星型邏輯模型如圖5所示#65377;

責任審計指標主要是對領導任期內的經濟責任方面進行審計#65377;責任審計指標分析的各類指標從報表指標中計算獲得#65377;
責任審計指標分析模型的說明:
事實表:報表信息;維表:時間維#65380;公司維#65380;責任審計指標維#65377;如果企業屬于集團企業,公司維中數據需要根據集團企業的下屬企業設置而更新維表中的數據#65377;責任審計指標維中定義企業領導任期內的經濟責任審計指標#65377;
4. 7經濟效益指標分析星型模型
經濟效益指標分析的星型邏輯模型如圖6所示#65377;

經濟效益指標分析主要是依照《企業效績評價指標解釋》(財統[2002]5號)文件精神對企業的績效進行評價#65377;經濟效益指標分析的各類指標從報表指標中計算獲得#65377;
經濟效益指標分析模型的說明:
事實表:報表信息;維表:時間維#65380;公司維#65380;經濟效益指標維#65377;如果企業屬于集團企業,公司維中數據需要根據集團企業的下屬企業設置而更新維表中的數據#65377;經濟效益指標維中定義《企業效績評價指標解釋》(財統[2002]5號)中指定的企業績效評價指標#65377;
5 結束語
基于本文關于建立審計數據倉庫的設計思路而開發的審計軟件,突破了傳統單機桌面版審計軟件的局限,并在大型項目中得到初步成功的應用,為基于數據倉庫進行更深層次的審計數據挖掘奠定了良好的基礎#65377;
主要參考文獻
[1] Craig Larman. Applying UML and Patterns[M]. 北京:機械工業出版社,2004.
[2] Jiawei Han,Micheline Kamber. Data Mining[M]. 北京:高等教育出版社,2005.
[3] 中華人民共和國審計署. 中華人民共和國審計法[S]. www. audit.gov. cn/cysite/docpage/c241/200603/0301_241_15924. htm,2006.
[4] 中華人民共和國審計署. 審計機關審計抽樣準則[S]. www. audit. gov. cn/cysite/docpage/c241/200405/0526_241_9239. htm,2006.
[5] 中華人民共和國審計署. 審計重要性與審計風險評價準則[S]. www. audit. gov. cn/cysite/docpage/c241/200405/0526_241_9236. htm,2006.
[6] 《信息技術會計核算軟件數據接口GB/T19581-2004》實施指南[S]. 北京:中國標準出版社,2005.
[7] 中華人民共和國財政部. 企業財務會計報告條例[S]. www. mof. gov. cn/news/20050304_1903_5474. htm,2006.
[8] 羅振宇. 基于動態聯機分析的審計信息系統[J]. 中國管理信息 化:會計版,2007,(8).