陳曉梅
(三明學院外國語學院,福建 三明 365004)
隨著信息化的快速發展和會計電算化的廣泛普及,計算機審計逐漸步入人們的視野。特別是在審計署的金審工程之后,計算機審計得到充分的重視和廣泛的應用。
在計算機審計實踐中,對數據的處理至關重要,甚至決定著審計的成敗。然而,計算機技術在實際審計中并未得到充分的運用,目前的審計軟件僅僅把手工審計流程計算機化,沒用充分利用先進的信息和數據處理技術,尚不能對源數據進行快速充分整合,更難以從原始數據中提取一些隱藏的信息。造成以上問題的原因有以下三個方面:一是被審計單位行業跨度大,審計人員擁有的經驗和知識無法處理跨專業的問題;二是隨著不同行業數據量的不斷增長,審計經驗往往落后于數據量增長的速度,審計經驗與數據量增長的非同步性增加了審計失敗的可能性;三是計算機審計技術和工具的落后,難以承擔復雜、繁重的審計工作。
區別于傳統的手工審計,采集完數據后如何運用計算機技術從龐大而零散甚至難以理解的數據中提取完整和有價值的信息(即運用計算機技術對審計數據進行預處理)是審計人員面臨的最大困難,而這正是計算機審計成功的關鍵步驟。
審計數據預處理是指在完成對源數據采集后,對龐大、不完整的臟數據進行轉化和清理,使之變成符合標準格式的審計初始數據,以滿足審計數據分析的需要。審計數據預處理是把雜亂的數據整理成符合審計工具標準格式要求的數據,這個過程突出一個“預”字,是數據處理過程中的前提和準備。
隨著計算機技術的發展,加之各行中業務方式的不同,實際市面上使用的會計軟件種類繁多,由此形成的憑證的格式也各不相同。這就造成了審計軟件與會計軟件的數據格式不統一,給計算機審計帶來了很大的困難。在進行計算機審計時,審計人員除了要面對會計軟件的可審計性問題外,還必須按審計工具將會計軟件中的數據變換格式。這不僅加大了審計人員的工作量,還存在數據輸入的風險。由于系統的原因,在輸入過程中難免造成數據的丟失與篡改。
數據的預處理清洗了現實中不完整的臟數據,為整個審計過程提供了完整的原始數據,提高了后續審計工作的效率,甚至直接或間接地影響了審計的效果。因此,對審計數據進行預處理是十分必要的,這為審計工作的順利開展提供了可靠的保障。
充分運用現有技術,不斷探索和完善審計數據預處理的技術,建立一套完整的數據預處理體系,對審計工作的開展有著深遠的意義。根據權威標準,首先對原始會計數據的標準化輸入和存儲,以形成源數據。然后通過清理與集成,把源數據存入數據倉庫;在聯網專家系統的輔助下,形成標準格式的初始數據。最后進行數據挖掘,找出隱藏的信息,輸出標準格式的審計初始數據,完成數據預處理。數據預處理過程如圖1所示。

圖1 數據預處理過程
雖然我國出臺的《信息技術會計核算軟件數據接口》規定了會計核算軟件的數據接口要求,規范了文本格式和XML格式的數據接口,但仍存在一些盲點,不夠完善。大多數商業財務軟件沒有考慮到與其他管理信息系統的數據兼容問題,因此也就難以實現數據的共享。如果從源頭抓起,使原始會計數據的輸入和存儲標準化,將做到數據的完整、準確和減少冗余。
國家財政相關部門可以結合電子商務和ERP系統,共同建立一個共享的財務信息網站平臺,根據不同行業的特點制定財務軟件的標準,并分行業設計具有權威性的財務軟件,采取對原始會計數據的標準化輸入和存儲。
用戶根據自己行業選擇并下載相應的財務軟件,這些軟件數據接口一致,采取統一的數據標準和格式,使得不同行業、部門可以實現數據共享。
這種具有強制性的國家財會軟件標準規范了原始數據的輸入和存儲格式,保證了數據質量,減少了計算機審計過程中的數據處理工作,進而提高審計的效率和效果,為計算機審計提供強有力的支持和保障。
比如淘寶網就把阿里旺旺軟件分為買家版和賣家版(如圖2),用戶根據自己身份下載需要的軟件,買家版和賣家版相互間可以實現對接,共享數據和信息。

圖2 阿里旺旺軟件下載頁面示意圖
現在數據可以存放在不同類型的數據庫中,如SQL、ACCESS、ORACLE等,對這些異源數據進行有效整合,可以利用數據倉庫技術。數據倉庫是數據庫技術的一種新型應用,它將多個異種源數據以一致的模式存儲在單個站點,以支持管理決策。數據倉庫技術包括數據清理、數據集成和聯機分析處理。數據倉庫不同于現有的操作型數據庫,它有效集成了對多個異構數據源,并按照主題進行了重組,是用于支持決策,面向分析型數據處理的新型數據庫。
在數據倉庫技術中,數據清理至關重要。它可能要占全過程60%的工作量,包含缺失值篩查和處理、異常值核查和處理、邏輯錯誤篩查和處理,還有數據格式的轉換,最后輸出完整、標準格式的數據。
數據庫技術中運用最廣的是SQL查詢語言,它方便、快捷,操作簡單,有著強大的查詢功能。審計人員熟練掌握和運用SQL語言,能快速地篩選數據,提高數據預處理的效率和正確度。
例如:現有一個名為Name_income的表,如表1所示。

表1 Name_income
假設我們需要篩選當INCOME小于1000時的NAME和INCOME信息,并將輸出結果根據INCOME由大到小排序,則輸入以下SQL語言:
SELECTNAME,INCOME
FROM Name_income
WHERE INCOME<1000
ORDER BY INCOMEDESC
輸出結果是:

NAME INCOME George 800 Abby 700
專家系統是一個智能計算機程序系統,其內部含有各領域海量的知識與經驗,能夠利用人類專家的知識和解決問題的方法來處理該領域的問題。專家系統根據某領域專家提供的知識和經驗進行分析和判斷,解決那些需要人工處理的復雜問題。
基于規則的產生式系統是目前實現專家系統知識運用的最基本方法,包括綜合數據庫、知識庫和推理機三個主要部分,分別提供了世界范圍內的事實和斷言、“if,then”形式表達的知識規則,以及運用控制策略來尋找規則的程序。
總之,聯網審計專家系統能夠利用審計領域、會計領域、法律領域專家的知識和經驗,對初始數據自動選擇與轉換,讓審計軟件與其自動核對、處理、審查,輸出符合標準審計格式的數據。聯網專家系統地開發和使用,對實現審計數據處理的智能化具有重要的意義。
數據挖掘就是從大量的、不完全的、有噪聲的、模糊或隨機的源數據中提取需要的、完整的,甚至是隱含在其中的有意義的信息和知識的過程。
數據挖掘通過自動化地分析每個數據,做出歸納性的推理和總結,從中挖掘出潛在的模式。其主要包括三個步驟:第一,數據準備,從相關的數據源中選取所需的數據并整合成用于數據挖掘的數據集合;第二,規律尋找,采用多種分析,在雜亂的源數據中尋找其隱含的規律;第三,規律表示,把規律以用戶可視化的方式表示出來(如數據或圖表)。
目前的計算機審計工作要求審計人員有較高的計算機知識和審計專業知識,但跨專業型人才又比較匱乏。運用人機界面設計技術可實現數據預處理過程中的人機交互,如運用對話框、填表等形式。這些操作簡單易懂,比較直觀,對審計人員的計算機水平要求也不高,這樣可以充分發揮人機的各自特點,方便快捷地處理數據,提高工作效率。
根據審計工作的特性和任務,設計數據預處理過程中的人機交互可視化操作界面,必要時形成系統操作手冊、訓練文件和用戶指南,實現操作的全面性和準確性。人機交互界面有多種實現類型,這些類型各有優缺點,如附表1所示。
在人機交互界面的運用方面做的最成功的是Windows窗口操作系統,它為DOS環境提供了通俗易懂、方便實用的圖形用戶界面。Windows的出現,極大地促進了計算機的普及,并為計算機技術的發展做出不可替代的貢獻。把人機交互界面運用在計算機審計數據預處理過程中,簡化審計人員的操作,是一個可行的方案。
隨著計算機技術的快速發展,數據處理的技術也日新月異。計算機審計工作應以計算機技術為依托,充分利用信息處理技術,快速、高效、準確地預處理數據,為計算機審計提供強有力的工具和支持,不斷提高審計工作的效率和效果,滿足審計工作不斷變化的需求。同時,隨著計算機技術的不斷進步,可以對審計行業特定的需求進行更匹配的定制,進一步完善和促進計算機審計的發展。

附表1 人機交互界面實現類型及其優缺點
[1]王媛.基于數據倉庫與數據挖掘技術的計算機審計模型及其應用研究[D].東北財經大學碩士論文,2011.
[2]嵇俊康,金光華,李占國.會計數據和信息的標準化與充分利用[J].會計之友,2006(9).
[3]韓家煒.數據挖掘概念與技術[M].北京:機械工業出版社,2012.
[4]杜艷君,陳晨,李湉湉.大規模數據清理的相關問題與探討[J].環境與健康雜志,2014(4).
[5]黃學瓊.IPTV故障診斷專家系統設計[D].華南理工大學碩士論文,2012.
[6]林麗.數據挖掘技術在高校教務管理系統中的應用[J].輕工科技,2012(4).