賈凱
大數據、云計算概念和關系
(一)大數據的概念。大數據,亦可稱海量資料,是指現在市場上的主流軟件工具都無法在一定的時間內完成分析、處理,并將其轉化成為有用信息的海量數據。而大數據技術既是指快速高效的從各種復雜繁多的類型數據中獲取有價值信息的能力。大數據具有四個特點:一是數據體量級別躍升,從TB到PB,不單是采集量大,其存儲和計算量也非常巨大。二是速度快、時效性高,這是大數據與傳統數據挖掘技術的最主要區別,例如用戶在搜索引擎上可以檢索到剛剛發生的新聞。三是數據類型多樣,從海量的結構化數據,以及位置信息、圖片、視頻、音頻等等各種各樣類型的半結構化和非結構化數據中,通過分析計算,找到數據價值,是大數據所要解決的問題。四是價值密度低,商業價值高,隨著信息技術的快速發展,各行各業中互聯網、物聯網的應用無處不在,產生的數據量在幾何倍數的增加,單一數據的呈現并不能產生價值,二若把相關數據聚集在一起并進行深入挖掘就會產生很高的商業價值。在大數據的思維下,我們不要抽樣要全體、不要精確要效率、不要因果要相關。大數據改變了人們收集、處理和使用數據的方式,促使著會計、審計思維方式的轉變,而這些改變則推動著財務管理模式的轉變,影響著審計技術和手段的發展。
(二)云計算的概念。云計算是虛擬化(Virtualization)、效用計算(Utility Computing)、基礎設施即服務(IaaS)、平臺即服務(PaaS)、軟件即服務(SaaS)等概念混合演進并躍升的結果,是一種新興的共享基礎架構的方法,它最核心的技術就是將大量用網絡連接的計算資源統一管理和調度,構成一個計算資源池對用戶提供按需服務,提供資源的網絡被稱為“云”。在云計算的環境下,為了使用戶能夠快速、便捷、準確、高效的訪問“云”中的數據,云計算的服務供應商不僅要能夠提供給用戶足夠大的存儲空間,還要能夠提供速度快、準確性高的計算能力,將服務器、網絡、存儲和各種應用軟件集中在一個資源共享空間內,使用戶能夠隨時隨地通過互聯網訪問數據,并將用戶每一次處理的數據保存在互聯網的數據中心,方便用戶以后隨時調取使用。這種模式使得管理費用大大降低,應用體驗感受大幅提升。
(三)大數據和云計算的關系。大數據和云計算可以看作是一個硬幣的正反兩面。大數據的特點決定了普通的單臺計算機無法滿足其功能需求對數據進行有效處理,而必須采用分布式計算架構,依托云計算的分布式處理、分布式數據庫、云存儲和虛擬化技術,對海量數據進行有效挖掘,找到有價值信息。大數據技術的重點在于對海量數據的存儲能力,同時提供數據采集、挖掘、分析的技術和方法,它著眼于“數據”,專注點在實際業務中。云計算技術的重點在于對海量數據的計算能力,也就是數據處理能力,它著眼于“計算”。大數據的海量數據存儲和云計算的海量數據處理是相輔相成、缺一不可的,二者只有同時作用于數據時才能使相關數據產生價值。
大數據、云計算對政府審計的影響
(一)擴大政府審計范圍?,F階段的政府審計工作,由于技術手段和從業人員的專業水平限制,無法對被審單位的所有數據進行梳理和辨別,通常是根據重要性水平,抽樣進行審計分析。而在大數據時代,云計算技術的不斷發展,使得審計的樣本量不斷擴大,從傳統的抽樣審計逐漸過渡到全覆蓋審計,因此可以規避掉審計抽樣風險。同時,審計范圍的擴大,也對數據的存儲、分析和挖掘力起到一個推動作用,使得大數據審計的技術能力不斷發展。
(二)豐富政府審計數據。傳統政府審計的數據主要為財務、業務等企業內部的結構化數據,但對企業的規章制度、會議記錄等非結構化的數據應用較少,且人為影響因素較大。在云計算平臺下,數據存儲空間及處理速度大幅度提升,對結構化和非結構化數據的處理水平也大大提高,因此可用數據越來越多,數據來源更為廣泛,快速、便捷、高效的獲取非標準化數據和各種類型的外部數據成為可能。
(三)促進政府審計成果應用。當前,擁有固定的格式,且內容相對單一、信息量相對較少的審計報告仍然是審計工作的最主要的成果。隨著大數據、云計算技術在審計中廣泛應用,審計工作進行過程中產生的各種信息數據也逐漸被重視。通過對這些數據的深入挖掘,并與內控、薪酬等等規章制度,以及外部數據的關聯,能夠從中找出財務、業務和經營管理等方面存在的問題和發展趨勢,總結出內在規律,并將其匯總歸納為宏觀性和綜合性較強的審計信息,提供給被審計單位的管理層和決策層,從而通過審計促進被審單位完善內部制度、提高管理水平,同時提高審計成果的綜合應用效果。此外,大數據、云計算技術還能夠將審計過程中發現的問題規則化并固化到系統中,并通過與同行業標桿企業相同問題進行對比,設置預警模型,向被審計單位進行預警。
(四)加速大數據審計師培養?,F階段的政府審計工作要求審計人員掌握相應的會計、審計知識,具備過硬的專業素質和職業道德,同時擁有一定的審計經驗。但是,在大數據、云計算時代,數據的真實性是一切的基石,倘若數據不真實,那么無論怎么計算都不能得到有價值的結果,因此,對數據真實性的驗證就成了重中之重。在這樣的前提下,就產生了數據審計師這一職業。數據審計師除了能熟練掌握審計相關知識以外,還應該是數學、統計學、以及計算機科學等領域的專家,應該具備大數據分析和預測的評估能力,同時也要與審計人員一同恪守職業道德。
大數據政府審計實施框架
大數據環境下政府審計的主要任務是通過構建一個支撐平臺,實現對審計數據的分析和處理,將審計系統和數據挖掘技術結合起來,找到結合的突破口。運用大數據技術對被審計單位運行過程中產生的大量業務數據與財務數據,以及與被審單位相關的外部數據進行深入的分析,形成疑點數據,取得審計線索?;谝陨侠斫?,本文根據審計項目實施流程,構建了一個大數據時代審計實施框架,見下圖:
大數據環境下的政府審計是按照統一的行業審計模型,通過云平臺數據中心來實現數據采集、數據轉換、模型和方法制作,并利用數據之間的相關關系得出相應的審計線索。審計部門可以從云平臺數據中心,調出被審計單位的數據,并通過云平臺審計系統進行數據的分析和處理。
(一)數據采集。大數據審計實施的基礎是數據采集,以審計目標為出發點,在被審計單位內部的企業資源計劃系統(ERP)及業務管理系統(EIS)中,采集與審計目標相關的各種類型數據,同時通過網絡將被審計單位內部各個系統與審計系統直接鏈接起來,審計人員就可以通過審計系統直接訪問被審計單位的內部各系統,進而修復、篩選出真實、可靠、相關的審計數據,形成數據層。
(二)數據清洗。首先對收集來的源數據進行抽取、轉換、清洗、集成,加載,再通過ODS、DM、OLAP等數據分析與數據挖掘技術對清洗過的數據進行有針對性加工,提煉出有價值合乎審計目標的數據。
(三)數據存儲。清洗過的數據采用分布式存儲的方式存儲在數據中心。
(四)數據分析。通過邏輯數據模型對清洗過的數據進行重構,形成多個數據倉庫,并在數據倉庫中進行存儲和管理,形成審計數據庫。審計數據庫使用多維數據模型進行數據建模,在基于云計算平臺的審計數據挖掘中,數據庫的訪問信息目錄由元數據提供,這個目錄可以精準的定位源數據和數據庫中的內容,也可以對數據倉庫服務器中的數據進行存儲和更新。
云平臺中的模型方法將輸入的原始數據過分析計算轉化為審計需要的信息,以發現審計線索或支持審計取證。從云平臺獲取處理過的審計數據,根據正確的設定值計算,判斷審計業務的性質。在對其進行確認驗證后,得出具體審計結果。
(作者單位:陜西省審計廳)