李永娣
(河南省統計局科研所,河南 鄭州 450008)
大數據在云計算的基礎上,借助信息存儲、信息分享與數據挖掘,把海量、高速、多元和多變的終端數據存儲在云端,在對其進行分析計算之后能夠尋求到解決問題的有效途徑。為了讓經濟社會的發展與大數據產業進程保持一致,國家制定并出臺了諸多與之相關的發展戰略與發展規劃[1]。尤其對審計行業來說,由于大數據、云計算、物聯網、4G 通信等新技術、新產業和新應用的持續涌現,該行業的信息系統變得越來越復雜,數據量不斷增加。此時,紙質賬冊形式的審計已無法滿足現實需要,借助大數據技術開展審計工作已經勢在必行。期間,電子財務數據與業務數據是十分重要的兩類數據,而一旦審計對象的信息化程度較高,就會由于數據統計分析難度較高而讓審計工作面臨諸多困難。
一段時間以來,大數據和云計算、物聯網、移動互聯網等技術一道,共同對全球經濟社會生活帶來了巨大沖擊[2]。在審計數據統計領域,大數據在為其提供了諸多新技術與新方法外,還對審計組織、審計人員提出了全新的要求——不但要把握大數據技術的內容和特征,讓審計技術與審計方法得到進一步發展,還要借此提高審計數據分析的水平與效率,最大限度拓展審計數據統計分析的應用范圍。
從2009年開始,“大數據”的概念逐漸開始在經濟領域傳播,而其真正變得火爆,是在2012年美國時任總統奧巴馬宣布了“大數據研究與開發計劃”之后。一般認為,這一事件是“大數據”時代真正開始的關鍵標志,也認為人類社會開始進入到了大數據場域之中。“大數據”也被稱為巨量資料,指的是所關聯的數據量規模極大,甚至難以借助當前的主流軟件工具加以度量,而一旦通過有效的工作在特點時間內對其進行收集、分析和處理以及轉化,就以得到幫助決策者決策的有價值的信息。在我國,互聯網數據中心對“大數據”下了如下定義,即為了更加經濟、更加有效地在高頻率、巨容量、異結構的數據體系內獲取價值,繼而設計出來的全新的架構與技術,然后借此描述與定義信息時代出現的海量數據。一般來說,大數據具有以下幾個顯著特征:第一,數據類型多,不但包括圖片、地理位置信息和視頻、網絡日志等,還包括音頻、動畫等多種形式;第二,大數據的價值密度較低,但其商業價值卻處于高位。如果對其進行深度開發,一定能夠從中獲得有價值的信息。也就是說,對大數據來說,任何單一的數據價值都較低,甚至可以忽略不計,可是一旦把大量數據聚集在一處,就能夠產生極高的商業價值;第三,數據體量無法估計,甚至可以從TB 級別躍升至PB 級別或者更高,如果對大數據的統計分析處理速度較快,就能改變傳統數據采集、處理與應用模式,也會因此而改變人們的思維范式。
大數據的本子是促使人們在搜集、處理與使用數據的過程中進行思維轉換,而這會對數據統計工作產生全新的影響,也會對相關工作提出新的要求:(1)在大數據背景下,人們很難發現事物之間的直接性的因果關系,需要深入認識并借助事物的相關關系才能發現問題的真相。而自古以來,尋找事物之間的因果關系已經成為人類發展進程中形成的不可更改的習慣。而到了大數據時代,人們可以把主要精力置于事物之間因果關系之外,對于因果關系的分析可以借助大數據技術進行。將其置于數據統計分析之中,更是能夠發現事物之間的相關關系。即借助某類事物之間的相關關系,能夠獲取事物的現在信息并預測未來,這對相關工作的開展是大有裨益的;(2)在大數據背景下,即便不通過抽樣分析,也能夠獲得并處理事物整體的所有數據。而實際上,自十九世紀之后,在處理較大樣本量的過程中,人們習慣借助抽樣的形式對總體進行分析。可需要注意的是,抽樣技術的出現是條件受限的結果,即在數據缺乏與獲得數據受到約束時,不得不采用的一類方法。而在今天,包括大數據技術在內的科學技術條件已經獲得了極大發展,借此可以對海量數據進行加工和分析。比如,可以借助大數據分析替換掉抽樣分析,讓數據統計分析工作突破抽樣調查與實證數據的局限,在大量收集過去難以收集到的數據之后,進行大數據分析,繼而獲得更多有價值的信息;(3)在大數據背景下,統計分析工作可以不必追求數據的精準度,而是追求其效率問題。這是因為,如果測量事物的能力受到約束,人們關注的問題就是獲取最精確的結果。也就是說,在大數據場域中,追求精確度變得不必要也不可行,在很多領域也不再受歡迎。在實際操作中,借助大數據分析技術,可以更為深刻的掌握事物的未來發展趨勢,提升數據的及時性與使用績效,讓統計人員能夠更加全面的認識事物的真相。
在大數據環境下,審計數據的規模更大、復雜度更高、數量更多,對其進行分析需要更有效的手段[3]。基于此,大數據時代的到來勢必會為審計數據統計工作帶來審計實踐、審計思維的變革,也會引發審計數據分析的深刻思考。當然,需要注意的是,審計機關除了要具備對大數據進行采集與存儲的能力,還要面對諸多挑戰,以便對審計數據進行高效分析與挖掘,借此發現更為直接的審計線索,尋求審計對策。

表1 河南省審計系統對大數據的依賴度(%)

圖1 河南省審計系統對大數據依賴折線圖
2018年3-5月,對河南省鄭州市、洛陽市等多地審計系統應用大數據(主要是對大數據的依賴程度)的現狀進行了調研。制定了《河南省審計系統大數據使用情況》的調查問卷。共針對審計系統領導、一線員工發放問卷360 份,各審計機關平均發放問卷20 份,共收回有效問卷342 份。經檢驗,問卷信度和效度均達到要求,有關結果如表1所示。
調查結果表明,河南省審計系統對大數據的總體態度以積極為主,高度依賴和一般依賴分別占到了26.8%和45.6%,但也有27.6%的審計系統領導和一線員工對大數據持“不依賴”的態度。這說明審計系統對于大數據的應用既有機遇也存在明顯的挑戰。但樂觀的是,從不同審計機關的數據看,無論對大數據“高度依賴”、“一般依賴”還是“不依賴”,它們所持的態度大體相同(圖1),這說明河南省審計系統對于大數據的應用正在推廣和普及,其積極效果在不同地區都有所顯現。
通過前文的分析可知,與傳統數據倉庫應用相較,大數據分析具備數據量大、查詢分析復雜等顯著特征,它注重把數據與業務流程、決策過程結合在一起,在進行實時分析之后能夠對業務產生更高價值。結合表1和圖1可知,在大數據背景下,審計數據統計分析工作會面臨以下機遇:(1)借助大數據技術對審計數據進行分析將能夠提升決策的科學性與準確性,促進預測預警與應急響應機制建設,更為有效的規范審計機構的經濟活動。審計人員能夠借助對歷年海量數據的統計和分析,挖掘出審計對象經濟活動的特征和規律,對相關違規違紀行為予以總結和歸納,這對審計機關的建章立制來說是大有幫助的,能夠為其提供更多有價值的參考信息;(2)借助大數據能夠更加科學的評估審計任務的執行效果,借此幫助審計機關不斷發現問題、分析問題和整改落實。更為重要的是,在審計數據統計分析工作不斷深化的過程中,審計分析會超越原有的數據分析模式,即在對純數據予以分析挖掘的基礎上,能夠完成對財務賬表、財務報告的深度挖掘,極大提升審計數據統計分析的效率和效果;(3)讓大數據參與到審計實踐之中,能夠極大增強審計數據分析的認同感。在我國,審計部門是一類綜合性的經濟監督部門,要始終根據數據說話。比如,在審計報告中,不論是綜合評價抑或是揭示問題,都要以數據做支撐。在大數據體系內,海量數據會以離散的形態存儲在不同信息系統內。借助大數據分析技術可以充分借助數據倉庫、聯機分析以及數據可視化等,對相關數據予以關聯分析與挖掘分析,借此科學評估資源的使用情況與法規的實施效果,這對得出更加客觀的審計結論是大有幫助的;(4)大數據以及得到了審計機構和審計對象的一致認同,這將在很大程度上提升審計實踐效果,讓審計統計數據分析的基礎數據獲取更為便利。近年來,我國審計機構不斷破除內部協同思想理念上的障礙,及時納入大數據思維,通過跨越系統、跨越平臺和跨越數據流結構的形式,讓審計數據實現了縱向、橫向流通。這樣一來,審計部門可以突破傳統“點對點”和審計對象聯網模式,只要在內部局域網設定了許可權限,就能夠直接查詢并借助數據信息,這不但極大節省了審計成本,還借助大數據技術提升了統計數據處理和分析響應的時間,讓審計效率得到了顯著提高。
結合表1和圖1可知,大數據在帶給審計信息化諸多機遇的同時,也使之面臨著前所未有的挑戰,主要體現在以下幾個方面:(1)審計機關是我國經濟社會安全運行的免疫系統,其工作職責當中除了要對已經出現的問題予以查處、修補外,還應對潛在風險予以及時揭示,最大限度的抵御風險。當然,更為重要的是,在大數據時代,審計人員需要對該新事物進行全面而深入的分析,以便在更高層面和更全范圍、更廣視角上為審計機關提供系統性、綜合性和前瞻性的審計建議;(2)在大數據時代,為了實現審計資源的統一規劃與綜合使用,需要以數據編碼與信息標準統一、彼此之間兼容互聯為基礎開展工作[4]。可是,因為相關制度依據的缺乏,部門之間的橫向協同難度較大,在傳統審計模式下形成的“信息孤島”無法為審計機關提供更多有價值的審計數據,使得持續性的審計變得十分困難;(3)面對體量巨大、種類繁雜的大數據信息源,審計機關在開展審計工作時,一方面要具備對海量數據進行搜集、分析與存儲的能力,還應以較快的速度對其進行分析與挖掘。但是,這一工作的開展需要審計人員從傳統社會的“經驗依賴”轉化成大數據時代的“數據依賴”,而這對審計人員及其數據處理能力來說是較大的考驗;(4)在大數據時代,審計業務流程主要以數據信息形式出現,資金流向一般都體現為數據信息流之間的交換,這就使得違規違紀行為更為隱蔽也更加多樣,任何數據變動都會帶來經濟損失。此時,之前的審計范式已經無法滿足需要,借助抽樣分析和單一的財務賬目分析也無法發現那些重要但微小的數據異常,單純這一工作,就對審計機關和審計人員提出了全新的、嚴格的要求。
按照經驗,審計技術與審計方法的發展都和科學技術的進步保持一致性。在大數據時代,審計技術與審計方法需要在原始查賬基礎上由低級到高級轉變、由不完備轉到更加完備的階段[5]。按照這一思路,當前乃至以后,基于大數據的審計數據統計分析工作除了要構建審計數據統計分析安全系統、深入挖掘審計統計數據信息外,還應充分融入統計學的思想與方法、基于云計算平臺開展審計數據統計分析,以便在審計抽樣技術、審計報告模式和審計證據搜集等方面做出更多成績。
在我國,需要在掌握大量關系經濟社會發展的數據之后才能開展工作,此類寶貴的數據資源如果出現了丟失或者產生了不必要的損失,就會對我國的經濟安全帶來難以挽回的負面影響,其后果不可估量。因此,為了保證審計數據資源的安全,需要以大數據為背景,全面了解審計對象信息系統的管理體系、組織結構、規劃設計和管理水平等屬性。其中,要對審計信息系統的數據資源進行重點調研,特別要清楚掌握審計數據庫中的項目、數量、功能等信息,并對統計分析軟件的版本、管理維護機構和訪問模式等進行分析,以此得到數據存儲與備份的關鍵信息。同時,還應關注審計統計數據和信息安全系統的建設問題,在不斷創新大數據審計技術研發的過程中,實現對敏感審計數據的監管工作,搭建起完善的審計數據安全體系。
已有的經驗表明,在大數據背景下,優化審計數據的掘取、存儲和處理以及應用水平,對提升審計效率、提高分析結果的精度具有十分積極的現實意義。一段時間以來,我國審計工作應用更多地為查詢型分析與驗證型分析,這種做法難以滿足深刻揭示經濟活動本質規律的現實訴求。因此,有必要引入大數據中的數據挖掘技術,即借助數據倉庫與數據挖掘工具對審計統計數據進行分析。期間,可以將回歸分析、聚類分析、關聯分析等方法和模型應用其中,然后借助數據挖掘技術,對上述數據進行分類、存儲和快速調用。這樣一來,不但完成了對審計數據資源的分析和整合,還通過數據存儲平臺的搭建,讓數據整理與研判機制更加完善,在實現重點數據庫兼容互聯的同時,讓審計數據分析結果更加精確。
基于大數據的審計數據分析應該借助統計學的思想與方法,讓數理統計技術應用其中,處理和解決審計數據分析問題。其具體做法是:(1)對審計數據中的離散點加以分析,發現其中的偏差,并將其視為審計工作的重點分析。接下來,要借助橫向和縱向邏輯分析與研究,對數據的特點、規律以及不對稱信息等進行分析,借此發現審計工作的新的突破口。比如,在納稅征管予以核查的過程中,應該分析該地區經濟產業結構的分布情況以及增減變動情況,借助大數據技術對納稅貢獻予以系統把握,這樣就可以得到更有價值的信息;(2)借助大數據技術對審計統計數據進行對比分析(尤其是異常數據)。比如,在對現金流趨勢進行分析的過程中,就可以借助定基法或者環比法等統計方法對變化規律進行觀察,以發現其中的異常變動情況。
通過大數據對審計統計數據進行分析時,需要構建與之相適應的云計算平臺,以此滿足審計人員對數據分析的訴求。當然,在數據審計的過程中,應合理借助云計算技術,使之能夠最大限度地避免審計人員的重復工作,降低其工作量。同時,要把審計信息錄入至云計算平臺當中,借助平臺系統軟件對審計數據進行統計、分類、分析與計算,以此得到海量數據中隱含的有價值的信息。此外,可以通過云計算的介入,讓審計數據實現跨空間運算,規避傳統審計數據分析方法的風險,解決軟件不兼容和格式不統一的瓶頸。如此一來,就可以最大限度地提升審計工作的網絡化水平與信息化程度。
作為一類企事業單位監督和管理的重要機制,審計對于經濟社會的發展和進步具有異常關鍵的現實意義。而在大數據環境下,越來越多的審計對象會在生產、經營和管理活動當中形成多種多樣的數據信息,借助大數據技術對審計數據進行分析和研判不但可以完成對數據信息的加工和整理,還能獲得傳統方法無法獲得的有價值的信息。因此,在將來,基于大數據的審計數據統計分析工作需要不斷提升其靈活性,在開展全面統計分析的同時,審計機構和審計人員要合理應用大數據分析模式和統計方法,成為審計數據分析最為重要的發展趨勢。