陳大偉
摘要:目前,金審三期工程正在快速推進,大數據審計系統也將在全國審計機關推廣應用。面對審計大變局,文章以Hadoop技術為例,論述大數據技術與大數據審計的關聯,基層審計機關面臨的問題及應對建議。
關鍵詞:大數據;技術;基層審計
2014年10月國辦發布的《國務院關于加強審計工作的意見》(國發[2014]48號)第十九條首次明確提出在審計中運用大數據技術推進審計信息化工作。2018年全國審計工作會議提出大數據審計是今年重點工作之一,明確了各級審計機關開展大數據審計是審計工作的重點內容之一。大數據審計是審計信息化工作的發展方向,下文將從大數據技術角度出發,淺析基層審計機關在大數據審計發展中遇到的困難及應對設想。
一、大數據與大數據技術
什么是大數據,具體多大量的數據才能稱之為“大”呢?一般認為,大數據的數據量級應該是“太字節”(TB)的,但麥肯錫全球研究所認為,隨著技術的進步,這個量級在不斷增大,對于各個不同的領域,“大”的定義也是不同的,無需統一。
一般而言,大數據技術可以分為4個層面:數據采集、數據存儲和管理、數據處理與分析、數據隱私和安全。數據采集層面,主要運用ETL工具將數據源中的數據抽取到數據集市或數據倉庫中,提供聯機分析處理和數據挖掘數據。數據存儲和管理層面,主要運用分布式文件系統、NoSQL數據庫、關系數據庫、數據倉庫等技術實現數據存儲和管理功能。數據處理和分析層面,主要運用分布式并行編程模型和計算框架,實現對海量數據的處理和分析,并以可視化的方式直觀呈現易于理解的分析結果。在數據隱私和安全層面,通過構建隱私數據保護體系和數據安全體系,保護個人隱私和數據。
開展大數據審計,將大數據技術的4個層面運用到審計中去,能很好解決現行審計中遇到的一系列問題。
在審計的數據采集過程中運用大數據技術,能夠解決從同級政府部門采集數據難,統一的數據采集避免的政府部門間的數據壁壘。解決采集數據內容確定的難點,統一的數據采集有明確的數據內容、格式,避免數據采集的盲目性。
在審計的數據存儲與管理中運用大數據技術,將數據集中到省級數據中心存儲與管理,可以消除基層審計機關的數據存儲物理設備成本,降低數據存儲和管理的軟件購置成本,減少基層審計機關對數據存儲和管理的人力資源投入。
在審計的數據處理和分析中運用大數據技術,可以提高審計質量。統一分析能避免因為分析人員能力差異形成的分析質量參差不齊,有助于滿足人民對高質量審計報告的期盼。統一的數據處理分析能快速生成審計疑點,避免現行審計過程中花費大量時間進行的數據分析工作,提升審計效率。
在審計數據隱私和安全防護中運用大數據技術,能避免數據分散儲存帶來的安全風險,通過大數據中心的數據安全防護體系,可以避免傳統數據分散儲存個人電腦產生的數據丟失、泄露風險。
二、基層大數據審計的困境
(一)大數據審計系統復雜、架構龐大,要深入理解困難。大數據審計是大數據技術在審計中的應用,相比傳統計算機審計技術,它的設計理念先進、系統架構龐大、技術組成復雜。
以目前主流應用的Hadoop系統為例,它的核心組件包括HDFS、YARN和MapReduce三個部分,將整個系統劃分為三層。HDFS是底層,用于文件的分布式存儲和管理;YARN和MapReduce是中間層,YARN組件用于資源管理和調度,MapReduce組件用于分布式計算;其他各種功能組件構成系統的最上層,如組件Pig提供了類似SQL語言,允許用戶編寫簡單腳本實現數據分析,組件Hive提供數據倉庫功能,組件HBase提供了非關系型的分布式數據庫,各功能組件與核心組件一道構成了Hadoop生態系統。
(二)大數據審計是全新的領域,學習應用存在困難。金審工程三期的總體思路是“統一規劃、兩級部署、以用為本”,數據不在本地存儲,需要使用網絡開展數據分析處理,全新的審計方式需要通過學習才能掌握,對基層審計機關來說,因為人員素質背景的不同,會存在學習障礙。
(三)保障審計數據安全,需要合理規劃數據權限。大數據審計系統提供了大量數據,系統運行后,當上級機關將數據訪問權限授予基層審計機關,合理規劃審計人員的訪問權限,達到既完成數據分析,又防止超范圍數據授權,最終完成審計工作,是基層審計機關面臨的又一難題。
三、基層大數據審計應對設想
(一)構建大數據審計團隊,深入理解系統。筆者認為,將同一地市的審計機關組織起來,由各縣市共同組建技術分析團隊不失為一種有效辦法,具體方式有虛擬團隊或同地辦公。
1.虛擬團隊。由各縣審計機關安排1到2名計算機人員加入團隊,通過網絡定期進行學習交流,完成團隊建設。團隊負責深入理解大數據審計系統,實現系統各項能力的深入挖掘,并將知識經驗傳遞給本單位其他人員,加快新系統的應用推廣,充分挖掘大數據審計系統價值。
2.同地辦公。由市局負責組織,從各縣抽調1到2人加入團隊,職責同虛擬團隊。兩者區別在于同地辦公能夠將更多的時間用于深入系統學習和困難問題解決,同時避免干擾、有利于團隊快速成型。
(二)提前培訓,避免陌生感。基層審計機關從現在開始,有目的的組織本單位人員開展大數據知識的培訓,提前熟悉大數據技術原理,消除陌生感。
在培訓過程中,一要明確學習了解大數據技術是培訓需求,之后的培訓計劃、培訓活動均圍繞此需求展開;二要制訂培訓計劃,明確培訓的目標、人員、內容、方法與資料等;三要進行培訓效果評估,通過發放評估問卷了解參與人員的滿意度,通過考試、演示、講演、討論等方式了解學習成效。
在培訓過程中,培訓方法選擇要符合工作實際。大數據技術是一項前沿技術,培訓師資相對緊缺,采用傳統的講授法、案例教學法代價高昂。例如:在組織學習“審計大講堂”課程時,將與大數據技術有關的具體內容進行分類匯總,進行二次消化吸收;從網絡尋找適合的培訓課程,組織員工進行集中或分散的學習,并定期或不定期開展交流,提升學習效果。
(三)制訂審計數據的安全管理措施,實現數據安全流轉。信息安全的根源有兩個,一是技術,二是管理。大數據審計系統實行統一開發、兩級部署,基層審計機關保障數據安全責任主要集中管理上,可以通過制定相應的管理制度來保障數據安全。
1.審計項目根據需要,確定數據授權。根據最小化原則進行數據授權,非工作必須的數據不予授權,非工作必須的人員不予授權。具體來說,一要根據審計目標確定數據授權范圍,明確所使用數據的時間范圍、地域范圍;二要根據審計組人員,明確授權對象及相應權限。
2.制定數據查詢規程,明確授權審批。一要明確流程,使項目組了解數據權限申請報批流程;二要確定單一的授權審批人員,避免多頭管理、使數據授權流于形式;三要對授權制度進行跟蹤,及使調整不恰當的規定,保證規程的可用性。
3.根據人員變動情況,及時調整授權。一是審計組人員變動時,及時調整人員的數據權限;二是審計項目結束時,及時關閉項目組數據權限;三是人員調動或離職時,應將該員工的所有權限予以凍結或注銷。
四、結語
大數據審計是國家審計發展的一個新階段,大數據審計將使全樣審計變成可能,統一審計方法提高審計效率成為成為現實,大數據技術的發展將為國家審計插上騰飛的翅膀。大數據審計是基層審計機關的挑戰更是機遇,只要抓住機遇迎難而上就能創建審計更加輝煌的明天。
參考文獻:
[1]林子雨.大數據技術原理與應用第2版[M].北京:人民郵電出版社,2017:14-33.
[2]涂子沛.大數據[M].廣西:廣西師范大學出版社,2012:51-68.
[3]安德魯·錢伯斯,格雷厄姆·蘭德.運營審計手冊[M].劉宵倫,朱曉輝,譯.北京:電子工業出版社,2012:98-121.
[4]葛正鵬.人力資源管理[M].北京:科學出版社,2006:162-180
[5]胡澤君在“金審工程”三期建設推進培訓會上強調以信息化建設推動新時代審計事業新發展[EB/OL].http://www.icnao.cn/news/news/content/2018-04/08/content_18666.htm.