汪 倩 上海對外經貿大學
資源環境審計的歷史在我國較短。由于我國地理范圍廣闊,地形分布復雜多樣,更是加大了資源環境審計的難度。2019年,南京市審計局在南京市水資源保護政策落實情況專項審計調查項目中,面對審計對象多、審計事項復雜、數據和審計資金量大的特點,積極采取“雙主審、雙方案、雙報告”的組織模式,深度融合大數據審計手段,取得了一定實效。2020年,江蘇省揚州市審計工作就將水資源審計作為資源環境審計的重中之重。揚州市審計局發布了多個加強資源審計的方案,并要求以“五個強審”行動計劃為引領,深入推進水環境審計高質量發展。
水資源審計是水資源保護與治理中重要的一環。水源質量的高低不僅會直接影響到居民的身體健康,也會對經濟社會的健康可持續發展產生重大影響,由此可見,水資源保護與治理對整個社會的發展的重要性。水資源審計單位可以作為社會獨立機構,審計相關環保部門的資源保護的效果以及污水治理資金是否得到恰當有效的利用,其具有一定的監督評價力度。由于,我國水資源審計發展歷史較短,還存在一定的局限性。例如,審計人員的教育背景傾向財會方向,對環境資源相關的知識不了解。大數據可視化技術可以快速處理環境質量檢測,污水排量與超標因子等統計數據,形成易于理解的圖形,便于審計人員從探求數據背后的規律和潛在問題。筆者結合大數據環境下基于數據可視化技術的電子數據審計方法(陳偉,2017),我國水資源審計的現狀與未來探討(耿建新,2018),研究基于數據可視化技術的水資源審計方法。
近幾年,大數據在我國計算機學科方面引起國民的高度關注,掀起了一股“人人都在學Python”的熱潮。其中,大數據可視化技術是指利用工具對數據進行處理分析,用直觀的圖表向讀者展示最關鍵核心的信息,同時也便于讀者發現隱藏在大量數據中的異常數據。在互聯網時代,我們每天可以及時有效的接受到各種各樣的信息數據,那么如何在海量的信息中,最便捷直觀的向讀者輸出關鍵信息,成了一大難題。而大數據可視化技術正好滿足這個要求。例如,在新冠疫情蔓延全國各地時,我們手機每日按各地區分類上報的新冠疫情感染人數的圖表,就是大數據可視化技術的結果,它可以直觀清晰的讓我們獲取相關的信息,以及近段時間數據的變化趨勢,也能為預測未來近期的趨勢提供相關有效數據。其次,在市場調研工作中,經常需要使用到大數據可視化技術,其可以有效的將市場產品相關的數據進行處理,用多樣且具有藝術形態的圖表來體現核心思想,這使得向客戶的市場匯報具有一定的趣味性,同時又簡潔明了,便于工作中思想的有效交流傳達。
在獲取可視化圖表之前,我們首要工作就是進行數據挖掘。行業報告和政府數據通常是需要自己在網上爬取相關數據。專業人士會選擇Python,但是市場也存在零代碼數據挖掘工具,例如造數。國內爬蟲軟件如Gooseeker,八爪魚等。數據處理好后,我們就可以進入可視化圖表制作了,其工具有BDP,Python等。由于Python相對與R語言要簡單,且是開源軟件,本文根據水資源審計需要,以Python為例,分析折線圖,詞云圖等可視化技術。
1.被審計單位的內部數據
其主要包括兩類,一是體現被審計單位自身經營狀況的文書報告,如水利工程建設,省市重點排污企業名單,各地區用水量以及飲用水質量檢測標準等,便于審計人員開展相關審計工作。二是水資源存量與質量相關的具體數據,如飲用水安全與污水基礎設施,污水排放標準。針對水資源審計工作的內容,重點關注飲用水安全情況與污水排放治理工作等。
2.被審計單位的外部數據
審計人員所需的外部數據具體包括水質自動監測系統數據,地區企業用水數據。全國部分地區設置的水質自動監測系統,及時有效的為水資源審計提供大量的較準確的數據,節約了大量的審計采集數據的時間,形成較完整的數據采集,分析,預測和決策系統。審計人員基于各地區有關部門制定的污染排放標準、企業用水數據和相關環境政策法規,結合相關污水基礎設施資金的運用情況,環保資金是否得到恰當的使用。另外,審計人員可以使用爬蟲工具在環保部門網站上抓取需要的水資源質量檢測數據,如《xx省水資源公報》《xx省水利發展統計公報》《xx發展年鑒》以及巡測資料和水文站實時監測成果。
審計人員結合大數據可視化技術進行審計時,首先要確認進行可視化分析的目標。通俗的話,一個具體的審計對象或審計目的的提出,其實就可以對應一個數據可視化的主體。確定數據圍繞的審計目的后,就可以獲取相關數據,選擇合適的工具將數據進行整理清洗,用合適的圖表將數據展示出來,最后將可視化的結果作為企業決策的依據。通常來說,我們可以把這個過程概括為三個階段,即采集、分析、應用。
在第一階段,審計工作人員是到審計現場獲取進行可視化分析時用到的有效數據。數據來源可以是業務檢測系統,例如水源質量監測數據。傳統方式上獲取的數據來源于財務室相關的財務會計信息和管理部門發布的相關水污染防治工作情況的報告等。
當我們收集到數據后,需要對數據進行預處理,將沒有意義的數據和錯誤的數據剔除。數據分析階段是根據我們的審計具體目標,選擇合適的圖表,進行統計分析,數據透視,地理分析等多種操作。
通過分析后會得到我們的數據可視化結果,通過對呈現的可視化圖標進行觀察,發現差異,獲取審計線索。進一步對異常數據進行延伸審計,最終獲取審計證據,以期發現水資源管理中存在的問題并提出優化建議,從而促進水資源健康,可持續發展。
本文以建設飲用水安全工程,加強水污染防治工作為背景,從水資源數量和質量上總體把握,以地下水源豐富,河湖眾多,水系復雜的xx省水資源審計為例,結合環保政策法規,考察xx省2017—2019年期間水質變化與水質污染源數據情況,探究大數據可視化技術在水資源審計中的具體應用。現已獲取xx省2017—2019年水質均值檢測數據,2019年國控重點排污單位自動監控超標數據等。目前,大數據分工具主要包括商業化軟件工具和開源的、可編程的工具。本文使用在國民圈大熱的大數據可視化分析軟件python,進行可視化分析。
1.文本與文檔可視化分析
文字是傳遞信息最常用的載體。在浮躁的當代社會,人們少有耐心讀面前大段文字,經常是掃幾眼文章中的配圖。這體現了人們對圖片的接受程度要比枯燥的文字要高很多,此時就出現了另一種更高效的方式,即文本可視化。文本可視化處理的對象是文字,借助數據可視化的邏輯框架,通常運用編程軟件,將復雜大量的枯燥文本內容,用有趣的圖表形式,將文本中的抽象的難以發現的現象規律展示出來,給人們一定的視覺沖擊感。
詞云是文本可視化分析技術的典型的結果形式,最先由美國一名副教授提出,是最新的,網絡流行的傳播方式。在新浪微博上,我們可以經??吹酱笮〔灰粯樱l率不一樣的文字的圖片,卻其中一段文字在大量文字中異常顯眼突出,讓我們過目不忘,這就是詞云的效果。為了在大量文本信息中突出關鍵文本信息,給予視覺上的沖擊,讓讀者一眼就能抓住文本的核心內容。其廣泛應用于報紙,雜志等傳媒和互聯網行業。
2.全省水質月報數據變化分析

圖1 2017—2019年水質自動檢測數據達標率變化情況
為了從整體上把握被審計地區水資源質量情況,審計人員首先應該采集相關水質檢測數據和收集相關的文件公告。此時,面對環保部門官網的實時更新的質檢數據,可以借助前文提到的爬蟲軟件。在此基礎上,借助Python工具,采用折線圖分析,從而有效清晰地分析水質變化情況。例如,2017—2019年水質月報數據變化分析情況,分析結果如圖1所示。其中,三條顏色不同的折線分別為集中式飲用水水源地,太湖流域重點斷面,南水北調控制斷面水質的月達標率。
由圖1可以容易發現太湖流域重點斷面水質達標率在近三年較平穩上升。2016年太湖流域遭受特大洪水災難,這對太湖流域斷面水質有直接影響。據被審計單位相關重點水利工程建設進展文本信息,可知于2017年、2018年,政府分別對太湖治理工程新溝河先后完成投資39 359萬元和9 400萬元,2019年完成太湖治理工程投資194 694萬元。圖線直觀的上升趨勢在一定程度上肯定了被審計單位關于加強太湖流域水資源保護和水污染防治,保障防汛等工作進展的情況。其中,集中式飲用水水源地水質,檢測的達標率控制在90%與100%之間,可以體現出飲用水安全管理工作進行的較好。另外,圖示很明顯的異常點是2019年8月,南水北調控制斷面的水質達標率低到了40%,水質情況屬于比較惡劣,需要引起審計人員的注意,應當及時進行調查,從而發現原因是由于自然災害,相關工程項目沒有實施到位,或者是自動檢測設備傳輸的數據異常問題,從而發現影響問題的線索。
3.全省國控重點污染源數據分析
為了解XX省2019年的國控重點污染源自動檢測數據超標情況,審計人員可以借助編程工具進行建模,計算該期間排放超標的企業名單頻次情況;在此基礎上,按年度對所有排放超標企業名單生成詞云圖進行分析。詞云不僅可以用于展示標簽,還可以展示更為復雜的文本信息,目的是給予使用者直觀的視覺感受,便于使用者抓取文本中的關鍵信息。詞云中字體的大小表示企業在2019年度重點排污單位自動監控數據超標公示表中出現的次數情況。圖2的分析結果表明:xx省2019年重點排污超標單位有實聯化工有限公司、宿遷市群英紡織印染科技有限公司、連云港晨興環保產業有限公司、盱眙北控水務發展有限公司等。這些單位在2019年12次重點排污單位自動檢測數據超標公示表中出現了至少六次以上。這些企業是污水排放的重大風險點,也是今后政府審計需要督促內部審計進行經常評價并報送的重點企業。政府審計可針對這些企業建立名單,并要求內部審計定期報送具體評價結果,從而給出可能的處罰措施;另一方面,也可以發現行業中污水治理比較好的企業,以便將其治理方案在行業中傳播,達到降低整個行業污水排放的目的。

圖2 重點排污單位內容分析
審計人員可以將這幾個公司納入重點審計對象,對排污數據超標因子進行進一步的延伸取證。抽離出重點排污單位,對其進入深入分析。審計人員可以發現:盱眙北控水務發展有限公司的超標因子為COD。COD出水濃度指標可以用來衡量污水對周圍環境的污染情況,COD出水濃度排放標準為50mg/L(國家標準),在2019年后半年,該公司顯然遠超出平均超出排放標準。在10月份,COD出水濃度更是排放標準的10倍,是六月份超標濃度的近3倍。此時,審計人員可以對污水治理資金以及相應排污處罰措施進一步分析,從而也可以為審查相關監督機構的環境保護項目的績效審計獲取證據。
基于數據可視化技術的水資源審計過程中,結合地域特點,以水資源生態環境為審計重點,在時間緊,任務重的情況下,堅持嚴謹盡職的審計工作態度,嚴格執行現場管理辦法,及時通報審計進度和發現的問題,加強對審計獲取的證據進行分析,提高大數據環境下水資源數據的使用效果。我國水資源分布地理范圍廣闊,因此審計的覆蓋范圍廣。同時審計需要的時間長,取證難度大,以及數據繁雜等特征都促使審計方法創新。與此同時,利用大數據可視化技術開展水資源審計可能是一種可行性研究方法。本文基于現實的需要,利用python探索了如何在水資源審計中應用大數據可視化技術,并通過案例具體分析?!?/p>