詹明惠(南京審計大學 江蘇南京 210000)
近年來,經濟高速發展引發的環境質量問題引起了各界的廣泛關注。在大力推進生態環境監測體系和監測能力現代化背景下,我國環境空氣質量監測體系不斷發展和完善,基本實現了對環境空氣污染物的逐時自動監測。環境空氣質量自動監測點位的自動化、精細化,對自動監測信息系統的完整性、有效性、一致性、可比性等提出了更高的要求。因此,開展環境空氣質量自動監測信息系統審計勢在必行。
大數據可視化分析技術是目前大數據審計應用比較成熟和主流的技術,它拓寬了傳統的數據圖表分析,把復雜或抽象的信息以直觀形象的方式呈現出來,有助于審計人員快捷高效地處理和分析數據。R語言作為一款免費、開源以及具有強大的數據可視化功能的工具,受到國內外高校、研究機構,以及金融、醫學、通訊等行業的廣泛應用。本文以R語言為工具,根據環境空氣質量自動監測信息系統風險審計的需要,選擇了動態時間序列圖、日歷圖、熱力趨勢圖等可視化圖形,研究如何有效利用大數據可視化分析技術審計環境空氣質量自動監測信息系統、有效發現潛在的信息系統風險、提高審計效率效果,在理論經驗與技術方法上具有一定的意義。
環境空氣質量自動監測信息系統采用自動控制技術、分析技術、通信和計算機軟件技術,可對環境空氣中特定指標從樣品采集與處理、分析到數據傳輸全過程實現自動處理。系統主要由監測設備、數據采集傳輸及查詢發布系統組成。國控站點產生的監測數據經過系統軟件直接傳輸至監測總站。省控、市控監測站點由各級行政主管部門負責管理。
基于大數據可視化分析技術的環境空氣質量自動監測信息系統審計的原理可概述為:根據對被審計單位的調查,在訪談和現場觀察等基礎上,采集被審計單位的環境空氣質量自動監測信息系統相關信息,如運維機構的日常巡檢記錄和績效考核報告、自動監測站點檔案、空氣質量日均值監測數據和小時監測數據等結構化和非結構化數據,以及從外部相關監管部門網站或其他網站上公開數據源采集來的數據,如監管部門出具的相關通報、處理處罰通知等。然后,在審計大數據預處理的基礎上,基于“總體分析、發現疑點、分散核查、系統研究”的審計思路,利用大數據可視化分析技術,從數據連續性、完整性、可比性、一致性、相關性等多個角度,快速從被審計大數據中發現異常信息,檢測是否存在信息系統風險情況,獲得審計線索。在此基礎上,通過對這些結果數據做進一步的延伸審計和審計事實確認,最終獲得審計證據。
審計人員在開展環境空氣質量自動監測信息系統風險審計過程中,可按照國家環境部及各級地方政府對環境自動監測管理的監管要求,關注以下內容:
根據空氣質量自動監測系統日常運行維護的基本要求及有關規定,環境空氣自動監測系統應連續運行。
以Z市為例,審計人員采集了全市6個國控站點2017年全年空氣質量日均值監測數據,是含有日期(date)、監測點(mark)、可吸入顆粒物 PM10、細顆粒物 PM2.5、二氧化硫(SO2)、二氧化氮(NO2)、一氧化氮(NO)、氮氧化物(NOx)、一氧化碳(CO)、臭氧(O3)等多個變量的表格數據。
首先在R語言中查看數據結構,如圖1所示,發現站點5在2017年的全年日數據僅為337條,數據量存在明顯缺失。在宏觀把握的基礎上,審計人員可采用動態時間序列圖查看站點5全年數據的具體分布情況。如圖2所示,動態時間序列圖的橫軸表示日期,縱軸表示污染物監測濃度,用不同顏色的折線代表不同污染物的日濃度,拖動橫軸下方的按鈕可以縮小時間間隔,鼠標停留的位置會出現日期及各污染物濃度數據的懸浮標簽。通過對動態時間序列圖時間間隔的拖動,發現站點5缺失了2017/1/16—2017/2/12的監測記錄,缺失日期長達26天,不符合監測設備連續運行的規定。審計人員可以通過這一分析,重點核實站點5在監測期間記錄缺失的原因、是否在主管部門備案,通過查看站點故障檢修記錄或者監控視頻記錄,獲取審計證據。

圖1 國控站點監測連續性分析

圖2 動態時間序列圖
審計人員首先整體分析2017年6個國控站點各監測物全年數據的完整性情況,通過圖3發現:監測站點對于臭氧(O3)的監測效果最好,不存在數據缺失的情況;對于一氧化氮(NO)的監測,各站點均存在較多缺失。審計人員應調查這些監測站點缺失較多一氧化氮(NO)數據的原因,考慮是否存在監測站點設備故障或監測不靈敏的風險。且觀察圖3可以發現,在個別日期存在監測站點只能監測到臭氧濃度而其他污染物數據均缺失的情況,審計人員應重點關注這些日期,查看是否存在監測設備受到人為刪除數據記錄或數據傳輸故障的風險。采用上文提到的動態時間序列圖可以確定審計線索出現的時間,通過拖動時間序列圖縮小時間間隔,如圖4所示,發現2017年9月7日存在只監測到臭氧數據而其他數據缺失的情況,審計人員可以將審計的范圍精確到該日期,縮小審計區間,提高審計效率。

圖3 數據質量完整性檢驗

圖4 動態時間序列圖查看日期
審計人員可以通過污染物之間的邏輯關系判斷數據的有效性。《環境空氣質量標準》(GB3095—2012)將PM10定義為空氣中小于等于10μm的顆粒物,也稱可吸入顆粒物;將PM2.5定義為環境空氣中小于等于2.5μm的顆粒物,也稱細顆粒物。從該定義來看,PM2.5屬于PM10的一部分,在同時同地測量的PM10濃度應大于PM2.5濃度,但實際測量數據中偶爾會出現PM2.5濃度大于PM10濃度的情況,俗稱“倒掛”。審計人員可以通過雙向柱狀圖可視化表示污染物濃度的差值,查看是否出現“倒掛”這種數據失效的情況。如圖5所示,橫軸表示時間,縱軸表示PM10與PM2.5的差值,向上的柱狀圖表示差值為正,向下的柱狀圖表示差值為負,即出現“倒掛”現象,數據失效;鼠標停留的位置會出現日期及各污染物濃度差值的懸浮標簽。圖中顯示2018年10月2日出現“倒掛”情況,差值為59,審計人員可重點核實監測儀器運行故障記錄,查看運營機構對設備的定期維護記錄等。

圖5 雙向柱狀圖
由于國控、省控、市控監測站點的自動監測信息系統的負責層級不同,國控站點產生的監測數據直接傳輸至監測總站,而省控、市控監測站點由各級行政主管部門負責管理。審計人員可以通過對比監測站點的經緯度信息、位置信息,選擇位置相同或相近的監測站點比較監測數據,判斷監測站點是否正常運行,揭露環境監測數據弄虛作假的行為。
以Z市為例,首先,審計人員通過對比監測站點經緯度信息,確定國控站點1與某市控站點安裝于同一位置,具有較強的可比性。審計人員對采集到的國控和市控監測數據的最大值、最小值、平均值、中位數、95%分位值、缺失值數據量及占比這些統計量進行了統計特征可視化展示,如圖6所示,對比發現,國控站點一氧化氮(NO)缺失值較市控站點多;對于臭氧(O3)的監測,國控站點的監測數據明顯高于市控站點。針對這一分析結果,審計人員可通過動態時間序列圖分析一氧化氮(NO)缺失的期間并進一步查找缺失原因。審計人員可重點關注臭氧(O3)監測數據的差異。

圖6 國控、市控站點可比性檢驗
日歷熱圖可以將時間分解為年、月、周、日等組成部分,以日歷的形式進行可視化展示,并通過顏色來表示某一監測值的數量大小或事件發生頻率。如圖7所示,左方部分表示國控站點的情況,右方部分表示市控站點的情況,兩個部分均按月分為12個區,各區中的每一行表示一周的情況,每1個小方塊表示1天,方塊中的顏色表示臭氧(O3)的濃度,由I到V表示的濃度水平越高,顏色也就越深。通過對日歷熱圖上不同月份的比較,可以看出夏季的臭氧(O3)濃度明顯高于冬季;通過對國控和市控站點的情況進行比較,可以看到國控站點的監測值普遍高于市控站點監測數據一個等級。此外,通過日歷熱圖還可以清楚地看到哪些天臭氧(O3)濃度超標以及存在缺失情況,審計人員可以通過這些線索有針對性地進行調查。

圖7 日歷熱圖對比檢驗
位置相鄰或相近的監測站點在污染物濃度變化趨勢上應具有一致性,審計人員可以獲取位置相近的監測站點的逐時監測數據,通過時間變化趨勢圖發現審計線索。如下頁圖8所示,將同一行政區域內4個站點的PM2.5監測數據通過時間變化趨勢圖表現出來,橫軸表示月份,縱軸表示小時,顏色表示污染物濃度。可以看出,冬季的PM2.5濃度明顯高于夏季,早晚的PM2.5濃度明顯高于中下午。此外,從圖8中還可以看到,站點1所監測區域PM2.5的濃度有明顯好轉的趨勢,尤其是11、12月較其他三個站點的變化趨勢不符,不符合區域一致性的假設。審計人員應關注此現象,防止該站點監測設備被人為干擾,導致數據失真風險。

圖8 PM2.5時間變化趨勢
環境科學研究表明,污染物之間存在一定的邏輯關系,就濃度值來說,PM2.5/PM10比值較高且相關性較好時,區域污染以細顆粒物源排放為主;PM2.5/PM10比值較低且兩者相關性較差時,區域污染以揚塵污染為主;若局部環境以工業燃燒(如燃煤發電、金屬冶煉等)等固定污染源為主時,SO2/NO2比值較高;反之,以機動車尾氣排放等移動污染源為主時,則SO2/NO2比值較低;等等。審計人員可以通過污染物之間的邏輯關系來發現污染物之間比值的時間變化規律,審查該監測區域的環境空氣治理目標是否與污染物排放源一致。
以某國控站點為例,如圖9所示,橫軸表示時間,縱軸表示污染物比值,其中PM表示PM2.5/PM10,SN表示SO2/NO2。PM在1月、3月及11月出現高峰,2月、8月出現次高峰;SN在1—6月比值較高,7—12月比值較低。說明該監測區域秋冬季節燃煤采暖過程中除產生大氣顆粒物外,同時排放的大量SO2等氣態污染物,更有助于二次PM2.5的生成。審計人員應核實該監測區域的環境空氣治理目標是否與火電、燃煤等有關。

圖9 污染物比例關系時間趨勢
審計人員可調閱監測站點日常維護與巡檢的記錄,檢查空氣監測子站巡檢記錄表、儀器運行檢查/校準記錄表、儀器精密度/準確度審核記錄等記錄表是否符合國家規定的要求。檢查運維人員是否接受過技術能力培訓,并通過了中國環境監測總站組織的考核。檢查儀器精密度/準確度審核人員是否與儀器日常操作維護人員權限分離。
生態環境監測是生態環境治理的保障,監測數據質量是生態環境監測的核心。本文以環境空氣質量自動監測信息系統為例,利用大數據可視化分析技術,從數據連續性、完整性、可比性、一致性、相關性等多個角度,探討了環境空氣質量自動監測信息系統的審計方法及可行性,防范自動監測系統風險,全面提升監測質量。