摘 要:自然資源資產是人類賴以生存的基礎,關乎每個人的切身利益。隨著可持續發展理論的深入,自然資源資產的管理和保護已成為黨和國家關注的焦點。2015年11月,中辦、國辦印發《關于開展領導干部自然資源資產離任審計的試點方案》。2017年6月,中央全面深化改革領導小組會議審議通過《領導干部自然資源資產離任審計暫行規定》。開展自然資源資產審計,是生態文明建設的必然要求,能夠促進合理開發和利用自然資源資產,維護自然資源資產的安全,促進生態文明建設。
關鍵詞:大數據;自然資源;資產
一、自然資源資產審計中運用大數據技術的必然要求
自然資源資產審計是一項全新的審計工作,國內外沒有先例,且不同于以往的常規審計工作,從審計方式到審計技術方法,都對審計人員提出了更高的要求。
(一)基于數據自身的屬性特點
事實就是數據,一切結論必須用數據來支撐。自然資源資產審計所涉及的時空數據十分復雜,有別于傳統審計,一是海量性,土地、水文、氣象等時空數據體量龐大,一些行業數據甚至需要超級計算機才能運行;二是異構性,數據類型既有Excel、SQL這樣的結構化數據,又有流文本、矢量圖斑、遙感影像、語音視頻這樣的非結構化數據;三是多源性,數據來源分散,存儲在國土、規劃、環保、水利、住建等若干個部門;四是隱蔽性,多部門數據之間的關聯規則關系,往往暗藏許多重要的審計線索。這樣的數據完全符合了大數據的典型特性,要求審計人員改變以往的數據采集理念和技術方法。
(二)基于數據分析的技術要求
自然資源資產審計關注的內容,是區域內大范圍、連續性分布的各類自然資源的現狀及其變化情況,有較強的時效性要求。在幾百平方公里到幾千平方公里的國土上,如何實現大面積的快速觀測,并保持統一的統計口徑,是一個難題。同時,土地測繪、水文監測、礦產勘探、海洋勘測等都是非常專業的領域,對于審計人員來說,如何對這些時空大數據進行分析,也是一片陌生“藍海”。在自然資源資產審計工作實踐中,傳統審計方法如檢查、詢問、函證以及常規計算機分析手段等,局限性相當明顯。只有采用全新的大數據分析方法,才能科學、高效地得到審計成果。
如胡澤君審計長所說:“今后審計的出路是科技強審,問信息化要資源,向大數據要效率。”秦博勇副審計長所說:“自然資源資產審計的試點工作要積極采用大數據技術,重點關注數據的分析,采用地理信息技術核實實物量和質量”。審計機關唯有技術創新,通過研究、探索,采用先進的大數據技術手段,才能開展好新時期的自然資源審計。
二、自然資源資產審計中運用大數據技術的總體思路
2016年以來,泰州市審計局牢固樹立大數據審計理念,積極探索基于時空大數據的自然資源資產審計工作,加大對自然資源數據的采集和分析,取得很好的效果。
我們的總體思路是:全方位、多渠道獲取自然資源資產審計數據,對所有結構化數據和非結構化數據進行集中存儲、集中整理,充分運用大數據分析技術、空間地理信息技術,達到“總體分析,發現疑點,分散核查,系統研究”的審計效果。在全省審計機關率先建設自然資源資產審計數據綜合分析系統,將各類行業數據統一時空基準,實現審計數據“一張圖”,方便的實現數據對比和分析,全面提升自然資源資產審計的信息化水平。
三、自然資源資產審計中運用大數據技術的主要做法
自然資源資產審計面臨審計要素多、覆蓋范圍廣、所需數據龐雜等問題,進行時空大數據的智能化分析是提高審計效率和質量的必要手段。最核心的兩個環節是數據采集整理環節、數據分析環節。
(一)數據采集整理環節
審計人員圍繞自然資源資產審計工作計劃,梳理出涉及行業的數據分布,包括業務數據、考核指標、文件法規、會議紀要等;摸清數據結構、存儲位置、信息系統以及數據庫類型、版本、數據量等,有針對性地做好數據采集、轉換和保密安全工作。涉及的行業數據主要有:
1.國土數據:土地利用總體規劃、耕地占補平衡動態監管數據、二調數據庫數據、歷年土地利用變更數據庫數據、基本農田保護圖斑數據庫、歷年土地利用現狀圖、遙感影像圖、城鄉建設用地增減掛鉤檔案數據、土地資源監測統計數據、礦產儲量數據等。
2.財政數據:土地、岸線、礦產等資源出讓金收支情況、污染防治專項資金收支情況、重大環境整治項目資金收支情況等。
3.林業數據:林業生態紅線地理空間數據庫、林業林地基本圖數據、林地利用現狀圖、林業總體規劃等。
4.水利數據:水利對象基礎信息數據、水系現狀圖、地表水和地下水監測數據等。
5.規劃數據:本級城市總體規劃、城市控制性詳細規劃、新城區規劃、污水管網布置等。
6.生態環保數據:大氣水文監測數據、重點排污企業監測數據、12369舉報電話記錄數據等。
7.測繪地理信息數據:基礎地形圖、影像圖、地理實體數據等。
審計人員從各部門采集回來的數據,體量巨大且類型繁多。對于Excel等結構化數據,可以通過ETL工具對數據進行采集、清洗、轉換、篩選;對于3S、圖斑、坐標位置等空間地理信息數據,則通過ArcGIS進行分類、清洗、歸納、融合;對于需要進行HDFS切分和MapReduce操作的流文本等數據,則通過Hadoop來實現。在審核整理中間表數據的基礎上,導入自然資源審計系統,為下一步的大數據分析做好準備。
(二)數據分析環節
審計人員對時空大數據進行分析與挖掘,揭示大數據的時間變化趨勢和空間分布規律。除了傳統的SQL查詢外,我們在實踐中應用到的大數據分析方法有:
1.自然資源資產總量核查法
審計人員通過時空數據分析,檢查區域內耕地、林地、濕地、海洋、沿江岸線、水面等實物量的總體以及分布結構情況;審查建設用地審批供應數量和結構,耕地和基本農田的總量和結構,建設占用、補充數量,沿江岸線占用企業分布情況,礦產資源規模總量等,主要以歷年國土部門地類圖斑數據分析。
2.自然資源變化趨勢核查法
審計人員通過影像圖斑、現狀圖斑等的不同年度數據的前后對比,分析區域內耕地保有面積、森林覆蓋率、濕地、水資源和礦產資源的分布變化情況,重點核查礦產、森林等資源的損毀,耕地、水域、濕地面積減少,生態環境污染加重等問題;客觀分析在資源使用效率、環境污染控制中存在的不足和問題,評估變動受人為因素和自然因素的影響程度。
3.多時相變化疑點核查法
審計人員利用地理信息技術、遙感技術和衛星定位、測繪技術,對分片區域中自然資源資產增量、質量,監測出審計年內和年度的變化信息及自然資源資產空間分布特征和動態變化情況。結合自然資源資產管理相關部門的規劃指標性數據、業務數據和相關技術指標,通過數據挖掘,多維度分析等,發現違規填湖、侵占濕地、違規占用河道、違規變更占用林地等疑點區域,進而進行核查。通過對空氣、水質量前后數據變化,如熱力圖分析,可以客觀分析變動受人為因素和自然因素的影響程度,以及核查是否存在人為因素造成空氣、水質量嚴重下降、大氣污染防治任務未完成等問題,從而準確界定被審計領導干部應承擔的責任。
4.詞云詞頻分析法
審計人員充分采集會議紀要文檔、12369投訴信息等電子文本,運用R語言分析把握各地區主要污染投訴情況進行分類,針對性的核查投訴較多區域污染治理情況等。
審計人員運用Python語言對數據進行可視化分析,依據重要性水平突出重點關鍵詞,總體把握該地區會議紀要中決策的重點項目和內容,關注領導干部任期中,是否對生態環境保護重視,有無重大生態事故等。
也可以通過SOL核查會計憑證庫中摘要有無高爾夫球場、樓堂館所、土壤修復、環境污染等敏感性詞語,有無協議、劃撥等出讓建設土地等費用開支。
5.網絡爬蟲撒點分析法
審計人員運用網絡爬蟲工具,從微博、論壇、政府網站等爬取帶有“侵占基本農田”“污染”“惡臭”“化工”“固廢”“養殖場”“環保投訴”等關鍵字樣的信息記錄,結合泰州區域地圖進行撒點分析,發現問題線索。
四、總結與展望
自然資源資產審計是個全新的研究領域,對審計理論、審計技術方法的探索性研究一直在進行。目前,大數據技術、地理信息技術的運用正處于快速發展階段,包括三維可視化、超算互聯體系等新技術將會給審計工作帶來更多的提升空間。因此,我們要緊隨時代發展,不斷創新思維,總結大數據審計理論實務,才能真正提高自然資源資產審計效果,更好的發揮審計在國家治理中的作用。
作者簡介:
蔣黎黎,江蘇省泰州市審計局。