摘要:大數據技術在人工智能、數據預測、計算處理等方面展現出其強大的優勢。本文在分析大數據在環境監測領域適用性的基礎上,從大數據環境監測采集與集成、大數據環境監測平臺架構、大數據環境監測技術應用保障等3個層面就大數據技術在環境監測中的應用進行了探討。
關鍵詞:環境監測;大數據;應用
中圖分類號:X83 文獻標識碼:A 文章編號:2095-672X(2018)06-0169-01
DOI:10.16647/j.cnki.cn15-1369/X.2018.06.101
Abstract: Big data technology shows its strong advantages in artificial intelligence, data prediction, and calculation processing. This paper analyzes the applicability of big data in the field of environmental monitoring, from the big data environment monitoring acquisition and integration, the framework of big data environment monitoring platform, the application of big data environment monitoring technology and other three aspects of the big data technology in environmental monitoring The application was discussed.
Keywords: Environmental monitoring; Big data; Application
大數據(Big Data)是從多種來源中搜集得到海量數據信息的總稱。“大數據”具有數據量大、類型復雜、需要即時處理和價值提純的特點。大數據技術在人工智能、數據預測、計算處理等方面展現出其強大優勢。2015年,國務院發布《促進大數據發展行動綱要》,將大數據上升為國家戰略。在“十三五”規劃綱要中,強調要大力“實施國家大數據戰略”。2016年環保部出臺《生態環境大數據建設總體方案》,大力推動生態環境大數據建設和應用。據統計,2014年環保部污染物監測中心每天會獲得391萬條自動監控數據,一年便會接收到14.6億條數據信息[1]。如何運用好這些大數據信息,對實時研判環境現狀,提高政府環境問題決策的科學性具有積極的現實意義。
1 大數據在環境監測中的適用性分析
環境監測機構通過大數據技術的應用,能夠實時采集、存儲和分析環境監測中的物理指標、化學指標和生態系統的信息數據,形成環境大數據的系統數據庫,有效提升環境治理的能力和管理決策水平。
1.1 提升數據采集質量
大數據技術應用于環境監測中,能夠利用數據技術和算法對環境數據信息進行全面、精準采集,并能及時將采集到的數據進行存儲和分析,再通過數據處理平臺實現數據的共享。尤其是現代高科技技術和器材的應用,會產生越來越多的環境數據信息,如環境分析儀器、GPS、GIS信息系統、衛星遙感技術應用等,及時評估水質、土壤、大氣、生態環境的狀況,及時獲取相關環境數據。再利用海量數據存儲技術、虛擬化技術和分布云技術[2],以及智能分析技術等云計算技術處理工具和算法,如Python,將采集到的數據信息進行深度分析,及時掌握環境現狀。
1.2 改善數據分析效率
大數據技術能夠實現數據信息的實時處理和分析,從而大大提升了環境數據的分析效率和質量。尤其是在環境應急狀態下,通過重要儀器設備的實時動態監測,能夠及時傳遞環境數據信息,高質量數據流的匯集和分析,較傳統的手工數據收集、錄入、分析等有了顯著提升,或推導出的數據結論也更可信、更準確。例如,在大數據技術背景下,采用紅外線監控、無線傳感網絡技術等能夠有效監測森林動態,第一時間里查明森林火災狀況,為環境治理提供了科學依據[3]。又如,現在全國各地均設立了大氣質量監測數據實時發布系統,每天都會實時更新當日的PM10、PM2.5、SO2、NO2、O3、CO2等六項指標的實時監測數據和空氣質量指數,讓社會各界及時掌握所在城市的大氣環境質量狀況,便于安排出行,接受外界監督等。
1.3 提升環境綜合預警能力
大數據技術將環境監測中所獲取的海量數據信息進行處理和分析后,能夠將當前的環境狀況整體態勢和發展趨勢進行預判,提高環境污染防治預警預報的精準性。如,大氣實時自動監測系統,由環保部門與氣象部門根據氣象衛星反饋到的數據信息和大氣污染物含量的實時監測,對大氣污染的過程作出整體判斷,并對未來一段時間大氣環境污染狀況做出準確的預警,為有關部門及時采取相關防治措施提供可靠的數據信息。
2 大數據在環境監測中的應用
2.1 大數據環境監測采集與集成
2.1.1 數據采集
環境監測中的數據有監測部門采集的結構化數據,另一部分是人群活動中產生的與環境相關的非結構化數據。前者主要包括大氣、水、土壤、噪聲、降水、電磁輻射、森林植被防護等生態環境綜合監測數據;廢水、廢氣、固廢等在線監管數據包括環境污染源監測、總量控制、排污費征收等環境監管方面的數據信息。這一類數據信息主要來自環境質量監測網和日常環境監管執法活動中產生的數據信息[4]。后者主要包括經濟社會發展、氣象、地理、人口經濟統計、生活垃圾等方面的數據信息,這一類數據信息多來自年鑒、網絡等渠道。
2.1.2 數據集成
數據集成就是將采集到的環境監測數據進行必要的處理,剔除不真實數據,確保數據的質量,為大數據應用奠定可靠保障。大數據技術進行數據集成,就是要環境監測數據進行抽取、分發、清洗、轉換和裝載等,并將源數據存儲到數據共享平臺中。具體來說,就是要做好:(1)數據模塊轉換,將不同類型或格式的數據信息轉換為統一的數據編碼格式;(2)數據模塊補采,將不完整或中斷的數據進行人工補采,確保數據信息的完整性;(3)數據模塊清洗,將不符合事實、不規則數據及時進行清洗、剔除;(4)數據采集監控,在環境監測數據平臺界面和功能管理中設置數據采集、啟動、跟蹤和監控功能,實現數據加載任務的自動啟停和優先級設置等功能。
2.2 大數據環境監測平臺架構
環境監測大數據平臺是將數據信息進行深度挖掘、分析,并根據環境監測的行業標準及規則,進行更高層次的組織、轉換和改造,使環境監測的單一數字向多維方向轉化,利用某一領域中的環境監測數據庫中的知識、標準、法規,實現對環境趨勢特征的自動認知。具體來說,環境監測大數據平臺應包括數據信息采集、數據信息存儲、數據信息處理、數據信息共享和數據信息應用等,并利用物聯網技術實現環境監測數據信息的應用和服務,為公眾、企業和政府等不同用戶提供優質、可靠的環保信息服務。與傳統的數據庫平臺不同的是,大數據環境信息監測平臺的數據規模更大,常以TB、PB為單位;數據類型以結構化、半結構化為主,兼有非結構化數據;多是在數據產生后進行不斷演化,呈現出動態性;大數據環境信息更具資源型特點。綜上所述,環境監測大數據平臺應由數據源、采集與存儲層、處理層、共享層和應用層5個部分組成。(1)數據源:主要包括污染源排放數據、生態環境監測和人類活動產生的數據;(2)采集與存儲層:通過數據技術實現環境監測數據的抽取、補采、裝載、匯總,并進過數據的清洗、轉換和數據采集監控,應用接入適配技術,將海量數據存儲于數據庫;(3)處理層:通過建模和挖掘,實現對環境監測數據的自動預測,并進行數據的關聯分析,聚類和概念描述,將偏差數據進行檢測,確保數據質量;(4)共享層:建立環境監測數據服務的標準化接口,通過現代信息技術應用,實現數據信息的共享管理和共享服務;(5)應用層:通過環境監測數據的分析、處理和共享,為相關部門進行生態環境綜合評價、生態環境綜合預警、健康風險評估等應用提供數據信息支持。近年來,高科技的應用使決策達到可視化應用效果,更為直觀。
2.3 大數據環境監測技術應用保障
除了上述技術層面的分析外,要實現大數據技術在環境監測工作中的應用效果,離不開標準規范的保障和人才的支持。一方面,要將環境監測領域的相關行業標準和技術規范與大數據技術需要結合起來,盡快出臺大數據環境監測領域的標準和規范,用以指導大數據技術在環境監測中的應用,提升大數據技術在環境監測中的應用標準化和規范化。如《環境空氣質量預報預警方法技術指南》《大氣顆粒物來源解析技術指南》等標準和規范與信息系統結合起來,進一步統一數據模型,為智能環境監測提供制度保障。另一方面,要大力培養大數據復合型人才,重點培養大數據環境監測應用開發工程師、分析師和安全研發人才等,為大數據環境監測技術的發展提供源源不斷的人才保障和智力支持。
參考文獻
[1]詹志明,尹文君.環保大數據及其在環境污染防治管理創新中的應用[J].環境保護,2016,(6):44-48.
[2]張洪君.大數據技術在環境監測中的應用探討[J].環境與發展,2017,(8):149-150.
[3]何愛蓮.大數據在環境監測中的應用分析[J].農技服務,2017,(4):148.
[4]解輝.大數據技術在環境監測中的應用[J].環境監控與預警,2016,8(4):62-66.
收稿日期:2018-04-23
作者簡介:李璐(1982-),女,碩士,工程師,研究方向為環境監測研究和質量管理。