于文健
(廣東省清遠生態環境監測站,廣東 清遠 511515)
借助現代信息技術有效監測大氣環境,確保環境保護與經濟發展之間的協調。本文介紹了大數據技術在大氣環境監測中應用的意義和原理、技術優勢和具體應用。
在大氣環境監測過程中,工作人員要收集大量的數據。在對這些數據進行評估和分析時,可以有效地提高數據分析的效率和評估結果的準確性,它是環境監測的重要組成部分。
大數據分析技術可以實現對大量數據的快速及準確分析,并能從這些海量數據中挖掘出有價值、有效的信息。可對當前區域大氣環境作出更準確地判斷和評價,為人們提供可靠的大氣環境信息,以便人們采取相應的措施[1]。
通過利用大數據分析技術對相關數據信息進行分析,結果可以直接呈現給用戶,包括研究人員和政府決策人員。建立大數據模型還可以模擬環境治理方案,評價環境治理的可行性,從不同治理方案中選擇環境效益好、成本效益高的方案,避免因決策失誤而增加環境工程成本。
在使用大數據進行環境監測時,人們可以建立云分析平臺,為生態問題及時提供反饋。也可以把大數據和網絡結合起來,直接在網上發布聚合結果,實時查看監測結果[2-3]。
篩選相關數據,選取數據特征量,用數學分析方法分析數據特征量及其相關關系。環境監測涉及大量的基礎數據,需要運用大數據分析技術進行收集和處理。除了獲取基本數據和特定數據類別外,還完成了特征的選擇[4]。
利用大數據分析技術可以分析出各區域特定的大氣環境,分析結果通過互聯網迅速發送到有關的氣象平臺,直觀地顯示當前的大氣環境,讓人們實時了解大氣環境。圖1:大氣環境監測分析結果。通過采樣系統收集和分析各項監測指標,然后把監測分站的數據信息發送到中心站,再通過中心站計算機將結果發送到監測平臺上,也可以通過繪圖儀和打印機打印出來,以便直接、隨時監測大氣環境質量,然后依據氣象預警,制定相應的防治措施[5-6]。

圖1 大氣環境監測過程分析
環境監測不僅收集和記錄大氣環境監測數據,還可基于大數據技術組織和挖掘大量數據。利用大數據分析技術對各種數據進行收集整理、檔案保存,加快工作效率的同時還可以確保數據收集和記錄的準確性[7]。
相關人員需要結合大氣環境的變化的特征,對數據進行匯總和分析,并進行有效預測。大氣環境監測應用大數據分析技術的過程中,系統會對數據進行進一步整理和挖掘,并對獲得的結果信息進行匯總和解析,得出外部環境因素和最終的與大氣環境質量相關的規律。具體如圖2所示。

圖2 主要運行方式
大數據分析技術的應用,不但可以很大程度上改變傳統的大氣環境監測的方法,而且有助于我們更好地了解大氣環境。若評估結果與相關要求不符合,則在評估結果符合相關要求的情況下,才可以發出警報,進行實地調查、實施計劃,再進行抽樣、樣本保存、預處理、定性測試、定量分析以及數據處理[8]。
SC中包含的特征量對目標函數的影響是一個多層多節點的傳遞過程,傳遞路徑是線性的,傳遞過程在節點處的輸出可以是線性的,也可以是非線性的。因此,SC具有靜態神經網絡結構的特點。神經網絡方法本身是模擬復雜系統和分析大數據的非常有用的工具。因此,選擇由輸入生成(Ig)和人工神經網絡(ANN)組成的SC進行仿真預測當地電網中PM2.5的濃度。
IG的作用是用各類空間特征量構建 ANN 的輸入值。從建有大氣自動監測站的網格中隨機選取兩個局地坐標為l1和l2的網格,每個網格中包含二個特征量和污染物濃度值,分別用f、f、f、f和c1、c2表示;x代表某一待預測的網格,其局地坐標用lx表示,x 網格中二個特征量和待估污染物濃度用f、f和cx表示。由IG構成的對ANN的輸入數據生成流程見圖3。

圖3 空間分類器IG數據生成流程
ANN是在接受輸入數據后,通過神經網絡節點和傳遞,最終產生對目標值的影響。為理解神經網絡的傳遞過程,神經網絡某節點的傳遞過程見圖4。圖4表示神經網絡一個節點輸入輸出關系。f1x、f2x表示該節點的兩個輸入;f'x表示該節點的輸出;w1x、w2x表示兩個輸入權重;bx表示該節點輸入輸出的偏移,即神經感知偏移;φ表示輸出為非線性輸出的變換函數。

圖4 神經網絡節點輸入輸出流程
大數據分析可以用于環境監測,提高監測的質量和效率,減少監測人員的工作量。