董君 陶紅蕾 亓靚
山東省青島生態環境監測中心 山東青島 266000
環境監測網絡不斷發展完善,生態環境中各個要素的監測覆蓋影響面也在不斷擴大,促使監測方法朝著標準和規范化方向發展。在環境監測系統完善的情況下,環境監測數量增加。但目前沒有充分開發和利用環境監測數據,因此很多數據封存于報告和檔案之中,沒有體現出其應有的價值和作用。此外,環保部門掌握的環境質量數據不精確,導致各類數據碎片化,相互關聯分析不夠,因此很難言明環境質量的變化狀況和潛在的風險。
地表水環境質量大數據呈現出與環境因素相關的變化。這項數據和其他領域的數據一樣,具有“4V”特征。這項數據特征指的是海量的數據規模、多樣化的數據模型、巨大的數據價值以及快速的數據流動等。地表水環境質量的數據來自于環境監測、水文、氣象、農業等多個領域和科研院校的組織結構,根據各自的工作需求展開地表水環境質量監測和管理工作,得到的數據供相關單位參考和使用[1]。數據監測和管理的過程中,所應用的管理模式是各自為政,依據自身監測獲得使用數據,規定數據的所有權和使用權歸監測單位所有,不會無償共享數據信息資源。因此,各類數據使用者受到業務領域和數據獲取成本的限制,會采取協作方式獲取其他結構的數據信息。對比地表水環境質量數據分析的要求,不同的數據使用者所掌握的數據是獨立的,缺少與水環境質量相關的其他類別數據,只能從一個狹窄的角度了解地表水環境質量的局部情況,應用價值不高。
針對地表水環境質量進行大數據分析的過程中,要運用全新的工作思維和技術方式,選擇和整理關聯的海量數據信息,將不同類型的數據有機融合在一起,從中發現對地表水環境狀況產生重要影響的因素和變化規律,從而得到科學有效的改善地表水環境質量的優化方案。
①因素識別。在初步分析階段,首先要了解對地表水環境質量產生影響的因素,才能確定采集數據的方向和途徑。事實上,地表水環境是開放的生態系統,與其他環境因素也進行了物質、能量交換,因此環境的復雜性是尤其明顯的。地表水環境系統的復雜內部因素和大量外部因素共同決定了其質量狀況。要對地表水環境質量進行大數據分析,必須首先確定這些影響因素。以湖泊水環境為例,在收集環境質量信息的過程中,要采集水文、氣象、污染源以及經濟、人口產業布局等內容,在綜合多項影響因素的基礎上建立科學的生態防護措施,提升地表水環境質量。②數據選擇。對地表水環境質量進行分析的過程中,要先了解對其產生主要影響因素的狀況,反映出指標水平高低、大小和數量的參數就是我們所需要的參數信息。基于當前因子識別的結果,要在掌握現有知識和經驗的基礎上科學選擇反映地表水環境質量的數據。在數據分析的過程中,根據實際情況和分析的可行性確定監控方法,同時要達到較高的準確度和精準度技術要求。數據選擇要盡量控制參數范圍和數量,如果數據較為龐大可能會產生不相關的信息干擾,如果數據太小則不能提供足夠的原始材料。③數據收集。根據地表水環境質量監測的需求和技術性要求,要精確收集數據信息,為大數據分析提供參考的依據。地表水環境質量數據信息和政府、企業、學校等組織相關,因此采集的方式也是不斷變化的,呈現出多樣性特點[2]。④數據整理。政府部門、企業、學校和社會組織收集的數據信息格式和生成方式是截然不同的,因此要采取一定措施轉化為統一的數字化表達方式,便于管理和使用。基于地表水環境質量的數據信息不僅僅是普通的電子水環境數據信息,因此要在合理存儲和即時檢索的情況下進行管理和相應應用。收集的紙質報告信息轉化成電子文檔后,也無法應用于大數據分析。要想科學應用,需要轉化為軟件系統檢索、計數和分析的數字信息。對于地表水環境質量數據,匯總編制數據內容的過程中要關注到監測方式和質量控制等方面的問題,了解不同技術應用間存在的差異,才能在數據分析的基礎上更改出現的錯誤此外,對于不符合技術要求的數據以及帶有系統偏差的數據進行合理校正,能夠為數據分析功能提供真實有效的參數,發揮其基本作用。⑤關聯分析。獲取的數據信息經過排序后,部分內容仍是松散的,因此要通過數據關聯分析的方式確定這些數據信息的使用途徑。在關聯分析的偶成中,一般會采用人工智能的方式,比如數據挖掘、自然語言處理、統計分析等技術方式,目的在于最大程度的還原地表水環境質量的情況。在收集數據時,結合多種生物模型能夠讓分析結果更為精確。此外,也可以通過反映地表水環境質量的零散信息構建數據模型,計算其他因素對地表水環境質量的影響情況,逐步實現數據系統化管理。系統的預測和-判斷功能能夠讓我們在數據分析的過程中發現問題,掌握事物變化的基本規律,才能合理有效的解決地表水環境問題[3]。
由上文可知,地表水環境質量數據分析是一門系統和綜合性的學科,涉及到計算機技術、信息技術以及水文氣象等多個學科領域。地表水環境質量大數據呈現出與環境因素相關的變化。這項數據和其他領域的數據一樣,具有“4V”特征。從推動地表水環境質量分析的角度出發,要集中培養具備學科知識能力和技術能力的綜合型人才。高等院校中應該建立相關學科,展開大數據分析專業教育,為大數據分析輸送專業的對口人才。