





摘要:地下水污染具有修復困難、存在隱蔽等特點,監測過程中地下水流速、污染介質含量等條件也會對地下水污染監測網的實際監測效果造成影響。基于此,當考慮到地下水滲透率、污染物排放速率等不確定性對監測網的穩定產生的影響時,結合模擬優化法與蒙特卡羅法對地下水污染監測網運行過程中的不確定參數進行求解,推導最優監測網設計方案。同時,考慮到蒙特卡羅法計算負荷過大的問題,構建XGBoost替代模型,代替模擬模型與優化模型進行耦合計算,用以全面提升監測網對實際地下水污染物的監測精度,助力地下水監測與治理工作的升級發展,期望能為各地地下水污染防治工作者提供一定的參考。
關鍵詞:地下水污染;監測網設計;XGBoost
替代模型;優化技術;實證分析
引言
地下水是我國重要的水體資源之一,同時也是污染物聚集的“重災區”,針對地下水污染的監測與防治、修復工作成為當前環保事業的重要構成。目前,我國的地下水監測系統存在施工費用高、參數解析難等問題。因此,在具體的地下水污染治理與修復的工作中構建相應的地下水環境監測網絡,幫助相關工作人員更高效地獲取地下水污染參數,以及獲取更精準的地下水監測參數,并對地下水污染監測網進行針對性的優化設計非常必要。本研究項目的實施,可為今后的防治、治理與修復措施的制定和實施提供科學依據和技術支撐。
1研究基礎
模擬優化方法能夠充分結合地下水數值模擬及運籌學、統計學等多學科的優勢,全面提升既有監測方案的監測質量與系統運行穩定性。落實對地下水污染監測網的模擬優化,不僅能夠基于地下水系統既有的物理規律對地下水的水質、水位、污染介質等的分布趨勢進行細致分析,同時也能結合不同監測單位的經濟基礎、技術條件及不同監測目標的環境特點等構建最優質的監測網井位布設方案[1]。
時至今日,盡管已經有大量的學者落實了對監測井網的優化設計與創新研究,其所取得的成果也都能夠在優化既有監測模型的基礎上對監測目標、求解公式等進行全面升級,但長期以來,多數學者在研究地下水污染的不確定性時,往往僅關注于污染源信息或模型參數等單一領域,而忽略了對這兩方面的綜合分析。針對這一問題,本研究采取了理論與實踐相結合的方法,并在此基礎上,對模式中源散發的濃度及滲透率估算的不確定性進行了深入研究;同時,采用蒙特卡羅法對各因子對地下水污染監測網的綜合作用進行研究,提出了相應的優化設計方案。
在對既有的研究成果與文獻進行分析后可知,大部分學者都將其研究工作的重點集中在具備恒定特征的地下水污染源層面,缺乏對不確定污染源的深入研究[2]。本研究在繼承前人研究成果的基礎上,對變化的污染源釋放強度進行了全面和詳細的分析。此外,考慮到使用蒙特卡羅方法時伴隨的高計算量、研究負擔及較高的錯誤率,本研究提出了采用替代模型的策略。相較于傳統方法,替代模型在計算效率、輸出輸入等方面展現了明顯的優勢,因此在蒙特卡羅分析過程中,直接采用替代模型而非傳統的組合模擬模型,以提高研究效率和準確性,不僅能有效降低整體監測工作的計算量,還能在節約計算成本的同時提升計算精準度,具有較高的應用價值。
綜上所述,能夠適配于地下水污染監測網工作的替代模型構建技術較多,但不同技術的實際使用效果良莠不齊,難以適應多元條件影響下的多樣化監測需求。如,BP神經網絡技術、支持向量機技術等傳統的替代模型構建方案,都屬于淺顯的即系學習模式。盡管這些方法,在處理簡單問題時都能夠產生良好的擬合結果,但在復雜條件下,它們往往難以有效應對模擬模型中存在的非線性映射關系的擬合挑戰[3]。而XGBoost(極限梯度提升樹方法)能夠將多個弱分類器組合為具備更高學習能力且結構相對簡單的強分類器,且該方法引入了葉節點懲罰函數的機制還能進一步避免相關模型的過度擬合,具備較高的可靠性與使用價值。因此,考慮使用基于XGBoost進行模擬模型的構建工作。
2設計模擬優化方案
在本研究中,針對地下水污染監測網的模擬優化方案,實現了既有模擬模型與優化模型的緊密耦合。通過構建地下水污染物質運動和位移的模擬模型,對現有地下水系統中的水動力學行為進行了深入研究和歸納。為了實現更有效的優化效果,本研究依據具體的優化目標參數,精心設計了目標函數,并在此基礎上構建了優化模型。本次研究的關鍵是將已有的仿真模式與最優模式結合起來,并以此為約束,利用嵌入式方法對已有的仿真模式與最優模式進行集成,同時將其嵌入到優化模型中,確保整體優化過程的準確性和效率,全面提升整體地下水污染監測網的監測質量。
2.1 地下水污染介質運移模型
2.1.1地下水水流模型的構建
針對地下水污染監測網的升級需求挑選適宜的研究區,并根據研究區域的實際水文地質概念模型構建與之相應的二維地下水水流數值模型,該過程見式(1)。
式中 K—地下水系統的滲透系數;H—地下水總高度;" —地下水中含水層的底板高度;" —地下水匯源;" "—地下水系統地給水量;" " " " —地下水污染介質的位置變量;S —研究目標的所在區域;" —時間變量;" " —地下水系統給水源頭邊界,第一類邊界;" " " " " " " " " " " " "—地下水系統中確定的水頭邊界,即第二類邊界;" —在上述邊界中特定點(x,y)的外法線方向上的單位向量;
與" " " " " " " "—確定的源頭水函數;
—已知的水流量函數。
2.1.2地下水污染介質運移模型的構建
基于上述地下水水流數值模型,構建基于地下水污染介質的二維數值模型,該過程見式(2)。
式中 c—目標監測區域中地下水的溶質濃度;
與 —涉及地下水系統中水動力彌散系數在x和y方向上的分布(在本研究中,通過旋轉坐標軸的方法,將x軸沿地下水的平均流向調整,確保目標區域內所有水動力彌散系數的張量交叉項始終為“0”); 與 —地下水系統的實際平均流速向量在x和y方向上的分量;I—地下水匯源項; —地下水污染物滯留因子;S—目標研究區域; —地下水已知濃度邊界(第一類邊界); 與 —地下水已知水動力彌撒第二類邊界; 與 —地下水系統中已知對流-彌撒通量第三類邊界;n—地下水系統孔隙度;b—地下水
系統含水層高程; " " " "、" " " " "、" " " " " 、
—已知函數。
2.2 基于XGBoost的替代模型
采用XGBoost替代模型,用一種比較簡單的方法及較少的運算代價,就可以得到一個非常近似于仿真模型的輸出-輸入關系。在給定數目的已知樣品中,通過“輸出-投入”之間的關聯來構造一個學習樣本,然后再對其進行擬合。利用這種方法,可以對未知樣本的輸出特征進行有效的預測和分析,對使用蒙特卡洛方法來處理地下水污染監測網絡中的不確定性問題時尤為重要,可充分發揮替代模型的優勢達成降低計算負荷、提升計算效率、優化最終監測結果的目標。
本次研究所選用的XGBoost方法,是以決策數為基礎的集成式機器算法。相較于其他算法而言,該方法在非結構預測問題中的計算效率與計算質量、精確度方面的表現更為優異,能夠切實滿足地下水污染監測網的運行、計算需求。
分類回歸樹(CART)是XGBoost算法的基礎。分類回歸樹需要通過二叉樹劃分法以不斷迭代的方式將指定的特征空間劃分為若干特征單元。因此,每一個特征單元都對應一個輸出過程,利用不斷優化特征空間中不同特征單元輸出值及相應切分方式的過程,最大限度地、最大程度地降低回歸樹輸出值與既有輸出值之間的誤差,從而對數據值進行高效率的擬合。但分類回歸樹具備一個較為顯著的缺陷,即在使用分類回歸樹的過程中,容易對某一個訓練及特征空間進行過于細致的劃分,導致擬合過度。因此,相關工作人員在使用該方法的過程中,必須加強對數據精度的把控,避免造成計算失誤。為方便理解,提出二層分類回歸樹切分流程,如圖1所示。
基于分類回歸樹的缺陷,本研究的核心是對XGBoost算法進行深入探討。該算法采用集成學習的原則,通過線性組合多個分類回歸樹實現預測功能。它特別強調利用前一層回歸樹的擬合誤差作為緊接著的下一層回歸樹的擬合目標,通過這種方式,不斷地添加新的回歸樹來逐步優化預測結果,從而使最終的預測值逐漸接近真實值,達成更高精準度的計算。基于XGBoost算法的代替模型構建流程如式(3)、式(4)、式(5)、式(6)所示。
①模型初始化。
*注:初始化階段中的模型沒有分類回歸樹。
②在初始化模型中插入第1棵分類回歸樹。
③承接上一步驟,在模型中插入第2棵分類回歸樹。
④承接前置步驟,在模型中插入第n棵樹。
式中 " " —完成第n棵樹的計算后,樣本 的預測結果; " —第n棵樹的預測結果,
即 " " -" " " " " " 計算得到的數值反映的是在第n-1棵樹完成后,模型的預測值與實際值之間的差異,也是構建第n棵樹的目標。
綜上,隨著決策樹數量的增加,每一棵新添加的決策樹都使得預測值更加接近真實數值。當擬合誤差變得非常小或迭代次數達到一定數量時,就無需再添加新的決策樹。之后,將決策樹相應的葉節點累積計算,作為最后的預測。
在 XGBoost算法中,多種類型的回歸樹結合之后,需要在具體應用中準確地決定每一種回歸樹的構造方式。本次研究所提出的XGBoost算法主要依賴式(7)、式(8)的目標函數對決策樹中切分特征、切分節點,以及各個葉節點的最終輸出數值(最終預測值)進行進一步的優化。
式中 —基于代模型參數為" "情況下的目標函數; " " —誤差函數,通常取值為回歸方程中的均方誤差; " " "—分類回歸樹中復雜度函數;T、" 、" 與" " —分類回歸樹涉及的所有葉節點的數量、輸出值以及相關系數。
當分類回歸樹變得更加復雜時,其對特征空間的切分將更加精細,導致模型越來越傾向于過擬合。這種過度擬合的模型在新的數據集上的表現通常較差,無法滿足預期的計算要求。因此,必須在設計目標函數時,同時考慮到計算模型的復雜性和擬合的精確度。目的是在確保良好擬合效果的同時,避免模型出現過度擬合的問題。
2.3 模型優化
針對這一現狀,提出了一種基于多目標函數的地下水污染監控布井優化方法。在制定研究對象時,首先要依據具體的環境要求對觀測點進行初步的篩選,然后選取能夠給出最大信息量的觀測井。該方法可以用0~1的整數規劃模式表示,選擇的可能監控點位置被賦1,沒有選擇的點被分配0。實現監控信息的最大限度利用。在采用克里格差異法對觀測井網觀測資料進行分析后,得出的污染羽差與真實污染羽數之間的關系,說明該觀測井網布設的品質較好。因此,優化問題轉化為如何篩選出信息量更高的潛在監測井,并將其有效整合成監測井網,以確保差值污染羽盡可能接近模擬模型預測的污染羽。
為了增強求解的質量,本研究在優化過程中數字化地表達了監測井網差值污染羽和模擬模型污染羽的相似度,并在此基礎上推導出了符合工程應用需求的可利用信息表示形式。該方法可將被污染的羽流作為一種基于密度的灰度圖來處理。該方法將2幅背景噪聲的近似度評價轉換成2幅影像之間的相似性對比問題。本文采用了一種更為準確的方法來刻畫影像的空間特性,本次研究所提出的空間矩陣包含零階矩陣、一階矩陣及二階矩陣,其分別代表了污染物的質量、重心位置及形狀特征。因此,在實際的監測過程中,只有明確污染羽的這3種物理特征才能更精準地分析出地下水中污染羽的具體分布。上述3種污染羽的物理特征如式(9)所示。
式中 " "—地下水系統的有效孔隙度; —該模型中第i點污染物的具體濃度; —監測井網選址; —沿a軸方向發展的第一階矩陣;D —該研究過程中的最高高程; —第a維度上的坐標值; —沿a、b軸方向發展的第二階矩陣。
首先,針對該問題,利用蒙特卡羅算法,將模式中的參數不確定性轉換為羽流形狀的不確定性,引入多重迭代模式,實現對不同類型水體的模擬。其次,研究基于多個背景噪聲的混合羽流模式,研究其在多種類型噪聲干擾條件下的空域矩陣誤差分布。綜合以上步驟,本次研究旨在構建一個有效的污染監測井網優化模型,其數學表達如式(10)所示。
式中 " —第j個監測井點建設方案; " " " " 、
與 " " " " " "—第j個還能測方案所對應的插值污染羽以及模擬模型污染羽零階矩陣、一階矩陣以及二階矩陣之間的誤差;" "—監測井中第i個潛在濃度;I —潛在濃度的總數;" " "—第j個監測井點建設方案中不同潛在監測井的選中狀態,其總數量不得超過P;" " " " " " " " " "—決策變量0~1的整數變量數值。
結合式(10),推導式(11)、式(12)、式(13)
計算" " " " " " " 、" " " " " " 與" " " " " " " 。
式中 N—利用蒙特卡羅進行監測數值模擬的總模擬次數; 、 與 " " —利用蒙特卡羅進行第n次模擬過程中地下水污染的零階矩陣、以x為主要方向的一階矩陣以及以xx為主要方向的二階矩陣;" " " " "、" " " " "與" " " " " " —第j個監測井建設方案在第n次模擬中插值污染羽的零階矩陣、以x為主要方向的一階矩陣以及以xx為主要方向的二階矩陣。
3實例分析
以某市區煤矸石滲漏區為主要研究區域,該區域東西長度9.7km、南北長6.1km,整體滲漏面積52.35km2,研究區域具體情況如圖2所示。利用2021年6月的水位情況及水質數據進行模型矯正,利用2022年6月份的實測資料,對該模式進行了檢驗。通過對模式的修正與檢驗,得出水源地實測數據與仿真結果的偏差均小于0.5m,但實際監測的水體總污染物濃度與模型計算結果的偏差均小于10%。這表明,模型在校正和驗證方面的整體準確度均達到了相關標準。如圖2所示,2個地下水系統分區的滲透系數經過校正后分別為82.7mg/d和97.4mg/d,結合相關監測設備測得煤矸石向地下水滲透,硫酸根的釋放強度約為7000mg/d。
4 結果與討論
根據前述的模型優化步驟,通過運用MATLAB
平臺中的遺傳算法工具箱來進行求解,從而確定了最優的監測井網布置位置,具體結果如圖3所示。
依托上述步驟進行計算得出結果。運用本次研究提出的利用基于XGBoost替代模型需要完成100次的輸入-輸出數據樣本集,便可獲取較為可靠的數值。求解總耗時為3.3h,替代模型的單層分類回歸樹計算只需要2s左右,其時間損耗基本可忽略不計。對比分析既往工作中常見的GMS的地下水溶質運移模型完成蒙特卡羅求解,其單次求解需要耗時2min左右,但要全面分析地下水污染監測網的不確定性則需耗時33h左右。因此,通過應用本次研究中提出的基于XGBoost替代模型進行100次蒙特卡洛模擬,可節約90%的時間成本。
結論
利用基于XGBoost方案所建立的替代模型具有較好的進度,同時能呈現出與模型相近的輸出與輸入關系,不僅能有效降低相關系統集散符合,還能進一步提升計算結果的可靠性。因此,使用本次研究所提出的XGBoost替代模型去代替既有模擬模型與優化模型進行地下水網數值檢測與耦合具有現實意義。應用空間矩影像評價結合方法,對地下水監測井網內的污染羽流與真實污染羽流的接近度進行分析,相較于傳統的運算模式而言更容易精準地捕捉到實際污染羽的形態與數值。
參考文獻
[1]崔萌,楊虹,盧志坤,等.垃圾處理場所地下水污染監測方法研究——以北天堂簡易垃圾填埋場為例[J].四川環境,2022,41(04):225-231.
[2]趙晶晶.地下水污染監測與治理措施探討[J].皮革制作與環保科技,2022,3(14):134-136.
[3]黃瑞瑞,王錦國,楊蘊.污染源變化條件下地下水監測網優化設計[J].能源與環保,2022,44(03):107-113.
作者簡介
王瓊(1989—),女,漢族,甘肅張掖人,碩士研究生,工程師,研究方向為環境監測。