葛淵博,盧文喜,白玉堃,潘紫東
基于SSA-BP與SSA的地下水污染源反演識別
葛淵博,盧文喜*,白玉堃,潘紫東
(吉林大學新能源與環境學院,地下水與資源環境教育部重點實驗室,吉林 長春 130012)
應用基于SSA-BP神經網絡替代模型的模擬-優化方法和SSA研究了地下水污染源位置及釋放歷史的反演識別問題.并在建立地下水水流模型時,應用Cholesky分解方法建立含水層滲透系數連續場,該方法相比于普通的參數分區方法更好地描述了水文地質參數的非均質性.結果表明:SSA-BP神經網絡替代模型對模擬模型具有較高的逼近精度,其平均相對誤差僅有3.21%.應用SSA求解優化模型,能夠快速準確地識別出點污染源的位置及釋放歷史.SSA對污染源位置的反演識別相對誤差在10%左右,對污染源源強的反演識別相對誤差不超過4%.因此,本文所提出的方法是一種有效的地下水污染源識別方法,可為污染責任認定及污染修復方案的優化提供參考.
污染源反演識別;模擬-優化方法;替代模型;麻雀搜索算法;SSA-BP神經網絡替代模型
地下水污染具有存在的隱蔽性和發現的滯后性等特點[1-2],給地下水污染修復方案的合理設計、污染責任的準確認定和污染風險預警等都帶來很大困難[3].地下水污染源識別可以根據已有的觀測數據(水位和污染質濃度觀測數據),以及現場調查和專業經驗等輔助信息,對描述地下水污染的數學模擬模型進行反演求解,從而識別地下含水層中污染源位置、污染源源強以及污染源釋放歷史[4-5].
地下水污染源識別的研究方法主要有解析法、直接法、模擬-優化方法以及隨機統計方法.其中基于模擬-優化方法的地下水污染溯源辨識問題應用最早且最為廣泛[6-7].目前模擬-優化方法仍舊處于發展階段,并面臨著諸多待解決的科學問題:第一, GMS軟件在地下水數值模擬等方面應用十分廣泛,并取得了很好的效果[8].在地下水水流模型的建立過程中,建模者限于對實際水文地質條件認識的局限性,大多采取了參數分區的方式來描述水文地質參數的非均質性[9-10].參數分區的方式過于簡單,并不能很好地描述水文地質參數的空間變異性,往往也會導致模擬結果的不確定性.第二,在進行模擬優化的過程中需要反復多次地調用地下水數值模擬模型,會產生大量的計算負荷,耗費大量計算時間.建立具有較高精度的替代模型來代替模擬模型進行迭代計算,可以有效解決這個問題[11].替代模型屬于一種黑箱模型,并且與模擬模型具有近似相同的輸入輸出關系[12].國內外學者利用自適應神經網絡、支持向量機等淺層學習方法建立了地下水數值模擬模型的替代模型[13-16].淺層學習方法在理論分析和實際應用中展現出了良好的優越性.但面對維數較高、線性程度復雜的問題時,使用淺層學習方法建立的替代模型難以滿足精度要求.深度學習方法更適合于解決復雜問題,但是其計算時間相比淺層學習方法會有所增加.試想研究一種替代模型,使之在面對復雜問題時既可以保持較高的精度,計算時間還相對較少.第三,求解優化模型同樣也需要一種高效的求解算法.目前為止應用最廣泛的優化算法有以梯度為基礎的傳統優化算法和啟發式優化算法兩種,傳統優化算法包括爬山法、最速下降法、共軛梯度法等,啟發式優化算法包括模擬退火算法、貪婪算法、遺傳算法、鯨魚算法、蟻群算法等.有研究人員將遺傳算法、單純形法、模擬退火算法等應用于地下水污染源及水文地質參數識別,并取得了很好的效果[17-19].然而,傳統的優化算法在面對復雜困難的優化問題時具有較大的局限性,某些啟發式算法在面對具體問題時也會出現局部搜索能力差,收斂速度慢,易陷入局部最優等問題.
針對以上問題,本文以模擬-優化方法為整體框架,提出了基于SSA-BP神經網絡替代模型及SSA的污染源溯源辨識方法.根據一假想點源污染案例建立地下水污染數值模擬模型,運用Cholesky分解方法建立含水層滲透系數連續場,其次運用SSA-BP神經網絡方法建立替代模型,通過麻雀優化算法(SSA)使BP神經網絡的初始權重與閾值達到最優,從而提高替代模型的精度與計算效率,最后使用麻雀搜索算法求解優化模型,以期為點污染源的位置及釋放歷史的識別提供更快速準確的方法.
模擬優化方法的基本原理是將模擬模型與優化模型相耦合,再以運籌學中的優化算法為工具對優化模型進行求解,通過反復多次地調用地下水數值模擬模型,對待識別變量進行不斷優化,最終求得待識別變量[20].
地下水含水層中的各水力參數(滲透系數、孔隙度、彌散度等)對于模擬地下水水流流動及溶質運移十分重要,為更好地描述水文地質參數的非均質性,采用以下函數來描述滲透系數的自然對數=ln在空間上的相關性:


再生成場的隨機數據集:

SSA由Xue等[22]在2020年首次提出,該算法受麻雀的覓食行為和反捕食行為的啟發而提出,具有較高的收斂性能和局部搜索能力.在整個麻雀的覓食過程中,所有麻雀被分為兩類:發現者與加入者.發現者具有較高的能源儲備并且負責搜索具有豐富食物的區域,從而為加入者提供覓食的區域和方向.加入者利用發現者提供的信息獲取食物或者在該發現者周圍覓食,并且一些加入者為了增加自己的捕食率還會不斷地監控發現者進而去搶奪食物資源.當發現危險時,發現者會將加入者迅速帶到其他安全區域進行覓食.在整個種群中,發現者和加入者的身份是動態變化的,但發現者和加入者所占種群數量的比重是不變的.
由只麻雀組成的種群如下所示:

式中:表示待優化問題變量的維數;為麻雀的數量.麻雀的適應度值為:

式中:表示適應度值.在每次迭代過程中,發現者的位置更新如下所示:

加入者的位置更新公式如下:


此外還有一部分麻雀擔任放哨報警的職責,這類麻雀的位置更新公式如下所示:


基本思想是模仿自然進化過程,通過對群體中具有某種結構形式的個體進行遺傳操作生成新的群體,從而逐漸逼近最優解.在具體求解過程中,GA會設定一個固定規模的初始種群,種群中的每個個體都表示問題的一個可能解,再利用適應度函數來判斷個體適應環境的程度,適應度差的個體被淘汰,適應度好的個體繼續繁衍,在繁衍過程中經過選擇、交叉、變異等操作形成新的種群,如此反復最終求得最優解.
BP神經網絡模型中的初始權值和閾值屬于隨機賦值,即使模型會通過誤差反向傳播算法不斷調整權值從而找到最優權值與閾值,但極其容易陷入局部最優,并且該過程的收斂速度較慢[23].為避免BP神經網絡陷入局部最優,提高BP神經網絡替代模型的精度和計算效率,本文利用SSA對其進行優化.SSA可以利用自身強大的局部、全局搜索能力及快速收斂能力,對BP神經網絡的初始權值和閾值進行優化,得到最優初始權值和閾值,再將最佳結果賦值給BP神經網絡,從而使BP神經網絡得到優化,形成了SSA-BP神經網絡替代模型[24].SSA-BP神經網絡替代模型的基本結構如圖1所示.

圖1 基于SSA-BP神經網絡的替代模型
優化模型通常由3個部分組成:目標函數、決策變量以及約束條件,一般形式如下所示:



圖2 研究區示意
本文針對假想算例進行研究,研究區由長250m、寬200m的二維非均質含水層構成.水流方向為西北向東南,西側1及東側2均概化為定水頭邊界,北側3及南側4均概化為零通量邊界.模擬期為10a,分為10個應力期(每年一個應力期),某點的地下水污染源在3~9期向含水層排放污染物,研究區內設置6口監測井(井1、2、3、4、5、6)監測地下水中污染物濃度,其中1~5號井用于參加地下水污染源反演識別過程,6號井用于檢驗算法的反演精度.設定背景污染物濃度為0mg/L,且污染物不會發生化學變化和生物降解.研究區示意如圖2所示:
2.2.1 地下水水流模型


2.2.2 地下水溶質運移模型



由于本文為假想例子,沒有真正的實測數據,所以首先給定污染源位置、初始釋放時間、釋放強度及各含水層水文地質參數的參考值(假定該研究區主要巖性為砂礫巖,其滲透系數、給水度、孔隙度等參數根據相關經驗值給出),并將其作為模擬模型的輸入,再正演模擬模型得到各個應力期觀測井中的污染物濃度作為觀測數據.含水層參數及污染源相關值的參考值如表1所示,觀測數據如表2所示.
2.2.4 模型的預報 利用MODFLOW模塊及MT3D模塊預測6a后研究區流場分布情況及污染物濃度空間分布情況如圖4所示.

圖3 含水層滲透系數連續場

表1 污染源相關值及含水層參數

表2 觀測數據(g/d)

圖4 6a后研究區水位和溶質空間分布
根據研究區情況,本文污染源反演的待識別變量為:污染源的橫向坐標、污染源的縱向坐標及污染源釋放通量st1~st10,共12個變量.相應的替代模型的輸入為上述12個變量,輸出為各時段5口監測井監測到的污染物濃度,共50個變量.
在替代模型中,訓練數據用于提取模擬模型內在的特征及規律,驗證數據用于評價替代模型的泛化能力.為保證數據均勻覆蓋采樣區間,增加樣本的遍歷性,本文采用拉丁超立方抽樣法對上述12個輸入變量進行抽樣,共抽樣1000組,隨機組合后輸入到地下水模擬模型中,計算得到相應的1000組污染物濃度輸出.再將輸入輸出數據集隨機分為訓練數據集(80%)和驗證數據集(20%).
采用SSA-BP和普通BP方法建立替代模型,并通過均方根誤差(RMSE)、確定性系數2及平均相對誤差(MAPE)評價及對比替代模型的性能.
由表3可知,基于SSA-BP方法建立的替代模型的精度明顯高于基于BP神經網絡方法建立的替代模型.由圖5可以看出,在迭代次數達到29次時,適應度函數已然收斂,說明SSA對BP神經網絡的初始權值和閾值完成了優化,且收斂速度較快.將污染源相關值與含水層參數的參考值輸入到SSA-BP神經網絡替代模型中,將其輸出與觀測值進行比較,對比結果如圖6所示.

表3 替代模型精度分析

圖5 SSA-BP適應度收斂曲線


結果表明,基于SSA-BP神經網絡方法建立的替代模型滿足精度要求,可以代替模擬模型與優化模型進行耦合.

表4 SSA及GA識別值與參考值的比較
以各監測井在各時段的替代模型計算值和實際觀測值之間的擬合誤差極小化作為目標函數,以污染源位置、坐標以及污染源釋放通量st1~st10共12個變量作為決策變量,并將已建立的替代模型作為等式約束條件嵌入其中,連同其他約束條件,構建針對污染源位置及源強反演識別的優化模型.構建的優化模型形式如下:

利用麻雀搜索算法和遺傳算法分別求解優化模型,計算識別值如表4所示.
再將SSA及GA識別出來的污染源位置及污染源釋放通量代入模擬模型中正演求解,并借助6號井分別比較兩者的模擬值及觀測值(表5).

表5 基于SSA及GA的6號井模擬值與觀測值的比較
根據兩種比較結果可知,在求解該優化模型時,SSA相較于GA具有更好的收斂性能和更高的識別精度.且由于st1、st2及st10的識別值明顯低于其他時段的識別值,因此可推斷初始釋放時段為st3,終止釋放時段為st10.對于污染源位置的反演識別可以為污染責任認定提供可靠證據,而考慮初始釋放時間和終止釋放時間的污染源源強識別對于進一步的修復任務具有重要參考價值.
在實際案例中,地下水不同污染物的性質及遷移方式存在很大差異,本文僅定義了一種假想污染物,且污染物不會發生化學變化和生物降解.后期的研究將會具體污染物具體分析,充分考慮污染物本身的物理化學性質及遷移方式,從而在污染物源反演識別中進行更加準確的模擬.
本文所提出的方法不可避免地存在誤差,比如觀測數據本身具有噪聲以及建立模擬模型和替代模型時的誤差等,這也就導致了污染源反演識別結果的不確定性.后期研究可根據反演識別結果進行匯的預測,通過與實際收集到的觀測數據比較來更新源的信息.
本文將水文地質參數看為已知變量,僅反演了污染源的相關信息,但是地下水污染源反演識別同時伴有水文地質參數的不確定性,后期研究將會同時反演水文地質參數及污染源的相關信息.
3.1 SSA-BP神經網絡替代模型在平均相對誤差、確定性系數及均方根誤差等評價指標上的表現都要優于普通BP神經網絡替代模型.且SSA優化BP神經網絡的初始權值及閾值時表現出了目標函數值下降幅度大、收斂速度快的優點.
3.2 SSA對污染源位置的反演識別相對誤差在10%左右,對污染源源強的反演識別相對誤差不超過4%,說明SSA的識別精度較高.綜上,基于SSA- BP神經網絡替代模型及SSA的地下水污染源溯源辨識是可行的.
[1] 王寶燕,肖 巍.地下水污染現狀與防治對策研究[J]. 環境與發展, 2020,32(10):38-39.
Wang B Y, Xiao W. Study on the status of groundwater pollution and prevention measures [J]. Environment and Development, 2020,32(10): 38-39.
[2] 楊 貞,張振師.國內外地下水修復技術應用現狀及發展趨勢[C]//中國環境科學學會.2020中國環境科學學會科學技術年會論文集(第三卷).中國環境科學學會:中國環境科學學會, 2020:4.
Yang Z, Zhang Z S. Current status and development trend of groundwater remediation technology application at home and abroad [C]// Proceedings of the 2020 Annual Scientific and Technical Conference of the Chinese Society for Environmental Sciences (Volume III). Chinese Society of Environmental Science: Chinese Society of Environmental Science, 2020:4.
[3] 李 媛,王國鋒,鄭 江,等.基于MOLDFLOW的某污染地塊地下水重金屬污染風險評價[J]. 江西科學, 2021,39(5):810-815,833.
Li Y, Wang G F, Zheng J, et al. Risk assessment of heavy metal contamination in groundwater of a contaminated site based on MOLDFLOW [J]. Jiangxi Science, 2021,39(5):810-815,833.
[4] 徐亞寧,盧文喜,王梓博,等.考慮參數和邊界條件不確定性的地下水污染隨機模擬[J]. 中國環境科學, 2022,42(7):
Xu Y N, Lu W X, Wang Z B, et al. Stochastic simulation of groundwater pollution considering parameter and boundary condition uncertainties [J]. China Environmental Science, 2022,42(7):
[5] 時延鋒.SCEUA算法在地下水污染溯源中的應用研究[D]. 濟南:濟南大學, 2015.
Shi Y F. Research on the application of SCEUA algorithm in groundwater pollution traceability [D]. Jinan: Jinan University, 2015.
[6] 王景瑞,胡立堂.地下水污染源識別的數學方法研究進展[J]. 水科學進展, 2017,28(6):943-952.
Wang J R, Hu L T. Research progress of mathematical methods for groundwater pollution source identification [J]. Advances in Water Science, 2017,28(6):943-952.
[7] 袁 乾,盧文喜,范 越,等.基于替代模型的煤矸石堆地下水污染隨機模擬[J]. 中國環境科學, 2019,39(6):2444-2451.
Yuan Q, Lu W X, Fan Y, et al. Stochastic simulation of coal gangue pile groundwater pollution based on alternative models [J]. China Environmental Science, 2019,39(6):2444-2451.
[8] 仝曉霞,寧立波,董少剛.運用GMS模型對某垃圾場地下水污染的研究[J]. 環境科學與技術, 2012,35(7):197-201.
Tong X X, Ning L B, Dong S G. Study of groundwater pollution in a landfill using GMS model [J]. Environmental Science and Technology, 2012,35(7):197-201.
[9] 杜守營,鹿 帥,杜尚海.基于GMS的地下水流數值模擬及參數敏感性分析[J]. 中國農村水利水電, 2013,(8):77-80.
Du S Y, Lu S, Du S H. Numerical simulation and parameter sensitivity analysis of groundwater flow based on GMS [J]. China Rural Water Conservancy and Hydropower, 2013,(8):77-80.
[10] 顏 萍,邢 芳,徐世光,等.基于GMS軟件對保山某尾礦庫地下水污染的數值模擬研究[J]. 地質災害與環境保護, 2019,30(3):102-107.
Yan P, Xing F, Xu S G, et al. Numerical simulation study of groundwater pollution in a tailing pond in Baoshan based on GMS software [J]. Geological Hazards and Environmental Protection, 2019,30(3):102-107.
[11] Queipo N V, Haftka R T, Shyy W, et al. Surrogate-based analysis and optimization [J]. Progress in Aerospace Sciences, 2005,41(1):1-28.
[12] Bhosekar A, Ierapetritou M. Advances in surrogate based modeling, feasibility analysis, and optimization: A review [J]. Computers & Chemical Engineering, 2018,108:250-267.
[13] Yan S Q, Minsker B. Optimal groundwater remediation design using an Adaptive Neural Network Genetic Algorithm [J]. Water Resources Research, 2006,42(5):5407-5420.
[14] 王梓博,盧文喜,王 涵,等.某鉬礦尾礦庫地下水污染的隨機模擬[J]. 中國環境科學, 2020,40(5):2124-2131.
Wang Z B, Lu W X, Wang H, et al. Stochastic simulation of groundwater pollution in a molybdenum mine tailing pond [J]. China Environmental Science, 2020,40(5):2124-2131.
[15] 侯澤宇,王 宇,盧文喜.地下水DNAPLs污染修復多相流模擬的替代模型[J]. 中國環境科學, 2019,39(7):2913-2920.
Hou Z Y, Wang Y, Lu W X. Alternative models for multiphase flow simulation of groundwater DNAPLs pollution remediation [J]. China Environmental Science, 2019,39(7):2913-2920.
[16] 王 宇,盧文喜,卞建民,等.基于小波神經網絡的地下水流數值模擬模型的替代模型研究[J]. 中國環境科學, 2015,35(1):139-146.
Wang Y, Lu W X, Bian J M, et al. Alternative modeling of groundwater flow numerical simulation model based on wavelet neural network [J]. China Environmental Science, 2015,35(1):139- 146.
[17] Yoon J H, Shoemaker C A. Comparison of optimization methods for ground-water bioremediation [J]. Journal of Water Resources Planning and Management-Asce, 1999,125(1):54-63.
[18] 江思珉,張亞力,蔡 奕,等.單純形模擬退火算法反演地下水污染源強度[J]. 同濟大學學報(自然科學版), 2013,41(2):253-257.
Jiang S M, Zhang Y L, Cai Y, et al. Inversion of groundwater pollution source intensity by simplex simulated annealing algorithm [J]. Journal of Tongji University (Natural Science Edition), 2013,41(2):253-257.
[19] 王 敬,韓 忠,梁 浩,等.地下水污染強度反演識別的SCE-UA算法[J]. 中國農村水利水電, 2020,(12):106-111.
Wang J, Han Z, Liang H, et al. SCE-UA algorithm for groundwater pollution intensity inversion identification [J]. China Rural Water Conservancy and Hydropower, 2020,(12):106-111.
[20] 肖傳寧,盧文喜,趙 瑩,等.基于徑向基函數模型的優化方法在地下水污染源識別中的應用[J]. 中國環境科學, 2016,36(7):2067-2072.
Xiao C N, Lu W x, Zhao Y, et al. Application of optimization method based on radial basis function model in groundwater pollution source identification [J]. China Environmental Science, 2016,36(7):2067- 2072.
[21] 張江江.地下水污染源解析的貝葉斯監測設計與參數反演方法[D].杭州:浙江大學, 2017.
Zhang J J. Bayesian monitoring design and parameter inversion method for groundwater pollution source analysis [D]. Hangzhou: Zhejiang University, 2017.
[22] Xue J K, Shen B. A novel swarm intelligence optimization approach: sparrow search algorithm [J]. Systems Science & Control Engineering, 2020,8(1):22-34.
[23] 郭名誠,侯 珂,李鑫浩.基于SSA-BPNN模型的Web服務質量評價[J]. 信息技術與信息化, 2021,(10):13-15.
Guo M C, Huo K, Li X H. Web service quality evaluation based on SSA-BPNN model [J]. Information Technology and Informatization, 2021,(10):13-15.
[24] 孫 全,孫 淵.基于麻雀搜索算法的BP神經網絡優化技術[J]. 上海電機學院學報, 2022,25(1):12-16.
Sun Q, Sun Y. BP neural network optimization technique based on sparrow search algorithm [J]. Journal of Shanghai Institute of Electrical Engineering, 2022,25(1):12-16.
Inversion and identification of groundwater pollution sources based on SSA-BP and SSA.
GE Yuan-bo, LU Wen-xi*, BAI Yu-kun, PAN Zi-dong
(Key Laboratory of Groundwater Resources and Environmental, Ministry of Education, College of New Energy and Environment, Jilin University, Changchun 130012, China)., 2022,42(11):5179~5187
The simulation-optimization method based on SSA-BP neural network alternative model and SSA were applied to study the inverse identification of groundwater pollution source location and release history. And the Cholesky decomposition method was applied to establish the continuous field of aquifer permeability coefficients in the groundwater flow model, which better describes the non-homogeneity of hydrogeological parameters compared with the common parameter partitioning method. The results showed that the SSA-BP neural network alternative model has a high approximation accuracy for the simulation model, and its average relative error is only 3.21%. The relative error of SSA in the inverse identification of source location is about 10%, and the relative error of SSA in the inverse identification of source intensity does not exceed 4%. Therefore, the proposed method is an effective groundwater pollution source identification method, which can provide reference for pollution responsibility identification and pollution remediation plan optimization.
pollution source inversion identification;simulation-optimization method;alternative model;sparrow search algorithm;SSA-BP neural network alternative model
X523
A
1000-6923(2022)11-5179-09
葛淵博(1999-),男,甘肅定西人,吉林大學碩士研究生,主要從事地下水污染源反演識別研究.發表論文1篇.
2022-04-21
國家自然科學基金資助項目(41972252);國家重點研發計劃資助項目(2018YFC1800405)
* 責任作者, 教授, luwenxi@jlu.edu.cn