朱 華, 陳 倩, 劉宏舒, 孫大鵬, 周 慧, 池 遼, 龐 亮
(1.四川省地質工程勘察院集團有限公司, 四川 成都 610072; 2.四川省天晟源環保股份有限公司,四川 成都 610072; 3.四川省天晟源信息技術有限公司, 四川 成都 610072; 4.鞍鋼股份有限公司,遼寧 鞍山 114033; 5.鞍山鋼鐵集團有限公司, 遼寧 鞍山 114033)
隨著城市化進程加快以及產業結構調整,冶煉、焦化、化工、油氣開采等重點行業場地及周邊地區土壤污染物超標率36.3%, 與冶煉化工相關的工業廢棄地等場地所在的大面積土壤遭到污染。 由于土壤中的污染物質向地下水中遷移造成地下水污染,并且由于地下水的徑流、排泄以及地下水位的波動,地下水中的污染物浸潤土壤,造成雙重污染,對周邊居民食品和飲用水安全、生態環境、經濟社會可持續發展帶來了巨大危害[1-2]。因此,開展污染場地的污染監測響應、調查評估、風險預測管控和修復是十分急切和有必要的。
場地污染風險預測和管控首先要對待測場地的土壤和地下水的污染狀況開展調查, 接著需要采集相應的場地樣本,進行初步以及詳細采樣分析,并從中獲得大量的污染數據樣本。 通過物聯網技術采集的數據的樣本數量大、監測項目多,結構復雜包含大量的特征信息和關系信息[3]。那么如何利用這些數據提取有價值的信息并應用于場地污染風險模擬和評估就成了一個極為重要的問題。 目前采取的傳統數據分析方法有主成分分析(PCA)、因子分析(FA)、判別分析(DA),層次聚類分析(HCA)等[4-7]。 但由于這些數據分析方法在處理像污染場地數據這種復雜的大數據集時,會有較大局限性,且當數據結構不滿足線性條件時,這類數據分析方法結果可能會不準確。近年來人們開始通過提高環境監測的監測精度、優化數據分析方法來提高分析結果的準確性。 SAHU等[8]將納米材料、電子器件和微流控系統的混合使用,并進一步改進了設計,使現場檢測具有更高的靈敏度。 至于數據分析方面,夏文文等[9]利用內梅羅指數法和多元統計分析方法對洪澤湖水質情況水質進行評價分析。
隨著計算機科學與技術的快速發展, 神經網絡(NN) 因為其擁有較高的準確性和客觀性開始活躍于各個科研領域和實際應用中[10-11]。由于神經網絡在處理非線性問題時具有較大的優勢, 在處理場地污染等大量復雜關系數據時可利用神經網絡模擬非線性工程問題來了解輸入和輸出特征間的關系。 本文將在上述背景下, 著重討論神經網絡在場地污染模擬和評估方面的應用。
神經網絡是對人腦若干基本特性的一種抽象和模擬的模型,由大量神經元組成,并且可以通過調整各神經元之間的關系來達到處理信息的目的。 它具有良好的容錯性與聯想記憶功能, 以及較強的自適應與自學習功能。1943 年MCCULLOCH 等[12]將閾值函數作為計算神經元的主要特性, 將邏輯演算作為神經計算架構, 由此提出了神經網絡的概念。 近年來,神經網絡被廣泛應用于各個領域之中。
神經網絡一般由輸入層、隱含層、輸出層等多層節點組成[13-15]。輸入特征信息由輸入層進入,通過隱含層的計算后進入到輸出層, 并且層與層之間通過權重和閾值來調節。整個過程一般先將數據經過預處理,然后將處理后的數據分為訓練、驗證、測試3 個部分,每個部分均根據需要設定一定的比例, 并初始化閾值和權重, 當訓練數據從輸入層通過隱含層至輸出層之后,計算網絡預測值和目標值的誤差[16-17]。
隨著HINTON 等[18]于2006 年在《Science》上發文,引出深度學習這一新的研究方向,神經網絡再次成為各大領域的研究熱點。 深度學習淺義上可解釋為層數較多的人工神經網絡, 實質上是一種對數據資料進行表征學習的算法。 深度學習便強調從結構中連續的層中進行學習數據資料的相關特征, 進而完成學習任務。 卷積神經網絡(CNN)等模型則是其中學習效率很高的深度學習模型。傳統CNN 結構包括輸入層、卷積層、池化層、全連接層和輸出層,結構見圖1。

圖1 卷積神經網絡結構
幾種應用較廣泛的卷積神經網絡模型如下。
(1)LeNet-5
LeNet-5 神經網絡模型是最早出現的卷積神經網絡模型之一, 共有7 層結構, 并且使用多個卷積核, 卷積核權值共享的方式既降低了網絡中的連接數, 又使得整個模型更加簡潔和利于計算。 通常來說,LeNet-5 被應用于手寫字符或者文檔的識別。
傳統LeNet-5 的效率并不理想, 單通道的網絡結構在進行特征提取時, 取得的結果并不完整且收斂速度達不到想要的效果。針對這一問題,YAO 等[19]提出了均勻憶阻器交叉陣列的制造來提網絡的性能, 還構建了一個基于五層憶阻器的CNN 來用于MNIST 圖像識別, 該CNN 系統比最先進的圖形處理單元能夠高出2 個數量級以上, 且擁有更強的拓展性。
(2)VGG-5
VGG 模型主要是使用很小的卷積核(3×3)構建各種深度的卷積神經網絡結構, 并對這些網絡結構進行了評估,最終證明16~19 層的網絡深度,能夠取得較好的識別精度。VGG 整個網絡由卷積層和全連接層疊加而成,和AlexNet 不同的是,VGG 中使用的都是小尺寸的卷積核。VGG 模型雖然具有更簡單的結構, 但GPU 數少的情況下可能會需要訓練很久,以及其由于權重過多導致文件體積過大。
(3)GoogleNet
GoogLeNet 擁有網絡小、參數較少,性能相對優越等優勢,GoogLeNet 使用的是Inception 網絡結構,通常要提升CNN 的性能, 一般會選擇增大網絡,但這種方式會導致過擬合的概率增加且計算量會變大, 而GoogleNet 引入的Inception 模塊則可避免這些問題, 既可以維持網絡稀疏性又可以減少參數保證高計算性能,同時還能提升網絡的寬度和深度。
(4)DenseNet
密集卷積網絡(DenseNet)的特點在于密集卷積塊, 不同密集卷積塊則用卷積層和池化層連接,該稠密連接方式由于采取的不是特征相加而是特征拼接,加強了特征和梯度的傳遞,采用全局平均池化層來降低參數, 最終再用線性分類器來進行分類。 在密集卷積塊中,當前層之前的所有層的輸出都會參與到該層的輸入, 通過該方法可以有效的利用之前層的所有信息, 同時縮短了前層和后層之間的連接, 有效地解決了隨著網絡的加深而產生的梯度消失問題。
主流的幾種經典卷積網絡模型的優、 缺點對比結果見表1。

表1 各類卷積網絡模型對比
通常情況下, 場地是否受到污染需要根據污染評估來判定,但通過傳統方法成本較高,且擁有一定的滯后性。 近年來,在環境污染評估和預測領域,相關專家和學者開始把神經網絡中的各種模型投入到環境評估和預測的實際應用中, 相較于傳統的方法有了更強的準確性和時效性。 下面將從以下幾個角度分別綜述神經網絡在場地污染領域中的發展現狀和趨勢。
土壤質量評價是改善土壤生態環境質量、 完善管理體系、保持土壤生產力可持續發展的有效途徑。SHAO 等[20]提出了基于BP 神經網絡的土壤質量綜合評價SHM-BP 模型,將土壤樣品中的重金屬濃度輸入經訓練和驗證的SHM-BP 模型,得到土壤樣本的分類結果,該模型的準確率超過97%。 KEBONYE等[21]將自組織映射神經網絡(SeOM-ANNs)與條件高斯模擬相結合來識別漫灘土壤中的潛在有毒元素(PTE)熱點。 利用其將包含PTE 和土壤要素的158個土壤樣本進行可視化分類, 對其用k-means 進一步分類,該聚類產生了總共5 個聚類。隨后結合CGS來可視化研究區域的PTE 濃度,最終對研究區域的土壤質量進行評價。
神經網絡在土壤質量評價方面取得了較好的效果,相較于傳統的評價手段時間更短,準確率更高,可以有效的促進土地的評估和監測。
由于各種工業活動產生的廢氣、 廢液和廢渣排放及泄漏導致大量重金屬進入土壤環境, 造成土壤污染,并且重金屬具有性質穩定、難降解和毒性強的特點,容易被土壤吸附并不斷累積,進而威脅人類健康[22]。 土壤中重金屬含量與土壤污染的控制直接相關, 但由于人力物力的限制, 很難對其進行詳細檢測, 因此通常需要根據現有數據預測未知區域的土壤重金屬含量, 所以近年來各種神經網絡模型被用于解決該類問題。
郭飛等[23]首先用主成分分析法提取高光譜數據中的主成分作為特征變量,然后選擇ANN 模型以及其他三個模型構建經篩選過后的特征變量和Cd 含量的關系,接著再用決定系數、均方根誤差和RPD評價模型的擬合精度。結果表明,該神經網絡模型取得了較好的擬合效果。 同樣利用高光譜遙感結合神經網絡模型的還有王雪梅等[24],以不同變換處理下的特征波段反射率作為自變量, 土壤鉻含量為因變量,采用多元線性逐步回歸、偏最小二乘回歸、BP 神經網絡和隨機森林回歸方法構建土壤重金屬鉻含量的高光譜估測模型, 并對最優估測結果進行克里格空間插值。 在該研究中,通過與其余模型進行對比,經處理后的BP 神經網絡模型估測精度和穩定性高于其他模型, 可作為研究區土壤重金屬鉻含量的最優估測模型。
任加國等[25]將研究區域選擇在某金屬加工廠中受到污染侵蝕的場地, 運用多元統計方法分析土壤樣品中重金屬和多環芳烴之間的關聯性, 并以此為基礎,利用已知數據樣本訓練BP 神經網絡模型,預測缺失土壤樣本中重金屬和PAHs 的含量。 結果顯示, 區域的土壤重金屬和PAHs 含量有一定的超標現象, 該研究建立的BP 神經網絡模型對污染物濃度預測結果獲得較為理想的數值, 再次證明了BP神經網絡對土壤中重金屬含量預測效果較好。
在土壤重金屬含量預測方面, 神經網絡模型依舊表現出了較好的效果, 擁有較強的穩定性和預測精度。不足之處在于對于訓練數據集的要求較高。綜合上述文獻, 整理相應的改進神經網絡模型對土壤重金屬含量估測結果見表2。

表2 文獻中模型估測結果
地下水系統作為一個開放系統, 與外界因素有著密切而復雜的關系,特別是在污染遷移過程中,土壤中的污染物質向地下水中遷移,造成地下水污染。并且由于地下水的徑流、排泄以及地下水位的波動,污染物質又反過來浸潤土壤。因此,地下水污染風險評價是一個復雜的問題, 同時地下水污染風險模擬是防治地下水污染的重要手段。 開展地下水污染評價, 不僅可以全面探討地下水污染與人類社會實踐的關系,還可以及時確定地下水污染的重點區域,能夠為地下水資源的管理和保護提供科學依據[26]。
在地下水污染評價這方面,袁瑞強等[27]采用綜合指數法、主成分分析(PCA)法和BP 神經網絡法對地下水雨、旱季水質進行了綜合評價,結果表明,BP神經網絡法適合整體水質評價, 評價結果最合理。GAD 等[28]在多元分析、人工神經網絡模型和地理信息系統技術的支持下,使用指數化方法(如飲用水質量指數(DWQI)和健康指數(HI)),對El Kharga 綠洲努比亞砂巖含水層(SSA)的地下水質量進行了評估。結果顯示,ANN-SC-13 是最準確的評估模型,因為它顯示了其特性與DWQI 之間最強的相關性,該模型的13 個特征對于評估DWQI 非常重要。
地下水污染對飲用水安全和生態環境構成威脅。由于地下水污染的隱蔽性和復雜性,地下水修復方案的設計、風險評估和污染責任識別非常困難。因此, 研究地下水污染源的反演識別和地下水污染的擴散預測具有重要意義。 同樣有很多學者利用神經網絡模型進行了地下水污染的溯源和模擬。
PAN 等[29]以撫順市某煤矸石堆放場為研究區,根據研究區的實際條件建立地下水污染質運移模擬模型,模擬地下水污染質未來時空變化特征,對地下水污染源源強及場地的滲透系數進行反演識別。 研究表明, 應用BP 神經網絡方法建立替代模型的輸出結果平均相對誤差為1.5%, 利用BP 神經網絡模型對污染源源強和滲透系數進行同步識別精度可以滿足實際需求。
ALKINDI 等[30]使用貝葉斯方法(如貝葉斯廣義線性模型(BGLM)和貝葉斯嶺回歸(BRR))來模擬地下水硝酸鹽污染,用11 個地下水硝酸鹽調節因子來作為模型的輸入參數。結果表明,該研究的地下水硝酸鹽模型比其他模型更有效, 并且鉀在模型中的重要性最高,其次是降雨量、海拔、地下水深度和距居民區的距離。 該研究結果可為控制和減少硝酸鹽污染源提供決策支持。
近年來, 神經網絡結合環境污染模擬和評估進行數據分析的研究成為熱點, 神經網絡模型在土壤質量評價、土壤重金屬含量預測、地下水污染評價、地下水污染源溯源和擴散模擬等多領域中展示出超強的數據挖掘和分析能力, 能夠在保證數據精度的同時,減少相應的實驗成本,并且擁有較為理想的模擬精度和污染評估效果。 本文首先對神經網絡原理和應用較為廣泛的幾個模型進行了介紹, 然后著重從各應用方面對神經網絡在場地污染的模擬和評估領域的相關改進模型的應用進行了介紹。 神經網絡在場地污染領域或者更大環境污染的模擬和評估領域還有巨大的開發和應用空間, 目前可以總結為以下幾個方面:
(1)在使用神經網絡模型對地下水污染進行反演識別時,隨著變量靈敏度的增加,精確度也隨之受到影響而增加。 并且觀測井的位置對地下水反演識別的精度也有一定的影響, 在以后的反演識別研究應重點關注位置對于檢測精度的影響。
(2)目前各文獻均顯示神經網絡模型在場地污染領域取得了較好的效果, 但是如果模型受到外界環境因素干擾的話, 或者獲取的污染樣本不太理想的話,均會導致模型精度不高。 因此,用相關模型去處理實際的應用問題還存在一定的差距, 即神經網絡泛化能力還有所欠缺, 今后可從該方面展開相關研究。
(3)目前改進神經網絡模型的角度均著眼于拓展模型深度和寬度, 但如果局限于具體的污染評估需求時,則不能取得理想的效果,未來的研究方向可以針對污染物的特征做區分的模塊化結構, 構建更加符合實際需求的模型。