嚴亞萍,王剛,姜盛基,徐敏
(蘭州交通大學 環境與市政工程學院,甘肅 蘭州 730070)
人工神經網絡(ANN),又可稱為神經網絡,是模擬生物神經網絡建立的一種進行信息處理的模型[1]。通過模擬動物大腦的機理和機制,同時結合動物神經網絡的行為特征來實現信息處理。人工神經網絡具有非常廣泛的研究內容,也是多學科領域相互交叉的一個重要體現。由于其具有高度的并行結構、并行實現能力、非線性處理能力、自學習能力、自組織性、自適應性等特點[2],所以在很多領域得到越來越多的應用,并取得了一些令人矚目的成就,比如其在模式識別、人工智能、計算機科學、機器人、自動控制、信息處理、CAD等方面[1]都有極大的應用價值。尤其在因素眾多、成分復雜的環境系統,人工神經網絡能以其對復雜系統非線性問題強大的學習能力彌補常規數值計算方法的不足,凸顯出了絕對的優勢。目前已有諸多學者成功地將ANN應用于環境領域的很多方面,表明其在環境領域的研究已初步打開了良好的局面,并將具有廣闊的應用前景。
人工神經元是人工神經網絡的基本單元結構,也是設計神經網絡模型的基礎,圖1為人工神經元的模型,其本質是由多個小的非線性函數組成一個大的非線性函數,反映的是輸入變量與輸出變量之間復雜的映射關系,具有非線性、非定常性、非凸性、非局域性[3]等特征。

圖1 人工神經元模型
人工神經網絡最初的雛形于20世紀中期被提出來,大致經歷了三個階段:①萌發期:1943年,美國心理學家W.S.McCulloch和數學家Walter Pitts第一次提出了簡單的神經元網絡模型,從此開啟了神經網絡科學研究的新紀元。②反思期:1969年,有學者提出感知器存在巨大漏洞,甚至不能解決邏輯異或的問題,為感知器判了死刑,導致不少研究人員轉變了研究方向,從此人工神經網絡的發展進入低迷期。③恢復期:美國物理學家Hopfield于1982年提出了著名的離散型神經網絡模型(Hopfield模型),同時在這一時期另一個代表模型——多層網絡的誤差傳播學習法算法(BP)的出現,使神經網絡的發展又掀起一股高潮,進入了恢復期。
現已開發出的人工神經網絡模型已有30多種,其中以BP網絡模型最具代表性,是目前應用最廣泛的人工神經網絡模型。除此之外還有感知器網絡模型、線性神經網絡模型、徑向基函數網絡模型(RBF)、反饋網絡模型、自組織網絡模型(SOM)、控制系統網絡模型等也是比較常見的幾種類型,表1列舉了幾種常見模型及其對應的功能。上述各種模型都是為了解決特定問題而提出的,所以每一種模型都具有各自的功能[4]。

表1 常見的人工神經網絡模型及其功能
環境領域中的各因素間大多具有非線性,這也是自然界具有的普遍特性,所以ANN具有非線性這一特性對于解決環境質量預測、環境質量評價、污染建模等問題有很大的優勢。隨著人工智能的迅速發展,應用于環境領域的人工神經網絡模型也日漸豐富,但目前應用最多的仍然是BP模型,此外RBF、 感知器網絡模型、前饋網絡模型也多有涉及。BP模型和RBF模型是針對模式識別、分類等問題的代表模型,均可用于環境質量預測和環境質量評價,但BP模型多用于環境質量預測和環境監測;RBF由于其在分類方面的能力優于BP模型,更多地用于環境質量評價時的等級分類問題。
在人工神經網絡沒有興起之前,人們普遍采用數值計算法和統計分析法這兩種傳統方法來進行環境質量預測,由于環境系統因素的復雜性和非線性,傳統的預測方法并不能很好的解決此類問題,而且傳統方法靈敏度不高,需要花費大量的時間和精力。在20世紀80年代人工神經網絡興起后,人們逐漸認識到它的優勢和便捷,所以近年來已有越來越多的學者對ANN在環境領域的應用做了相關研究。
2.1.1 環境空氣質量預測 在環境空氣質量預測方面,大多集中于對SO2、CO2、PM2.5等幾種常見的大氣污染物的預測。
郭慶春[5]對基于神經網絡的大氣污染預測進行了總結,結果表明在大氣污染預測的應用中,人工神經網絡較傳統預測方法具有諸多優勢,比如預測速度快、預測精度大、容錯性強、動態自適應能力強等。Bashir等[6]提出了支持向量機、M5P模型樹和人工神經網絡三種機器學習算法,并將它們應用到城市大氣污染監測預報系統,對地面O3、NO2、SO2濃度進行預測,在大量的實驗基礎上發現M5P算法具有樹狀結構效率高、泛化能力強的特點,而人工神經網絡由于在具有許多屬性的小數據集上的泛化能力差導致復雜網絡過度擬合,預測效果最差。Dunea等[7]介紹了應用地面O3、CO2和TSP時間序列的各種前饋神經網絡(FANN)和小波前饋神經網絡(WFANN)在四個監測站的篩選,結果顯示由于時間序列的特異性,NO2很難建模,FANN對O3的預測結果良好,兩種模型(FANN和WFANN)對PM2.5的預測值都偏高。
蒲國林等[8]將人工蜂群算法與反向傳播神經網絡相結合,即將反向傳播神經網絡模型進行改進,用來預測四川達州市2016年空氣質量,結果表明,該混合算法的效果要比未進行改進的反向傳播神經網絡算法好,預測精度也更高,實現了一種較為理想的空氣質量預測模型。高宇航[9]選取南京市2015年10月~2016年8月的空氣污染濃度,以此為數據集成功建立了空氣質量預測模型,該模型以BP模型為主體,但鑒于BP網絡還不夠完善,因此對它進行了進一步的改進,提出了基于貝葉斯正則化改進的L-M神經網絡,經證明比傳統的BP神經網絡空氣質量模型在很多方面(包括預測精度、收斂速度、學習能力、訓練速度等)都有顯著的提升。
Sousa等[10]采用基于主成分分析的多元線性回歸模型(PCR)和基于主成分分析的前饋神經網絡(PC-FANN)來預測葡萄牙波爾圖地區第二天的O3濃度,結果表明PC-FANN對O3的預測結果更準確,同時采用主成分分析法會提高人工神經網絡的精度。申浩洋等[11]選取西安市雁塔區小寨區域的環境空氣監測數據構建了BP人工神經網絡預測模型,并用實際監測數據對人工神經網絡模型進行檢驗,結果表明BP神經網絡模型可以準確地預測SO2日均濃度,即用BP人工神經網絡來預測SO2的 24 h 質量濃度是可以實現的。Oduro等[12]提出了一種基于MARS和ANN模型的汽車CO排放評估方法,將MARS算法與L-M優化的神經網絡模型進行比較發現ANN模型表現出良好的預測性能,而MARS的預測精度略低。安帥等[13]也以BP神經網絡為模型預測某煉廠催化裂化裝置尾氣中SO2的每小時質量濃度,結果同樣驗證了該模型有較好的可行性和較高的精確度,可以用來預測SO2濃度的變化趨勢。
楊帆[14]建立了三種CO2通量預測模型,分別是基于個體變學習率優化的BP神經網絡模型、基于粒子群優化的BP神經網絡模型、基于遺傳算法的BP神經網絡模型,對結果對比后發現,其中基于遺傳算法的BP神經網絡CO2通量模型預測效果最好,無論從訓練速度、學習能力、準確度等方面都有較優的性能。Franceschi等[15]為了預測哥倫比亞波哥大當地的PM2.5和PM10濃度,從監測網的13個站點收集了2010~2015年期間的監測數據,并用主成分分析法和K均值聚類法確定了神經網絡模型的輸入變量,進而建立了PM2.5和PM10預測的神經網絡模型,結果表明此模型適用于預測高濃度污染的肯尼迪站每小時PM2.5和PM10,因此,可以進一步考慮將數據挖掘技術與確定性模型相結合來建立小時預測模型。付彥麗[16]建立了三種人工神經網絡模型來預測PM2.5的質量濃度,分別是BP神經網絡、T-S 模糊神經網絡、遺傳算法優化的神經網絡,對比分析這三種方法后仍然發現遺傳算法優化的神經網絡在預測PM2.5質量濃度時效果最佳。
林承勇[17]選取國內三個代表性城市——北京、武漢、廣州為研究區域,并以2014年的歷史監測數據對PM2.5濃度預測進行建模,構建了三種神經網絡模型,包括時間序列網絡模型、基于MIV雙BP網絡模型和粒子群優化的雙BP網絡模型,從預測效果來看,這三種模型都可以實現不錯的預測效果,其中基于粒子群優化的雙BP網絡模型對PM2.5濃度的預測效果最為突出。Huang等[18]以石家莊空氣質量監測站的數據為基礎,結合數據挖掘技術,建立了神經網絡模型來預測大氣污染狀況,研究表明該模型具有較高的預測精度,能較好地滿足實際應用的需要,可為環境保護部門提供可靠的決策依據。綜合上述的研究結果可以發現基于遺傳算法優化的BP神經網絡模型整體效果要優于其他模型。
2.1.2 環境水質預測 神經網絡模型除了可以預測空氣質量濃度,還可以用于水質預測,例如地下水水質預測、地表水水質預測。
劉宇同[19]用BP神經網絡預測了2014年黑龍江斷面的水質,以2005~2013年黑龍江斷面的監測數據為數據集建立了模型,然后再用此模型預測2014年黑龍江的斷面水質,通過與實際監測數據的比較,該模型具有較好的預測效果,說明BP神經網絡預測地表水質是可行的。Kim等[20]采用幾種聚類方法,來減輕訓練數據集的不平衡,進而建立了一個神經網絡集成模型,并將其應用于洛東江桑東站水質變量的預測,結果發現所有的聚類神經網絡模型都比不聚類的模型有更好的預測效果。Bui等[21]采用人工神經網絡預測越南Dau Tieng水庫的藍藻水華,將pH、溶解氧、溫度、總溶解固體、總氮、總磷、生化需氧量和化學需氧量作為輸入,三個藍藻屬(項圈藻、微囊藻和顫藻)作為三層前饋反向ANN的輸出,預測結果令人滿意,實驗值與預測值之間存在較低的誤差和較高的相關系數,對所建立的神經網絡的敏感性分析表明,總氮和溫度對微囊藻毒素濃度的影響最大。
神經網絡用于環境質量評價時,一般在水質模型評價方面應用較多。萬雅虹[22]建立了BP神經網絡、概率神經網絡、遺傳算法優化的神經網絡模型,并對吉林省敦化新甸段的地表水水質斷面進行了水質評價,研究表明用遺傳算法優化后的神將網絡顯示出了巨大的優勢,證明了其用于水質評價的可行性。
Salari等[23]采用美國密歇根州灣監測站的數據,建立了基于最小二乘法的數學模型和前饋神經網絡兩種模型來模擬水質參數,通過驗證發現,數學建模的優點是使用簡單,可以直觀地對兩個或多個參數進行敏感性分析;而人工神經網絡具有用普通數學方法無法解決復雜關系的建模能力,而且在大多數情況下,與數學方法相比,神經網絡具有更準確的評價結果。黃斌[4]在評價沅江中上游水質狀況時,先用傳統評價方法對1994~2003年沅江的水質情況做了評價,然后又建立了水質評價神經網絡模型、湖泊富營養化神經網絡模型和總磷濃度預測模型對沅江的水質、五強溪的富營養化狀況進行進一步的評價并同時預測了它的總磷濃度,結果表明采用神經網絡對水質狀況評價的效果要比傳統的評價方法(如單因子分析法、主成分分析法、季節性肯達爾檢驗法等)理想,評價結果更準確,比較符合水質的實際情況。
李哲等[24]將BP神經網絡應用到富水性評價中,對陜北神府礦區的風化基巖層進行了富水性評價,最后得出富水性結果有5個等級:弱富水區、較弱富水區、中等富水區、較強富水區、強富水區。李世明等[25]運用BP神經網絡來評價太湖的藍藻水華狀態,研究表明評價結果與實際情況相符合,即證明了BP神經網絡用于評價水體富營養化的可行性。除了評價地表水水質,也有人將神經網絡模型應用到地下水評價中,例如鄒濤[26]在研究新疆某地區地下水水質情況時,就采用了BP神經網絡,而且其評價結果比綜合指數法、聚類分析和模糊綜合評價法等方法的科學性、準確度要高。
Khaki等[27]通過采用現有水質參數,來評估應用模糊神經系統和神經網絡模擬總溶解性固體和電導率水平的潛力,該研究以馬來西亞蘭加特盆地2008~2013年6年間的5個采樣站的水質數據進行分析,發現這些計算值與各自的地下水質量測量值之間存在密切的一致性。也有學者將神經網絡用于評價大氣質量,宋暉等[28]就將人工神經網絡用于大氣質量智能評價預警系統,利用該系統可以實現對大氣的自動預測,并對大氣質量及時做出智能評價,也可以通過監測局部的大氣污染趨勢對整個大氣系統做出預警。李祚泳等[29]以環境質量標準中的數據為訓練集,建立了BP神經網絡模型,然后用此模型來評價大氣環境質量,結果表明該方法比模糊數學法和灰色系統法的評價結果更科學、更合理。
神經網絡在環境評價中最常規的應用就是水質評價和大氣質量評價。此外神經網絡還被用于環境風險評價、生態脆弱性評價等方面。羅雨[30]為了評價溢油事故對海洋生態環境的損害和風險,以遼寧省盤錦港為研究區域,建立了RBF神經網絡模型,該模型可以計算出溢油的擴散范圍,進而評價對海洋生態系統的環境風險。肖歡[31]以四川省為研究區域,利用3S技術建立了生態脆弱性數據庫,并在此數據庫的基礎上建立了兩種生態環境脆弱性評價的神經網絡模型——即BP神經網絡和極限學習機模型,經驗證BP神經網絡的脆弱性評價效果更好,顯著性更高。劉永春[32]還將BP神經網絡模型應用于發動機生產作業環境綜合評價,該模型將專家的評價思想賦予到神經網絡的連接權值上,可以靈活、智能地對發動機生產作業產生的環境影響及對人體的舒適等級做出科學的評價。
環境監測內容廣泛,其中包含許多測定污染物的方法,例如分光光度法、X射線熒光法、色譜法等,這些傳統的方法大都具有一定的局限性。隨著人們對人工神經網絡的認識日趨成熟,便有不少學者嘗試著將人工神經網絡與傳統的測定方法結合起來。
Zupan等[33]采用了充分的例子來證實自組織神經網絡(K-ANN)和反向傳播神經網絡(CP-ANN)在監測方法中具有廣泛的應用領域,包括聚類、分類、映射、對象選擇、建模等,通過舉例歸納發現,K-ANN 和CP-ANN可以非常靈活地適應不同類型的問題,并且可以完成針對幾乎任何類型的任務,但不代表它在任何情況下都可以成功。申金山[34]首次開創了國內外尚未報道的基于人工神經網絡的分光光度法和液相化學發光分析法相結合的一種新型測量方法,該方法恰到好處地利用化學計量學可以對發光信號進行處理這一特點來彌補液相發光分析法選擇性方面的欠缺,為液相化學分光分析領域開辟了一條新途徑,作者認為在不久的將來,該方法一定可以被廣泛地應用和推廣,取得重要突破。
Li等[35]綜述了一些具有代表性的人工神經網絡模型,如反向傳播、徑向基函數、遺傳算法人工神經網絡等在X射線熒光光譜分析中的發展和應用,并詳細討論了神經網絡在過度擬合、泛化和算法效率等方面的性能,發現深度神經網絡可以有效地避免過度擬合的現象,而提高模型效率方面可以通過改進神經網絡來實現。
Benvidi等[37]設計了一種有效的人工神經網絡方法,用于分光光度法測定合成色素;該方法將遺傳算法和部分群優化算法相結合,對神經網絡進行優化,然后利用該算法處理吸光度和分析濃度之間的關系,結果表明該混合算法綜合了粒子群算法和遺傳算法的優點,能夠準確測定合成色素的著色劑濃度。
Hassaninejad-Darzi 等[38]提出了用偏最小二乘法和人工神經網絡兩種方法同時對三元堿性染料混合物進行紫外-可見分光光度定量,結果表明,偏最小二乘法和人工神經網絡均能較好地捕捉具有高重疊吸收光譜的組分之間的相互作用,且具有較高的精度,兩種算法的預測值與實際值之間具有良好的一致性(R2>0.997),表明提出的同時測定純樣品中三種堿性染料的方法的有效性。方正等[39]將遺傳算法和人工神經網絡結合,建立了誤差反向傳播神經網絡模型(GA-BP),并將其用于塑料樣本的光譜分析,成功地將塑料樣本進行識別,有助于塑料分類。由此可見,人工神經網絡可與環境監測中的多種測定分析方法相結合,提高了測定精度,并拓展了應用范圍。
近年來出現了不少學者將人工神經網絡拓展到環境化學的研究中,其中大部分集中于對環境化學中涉及的有機物結構的研究。
Zhang等[40]利用子集回歸的方法,建立了以電拓撲狀態指數(En)為函數的結構-保留定量關系(QSRR)的六元回歸模型和用六個結構參數作為輸入神經元的6∶8∶1型的反向傳播神經網絡結構,來計算114個多環芳香硫雜環的En,結果顯示,六元回歸模型的相關系數為0.989,說明該模型可靠性高,具有良好的預測能力;BP-ANN的相關系數為 0.996,可以得出BP-ANN的預測精度更高,預測結果要優于MLR-QSRR模型。
Ye等[41]為了評價硫酸根離子與痕量有機污染物反應的二階速率常數(k)在水處理系統中的去除效率,建立了多元線性回歸(MLR)和人工神經網絡兩種模型來測定硫酸根離子的k值,結果表明MLR方法對訓練集有較好的擬合性,且對驗證集有合理的預測性;相比之下,ANN有更高的統計穩定性,但預測效果較差。
Wei等[42]利用一種新的反應指紋圖譜方法,探討了神經網絡在有機化學反應類型預測中的應用;作者將預測因子與智能轉換相結合,建立了一個新系統,在給定一組試劑和反應物的情況下,預測可能的產物,結果表明,基于指紋圖譜的神經網絡算法能夠正確地識別出烯烴和鹵代烷烴反應范圍內大多數反應類型。
隨著人工智能的發展和人工神經網絡技術的日漸成熟,ANN幾乎已滲透到環境科學的不同領域,也就是說它在環境領域的各個方面幾乎都有應用。就目前的發展來看,ANN仍然在環境質量預測和環境質量評價領域的應用最為廣泛,但也有學者進行了一些開創性研究,將其應用于環境污染控制、生態建模、監測水體中的BOD、COD和溶解氧、污水處理建模等方面。
張建軍等[43]建立了遺傳算法與人工神經網絡相結合的算法模型,將其用于某關鍵部件的環境溫度控制系統,實現了對此關鍵部件的溫度響應曲線模擬。結果顯示,ANN的預測結果與實測結果相當接近,同時與傳統的PID控制方法相比,基于遺傳算法的人工神經網絡的控制效果要優于PID控制法,說明將遺傳算法ANN應用于環境控制系統的可行性較好。李勝海等[44]首次探索性地將遺傳算法(GA)與離散Hopfield網絡(DHNN)結合在一起,將其應用于水污染控制規劃優化方案中;在GA與DHNN選擇優化方案時,如果某一水體的某個控制斷面的某種污染物濃度超標,則會優先選擇降低該斷面污染物單位濃度所需的治理費用最少的方案,來達到最大化的環境和經濟效益,即尋求最優控制方案。
Ostad-Ali-Askari等[45]采用水質與人工神經網絡相結合的方法,對伊朗伊斯法罕Zayandeh Rood河邊緣地區地下水硝酸鹽污染進行了建模與評價。該模型以Zayandeh Rood河邊緣地區的100口井(77口農業井、13口飲用井和10口花園井)為研究對象,采用MATLAB軟件和三層感知器網絡進行建模,將反向傳播學習規則應用于訓練過程,經過多次實驗,發現具有一個隱藏層和19個神經元的網絡在測試過程中誤差最小。
Gebler等[46]利用人工神經網絡建立了河流生態狀況的預測模型,對河流大型植物指數(MIR)、河流大型植物生物指數(IBMR)和河流大型植物營養指數(RMNI)三個生態狀態指標進行了測試,此外,還測試了物種豐富度(N)和辛普森指數(D)兩個多樣性指數,研究了五種大型植物指數與水污染和水文地質退化的綜合影響之間的關系;分析表明,廣泛的水文形態變化對河流水生植物有較強的影響,且同時考慮水質參數和水文形態指標時,可以檢測多種因素對大型植物的影響,從而達到最佳的網絡建模質量。Jahani等[47]利用森林退化的生態和相關因素建立人工神經網絡模型來預測生態系統的退化,從而為人們提供一種環境決策支持系統來評估森林項目的環境影響;優化森林退化模型(OFDM)訓練的多層前饋網絡的結果表明,OFDM的性能要優于其他退化模型,同時該系統是一個智能的環境決策支持系統,它允許決策者模擬森林退化的標準,來達到并采用最佳的分配計劃;這就說明基于人工神經網絡的多準則決策分析(MCDA)法是解決MCDA問題的一種強有力的方法。

人工神經網絡由于其廣泛的適用性和強大的非線性處理能力,在環境領域的應用幾乎覆蓋了方方面面。能夠識別和學習輸入數據集與相應目標值之間的相關模式,經過訓練,還可以用來預測新的獨立輸入數據的輸出;有的模型也可以利用自身的分類功能用于環境質量評價和化合物的結構類型識別等,在很多問題上取得了令人滿意的結果。
但由于單一的人工神經網絡模型往往存在訓練時間長、收斂速度慢、欠擬合與過度擬合等缺陷,一般都會將人工神經網絡與別的算法結合進行改進,克服自身的不足,然后再進行應用。改進后的算法學習能力更強、速度更快、應用范圍更廣、效果也更精確。就目前的發展趨勢來看,人工神經網絡在環境領域的應用仍然主要集中于環境質量預測和環境質量評價,在環境監測方面的應用也有所增加,僅次于環境質量評價;不過近年來人工神經網絡在環境領域的應用范圍更加廣泛,例如在環境風險評價、生態脆弱性評價、環境毒理學、環境優化、污染防治系統建模等方面都逐漸有了應用。
在實用方面,雖然已有不少實際應用成果面世,但大多集中于機器人、醫學方面,在環境領域的應用并不成熟也很少見,所以要想真正普及人工神經網絡的應用,還需不斷提高計算機硬件設施,實現計算機神經網絡化。相信在不久的將來,人工神經網絡一定會被普及和推廣,在環境領域發揮巨大的實用價值。