張 彥
(河北省保定水文水資源勘測局,河北 保定071000)
水資源是人類賴以生存的物質基礎,而水環境則是維持生態環境與社會經濟協調發展的基礎。隨著社會經濟的飛速發展,水資源緊缺,水體被嚴重污染,水環境日益惡化,已嚴重阻礙人類社會和經濟的持續發展[1]。因此,水環境承載力(Water Environmental Capacity,WECC)的研究對于區域的水環境與社會經濟的可持續發展具有重要意義。
WECC量化評價方法目前有多種研究方法,主要研究方法有模糊綜合評判法[2]、主成分分析法[3]、投影尋蹤模型法[4]、多目標決策法及人工神經網絡法[5]等。由于WECC涵蓋眾多領域之間復雜的非線性關系,而人工神經網絡的方法對于非線性問題具有強大的處理能力。到目前為止,神經網絡技術已廣泛應用于多種領域,但是基于人工神經網絡的WECC的評價文獻較少,主要是應用BP(Back Propagation)神經網絡對不同區域進行建模評價。胡榮祥、徐海波等[5]應用BP神經網絡對麗水市內河進行評價;楊麗花、佟連軍[6]應用BP神經網絡對松花江流域(吉林省段)的WECC進行評價;楊秋林、張淑貞[7]應用BP神經網絡對山西省WECC進行研究。本文選取應用廣泛的BP神經網絡、RBF神經網絡和Elman神經網絡分別建立對保定市WECC的評價模型,并進行對比研究。旨在尋找更適合WECC評價的人工神經網絡模型,為探尋人工神經網絡在WECC評價上的應用提供科學的參考依據。
BP神經網絡是由Rumelhart和McClelland為首的研究小組在20世紀80年代末提出的一種誤差逆向傳播的多層前饋型網絡[8],是目前為止應用最廣泛的神經網絡之一。網絡結構一般由輸入層、隱含層和輸出層組成[9],其中隱含層為一層或多層,一個3層的BP神經網絡能夠逼近任意一個連續函數或映射。本文選用單隱層的3層BP神經網絡,其網絡模型結構如圖1。

圖1 BP神經網絡模型結構
BP神經網絡的基本運算過程分為輸入信號正向傳播和誤差反向傳遞兩個部分。在正向傳播過程中,輸入信號由輸入層前向傳遞到隱含層,再經過傳遞函數運算處理將結果傳給輸出層;學習算法采用梯度下降法原理,當實際輸出與期望輸出存在誤差,則算法將誤差轉入反向傳遞,并逐一調整各層連接權值來不斷減小誤差,這樣不斷迭代訓練,最終使網絡的誤差均方值達到精度要求[10]。
徑向基神經網絡又稱為RBF神經網絡,是1989年由J.Moody和C.Darken提出的,借鑒人腦局部協調、相互覆蓋接收域的一種前饋型網絡[11]。其具有學習規則簡單,網絡結構簡單,收斂速度快的優點,當具有足夠多的隱層神經元時網絡可以以任意精度逼近任意的線性或非線性函數。
RBF神經網絡是一種具有單隱層的三層神經網絡,由輸入層、徑向基函數隱含層、輸出層組成,其網絡模型結構如圖2。

圖2 RBF神經網絡模型結構
第一層輸入層(x1,x2,…,xm)由信號源節點組成,信號由輸入層通過徑向基變換函數φ(x)實現輸入到隱含層的非線性映射傳導。隱含層變換函數有高斯函數、多二次函數和模板樣條函數等[12],其中最為常用的徑向基函數為高斯函數。隱含層到輸出層是通過對隱含層的輸出和與之對應的連接權重(w1,w2,…,wn)的乘積進行線性加權f(x)后輸出來作為神經網絡的最終輸出。
Elman神經網絡是J.L.Elman在1990年針對語音處理問題提出來[13],是一種典型的反饋型神經網絡模型。Elman神經網絡結構一般由輸入層、隱含層、關聯層、輸出層4層組成,輸入層起到信號傳輸作用,隱含層傳遞函數有線性函數和非線性函數兩類函數,一般采用正切sigmoid型非線性函數。關聯層和隱含層節點一一對應,將記憶上一時刻的隱含層狀態和當前時刻輸入一同作為隱含層輸入,起到延時記憶功能,從而使系統具有處理動態信息的能力。關聯層和輸出層的傳遞函數均為線性函數。當隱含層神經元足夠多的時候,Elman網絡可保證網絡以任意精度逼近任意非線性函數。其結構如圖3。

圖3 Elman神經網絡模型結構
圖3中,u為輸入向量,x為隱含層向量,xc為承接層向量,w1,w2,w3分別為輸入層到隱含層、承接層到隱含層、隱含層到輸出層的連接權值。
WECC的影響因素涉及人口與水資源、社會、經濟及生態環境等眾多方面。建立的評價系統應全面涵蓋各個系統對水環境的影響。本文以保定市作為研究對象,結合保定市實際水環境狀況并查閱大量參考文獻,評價指標的選取遵循科學性、客觀性、代表性、可量化性和數據的易獲取性原則,從WECC涉及的人口與水資源系統、社會經濟系統和生態環境系統中選取了10項評價指標,構建了保定市WECC指標評價系統。
對選取的評價指標制定WECC分級評價標準,確定評價分級標準值的依據。
(1)優先參考國家標準或地方標準。
(2)依據參考文獻并根據本地區實際情況確定評價標準。
(3)在無任何標準、文獻可參考時,咨詢專家采用經驗值。
依照分級原則,對選取的評價指標進行分級,根據WECC的強弱程度共分為強承載、較強承載、較弱承載和弱承載共4個等級,并用Ⅰ、Ⅱ、Ⅲ和Ⅳ代表。每個指標的各個等級所對應的標準范圍如表1。其中Ⅰ級定義為區域水環境具有很強的承載能力,水環境能夠很好地支撐人類社會經濟活動,生態環境良好發展,三者之間處于良好的協調發展狀態;Ⅱ級定義為區域水環境有較強承載能力,水環境能較好的支撐人類社會經濟活動,生態環境較好發展,三者處于較協調發展狀態,但應關注水環境問題,防止人類社會對水環境的進一步影響,保證水環境持續健康的發展;Ⅲ級定義為區域水環境承載能力較弱,水環境對人類社會經濟活動支撐能力較弱,生態環境遭到一定程度的破壞,三者不能協調發展,應進一步加大對環境的治理程度;Ⅳ級定義為區域水環境承載能力很弱,水環境完全喪失了對人類社會經濟活動的承載能力,生態環境破壞嚴重,有發生水環境危機的可能。保定市WECC評價指標分級如表1。

表1 水環境承載力評價指標及分級
3種神經網絡的建模工具選用Matlab(R2016a)軟件,Matlab軟件是美國MathWorks公司出品的商業數學軟件,是國際上公認的數據計算和非線性動態系統建模和仿真的最優秀軟件之一。
由于實驗樣本數據有限,為了提高網絡模型的性能和泛化能力,需要生成足夠多實驗樣本來訓練神經網絡,因此本文選用unifrnd函數在評價指標相應級別之間進行隨機插值,每個分級區間隨機生成200組樣本作為輸入樣本。
將WECC的等級作為理論輸出值,用1,2,3,4分別代表WECC的Ⅰ,Ⅱ,Ⅲ,Ⅳ4個級別,也同樣用unifrnd函數在輸出值之間隨機生成200組與輸入值對應數值。另外,為了消除不同量綱的影響,提高網絡的訓練速度,需對輸入和輸出樣本采用mapminmax函數歸一化到[0,1]。
在確定輸入輸出樣本集后需要構建BP神經網絡模型,網絡結構采用輸入層、隱層、輸出層的三層網絡結構。根據選定的評價指標個數確定輸入層為10個神經元,輸出層為1個神經元。
應用MATLAB中newff函數創建模型網絡結構,選用tansig正切函數作為輸入層和隱層之間的激活函數,選用purelin線性函數作為隱層和輸出層之間的轉換函數,將L-M優化算法的trainlm函數作為訓練函數。最大終止訓練步數設置為2000,學習速率設置為0.01,期望誤差目標值的選定依據是通過訓練網絡而達到默認梯度函數值時的網絡誤差值。最終期望誤差設定為1.0×10-11,其他參數選用默認值。
隱層神經元個數對神經網絡訓練的精度有很大影響,一般采用經驗公式或試湊法確定。本文通過經驗公式確定大概范圍,其中,N為隱層神經元數,p為輸入層節點數,m為輸出層節點數,q為1~10的常數;然后通過訓練不同隱含層神經元個數下訓練誤差最小時的隱含層神經元數,最終確定為7。
RBF神經網絡模型網絡結構采用輸入層、隱層和輸出層3層結構。輸入層和輸出層與BP神經網絡相同。利用MATLAB中的newrb函數建立RBF神經網絡,隱含層徑向基傳遞函數為radbas函數,輸出層的函數是purelin線性函數。其中隱含層神經元數從0開始,根據比較網絡的輸出誤差而自動添加,直至達到目標誤差或最大隱層神經元數為止。在建立模型中影響網絡訓練效果的是目標誤差goal 和分布常數spread。當目標誤差設定太小時,網絡會增加隱層神經元數目以達到設定目標,這樣容易出現過擬合;而分布常數太小時,雖然會提高網絡的訓練精度和速度,但也容易出現過擬合現象。因此,經過多次訓練調整,目標誤差設定為0.01,spread設定為5。
Elman神經網絡的結構與BP神經網絡相同。應用MATLAB軟件調用newelm函數創建網絡結構,其他設置均與BP神經網絡相同。
3種神經網絡建模完成以后,將輸入項和目標項帶入神經網絡進行訓練,分別將3種模型的訓練集和測試集的平均相對誤差和均方誤差作為模型性能對比,平均相對誤差衡量的是模型預測結果的可信度,均方誤差衡量的是觀測值與真值之間的偏離程度,結果如表2。

表2 3種模型擬合精度對比
由表2得出,RBF神經網絡訓練集和測試集平均相對誤差和均方誤差均明顯小于BP神經網絡和Elman神經網絡,說明其擬合精度和預測精度均明顯小于后者。BP神經網絡和Elman神經網絡的訓練集和測試集的擬合精度均無明顯的區別,兩個神經網絡的擬合精度都很高,擬合誤差穩定、可靠,泛化能力強,均適合作為WECC的評價模型。
模型訓練完成后,將2001~2016年保定市WECC相應評價指標對應的數據作為輸入項輸入到訓練好的網絡模型中進行評價,評價結果如表3。

表3 保定市水環境承載力評價結果
評價結果可知,3個神經網絡模型評價結果一致。2007年以前(2004年除外),保定市WECC水平一直處于弱承載水平,水環境惡化嚴重,已經不能承載社會經濟的可持續發展;2008年以后保定市WECC有所好轉,但還處于較弱承載水平,水環境仍不能與社會經濟和諧發展,仍需進一步加強水環境治理,提高用水效率,保證水環境和社會經濟的可持續和諧發展。
(1)對3種神經網絡建立的水環境承載力評價模型進行了對比,仍需對其他神經網絡進行探索研究,并對合適的神經網絡模型進行優化,以期建立擬合精度更高,更加穩定可靠的水環境承載力神經網絡評價模型。
(2)由于受收集的數據限制,所選擇的保定市水環境承載力的評價指標數量有限,并不能全面涵蓋與水環境承載力相關因素,今后需進一步豐富完善保定市水環境承載力的評價體系,以期使保定市水環境承載力評價更加全面客觀。