王重陽,馬菁華,吳睿鈺,嚴澤凡
(1華北理工大學 化學工程學院 河北 唐山 063000)
(2華北理工大學 信息工程學院 河北 唐山 063000)
建立主要理化因子和常見浮游生物致害密度發生關系的模型,并預測出水華發生的時間。本文選取BP神經網絡模型來求解,經過查閱相關資料后,本文考慮浮游生物的致害密度主要選取浮游植物(藻類植物為主)的數量作為評判指標,即輸出因子。并經過對所給數據進行回歸分析和主成分分析,得到了互相關聯度小但與輸出因子相關的6個環境因子:水溫、總氮、總磷、溶氧、PH值、COD,即輸入因子。再確立輸入因子與輸出因子后,建立合適的網絡結構以及訓練算法。
將浮游植物的數量作為評判水華爆發的指標,為得知水華發生的時常見主要理化因子的范圍,本文從敏感性分析加以入手,即采用多因素敏感性分析法,分析多個環境因素共同影響下,每個指標分別對水華爆發的影響,從而得知當水華爆發時不同理化因子的范圍。
(1)BP神經網絡模型
BP神經網絡由兩個過程組成,包括信息的正向傳播和誤差的反向傳播。利用輸出層的誤差來估計輸出層的直接前導層的誤差,再利用這一誤差來估計更前一層的誤差,它能不斷的學習和存貯大量有關輸入—輸出模式的映射,且不需要直接描述這種關系的方程。
由于標準的BP神經網絡算法收斂速度慢,很容易造成局部范圍的極小值,大量基于BP神經網絡的算法被提出,本文特別采用有動量法和自適應學習速率梯度下降法。

附加動量法是將每一個權值的變化在加上正比于上一次權值變化的值,最后利用反向傳播法產生新的變化的權值。即公式:為誤差函數梯度;n為訓練次數;α為動量因子。其主要意義是使網絡避免產生局部極小值,使得權值的改變向誤差曲面底部平均變化。
自適應學習速率梯度下降法是學習速率因誤差的變化而進行自適應改變。為了增加其穩定性和提高收斂速度,特別采用以下公式的學習速率自適應調節機制:

其中E(n)表示第 n 步的誤差。
(2)模型的敏感性分析
敏感性分析是指在多個因素共同影響下,每個不確定因素對某個項目的重要度的分析,是一種能夠定量分析模型中輸入因子與輸出因子關系的方法。令模型中輸入因子的值不斷變化,分析其改變對輸出因子的重要性程度,且將其重要性程度的大小稱為敏感性系數。本文只選用均方根方法:

其中Si,k為輸入因子Xi對輸出因子yk的敏感性系數,T為樣本數。當神經網絡模型中訓練完成后,確定唯一權重后,便可以得到每個輸入因子的全樣本系數。
(3)找出最大敏感因素,并進行分析和采取相關措施,以達到對水華的提前預警。
(1)確定輸入因子
本文通過對浮游生物致害密度(以浮游植物密度為參考)的影響指標做回歸分析和主成分分析,將水溫、總氮、總磷、溶氧、COD、PH值作為浮游生物致害密度的影響因素進行水華爆發的預測。這六個指標即為輸入因子。
(2)確定網絡模型
本文選取3層BP神經網絡來建立水華爆發預測模型,將上述輸入因子作為輸入層神經元,隱含層節點數20,輸出節點數為1,即表示浮游植物總量水華預測神經網絡模型如圖1所示。

圖1 浮游植物總量水華預測神經網絡模型
本次研究主要選取了8周數據作為學習樣本,其中六周作為訓練樣本,剩下2周作為檢驗樣本。見表1。

表1 浮游植物總量學習樣本基本數據
(3)學習樣本訓練及其預測結果
設置基本參數,最小均方誤差10-6,學習率0.01,動量系數為0.95,最大訓練次數為10000,將表中的數據作為訓練樣本輸入,浮游植物總量作為目標結果進行學習。建立的該網絡經過了5986次學習后精度符合要求。下表對預測結果和實測值進行了比較。見表2。

表2 神經網絡實測值與結果對比
由表2可知,最大相對誤差的值為9.1%,最大絕對誤差為,其精確度最低為90.9%,精確度非常高,這表明,針對浮游植物總量預測BP神經網絡模型表達了水華爆發與各個常見主要理化因子之間存在內在規律與聯系。
(4)敏感性分析
考慮到不同理化因子的單位不同,為了使各個理化因子之間的敏感性系數有可比性,所以將輸入因子和輸出因子均歸一化,然后將其結合水華爆發預測模型進行分析。由全樣本敏感性系數可知,水華的爆發并不是受單一因素的影響而發生的,而是受多個因素的共同影響而造成的,其中總氮是最大的影響因子,它的全樣本敏感性系數的值為0.24,依次是總磷、溶氧、水溫、COD、PH值,敏感性系數分別為0.21、0.2、0.17、0.1、0.05。
本文采用結構簡單的有動量和自適應性學習速率下降法的BP神經網絡模型,可以很好的模擬水華發生時候的情況,以及預測水華發生的時間,1周、3周、5周、7周、9周、11周、13周、15周的預測精度分別達到99.46%、92.65%、91.67%、94.8%、93%、90.9%、93.78%、97.18%,具有很高的精確度,為預測水華發生提供了高效的措施。而且建立的BP神經網絡模型構出的預測值與實際值能夠很好的貼合,說明神經網絡模型能將水華爆發同相關常見主要理化因子之間有內在聯系與規律。
基于水華爆發的BP神經網絡模型,水華成因分析利用了偏導敏感性分析法,克服了神經網絡模型不能定量解釋的缺陷,同時,本文考慮到各種環境因素均會相互轉換、影響,所以本文利用全樣本敏感性分析法對不同因素下,單個因子對輸出因子的影響,以及其具體范圍。水華爆發時其常見主要理化因子的范圍即理化因子與輸出因子的全樣本敏感性系數達到最高,所以水華爆發時,水溫的范圍為27℃~29℃;總氮的范圍為1.8g·kg-1~2.0g·kg-1;總磷的范圍為6.5g·kg-1~7g·kg-1;COD的范圍為25~27mg/L;PH值的范圍為9.25~9.35;溶氧的范圍為 5.5~ 6.5mg/L。