劉煜輝,麥文杰,李小勇,趙銀中,何新忠,黃明智*
(1.佛山市南海區獅山鎮金迪水利投資建設有限公司,廣東 佛山 528225;2.華南師范大學環境學院 廣東省化學品污染與環境安全重點實驗室 教育部環境理論化學重點實驗室,廣東 廣州 510006;3.福建省環境保護設計院有限公司,福建 福州 350000)
廢水參數的獲取是廢水處理的第一步。一般的廢水參數主要有生化需氧量(BOD)、化學需氧量(COD)、pH、氨氮、磷、懸浮物、溶解氧、污泥涉及沉降比、濃度等。根據現有的廢水處理技術,主要是人工間接測量再進行計算去對水質參數進行檢測。這種方法耗時長,信息反饋具有一定的時滯性,會導致一些嚴重的后果。隨著計算機技術的發展,基于神經網絡的軟測量技術開始興起。該技術克服了人工測量的非實時性和耗時性,可對廢水進行實時監測,實現對廢水處理的智能控制。馮麗輝等[1]采用軟測量建模技術構造多元線性回歸模型,通過結合計算機模擬技術該模型能夠實現多個廢水出水水質參數的軟測量預測,仿真實驗結果表明,該模型的預測精度較高,有良好的擬合優度和一定的泛化能力。趙文文等[2]通過構建多核LSSVM模型并采用全局搜索能力較為出色的粒子群(PSO)算法對模型的超參數進行優化,最后應用于污水軟測量建模中,仿真分析證實該方法進一步改善了回歸模型的精確度和COD濃度的在線預估能力。紀廣月[3]為解決傳統BP神經網絡所存在的收斂速度較慢和易于陷入局部最優的弊端,創建了一種通過云模型粒子群算法對BP神經網絡的最佳初始權值和閾值進行優化的水質預測模型,并將訓練后的模型應用到對西江水質的預測中,仿真結果證實,CPSO-BP水質預測的誤差最小,且運算速度進一步提高,實現較快收斂。張秀菊等[4]針對傳統水質預測方法存在預測精度不理想以及對實測數據要求較高的問題,創建基于BP神經網絡的水質預測模型,仿真實驗結果顯示,所創建的BP神經網絡模型預測效果較好,預測結果能很好地逼近真實值,可以用于瀟河流域的水質預測。在上述所涉及的模型中,神經網絡模型已較為成熟,但傳統的BP神經網絡易出現局部收斂問題,針對該問題,相關研究領域的學者研發出了基于小波變換理論的小波神經網絡(Wavelet Neural Network,WNN),并將其應用于水文水資源領域[5-8]。通過小波基函數將輸入信號分解成不同的頻率通道,小波變換理論可以實現輸入信號的平滑化處理,從而得到比原始信號更單一的分解信號,在對具有非線性和波動性特質的水質數據進行處理時,它也更具適應性[9]。
為確保污水廠一直處于穩定、安全的運行狀態,首先需要對污水處理過程中的關鍵指標進行實時監測,例如化學需氧量(COD)、總固體懸浮物(TSS)、總磷(TP)、總氮(TN)、氨氮(SNH)等,通過監測這些指標可以反映出污水處理性能、出水質量和經濟效益,進而根據監控結果來優化及控制污水處理過程。COD和SS作為污水處理廠的關鍵指標,若被過量排入受納水體,將會導致嚴重的水污染事故,其造成的損失更是不可估計。因此,對污水處理廠出水COD和SS進行在線監測成為預防水污染事故成為預防水污染事故的關鍵。本文提出了一種基于小波變換的神經網絡模型——WNN神經網絡,并運用粒子群與遺傳算法結合的PSOGA優化算法迭代尋優獲取WNN神經網絡的最佳初始值和閾值,對廢水中的COD和SS進行預測,將小波理論和神經網絡理論結合起來,實現對廢水參數的預測,為目標廢水的處理提供數據參考。
WNN神經網絡同時結合了小波變換和神經網絡的優點[10]。它是一種結合了小波變換的定位特性和神經網絡的自學習能力的神經網絡。WNN神經網絡的網絡結構是根據小波分析的理論確定的,它避免了 BP 神經網絡[11]等在網絡結構設計中的盲目性,并提高了容錯性和逼近性能[12]。總體而言,對于處理同樣的機器學習任務,WNN神經網絡具有更加簡單的網絡層結構,收斂速度更快,準確率更高。
WNN神經網絡與BP神經網絡的主要不同是用非線性的Morlet 小波函數代替BP神經網絡中常用的Sigmoid激活函數進行小波變化,然后傳入輸出層,WNN神經網絡結構見圖1[13]。
Morlet 小波函數:
(1)
式中f(x)——加權和;b——平移因子;a——尺度因子。
a)載入數據。為加快模型運行時的收斂速度,消除量綱的影響,需對訓練和測試數據集中的6個輸入水質參數數據:CODinf、Q、pH、SSinf、T、DO進行歸一化處理,歸一化是指使用特定的算法將數據保持在特定的范圍內,6組輸入數據使用相同的歸一化操作。本研究中使用的方法是線性函數的歸一化,見式(2):
(2)
式中xmax、xmin——單組輸入數據的最大值、最小值;x、Y——數據歸一化前后的值[14]。
b)網絡構建。神經網絡的網絡構建過程主要是指通過解析數據特征,判斷模型的輸入層節點數(n)、隱含層網絡節點數(m)以及輸出層網絡節點數(p),配置網絡參數最大迭代次數maxgen和學習速率Lr。
d)迭代優化。計算實際值與輸出值的誤差,根據誤差精度和迭代次數不斷調整參數。
e)計算誤差。網絡預測是水質參數預測的最后一步,其主要內容是利用訓練好的小波神經網絡對水質數據測試集進行預測,然后對預測數據進行反歸一化并輸出結果[16]。
粒子群算法(PSO)與遺傳算法(GA)均為模仿自然界中生物活動過程的高智能算法,因此各有優缺點。在PSO算法中,由于粒子具有記憶能力,因而可以存儲迭代尋優時的最優信息,它的局部尋優能力強,且收斂速度快;而GA則是具備較強的全局搜索能力;其交叉操作蘊含了信息互換的基本思路,而變異操作則可以增加種群的多樣性,從而避免在迭代尋優過程中產生的早熟現象[17]。通過綜合2種算法的優點,將GA的交叉和變異方法引入到PSO算法中,進而獲得了整體性能更好的PSOGA算法。
PSOGA算法結合了遺傳算法與粒子群算法的優點,具有快速的全局群體尋優的能力,能夠較快的優化神經網絡結構。利用PSOGA算法訓練WNN神經網絡的各參數,能夠發揮神經網絡的廣泛映射能力,同時使網絡快速收斂,使神經網絡的權值、閾值及隱含層節點數達到最優,PSOGA算法訓練WNN神經網絡的流程見圖2。
圖2 PSOGA-WNN神經網絡算法流程
其中算法關鍵步驟如下。
步驟一初始化模型參數。給定初始條件:即粒子個數n,最大慣性因子wmax、最小慣性因子wmin、學習因子η1、η2、種群規模popsize、交叉概率Pc、變異概率Pm、粒子更新速度Vmax、Vmin、迭代次數maxgen,神經網絡各層的連接權值和隱含層數及節點數。
步驟二適應度函數設定。使用實際輸出與期望輸出的誤差和作為適應度函數,以此評價粒子的搜索性能。適應度函數fit可表示為式(3):
(3)
PSOGA訓練問題的最優解就是迭代完成后適應度函數值最低的粒子,此時的訓練誤差也最小。
步驟三確定種群。神經網絡參數優化問題的最優解就是通過計算得到粒子群中粒子的最佳位置,即粒子的位置向量z所包含的隱含層節點數以及連接權值和閾值。
神經網絡輸入層的節點數量為n,輸出層節點數量為m,隱含層節點數量為p;輸入層i到隱含層j的連接權值為wij,隱含層到輸出層的連接權值為wjk,隱含層單元的閾值為bj,輸出層單元的閾值為aj,則位置向量pop可表示為式(4):
pop=[p,w11,…,wnp,b1,…,bp,w11,…,wpt,a1,…,at]
(4)
步驟四初始化。在限定的區間內隨機初始化隱含層節點粒子的位置和速度。
步驟五評價粒子。利用適應度函數計算粒子在每一次迭代過程中的適應度值。
步驟六更新個體最優值和全局最優值。評價粒子當前適應度值與其最好位置的適應度值,判斷是否為最佳的位置,并比較所有的pbest和gbest,更新gbest。
步驟七慣性權重更新。慣性權值w,采用線性遞減方法來更新:
(5)
式中wmax、wmin——w的最大值、最小值,通常wmax=0.9,wmin=0.4;t——當前迭代步數;tmax——最大迭代步數。
步驟八位置和速度的更新。由步驟六生成的pbest和gbest進行位置和速度的更新。
位置更新見式(6):
popid=popid(t)+0.2×vid(t)
(6)
速度更新見式(7):
vid(i+1)=w×vid(i)+η1rand()(pid-zid(t))+η2rand()(pgb-zid(t))
(7)
式中vid——粒子的速度;w——慣性權重;t——迭代次數;η1、η2——學習因子;popid——粒子的位置; rand()——介于[0,1]間的隨機數;pid——粒子最好位置,即個體極值;pgb——種群最佳位置,即全局極值。
此外,為使粒子速度變化不致過大,可設置速度上限vmax,程序代碼如下:
Ifvid(t+1)>vmax
vid(t+1)=vmax
Else ifvid(t+1) vid(t+1)=vmin end 同理,為限制粒子的位置,可設置位置上限popmax,程序代碼如下: If popid(t+1)>popmax popid(t+1)=popmax Else if popid(t+1) popid(t+1)=popmin end 步驟九位置的交叉和變異。按照設置好的交叉概率Pc和變異概率Pm對更新的位置pop進行交叉和變異操作,然后進行適應度計算更新pbest以及gbest。 步驟十迭代停止。達到最大迭代次數,算法停止。 步驟十一生成最優解。算法停止時的全局最優值,即為神經網絡各層網絡的連接權值及閾值。 步驟十二權值訓練。將步驟十一優化得到的結果,生成神經網絡結構所需的所有參數,隱含層節點數、網絡權值和閾值,作為WNN網絡的權值和閾值。 整個WNN神經網絡的結構及權值、閾值有了初步優化,但這并不是最終的網絡結構,WNN網絡本身也包含了訓練、學習的步驟,利用PSOGA算法獲得的網絡結構再次進行自我訓練和優化,進一步尋找神經網絡的最優解,進行局部尋優,從而提高神經網絡的搜索效率以及收斂程度,獲得良好的模式識別網絡。 仿真實驗中使用的是廣東省東莞市某造紙廠廢水處理系統曝氣池的監測結果[18],包括CODinf、Q、pH、SSinf、T、DO、CODeff、SSeff8組實測數據,每組數據170個樣本,采用CODinf、Q、pH、SSinf、T、DO 6個水質參數對CODeff和SSeff進行預測。由于WNN神經網絡同時預測2個變量效果并不是很好,因此CODeff和SSeff應分別進行預測。預測統一采用前140組實測數據作為訓練樣本,測試和檢驗樣本都選擇為后30組數據。 為了檢驗預測的精確度,使用均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)和相關系數(R2)3個評價指標來檢測,其計算見式(8)—(10)。n是測試樣本預測數據的量,y′為模型訓練之后得出的預測值,y為實測值。RMSE和MAPE反映出真實值和預測值之間偏差的側度,RMSE和MAPE越小,表明預測值越接近真實值,即預測的效果越好,而R2表征擬合優度,越接近于1表示擬合數據能力越好。 檢測值RMSE 的計算方法為: (8) 檢測值R2的計算方法為: R2= (9) 檢測值MAPE的計算方法為: (10) WNN神經網絡是一種混合小波分析和神經網絡模型,主要用于時間序列預測。分別使用小波神經網絡進行運算,采用小波神經網絡的結構為6-4-1,即輸入層網絡節點6個,隱含層網絡節點為4個,輸出層網絡節點為1個。在樣本學習率分別為Lr1=0.01和Lr2=0.000 1的前提下,經過1 500步運算后訓練完成。測試集預測結果與檢驗樣本結果對比見圖3、4。 圖3 測試樣本出水COD真實值和預測值曲線 圖4 測試樣本出水SS真實值和預測值曲線 圖5、6為PSOGA-WNN模型訓練樣本和檢驗樣本的誤差曲線。由圖可知,訓練誤差曲線隨著網絡訓練次數的增加而趨向于0。為防止發生過擬合,模型采用了“早停止”策略,即當模型的MSE在連續的20次迭代中都無明顯變化,模型訓練停止,由圖可知,對于出水COD的預測,在epoch=400時,模型停止了運行;對于出水SS的預測,在epoch=600時,模型停止了運行。由模型的訓練誤差曲線可知,模型檢驗樣本誤差和訓練樣本誤差相差不大并未發生過擬合,且模型在訓練時能夠較快地擬合數據使其趨于真實值,數據收斂后其誤差能持續保持穩定。圖3、4表明,構建神經網絡,利用歷史數據對廢水參數中CODeff和SSeff進行預測。通過真實值和預測數值比較表明PSOGA-WNN神經網絡具有強大的預測能力,進一步考慮PSOGA-WNN神經網絡的功能。在本文中,使用RMSE、MAPE和R2的性能評估指標比較了PSOGA-BP神經網絡、PSOGA-WNN神經網絡、PSO-WNN[19]神經網絡以及GA-WNN[20]神經網絡的預測結果。結果見表1。 表1 預測性能評價指標結果 圖5 出水COD預測誤差曲線 圖6 出水SS預測誤差曲線 由表1可知,在CODeff的預測中,RMSE(PSOGA-WNN) 小波變換和神經網絡的優點完美結合,WNN神經網絡具有學習能力強、收斂速度快、精度高、穩定性強等優點,而結合PSOGA的PSOGA-WNN神經網絡通過對權值和閾值進行優化進一步提升了神經網絡的性能。通過PSOGA-WNN神經網絡與PSOGA-BP以及PSO-WNN、GA-WNN的仿真實驗結果對比可知,對于CODeff的預測,PSOGA-WNN神經網絡的RMSE比PSOGA-BP降低了25.6%,比PSO-WNN降低了20.2%,比GA-WNN降低了19.0%,PSOGA-WNN神經網絡的MAPE比PSOGA-BP降低了21.1%,比PSO-WNN降低了17.6%,比GA-WNN降低了19.5%,而R2則比PSOGA-BP提高了18.6%,比PSO-WNN提高了17.9%,比GA-WNN提高了15.5%;對于SSeff的預測,PSOGA-WNN神經網絡的RMSE比PSOGA-BP降低了39.5%,比PSO-WNN降低了16.2%,比GA-WNN降低了8.1%,PSOGA-WNN神經網絡的MAPE比PSOGA-BP降低了35.8%,比PSO-WNN降低了14.5%,比GA-WNN降低了6.6%,而R2則比PSOGA-BP提高了27.2%,比PSO-WNN提高了7.3%,比GA-WNN提高了3.7%。由該對比結果可得,WNN神經網絡相比于BP神經網絡,其預測精度更高,而將PSO和GA算法的結合在一起的PSOGA算法相比于單一的PSO和GA算法具有更好的尋優性能。這表明PSOGA-WNN是一個擬合效果極佳的水質預測模型,使用PSOGA-WNN神經網絡的預測可以充分逼近特定水質數據的實際值。目前的研究可以在水質預測領域進一步研究水質數據中的多元關系,進一步提高PSOGA-WNN神經網絡模型的預測精度和穩定性,同時,尋找更加有效的參數優化算法來優化模型,提高模型的預測性能。3 仿真結果與分析
3.1 數據預處理
3.2 預測性能評價指標
3.3 試驗結果
4 結論