黃琦蘭,范金祥
(天津工業(yè)大學 電氣工程與自動化學院,天津 300387))
污水處理過程中,化學需氧量(chemical oxygen demand,COD)是衡量水中有機物含量的重要指標,能否對COD進行實時準確的監(jiān)測是水質(zhì)污染防治的關鍵。由于污水處理系統(tǒng)存在處理工藝復雜,污水控制干擾大等問題,傳統(tǒng)測量方法由于測量手段有限,難以滿足精確性、實時性、經(jīng)濟性等要求,因此有必要建立高質(zhì)量的軟測量模型來預測出水水質(zhì)參數(shù)[1-6]。
近年來,國內(nèi)外很多學者對污水處理過程中出水水質(zhì)軟測量模型進行了大量的研究。人工神經(jīng)網(wǎng)絡(artificial neural network,ANN)已成功應用于許多污水處理廠的在線預測和過程監(jiān)控中[7]。Fernandez等[8]使用灰色模型和人工神經(jīng)網(wǎng)絡來預測廢水中的懸浮物和化學需氧量;Cong等[9]將小波神經(jīng)網(wǎng)絡和自適應加權(quán)融合的混合軟測量模型用于出水COD的在線預測。然而,盡管人工神經(jīng)網(wǎng)絡表現(xiàn)出了優(yōu)異的性能,但仍然存在局限性,如擬合度過高、收斂速度慢、泛化性能差等缺點。
支持向量機(support vector machine,SVM)在解決復雜問題方面具有獨特的優(yōu)勢,在軟測量中得到廣泛的應用。文獻[10]利用基于PSO-SVM混合模型對灌溉系統(tǒng)的沙濾池中出水濁度和pH值進行預測,并獲得了良好的性能;最小二乘支持向量機(LSSVM)利用結(jié)構(gòu)風險最小化原則來代替?zhèn)鹘y(tǒng)的經(jīng)驗風險最小化,使其對未來樣本有較好的泛化能力,但該算法的自適應能力差,魯棒性不強;文獻[11]利用PSO-LSSVM進行污水COD預測,但PSO自身收斂速度慢,對預測精度有一定影響[12]。
基于以上原因,本文提出一種基于改進LSSVM的軟測量模型,該方法通過改進粒子群算法(Improved PSO,IPSO)對LSSVM模型相關參數(shù)進行優(yōu)化。IPSO算法旨在解決PSO算法早熟收斂問題。通過IPSO算法尋找LSSVM模型參數(shù)的全局最優(yōu)解,建立基于IPSO優(yōu)化的LSSVM污水水質(zhì)參數(shù)預測模型。選用污水處理過程中具有代表性的特征向量作為預測模型的輸入向量,并且與傳統(tǒng)的LSSVM模型及基于PSO優(yōu)化LSSVM模型進行了模型精度分析對比。
最小二乘支持向量機(LSSVM)通過求解線性規(guī)劃而非二次規(guī)劃來提高SVM算法的性能從而簡化了計算雜過程,提高了運算速度,是SVM算法的一種擴展[13-14]。
設數(shù)據(jù)集T=[(xi,yi)],i=1,2,…,N為樣本總數(shù);則樣本的回歸模型為

式中:y(x)表示輸出;x 表示輸入變量;φ(x)為非線性逼近函數(shù);w和b分別表示權(quán)重項和偏置項。對于LSSVM,其優(yōu)化問題變?yōu)?/p>

式中:ai為拉格朗日乘子。該方程通過對各個變量求其偏導并令偏導為0來求解,得到以下方程組:

消去w和ξi,問題可以定義如下:

式中:Ω和I分別表示核矩陣和恒等式矩陣。核矩陣可表示為Ω=φT(xi)φ(xi)。
求解式(5)可以獲得LSSVM函數(shù)估計如下:

式中:K(xi,x)為核函數(shù),有不同類型的核函數(shù),如徑向基函數(shù)(RBF)和多項式函數(shù),本文以徑向基函數(shù)作為核函數(shù)。

式中:只有1個待定參數(shù)σ,表示徑向基函數(shù)寬度;根據(jù)LSSVM回歸理論,LSSVM存在1個可調(diào)參數(shù)γ>0。因此,當應用帶有RBF核函數(shù)的LSSVM方法時,有2個可調(diào)參數(shù)(σ和γ)。
粒子群優(yōu)化算法(particle swarm optimization,PSO)是一種受鳥群或魚群等動物之間社交互動行為啟發(fā)的隨機優(yōu)化算法,最初由Eberhart和Kennedy于1995年提出,并由Shi和Eberhart于1998年進一步改進[15-16]。PSO算法在編碼上的簡單性和一致性被認為是該進化算法的突出優(yōu)點[17]。在該算法中,每個解都由一群粒子表示,pbest和gbest分別表示粒子i的個體最優(yōu)解和種群中所有粒子之間的最優(yōu)解,為了達到最優(yōu)結(jié)構(gòu),每個粒子的更新速度vi和位置xi的數(shù)學方程描述如下:

式中:c1和 c2表示加速度常數(shù);r1、r2服從 U(0,1)分布的隨機數(shù);慣性權(quán)w重用于平衡局部勘探和全局勘探,慣性權(quán)重可由下列公式確定:

式中:wmax和wmin分別代表最終和初始權(quán)重;K表示迭代最大次數(shù)。
盡管PSO算法具有可調(diào)參數(shù)少、易于實現(xiàn)等優(yōu)點,但是當面對一些復雜的問題,它也可能會過早收斂或陷入局部最優(yōu),即在一定時間內(nèi),每個粒子在種群中的最佳位置趨于固定值,并且每個粒子的速度也趨于零,為了解決這個問題,本文提出改進PSO(Improved PSO,IPSO)算法。
實驗研究表明,慣性權(quán)重因子w是PSO的關鍵參數(shù)[18-19],它用于控制粒子先前速度對當前速度的影響。w較大,則粒子具有更大的全局搜索能力,但計算量較大;而相對較小的w收斂速度更快,但更有可能落入局部最優(yōu)值。為了更好的保持種群的多樣性,提出一種可變慣性權(quán)重策略,即種群的慣性權(quán)重隨迭代次數(shù)的變化而變化。慣性權(quán)重因子重新定義如式(10),該策略使得慣性權(quán)重調(diào)整范圍逐漸壓縮并整體呈非線性遞減趨勢,概率判斷的加入增強了w在整體遞減趨勢下的隨機性,避免了w單一變化的模式,有助于改善粒子的多樣性。

式中:rand(k)為當前迭代次數(shù)的隨機概率。
圖1所示為慣性權(quán)重的變化曲線。

圖1 慣性權(quán)重的變化曲線圖Fig.1 Variation curve of inertial weight
由圖1可見,本文提出的非線性遞減慣性權(quán)重在早期階段的權(quán)值下降速度大于傳統(tǒng)的線性遞減慣性權(quán)重,隨著當前迭代次數(shù)的逐步增加,權(quán)值的下降速度逐漸緩慢最終在達到迭代的終止條件時,權(quán)值會限定在。當w從大到小變化時,粒子搜索的范圍可從一個較大的空間逐漸變化到很小的區(qū)域。
為了進一步防止PSO算法在迭代過程中陷入局部極值,本文通過引入極值擾動算子調(diào)整粒子的個體極值和全局極值,使粒子逃離局部最優(yōu)區(qū)域,擴大搜索范圍,這樣粒子有更大的概率去發(fā)現(xiàn)最優(yōu)解。本文在速度更新公式中引入一種非線性更新擾動算子,對個體最優(yōu)值和全局最優(yōu)值進行調(diào)整,擾動算子值隨著迭代次數(shù)的增加而呈非線性遞減,有利于粒子進化前期較大范圍搜索,后期在較優(yōu)解范圍內(nèi)的精確搜索。擾動算子更新公式如式(11):

式中:dmax為最大極值擾動算子;dmin為最小極值擾動算子。
引入擾動算子后,粒子群的速度更新公式變?yōu)椋?/p>

為了比較不同模型的優(yōu)劣性,本文采用均方根誤差(RSME)、模型決定系數(shù)(r2)以及平均相對誤差(MRE)作為模型的性能評價指標,各評價指標定義分別如式(13)、式(14)、式(15):


LSSVM的參數(shù)優(yōu)化問題通常會轉(zhuǎn)換為多元線性回歸函數(shù)的參數(shù)估計問題。正則化參數(shù)和核參數(shù)在LSSVM建模中起著重要作用。因此,為了得到理想的預測模型,需要對這些參數(shù)進行調(diào)整。本文采用IPSO算法對參數(shù)進行優(yōu)化,并采用均方根誤差(RMSE)評估粒子的適應度值。
利用提出的IPSO-LSSVM算法對污水處理廠出水COD預測模型建模,具體實現(xiàn)過程如圖2所示。

圖2 基于IPSO算法的LSSVM參數(shù)尋優(yōu)流程Fig.2 Flow chart of LSSVM parameters optimization based on IPSO
出水COD是評價一個污水處理廠工藝水平和運行情況的重要指標之一,對COD進行模擬預測對污水處理廠的優(yōu)化運行有重要意義,因此本文選取污水處理廠出水COD為模型的輸出變量。
本文實驗數(shù)據(jù)采集自長沙臨空某綜合污水處理中心,該廠的日處理能力為10萬t/d,項目采用改良型生物池、高效沉淀池和反硝化濾池等工藝除去COD、總氮(TN),出水水質(zhì)執(zhí)行《地表水環(huán)境》(GB3838-2002)中的準IV類排放標準。為了檢驗IPSO-LSSVM模型的泛化能力,通常將樣本集分為訓練樣本和測試樣本2部分。因此,本文將2019年的日運行數(shù)據(jù)作為模型訓練和測試數(shù)據(jù)。以出水COD為預測模型的輸出,以進水懸浮固型物(SS)、進水總氮(TN)、進水溫度(T)、進水化學需氧量(COD)、進水量(Q)、進水 pH值、生化池溶解氧(DO)為預測模型的輸入,建立7輸入1輸出的預測模型。
為了驗證IPSO算法的尋優(yōu)能力,本文采用4種類型的測試函數(shù)對標準PSO、以及本文所提出的IPSO算法進行仿真測試。其中,Ackley、Schaffer、Griewanks為多峰函數(shù),Rosenbrock為單峰函數(shù),表1給出了這些測試函數(shù)的維度、取值范圍以及理論極值。

表1 標準測試函數(shù)Tab.1 Standard test function
為了測試結(jié)果的公平性,將IPSO與標準PSO的公共參數(shù)設置一致。具體實驗參數(shù)設置為:種群規(guī)模N=30,維數(shù)D=30,最大進化代數(shù)為K=500,學習因子c1=c2=2.0;在IPSO中,最大慣性權(quán)wmax=0.9,最小慣性權(quán)重wmax=0.4,最大擾動值dmax=0.85,最小擾動值dmin=0.35。兩種算法對每一個測試函數(shù)分別單獨運行30次。
圖3—圖6為各函數(shù)適應度值進化曲線。由圖可以看出,對于所選擇的4個測試函數(shù),本文提出的基于隨機非線性遞減慣性權(quán)重和加入非線性遞減極值繞動策略的IPSO算法在收斂速度和尋優(yōu)精度上均優(yōu)于標準PSO算法。

圖3 Ackley函數(shù)曲線Fig.3 Curve of Ackley function

圖4 Rastrigin函數(shù)曲線Fig.4 Curve of Rastrigin function

圖5 Schaffer函數(shù)曲線Fig.5 Curve of Schaffer function

圖6 Rosenbrock函數(shù)曲線Fig.6 Curve of Rosenbrock function
實驗結(jié)果對比見表2。由表2可以看出,IPSO相比標準PSO算法性能更優(yōu),證明當慣性權(quán)重服從隨機變化和擾動極值非線性遞減時,粒子表現(xiàn)出較好的尋優(yōu)能力;其次,本文所提出的改進PSO算法較標準PSO來說平均收斂值最小,并且最優(yōu)收斂值更接近于測試函數(shù)的最優(yōu)值,說明IPSO能有效避免粒子陷入早熟的狀態(tài),跳出局部最優(yōu)的能力更為突出。

表2 實驗結(jié)果對比Tab.2 Comparison of experimental results
綜上所述,本文提出的IPSO算法較傳統(tǒng)的線性遞減PSO算法收斂速度更快、需要迭代的次數(shù)更少,能夠較接近收斂精度且沒有使算法出現(xiàn)早熟現(xiàn)象,有效改善了算法的整體尋優(yōu)性能。
為了驗證IPSO-LSSVM算法的預測精度,本文選取傳統(tǒng)的LSSVM和基于PSO優(yōu)化的PSO-LSSVM模型,在相同的測試樣本上比較模型的精度。利用MATLAB工具箱,編寫LSSVM、PSO-LSSVM及IPSOLSSVM算法程序,對訓練樣本進行訓練預測,得到滿足精度要求時的γ和σ2值,完成γ,σ2參數(shù)尋優(yōu)。采用IPSO算法和PSO算法優(yōu)化時,設定公共參數(shù):設定粒子維度D=2,種群規(guī)模M=30,進化最大次數(shù)Tmax=800,學習因子 c1=c2=1.5,慣性權(quán)重 ω =[0.4,0.9],模型參數(shù) γ,σ2取值范圍分別為[0.01,1 000],以樣本集的實測值和預測結(jié)果的均方差作為適應度函數(shù),終止精度10-6。在IPSO算法中,取最大擾動值dmax=0.85,最小擾動值dmin=0.35。對于傳統(tǒng)LSSVM模型,根據(jù)參考文獻[20],γ,σ2參數(shù)分別取值 10,4。IPSO 和 PSO 算法分別優(yōu)化LSSVM的適應度曲線如圖7所示。經(jīng)運行IPSO-LSSVM算法得到的模型參數(shù)見表3。

圖7 PSO-LSSVM和IPSO-LSSVM算法適應度曲線Fig.7 Fittness curve of PSO-LSSVM and IPSO-LSSVM

表3 LSSVM參數(shù)優(yōu)化結(jié)果Tab.3 Optimization results of LSSVM parameter
利用MATLAB分別運行3種模型對出水COD進行預測,最終實際值與預測值的對比如圖8所示,不同模型相對誤差曲線如圖9所示。
表4所示為3種模型預測性能對比。
由表4可看出,在出水COD的預測中,IPSOLSSVM模型的平均相對誤差為2.815%,LSSVM和PSO-LSSVM模型則分別為5.973%和4.008%;IPSOLSSVM模型的均方根誤差為1.125 0,LSSVM和PSOLSSVM模型則分別為1.608 7和1.905 3;IPSO-LSSVM模型的決定系數(shù)系數(shù)為0.9467,LSSVM和PSO-LSSVM模型則分別為0.834 1和0.889 1;通過各項指標比較可知,IPSO-LSSVM模型效果均優(yōu)于其他2個模型。

圖8 3種模型預測結(jié)果對比Fig.8 Comparison of prediction results of three models

圖9 3種模型預測結(jié)果相對誤差對比Fig.9 Comparison of prediction relative error of three models

表4 3種模型預測性能對比Tab.4 Comparison of predictive precision of three models
(1)本文針對長沙臨空某綜合污水處理中心2019年日運行數(shù)據(jù)建立了基于IPSO-LSSVM的出水COD預測模型,與PSO-LSSVM和LSSVM模型相比,IPSOLSSVM模型預測結(jié)果的均方根誤差分別降低了40.9%和30.5%;相關系數(shù)分別提高了13.0%和6.6%,IPSO-LSSVM模型應用于工業(yè)污水處理出水水質(zhì)參數(shù)預測可取得更好的預測效果。
(2)改進粒子群算法具有全局優(yōu)化和收斂速度快等特點,將其與LSSVM相結(jié)合,可獲取更優(yōu)的LSSVM模型參數(shù),使其訓練效果更佳,提高算法的預測精度和抗干擾能力。
(3)本文構(gòu)建的污水出水COD預測模型,尤其適合小樣本數(shù)據(jù)的新建污水處理廠。