朱湘臨,陳 威,丁煜函,王 博,朱 莉,姜哲宇2,宋 彥
(1.江蘇大學 電氣信息工程學院,江蘇 鎮江 212013; 2.無錫太湖水務有限公司,江蘇 無錫 214000)
光合細菌(PSB)是具有光能合成體系的原核生物,在新能源開發、環境保護、養殖、醫藥等方面有廣泛應用[1-5]。然而其發酵過程中菌液紅色會不斷加深,越來越渾濁,是一個高度時變性、強耦合復雜過程。由此導致直接反應發酵品質的關鍵參量活菌濃度難以在線測量,進而影響發酵過程的優化控制。目前主要采用的是人工離線檢測的手段,但存在著較大的測量延時及誤差,且易染菌,會降低發酵品質。軟測量技術[6-8]是解決此問題的有效手段。
最小二乘支持向量機(LSSVM)[9-12]是一種基于統計學習理論的機器學習方法,具有優秀的小樣本數據學習能力和預測能力,很適合樣本數據較少的發酵過程[13-15]。實踐表明,LSSVM的核參數與懲罰參數的取值對模型的泛化能力與精度起關鍵作用,不恰當的選擇可能會使LSSVM預測模型容易出現過度擬合和泛化能力不佳的問題。針對這個問題,大量學者針對LSSVM模型參數的選擇研究了各種優化算法。文獻[16]將混沌優化算法與LSSVM進行有機結合并用于發酵過程中,得到誤差較小的發酵預測曲線;文獻[17]采用粒子群算法優化LSSVM的模型參數,提高了模型的函數逼近能力,取得了良好的預測效果;文獻[18]以遺傳算法完成對LSSVM的模型參數選擇,能夠有效地跟蹤因變量和預測變量之間復雜的非線性關系,顯示出很好的預測與泛化能力。
蝙蝠算法(BA)是由楊新社根據蝙蝠的生物特性于2010年提出的一種新型智能算法[19],相較于粒子群算法、遺傳算法等傳統智能算法,BA算法具有模型簡單、搜索能力強、收斂速度快等特點,有效性和準確性方面也有明顯的提高。目前已在電機運行監測[20]、數據挖掘[21]、風速預測[22]、水力發電[23]等領域得到廣泛應用。但BA算法仍有著易陷入局部極小的問題[24-25],基于此,本文對BA算法的速度更新公式進行改進,并將差分進化算法(DE)的變異機制引入BA,提升了BA算法的全局及局部搜索能力。然后將改進的蝙蝠算法(Improve Bat Algorithm,IBA)對LSSVM的模型參數進行組合尋優,建立光合細菌發酵過程活菌濃度的IBA-LSSVM模型。仿真結果表明,該軟測量模型有不錯的泛化能力和預測精度。
最小二乘支持向量機是Suykens[26]在支持向量機(SVM)的基礎上提出的新型支持向量機,用于解決模型分解和函數估計問題。其建模原理如下:
設有l個訓練樣本{(xi,yi)|i=1,2,…,l},其中樣本為n維向量,xi∈Rn為樣本輸入,yi∈Rn為樣本輸出,對樣本數據逼近的LSSVM可表示為:
(1)
s.t.yi=ωTφ(xi)+b+ξi,(i=1,2…,l)
(2)
式中,ω為權矢量;g∈R+是懲罰參數;ξi是誤差變量;b為偏差量;φ(·)是一個非線性映射,能把xi從輸入空間映射到高維(甚至無限維)的特征空間。
用拉格朗日法對上述問題進行優化:

(3)
式中,αi是拉格朗日乘子。根據KKT條件將求解的優化問題最終可轉換為求解線性方程:
(4)
式中,y=[y1,y2,…,yl]T;1l=[1,…,1]T;Il為l階單位矩陣;α=[α1,…,αl]T;K為滿足Mercer條件的核函數矩陣,K=K(xi,xj)=φT(xi)φ(xj),i,j=1,…,l。
本文選用徑向基函數作為核函數:
(5)
式中,σ為核函數寬度。
最終得到LSSVM的函數估計為:
(6)

fi=fmin×(fmax-fmin)θ
(9)
(10)
(11)
式中,θ∈[0,1]是均勻分布的隨機數;fi∈[fmin,fmax]是第i只蝙蝠的搜索脈沖頻率。
蝙蝠算法的局部搜索是通過隨機擾動實現的,隨機在當前最優解集中選擇一個解zr,并在其附近產生一個局部新解znew,如式(12)所示:
znew=zr+μAt
(12)
式中,At為當前蝙蝠種群的平均脈沖音強;μ是[-1,1]上均勻分布的隨機數。
蝙蝠i的搜索脈沖頻度和脈沖音強更新公式為:
Ai(t+1)=βAi(t)
(13)
Ri(t+1)=R0[1-exp(-γt)]
(14)
式中,R0表示蝙蝠群體的最大脈沖頻度;γ表示頻度增加系數;β表示脈沖音強衰減系數;Ai(t)表示t時刻的脈沖音強;Ai(t+1)表示t+1時刻的脈沖音強;Ri(t+1)表示t+1時刻的脈沖頻度。

(15)
(16)
λ1=1-λ2
(17)
(18)
式中,M是當前迭代次數,Mmax是最大迭代次數,τ是[0,1]的1個實數,隨著迭代次數的增大,λ2線性遞減,而λ1則從1-τ線性遞增到1,qmax和qmin別為慣性權重的最大和最小值。
該自適應方法使得算法在迭代早期具有較強的全局搜索能力,跳出局部極小,而在后期以當前全局最優解為主導進行局部搜索。針對BA算法因缺乏變異機制而導致局部搜索能力不強的缺陷,將DE算法中的變異機制引入BA算法中,以豐富種群多樣性,強化算法局部搜索能力。本文采用標準DE/rand/1/bin[27]進行變異操作,公式如下:
η=e1-Mmax/(Mmax-M+1)
(19)
F=F0×2η
(20)
znew=zr1+F(zr2-zr3)
(21)
式中,η為變異算子;F為縮放因子,F0為縮放因子的初始值;zr1,zr2,zr3是從當前局部最優解集中隨機選出的3個解。
綜上所述,IBA步驟如下:
Step 1:初始化種群數目N、最大迭代次數Mmax或搜索精度ε、搜索脈沖頻率范圍[fmin,fmax]、最大脈沖音強A、音強衰減系數β、最大脈沖頻度R0、頻度增加系數γ、τ、權重范圍[qmin,qmax]、初始縮放因子F0,初始化種群速度和位置并計算每只蝙蝠的適應度,找到當前全局最優解z*。


Step 4:生成隨機數rand2,若rand2>Ai且更新位置后的蝙蝠i優于當前全局最佳位置,則接受此新位置為當前全局最佳位置,并根據式(13)、式(14)更新脈沖頻度Ri和響度Ai。
Step 5:當滿足搜索精度或達到最大迭代次數時,則算法結束,輸出結果;否則轉回Step 2繼續迭代。
rand1與rand2是[0,1]上均勻分布的隨機數。
在光合細菌發酵過程中,影響到關鍵參量活菌濃度,且可實時在線檢測的潛在輔助變量有很多,如:光照強度E、空氣流量H、發酵罐壓力p、發酵液溫度T、發酵液體積V、氨水流加速率S、葡萄糖流加速率C、電機攪拌速度U、發酵液酸堿度pH等環境參量。軟測量模型的精準度離不開對可測輔助變量的合理選取[28-29],故采用一致關聯度法[30]獲得各參量與活菌濃度的關聯度,選擇關聯度最高的前5個作為輔助變量。表1為各潛在輔助變量與關鍵參量活菌濃度的關聯度。

表1 環境變量和主導變量的關聯度
由表1可知,光照強度E、發酵罐溫度T、空氣流量H、葡萄糖流加速率C、發酵液酸堿度pH與活菌濃度的相關性更密切,因此選擇這5個變量作為輔助變量。
采用離線訓練構建基于IBA-LSSVM的光合細菌發酵過程活菌濃度軟測量模型,在訓練過程中采用IBA對LSSVM的懲罰參數g與核函數寬度σ進行組合尋優,得到最佳的模型參數,然后將訓練好的軟測量模型進行測試,驗證IBA的優化性能。整個軟測量模型構建流程如圖1所示。

圖1 光合細菌發酵軟測量模型構建流程圖
算法具體步驟如下:
1)采集樣本數據,劃分為測試樣本和訓練樣本兩部分,并進行預處理。
2)設定參數g和σ的搜索范圍,初始化IBA算法的相關參數。
3)隨機產生蝙蝠種群,每個蝙蝠位置由g和σ構成,使用訓練樣本進行訓練,取訓練樣本集的均方差作為適應度值。
4)依據適應度值最小法則,使用IBA算法進行迭代搜索以及必要的越界處理,保留適應度值最優的位置。
5)判斷是否滿足搜索精度或達到最大迭代次數,若滿足,結束迭代,轉至6);否則返回4)循環進行迭代。
6)選擇全局適應度最佳的模型參數gbest和σbest建立LSSVM軟測量模型,最終得到基于IBA-LSSVM的光合細菌發酵過程活菌濃度軟測量模型。
依據光合細菌發酵工藝進行分批發酵試驗。發酵罐進行高溫消毒后,發酵過程溫度控制在25~34℃,電機攪拌轉速為350~450 r·min-1,罐壓為0.04~0.06 Mpa,通氣量為0.2~0.6 V·(V·min)-1,pH控制在6~8,光照強度控制在2000~5000 Lux,葡萄糖流加速率控制在0.01~0.015 g·(L·h)-1發酵周期為48小時。由數字系統每隔1分鐘采集發酵過程中光照強度、溫度、發酵液pH值、葡萄糖流加速率,由下位機傳送到上位機,形成數據庫。在發酵正常工況下,每2 h取樣一次發酵液,經離心、洗滌后,于105℃烘干后得到菌體含量。匯集現場數據進行數據預處理,一共采集10個發酵批次的數據,從上述批次中取出6批數據(包含480個樣本)作為訓練樣本,2批(包含120個樣本)作為驗證樣本,其余2批數據(包含480個樣本)作為測試樣本。
為了驗證以上方法對光合細菌發酵過程軟測量建模的可行性采用IBA-LSSVM軟測量方法建立了光合細菌發酵過程活菌濃度的軟測量模型,選用標準BA-LSSVM與其做比較分析。模型參數設置為:種群規模N=50,最大迭代次數Mmax=300、搜索精度ε=0.05、搜索脈沖頻率范圍[0,10]、最大脈沖音強A=0.5、音強衰減系數β=0.95、最大脈沖頻度R0=0.5、頻度增加系數γ=0.9、τ=0.6、權重范圍[0.2,0.9]、初始縮放因子F0=1,參數g和σ的取值范圍均設置為[0.01,1000]。兩種優化模型的預測效果分別如圖2和圖3所示。

圖2 BA-LSSVM預測效果圖

圖3 IBA-LSSVM預測效果圖
對比圖2和圖3可以發現,圖3中IBA-LSSVM模型的預測曲線比圖2中BA-LSSVM模型的預測曲線更逼近于離線化驗值,即IBA-LSSVM模型的預測效果明顯優于BA-LSSVM模型的預測效果。將兩者對光合細菌活菌濃度的軟測量誤差在圖4中體現出來,并計算兩種模型的均方誤差(RMSE)與最大相對誤差(MRE)如表2所示,以便能更直觀體現兩種模型的預測性能。

圖4 軟測量誤差

模型RMSEMRE/%BA-LSSVM0.31749.7IBA-LSSVM0.13584.1
從圖4和表2可以看出相較于BA-LSSVM,IBA-LSSVM的軟測量效果更優異,MSE僅為4.1%表明模型的預測精度高,RMRE為0.1358表明模型的可行性佳。
針對光合細菌發酵過程中活菌濃度難以在線測量的問題,以BA算法為基礎,對BA的速度更新公式進行改進,并引入DE的變異性,使得改進的IBA算法有更好的局部收斂能力及收斂精度,將該方法確定LSSVM的模型參數,建立了基于IBA-LSSVM的光合細菌發酵過程活菌濃度的軟測量模型。仿真實驗結果表明,該軟測量方法的學習能力、預測性能優于BA-LSSVM,為某些工業中存在難以在線測量的參量提供了一種可行的測量方法。