姜吉光,盛宇博,常 川,石 磊,蘇成志,2*,李 鑫
(1.長春理工大學機電工程學院,長春 130022;2.長春理工大學人工智能研究院,長春 130022)
水體中氨氮濃度是考核水質優劣的一項重要指標,測定水體中的氨氮有助于評價水體被污染情況和自凈能力[1]。目前常用的氨氮在線檢測方法主要有納氏試劑分光光度法、水楊酸分光光度法、熒光法、氣相色譜吸收法和氨氣敏電極法[2-4],這些方法均需要對水樣進行添加化學試劑、加熱等預處理,這種做法不僅提高了野外在線監測系統的運行成本,產生的檢測廢液也會對環境造成二次污染。而銨離子選擇性電極法則無需添加試劑對水樣進行預處理,且具有響應速度快、無二次污染等優點,更適用于對水體中氨氮濃度進行在線綠色監測。
然而基于銨離子選擇電極的氨氮傳感器在野外自然條件下易受溫度變化影響,存在監測精度低、穩定性差等缺點,Huang等[5]在4、12、20、28、36 ℃ 時對基于銨離子選擇性電極的氨氮傳感器進行了氨氮檢測對比實驗,發現溫度對氨氮檢測結果有顯著影響。因此,要提高傳感器在野外自然環境下監測精度和穩定性還需要進行溫度補償。
目前中外關于氨氮溫度補償的研究多是基于氨氮傳感器本身物理化學性能推導溫度與傳感器響應關系方程,Wen等[6]基于能斯特理論與經驗公式建立溫度與氨氮傳感器輸出二者關系模型,實現氨氮傳感器溫度補償。一些科研工作者,如文獻[7-8]等基于能斯特方程,采用多元回歸分析的方法,建立氨氮溫度補償模型。上述研究工作均是以傳感器本身理化性質展開進行研究的,但受限于成品傳感器材料性能均已固定,在野外復雜環境下很難做到與實驗室環境相同的工作性能,而且通過多元回歸擬合的多項式模型結構簡單,很難準確描述氨氮傳感器受溫度干擾的非線性變化。隨著人工智能算法研究的不斷深入,數據驅動的機器學習算法開始應用到傳感器的優化研究中,其中支持向量機作為機器學習中的經典算法,憑借對小樣本、非線性問題良好的適用性和泛化性能好等諸多優勢在傳感器抗干擾領域展現出巨大的優勢[9-10]。因此,現將支持向量(support vector regression,SVR)算法應用在氨氮傳感器溫度補償研究中,并結合粒子群優化(particle swarm optimization,PSO)算法對支持向量機模型輸入參數進行尋優,摒棄傳統根據經驗選取參數存在的主觀性與任意性[11]提高模型的精度,以更好地描述溫度與氨氮傳感器之間的非線性關系,解決傳統氨氮溫度補償方法的不足,提高氨氮在線監測系統監測的精度和穩定性。

(1)
銨離子選擇性電極是一種電化學傳感器,如圖1所示,銨離子選擇性電極由內參比電極、內充溶液、銨離子選擇性膜、電極外殼組成。

圖1 銨離子選擇性電極的結構示意圖
(2)

通過能斯特方程可以計算出溶液中氨離子濃度,進而通過游離氨和氨離子在水中存在的比例關系得到總的氨氮值。由式(2)可以看出溫度的變化對基于銨離子選擇性電極的氨氮傳感器輸出的電位產生影響。
實驗設備選用ANB-300氨氮變送器(精確度1%,分辨率0.1)、電子溫度計(0~50 ℃,精度0.1)和79-1型恒溫攪拌器,實驗試劑為100 mg/L氨氮標準貯備液和去離子水。將100 mg/L氨氮標準試劑通過去離子水按比例稀釋成1、5、10、15、20、25、30、35、40 mg/L的氨氮溶液以備后續實驗使用。
實驗前分別用去離子水、1、10、100 mg/L氨氮標準溶液對電極進行標定,單次檢測結束后,用去離子水清洗電極頭部。檢測時,對樣品進行攪拌可以加快待測離子擴散速度,提高傳感器響應速率。實驗證明,攪拌速度為320 r/min時實驗效果最佳。
分別調節1、5、10、15、20、25、30、35、40 mg/L的氨氮標準溶液的檢測溫度,記錄每組溶液在0、5、10、15、20、25、30 ℃下傳感器的輸出值,每個溫度梯度提取6個數據,將其平均值記為該溫度下傳感器的輸出值,實驗結果如表1所示。
對表1中實驗數據進行相關性分析,上述9組氨氮檢測溫度實驗中氨氮檢測值與溫度的相關系數均大于0.95,表明氨氮傳感器輸出值與環境溫度具有強相關性。將表1中的檢測結果與實驗室常溫(20 ℃)下氨氮溶液的標準濃度對比,并進行誤差分析,結果如圖2所示。分析可得除20 ℃以外,其他溫度下傳感器輸出結果的誤差均大于10%,最大誤差出現在0 ℃下檢測10 mg/L氨氮標準溶液時達到了31%,這個結果已經遠遠超出《地表水自動監測技術規范》(HJ 915—2017)中電極法允許相對誤差為±10%的范圍。因此為提高氨氮在線監測系統的穩定性和監測精度,需要對氨氮傳感器進行在線溫度補償。

表1 各種濃度氨氮標準溶液在不同溫度下的傳感器輸出值

圖2 氨氮傳感器檢測誤差分析
溫度補償可以將非標準溫度的傳感器輸出換算成標準溫度下的傳感器輸出,是建立在定標的基礎上對數據進行修正。現有的溫度補償模型中,傳統的多項式溫度補償模型結構簡單,對溫度干擾的非線性變化數據樣本回歸效果差。而SVR對非線性函數具有良好的擬合性能,模型補償精度高,且基于結構風險最小化原則使其具有良好的泛化能力[12]。
參數優化是 SVR 建模中的一個重要問題,參數選擇的不同會直接影響 SVM 模型的分類預測精度和泛化能力[13]。針對SVR在建立溫度補償模型時, 難以確定模型懲罰因子和核函數參數的問題, 提出了引入粒子群算法對模型參數進行尋優, 以提高模型的建模效率、預測準確度和泛化能力。
非線性SVR的基本思想是通過事先確定的非線性映射將輸入向量映射的一個高維特征空間(Hilbert空間)中,然后在此高維空間中再進行線性回歸,從而取得在原空間非線性回歸的效果。
對于訓練樣本(xi,yi)(i=1,2,…,n),xi∈Rn為輸入量,yi∈R為輸出量,其回歸函數為
f(x)=ωφ(x)+b
(3)
式(3)中:φ(x)為非線性映射函數,可以將x輸入向量映射到高維特征空間;ω為系數向量;b為閾值。
標準支持向量回歸機采用ε-不敏感損失函數,且通過結構風險最小化原則得到SVR的目標函數和約束條件為
(4)
(5)

此時回歸問題就轉化為關于待求參數ω、b的凸二次規劃問題,引入Lagrange函數得到式(4)、式(5)的對偶形式為
(6)
(7)
式中:φ(xi)·φ(xj)為高維空間的點積運算,令K(xi,xj)=φ(xi)·φ(xj),稱K(xi,xj)為核函數,通過引入核函數解決維數問題,可在不知映射函數的情況下實現回歸估計。核函數的類型有多種,這里將RBF高斯徑向基函數作為補償模型的核函數。
將核函數代入式(6)求解,得到非線性擬合函數表達式為
(8)
式(8)中:K(x,xi)=exp(‖x-xi‖2/2σ2)。
粒子群優化(PSO)算法是計算智能領域除了蟻群算法和魚群算法之外的一種群體智能的優化算法,該算法最早由Kennedy和Eberhart在1995年提出的,源自對鳥類捕食問題的研究[14]。PSO算法通過粒子搜尋自己找到的個體最優解和群體最優解完成優化。PSO算法基本流程如下。
(1)設置群體規模N,初始化粒子的位置xi和速度vi。
(2)計算每一個粒子的適應度值。
(3)計算每個粒子的適應度和個體極值Pi,比較兩者大小,若適應度值大于Pi,則用適應度值賦予Pi。
(4)計算全局極值gi,將粒子的適應度值和全局極值gi比較,若適應度值大于gi則將適應度值賦予gi。
(5)更新粒子的位置xi和速度vi。
(6)當誤差滿足預期條件或達到最大循環次數時尋優結束,否則返回步驟(2)。
基于粒子群優化算法支持向量回歸機的氨氮傳感器溫度補償模型建模步驟如下。
(1)采集傳感器檢測水體氨氮時傳感器輸出與溫度的變化數據如表1所示,建立訓練樣本集。
(2)選取核函數,選取RBF高斯徑向基函數作為PSO-SVR模型的核函數。
(3)通過離子群優化算法優化SVR模型參數。根據每個粒子包含的參數訓練SVR模型,將訓練得到的補償值與實際值對比計算均方根誤差(root mean square error,RMSE)作為每個粒子的適應度,更新得到最優參數。
(4)將最佳的懲罰系數C和核函數參數g輸入到SVR模型中,通過訓練集訓練的最終PSO-SVR氨氮傳感器溫度補償模型。
通過MATLAB軟件實現建模,設定粒子群初始參數為:最大迭代次數為200、粒子群規模為n=20、局部搜索能力c1=1.5、全局搜索能力c2=1.7,經過粒子群優化算法對SVR模型參數尋優,適應度如圖3所示,經尋優后得到的模型最優參數懲罰系數C和核函數參數g分別為100、0.01。

圖3 PSO算法參數尋優適應度變化曲線
為了驗證PSO-SVR算法建模的補償效果,分別采用多元線性回歸擬合三次曲面方程的溫度補償模型、傳統的SVR模型和PSO-SVR模型在相同的訓練集上進行訓練,在同樣的測試樣本(表2)上比較模型的補償精度。各模型的決定系數R2、均方根誤差(RMSE)、測試集平均誤差如表3所示,不同模型對訓練樣本的補償效果及誤差如圖4所示。

表2 測試集數據

表3 3種模型補償效果對比

圖4 不同模型補償效果和補償誤差對比圖
可以看出,最小二乘法擬合三次曲面方程的補償準確度不高,表現較差,SVR和PSO-SVR模型都具有良好的非線性擬合性能,但PSO-SVR模型的決定系數較高,均方根誤差(RMSE)和測試集平均誤差較小,誤差基本集中在4%以內,補償精度要優于其他兩個模型,補償效果最為優異。
在野外水域提取6組水樣,在隨機溫度下,采用本研究建立的氨氮傳感器溫度補償模型所優化后的傳感器測量氨氮濃度數據,并與國標法檢測的同組水樣檢測結果對比如表4所示,可以看出兩種測量結果最高偏差4.76%,最小偏差0.64%,偏差均小于5%,多數偏差在2%附近。由此可知,溫度補償模型對非建模數據具有良好的泛化性能和較高的精度,該模型補償后的銨離子選擇性電極能夠滿足野外低溫環境下,在線監測系統對氨氮的檢測要求。

表4 實際水樣補償實驗結果分析表
基于粒子群優化支持向量回歸算法(PSO-SVR),針對銨離子選擇性電極的氨氮傳感器在實際使用過程中,氨氮檢測結果容易受到環境溫度變化的影響,造成檢測結果失準的問題,建立氨氮溫度補償模型,以提高氨氮在線監測系統的檢測精度和穩定性。
(1)將不同濃度的氨氮標準溶液,在不同溫度下得到的傳感器輸出值與標準濃度進行對比,得出檢測結果與標準溶液濃度存在偏差。在0 ℃下,檢測10 mg/L氨氮標準溶液時最大偏差達到了31%,遠超過技術規范的允許范圍。
(2)建立PSO-SVR氨氮溫度補償模型。采用粒子群優化算法對SVR模型核心參數進行尋優,摒棄了通過經驗等人為因素對核心參數的選取,使其相較于傳統SVR和多元線性回歸模型具有更好的模型精度。
(3)將野外實際水樣實驗中,模型補償的結果與行業標準檢測數據進行對比,誤差均小于5%。由此可見,氨氮補償模型能夠有效地校正溫度對氨氮檢測結果的影響,對非建模數據也具有良好的泛化能力。研究可為野外低溫環境下水體氨氮含量在線精準監測提供理論依據和參數支持。