連亮亮 馮海林 方益明 杜曉晨 姜培坤
摘 要: 針對目前環境監測數據化學需氧量(COD)的預測精度不高等問題,考慮神經網絡預測極易陷入極小值,提出一種基于自適應神經模糊推理系統(ANFIS)的COD預測模型。實驗過程中采用控制變量法,根據訓練過程中標準誤差(RMSE)的變化選取最優訓練次數、隸屬度函數數目和隸屬度函數類型并建立ANFIS模型。實驗以浙江省杭州徑山水質為研究對象,選取PH、溶解氧(DO)、氨氮(NH3-N)和總磷(Tp)等指標作為預測參數,以COD指標作為預測結果。實驗結果表明,優化后ANFIS模型具有預測精度高、穩定度好等特點,與BP神經網絡和RBF神經網絡相比平均相對誤差降低了3.18%。
關鍵詞: 自適應神經模糊推理系統; 神經網絡; 化學需氧量; 水質
中圖分類號:X832 文獻標志碼:A 文章編號:1006-8228(2017)12-08-05
Water COD prediction based on ANFIS model
Lian Liangliang1,2, Feng Hailin1,2, Fang Yiming1,2, Du Xiaochen1,2, Jiang Peikun3
(1. School of Information Engineering, Zhejiang A & F University, Lin'an, Zhejiang 311300, China; 2. Zhejiang Provincial Key Laboratory of Intelligent Monitoring in Forestry and Information Technology; 3. School of Environmental&Resource Science, Zhejiang A & F University)
Abstract: Aiming at the problems that the chemical oxygen demand (COD) prediction accuracy of environmental monitoring data is not high and the neural network prediction is very easy to get into the minimum value, a COD prediction model based on adaptive neural fuzzy reasoning system (ANFIS) is put forward. The experiment uses the variable controlling method, which the optimal number of training times, the number of membership functions and the type of membership function are chosen to build the ANFIS model; the hydrogen ion concentration(PH), dissolved oxygen (DO), ammonia nitrogen (NH3-N) and total phosphorus (Tp) are used as the prediction parameters and the COD indicator is used as the prediction result. The experimental data are selected from the water quality monitoring site at Jingshan Mountain in Hangzhou. The results show that the optimized ANFIS model has the characteristics of high prediction accuracy and good stability, and the average relative error is 3.18% lower than that of BP neural network and RBF neural network.
Key words: ANFIS; neural network; COD; water quality
0 引言
水是一切有機體的主要組成部分,可是地球上可利用的水資源日趨短缺。因此,針對水質變化的檢測與監測顯得尤為重要。化學需氧量(Chemical Oxygen Demand, COD)是以化學方法測量水樣中需要被氧化的還原性物質的量。在河流污染和工業廢水性質的研究過程中,COD是一個重要且能較快測定的有機物污染參數。
國內外眾多學者關于COD的預測研究已經有很多成果。例如湯斌、趙敬曉[1]等研究了一種基于粒子群算法聯合最小二乘法支持向量機(PSO_LSSVM)的水質檢測COD預測模型優化方法,并引入主元分析(PCA)算法提高模型的收斂速度和精度。崔雪梅[2]通過采用灰色GM(1,1)模型預測數據并得到殘差,運用遺傳算法對LM-BP神經網絡的初始權值和閾值進行優化,最后利用GA-LM-BP神經網絡對殘差進行擬合、測試和預測。宓云耕[3]等人運用機器學習方法中的LM-BP神經網絡和支持向量機,建立紫外多波段光譜數據與COD值的相關性模型,并采用最小二乘法來比較實驗的準確度。梁勇[4]構建了SVR時間序列預測模型,計算一定時期內的COD濃度和氨氮濃度,通過與BP神經網絡進行誤差對比證實了SVR預測性能優于BP神經網絡。高峰[5]采用粒子群算法(PSO)優化BP神經網絡模型并將此模型運用于COD預測與驗證實驗中,大大提高了COD預測的精確度。Hamid Zare Abyaneh[6]以PH、總懸浮固體(TSS)和總懸浮物(TS)為輸入,采用多變量線性回歸和人工神經網絡模型預測污水處理廠出水口的COD和BOD含量。Davut Hanbay[7]等人基于小波分解優化神經網絡預測污水處理廠的COD參數,結果發現優化后的模型預測結果更接近COD實際值。S.Emamgholizadeh[8]運用徑向基網絡、ANFIS和多層感知器對水中COD、生化需氧量(BOD)進行建模預測。對比三種模型對水中COD、BOD的預測結果發現,ANFIS能很好的預測水中COD、BOD的含量。endprint
針對以上方法存在的一些預測精度低和收斂速度慢等問題,本文提出自適應神經模糊推理系統(ANFIS)。ANFIS是一種非線性模型,將神經網絡與模糊控制相結合,具有自學習的能力,通過訓練自行生成模糊控制規則。
1 數據與方法
1.1 數據來源
實驗數據樣本來源于2016年12月到2017年4月浙江省環境保護局某分局自動監測站對5項指標的實際監測數據。5項指標分別為:PH、溶解氧(DO)、氨氮(NH3-N)、化學需氧量(COD)、總磷(TP)。各項水質指標的監測周期為6小時。剔除無效數據,剩余數據中抽出20組作為預測樣本,其余數據作為樣本訓練網絡。
1.2 ANFIS算法
ANFIS典型模糊推理規則為[9]:
⑴
其中A和B作為前提的模糊數,z=f(x,y)為結論中的精確數。通常f(x,y)為x和y的多項式。當f=(x,y)為一階多項式時,模型稱謂一階Sugeno模糊模型。模糊規則如下。
規則1:
規則2:
其對應的ANFIS結構圖如圖1所示。
第一層:將輸入變量模糊化,輸出對應模糊集的隸屬度。該層的每個結點i是一個有結點函數的自適應結點。
x和y是結點i的輸入,O1,i是模糊集A(A1,A2,B1或B2)的隸屬度,A的隸屬函數μA(x)可以是任意合適的參數化隸屬函數,如高斯函數。
第二層:該層結點都是固定結點,它的輸出是所有輸入信號的代數積,如式⑶。
第三層:將各條規則的激勵強度歸一化,該層中的結點也是固定結點。
第四層:該層的每個結點i為自適應結點,計算出每條規則的輸出。
第五層(輸出層):該層的單節點是一個固定結點,總輸出為:
建立一個初始ANFIS系統進行訓練時,其訓練次數、隸屬函數的數目和類型都是不固定的,這三個參數的選擇直接影響系統訓練后的效果。
針對訓練次數,引入一個性能指標σ,設定精度要求ε,訓練次數n,trRMSE(n)為訓練n次后的RMSE值。根據公式:
最后當σ?ε時,n為最優訓練次數。
選取最優隸屬度函數數目和隸屬度函數時,利用控制變量法,確定三個參數中的二個參數,針對第三個參數進行測試。根據擬合程度進行分析,選定最優參數。
2 結果與分析
選取最優訓練次數,首先設定模型訓練次數為500次、隸屬函數的數目為5條和高斯曲線隸屬度函數。在訓練過程中,RMSE隨訓練次數增加的變化曲線如圖2所示。
由圖2可知,當訓練次數達到350次時,RMSE值逐漸趨向于平穩。再根據上述公式⑺本文設定訓練精度為0.02,得出最優訓練次數為378次。
選取最優隸屬度函數數目,針對3條、5條、20條隸屬度函數數目進行測試。如圖3可知,隸屬度函數數目為5條和20條時都能很好地擬合原曲線,但是隸屬度函數數目太高,各個模糊子集之間的相互影響性較大,會造成靈敏度的下降。所以最終選定隸屬度函數數目為5條。
選取最優隸屬度函數類型,隸屬度函數類型分別為高斯函數、雙高斯函數和鐘型函數。實驗發現三種函數都能較好的完成對原曲線的擬合。總結得出:本實驗中采用378次訓練次數、5條隸屬度函數數目和高斯曲線隸屬度函數,可以確保訓練模型的準確性、實時性和靈敏性。
實驗共使用某監測點數據630組,其中有610組樣本作為ANFIS模型的訓練樣本,其余20組作為實驗樣本進行預測。
為驗證ANFIS模型的有效性和合理性,且更直觀的看出ANFIS模型的預測結果的優劣性,將ANFIS模型、BP神經網絡模型和徑相基(RBF)神經網絡模型三種預測模型結果和性能參數繪制成一張圖表來比較和評價模型,見圖5和表1。
從圖5可以看出,三種模型都能有效的預測出水中COD的數值,但是ANFIS較后兩種方法所得出的絕對誤差值更低,預測值更接近于實際值。表1給出了三種模型對某水質預測結果及相對平均誤差、均方誤差、標準誤差。由表1可得ANFIS模型的平均相對誤差為1.82%,低于BP模型的6%和RBF模型的5%,大幅度降低了實驗平均相對誤差;同時預測均方誤差也有了很大改善,ANFIS模型的預測均方誤差為2.8×10-3,而BP模型的預測均方誤差為2.34×10-2,RBF模型的預測均方誤差為1.3×10-2;另外從標準誤差(RMSE)數據對比可以看出ANFIS模型預測標準誤差為5.33×10-2,而BP模型預測標準誤差為1.14×10-1,RBF模型預測標準誤差為1.53×10-1,ANFIS模型預測結果的離散程度更低,更接近于實際值。因此,基于ANFIS模型的預測更精確。
3 結論
本文討論ANFIS的訓練次數、隸屬度函數數目和隸屬度函數類型對ANFIS的影響,取得了良好的效果,為后續的進一步預測研究打下了基礎。通過對ANFIS后件參數的改進,能進一步提高系統建模的精度和速度。
根據實測數據建立了ANFIS模型對COD進行了預測,預測結果表明,與BP神經網絡和RBF神經網絡相比,ANFIS模型使平均相對誤差從6%減小到1.82%,其均方誤差從2.34×10-2減小到2.8×10-3,標準誤差由1.53×10-1減小到5.33×10-2。表明ANFIS模型比BP神經網絡和RBF神經網絡具有更好的預測精度。
實踐表明,ANFIS很好地融合了模糊邏輯和神經網絡這兩種理論,既融合了神經網絡的學習功能,又實現了模糊推理,發揮二者的優點,彌補了各自的不足。本文將ANFIS引入水質預測當中,對于預測水質COD的準確性有顯著提高。ANFIS預測模型為河段的水質預測提供了一種較為簡便又有一定精度的新預測方法。endprint
參考文獻(References):
[1] 湯斌,趙敬曉,魏彪,蔣上海,羅繼陽,Vo Quang Sang,馮鵬,米
德伶.一種紫外-可見光譜檢測水質COD預測模型優化方法[J].中國環境科學,2015.35(2):478-483
[2] 崔雪梅.基于灰色GA-LM-BP模型的CODMn預測[J].水利
水電科技進展,2013.33(5):38-41
[3] 宓云軿,王曉萍,金 鑫.基于機器學習的水質COD預測方法[J].
浙江大學學報(工學版),2008.42(5):790-793
[4] 梁 勇.基于支持向量回歸的水質預測研究[D].武漢理工大學,
2012.4.
[5] 高 峰,馮民權,滕素芬.基于PSO優化BP神經網絡的水質預
測研究[J].安全與環境學報,2015.15(8):338-341
[6] Hamid Zare Abyaneh. Evaluation of multivariate linear
regression and artificial neural networks in prediction of water quality parameters[J].Environmental Health Science & Engineering,2014.12:2-8
[7] Davut Hanbay, Ibrahim Turkoglu, Yakup Demir.Prediction
of Chemical Oxygen Demand (COD) Based on Wavelet Decomposition and Neural Networks[J].CLEAN-Soil,Air,Water,2007.6-3(35):250-254
[8] S. Emamgholizadeh ,H. Kashi, I. Marofpoor ,E. Zalaghi.
Prediction of water quality parameters of Karoon River (Iran) by artificial intelligence-based models[J].environmental science & technology,2014.11:645-656
[9] 馬細霞,郭慧芳.水利工程方案綜合評價的ANFIS模型[J].中
國農村水利水電,2007.10:65-67
[10] Singh KP, Basant A, Malik A, Jain. Artificial neural
network modeling of the river water quality, a case study[J].ecological modelling,2009.220:888-895
[11] ZHAO Shixin,ZHANG Chen,LI Jingyi,et al.Predicted
water-quality evaluation of Lihe sector in Lua-nhe diversion to Tianjin water project based on BP neural network[J].Journal of Safety and Envir-onment,2010.10(2):93-96
[12] Reza Mohammadpour,Syafiq Shaharuddin,Chun Kiat
Chang,Nor Azazi Zakaria, Aminuddin Ab Ghani, Ngai Weng Chan. Prediction of water quality index in constructed wetlands using support vector machine[J].environmental science and pollution research,2015.4-8(22):6208-6219endprint