劉星宇 程建 牛藝曉 楊春



摘要:葉綠素a質量濃度是預測湖泊水華形成的重要影響因子,但常用的徑向基(radial basis function,RBF)神經網絡存在容易陷入局部極值,導致預測精度欠佳.針對這一問題,采用自適應遺傳算法(adaptive genetic algorithm,AGA)對RBF神經網絡進行優化,構建基于AGA-RBF神經網絡預測模型,以莆田東圳水庫為應用案例,對葉綠素a質量濃度進行預測,通過采集到的數據對預測模型進行仿真,對比均方根誤差(RMSE)、相對誤差(RE)以及平均相對誤差(MRE),驗證改進后的AGA-RBF模型具有更好的預測精度,以期對葉綠素a質量濃度進行長期預測.
關鍵詞:RBF人工神經網絡; 自適應遺傳算法; 預測模型; 葉綠素a質量濃度
中圖分類號:TP183? 文獻標志碼:A? 文章編號:1001-8395(2024)05-0670-06
doi:10.3969/j.issn.1001-8395.2024.05.012
隨著社會的快速發展,人類的大規模開發和生產行為導致水體富營養化現象劇增,水華的爆發也越來越頻繁,而水華的爆發使得水環境越來越差,長此以往,污染越來越嚴重,在諸多水質環境監測要素中,葉綠素a質量濃度能夠很好地反映湖泊藻類生物數量[1],對葉綠素a質量濃度進行準確的預測能夠為水體提供數據支撐,預防水體富營養化的發生.目前葉綠素a質量濃度預測主要運用的模型有多元線性回歸模型[2-6]、時間序列模型[7-10]以及神經網絡模型[11-18].多元線性回歸預測具有計算過程簡單和預測速度快等優勢,但多元回歸預測模型對于數據的代表性和隨機性要求較高;時間序列預測模型建模相對簡單,短期預測精度高,但需要長期預測的數據,模型預測精度差;神經網絡作為當前最流行的預測模型,它的預測能力和非線性擬合能力都十分優越,還可以用于中長期預測.裴洪平等[12]以水溫和葉綠素a質量濃度這兩者作為輸入變量建立的BP(back propagation)神經網絡,能有效預測西湖生態系統中非線性變量葉綠素a質量濃度的變化.胡志洋等[13]建立了基于ABC-BP神經網絡預測模型,結果表明,經ABC(artificial bee colony)算法優化后,BP神經網絡模型預測梅梁灣葉綠素a質量濃度的平均相對誤差從8.83%降低到3.31%,提高了葉綠素a質量濃度短期預測的準確性.周游等[14]使用遺傳算法對BP神經網絡連接權值進行優化,提高了葉綠素a質量濃度的預測精度.Hameed 等[15]構建了BP和RBF神經網絡預測模型,根據預測結果比較分析模型的預測性能,預測效果雖沒有太大差別,但RBF的性能優于BP的性能.RBF神經網絡相較于BP神經網絡,復雜度高,結構龐大,運算量也增加不少,但RBF神經網絡具有對函數逼近性能更高的優勢,且對于小樣本數據也能有不錯的效果[16].劉載文等[17]研究了RBF網絡基函數中心、寬度和權值的監督學習算法,提出了基于RBF神經網絡的水華預測方法,能夠有效預測葉綠素a的短期變化規律,但仍存在易陷入局部極值[18]和中長期預測精度不佳等問題.為了保證模型的預測精度和中長期預測效果,本文利用自適應遺傳算法優化RBF神經網絡參數,提出一種基于AGA-RBF神經網絡的預測模型,自適應遺傳算法全局優化能力十分強大,能有效解決RBF神經網絡易陷入局部最優的問題,從而提高葉綠素a質量濃度預測的精準度,為水質管理決策提供數據支撐.
1 AGA-RBF神經網絡模型設計
1.1 RBF神經網絡
RBF神經網絡的結構如圖1所示,x=[x1,x2,...,xn]T為網絡的n維輸入,本文選用與葉綠素a質量濃度有顯著相關關系的水質影響因子作為輸入,y=[y1,y2,...,ym]T為網絡的m維輸出,選用葉綠素a質量濃度數據作為輸出,c=[c1,c2,...,cm]T為隱含層徑向基函數中心構成的矩陣.由于高斯函數具有徑向對稱,解析性好,并存在任意階導數等優點[19],本文使用高斯函數作為徑向基函數,則RBF神經網絡的輸出y可表示為
y=∑mi=1Wikexp(-‖x-ci‖22σ2i),i=1,2,…,m,(1)
其中,ci是第i個基函數的中心,σi是基函數中心點的寬度,Wik是權值.
1.2 遺傳算法優化RBF神經網絡參數
由上述RBF神經網絡的基本原理可知,RBF神經網絡的參數選取十分重要.目前常用的隨機選取中心法、自組織選取中心法等對樣本數據需求較大,且在訓練過程中易陷入局部極小值,無法得到最優的基函數中心和隱含層節點寬度[20].因此,本文將自適應遺傳算法(AGA)引入到RBF神經網絡的參數尋優中,建立AGA-RBF神經網絡預測.遺傳算法的全局搜索能力很強,但由于標準遺傳算法僅僅通過適應度值的大小判斷解的優劣,因此,如果算法前期個體的適應度值越大,該個體對于種群的影響就越大,導致種群中個體分布過于集中,種群失去多樣性,難以尋找到全局最優值,造成算法早熟;在標準遺傳算法中,選擇操作選出的個體適應度值高于原個體,但交叉和變異操作并不能保證這一點,如果新個體不夠優良,就會影響遺傳算法的進化,減慢算法運行的速度.針對上述標準遺傳算法的2點不足,自適應遺傳算法從以下方面對標準遺傳算法進行了改進.
劉星宇,等:基于AGA-RBF神經網絡模型的葉綠素a質量濃度預測研究
1) 改變交叉和變異概率,使得交叉率和變異率根據個體的適應度值以及進化代數進行調節:
pc=pc_max-((pc_max-pc_min)tmax)t, f′>favg,pc_max, f′≤favg,(2)
pm=pm_min-((pm_max-pm_min)tmax)t, f′>favg,pm_min, f′≤favg,?(3)
其中,pc表示交叉概率,pm表示變異概率,t表示進化代數,tmax表示進化最大代數,f′表示交叉個體之間較大的適應度值,f表示變異個體適應度值,favg表示種群的平均適應度值.
通過調整交叉概率和變異概率,算法在進化早期全局搜索能力較強,能夠快速尋找到最優解的取值空間,隨著進化代數的增加,局部搜索能力增強,更易于找到全局最優值,防止算法早熟.
2) 針對交叉和變異操作無法保證產生更優良個體這一問題,在交叉和變異操作中引入適應度函數,如果原個體經過交叉或變異后適應度值增大,就保留該個體的變化,否則保留原個體,此種改進可以保證交叉和變異操作后的個體都是優于原個體的,使算法尋到全局最優解后快速收斂,加快進化速度,縮短了算法運行時間.
2 算法流程
利用AGA對RBF神經網絡的基函數中心、寬度以及連接權值進行優化,從而得到RBF神經網絡的最優基函數中心、寬度和連接權值,具體流程如圖2所示.
1) 數據預處理.對數據進行歸一化處理,歸一化處理對后續的數據處理提供便利,而且有助于模型訓練結果更加精準.本文采用min-max標準化,將原始數據按照一定比例縮放到[0,1]之間,具體公式如下:
x=-xminxmax-xmin.(4)
2) 編碼.本文使用二進制編碼方法,將徑向基函數的中心、寬度以及權值編成二進制的字符串,用字符串來表示每個個體的染色體,隨機產生n個染色體,組成初始種群P.
3) 選擇適應度函數.適應度函數是進行評價個體優劣的依據,本文選用均方根誤差(RMSE)作為適應度函數:
f=σRMSE=1n∑ni=1(i-yi),(5)
其中,n為樣本個數,i為實際值,yi為預測值.
4) 選擇操作.選擇算子的選取基于概率的輪盤賭法,根據個體的適應度值進行選擇復制操作,形成具有N個體的臨時集合C.
5) 交叉操作.交叉算子采用單點交叉,對臨時集合C進行交叉操作,產生新染色體種群集合C′.
6) 變異操作.變異算子采用單點變異,對集合C′中的個體實施變異操作,產生新的個體種群集合C″.
7) 終止條件.一般情況下,達到最大迭代次數或計算結果達到最小誤差時停止運算,若滿足終止條件,執行下一步,不滿足,令P=C″轉至操作3).
8) 輸出.將種群集合中最優值作為遺傳算法的輸出.
9) 訓練RBF神經網絡.將AGA的輸出作為RBF神經網絡參數.
3 仿真測試
為驗證算法的有效性,本文使用MATLAB對基于RBF神經網絡預測模型與AGA-RBF神經網絡預測模型分別進行仿真測試.根據現有的莆田東圳水庫2021年連續300 d的葉綠素a質量濃度數據,取前240 d數據作為訓練集樣本,后60 d數據作為測試集樣本.在基于AGA-RBF神經網絡的模型中,經反復實驗,主要參數設置如下,在AGA中,初始種群規模n設為30,最大交叉概率pc_max取0.9,最小交叉概率pc_min取0.1,最大變異概率pm_max取0.4,最小變異概率pm_min取0.01,訓練誤差為0.01,最大迭代次數為100.在RBF中,經過相關性分析,有5個影響因子與葉綠素a質量濃度存在顯著性相關關系,因此確定輸入節點個數為5,分別對應5種環境因子:溶解氧、電導率、濁度、氨氮和葉綠素a質量濃度,輸出節點為1,即將葉綠素a質量濃度作為輸出變量,訓練終止條件為總體誤差小于或等于0.001.
4 實驗分析
使用RBF神經網絡和AGA-RBF神經網絡對葉綠素a質量濃度進行預測,得出優化前后RBF神經網絡葉綠素a質量濃度預測值和真實值對比,如圖3所示.本文以預測結果的均方根誤差(RMSE)、相對誤差(RE)以及平均相對誤差(MRE)作為預測模型的評價指標,其計算公式為:
σRMSE=1n∑ni=1(i-yi),(6)
σRE=i-yii,(7)
σMRE=1n∑ni=1|i-yii|.(8)
(a) 傳統RBF神經網絡預測值與實際值對比
(b) AGA-RBF神經網絡預測值與實際值對比
圖3是RBF與AGA-RBF預測結果趨勢圖對比,其中,星號實線在圖中均代表的是葉綠素a真實質量濃度數據,圓圈虛線在圖中分別代表的是RBF神經網絡模型預測數據和AGA-RBF神經網絡模型預測數據.從圖3可以看出,使用RBF神經網絡模型對葉綠素a質量濃度進行預測,可以大致預測出葉綠素a質量濃度的變化趨勢,但均方根誤差高達0.783,而AGA-RBF神經網絡模型,均方根誤差僅為0.166.表1計算了RBF與AGA-RBF預測值與實際值的相對誤差,RBF預測值與實際值的平均相對誤差為7.08%,其中,相對誤差最大達到-12.23%,最小為-2.72%,而AGA-RBF預測值與實際值的平均相對誤差為1.20%,其中相對誤差最大為-3.81%,最小為-0.07%,可以看出,使用 [10]AGA-RBF神經網絡模型得到的葉綠素a質量濃度值與實際值更為接近,雖然仍存在一定誤差,但與RBF神經網絡預測效果相較,預測精準度明顯提高.
5 實驗結論
針對RBF神經網絡在葉綠素a質量濃度預測中易陷入局部最優解的問題,本文利用AGA算法對RBF網絡的參數進行全局優化,提出了基于AGA-RBF神經網絡預測模型.利用MATLAB進行仿真分析,結果表明,經過AGA算法優化過的RBF神經網絡預測模型不僅解決了RBF神經網絡訓練時易陷入局部最優值的問題,而且具有更好的預測精度,在中長期葉綠素a質量濃度預測中也具有更強的適應能力,與傳統RBF神經網絡模型相比,預測均方根誤差降低了0.617 7,平均相對誤差降低了5.88%,有效降低了葉綠素a質量濃度的預測誤差,性能明顯優于傳統模型,在水質預測中有著更好的實用性.
參考文獻
[1] 代前程. 基于多源遙感數據的南漪湖葉綠素a濃度反演及變化研究[D]. 南京:南京信息工程大學,2022.
[2] 袁健,樹錦. 改進多元回歸法與神經網絡應用于水質預測[J]. 水資源保護,2008,24(3):46-48.
[3] 梁勇. 基于支持向量回歸的水質預測研究[D]. 武漢:武漢理工大學,2012.
[4] 劉紅梅,徐英嵐,張博,等. 基于最小二乘支持向量回歸的水質預測[J]. 計算機與現代化,2019(9):31-34.
[5] 李修竹,蘇榮國,張傳松,等. 基于支持向量機的長江口及其鄰近海域葉綠素a濃度預測模型[J]. 中國海洋大學學報(自然科學版),2019,49(1):69-76.
[6] 黃克勤,吳海洋,賈德庚. 基于多元線性回歸模型的水質優化研究[J]. 四川有色金屬,2021(4):58-60.
[7] 肖金樹. 指數平滑法在水質預測中的應用[J]. 福建環境,1996(4):34-35.
[8] 王伍軍,鄢貴權,丁堅平,等. 城鎮地區巖溶地下水污染的水質預測[J]. 貴州工業大學學報,1997,26(2):62-66.
[9] 孫國紅,沈躍,徐應明,等. 基于Box-Jenkins方法的黃河水質時間序列分析與預測[J]. 農業環境科學學報,2011,30(9):1888-1895.
[10] 任樹順,高萌,王煦雯,等. 基于3種時間序列模型的九龍江河流庫區藻華預測[J]. 環境科學學報,2022,42(11):172-183.
[11] MAIER H R, DANDY G C. The use of artificial neural networks for the prediction of water quality parameters[J]. Water Resources Research,1996,32(4):1013-1022.
[12] 裴洪平,羅妮娜,蔣勇. 利用BP神經網絡方法預測西湖葉綠素a的濃度[J]. 生態學報,2004,24(2):246-251.
[13] 胡志洋,李翠梅,薛天一. 基于灰色關聯和ABC-BP神經網絡的葉綠素a濃度預測[J]. 水電能源科學,2021,39(1):55-58.
[14] 周游,陸安江,劉璇. 基于改進遺傳算法的BP神經網絡的水體葉綠素a含量預測[J]. 電子測試,2022,36(15):37-42.
[15] HAMEED M, SHARQI S S, YASEEN Z M, et al. Application of artificial intelligence (AI) techniques in water quality index prediction: a case study in tropical region, Malaysia[J]. Neural Computing and Applications,2017,28(1):893-905.
[16] 劉永,張立毅. BP 和 RBF 神經網絡的實現及其性能比較[J]. 電子測量技術,2007,30(4):77-80.
[17] 劉載文,崔莉鳳,王小藝,等. 基于RBF神經網絡的河湖水華軟測量方法[C]//第二十六屆中國控制會議論文集.北京:北京航空航天大學出版社,2007:3446-3449.
[18] 余可春. 基于改進RBF神經網絡模型的SOFC性能預測方法[J]. 計算技術與自動化,2023,42(2):124-129.
[19] 宋朝鵬. 改進遺傳算法優化RBF神經網絡在短期電力負荷預測中的應用[J]. 電子世界,2021(16):164-165.
[20] 張麗娜. 基于RBF神經網絡的水質預測模型研究[D]. 邯鄲:河北工程大學,2019.
The Study of Chlorophyll-a Mass Concentration Prediction Based on AGA-RBF Neural Network Model
LIU Xingyu1,2, CHENG Jian2,3, NIU Yixiao1,2, YANG Chun1,2
(1. School of Mathematical Sciences, Sichuan Normal University, Chengdu 610066, Sichuan;2. Key Laboratory of the Evaluation and Monitoring of Southwest Land Resources, Chengdu 610066, Sichuan;3. Center of Network and Information, Sichuan Normal University, Chengdu 610066, Sichuan)
Keywords:Abstract:Chlorophyll-a mass concentration plays a crucial role in predicting the formation of lake blooms. However, the traditional radial basis function (RBF) neural network is susceptible to local optimal solutions, resulting in poor prediction accuracy. In this study, we employ an adaptive genetic algorithm (AGA) to optimize the neural network model, and a prediction model based on AGA-RBF neural network is constructed to predict? the concentration of? the chlorophyll a using Putian Dongshen Reservoir as an application case. Through the utilization of collected data to simulate the prediction model, we demonstrate that the improved AGA-RBF model has a good prediction accuracy, which is verified by the comparison of the root-mean-squared error (RMSE), the relative error (δ), and the average relative error (MRE). After the comparison of the root mean square error and the average relative error, it was verified that the improved AGA-RBF model has better prediction accuracy and is highly practical in the medium- and long-term prediction of the mass concentration for chlorophyll a.
radial basis function neural network; adaptive genetic algorithm; prediction model; chlorophyll-a mass concentration2020 MSC:68T07
(編輯 鄭月蓉)
基金項目:國家自然科學基金(12101438)、中央引導地方科技發展項目(2022ZYD0011)和四川省自然科學基金(2022NSFSC1852)
*通信作者簡介:楊 春(1970—),男,博士,教授,研究生導師,主要從事數學模型算法、應用軟件開發、機器學習與人工智能的研究,E-mail:328341729@qq.com
引用格式:劉星宇,程建,牛藝曉,等.基于AGA-RBF神經網絡模型的葉綠素a質量濃度預測研究[J]. 四川師范大學學報(自然科學版), 2024,47(5):670-675.