李順勇,張睿軒,譚紅葉
(1.山西大學數(shù)學科學學院,山西 太原 030006;2.山西大學計算機與信息技術學院,山西 太原 030006)
生態(tài)環(huán)境的水資源是地球生物生存的保障,準確預測水質(zhì)指標已逐漸發(fā)展為重要的研究方向。水質(zhì)指標主要包含水溫、pH、水質(zhì)類別、總磷、總氮、高錳酸鉀、氨氮、電導率、濁度和溶解氧。其中,溶解氧含量是衡量水體質(zhì)量的重要指標之一,常用于評估河流水質(zhì)狀況,其含量變化與河道水體新陳代謝率息息相關;同時水體富營養(yǎng)化是全球主要的水環(huán)境問題,而氮、磷含量高是造成水體富營養(yǎng)化的主要原因。因此,預測氮、磷和溶解氧含量對評估河流水質(zhì)和控制污染物排放具有重要意義。
水質(zhì)指標數(shù)據(jù)具有時序性、不穩(wěn)定性和非線性的特點,因此水質(zhì)指標預測是典型的時間序列分析任務。傳統(tǒng)的時間序列分析方法和機器學習方法難以捕捉其非線性的變化趨勢。神經(jīng)網(wǎng)絡方法因其善于捕捉數(shù)據(jù)中非線性信息的特點而被應用于水質(zhì)預測研究中,該方法涉及到的神經(jīng)網(wǎng)絡主要有三類:
1)BP 神經(jīng)網(wǎng)絡[1-2],如:2014年,Ding J 等人將BP 神經(jīng)網(wǎng)絡與人工神經(jīng)網(wǎng)絡相結合,預測錢塘江流域水質(zhì)的諸多指標,但該方法捕捉時間序列中長距離自相關信息的能力比較差,預測精度不高[1]。
2)長短期記憶(Long Short Term Memory, LSTM)神經(jīng)網(wǎng)絡,如:2022年,Wu J 等人將人工神經(jīng)網(wǎng)絡、離散小波變換和LSTM 結合預測水質(zhì),但各水質(zhì)指標的影響因素較多,而LSTM 無法捕捉數(shù)據(jù)指標間的相關性[3-5]。
3)CNN-LSTM 組合模型[6-8],如:2022年,張麗娜等人將時間序列對抗生成網(wǎng)絡TimeGAN 與CNN-LSTM 模型相結合預測河流水質(zhì)[8]。該模型在LSTM 的基礎上,利用CNN 挖掘各水質(zhì)指標間的相關關系,充分提取水質(zhì)數(shù)據(jù)在時間和空間上的特征,更準確地預測了水質(zhì)指標。但是該方法忽視了河流流向,沒有考慮河流上游對下游水質(zhì)產(chǎn)生的影響。
此外,研究者針對CNN-LSTM 模型,利用優(yōu)化算法調(diào)整神經(jīng)網(wǎng)絡模型中的參數(shù),如:張銘瑋等人利用量子粒子群調(diào)整CNN-LSTM 組合模型中的參數(shù),解決了深度學習模型CNN-LSTM 中待調(diào)整的超參數(shù)較多的問題,但優(yōu)化算法中仍存在較多超參數(shù)需要設置[9]。
本文建立基于哈里斯鷹優(yōu)化算法(Harris Hawks Optimization, HHO)的時空水質(zhì)預測模型(WT-CNNLSTM-HHO)。該模型考慮了河流流向,結合上游水質(zhì)指標數(shù)據(jù)對下游監(jiān)測點水質(zhì)變化進行預測;同時,利用HHO 算法調(diào)整神經(jīng)網(wǎng)絡中的神經(jīng)元數(shù)量、學習率和Dropout 等超參數(shù),優(yōu)化神經(jīng)網(wǎng)絡調(diào)參方法,在設置較少超參數(shù)的同時進一步提升了模型的預測精度。
本文建立時空水質(zhì)預測模型(WT-CNN-LSTMHHO),分析河流流向,基于上游監(jiān)測點水質(zhì)指標預測下游水質(zhì),并利用HHO 調(diào)整模型中的參數(shù)。時空水質(zhì)預測模型主要分為三部分:數(shù)據(jù)降噪模塊、水質(zhì)預測模塊和參數(shù)優(yōu)化模塊。首先,在數(shù)據(jù)降噪模塊中,利用小波變換對數(shù)據(jù)進行降噪處理;其次,在水質(zhì)預測模塊中,利用CNN 網(wǎng)絡提取各站點間的空間依賴關系,再將特征提取后的數(shù)據(jù)輸入LSTM 模型,對天津海河大閘水質(zhì)監(jiān)測點的溶解氧、氮和磷含量進行預測;最后,在參數(shù)優(yōu)化模塊中,選取HHO 算法優(yōu)化神經(jīng)網(wǎng)絡中的預測步長、神經(jīng)元數(shù)量、學習率、Dropout 等超參數(shù)。水質(zhì)預測模型結構如圖1 所示。

圖1 水質(zhì)預測模型結構示意圖
數(shù)據(jù)降噪模塊利用小波變換對數(shù)據(jù)進行降噪處理。小波變換(Wavelet Transform, WT)源于傅里葉分析,是一種常見的信號濾波方法,廣泛應用于數(shù)字信號處理等領域[10]。針對包含噪聲的信號,信號中的有效信息經(jīng)小波分解后小波系數(shù)較大,而噪聲部分小波分解后的小波系數(shù)較小,設定恰當閾值,可以認為大于該閾值的部分為有效信息,而小于該閾值的部分為噪聲,進而實現(xiàn)小波降噪。
選擇恰當?shù)男〔ê瘮?shù)是小波降噪過程中的重要步驟[11],通常需要對比不同小波函數(shù)的降噪效果,選擇恰當?shù)男〔ê瘮?shù)。本文選用降噪前后信號均方誤差衡量小波變換的降噪效果。均方誤差越小,表明針對當前信號該小波函數(shù)的降噪效果越好。小波降噪的流程如圖2 所示。

圖2 小波降噪步驟
水質(zhì)預測模塊利用CNN-LSTM 網(wǎng)絡預測水質(zhì)指標。其中,卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)受視覺神經(jīng)機制的啟發(fā)而設計。CNN 因其結構中包含局部連接、權值共享等特點,具有強大的特征提取能力,尤其在圖像處理方面有較大的優(yōu)勢[12]。CNN 基本結構包含:輸入層、卷積層、池化層、全連接層和輸出層[13]。其中,卷積層的作用是借助數(shù)學中卷積的概念,實現(xiàn)對輸入數(shù)據(jù)的特征提取,是卷積神經(jīng)網(wǎng)絡的核心;池化層的作用是縮小矩陣的尺寸,大幅降低模型計算量[14]。
長短期記憶神經(jīng)網(wǎng)絡通過門結構實現(xiàn)對時間序列信息的控制和保護,分別是遺忘門、輸入門和輸出門[15]。基于門結構,LSTM 解決了RNN 梯度彌散的問題[16],因而對于時間序列具備長期記憶的能力,能夠更好地挖掘時間序列中的信息,進而實現(xiàn)對時間序列的準確預測。
CNN-LSTM 組合模型融合兩者優(yōu)勢,利用CNN 提取各指標間的依賴關系,LSTM 用于預測時間序列,可以較好地結合多監(jiān)測點數(shù)據(jù)預測目標監(jiān)測點水質(zhì)。水質(zhì)預測模塊結構如圖3 所示。

圖3 水質(zhì)預測模塊結構示意圖
參數(shù)優(yōu)化模塊選取HHO 算法調(diào)整神經(jīng)網(wǎng)絡中的參數(shù)。哈里斯鷹優(yōu)化算法[17-19]模擬了哈里斯鷹圍捕兔子的過程,將圍捕過程抽象成探索和開發(fā)兩個階段,每個階段有不同的搜索機制。
1.4.1 探索階段
在圍捕獵物的過程中,哈里斯鷹棲息在某地,定位并等待發(fā)現(xiàn)獵物。HHO 算法的探索階段中共有兩種棲息策略,兩種棲息策略的概率均等,表達式如下:
式中:X(t)表示t輪迭代中哈里斯鷹的位置;Xrabbit(t)表示第t輪迭代中兔子的位置;q和ri是(0,1)內(nèi)的隨機數(shù);Xrand(t)是當前種群內(nèi)隨機一只哈里斯鷹的位置;Xm(t)是所有哈里斯鷹的平均位置。
1.4.2 探索階段到開發(fā)階段的過渡
哈里斯鷹在捕食過程中,捕食者需要根據(jù)獵物的逃跑能量在不同圍捕行為間轉換,此過程獵物自身能量對應的數(shù)學模型可表示為:
式中:T表示最大迭代次數(shù);E0表示初始逃逸能量,在(-1,1)內(nèi)隨機取值。
1.4.3 開發(fā)階段
針對獵物逃脫概率r和獵物剩余能量 ||E,HHO 算法的開發(fā)階段不斷在軟圍攻和硬圍攻間切換。
1)軟圍攻
當r≥0.5 且 ||E≥0.5 時,哈里斯鷹位置更新方式如下:
式中:ΔX(t) =Xrabbit(t) -X(t)表示第t輪迭代中當前位置與兔子位置之間的距離;J= 2(1 -r5)表示兔子逃脫過程中的隨機跳躍強度,r5為(0,1)內(nèi)的隨機數(shù)。
2)硬圍攻
當r≥0.5 且 |E|<0.5 時,哈里斯鷹的位置按如下表達式進行更新:
3)軟圍攻與漸進快速俯沖
當r<0.5 且 |E|≥0.5 時,HHO 算法利用Levy Flight中的低頻信號模擬獵物逃跑時的運動軌跡和哈里斯鷹抓捕獵物時快速的俯沖,哈里斯鷹的位置更新方式可以表示如下:
式中:D為優(yōu)化問題的維度;S為1 ×D維的隨機向量;LF(x)表示Levy 飛行函數(shù)。
4)硬圍攻與漸進快速俯沖
當r<0.5 且 |E|<0.5 時,策略與軟圍攻并漸進快速俯沖類似,哈里斯鷹的位置更新方式表示如下:
哈里斯鷹在圍捕兔子的過程中自動調(diào)整圍捕策略,以達到更強的搜索能力,且僅需設置2 個超參數(shù):哈里斯鷹數(shù)量和迭代次數(shù),少于粒子群優(yōu)化算法和量子粒子群算法。
本文選取天津海河流域監(jiān)測點的水質(zhì)數(shù)據(jù)完成算法實證,數(shù)據(jù)來自青悅數(shù)據(jù)。考慮到河流上游水質(zhì)對下游有一定影響,選擇海河大閘監(jiān)測點及其上游的大紅橋、曹莊子泵站、井岡山橋、北洋橋和生產(chǎn)圈閘共計6 個國控水質(zhì)監(jiān)測點作為研究對象,時間跨度為2022年6 月1 日—2022年10 月31 日,數(shù)據(jù)的采樣間隔為4 h,每個監(jiān)測點共918 條數(shù)據(jù)。本文主要基于水溫、pH、水質(zhì)類別、總磷、總氮、高錳酸鉀、氨氮、電導率、濁度和溶解氧水質(zhì)指標,對總磷、總氮和溶解氧進行預測。監(jiān)測點的相對位置關系如圖4 所示。

圖4 天津海河流域監(jiān)測點名稱及地理位置關系
小波降噪。本文選擇使用db5、haar、sym10 和coif10 共4 種小波函數(shù)對數(shù)據(jù)進行降噪,利用原始序列與降噪后序列的均方誤差衡量小波變換的降噪效果。兩序列間的均方誤差越小,表明該小波函數(shù)的降噪效果越好。以海河大閘監(jiān)測點的各水質(zhì)指標為例,各小波函數(shù)的降噪效果如表1 所示,水溫、pH、溶解氧、高錳酸鉀、總磷、總氮、電導率和濁度選用coif10 小波基函數(shù),氨氮選擇sym10 函數(shù)。

表1 不同水質(zhì)指標的小波基函數(shù)降噪效果
CNN-LSTM 模型參數(shù)設置。模型包含1 層卷積層、1 層池化層和2 層LSTM 層。根據(jù)時間序列偏自相關系數(shù)特點,將預測步長定為13。神經(jīng)網(wǎng)絡中,卷積層中卷積核的數(shù)量設置為32,第1 層LSTM 神經(jīng)元數(shù)量設置為64,第2 層LSTM 神經(jīng)元數(shù)量設置為32,學習率均設置為0.001。
優(yōu)化算法參數(shù)設置。為有效對比優(yōu)化算法的效果,將PSO 算法、QPSO 算法中的種群規(guī)模和HHO 中的哈里斯鷹數(shù)量均設置為30,迭代次數(shù)同為50 次。待調(diào)參數(shù)的取值范圍如表2 所示。

表2 參數(shù)取值范圍
2.3.1 基于上游水質(zhì)的時空水質(zhì)預測結果
為驗證本文提出的基于上游水質(zhì)數(shù)據(jù)的WT-CNNLSTM 模型的優(yōu)越性,將基于海河大閘單監(jiān)測點建立的CNN-LSTM 模型與基于上游水質(zhì)數(shù)據(jù)建立的CNNLSTM 模型的預測效果進行對比,驗證CNN 網(wǎng)絡提取多監(jiān)測點間數(shù)據(jù)空間依賴性優(yōu)勢顯著;將WT-CNN-LSTM模型與CNN-LSTM 模型的預測效果對比,驗證利用小波變換對數(shù)據(jù)降噪的重要性;將WT-CNN-LSTM 與WTCNN 對比,驗證LSTM 預測時間序列的優(yōu)勢。本文分別選取RMSE、MAE 和MAPE[20-21]作為模型的評價指標。為避免單次運行結果的偶然性,每個模型運行10 次,將各評價指標的平均值作為各模型最終預測效果的評價指標。
針對溶解氧、總磷和總氮指標,四種模型的評價指標對比如表3~表5 所示。

表3 模型溶解氧預測的評價指標對比

表4 模型總磷預測的評價指標對比

表5 模型總氮預測的評價指標對比
綜合分析表3~表5 可知,針對總氮指標,本文所提新模型的3 個指標均達到最優(yōu),而針對溶解氧和總磷指標,該模型在兩個評價指標達到最優(yōu),故該模型為當前的最優(yōu)模型。以溶解氧指標為例,WT-CNN-LSTM 模型與CNN-LSTM 模型相比,RMSE 降低了47.26%,MAE 降低了42.11%,表明小波降噪可以有效提高模型預測精度;與WT-CNN 模型相比,本文所提模型RMSE 降低了27.71%,MSE 降低了38.56%,證明了LSTM 預測時間序列數(shù)據(jù)的優(yōu)勢;與單監(jiān)測點相比,利用上游水質(zhì)數(shù)據(jù)預測溶解氧含量的WT-CNN-LSTM 模型RMSE 降低了8.90%,MAE 降低了9.65%,但MAPE 指標稍高。MAPE評價指標對極端數(shù)據(jù)的預測效果不敏感,MAPE 高而RMSE 和MAE 低表明基于上游水質(zhì)的預測模型對于極端數(shù)據(jù)的預測效果更好,充分說明該模型可以有效提升水質(zhì)的預測精度。氮、磷的預測情況與溶解氧指標類似。
經(jīng)上述分析,基于上游水質(zhì)的時空水質(zhì)預測模型(WT-CNN-LSTM)的預測精度最高。本文在該模型的基礎上,繼續(xù)利用PSO、QPSO 和HHO 三種優(yōu)化算法調(diào)整神經(jīng)網(wǎng)絡模型中的參數(shù),從而進一步有效提升模型的預測效果。
2.3.2 基于HHO 的神經(jīng)網(wǎng)絡參數(shù)優(yōu)化
1)優(yōu)化過程
本文在基于上游水質(zhì)數(shù)據(jù)的時空水質(zhì)預測模型(WT-CNN-LSTM)中分別使用優(yōu)化算法HHO、PSO 和QPSO 最小化模型的loss 函數(shù),調(diào)整神經(jīng)網(wǎng)絡中的參數(shù),以溶解氧指標為例,優(yōu)化過程如圖5 所示。分析圖5 可知,針對溶解氧指標,PSO 算法在第31 輪達到最優(yōu),QPSO 算法在第38 輪迭代時達到最優(yōu),而HHO 算法在第27 輪迭代時達到最優(yōu),故HHO 算法收斂速度更快。

圖5 不同算法優(yōu)化過程對比
2)優(yōu)化效果
為比較三種調(diào)參方法的優(yōu)劣,將三種算法調(diào)參后模型的預測曲線繪制在同一張圖中進行對比,如圖6 所示。以溶解氧為例,由圖6 可知,經(jīng)過各種方法調(diào)參的WT-CNN-LSTM 的預測值可以基本擬合溶解氧變化的趨勢,但對于個別極端數(shù)據(jù),WT-CNN-LSTM-HHO 模型的擬合效果明顯優(yōu)于其他模型。

圖6 不同算法溶解氧指標預測效果對比
利用各模型預測溶解氧、總磷和總氮指標,模型評價指標分別如表6、表7 和表8 所示。

表6 溶解氧指標模型預測情況

表7 總磷指標模型預測情況

表8 總氮指標模型預測情況
由表6 可知,以溶解氧指標為例,3 個評價指標中,WT-CNN-LSTM-HHO 的RMSE 和MAE 均達到最小值,分別為1.381 和1.030,但MAPE 指標沒有達到最小,該評價指標受極端值預測效果影響較小。綜合三種評價指標分析,再次證明本文所提出的基于HHO 優(yōu)化的時空水質(zhì)預測模型對于極端值的預測效果更好。
相較于WT-CNN-LSTM 模型,WT-CNN-LSTM-HHO模型的RMSE 降低了5.48%,MAE 降低了9.65%,MAPE降低了4.17%,故使用HHO 算法調(diào)整模型中的參數(shù)有效提升了模型的預測精度。與WT-CNN-LSTM-PSO 模型相比,WT-CNN-LSTM-HHO 模型的RMSE 降低了3.49%,MAE 降低了6.36%。與WT-CNN-LSTM-QPSO 模型相比,WT-CNN-LSTM-HHO 模型的RMSE 降低了3.49%,MAE 降低了3.47%??偭缀涂偟笜祟A測情況與溶解氧指標類似。綜上分析,所提出的WT-CNNLSTM-HHO 模型對水質(zhì)指標的變化趨勢的預測效果最優(yōu)。
3)參數(shù)數(shù)量
HHO 算法僅需設置2 個超參數(shù),數(shù)量少于PSO 和QPSO,降低了因參數(shù)選取不當而使模型陷入局部最優(yōu)的風險。同時,比較表6~表8 中3 種優(yōu)化算法尋得的最優(yōu)模型可知,針對3 個水質(zhì)指標,HHO 算法的優(yōu)化效果更好,RMSE 和MSE 指標均小于PSO 算法和QPSO 算法尋得的最優(yōu)模型。
綜上所述,HHO 算法在優(yōu)化速度和優(yōu)化效果方面均好于PSO 算法和QPSO 算法。此外,HHO 能在超參數(shù)數(shù)量較少的前提下達到更好的預測效果。
利用小波降噪后的各監(jiān)測點水質(zhì)數(shù)據(jù),結合河流流向建立CNN-LSTM 模型,預測地處下游的海河大閘監(jiān)測點溶解氧、總磷和總氮含量。得出相較于其他模型,本文提出的基于HHO 的時空水質(zhì)預測模型的預測效果最好。
為解決神經(jīng)網(wǎng)絡中超參數(shù)較多且參數(shù)選取不當,容易使模型陷入局部最優(yōu)解的問題,現(xiàn)有研究引入粒子群算法、量子粒子群算法,但上述兩種算法仍需設置較多超參數(shù)。為此,本文利用HHO 算法優(yōu)化神經(jīng)網(wǎng)絡中的歷史序列長度、卷積核數(shù)量等參數(shù),進一步提升了模型預測精度。實驗結果顯示,所提出的HHO 優(yōu)化模型需設置的超參數(shù)最少,預測性能最優(yōu),對于極端數(shù)據(jù)的預測效果明顯優(yōu)于其他組合模型。
注:本文通訊作者為李順勇。