關鍵詞:徑流預測;孿生極限學習機;合作搜索算法;面雨量因子
中圖法分類號:P338 文獻標志碼:A DOI:10.15974/j. cnki. slsdkb.2025.05.002
文章編號:1006-0081(2025)05-0007-07
0 引言
徑流預測作為水文領域的關鍵課題,一直以來備受關注,通常采用基于物理過程驅動的模型研究水文循環物理過程以預測未來的徑流變化[1-2],但該類模型率定參數眾多,對數據量要求大,建模困難;基于數據驅動的機器學習模型以其更準確可靠的性能優勢逐漸取代基于物理機制的傳統模型[3-4]。在機器學習模型應用的初期,由于各項技術的時代局限性,通常以歷史數據作為預測因子輸入,但近年來氣象因子對徑流的影響已經越發顯著,隨著各項技術的發展,已逐漸考慮將降水、溫度、濕度等氣象因子作為輸入因子,為機器學習模型在徑流預測方面的應用提供了新的可用信息[5-7]。例如,ARDALAN 等[8]以降雨、溫度、蒸散發等氣象因子作為模型輸入變量對比了GRU和LSTM模型在季節性河流和非季節性河流的徑流預測方面的準確性,試驗結果表明,基于深度學習模型的徑流預報僅需考慮氣象因子,且其預報過程與傳統水文模型相比不受流域物理特性的影響。
極限學習機(ExtremeLearningMachine,ELM)具有建模速度快、容易實現等優點[9],但因參數隨機性強,導致模型預測能力不穩定、魯棒性較差。近年來,有學者提出了孿生極限學習機(TwinExtremeLearningMachine,TELM)[1o],通過優化兩個分類平面來提高模型性能,已廣泛應用于故障檢測等分類問題[11-12],但在徑流預測領域應用較少。通過群體智能優化算法選取合適的輸入參數,可以有效提升預報結果準確性和模型運算效率,但率定模型參數時優化方法存在的局部最優和收斂速度緩慢等問題都將影響預測結果的準確性[13]。為避免此類問題,Feng 等[14]提出了一種全新的智能優化方法—合作搜索算法(CooperationSearchAlgorithm,CSA)。CSA具有結構簡單、調節參數少等特點,通過集成至神經網絡、極限學習機等人工智能模型參數,顯著提升了模型精度和效率[15-19]。然而,在處理復雜問題時,CSA在全局搜索方面存在不足。針對此問題,本文提出兼顧全局搜索能力和局部勘探能力的改進合作搜索算法(ImprovedCooperation"SearchAlgorithm,ICSA),而后將其集成至孿生極限學習機TELM參數優化領域,實現高精度徑流預測。
1 研究方法
1.1 改進合作搜索算法
合作搜索算法(Cooperation Search Algorithm,CSA)[14]是近年來新提出的智能啟發算法,該算法把每個員工看作一個解決方案,從而將現代企業團隊的合作發展行為表示為一個數學模型。其具有結構簡單、調節參數少等特點,但在處理問題時在全局搜索方面存在不足。針對此問題,本文提出改進合作搜索算法(Improving Cooperation Search Algorithm,ICSA),旨在提高全局搜索能力的同時保證局部勘探能力,為構建高精度的水文預報模型提供重要策略支撐。具體改進公式如下:






M=1+max(floor(3?α?I?(1-t/(0.7?T)))
式中: xi,jk 是第 k 個迭代過程中第 χi 個成員的第 j 個位置; I 是當前目標函數解空間的維數; K 為最大迭代次數; J 為員工所取變量的最大個數; φ(X,Y) 是生成在(2 [X,Y] 內均勻分布的隨機數的函數; ui,jk+1 為第 k+1 次迭代第 i 個員工群組更新后第 j 個變量取值; pBesti,jk 表示第 k 次迭代第 i 個員工歷史最優決策的第 j 個變量取值; gBestind,jk 表示第 k 次迭代第ind個團隊歷史最優決策的第 j 個變量取值; M 表示團隊歷史最優決策的個數; Ai,jk,Bi,jk Ci,jk 分別表示從領導者、決策者和監督者得到的信息增益; α,β 表示調整參數; ΨtΨt 和 T 分別為當前迭代次數和全局迭代次數;floor是向下取整函數。
改進合作搜索算法具體包括以下算子:
(1)改進的團隊溝通算子:式(3)作為算法主要收斂公式,引入進行聯合搜索,提高收斂速度;式(4)中的 M ,選取個數為動態選擇,在前期提高全局尋優能力,避免早熟收斂。后期選取全局最優,提高局部搜索能力;式(5)不再采用種群個體進行更新,而是采用種群均值,為種群尋優提供整體優化方向,提高收斂精度及收斂速度。
(2)改進的反思學習算子:在反思學習階段,式(7)作為均衡全局和局部搜索的控制算子;式(8)在反思搜索的同時引人動態擾動,盡可能防止陷人局部最優,在前期提高搜索的多樣性,后期保持穩定反思搜索;式(9)對種群個體和歷史最優個體增加了動態擾動,提高局部搜索能力。



式中: vi,jk+1 為第 K+1 次迭代第 i 個員工反思決策后第 j 個變量取值;randn是正態分布隨機函數; rand 是[0,1]隨機取值函數;
分別表示第 j 個變量的最大值和最小值。
(3)內部競爭算子:

式中: F(x) 用于評估員工的工作表現,即待優化問題的適應度取值。
1.2 孿生極限學習機
孿生極限學習機(TwinExtremeLearningMachine,TELM)是極限學習機的一種改進方法,其基本原理是生成一對非平行超平面并對其進行求解,得到一對上下邊界函數[10]。TELM算法的核心是解決以下兩個二次規劃問題:
TELM 1 :

約束條件為
(204
TELM 2 :

約束條件為
式中: Y 為輸出項;隱藏層的數量為 L , H= 號
為隱藏層的輸出,
為輸人項的非線性映射;
wi 為權重, bi 為偏差, G 為激活函數; ξ,η 均為誤差向量; C1,C2 為大于零的權衡參數; e 為單位向量; ε1,ε2 為尋優參數;
和
為待求的權重項。
以式(11)為例,引入拉格朗日乘子 (α,γ ,原始問題的拉格朗日函數定義如下:


根據最優化理論和KKT條件求得:


C1e-α-γ=0



式中: x 為輸人項。
引入正則化項
,避免
中可能出現的不良條件反射,則:

f=Y-eε1
式中:δ為一個取值較小的正標量, I 為單位矩陣。則對偶形式如下所示:

步驟5:計算個體適應度值并更新全局最優解。
步驟6:團隊溝通階段。引入pBest進行聯合搜索,動態選取個數M,采用種群均值,為種群尋優提供整體優化方向,提高收斂精度及收斂速度。
步驟7:計算反思學習階段的最優解,得到團隊內部競爭階段的個體最優解。引入搜索均衡算子以及動態擾動,提高前期搜索的多樣性,以及局部搜索能力。
步驟8:重復步驟5\~7直至滿足最大迭代次數。
步驟9:輸出全局最優解,即模型最優參數組合。從而建立TELM-ICSA模型對測試集進行預測,得到最終徑流值點預測結果。
2 評價指標
預測評價指標體系包括:均方根誤差(RootMeanSquareError,RMSE)平均絕對百分比誤差(MeanAb-solutePercentageError,MAPE)、相關系數(CorrelationCoefficient,R)納什-效率系數(Nash-sutcliffeEffi-ciency,NSE)。RMSE和MAPE值越接近 0,R 和 NSE 值越接近1,代表模型的預測性能越好。



通過這兩個公式,可以得到TELM模型最終預測結果如下:

1.3 建模流程
步驟1:利用偏自相關分析法確定時間序列的滯時作為輸入因子;而后確定訓練集和測試集樣本,并進行歸一化處理,以減小數據量差異影響。
步驟2:利用訓練樣本的擬合值與實測值建立納什效率系數函數,將其作為ICSA算法優化TELM模型參數的適應度函數。
步驟3:初始化算法參數,設置最大迭代次數、種群個數、尋優參數范圍。
步驟4:團隊建設階段,隨機生成團隊成員。
式中: n 為樣本總數;
分別表示第 χi 個實測值和預測值; yavg ,
分別表示實測和預測序列的平均值。
3 實例分析
3.1 數據預處理
池潭水庫位于福建省閩江水系的二級支流金溪的中上游,流域形狀近扇形,其壩址以上控制流域面積4766km2 ,地屬高山丘陵區,亞熱帶氣候[20]。本文以池潭水庫2000年4月2日至2020年8月27日的徑流序列,以及日尺度面雨量時間序列作為數據資料,預見期為1d,具體數據信息如圖1和表1所示。以8:2的比例劃分訓練集、測試集。理論上,流域出口斷面流量主要由流域滯時之前的降雨形成,反映了地形、地貌、降水強度等因素對降雨-徑流過程的影響??紤]降雨等信息有助于更好理解徑流形成演變機制,揭示不同區域之間徑流過程的聯系和差異,使得模型更加接近實際情況,為徑流預測提供科學依據。為確定滯時,本文采用偏自相關分析法識別徑流序列蘊藏的依賴關系,計算時間序列觀測值與其過去某一滯后項之間的相關性。經計算,徑流序列的最佳滯后輸入項為8個時段,以日徑流和面雨量時間序列作為輸入項,預測下一時段的日徑流值。

表1池潭水庫面雨量和徑流量時間序列數據

3.2 結果分析
氣象因子等物理因素可以有效提高水文預報精度。為此,本文以面雨量時間序列為氣象因子,分別考慮前期面雨量與降雨預報信息。研究該因子在徑流預測精度上的貢獻度。為減小工作量,ICSA種群個數為10,最大迭代次數為25。同時,構建多個對比模型,包括:耦合孿生極限學習機和合作搜索算法模型(TELM-CSA)、孿生極限學習機(TELM)、極限學習機(ELM)長短期記憶神經網絡(LongShortTermMemo-ry,LSTM)最小二乘支持向量機(Least SquaresSup-portVectorRegression,LSSVR)。
3.2.1 算例1:考慮前期面雨量
由表2\~3中池潭水庫測試集各模型預測評價指標結果及改善率可知,考慮前期面雨量可顯著提高模型的預測精度,各項指標結果均有不同程度的改善,其中,平均改善率最大的為NSE,4項指標的平均改善率為 23.71% 。與耦合原始CSA優化方法的CSA-TELM模型相比,經過改進后的TELM-ICSA模型可以得到更好的預測結果。不考慮前期面雨量時,與TELM-CSA 模型相比,TELM-ICSA對 RMSE,MAPE ,R,NSE 評價指標的改善率分別為 0.29% , 23.04% ,0.40% ? 0.38% ;考慮前期面雨量時,與TELM-CSA模型相比,TELM-ICSA對 RMSE,MAPE,R,NSE 評價指標的改善率分別為5. 25% ,15. 78% , 1.12% ,2.53% 。與不考慮前期面雨量的情況相比,考慮前期面雨量的情況下,TELM-ICSA模型對 RMSE,MAPE ,R,NSE 四項評價指標的平均改善率為 27.60% ??煽闯?,面雨量因子對模型效果的改進程度具有一定的影響,可以提高方法預測精度。圖2\~4為各模型的預測過程以及散點圖。可見,無論是否考慮前期面雨量,所提方法預測能力均好于對比模型,擬合度更高,預測誤差較小。不考慮前期面雨量時,各模型所得的預測結果誤差較大,散點圖過于分散,擬合程度較差。


3.2.2算例2:考慮降雨預報信息
考慮當天降雨預報信息,對徑流序列進行預測,得到預測結果如表4~5所示??梢?,當天降雨預報信息作為輸人項時,可顯著增加徑流預測結果。TELM-ICSA模型各項評價指標的改善率分別為 14.33% ,10.34% . 3.11% . 6.09% 。其中,各模型的MAPE改善程度最大,平均 19.05% 。與不考慮當天預報信息的情況相比,考慮當天降雨預報信息的情況下,4項評價指標的平均改善率為 8.47% 。分析各模型不同年份21個峰值預測流量并繪制柱狀圖如圖5所示??梢?,相較于其他對比模型,TELM-ICSA模型峰值預測能力更強,所得峰值預測結果更接近實測峰值流量。




表5考慮降雨預報信息時各模型評價指標改善率

注:不考慮當天預報信息的情況和考慮前期降雨的情況是一樣的,因為二者的降雨輸入項相同。
注:表中數據為A對B的改善率。
綜上所述,本文對CSA進行的改進(如 M 的個數為動態選擇、采用種群均值更新監督者得到的信息增益、在反思學習階段引入動態擾動等改進)可以提高模型的全局尋優能力,盡可能防止陷入局部最優,避免早熟收斂,提高搜索的多樣性、模型的收斂精度及收斂速度、搜索能力,得到全局最優解,從而提高模型的預測能力,使得TELM-ICSA具有更好的魯棒性和可靠性。

4結語
本文提出了耦合孿生極限學習機和改進合作搜索算法的徑流預測模型,將孿生極限學習機應用于水文預報領域,同時通過向合作搜索算法中增加動態擾動和搜索均衡算子等改進方法提高優化算法的全局尋優能力,避免陷入局部最優。池潭水庫的應用結果表明,所提模型TELM-ICSA可得到更好的徑流預測結果,面雨量因子的引入可增強模型的物理機制,顯著提高水文預報精度。
參考文獻:
[1]閆寶偉,唐儀偉,劉昱,等.基于等容瞬時單位線的水文模 型研究[J].人民長江,2024,55(6):92-97.
[2] 崔震,郭生練,王俊,等.基于GR4J-LSTM混合模型的洪 水預報研究[J].人民長江,2022,53(7):1-7.
[3] 胡樂怡,付曉雷,蔣曉蕾,等.基于LSTM、RF、SVR三種機 器學習方法的徑流預測研究[J].水文,2024,44(5):17 -24.
[4]張玥,姜中清,周伊,等.基于GRU-CNN 雙網絡輸出構 建BP模型的徑流預測方法[J].水力發電,2024,50(6): 17 -22.
[5]周慶梓,何自立,吳磊,等.多源數據融合的深度學習徑流 預測模型[J].水力發電學報,2023,42(5):43-52.
[6]李步,田富強,李鈺坤,等.融合氣象要素時空特征的深度 學習水文模型[J].水科學進展,2022,33(6):904-913.
[7]陳娟,徐琦,曹端祥,等.基于多因子多模式集成的中長期 徑流預測模型[J].水科學進展,2024,35(3):408-419.
[8]ARDALAN I,NASTARAN Z,MOHAMMAD R N,et al. Exploring the potential of deep learning for streamflow forecasting:Acomparative study with hydrological models for seasonal and perennial rivers[J]. Expert Systems with Applications,2024,252:124139.
[9]洪敏,艾萍,岳兆新.基于FPA-ELM模型的中長期徑流 預測——以雅襲江流域為例[J].人民長江,2022,53 (6) :119 -125.
[10]WAN Y H,SONG S J,GAO H,et al. Twin extreme learning machines for pattern classfication[J].Neurocomputing, 2017,260:235 - 244.
[11]YUAN X,FAN Y,ZHOU C,et al. Research on twin extreme learning fault diagnosis method based on multi- scale weighted permutation entropy[J]. Entropy,2O22,24:1181.
[12]YANG Y,XUE Z X,MA J,et al. Robust projection twin extreme learning machines with capped L1- norm distance metric[J]. Neurocomputing,2023,517:229 - 242.
[13]毛建剛,王慶杰.群智能算法在月徑流預測支持向量機 建模中的適應性研究[J].水電能源科學,2024,42(5): 34-38.
[14]FENG Z K,NIU W J,LIU S. Cooperation search algorithm: A novel metaheuristic evolutionary intelligencealgorithm for numerical optimization and engineering optimization problems[J]. Applied Soft Computing,2021,98:106734.
[15]FENG Z K,NIU W J. Hybrid artificial neural network and cooperation search algorithm for nonlinear river flow time series forecasting in humid and semi - humid regions[J]. Knowledge-Based Systems,2021,2111:106580.
[16]FENG Z K,NIU WJ,TANG Z Y,et al.Evolutionary artificial intelligence model via cooperation search algorithm and extreme learning machine for multiple scales nonstationary hydrological time series prediction[J]. Journal of Hydrology,2021,595:126062.
[17]FENG ZK,SHI PF,YANG T,et al.Parallel cooperation search algorithm and artificial inteligence method for streamflow time series forecasting[J]. Journal of Hydrology, 2022,606:127434.
[18]馮仲愷,付新月,紀國良,等.基于混合孿生支持向量機的 徑流區間預測[J].人民長江,2024,55(4):95-102,117.
[19]王鏡淋,王敬,沈來銀,等.基于人工神經網絡的長期徑流預報模型研究[J].水利水電快報,2023,44(9):6-10,28.
Runoff prediction model based on coupling of Twin Extreme Learning Machine and improved Cooperation Search Algorithm
YANG Shengyi1 ,LIN Fei1,LIU Zhijia1,ZHANG Taiheng2 (1.CentralControlCenterChianHydroeletricowerPntofujaHuadianFuruEnegyDeveopmentCod.anmng, China;2.HydroelectricesearchCenter,uadianElectricowerResearchIstituteCo.Ltd.HanghouOina)
Abstract:Toenhancetheaccuracyofrunoffprediction,wedevelopedapredictionmodelincorporating thearealrainal factor based on Twin Extreme Learning Machine (TELM).The improved Cooperation Search Algorithm (ICSA) was optimizedthrough dynamic disturbance enhancementand searchequilibriumoperator implementation to strengthenits global optimization capability.Subsequently,acoupled runoff prediction model integrating Twin Extreme Learning Machine and improved Cooperation Search Algorithm(TELM-ICSA)was established.Using Tanchi Reservoir in Fujian Province as a case study,comparativevalidation was conducted between TELM-ICSAand alternative models including TELM, Extreme Learning Machine(ELM),Long Short- Term Memory neural network(LSTM),and Least Squares Support VectorMachine(LSSVR).The results showed that compared with models neglecting antecedent areal rainfall,the TELM -ICSA model achieved average improvement rates of 27.60% across RMSE,MAPE,R ,and NSE four evaluation metrics.When incorporating daily rainfall forecast information,the average improvement rate reached 8.47% for these four metrics.The inclusionof arealrainfallfactorsignificantlyenhancedmodelperformance.Overall,regardlessof whether areal rainfallfactors were considered,TELM-ICSA exhibited superior predictive capabilitycompared to benchmark models,characterized by higher fitting degree,smaller prediction errors,as wellas robust reliability.
Key Words: runoff prediction;Twin Extreme Learning Machine; Cooperation Search Algorithm;area rainfallfactor