祖 佳
(遼寧省朝陽水文局,遼寧 朝陽 122000)
在水文科學領域內,中長期徑流預測的準確性一直是熱點和難題。近年來,中長期徑流預測的模型和方法取得一定研究成果[1- 8],但在實際應用中存在精度不高的問題[9]。目前,提高中長期徑流預測精度的重要手段是對單一模型進行改進或者建立不同模型的組合[10]。相比于單一改進模型,組合模型可綜合考慮不同模型計算的優點,通過設置權重系數進行模型組合,在一些區域中應用效果好于單一中長期徑流預測模型[11- 15],但總體還是難以達到理想的誤差精度。當前,許多模型通過進行參數優化使計算精度得到提高,許多參數優化算法通過樣本數據系列,以模型計算誤差為目標函數,對模型的參數進行不斷優化和調整,將模型預測精度提高。SMA算法由于具有較快的收斂度和較強的搜索能力,近年來在優化算法函數中脫穎而出。
遼西地區屬于遼寧省典型的干旱半干旱區,中長期徑流預測精度對水庫調蓄規劃十分關鍵。為提高遼西地區水庫中長期徑流預測精度,本文組合國內中長期預測效果較好的灰色模型與BP神經網絡模型,并結合SMA算法對其參數進行優化,以區域內2座大型水庫白石水庫和閻王鼻子水庫為實例,進行模型精度驗證和對比。研究成果對于水庫中長期徑流預測方法具有參考價值。
本文將灰色模型和BP神經網絡模型進行組合,由于模型在國內應用較為成熟,對其模型原理不再敘述。組合模型的原理在于可將不同模型通過組合權重進行組合,綜合利用不同模型的優點進行分析?;疑P蛯Χ唐陬A測具有較高的精度,但是對長期波動性較大的數據預測精度不高;BP神經網絡模型對數據系列非線性變化特征較強,能夠較好地模擬,但其收斂速率較低,且在局部由于訓練時間較長容易出現極小值。因此將灰色模型和BP神經網絡模型進行組合,可綜合不同模型之間的優勢。組合模型預測的最關鍵要素是合理確定組合權系數,本文以最小絕對誤差為目標函數進行組合模型的建立。
(1)

(2)
式中,lk—不同組合模型的權重系數;di—預測時段內不同模型的殘差平方之和。本文中組合模型的數量為2個,其權重系數計算方程分別為:
(3)
(4)

Pt+1=P0[P(1)]t+1
(5)
式中,Pt+1—t+1時刻的概率分布;P0—無條件概率初始時刻的分布;P(1)—概率轉移矩陣,其計算方程為:
(6)
式中,pij—從tn時刻到tn+1時刻的概率轉移值;m—轉移變量的總數。
SVM優化算法通過不斷逼近目標函數來實現參數的優化,其快速收斂的原因在于不同調整變量參數自適應的權重,其變量位置優化調整方程為:
(7)
其中:
p=tanh|s(i)-DF|,i=1,2,…,k
(8)
式中,ub、lb—目標搜索區間內的上限和下限值;rand—在[0,1]范圍內隨機數;參數vb的變化區間為[-a,a];參數vc的變化區間為[0,1]且呈線性遞減變化;t—迭代步長;x—目標搜素所在位置;xm、xn—2個隨機選取的位置;w—搜索因子權重;s(i)—x的適應度;DF—在目標優化求解過程中的適應度最佳值。參數a的計算方程為:
(9)
式中,maxt—迭代最大次數。w權重值計算方程為:
(10)
其中:
smellindex=sort(s)
(11)
式中,r—在區間范圍為[0,1]的隨機數;bF—迭代過程中適應度最高值;wF—迭代過程中適應度最低值;smellindex—搜索過程中目標函數因子的適宜度系列。
本文以白石水庫和閻王鼻子水庫為具體實例,2座水庫均為遼寧省朝陽市的大型供水水庫。白石水庫修建于1995年,壩址以上控制面積為17649km2,為大凌河干流主要控制型工程,水庫總庫容為16.45億m3,多年入庫水量均值為7.24億m3。閻王鼻子水庫修建于1996年,壩址以上控制面積為9482km2,總庫容為2.17億m3,多年入庫水量均值為8.08億m3。本文結合白石水庫和閻王鼻子水庫2000—2020年入庫徑流作為模型的樣本數據系列,其中2000—2016年入庫徑流量數據系列作為訓練樣本,2017—2020年作為模型精度驗證年份。
不同維度SVM優化算法,其優化求解精度有所差異。為提高SVM優化算法對水庫入庫徑流組合模型的優化求解精度,分別選取5種測試函數進行SVM優化算法不同維度下的仿真計算,其中SMA算法和PSO算法迭代次數最大值均為100次,種群規模和學習因子均為50和2.0。不同維度優化函數尋優求解能力對比結果見表1。

表1 不同維度下SMA算法和PSO算法的尋優對比結果
本文將不同優化算法下的最優值設置為0。從對比結果可知,不同維度條件下,SMA算法對于單峰函數而言其尋求求解精度好于PSO算法;而SMA算法對于2種多峰函數而言,其不同維度條件下經過40次尋優后可達到設理論最優值0。表明就尋優精度而言,SMA算法要好于PSO算法。此外對于多峰函數Ackley,由于該函數旋轉不可分的特點,在各維度條件下SMA算法尋優精度逐步趨于穩定。綜上,SMA算法由于具有較好的優化和極值搜索能力,其尋優結果好于PSO算法,將該算法用于組合預測模型可行。
采用SMA算法分別對灰色模型與BP神經網絡模型參數進行優化設置,其中灰色模型2個參數分別為發展系數α和內部控制變量b,BP神經網絡模型2個參數分別為權值η和連接閾值θ。2個模型設置訓練精度為0.001,最大訓練步驟為10000次。模型參數優化結果見表2。

表2 模型優化參數結果
結合模型參數優化結果進行灰色模型和BP神經網絡模型參數設置,按照白石水庫和閻王鼻子水庫2000—2016年年入庫徑流數據作為訓練樣本進行誤差絕對值分布計算,按照馬爾科夫鏈模型進行不同預測區間的劃分,其中白石水庫的馬爾科夫狀態區間劃分為:[0 15%]、(15% 25%]、(25% 35%]、(35% 65%]。閻王鼻子水庫的馬爾科夫狀態區間劃分為:[0 6%]、(6% 11%]、(11% 20%]、(20% 45%]。組合模型擬合誤差系進行分類后對轉移概率矩陣進行確定,分別為:

(11)

(12)
結合白石水庫和閻王鼻子水庫2000—2016年入庫年徑流數據,按照劃分的狀態區間對組合模型誤差序列進行修正,并結合優化后的模型參數,利用2個水庫狀態轉移概率矩陣代入方程(5)進行水庫入庫徑流預測,預測結果見表3。

表3 優化參數的修正組合模型預測結果對比
從參數優化前后修正組合模型在2個水庫入庫年徑流量預測對比結果可看出,參數優化后修正的組合模型預測精度明顯好于參數優化前。白石水庫參數優化前相比于優化后,其相對誤差均值可降低10.3%;閻王鼻子水庫參數優化前相比于優化后,其相對誤差均值可降低9.69%。采用SVM算法對修正組合模型進行參數優化后,提高了組合模型尋優能力,加速了最優解收斂精度,從而提高了其模型預測的精度。從參數優化前2個水庫采用修正組合模型的相對誤差來看,相對誤差在±20%以內,而進行優化后,相對誤差均可在±15%以內。
分別將參數優化前后的單一灰色模型、單一BP神經網絡模型及參數優化前后的修正前后組合模型,對2017—2020年白石水庫、閻王鼻子水庫進行入庫徑流量預測,并統計其平均相對誤差MAPE,取各年份預測相對誤差絕對值的均值,均方根誤差,并將預測相對誤差±20%認為其預測結果在合理范圍內,統計不同模型預測的合格率,結果見表4。
對比白石水庫和閻王鼻子水庫2017—2020年入庫年徑流量預測結果可知,相比于其他5種模型,參數優化后的修正組合模型(模型6)平均相對誤差MAPE可降低約10%13%,均方根RMSE誤差平均可降低約34%~42%。對于預測合格率而言,認為預測相對誤差在±20%以內屬于合格,從對比結果可看出,單一BP神經網絡模型參數優化前后2個水庫的預測合格率均可以達到50%,修正組合模型參數優化前后其預測合格率得到明顯提升,參數優化后的修正組合模型其預測合格率可達到100%,預測合格率得到明顯改善。

表4 不同模型預測精度對比
(1)對于SMA黏菌優化算法而言,在多峰函數條件下相比于單峰函數,其各維度下尋優搜索能力都有所提升,不同維度條件下經過40次尋優后可達到設理論最優值。
(2)通過實例分析,采用馬爾科夫鏈對組合模型進行修正后,能將組合模型結構進行優化,從而降低傳統模型組合權重系數的不確定性對其預測精度的影響。
(3)本文預測及驗證的樣本數據系列較短,在后續的研究中,還需要將參數優化后的修正組合模型在不同區域進行長序列樣本數據系列的驗證應用,不斷優化模型結構,擴大模型應用面。