劉磊 王帥



摘 要:受多種因素的綜合影響,水庫泥沙淤積表現為一個復雜的非線性動態過程,影響著水庫的運行方式和其他效益的發揮。針對目前常用的幾種計算水庫泥沙沖淤量方法存在的問題,本文以三門峽水庫為例,將支持向量機應用于水庫泥沙沖淤量計算和預測。算例結果表明,該方法計算結果較為合理,計算過程涉及的參數較少,使用簡便,適用于水庫泥沙沖淤量的快速計算和預測。
關鍵詞:水庫泥沙淤積;支持向量機;灰色關聯分析
中圖分類號:TV145文獻標識碼:A文章編號:1003-5168(2020)04-0072-03
Abstract: Affected by a variety of factors, the sedimentation of the reservoir appears as a complex nonlinear dynamic process, which affects the operation mode and other benefits of the reservoir. Aiming at the problems existing in several commonly used methods for calculating reservoir erosion and deposition, this paper took Sanmenxia Reservoir as an example, and applied support vector machines to the calculation and prediction of reservoir erosion and deposition. The results of calculation examples show that the calculation results of this method are reasonable, the parameters involved in the calculation process are relatively small, and the application is simple and convenient. It is suitable for the rapid calculation and prediction of sediment and erosion in the reservoir.
Keywords: sedimentation of reservoir;support vector machine;grey relation analysis
泥沙淤積是多泥沙河流水庫運行過程中不可忽視的關鍵問題,泥沙淤積導致水庫有效庫容減小,既影響水庫的運行方式,又影響水庫防洪、發電等效益的發揮。目前,水庫泥沙沖淤量的計算方法主要有實測資料分析估算法、水沙動力學模型[1]以及人工神經網絡模型智能算法[2]。實測資料分析估算法根據經驗對特定水庫泥沙淤積總量和變化過程進行簡單估算,不利于推廣應用;水沙動力學模型計算參數較多,過程復雜,在水庫實際管理中運用較為困難;人工神經網絡模型智能算法在處理復雜非線性問題時容易出現過學習、極小值問題,從而影響其預測精度。支持向量機(Support Vector Machines,SVM)是一種基于統計學習理論的機器學習算法,可以對復雜非線性問題進行有效識別[3],與人工神經網絡模型相比,在小樣本情況下的回歸分析中有更好的收斂性。本文以三門峽水庫為例,將支持向量機應用于水庫泥沙沖淤量計算和預測,旨在為水庫泥沙沖淤量的計算和預測研究提供一種新的途徑。
1 支持向量機
支持向量機由Cortes & Vapnik于1995年正式提出,最早用于模式識別問題,后來推廣應用于函數擬合、非線性回歸分析、概率密度估計等方面。它在處理非線性問題時的主要思想是用非線性函數將樣本映射到高維特征空間,進而尋求全局最優解。
通過引入Lagrange算子和核函數,可將式(1)轉化為求解如下凸二次優化問題:
2 基于SVM的水庫泥沙沖淤量計算模型
2.1 影響因子選取
在構建SVM模型過程中,影響水庫泥沙沖淤量的相關因素作為模型的輸入變量,其選取的合理與否直接影響著模型的計算精度。本文以三門峽水庫為例,根據水庫多年實際運用經驗和水沙運動規律,選取水庫入庫流量、入庫沙量、運行水位以及下泄流量作為影響庫區泥沙沖淤量的4個主要因子[4],并利用灰色關聯分析法來驗證所選影響因子的合理性。
灰色關聯分析法是根據因素之間發展趨勢的相似或相異程度,研究因素之間關聯性強弱的一種因素分析方法,通常用灰色關聯度來描述[5]。其具體計算步驟如下。
2.2 模型構建與計算
根據三門峽水庫現階段運用方式,來水來沙量較小的非汛期以興利為目標控制運用,來水來沙量較大的汛期降低運行水位排沙運用[6],汛期水沙關系復雜,庫區逐日泥沙沖淤量變化較大。因此,為使支持向量機回歸模型的計算結果更具有代表性,本文以天為計算時間段,采用水庫1999年汛期和2000年汛期部分天數共190天的實測水沙數據,對泥沙沖淤量逐日進行模擬計算,模型的輸入與輸出變量分別為4個影響因子的日平均值和庫區每日累計泥沙沖淤量。
為了消除各個因子量綱和數量級不同的影響,采用式(9)對實測數據進行無量綱化處理,并利用式(7)、式(8)計算各影響因子與泥沙沖淤量之間的灰色關聯度分別為:[γQ]=0.832 5,[γs]=0.857 0,[γh]=0.843 4,[γq]=0.839 2。結果表明,本文所選取的4個影響因子與對水庫泥沙沖淤量均有較大影響,關聯性較強,影響因子選取較為合理。
模型分為訓練模擬和預測兩部分,本文借助基于MATLAB的SVM工具箱進行模型的計算,以前180天無量綱化處理后的數據為訓練樣本進行模型訓練,選用徑向基核函數,采用交叉驗證和自適應網格收索法對模型的懲罰參數[C]和核參數[σ]進行優選,得到最優參數[C]=1 454.301 6,[σ]=16.765 5。模型訓練好后,將后10天沒有參加訓練的數據作為預測樣本輸入模型進行預測。模型的模擬和預測結果分別如圖1、2所示。
2.3 結果分析
從圖1、圖2模型的計算結果來看,模擬值與實際值吻合較好,預測結果與水庫泥沙沖淤情況的實際變化趨勢也基本一致,這表明本文將支持向量機模型用于水庫泥沙沖淤量計算和預測是可行的。為了驗證支持向量機模型的計算和預測精度,本文還采用人工神經網絡模型構造三層網絡拓撲結構,利用同樣的樣本數據對網絡進行訓練,網絡訓練好后,對后10天沒有參加訓練的測試樣本進行預測,并將兩者預測結果進行比較,如表2所示。
從表2可以看出,對于相同的樣本數據,支持向量機模型預測結果相比于人工神經網絡模型相對誤差更小,且模型訓練過程中收斂速度更快,表明支持向量機在處理復雜非線性問題時相比于人工神經網絡有著更好的泛化學習能力,計算和預測精度更高,速度也相對較快,適用于水庫泥沙沖淤量的快速計算和預測預報。
3 結語
水庫泥沙淤積受到多種因素綜合影響,表現為一個高度復雜的非線性動態過程,支持向量機作為新興的人工智能和機器學習方法,可以對復雜非線性問題進行有效識別。本文以三門峽水庫為例,根據水庫多年實際運用經驗和水沙運動規律,選取影響水庫泥沙沖淤量的相關因子,并通過灰色關聯分析對所選影響因子進行了合理驗證,進而采用支持向量機回歸模型對水庫汛期逐日泥沙沖淤量進行了計算和預測。從模型計算和預測結果來看,該模型計算結果較為合理,使用起來簡單方便,與人工神經網絡模型相比,預測精度更高,適用于水庫泥沙沖淤量的快速計算和預測預報。
參考文獻:
[1]韓其為.水庫淤積[M].北京,科學出版社,2003.
[2]劉媛媛,練繼建.遺傳算法改進的BP神經網絡對汛期三門峽水庫泥沙沖淤量的計算[J].水利發電學報,2005(4):110-113.
[3]楊志民,劉廣利.不確定性支持向量機原理及應用[M].北京:科學出版社,2007.
[4]劉磊.多泥沙河流水庫優化調度研究:以三門峽水庫為例[D].鄭州:鄭州大學,2010.
[5]呂翠美,吳澤寧,胡彩虹.用水結構變化主要驅動力因子灰色關聯度分析[J].節水灌溉,2008(2):39-41.
[6]丁六逸.三門峽水庫的調度運用[J].人民黃河,1991(1):21-25.