劉曉陽,郭 樂
(1.三峽水利樞紐梯級調度通信中心,湖北 宜昌 443002; 2.智慧長江與水電科學湖北省重點實驗室,湖北 宜昌 443002)
低水頭、大流量電站在調度運行中,發電流量與發電水頭關系極為敏感,發電水頭的變化對出庫流量影響較大,在進行后期調度計劃安排時,計劃負荷曲線的可用性及準確性受到入庫預報、廠內運行計算精度的影響。葛洲壩水電站位于長江三峽末端河段,是世界最大的低水頭、大流量徑流式水電站,主要承擔三峽水電站反調節及配合三峽樞紐進行長江河段疏航任務。由于上游三峽水電站運行的計劃性較強,葛洲壩水電站預報入庫流量精度較高。經校核,葛洲壩上游水位-庫容關系曲線、NHQ曲線、水頭損失曲線的準確度可滿足生產需求,但下游水位變化影響因素較多,變化規律復雜,利用已有的下游水位-流量關系曲線難以精確計算,將直接影響發電水頭的計算精度。
近幾年興起的機器學習方法為水位預測提供了新的技術手段,利用機器學習方法可以從大量數據中挖掘變量間存在的復雜映射關系,相比傳統的既定關系曲線計算方法具有明顯優勢,可有效提高計算精度。許多學者嘗試將機器學習模型應用于水位預測的研究,并取得了較為豐富的研究成果。孫秋菊等[1]以秦皇島地區 1992~2002 年地下水平均埋深實測數據作為訓練樣本建立BP神經網絡預測模型,并以2003~2016年地下水位數據作為測試集對模型預測精度進行評估分析,結果顯示預測模型在測試集上表現較為良好,誤差值均小于0.1 m。劉亞新等[2]分析了葛洲壩上下游水位變化規律的影響因素,以三峽水庫上游鳳凰山水位、三峽水電站有功出力、葛洲壩電廠有功出力等因素作為輸入變量,建立了基于LSTM的水位預測模型,測試結果表明對于葛洲壩水電站連續6 h的下游水位預測以及連續3 h的上游水位預測具有較高精度。翁玲等[3]以多元線性回歸、嶺回歸和套索回歸3種機器學習方法為基礎,建立了赤水站未來6 h水位預測模型,其中引入72 h滯后量的套索回歸表現最優,測試集均方根誤差指標為0.192 m;王淑華[4]利用自回歸移動平均模型對馮家山水庫主汛期水位進行預測研究,測試結果顯示,ARIMA(1,2,2)模型預測精度較高,對馮家山水庫汛期調度決策具有較大指導意義。劉青松等[5]構建了基于AR-RNN的多變量水位預測模型,以清溪河流域水位測站數據為基礎,對比了AR-RNN模型和RNN模型在測試集上的表現,結果表明AR-RNN模型相對于RNN模型在測試集上平均絕對誤差MAE提升了10%,RMSE 提升了5%,最大誤差及最大相對誤差提升了15%。郭燕等[6]基于LSTM和GRU兩種神經網絡方法分別建立了洞庭湖水位預測模型,對比測試結果表明兩種方法均能較好預測洞庭湖水位特征變化,GRU在訓練過程中具有更高的收斂速度,在對2012年洞庭湖典型洪水過程的模擬中,LSTM神經網絡可準確預測預報期長達3 d的洞庭湖水位。周勇強等[7]通過將SFLA-CNN和LSTM分線性組合的方式構建了太湖區域水位預測模型,測試結果表明該模型具有較高的預測準確度和泛化能力,MAE和RMSE指標分別為0.016,0.018 m。
本文以人工神經網絡、支持向量機、隨機森林3個代表不同原理的機器學習方法為基礎,建立葛洲壩水電站下游水位預測模型,并以2018~2020年歷史運行數據為樣本數據集展開研究。
1943年,Warren McCulloch和Walter Pitts首次提出人工神經網絡技術,他們受到神經細胞的啟發,通過數學算法和邏輯表達式,成功模擬了神經元的行為方式。該模型自提出以來一直受到相關領域學者的廣泛關注。
一個多層感知網絡由節點(神經元)和連接線組成,節點分布在不同層面,包括輸入層、隱藏層、輸出層、相鄰層的節點通過連接線相連。在應用過程中,多數均為全連接神經網絡,顧名思義,每一層所有神經元都與前一層的所有神經元相連,由此形成的每個連接都被賦予一個權值,在訓練過程中通過不斷對鏈接權值進行修正,最終使該網絡單元能夠精準描述數據間復雜的函數關系,其具體結構如圖1所示。

圖1 人工神經網絡結構Fig.1 Artificial neural network structure diagram
支持向量機(Support Vector Machine,SVM)是一種按監督學習方式對數據進行二元分類的廣義線性分類器,其決策邊界是對學習樣本求解的最大邊距超平面。SVM使用鉸鏈損失函數計算經驗風險并在求解系統中加入了正則化項以優化結構風險,是一個具有稀疏性和穩健性的分類器。SVM可以通過核方法進行非線性分類,是常見的核學習方法之一。1964年提出SVM,20世紀90年代后得到快速發展,并衍生出一系列改進和擴展算法,在人像識別、文本分類等模式識別問題中得到應用,SVM結構見圖2。

圖2 支持向量機結構Fig.2 Support vector machine structure diagram
隨機森林是決策森林的衍生模型。該模型改善了決策森林過擬合、“剪枝”不合理、易于陷入局部最優等缺陷,全面提升了預測性能,構建流程如圖3所示。其特點在于結構簡單,表達易于理解。相比于傳統回歸模型,隨機森林在回歸預測方面具有更優秀的表現,且可有效防止過擬合現象的出現。
葛洲壩水電站下游水位主要受出庫流量影響,在進行未來時段調度計劃安排時,傳統計算模式是利用下游水位-流量關系曲線進行水位計算。該方法主要存在兩個弊端:① 曲線是在前期工況下測定,更新成本較高。下游河道形態會隨時間發生一系列變化,如曲線更新不及時,則計算過程中會產生客觀誤差;② 電站出庫流量變化受機組出力及閘門開度控制,響應時間較短,但河道水位變化是連續過程,具有一定的滯后性,由圖4葛洲壩水電站出庫流量與下游水位關系可見,在出庫流量發生突變時,下游水位需經歷較長過渡時間才能漲落到位。葛洲壩水電站屬于低水頭、大流量徑流式電站,出庫流量對水頭變化極為敏感,后期調度方案制作精度較大程度取決于水頭計算精度。

圖4 2018年葛洲壩水電站出庫流量與下游水位關系Fig.4 Relationship between Gezhouba Hydropower Station outflow and downstream water level in 2018
人工神經網絡、支持向量機、隨機森林3種機器學習方法參數設置如下。
(1) 人工神經網絡隱藏層層數為15;隱藏層神經元個數為50;激活函數為修正非線性(relu);學習率為0.001;梯度下降方法為Adam。
(2) 支持向量機核函數kernel為rbf;懲罰系數C為1.0;核函數參數degree為3;核函數參數gamma為scale。
(3) 隨機森林基評估器(樹)的數量為100;樹生成模式random_state為None。
根據前文葛洲壩水電站下游水位變化規律分析可知,下游水位變化并不會及時響應出庫流量變化,而且受慣性影響,前期水位變化趨勢對后續水位變化同樣存在一定影響。因此將這一規律加入到機器學習模型的建立過程,加入以前兩個時段水位值作為描述前期水位變化趨勢的變量,以降低映射復雜度,加快機器學習方法學習效率。為便于后期調度計算模型調用,本文采用單點預測方式。設置輸入變量為葛洲壩出庫流量、1 h前下游水位、2 h前下游水位;輸出變量為預測時刻下游水位。
評價指標選取均方誤差MSE和決定系數R2兩個回歸任務評價指標。
(1)
(2)

為更好體現預測模型對訓練數據集泛化能力,評價時使用k折交叉驗證(k取10)。即將數據集等比例劃分成k份,以其中的一份作為測試數據,其他的k-1份數據作為訓練數據,進行k次測試后得到綜合評價結果。本文所用數據集為2018~2020年歷史運行數據,共17 470條樣本數據,采用10折交叉驗證,即每次驗證以15 723個樣本作為訓練集,1 747個樣本作為測試集,3種機器學習方法的訓練及測試評價結果見表1。
表1中所示3種方法在測試集上均有較好表現,其中支持向量機表現最優,MSE為0.0071,R2平均值為0.98,預測精度較高,可見基于機器學習方法的預測模型可在復雜因素影響下的水位預測中表現良好。

表1 3種預測模型預測精度評估Tab.1 Prediction accuracy evaluation of three types of prediction model
為更加直觀地展示預測結果,本文選取訓練集以外的葛洲壩水電站典型日內水位過程為獨立測試對象,進行模型預測結果的定量分析。研究選取了2021年葛洲壩水電站出庫流量10 000 m3/s 以上和以下兩個不同出庫流量的的典型過程作為測試對象。支持向量機模型在3個模型中表現最好,因此利用支持向量機預測模型對典型日內水位過程進行模擬預測,預測效果如圖5~6所示。圖5~6中預測水位與實際水位較為接近,尤其在水位變化段能夠較好模擬實際水位趨勢,可見在不同工況下基于機器學習方法的水位預測模型均表現良好,預測精度較高,滿足生產實際需求,可在后續調度計劃制作應用種進一步驗證其預測效果。

圖5 2021年葛洲壩水電站典型過程預測水位結果對比 (出庫流量小于10 000 m3/s)Fig.5 Comparison of water level prediction results in typical processes(outflow below 10 000 m3/s)in 2021

圖6 2021年葛洲壩水電站典型過程預測水位結果對比 (出庫流量大于10 000 m3/s)Fig.6 Comparison of water level prediction results in typical processes(outflow above 10 000 m3/s)in 2021
本文針對葛洲壩水電站實際調度中下游水位-流量關系曲線難以準確模擬下游水位變化這一問題,引入人工神經網絡、隨機森林和支持向量機3種機器學習方法作為技術手段,以2018~2020年歷史出庫流量、下游水位等小時尺度運行數據為樣本數據集,分別建立水位預測模型,并在預測因子選擇時加入下游水位變化規律,以降低映射復雜度,加快模型學習效率。k折交叉驗證結果表明,基于支持向量機的預測模型表現最優,預測精度較高,可滿足生產實際需求,且對后期葛洲壩水電站調度計劃制作具有重要指導意義。