999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

兩類集成學習算法在中長期徑流預報中的應用

2020-07-16 08:18:24楊鳳根酈于杰
水力發電 2020年4期
關鍵詞:合格率模型

許 斌,楊鳳根,酈于杰

(1.河海大學地球科學與工程學院,江蘇 南京 211100;2.河海大學水文水資源學院,江蘇 南京 210098)

0 引 言

準確、穩定的月-季-年尺度的中長期徑流預報,對科學制訂水資源的合理配置和優化調度方案,對提高水文預報綜合業務的廣度和深度具有重要的戰略意義與應用價值[1]。隨著水利信息化的大力推進,水文數據已逐漸呈現出海量數據、多種來源、多種結構、高價值、價值密度稀疏等特征,且具有較強的空間、時間屬性[1-2]。在大數據時代,如何利用數據挖掘技術,從歷史經驗與海量氣象水文中探索數據的內在價值與深度聯系,是發展和擴充水文預報的前沿研究領域[3]。

機器學習是一門主要研究對象是人工智能的學科,通過經驗學習改進預測性能及優化算法,廣泛應用于數據挖掘、計算機視覺、生物特征識別、市場規律分析等領域[4-5]。基于大數據的機器學習在中長期徑流預測中構建了一類黑箱模型,在忽略復雜的陸氣環流方式、水文模擬過程、下墊面變化、人類活動影響、尺度不匹配及參數異質化等前提下,利用人工智能算法對大量、高維、多態問題的優異處理性能,實現月-季-年尺度的水資源預測。

機器學習中一些智能算法已應用于中長期徑流預報[6-10]。在這些機器學習的有監督學習算法中,預報因子往往是前期降雨、徑流,缺乏一定的物理機制;預報模型的選擇也較為單一,準確率與穩定性均有所不足。因此,本次研究將前期氣候指數作為預報因子,利用分類回歸樹算法(CART)作為基學習器,引入隨機森林模型(RF)與梯度提升樹模型(GBDT)作為兩類集成學習算法,通過形成強學習預報模型,實現對丹江口水庫未來1個月,未來1季度以及未來1年三類徑流序列的滾動預報,并通過相對誤差絕對值的平均值(MAPE)、Nash效率系數(NSE)、相對均方根誤差(RRMSE)、合格率(QR)等指標進行比較分析,探索中長期徑流預報的研究發展新途徑。

1 研究區概況與徑流特征分析

漢江為長江的最大支流,發源于陜西省潘冢山,全長1 577 km;流域面積達15.9萬km2,地勢西高東低,西北部以山區為主,東南部以平原為主。漢江流域屬于亞熱帶季風氣候,降水充沛,多年平均降雨量為900~1 500 mm,年內分配極不均勻,夏季降水約占年總降水的50%。流域多年平均徑流量為250億m3,汛期(5月~10月)徑流量約占全年的75%。丹江口水庫位于漢江中上游,為南水北調中線一期工程水源地,水源面積達1 000 km2,蓄水量達290億m3。分析影響丹江口水庫來水量的主要因子,并建立相應的中長期徑流預報模型,對合理安排水庫調度、保障南水北調中線供水具有重要的意義。

2 研究方法與模型模擬

2.1 集成學習算法

集成學習算法(Ensemble Learning)的主要思想是產生大量的子預報模型,再通過某種策略將結果綜合。在本次研究中,采用分類回歸樹算法(CART)[11]作為子預報模型,集成學習算法主要采用基于Bagging算法的隨機森林模型(RF)與基于Boosting算法的梯度提升樹模型(GBDT)。Bagging算法的核心思想是從訓練集進行Bootstrap抽樣,構造子預測模型,再將所有預測結果進行投票平均。Boosting算法的核心思想是將訓練過程階梯化,每輪訓練使用全部樣本,但改變樣本的權重。采用損失函數擬合殘差,每一輪訓練的目標為擬合上一輪的殘差,到殘差足夠小或達到迭代次數時停止,其預測結果為每一輪子預報結果的加權平均。

2.2 預報因子篩選

本次采用130項逐月遙相關氣候指數作為預報因子數據集,丹江口水庫天然入庫徑流量作為預報對象,對未來1個月、1季度及未來1年的3類徑流量進行滾動預報(模擬),并設定率定期徑流序列為1965年~2001年(共37 a),驗證期徑流序列為2002年~2016年(共15 a)。預報因子篩選過程如下:

(1)假定預報因子作用的提前量為一年,分別計算相同月徑流序列(如1965年~2001年1月徑流)與前期各月(如1964年~2000年2月)各項預報因子的相關系數,得到1 560組相關系數。

(2)設置置信度為0.05,根據序列長度與相關系數顯著性檢驗表,篩選出所有顯著相關的因子作為初選預報因子。

(3)對初選預報因子進行逐步回歸分析,根據方差貢獻率,進一步篩選出10個獨立性強、相關性高的因子作為最終預報因子。丹江口站徑流預報因子匯總表略。

2.3 預報模型構建

本次采用Python作為編程平臺,同時包括開源數據庫NumPy、Pandas、Scikit-Learn等。RF模型與GBDT模型的參數通過率定期的擬合效果確定。采用相對誤差絕對值的平均值(MAPE)、相對均方根誤差(RRMSE)、Nash效率系數(NSE)與合格率(QR)作為評定模擬精度的評價指標。其中,RRMSE范圍為0~1,數值越小表明模擬結果越好。NSE范圍為-1~1,越接近1表明模擬結果越好。具體為

(1)

(2)

(3)

(4)

(5)

根據GB/T 22482—2008《水文情報預報規范》:“7.5.3 中長期定性預報主要根據要素距平值劃分為枯水(距平<-20%)、偏枯(-20%≤距平<-10%)、正常(-10%≤距平≤10%)、偏豐(10%<距平≤≤20%)、豐水(距平>20%)五級。7.5.4 中長期預報的精度評定規定:對于水位(流量)的特征值定量預報,按多年同期實測變幅的10%、其他要素按多年同期實測變幅的20%、要素極值的出現時間按多年同期變幅的30%作為許可誤差,根據所發布的數值或實測變幅的中值進行評定。”

圖1 RF模型、GBDT模型的模擬結果(預報未來一個月)

故,本文QR分為定性與定量兩種評定方式。在定性評定中,若預報等級與實測等級相同,則計為合格;在定量評定中,分別采用實測變幅的10%與實測變幅的20%作為許可誤差,若預報值與實測值的差值小于許可誤差,則計為合格。另外,在定性預報中,增加一種根據要素距平值劃分為枯水(距平<-20%)、平水(-20%≤距平≤20%)、豐水(距平>20%)三級的評級方法,若預報等級與實測等級相同,則計為合格。

2.4 預報結果分析

圖1展示了RF模型和GBDT模型在預報未來1個月徑流時模擬性能,其中圖1a與圖1b分別為兩個模型在率定期的結果,圖1c與圖1d分別為兩個模型在驗證期的結果。不難發現,在率定期GBDT模型明顯優于RF模型,其預測值與實測值擬合更好,兩者的決定系數R2分別為0.999 5和0.954 1。而在驗證期,RF模型的模擬性能略好于GBDT模型,兩者的決定系數R2分別為0.863 2和0.852 4。當預報未來1季度徑流時,RF模型和GBDT模型表現出相似的模擬性能(圖略),率定期兩者的決定系數R2分別為0.954 1和0.999 6,驗證期精度均有所下降,兩者的決定系數R2分別為0.840 6和0.860 3。當預報預報1年徑流時(圖略),RF模型和GBDT模型仍然保持了較好的模擬能力,率定期兩者的決定系數R2分別為0.963 2和0.999 1,驗證期兩者的決定系數R2分別為0.645 8和0.765 6。

統計上述預測序列的精度指標于表1可得,在率定期,預報未來1個月、1季度、1年徑流時,MAPE依次減小,RF模型分別為20.6%、15.7%、10.1%,GBDT模型分別為1.5%、1.1%、1.0%;RRMS同樣依次減小,RF模型分別為0.36、0.28、0.13,GBDT模型分別為0.03、0.02、0.02;由于預報1季度、1年的序列太短,不適合統計NSE指標,故只用于表征預報1個月,在率定期,RF、GBDT模型分別為0.94與0.99。在驗證期,預報未來1個月、1季度、1年徑流時,MAPE亦依次減小,RF模型分別為36.5%、20.4%、14.7%,GBDT模型分別為37.6%、21.5%、13.9%;RRMSE走勢亦相似,RF模型分別為0.55、0.23、0.17,GBDT模型分別為0.61、0.25、0.16;RF與GBDT模型的NSE分別為0.90與0.88。此外,在率定期,GBDT模型模擬精度優于RF模型,在驗證期,兩種模型精度相近。

表1 3類精度評定指標

表2 4類預報合格率 %

進一步統計上述預測序列的合格率于表2可得,無論率定期與驗證期,4類合格率均隨著預報尺度與徑流量的增加(從預報1個月到1季度,1年)而提高,且在驗證期,兩種模型精度相近。具體地看,若以多年變幅的10%作為許可誤差,驗證期RF模型在3類徑流序列(1個月、1季度、1年)的合格率分別為56.7%、58.3%、66.7%;GBDT模型則為53.3%、55.0%、80.0%。若以多年變幅的20%作為許可誤差,驗證期RF模型在3類徑流序列的合格率分別為84.4%、90.0%、93.3%;GBDT模型則為82.8%、90.0%、100.0%。對于5級預報,驗證期RF模型在3類徑流序列的合格率分別為43.3%、58.3%、66.7%;GBDT模型則為46.1%、53.3%、66.7%。對于3級預報,驗證期RF模型在3類徑流序列的合格率分別為58.3%、68.3%、70.0%;GBDT模型則為58.3%、66.7%、66.7%。

3 結 語

本研究將前期130項遙相關氣候指數作為預報因子,利用分類回歸樹算法(CART)作為子預報模型,引入集成學習算法中Bagging和Boosting的代表模型,隨機森林(RF)與梯度提升樹(GBDT)作為強學習預報模型,實現對丹江口水庫未來1個月,未來1季度以及未來1年3類徑流序列的滾動預報,并通過相對誤差絕對值的平均值(MAPE)、Nash效率系數(NSE)、相對均方根誤差(RRMSE)、合格率(QR)等指標進行對比分析,得到如下結論:

(1)若從作業預報中最常用的MAPE指標來看,驗證期RF模型對于3類徑流序列的模擬結果分別為36.5%、20.4%、14.7%;GBDT模型分別為37.6%、21.5%、13.9%,均表明兩類模型可用于中長期徑流預報,且精度尚可,結果相仿。

(2)隨著預報對象量級的增加,徑流序列的不穩定性與極值序列分布的不均勻性得以降低,預報的準確度、可靠度以及穩定度得到提高,換句話說,未來1年、1季度、1個月的預報精度呈單調下降。

猜你喜歡
合格率模型
一半模型
提高肉雞出欄合格率的綜合措施
提高某傘形罩加工合格率工藝探討
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
淺談如何提高遙測狀態估計合格率
提高重癥醫學科床頭抬高合格率
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
我國生鮮乳連續7年三聚氰胺抽檢合格率100%
現代企業(2015年8期)2015-02-28 18:55:23
主站蜘蛛池模板: 在线免费观看AV| 久久国产精品夜色| 欧美国产三级| 亚洲精品在线影院| 欧美一区二区自偷自拍视频| 高清国产在线| 亚洲不卡影院| 欧美日韩综合网| 国产精品无码一二三视频| 亚洲最新在线| 国产亚洲欧美在线中文bt天堂 | 亚洲国产天堂久久九九九| av色爱 天堂网| 国产日本视频91| 国产精品夜夜嗨视频免费视频| 色有码无码视频| 亚洲第一成网站| 无码网站免费观看| 麻豆精品视频在线原创| 国产精品色婷婷在线观看| 国产亚洲高清视频| 国产天天色| 日本伊人色综合网| 91外围女在线观看| 国产精品亚洲欧美日韩久久| 亚洲综合九九| 天堂成人在线| 亚洲第一网站男人都懂| 亚洲色精品国产一区二区三区| 亚洲视频免费在线| 欧美日韩一区二区在线免费观看| 欧美午夜在线视频| 欧美精品另类| 超碰免费91| 无码中文字幕加勒比高清| 日韩二区三区无| 色爽网免费视频| 自慰高潮喷白浆在线观看| 亚洲天堂2014| 亚洲人网站| 久久免费看片| 亚洲无码日韩一区| 热99re99首页精品亚洲五月天| 精品国产aⅴ一区二区三区| 色哟哟国产成人精品| 一本久道久综合久久鬼色| 国产精品污视频| 欧美A级V片在线观看| 国产精品免费p区| 国产一级视频久久| 国产无码性爱一区二区三区| 婷婷99视频精品全部在线观看 | www.狠狠| 久久毛片网| 最新无码专区超级碰碰碰| 久久精品日日躁夜夜躁欧美| 欧美一级黄片一区2区| 国产你懂得| 亚洲无线一二三四区男男| 97se亚洲综合在线天天| 亚洲福利视频一区二区| 大学生久久香蕉国产线观看| 2022精品国偷自产免费观看| 国产香蕉在线视频| 欧美中文字幕第一页线路一| 永久在线精品免费视频观看| 久久国产精品无码hdav| 二级特黄绝大片免费视频大片| 欧美精品色视频| 欧美成在线视频| 亚洲国产成熟视频在线多多| 少妇精品久久久一区二区三区| 久久成人国产精品免费软件| 国产精品人人做人人爽人人添| 国产精品福利导航| 亚洲精品欧美日韩在线| 99在线视频免费| 免费xxxxx在线观看网站| 无码一区二区三区视频在线播放| 欧美色综合久久| 亚洲日韩AV无码一区二区三区人| 成人免费一级片|