999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

長江上游水庫入庫流量的中長期預報

2022-07-21 06:13:24張行南王高旭
水資源保護 2022年4期
關鍵詞:模型

張 軒 ,張行南 ,王高旭 ,吳 巍 ,許 怡

(1.南京水利科學研究院水文水資源研究所,江蘇 南京 210029; 2.水文水資源與水利工程科學國家重點實驗室,江蘇 南京 210029;3.河海大學水文水資源學院,江蘇 南京 210098)

中長期預報技術可以服務于水庫復雜的工作任務,對防汛抗旱、科學調度、蓄水發電、航道運輸有著重大意義。國內外關于中長期預報方法的研究很多,從諸多氣象因子中選取合適的因子集合,建立預報模型訓練流域徑流,是目前中長期預報的主流方法之一[1]。該類方法常見的模型有數理統計模型以及近年出現的機器學習模型,數理統計模型較早應用于徑流預報,主要有多元線性回歸[2-3]、逐步回歸[4]等模型;機器學習模型應用較晚,但是發展迅速,以人工神經網絡[5]、支持向量機[6]、隨機森林[7]為代表的模型在中長期預報中都取得了較好的效果。趙鵬雁等[8]基于最近鄰抽樣回歸模型、周期疊加模型、逐步回歸模型和神經網絡模型等10種模型建立了瀾滄江流域小灣水庫月徑流預報方案;陶思銘等[9]采用長短期記憶神經網絡,構建了未來30 d的逐日流量預報模型,預報效果良好;謝帥等[10]引入Lasso回歸方法篩選徑流預報因子,以其選擇結果作為支持向量回歸模型中的預報因子,構建了Lasso回歸和支持向量回歸耦合(Lasso and support vector regression,LSVR)模型,并應用到龍羊峽水庫進行月入庫徑流預報。綜上,中長期徑流預報中模型的實際應用已經非常成熟,然而對比于傳統的模型,機器學習模型有什么優勢與缺點,適用性與穩定性如何,仍然需要進一步探索。在數理統計方法中,逐步回歸法可以按照自變量對因變量的作用大小,剔除不顯著的變量,在預報因子優選方面有獨特的優勢[11];而與其他機器學習模型相比,隨機森林模型訓練速度快[12],對噪聲及異常值的容忍性較強,對缺失數據和非平衡的數據的預測更為穩健。這兩種模型在各自領域具有一定的代表性和優勢性,故對這兩種模型的特點和適用性進行研究具有一定意義。

1 研究區概況

選擇長江上游流域作為研究區,為了更好地驗證結果,選取長江干流重要水庫烏東德水庫與岷江的瀑布溝水庫作為研究對象(圖1)。烏東德水庫(101°14′E ~103°3′E, 25°20′N~27°12′N)位于四川省會東縣和云南省祿勸縣交界處的金沙江峽谷內,屬于低緯度高原季風氣候,氣候特征為高溫、干旱、少雨;水庫上距觀音巖水電站253 km,下距白鶴灘大壩180 km,壩址下至宜賓河道長562 km,控制集水面積406 142 km2;水庫正常蓄水位950 m;死水位920 m,相應庫容為33.06億m3,校核洪水位959.79 m,相應庫容為42.18億m3。烏東德水電站是流域開發的重要梯級工程,有一定的防洪、航運和攔沙作用。瀑布溝水庫(102°21′E ~102°49′E, 29°14′N ~29°24′N)位于岷江支流大渡河的下游上段,在四川省雅安市漢源縣和涼山彝族自治州甘洛縣境內,屬于干熱河谷氣候;水庫實行夏季放水、冬季蓄水的水位調節模式,是一座以發電為主,兼有防洪、攔沙等綜合利用效益的大型水電工程;瀑布溝水庫壩址以上控制流域面積68 512 km2,水庫正常蓄水位850.00 m,汛限水位841.00 m,死水位790.00 m,總庫容53.90億m3,從歷史洪水資料分析得知,瀑布溝最大日均流量多出現在7月、8月下旬和9月上旬。

圖1 研究區域

2 研究方法

選取逐步回歸與隨機森林兩種方法,基于氣象因子影響的物理機制,結合數理統計分析以及隨機森林重要性分析,篩選關鍵氣象因子作為模型輸入,對長江上游的烏東德、瀑布溝兩個水庫1959—1998年的入庫流量進行模型訓練,驗證兩個水庫1999—2014年的入庫流量。

2.1 逐步回歸法

逐步回歸法在建立回歸方程時,需定義一個指標用來衡量因子的重要程度,再依次逐步挑選預報因子。在所有可供挑選的因子之中,被選中的因子需要使殘差平方和下降達到最大值。首先根據方差貢獻大小挑選預報因子x1,再根據剩余因子的方差貢獻大小挑選出第二個因子x2,第一、二步過渡方程分別為

y=b0+b1x1

(1)

y=b0+b1x1+b2x2

(2)

式中b0、b1、b2為回歸系數。

用同樣的方法繼續挑選因子進入方程,隨著因子的逐漸增加,因子之間的共線性關系使得后面的因子的顯著性越來越小。因此,在逐步回歸的每一步都要對因子作剔除檢驗,直至方程F檢驗不能通過為止,最終得到的方程即為擬合最佳的回歸方程。

2.2 隨機森林算法

隨機森林是一種集成學習算法[13],該算法主要思路是通過某種策略綜合大量的子預報模型的結果。隨機森林就是以決策樹模型為子模型,基于袋裝法[14-15]構造而成。隨機森林在以決策樹為子學習器的前提下,在訓練過程中進一步改進了屬性特征的隨機選擇[16]。傳統決策樹在劃分屬性特征時,在當前節點的屬性集合中選擇最優的屬性;而在隨機森林中,需要先從子決策樹的每個結點的屬性集合中隨機選擇一個包含若干個屬性的子集,再從該子集中選擇最優屬性用于決策樹的劃分。隨機森林中子學習器除了來自袋裝法的樣本擾動外,還有自身的屬性擾動,因此隨著學習時間的增加,泛化誤差會逐漸減小,集成學習的泛化性能也因此得到進一步的提升[17]。隨機森林可以計算出特征為隨機森林的每棵樹的貢獻,取均值后對不同特征的貢獻進行排序。因此,該模型除了可以挖掘眾多解釋因子與目標變量之間的關系,亦可評價解釋因子的重要程度,為挑選預報因子提供了新的方法。

2.3 預報方案

a.關鍵預報因子篩選方案。烏東德水庫和瀑布溝水庫都位于長江上游流域,但位置距離較遠,下墊面與氣候條件不同,因此挑選的預報因子不同,從而避免因為預報因子相似而造成結果的偶然性。本文收集整理了130項氣象因子數據,包括88項大氣環流指數、26項海溫指數以及16項其他指數。數據來源于中國氣象局國家氣候中心(https://cmdp.ncc-cma.net/Monitoring/cn-index-130.php),國家氣象局已核查檢驗了數據系列,數據的真實性與可靠性較高。本文選用1958—2013年的130項氣象因子,通過查閱大量文獻[18-21],結合已有研究,就130項氣象因子逐一分析其具體的物理機制,排除無顯著影響的因子,實現對各項預報因子的初步篩選。以初步篩選的因子為基礎,結合單相關系數分析與隨機森林的重要性分析進行關鍵預報因子的識別,據此對各水庫逐月徑流量的關鍵預報因子進行篩選,最終2個水庫每月選取重要程度前5的關鍵氣象因子作為該水庫月徑流量的預報因子。采用相關系數(r)進行相關性檢驗,利用t檢驗確定其顯著性。

b.預報模型構建方案。針對烏東德水庫和瀑布溝水庫進行獨立建模,分別采用逐步線性回歸與隨機森林兩種方法構建預報模型,建模時間為12個月,共構建了48個子模型。模型從每年年初起預報,利用上一年的關鍵氣象因子預報該年的月平均徑流,每個月的預見期不一致,預見期最長為1 a。選取了數據系列的70%作為訓練樣本,即訓練期為1959—1998年,驗證期為1999—2014年。逐步回歸計算由SPSS軟件實現。隨機森林核心內容基于Python語言機器學習算法庫sklearn中的隨機森林分類器(random forest classifier)實現[22]。

c.結果精度評定方案。中長期預報的預見期長,不確定因素多,缺乏確定的精度評定標準。本文參考前人在中長期預報中所采用的相關精度評定方法,選取了相關系數(r)、均方根誤差(RMSE)、確定性系數(R2)、平均相對誤差(MRE)4個指標進行誤差分析。其中,r和R2越大表明預測效果越佳,而RMSE值和MRE值越小表明預報效果越佳。RMSE值因水庫集水面積不同而變化較大,僅作為參考;MRE無量綱,可消除水庫集水面積的影響,準確反映不同流量量級的誤差大小,進而較為直觀地反映誤差水平。

3 結果與分析

3.1 關鍵預報因子識別結果

烏東德水庫與瀑布溝水庫各月關鍵預報因子識別結果如表1所示,分析各分區的因子篩選結果可以發現,同一分區臨近月份關鍵預報因子相似。例如烏東德水庫1—3月,11月黑潮區海溫指數與11月NINO A區海表溫度距平指數都是關鍵預報因子,這符合氣象因子對降雨徑流影響的長時效性的規律,同時也反映了氣象因子挑選結果的可靠性。此外,兩個水庫的同一月份的關鍵預報因子可能相似,例如烏東德與瀑布溝水庫11月都含有5月北極濤動指數的關鍵預報因子,體現了大氣環流對降雨徑流的大尺度范圍影響。

表1 關鍵預報因子識別結果

3.2 烏東德水庫預報結果

表2為烏東德水庫預報結果精度,可見,兩種模型在訓練期的訓練效果良好,穩定性強,預報能力差別不大。在驗證期時,兩種模型的精度與模型穩定性有所下降,而隨機森林的預測結果比逐步回歸的精度高,但總體上來說兩種模型的精度區別不大。計算兩種模型訓練期與驗證期每個月的MRE值,結果見表3。由表3可見,兩種預報模型在烏東德水庫上游非汛期預測結果比汛期的結果更好,整體上誤差隨著徑流量的增加而增加。訓練期,隨機森林預測結果的逐月平均相對誤差更低一些;驗證期,兩種模型有高有低,難以具體比較。

表2 烏東德水庫預報結果精度

表3 烏東德水庫預報結果逐月MRE值

圖2為1959—2014年烏東德水庫徑流量逐月預測結果。在驗證期2017年8月,逐步回歸預測出的入庫徑流量與實測流量有大幅偏差,這也導致了8月逐步回歸法預測結果的MRE值達到了34.59%。據分析,2017年8月,其關鍵預報因子印度副高強度指數陡增至1959—2014年內最高,其他時間該指標都比較低,所以導致了模型預測結果的巨大誤差。隨機森林這種情況下體現了優勢,預測因子通過子學習器的分類后,按照不同數量級別對應不同的擬合流量值,形成的預測流量范圍總是在歷史流量的范圍內,從而避免了某一預測因子值的突變帶來的預報誤差。

分析圖2可知,兩種模型在訓練期時擬合實測還原流量效果非常優異,驗證期時效果變差,而隨機森林這一點特點更為明顯,可見隨機森林模型的過擬合現象較為嚴重。機器學習的過擬合主要原因是非線性模型對數據外延方面能力的不足,訓練的數據一旦缺乏代表性,就會對預測精度造成較大影響。盡管在建模時已經多次調參,將模型調至最佳擬合效果,但由于水文數據時間序列較短,數據量不足,過擬合現象仍無法避免。

圖2 烏東德水庫入庫流量逐月預測結果Fig.2 Monthly forecast results of Wudongde Reservoir inflow

3.3 瀑布溝水庫預報結果

表4為瀑布溝水庫預報結果精度,可見,在訓練期,隨機森林的預測效果比逐步回歸更加優秀,3項精度評定指標都優于逐步回歸的預測結果。盡管訓練期有過擬合傾向,但在驗證期,逐步回歸的預測能力更加優秀,驗證期結果與烏東德水庫驗證期相似。兩種模型在驗證期精度與模型穩定性有所下降,而隨機森林的預測結果比逐步回歸精度高,但總體上來說兩種模型的精度差距不大。

表4 瀑布溝水庫預報結果精度

計算兩種模型訓練期與驗證期每個月的MRE值,如表5所示。由表5可見,逐步回歸預報模型在瀑布溝水庫上游非汛期時預測結果比汛期時的結果

表5 瀑布溝水庫預報結果逐月MRE值

更好,整體上誤差隨著徑流量的增加而增加。而隨機森林預報結果在訓練期出現了MRE值減小的反規律狀況,其在6—9月的平均相對誤差降至了相當低的范圍。據分析,出現這種狀況的原因主要是在預測過程中隨機森林模型的學習深度過高,導致了過擬合的問題。

圖3為1959—2014年瀑布溝水庫徑流量逐月預測結果。可以看到,2012年7月的月流量較大,達到了4 415 m3/s,模型擬合效果較差。在該月的20—23日,受較強的冷空氣和西南渦的共同影響,在岷沱江流域出現了1次強降雨過程,導致了該流量值是瀑布溝水庫1959—2014年中最大的月入庫流量。在瀑布溝水庫7月挑選的因子為12月親潮區海溫指數、12月亞洲區極渦面積指數、12月850 hPa中太平洋信風指數、8月NINO W區海表溫度距平指數與12月南方濤動指數,該類因子在訓練期的相關性較高,但2012年的7月流量偏高的主要影響因素為冷空氣與西南低渦,所以預測結果精度較差。

圖3 瀑布溝水庫入庫流量逐月預測結果

分析圖3發現,在2011年1月、2月、3月出現了遠遠高于往年的流量,因為訓練期未發生如此大的流量過程導致了模型擬合效果較差。同理,還有2009年的11月與12月的流量過程,異常低于以往的平均流量,結果擬合效果同樣不佳。除了上述2段流量過程之外,整體上的流量擬合效果良好,兩種模型均能準確訓練出流量的變化過程,驗證期相對誤差在40%范圍內,平均相對誤差為17%。

4 結 論

a.針對長江流域上游的烏東德水庫和瀑布溝水庫的中長期徑流預報,隨機森林和逐步回歸兩種模型的模擬效果良好,穩定性強。隨機森林的預測結果比逐步回歸的精度高,但精度的差距不大。在驗證期時,兩種模型的精度與穩定性較訓練期均有所下降,精度結果依然滿足預報要求。預測誤差隨著預測流量的增加而增大,存在汛期誤差大、非汛期誤差小的現象。

b.隨機森林由于模型自身特點,不能夠做出超越訓練集數據范圍的預測。在訓練數據量充足的條件下,該特點可以避免某一預測因子值的異常變化帶來的擬合誤差,以逐步回歸為代表的線性模型則相較不足。

c.兩種模型均存在過擬合現象,但隨機森林更為明顯。具體表現為:在訓練期時擬合實測還原流量異常優異,到了驗證期時變差。由于水文數據時間序列較短,數據量不足,導致了過擬合現象無法通過調參避免。這也體現了以隨機森林為代表的非線性模型在數據外延方面能力的不足。

d.相較于傳統的數理統計模型,以隨機森林為代表的機器學習模型預報精度更高,穩定性更強,在長江上游流域適用性良好,但模型本身存在著過擬合的問題,需要在接下來的研究中進一步探索。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲乱码在线播放| 国产v精品成人免费视频71pao| 91系列在线观看| 精品成人一区二区| 久久性视频| 免费黄色国产视频| 亚洲欧美日韩成人高清在线一区| 国产成人精品一区二区免费看京| 一级香蕉人体视频| 免费毛片视频| 五月天综合婷婷| 中文字幕在线一区二区在线| 九色国产在线| 国产丰满大乳无码免费播放| 欧美成人综合在线| 国产精品区视频中文字幕 | 999在线免费视频| 国产精品成人一区二区| 成人夜夜嗨| 欧美日韩国产成人高清视频| 日本免费a视频| 欧美在线精品怡红院| 欧美成人免费午夜全| 中文无码影院| 国产亚洲精品yxsp| 日韩黄色大片免费看| 欧亚日韩Av| 国产精品尤物在线| 久久午夜夜伦鲁鲁片不卡 | 曰韩人妻一区二区三区| 亚洲精品成人片在线观看| 国产尤物jk自慰制服喷水| 国产原创演绎剧情有字幕的| 亚洲美女视频一区| 九九热在线视频| 手机精品福利在线观看| 日本午夜在线视频| 日本免费一区视频| 欧美成人日韩| 欧美日韩成人在线观看| 韩日免费小视频| 五月天天天色| 伊人久久福利中文字幕| 黄色网站在线观看无码| 天堂亚洲网| 亚洲人成亚洲精品| 国产污视频在线观看| 91无码视频在线观看| 天堂亚洲网| 最新精品国偷自产在线| 日韩成人免费网站| 午夜无码一区二区三区| 素人激情视频福利| 久久国产乱子伦视频无卡顿| 国产黄网站在线观看| 日韩a在线观看免费观看| 国产真实自在自线免费精品| 日韩天堂网| 亚洲视频无码| 国产成人AV综合久久| 久青草网站| 久久永久免费人妻精品| 免费精品一区二区h| 2020国产精品视频| 久久人体视频| 国产网站一区二区三区| 国产91av在线| 国产永久在线观看| 国产成人综合日韩精品无码不卡| 色成人亚洲| 在线播放精品一区二区啪视频| 国产日本视频91| 99热这里只有成人精品国产| 呦系列视频一区二区三区| 在线观看视频99| 小说 亚洲 无码 精品| 欧美成人a∨视频免费观看| 欧美日韩国产系列在线观看| 成人永久免费A∨一级在线播放| 国产在线八区| 亚洲日韩第九十九页| 精品视频一区二区三区在线播|