999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

資料長(zhǎng)度對(duì)深度學(xué)習(xí)方法日徑流預(yù)報(bào)效率的影響

2023-12-29 00:00:00楊錕張文江宋克超
人民長(zhǎng)江 2023年3期

摘要:

長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)方法具有顯著的時(shí)序分析能力,在徑流預(yù)報(bào)方面有其獨(dú)特的優(yōu)勢(shì),但該模型預(yù)報(bào)的最優(yōu)輸入輸出長(zhǎng)度組合尚不太明確,探析不同輸入輸出長(zhǎng)度對(duì)LSTM日徑流預(yù)報(bào)效率的影響對(duì)相關(guān)應(yīng)用具有實(shí)際意義。以四川省西部大渡河、雅礱江、岷江支流以及嘉陵江上游等流域?yàn)檠芯繀^(qū),選取了20個(gè)子/區(qū)間流域,試驗(yàn)不同長(zhǎng)度的前期輸入資料預(yù)報(bào)不同預(yù)見期下的徑流,研究了不同資料長(zhǎng)度下LSTM模型的日徑流預(yù)報(bào)效率,分析了該方法在不同流域的適用性與最優(yōu)輸入輸出長(zhǎng)度的特征。結(jié)果表明:①以前期降水、氣溫以及徑流作為輸入,前期資料長(zhǎng)度對(duì)預(yù)報(bào)結(jié)果影響不太明顯,但預(yù)報(bào)準(zhǔn)確性會(huì)隨預(yù)見期延長(zhǎng)而下降,采用該種輸入方案的預(yù)見期不宜超過7 d;②僅以前期降水、氣溫資料作為輸入,預(yù)報(bào)準(zhǔn)確性會(huì)隨前期資料長(zhǎng)度增加而提高,也會(huì)隨預(yù)見期的延長(zhǎng)而下降,建議該種方案的資料長(zhǎng)度大于7 d、預(yù)見期最好為1 d,不宜超過3 d;③徑流變異性是顯著影響預(yù)報(bào)效率和最優(yōu)輸入輸出長(zhǎng)度組合的重要因子,變異性強(qiáng),則預(yù)報(bào)效果較差,對(duì)輸入輸出長(zhǎng)度的敏感性偏弱。研究成果可為提高深度學(xué)習(xí)徑流預(yù)報(bào)效率提供參考,有助于結(jié)合流域特性確定適用的輸入輸出長(zhǎng)度組合方案。

關(guān) 鍵 詞:

徑流預(yù)報(bào); 資料長(zhǎng)度; 預(yù)見期長(zhǎng)度; LSTM; 深度學(xué)習(xí)

中圖法分類號(hào): TV124

文獻(xiàn)標(biāo)志碼: A

DOI:10.16232/j.cnki.1001-4179.2023.03.013

0 引 言

徑流預(yù)報(bào)是水文水資源分析的重要內(nèi)容,也是洪澇預(yù)警、流域調(diào)度的關(guān)鍵環(huán)節(jié)。神經(jīng)網(wǎng)絡(luò)為徑流預(yù)報(bào)提供了一類基于統(tǒng)計(jì)的簡(jiǎn)單靈活方法[1-4]。其中,長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)模型,在序列數(shù)據(jù)擬合上有其獨(dú)特的優(yōu)勢(shì),已經(jīng)被廣泛應(yīng)用于徑流預(yù)報(bào)和模擬中,展現(xiàn)了良好的預(yù)報(bào)性能[5-8]。

LSTM模型能夠?qū)W習(xí)信息之間的長(zhǎng)期依賴關(guān)系,在融雪徑流和匯流時(shí)間較長(zhǎng)的流域,預(yù)報(bào)效果比較理想,但在氣候條件極端的流域,預(yù)報(bào)效果不太理想[9-13]。Kratzert等[12]采用241個(gè)流域檢測(cè)了LSTM的預(yù)報(bào)潛力,其中只有半數(shù)流域納什效率系數(shù)(NSE)達(dá)到0.65,其余流域大多位于干旱區(qū)域,預(yù)報(bào)效果不太理想,低估了徑流峰值。Boulmaiz等[13]采用20個(gè)流域來測(cè)試訓(xùn)練數(shù)據(jù)長(zhǎng)度對(duì)預(yù)報(bào)效果的影響,表明了日尺度徑流預(yù)報(bào)需要9~12 a的訓(xùn)練數(shù)據(jù)才能保證預(yù)報(bào)效果。而在其多次測(cè)試的結(jié)果中,有3個(gè)流域的預(yù)報(bào)效果始終不太理想,這是由于輸入數(shù)據(jù)中存在極端事件,使得LSTM模型難以從稀少的極端事件中捕捉到準(zhǔn)確的時(shí)序信息。可見,模型的預(yù)報(bào)性能可能會(huì)受到流域的地理、氣候等自然特征影響;在模型中拓展體現(xiàn)流域特征的物理模塊或參數(shù),可以提高模型的預(yù)報(bào)性能[14-15]。但也有學(xué)者指出,LSTM模型從根本上無法嚴(yán)謹(jǐn)?shù)貙W(xué)習(xí)水量平衡的規(guī)律,因而不太可能模擬完備的實(shí)際物理規(guī)律[16]。

作為數(shù)據(jù)驅(qū)動(dòng)模型,LSTM模型的預(yù)報(bào)效果與輸入數(shù)據(jù)息息相關(guān)。不同長(zhǎng)度的前期資料輸入得到的預(yù)報(bào)結(jié)果存在差異[17],要使預(yù)報(bào)準(zhǔn)確率達(dá)到最優(yōu),需要一定長(zhǎng)度的資料來確保模型能夠提取到足夠的信息,如王萌[7]的研究中資料長(zhǎng)度為75 d。同時(shí),預(yù)見期也是影響模型預(yù)報(bào)效果的重要因子。一般地,預(yù)見期增加,模型預(yù)報(bào)效果會(huì)下降[5-6,18-19],陶思銘等[18]初步探索了預(yù)見期的影響,表明預(yù)見期在18 d內(nèi),模型預(yù)報(bào)的相對(duì)誤差絕對(duì)值的平均值可維持在20%以下。

可見,LSTM模型的徑流預(yù)報(bào)效率同輸入輸出長(zhǎng)度有直接的內(nèi)在聯(lián)系,探究其規(guī)律有助于確定適用的資料輸入方案。為此,本文以大渡河及臨近流域?yàn)檠芯繀^(qū),探究不同長(zhǎng)度前期輸入的日徑流預(yù)報(bào)效率及其同預(yù)見期的關(guān)系,分析不同資料組合方案對(duì)LSTM模型輸入輸出長(zhǎng)度的敏感性,并研究該敏感性的影響因子。

1 數(shù)據(jù)及研究方法

1.1 研究區(qū)及資料選取

本文選取了位于四川省西部的大渡河、雅礱江、岷江的支流,以及嘉陵江上游區(qū)域?yàn)檠芯繀^(qū),經(jīng)緯度在26.6°N~34.7°N,96.8°E~107.1°E之間(見圖1)。研究區(qū)屬于山區(qū)流域,海拔變化大(1 000~5 000 m),以亞熱帶季風(fēng)氣候?yàn)橹鳌搅髦饕山涤晷纬桑糠钟扇谘⒌叵滤a(bǔ)給;年際變化不大,年內(nèi)變化曲線多呈雙峰,峰值出現(xiàn)在7月和9月。大渡河下游及青衣江流域位于暴雨區(qū),徑流隨暴雨發(fā)生而陡漲陡落;所選嘉陵江上游區(qū)域狀似扇形,汛期徑流陡漲,洪水峰高歷時(shí)短。

本文所用數(shù)據(jù)來自水文站點(diǎn)和氣象站日尺度的實(shí)測(cè)數(shù)據(jù)。對(duì)水文站點(diǎn)的徑流數(shù)據(jù)進(jìn)行篩選整理,剔除缺漏嚴(yán)重或異常較多的站點(diǎn)和年份,最終挑選了20個(gè)水文站點(diǎn)中較為可靠的數(shù)據(jù)序列,并依據(jù)站點(diǎn)位置劃分了20 個(gè)子流域(流域按站名命名)。所選流域包括典型山區(qū)流域、暴雨山區(qū)流域、亞高山山區(qū)流域幾個(gè)類型。站點(diǎn)的具體情況如表1所列。

氣象數(shù)據(jù)采用了研究區(qū)及其周邊的54個(gè)氣象站點(diǎn)的降水和氣溫資料,并以算術(shù)平均法計(jì)算子流域日尺度的面平均降水和面平均氣溫。

此外,為降低不同類數(shù)據(jù)對(duì)模型計(jì)算權(quán)重的影響,加快模型的收斂速度,還預(yù)先對(duì)數(shù)據(jù)進(jìn)行了歸一化處理。

1.2 模型方法

長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的變體,通過增加的3個(gè)“門”,化解了RNN對(duì)長(zhǎng)序列模擬乏力的問題。在日尺度徑流預(yù)報(bào)中,12 a的數(shù)據(jù)訓(xùn)練長(zhǎng)度才能保證模型達(dá)到最優(yōu)[13]。本文試驗(yàn)中各站的數(shù)據(jù)長(zhǎng)度雖不同,但基本滿足訓(xùn)練和驗(yàn)證的數(shù)據(jù)長(zhǎng)度要求。

本文設(shè)計(jì)了兩種輸入因子組合方案(見圖2):僅輸入前期面平均降水(P)和面平均氣溫(T)的PT方案,以及在PT方案基礎(chǔ)加上前期徑流(R)的PTR方案。以1,3,5,7,9,12,15,20,25,30 d作為輸入資料長(zhǎng)度,預(yù)見期則按1~30 d進(jìn)行取值,得到300個(gè)資料長(zhǎng)度和預(yù)見期長(zhǎng)度組合。對(duì)各流域不同輸入因子方案的不同長(zhǎng)度組合進(jìn)行訓(xùn)練、模擬,以檢驗(yàn)LSTM模型在不同流域的適用性,探究資料長(zhǎng)度對(duì)預(yù)報(bào)的影響,并找出不同資料長(zhǎng)度下合適的預(yù)見期長(zhǎng)度。

參考其他研究[20-21]以及多次調(diào)試驗(yàn)證,本文模型超參數(shù)設(shè)定方案如下:隱藏層輸出單元數(shù)(units)為64、批處理量(batch_size)為64、數(shù)據(jù)遍歷次數(shù)(epochs)為100。以均方誤差(MSE)作為模型訓(xùn)練過程中的損失函數(shù)。

對(duì)輸出結(jié)果,本文采用納什效率系數(shù)(NSE)作為評(píng)價(jià)指標(biāo):

NSE=1-ni=1(yobs,i-ymod,i)2ni=1(yobs,i-obs)2(1)

式中:yobs,i為i時(shí)刻的觀測(cè)值;ymod,i為相應(yīng)的模型預(yù)報(bào)值;obs為觀測(cè)序列的平均值;n為預(yù)報(bào)序列長(zhǎng)度。

為降低由網(wǎng)絡(luò)隨機(jī)性帶來的誤差,對(duì)每一組合都獨(dú)立重復(fù)100次,以100次結(jié)果的均值作為該組合的最終評(píng)價(jià)指標(biāo)。

2 結(jié)果與討論

2.1 模擬結(jié)果

不同輸入因子的組合方案在不同資料長(zhǎng)度與預(yù)見期條件下得到的統(tǒng)計(jì)結(jié)果如圖3所示。

對(duì)于PTR方案,前期資料長(zhǎng)度對(duì)模型預(yù)報(bào)效率的影響微弱,以預(yù)見期1 d的情況為例,20個(gè)流域中有11個(gè)的NSE大于0.800,7個(gè)處于0.600~0.800區(qū)間,2個(gè)小于0.600,站點(diǎn)的NSE分布情況不受前期資料長(zhǎng)度影響;20個(gè)站點(diǎn)的NSE平均值隨前期資料長(zhǎng)度的延長(zhǎng)而輕微下降,從1 d延長(zhǎng)至30 d,NSE均值由0.823逐漸下降至0.809。

相比PTR方案,PT方案下模型的預(yù)報(bào)效率整體下降,NSE均值在各輸入輸出長(zhǎng)度組合下都更低。在該方案下,預(yù)報(bào)效率受資料長(zhǎng)度的影響明顯,同樣以預(yù)見期1 d為例,隨著前期資料長(zhǎng)度從1 d延長(zhǎng)至30 d,20個(gè)流域的NSE分布情況逐漸右移,即NSE大于0.600的流域從0個(gè)逐漸增加至15個(gè),NSE均值也由0.460逐漸升高至0.713。

兩種方案,模型受預(yù)見期的影響都十分顯著。對(duì)圖3的統(tǒng)計(jì)結(jié)果進(jìn)行橫向比較,以前期資料長(zhǎng)度30 d為例,預(yù)見期逐漸延長(zhǎng),NSE分布逐漸左移,NSE均值迅速下降,即預(yù)見期從1 d變?yōu)?,7,15,30 d,PTR方案下NSE均值由0.809下降至0.460,PT方案下由0.713 下降至0.458。

并且,20個(gè)流域的預(yù)報(bào)效率差異顯著,受輸入輸出長(zhǎng)度的影響程度不一。PTR方案,相同的輸入輸出長(zhǎng)度條件下,NSE最大的流域與最小的相差值均超過0.5。以輸入資料長(zhǎng)度7 d、預(yù)見期1 d的情況為例,NSE最大的是雅江流域?yàn)?.982,最小的是馬邊流域?yàn)?.460,相差0.522。

綜合來看,為保證較好的預(yù)報(bào)效果,對(duì)于PT方案,前期資料長(zhǎng)度應(yīng)大于7 d,預(yù)見期最好在3 d以內(nèi);對(duì)于PTR方案,預(yù)見期在7 d以內(nèi)仍可以使得的NSE均值在0.600以上。

2.2 前期資料長(zhǎng)度對(duì)預(yù)報(bào)效率的影響

模型對(duì)不同類型的資料依賴程度不同,使得前期輸入長(zhǎng)度對(duì)模型的影響因輸入方案而異。

從產(chǎn)匯流來說,由于流域的調(diào)蓄作用,當(dāng)前時(shí)刻的降水在一段時(shí)間之后才能匯入河道而形成徑流。因此,某日降水可能會(huì)影響未來幾日的徑流;反之,某日的徑流量也會(huì)與前一時(shí)段的降水相關(guān)。所以,PT方案下,模型需要足夠長(zhǎng)度的前期降水資料,才能較為準(zhǔn)確預(yù)報(bào)流域徑流,即模型預(yù)報(bào)效率會(huì)隨前期資料長(zhǎng)度的延長(zhǎng)而提高,并趨于穩(wěn)定(見圖4(a))。需注意的是,圖4中展示的是20個(gè)流域的均值,就單個(gè)流域而言,部分流域?qū)η捌谫Y料長(zhǎng)度的依賴會(huì)稍弱,NSE能更容易達(dá)到0.600,也能更快趨于穩(wěn)定。整體而言,PT方案,前期資料長(zhǎng)度達(dá)到7 d,才能保證大部分流域的NSE能達(dá)到0.600。

輸入因子方案中加入徑流后(PTR方案),由于徑流序列的自相關(guān)性強(qiáng),且包含的時(shí)序信息更豐富,前期徑流取代降水成為影響預(yù)報(bào)的主導(dǎo)因子。一般地,大部分流域除了洪水期,日徑流量變化不會(huì)太大,所以,僅僅前期1 d的徑流資料,就包含了前期及未來一定時(shí)段的水文過程信息(該時(shí)段的長(zhǎng)短同流域產(chǎn)匯流響應(yīng)時(shí)長(zhǎng)相關(guān)),繼續(xù)增加前期的徑流數(shù)據(jù),增加的新信息已十分有限。因此,該種方案下前期輸入長(zhǎng)度對(duì)模型的影響被極大地削弱。如圖3和圖4所示,前期輸入的變化,對(duì)NSE的分布和均值的影響十分微弱。

與預(yù)期結(jié)果不同,PTR方案下,延長(zhǎng)前期輸入的長(zhǎng)度,還可能會(huì)帶來負(fù)效益,如圖4(b)所示:預(yù)見期為1 d,前期輸入延長(zhǎng)了29 d的情況下,NSE均值并未提升,反而略有下降(降了0.014)。這種情況的可能原因是:延長(zhǎng)前期資料長(zhǎng)度,增加的新信息可能有限,同時(shí)可能出現(xiàn)過多冗余信息。在深度學(xué)習(xí)方法中,冗余會(huì)導(dǎo)致信息權(quán)重的失真;被冗余“強(qiáng)調(diào)”的信息會(huì)得到更大權(quán)重,相應(yīng)地導(dǎo)致“其他信息”的權(quán)重在一定程度上降低。如果“其他信息”是有效信息,顯然冗余會(huì)給預(yù)報(bào)帶來負(fù)效益;反之,若“其他信息”是噪聲,則這種輸入的增加能抑制噪聲[22]。比如,圖4(b)中預(yù)見期為30 d的情況,NSE呈上升趨勢(shì),由0.426升至0.460,輸入的增加對(duì)預(yù)報(bào)起了正效應(yīng)。一般地,利用相關(guān)系數(shù)、梯度提升決策樹、主成分分析法等方法,進(jìn)行數(shù)據(jù)降維處理和特征選擇,可以解決數(shù)據(jù)冗余的問題,提高運(yùn)算速度[23-25]。

整體而言,PTR方案下資料長(zhǎng)度對(duì)預(yù)報(bào)效果的影響不大(對(duì)NSE的提升/降低不超0.05),但結(jié)合模型運(yùn)算速度來看,應(yīng)限制前期輸入長(zhǎng)度。

2.3 預(yù)見期的選擇

預(yù)見期越長(zhǎng),輸入的數(shù)據(jù)資料與要預(yù)報(bào)的徑流之間的相關(guān)性越弱,模型也就越難捕捉到時(shí)序的有效信息。總體而言,延長(zhǎng)預(yù)見期,預(yù)報(bào)難度加大,預(yù)報(bào)準(zhǔn)確性下降。

PT方案下,LSTM模型獲得的信息偏少,對(duì)前期資料長(zhǎng)度高度依賴。不同的前期資料長(zhǎng)度下,模型的表現(xiàn)差異明顯,不同資料長(zhǎng)度下合適的預(yù)見期長(zhǎng)度不同,如圖5及表2所示。

PTR方案下,模型受前期資料長(zhǎng)度的制約極小。預(yù)報(bào)徑流的NSE與預(yù)見期之間大體滿足對(duì)數(shù)關(guān)系:

NSE=-0.103ln(x)+0.806(2)

式中:NSE為20個(gè)流域納什系數(shù)的平均值;x為預(yù)見期長(zhǎng)度。

綜合考慮下,為保證預(yù)報(bào)結(jié)果的準(zhǔn)確性,采用PT方案時(shí),前期資料長(zhǎng)度為15 d以內(nèi),預(yù)見期長(zhǎng)度不宜超過3 d;30 d以內(nèi)不宜超過4 d。采用PTR方案時(shí),預(yù)見期7 d以內(nèi)都能得到較為準(zhǔn)確的預(yù)報(bào)結(jié)果。

2.4 徑流變異性對(duì)預(yù)報(bào)效率的影響

PTR方案下,20個(gè)流域中有2個(gè)流域的NSE始終無法達(dá)到0.600,分別為馬邊和流沙河;有6個(gè)流域的NSE系數(shù)僅在預(yù)見期1 d的情況下,可以達(dá)到0.600,分別為紅旗、三磊壩、涪江橋、多營坪、夾江、略陽。

圖6 展示了PTR方案資料長(zhǎng)度7 d、預(yù)見期1 d下,流沙河流域徑流過程的預(yù)報(bào)。模型對(duì)徑流峰值部分存在嚴(yán)重的低估;放大圖還顯示,預(yù)報(bào)峰值要比實(shí)測(cè)值滯后1 d。

流沙河流域徑流陡漲陡落,徑流的日間變化大,變異性強(qiáng)。如圖6所示,流沙河流域?qū)崪y(cè)降水與徑流位相是幾乎同步的,這說明流域產(chǎn)匯流速度較快,大部分降水水量在當(dāng)日即可達(dá)到出口斷面,匯流時(shí)間小于1 d;而對(duì)于日徑流預(yù)報(bào)來說,最小預(yù)見期為1 d。與林康聆等的研究結(jié)果類似,當(dāng)預(yù)見期大于匯流時(shí)間時(shí),LSTM模型預(yù)報(bào)能力顯著變差[19]。

對(duì)一場(chǎng)典型降水-徑流過程,一般地,流量過程線相對(duì)降水過程線有一定位相滯后,假設(shè)為1 d,那么LSTM模型學(xué)習(xí)到降水-流量時(shí)序規(guī)律后,能根據(jù)前一日的降水峰值,在次日預(yù)報(bào)出徑流峰值,得到較為準(zhǔn)確的徑流預(yù)報(bào)。但是,在日尺度的粗略時(shí)間分辨率下,暴雨小流域流沙河的降水-流量過程位相關(guān)系被掩蓋了,LSTM難以有效提取學(xué)習(xí)降水-徑流時(shí)序規(guī)律,導(dǎo)致暴雨洪水期預(yù)報(bào)效果不理想。

可見,這種局限是由于資料的時(shí)間分辨率對(duì)流域徑流過程刻畫能力不足所致,流沙河日尺度的降雨、徑流資料無法體現(xiàn)流域徑流匯流過程的時(shí)序關(guān)聯(lián)規(guī)律,采用更詳盡的時(shí)序資料,則可能提高預(yù)報(bào)效果。

不同流域受資料時(shí)間分辨率的限制程度不同,與流域徑流相鄰時(shí)段變化程度(徑流變異性)相關(guān)。為更好地刻畫流域的徑流變異特征,采用1 d時(shí)滯相關(guān)系數(shù)的倒數(shù)Vrunoff進(jìn)行量化:由原始徑流序列(R1,R2,R3,…,Rn)按1 d時(shí)滯生成兩列新的序列{R1,R2,R3,…,Rn-1}和{R2,R3,R4,…,Rn};兩個(gè)序列相關(guān)系數(shù)的絕對(duì)值越接近0,兩個(gè)序列的差異越大,Vrunoff也越大。

Vrunoff=1R2delay,1=n-ji=1(Ri+1-1)2·n-ji=1(Ri-2)2n-ji=1(Ri+1-1)·(Ri-2)2(3)

式中:Ri為第i時(shí)段的徑流量;Ri+1為第i+1時(shí)段的徑流量;n為數(shù)據(jù)的總時(shí)段數(shù);1為第1天到第n-1天的徑流平均值;2為第2天到第n天的徑流平均值。

如圖7所示,日徑流預(yù)報(bào)的NSE同Vrunoff具有很強(qiáng)的相關(guān)性,PTR和PT兩種輸入方案的相關(guān)系數(shù)(R)分別為-0.858(plt;0.05)和-0.746(plt;0.05),徑流變異性在很大程度上決定了LSTM的模擬難度和效率。

結(jié)合模擬結(jié)果,可將本文流域按照Vrunoff 分為3類:Vrunoff lt;1.05時(shí),流域變異弱,徑流因子時(shí)序自相關(guān)性強(qiáng),LSTM模型對(duì)輸入輸出長(zhǎng)度高度敏感,最優(yōu)方案時(shí)NSE可達(dá)0.80以上;1.05≤Vrunofflt; 1.40時(shí),流域徑流變異性較強(qiáng),模型在此類流域的適用性一般,輸入輸出長(zhǎng)度的變化會(huì)影響模擬效率,NSE可以達(dá)到0.60以上,甚至接近0.80,代表流域?yàn)閹r潤(rùn)、三磊壩、略陽、涪江橋、多營坪、紅旗、夾江;Vrunoff≥1.40時(shí),流域徑流變異性強(qiáng),模型在此類流域的適用性弱,對(duì)輸入輸出維度敏感性弱,NSE很難達(dá)到0.60,代表流域?yàn)榱魃澈印ⅠR邊。

大體上,徑流變異性與流域的匯流速度直接相關(guān)。一般地,流域面積大,匯流時(shí)間長(zhǎng),徑流變異性弱,Vrunoff小于1.05的11個(gè)流域中,除雜谷腦流域外,其余流域面積不小于10 000 km2;相應(yīng)地,馬邊、流沙河、紅旗3個(gè)流域的面積在2 000 km2以下,Vrunoff分別為1.54,1.46,1.34。同時(shí),還受降雨條件影響,處于暴雨區(qū)的流域,徑流變異性更強(qiáng):青衣江暴雨區(qū)的多營坪、夾江斷面以上雖然面積較大(約為10 000 km2),但變異性不弱,Vrunoff分別為1.29,1.38,大于巖潤(rùn)流域(面積3 300 km2)的1.15。

全球氣候的變化以及人類活動(dòng)對(duì)流域的改造,如河流改道、水庫修建等,使得流域的特征發(fā)生變化,影響流域徑流變異性。利用部分站點(diǎn)2007~2013年數(shù)據(jù)對(duì)訓(xùn)練好的模型進(jìn)行測(cè)試。預(yù)見期5 d以內(nèi),除個(gè)別站點(diǎn)外,預(yù)報(bào)效果與原來無明顯差異;預(yù)見期大于5 d,預(yù)報(bào)效果略有下降,PTR方案NSE下降幅度集中在0.034~0.112,PT方案下集中在0.045~0.154。整體的變化趨勢(shì)不變,仍符合前文得到的輸入輸出長(zhǎng)度影響LSTM日徑流預(yù)報(bào)效率的規(guī)律。

3 結(jié) 論

本文采用LSTM深度學(xué)習(xí)模型,由不同長(zhǎng)度的前期降水、氣溫以及徑流資料,預(yù)報(bào)未來一定時(shí)期的日徑流。研究表明:以前期降水、氣溫和徑流作為輸入時(shí),預(yù)報(bào)效率幾乎不受前期資料長(zhǎng)度的影響,但會(huì)隨著預(yù)見期的延長(zhǎng)而下降,最后趨于穩(wěn)定;預(yù)見期小于7 d,能夠滿足NSE達(dá)到0.60以上的要求。僅以前期降水、氣溫作為輸入時(shí),預(yù)報(bào)效率隨前期輸入延長(zhǎng)而提高,隨預(yù)見期延長(zhǎng)而降低;前期輸入長(zhǎng)度大于7 d、預(yù)見期小于3 d,能保證一半以上流域NSE達(dá)到0.60。

采用LSTM模型進(jìn)行的日徑流預(yù)報(bào)效率及輸入輸出長(zhǎng)度特征具有明顯的流域差異,主要影響因素為徑流變異性(Vrunoff),流域的徑流變異性越弱,模型預(yù)報(bào)效果越好。以Vrunoff為衡量指標(biāo),可大致將流域類型分為3類:Vrunofflt; 1.05,徑流變異性弱,模型模擬效果好,NSE能達(dá)0.60以上;Vrunoff≥1.40,徑流變異性強(qiáng),模型模擬效果差,NSE難達(dá)0.60;在兩者之間,模型模擬效果一般,在合適的輸入輸出長(zhǎng)度條件下,可以達(dá)到0.60以上。因此,制定徑流輸入輸出方案時(shí),應(yīng)考慮徑流過程的變異性特征,以充分利用模型和資料的有效性。

參考文獻(xiàn):

[1] 劉攀,鄭雅蓮,謝康,等.水文水資源領(lǐng)域深度學(xué)習(xí)研究進(jìn)展綜述[J].人民長(zhǎng)江,2021,52(10):76-83.

[2] 陳劍飛,李勇,劉俊江,等.耦合陸面水文模型和機(jī)器學(xué)習(xí)方法的水庫徑流量預(yù)報(bào)及應(yīng)用[J].氣象研究與應(yīng)用,2022,43(1):1-7.

[3] 李瑤.基于機(jī)器學(xué)習(xí)的黃河源區(qū)月徑流模擬與中長(zhǎng)期預(yù)報(bào)研究[D].北京:中國地質(zhì)大學(xué),2021.

[4] 謝智峰.基于深度學(xué)習(xí)的螢火蟲算法研究及在中長(zhǎng)期徑流預(yù)報(bào)中的應(yīng)用[D].南昌:南昌工程學(xué)院,2019.

[5] 徐源浩,鄔強(qiáng),李常青,等.基于長(zhǎng)短時(shí)記憶(LSTM)神經(jīng)網(wǎng)絡(luò)的黃河中游洪水過程模擬及預(yù)報(bào)[J].北京師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,56(3):387-393.

[6] 殷兆凱,廖衛(wèi)紅,王若佳,等.基于長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)的降雨徑流模擬及預(yù)報(bào)[J].南水北調(diào)與水利科技,2019,17(6):1-9,27.

[7] 王萌.神經(jīng)網(wǎng)絡(luò)算法在徑流模擬中的開發(fā)與應(yīng)用[D].哈爾濱:哈爾濱工業(yè)大學(xué),2019.

[8] 巫義銳,郭鴻飛,錢程,等.基于特征增強(qiáng)與時(shí)序感知的洪水預(yù)報(bào)模型[J].人民長(zhǎng)江,2021,52(增2):21-26,44.

[9] HAN H,CHOI C,JUNG J,et al.Deep learning with Long Short Term Memory based sequence-to-sequence model for rainfall-runoff simulation[J].Water,2021,13(4):437.

[10] HU C,WU Q,LI H,et al.Deep learning with a Long Short-Term Memory networks approach for rainfall-runoff simulation[J].Water,2018,10(11):1543.

[11] 黃克威,王根緒,宋春林,等.基于LSTM的青藏高原凍土區(qū)典型小流域徑流模擬及預(yù)測(cè)[J].冰川凍土,2021,43(4):1144-1156.

[12] KRATZERT F,KLOTZ D,BRENNER C,et al.Rainfall-runoff modelling using Long Short-Term Memory(LSTM)networks[J].Hydrology and Earth System Sciences,2018,22:6005-6022.

[13] BOULMAIZ T,GUERMOUI M,BOUTAGHANE H.Impact of training data size on the LSTM performances for rainfall-runoff modeling[J].Modeling Earth Systems and Environment,2020,6:2153-2164.

[14] KRATZERT F,KLOTZ D,SHALEV G,et al.Towards learning universal,regional,and local hydrological behaviors via machine learning applied to large-sample datasets[J].Hydrology and Earth System Sciences,2019,23(12):5089-5110.

[15] KHANDELWAL A,XU S M,LI X,et al.Physics guided machine learning methods for hydrology[J].arXiv,2020,2012:02854v1.

[16] YOKOO K,ISHIDA K,ERCAN A,et al.Capabilities of deep learning models on learning physical relationships:case of rainfall-runoff modeling with LSTM[J].Science of the Total Environment,2022,802:149876.

[17] 方威,周建中,周超,等.基于G-LSTM 模型的短期徑流預(yù)報(bào):以長(zhǎng)江上游寸灘斷面-三峽入庫斷面為例[J].人民長(zhǎng)江,2021,52(2):66-71.

[18] 陶思銘,梁忠民,陳在妮,等.長(zhǎng)短期記憶網(wǎng)絡(luò)在中長(zhǎng)期徑流預(yù)報(bào)中的應(yīng)用[J].武漢大學(xué)學(xué)報(bào)(工學(xué)版),2021,54(1):21-27.

[19] 林康聆,陳華,陳清勇,等.耦合Encoder-Decoder的LSTM徑流預(yù)報(bào)模型研究[J].武漢大學(xué)學(xué)報(bào)(工學(xué)版),2022,55(8):755-761.

[20] 黃文峰.長(zhǎng)短期記憶模型的超級(jí)參數(shù)調(diào)節(jié)在徑流預(yù)測(cè)中的效果研究[J].西華大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,39(1):23-29.

[21] XIANG Z,YAN J,DEMIR I.A rainfall-runoff model with LSTM-Based Sequence-to-Sequence Learning[J].Water Resources Research,2020,56(1):e2019WR025326.

[22] 成軍.同義反復(fù)話語的信息冗余性及其交際功能[J].外國語文,2018,34(6):70-76.

[23] 何志鵬.基于改進(jìn)CNN-LSTM的光伏發(fā)電功率預(yù)測(cè)及仿真研究[D].天津:天津理工大學(xué),2022.

[24] 李澤文,胡讓,劉湘,等.基于PCA-DBILSTM的多因素短期負(fù)荷預(yù)測(cè)模型[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2020,32(12):32-39.

[25] 戴健非,楊鵬,諸利一,等.集成PCA和LSTM神經(jīng)網(wǎng)絡(luò)的浸潤(rùn)線預(yù)測(cè)方法[J].中國安全科學(xué)學(xué)報(bào),2020,30(3):94-101.

(編輯:謝玲嫻)

Influences of data length on efficiency of daily runoff forecast by deep learning method

YANG Kun,ZHANG Wenjiang,SONG Kechao

(College of Water Resources and Hydropower,Sichuan University,Chengdu 610065,China)

Abstract:

Long Short-Term Memory(LSTM) neural network model,a deep learning method with strong capability of temporal series analysis,has unique advantages in runoff prediction.However,the optimal scheme of input and output lengths in this model is still not clear,so it is of practical significance to explore the influence of different input and output lengths on daily runoff prediction efficiency by LSTM.Taking Dadu River,Yalong River,tributaries of Minjiang River and upper reaches of Jialing River in western Sichuan Province as the study area,20 sub-catchments were selected to test the daily runoff in different forecast periods with input data of different lengths and the daily runoff prediction efficiency of LSTM model under different data lengths was studied.The applicability of this method in different river basins and the characteristics of optimal input and output length were analyzed.The results show that:① When the previous precipitation,temperature and runoff are taken as inputs,the input length has little effect on daily runoff prediction,but the accuracy will decrease with the extension of forecast period.Therefore,the forecast period should be set within 7 days to guarantee forecast accuracy.② When only previous precipitation and temperature are taken as inputs,the forecasting accuracy will increase with the extension of previous data and decrease with the extension of forecast period.Therefore,the length of preliminary data should be beyond 7 days,and the forecast period is preferably 1 day,and should not exceed 3 days.③ Runoff variability is an important indicator affecting the prediction efficiency and the optimal combination of input and output lengths.The prediction results in catchments with strong variability show low accuracy and weak sensitivity to input and output lengths.The research results can provide a reference for improving the runoff prediction efficiency by deep learning method,and help to determine the suitable input and output length combination scheme in consideration of watershed characteristics.

Key words:

runoff forecast;data length;length of forecast period;LSTM;deep learning

主站蜘蛛池模板: 深夜福利视频一区二区| 欧美性精品| 成色7777精品在线| 久久精品国产精品青草app| 国产精品永久不卡免费视频| 国产精品偷伦在线观看| 久久中文字幕av不卡一区二区| 国产国产人免费视频成18| 欧美在线一二区| 久久久91人妻无码精品蜜桃HD| 在线欧美a| www.日韩三级| 亚洲无码高清一区| 日韩欧美中文字幕在线韩免费| 日韩成人免费网站| 97成人在线视频| 5388国产亚洲欧美在线观看| 国产人碰人摸人爱免费视频| 久久国产精品嫖妓| www.91在线播放| 91蜜芽尤物福利在线观看| 无码专区国产精品一区| 国产精品9| 啊嗯不日本网站| 99人妻碰碰碰久久久久禁片| 欧美在线天堂| a级毛片免费网站| 欧美精品二区| 欧美精品啪啪一区二区三区| 伊人色综合久久天天| 欧美专区在线观看| 57pao国产成视频免费播放| 青青热久免费精品视频6| 538精品在线观看| 久久无码av一区二区三区| 最新国产高清在线| 日本黄色不卡视频| 日韩高清一区 | 日本人妻丰满熟妇区| 大香伊人久久| 手机在线免费不卡一区二| 精品少妇人妻av无码久久| 青青草原国产精品啪啪视频| 国产精品吹潮在线观看中文| 666精品国产精品亚洲| 人妻21p大胆| 在线观看欧美国产| 欧美在线视频不卡第一页| 亚洲大学生视频在线播放| 国产剧情无码视频在线观看| 少妇极品熟妇人妻专区视频| 青青国产视频| 国产精品亚欧美一区二区| 亚洲中文字幕无码爆乳| 欧美性色综合网| 伊人久久婷婷五月综合97色| 国产精品无码作爱| 欧美黑人欧美精品刺激| 黄色网页在线观看| 五月婷婷中文字幕| 国产精品成人啪精品视频| 91年精品国产福利线观看久久| 欧美日韩国产成人高清视频| 成人自拍视频在线观看| 亚洲乱码在线播放| a级免费视频| 成人在线天堂| 亚洲成人一区在线| 热伊人99re久久精品最新地| 国产黄在线免费观看| 午夜一区二区三区| av一区二区无码在线| 久久精品丝袜高跟鞋| 国产原创演绎剧情有字幕的| 四虎永久在线视频| 国产午夜不卡| 在线精品视频成人网| 香蕉久久国产精品免| 少妇极品熟妇人妻专区视频| 亚洲中文字幕在线观看| 九月婷婷亚洲综合在线| 国产大片黄在线观看|