姜淞川, 陸建忠*, 陳曉玲,2, 劉子旋
(1.武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室, 武漢 430079;2.江西師范大學(xué)鄱陽(yáng)湖濕地與流域研究教育部重點(diǎn)實(shí)驗(yàn)室, 南昌 330022)
對(duì)流域徑流變化趨勢(shì)的模擬與預(yù)測(cè)是水文學(xué)研究領(lǐng)域內(nèi)的一個(gè)重要課題,它對(duì)于長(zhǎng)期規(guī)劃水資源的合理利用具有十分重要的指導(dǎo)意義[1].我國(guó)是洪澇災(zāi)害十分頻繁的國(guó)家,它給人類(lèi)生命、基礎(chǔ)設(shè)施、農(nóng)業(yè)、生態(tài)系統(tǒng)帶來(lái)巨大損害[2-3].多時(shí)間尺度的徑流模擬預(yù)報(bào)對(duì)于水資源可持續(xù)利用與規(guī)劃具有非常重要的意義,然而徑流變化的非線(xiàn)性和隨機(jī)性等特點(diǎn)使得水文預(yù)報(bào)工作變得充滿(mǎn)挑戰(zhàn),到目前還沒(méi)有一個(gè)通用的模型能夠在所有情況下對(duì)徑流進(jìn)行精確模擬.傳統(tǒng)分布式徑流預(yù)測(cè)模型主要基于研究區(qū)內(nèi)復(fù)雜的氣象物理過(guò)程,采取統(tǒng)計(jì)的方式建立預(yù)報(bào)方程,并結(jié)合經(jīng)驗(yàn)指標(biāo)對(duì)模型進(jìn)行校準(zhǔn),因此多針對(duì)特定流域、特定預(yù)測(cè)尺度建立,推廣及應(yīng)用能力較差,難以對(duì)中小型地區(qū)進(jìn)行建模,同時(shí)受限于對(duì)復(fù)雜物理過(guò)程知識(shí)的匱乏以及昂貴的計(jì)算成本,這種方法的預(yù)測(cè)效果并不理想[4-7].
深度學(xué)習(xí)(Deep Learning,DL)作為新一代人工神經(jīng)網(wǎng)絡(luò),近年來(lái)在水資源和環(huán)境領(lǐng)域取得了長(zhǎng)足的進(jìn)展[8].多種常見(jiàn)的機(jī)器學(xué)習(xí)模型如人工神經(jīng)網(wǎng)絡(luò)(ANN)、決策樹(shù)和隨機(jī)森林(DT)、多層感知機(jī)(MLP)、支持向量機(jī)(SVM)等被廣泛應(yīng)用于水文預(yù)報(bào)和環(huán)境監(jiān)測(cè)等問(wèn)題的研究中[9].如Zhang等[10]采用基于深度學(xué)習(xí)的DBN結(jié)構(gòu)和傳統(tǒng)的反向傳播神經(jīng)網(wǎng)絡(luò)對(duì)中國(guó)東海岸的赤潮現(xiàn)象進(jìn)行了模擬預(yù)測(cè),結(jié)果顯示深度學(xué)習(xí)方法具有更好的泛化能力和更高的預(yù)測(cè)精度.Zhu等[11]采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)和多層感知機(jī)混合模型進(jìn)行了具有時(shí)空相關(guān)性的風(fēng)速預(yù)測(cè),這種組合模型的預(yù)報(bào)方法相較于單一機(jī)器學(xué)習(xí)模型取得了更好的模擬結(jié)果.Modaresi和Ebrahimi[12]采用4種數(shù)據(jù)驅(qū)動(dòng)模型(ANN、GRNN、LS-SVR、KNN)對(duì)伊朗Karkheh大壩在線(xiàn)性和非線(xiàn)性?xún)煞N情況下進(jìn)行了月尺度的徑流模擬,結(jié)果表明線(xiàn)性條件下ANN模擬效果最好而非線(xiàn)性條件下LS-SVR表現(xiàn)最優(yōu).崔東文等[13]對(duì)新疆伊犁河雅馬渡站徑流量預(yù)測(cè)過(guò)程中,基于多隱層BP神經(jīng)網(wǎng)絡(luò)模型,得到了比較理想的預(yù)報(bào)結(jié)果.目前存在的多種深度學(xué)習(xí)方法中,LSTM長(zhǎng)短期記憶網(wǎng)絡(luò)作為一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),能更好的處理具有長(zhǎng)時(shí)依賴(lài)的水文數(shù)據(jù).Kratzert等[14]在對(duì)大量流域進(jìn)行實(shí)驗(yàn)的基礎(chǔ)上探索了使用LSTM網(wǎng)絡(luò)進(jìn)行降雨-徑流模擬的能力,實(shí)驗(yàn)表明LSTM在處理長(zhǎng)時(shí)間序列數(shù)據(jù)上具有傳統(tǒng)RNN不具有的優(yōu)勢(shì),得出了在根據(jù)氣象數(shù)據(jù)進(jìn)行徑流模擬的過(guò)程中應(yīng)該使用LSTM而不是傳統(tǒng)RNN的結(jié)論.Kratzert等[15]也探討了LSTM模型在沒(méi)有歷史徑流觀(guān)測(cè)數(shù)據(jù)進(jìn)行參數(shù)調(diào)優(yōu)的情況下模擬徑流的能力,結(jié)果表明基于LSTM建立的概化模型在大多數(shù)流域的表現(xiàn)都優(yōu)于已建立的針對(duì)特定流域的水文模型.Zhang 等[16]采用LSTM網(wǎng)絡(luò)進(jìn)行污水的流量預(yù)測(cè),結(jié)果表明LSTM方法在預(yù)測(cè)污水流動(dòng)方面具有重要的應(yīng)用價(jià)值.LSTM網(wǎng)絡(luò)能夠很好的處理時(shí)間序列數(shù)據(jù),但是在空間數(shù)據(jù)處理上存在較多冗余.Shi等[17]基于這一問(wèn)題提出了卷積LSTM網(wǎng)絡(luò)模型,并成功應(yīng)用于短時(shí)降雨的即時(shí)預(yù)報(bào)中.上述這些方法通過(guò)挖掘歷史水文數(shù)據(jù)建立水文模型,相較于傳統(tǒng)的統(tǒng)計(jì)預(yù)報(bào)模型提升了預(yù)報(bào)精度.鄱陽(yáng)湖是我國(guó)最大的淡水湖,撫河流域作為鄱陽(yáng)湖第二大子流域,是我國(guó)重要的糧食產(chǎn)地,也在調(diào)節(jié)長(zhǎng)江水位、涵養(yǎng)水源、改善當(dāng)?shù)貧夂蚝途S護(hù)周?chē)貐^(qū)生態(tài)平衡等方面起著巨大作用.然而關(guān)于鄱陽(yáng)湖流域的水文預(yù)報(bào)工作卻鮮有報(bào)道,采用深度學(xué)習(xí)方法進(jìn)行徑流模擬的工作更是少之又少.另外,為了測(cè)試深度學(xué)習(xí)徑流模擬模型在新樣本上的表現(xiàn)性能,往往需要將數(shù)據(jù)集劃分為訓(xùn)練集與測(cè)試集,不同劃分方法得到的模型評(píng)估結(jié)果往往不同,因此單一的數(shù)據(jù)劃分方法得到的估計(jì)結(jié)果往往不夠穩(wěn)定可靠.
針對(duì)上述問(wèn)題,本文首先基于Tensorflow開(kāi)源模塊在Python環(huán)境下編寫(xiě)代碼構(gòu)建模型,然后以氣象站降雨數(shù)據(jù)和TRMM遙感降雨數(shù)據(jù)兩種數(shù)據(jù)為驅(qū)動(dòng),分別進(jìn)行日、月兩種尺度的徑流預(yù)報(bào),對(duì)同一模型在不同驅(qū)動(dòng)數(shù)據(jù)下的表現(xiàn)性能進(jìn)行了比較評(píng)估,并對(duì)于驅(qū)動(dòng)數(shù)據(jù)精度較差的情況下采用多重交叉驗(yàn)證的方法進(jìn)行數(shù)據(jù)集劃分,在一定程度上提高了模擬的精度,彌補(bǔ)了數(shù)據(jù)精度不足的缺陷,能夠較好的分析出流域徑流量的變化趨勢(shì).鄱陽(yáng)湖撫河流域集水面積超過(guò)1萬(wàn)km2,降雨季節(jié)性變化大,流域水文氣象站點(diǎn)眾多,數(shù)據(jù)充沛,十分適合于水文預(yù)報(bào)工作的進(jìn)行.同時(shí)鄱陽(yáng)湖流域作為我國(guó)重要的糧食產(chǎn)地之一,采用水文預(yù)報(bào)方法進(jìn)行防洪減災(zāi)具有十分重要的現(xiàn)實(shí)意義.本文在分析氣象站和TRMM降雨數(shù)據(jù)的基礎(chǔ)上,采用LSTM網(wǎng)絡(luò)架構(gòu)進(jìn)行徑流量的模擬與預(yù)報(bào),以期為撫河流域水資源規(guī)劃及防洪減災(zāi)、綜合治理提供有效輔助決策手段和堅(jiān)實(shí)理論依據(jù).
鄱陽(yáng)湖作為我國(guó)最大的淡水湖,也是第二大的湖泊,位于25°~30°N,114°~118°E之間,南北跨度620 km,東西跨度490 km,流域面積約16萬(wàn)km2,主要有贛江、撫河、信江、饒河、修水五大支流,七個(gè)入湖口[18],與中國(guó)江西省的行政區(qū)劃重疊約97%.
撫河流域(圖1)集水面積為15 811 km2,是五大支流中第二大的河流,位于26°30′~28°20′N(xiāo)、115°36′~117°10′E之間,地勢(shì)南高北低,地貌以丘陵為主,山地和河谷平原交錯(cuò)分布.地處亞熱帶濕潤(rùn)季風(fēng)性氣候,年平均氣溫在17.2 ℃~18.9 ℃之間,年平均降雨量1 722 mm,降雨的時(shí)空分布不均,5月到7月降雨量約占全年的51%,春冬兩季(10月到次年5月)降雨稀少[19].

圖1 鄱陽(yáng)湖撫河流域及其水文站、氣象站分布Fig.1 Map of Fuhe River Basin of Poyang Lake watershed with hydrological and meteorological stations
本文使用的降雨數(shù)據(jù)分日、月兩種尺度,日尺度的徑流模擬實(shí)驗(yàn)采用從中國(guó)氣象數(shù)據(jù)服務(wù)共享網(wǎng)站(http://data.cma.cn/)下載的鄱陽(yáng)湖撫河流域內(nèi)南城、南豐、廣昌3個(gè)地面觀(guān)測(cè)站從1960年1月1日至2009年12月31日共50 a 18 263 d的降水?dāng)?shù)據(jù);月尺度的徑流模擬實(shí)驗(yàn)采用1998年1月到2009年12月共144個(gè)月的TRMM數(shù)據(jù).TRMM的全稱(chēng)為“Tropical Rainfall Measuring Mission Satellite”,它是由美國(guó)國(guó)家航天局(NASA)和日本航空探測(cè)局(JAXA)共同研發(fā),專(zhuān)門(mén)對(duì)熱帶、亞熱帶的降雨進(jìn)行測(cè)量的氣象衛(wèi)星[20].本實(shí)驗(yàn)構(gòu)建的徑流預(yù)測(cè)模型采用了3B43降雨數(shù)據(jù)作為驅(qū)動(dòng)數(shù)據(jù).3B43是一種網(wǎng)格形式的降雨數(shù)據(jù),它融合了高精度的微波、紅外數(shù)據(jù)以及地面雨量站數(shù)據(jù),形成了一種以月為尺度的網(wǎng)格降雨數(shù)據(jù),覆蓋范圍為50°S~50°N,空間分辨率為0.25°×0.25°[21].首先將下載到的HDF格網(wǎng)形式數(shù)據(jù)利用IDL語(yǔ)言轉(zhuǎn)化為txt格式數(shù)據(jù),然后將南城、南豐、廣昌3個(gè)氣象站所在的網(wǎng)格點(diǎn)對(duì)應(yīng)的TRMM月降雨數(shù)據(jù)提取出來(lái),對(duì)日尺度的地面觀(guān)測(cè)降雨數(shù)據(jù)進(jìn)行累加得到月尺度的地面實(shí)測(cè)數(shù)據(jù),統(tǒng)一了時(shí)間空間尺度后,通過(guò)二者的比對(duì)實(shí)現(xiàn)對(duì)TRMM降雨數(shù)據(jù)的精度評(píng)估.本文使用的徑流量數(shù)據(jù)是從李家渡水文站于1960年1月1日至2009年12月31日獲取的日實(shí)測(cè)數(shù)據(jù),通過(guò)將徑流量逐月累加便能得到月尺度的徑流實(shí)測(cè)數(shù)據(jù).
收集到的降雨數(shù)據(jù)作為驅(qū)動(dòng)數(shù)據(jù)輸入到基于LSTM網(wǎng)絡(luò)構(gòu)建的降雨-徑流模型當(dāng)中進(jìn)行計(jì)算,而收集到的徑流量數(shù)據(jù)作為標(biāo)簽數(shù)據(jù)與通過(guò)模型計(jì)算得到的徑流量模擬值進(jìn)行比對(duì)得到損失函數(shù)(誤差),采用誤差的反向傳播算法使損失函數(shù)達(dá)到最小從而使模型參數(shù)得到優(yōu)化,如此反復(fù)迭代便能得到最優(yōu)的預(yù)報(bào)模型.
Tensorflow是由Google公司的人工智能團(tuán)隊(duì)Google Brain開(kāi)發(fā)和維護(hù)的一個(gè)用于數(shù)值計(jì)算的強(qiáng)大開(kāi)源軟件庫(kù),它十分適合用來(lái)進(jìn)行機(jī)器學(xué)習(xí)方面的研究[22].降雨量(precipitation)是河流徑流量最重要的影響因素.在一定的時(shí)間范圍內(nèi),在河流流域的地形地貌以及土壤結(jié)構(gòu)性質(zhì)變化不大的情況下,可以忽略影響流域徑流的其他過(guò)程參數(shù),而直接建立降雨和徑流的輸入輸出關(guān)系.本實(shí)驗(yàn)所使用的降雨數(shù)據(jù)包括地面氣象站數(shù)據(jù)和TRMM遙感數(shù)據(jù).氣象站數(shù)據(jù)分布稀疏而精度較高,遙感數(shù)據(jù)分布均勻但精度較差,二者的互補(bǔ)可以減少由采樣代表性、采樣范圍和頻率以及數(shù)據(jù)獲取模式不同所帶來(lái)的差異性.同時(shí)采用位于鄱陽(yáng)湖撫河干流下游的李家渡水文站實(shí)測(cè)的河流徑流量作為對(duì)應(yīng)于模型輸入數(shù)據(jù)的標(biāo)簽數(shù)據(jù),通過(guò)損失函數(shù)的計(jì)算來(lái)對(duì)模型進(jìn)行訓(xùn)練.
從模擬的過(guò)程分,模型中的數(shù)據(jù)分為作為輸入的驅(qū)動(dòng)序列X,作為輸出的模擬序列Y以及用作校準(zhǔn)訓(xùn)練的標(biāo)簽實(shí)測(cè)序列O.由于LSTM網(wǎng)絡(luò)的時(shí)序特征,在將序列數(shù)據(jù)輸入到模型中之前需要將X、Y、O統(tǒng)一到同一個(gè)時(shí)間尺度下.由于降雨和徑流的數(shù)據(jù)來(lái)源、單位量綱的不同,各種數(shù)據(jù)的值域范圍可能會(huì)存在較大的差異,因此為了便于LSTM網(wǎng)絡(luò)在訓(xùn)練過(guò)程中能夠快速的使誤差收斂獲得最優(yōu)解,需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理.經(jīng)過(guò)了時(shí)間尺度的統(tǒng)一和數(shù)據(jù)歸一化處理后,便能構(gòu)建輸入向量,從而作為驅(qū)動(dòng)數(shù)據(jù)輸入循環(huán)網(wǎng)絡(luò)模型.循環(huán)網(wǎng)絡(luò)主要由多個(gè)LSTM層和兩個(gè)全連接層組成(圖3),輸入序列X進(jìn)入循環(huán)網(wǎng)絡(luò)處理得到輸出序列Y,然后通過(guò)將輸出序列Y與實(shí)測(cè)序列O的對(duì)比,基于反向傳播優(yōu)化參數(shù)的算法,最小化損失函數(shù),然后重新將輸入序列X輸入到更新了模型參數(shù)后的循環(huán)網(wǎng)絡(luò),經(jīng)過(guò)多次迭代直至損失函數(shù)小于某一設(shè)定值后停止迭代,模型訓(xùn)練結(jié)束.模型架構(gòu)如圖2所示.
循環(huán)體內(nèi)部,輸入序列Xn首先經(jīng)過(guò)一個(gè)全連接層,流經(jīng)多層LSTM網(wǎng)絡(luò),每層由多個(gè)LSTM神經(jīng)元組成,隱藏層計(jì)算后的輸出再作為輸入進(jìn)入到另一個(gè)全連接層,再經(jīng)計(jì)算得到輸出序列Yn,循環(huán)體(圖2紅框部分)內(nèi)部結(jié)構(gòu)如圖3所示.
模型參數(shù)分為兩部分(表1):一部分為普通參數(shù),包括循環(huán)體內(nèi)部隱藏層各單元之間的連接權(quán)重和偏置、輸入輸出全連接層的權(quán)重和偏置,這部分參數(shù)由TensorFlow內(nèi)置優(yōu)化算法計(jì)算梯度并更新參數(shù)獲得最優(yōu)解;另外一部分為L(zhǎng)STM網(wǎng)絡(luò)的超參數(shù),主要有:
1) 隱藏層層數(shù)和每個(gè)隱藏層中LSTM神經(jīng)元的個(gè)數(shù),這兩個(gè)參數(shù)確定了網(wǎng)絡(luò)的基本結(jié)構(gòu),其中層數(shù)越多、每層神經(jīng)元越多,模型參數(shù)越多,也就意味著訓(xùn)練過(guò)程越復(fù)雜,所需訓(xùn)練時(shí)間越多.
2) 最大時(shí)序截?cái)嚅L(zhǎng)度time_step,由于LSTM在處理較長(zhǎng)的序列數(shù)據(jù)時(shí),在參數(shù)優(yōu)化過(guò)程中的存在梯度消失或梯度爆炸的問(wèn)題,因此在實(shí)際使用時(shí)需要設(shè)定一個(gè)最大時(shí)序截?cái)嚅L(zhǎng)度.
3) 訓(xùn)練數(shù)據(jù)包大小batch_size,即一次輸入模型中的樣本個(gè)數(shù),極限值為訓(xùn)練集樣本總數(shù).
4) 學(xué)習(xí)率learning_rate,學(xué)習(xí)率決定了模型訓(xùn)練時(shí)的收斂速度,學(xué)習(xí)率較大時(shí),收斂速度較快但可能造成模型在局部最優(yōu)解的附近擺動(dòng),學(xué)習(xí)率較少時(shí),訓(xùn)練結(jié)果精度較高但是由于計(jì)算量變大,收斂速度較慢.
5) 迭代次數(shù)epoch,即模型將整個(gè)樣本數(shù)據(jù)完整訓(xùn)練的次數(shù),迭代次數(shù)的多少?zèng)Q定了模型是否會(huì)發(fā)生過(guò)擬合或者欠擬合現(xiàn)象.

圖2 基于LSTM網(wǎng)絡(luò)的徑流模擬模型Fig.2 Runoff simulation model based on LSTM network

圖3 循環(huán)網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)Fig.3 The internal operation of recurrent network

參數(shù)類(lèi)型參數(shù)名說(shuō)明調(diào)參方式num_layers隱藏層層數(shù)全局超參數(shù)hidden_size單個(gè)隱藏層中神經(jīng)元個(gè)數(shù)超參數(shù)time_steps最大時(shí)序截?cái)嚅L(zhǎng)度經(jīng)驗(yàn)調(diào)參batch_size訓(xùn)練數(shù)據(jù)包大小訓(xùn)練時(shí)超參數(shù)learning_rate學(xué)習(xí)率epoch迭代次數(shù)w_in,b_in輸入全連接層參數(shù)普通參數(shù)w_rnn,b_rnn循環(huán)體隱藏層參數(shù)自動(dòng)調(diào)參w_out,b_out輸出全連接層參數(shù)
在日尺度的徑流預(yù)測(cè)模擬實(shí)驗(yàn)中,由于河流徑流量數(shù)據(jù)在年內(nèi)具有相似的變化規(guī)律,因此直接將1960年1月1日—1989年12月31日共30 a數(shù)據(jù)作為訓(xùn)練集來(lái)對(duì)模型進(jìn)行訓(xùn)練,1990年1月1日—2009年12月31日共20 a數(shù)據(jù)作為測(cè)試集來(lái)測(cè)試模型精度.
在月尺度的徑流預(yù)測(cè)模擬實(shí)驗(yàn)中,由于數(shù)據(jù)量較小,為了提高模擬精度,采用“交叉驗(yàn)證法”對(duì)數(shù)據(jù)集進(jìn)行劃分,將1998年—2009年共12 a的數(shù)據(jù)集M等分為12個(gè)大小相同的互斥子集,即每年的數(shù)據(jù)作為一個(gè)子集.每次將1個(gè)子集作為測(cè)試集,其余11個(gè)子集作為訓(xùn)練集,共進(jìn)行12次訓(xùn)練和測(cè)試,最終返回12個(gè)測(cè)試結(jié)果的均值.示意圖如圖4所示.

圖4 月尺度徑流模擬實(shí)驗(yàn)中采用“交叉驗(yàn)證法”對(duì)數(shù)據(jù)集進(jìn)行劃分Fig.4 The method of data set division in monthly runoff simulation: 12-fold cross validation
為了定量描述模型的表現(xiàn)性能,采用相關(guān)系數(shù)R2、納什系數(shù)NSE和百分比偏差Pbias來(lái)評(píng)定徑流實(shí)測(cè)值與模擬值之間的“親近性”,同時(shí)為了對(duì)TRMM遙感降雨數(shù)據(jù)進(jìn)行精度驗(yàn)證,還加入了均方根誤差RMSE來(lái)評(píng)定相同時(shí)空尺度下氣象站數(shù)據(jù)和TRMM數(shù)據(jù)的相關(guān)性.表2詳細(xì)介紹了本文所用精度指標(biāo)的計(jì)算公式、取值范圍以及最佳取值.
利用氣象站觀(guān)測(cè)的日降雨數(shù)據(jù)來(lái)對(duì)月尺度的TRMM遙感降雨數(shù)據(jù)進(jìn)行精度驗(yàn)證,需要將兩種數(shù)據(jù)統(tǒng)一到相同的時(shí)空尺度上.在時(shí)間尺度上通過(guò)對(duì)地面氣象站的日降雨數(shù)據(jù)逐月累加便能將二者統(tǒng)一為月尺度數(shù)據(jù);在空間上,直接將南城、南豐、廣昌所在TRMM網(wǎng)格對(duì)應(yīng)的降雨量作為與氣象

表2 R2、NSE、Pbias和RMSE計(jì)算公式、取值范圍以及最佳取值(Qobsi為實(shí)測(cè)徑流序列,
站數(shù)據(jù)相同空間尺度下的降雨數(shù)據(jù).選擇相關(guān)系數(shù)R2、均方根誤差RMSE為評(píng)價(jià)指標(biāo),以TRMM降雨為橫坐標(biāo),氣象站月觀(guān)測(cè)降雨為縱坐標(biāo),分別繪制3個(gè)氣象站的散點(diǎn)圖,并分別計(jì)算每個(gè)氣象站的相關(guān)性指標(biāo)(圖5).從下圖中可以看出,3個(gè)氣象站的地面觀(guān)測(cè)數(shù)據(jù)和TRMM數(shù)據(jù)的相關(guān)系數(shù)在0.88~0.94之間,表明兩種數(shù)據(jù)的相關(guān)性較強(qiáng).南豐氣象站的TRMM數(shù)據(jù)和氣象站數(shù)據(jù)的相關(guān)系數(shù)為0.88,在3個(gè)氣象站中最低,表明TRMM數(shù)據(jù)在南豐位置的精度相較最低,廣昌氣象站相關(guān)系數(shù)達(dá)到0.94,表明TRMM在廣昌精度最高;RMSE在30~50 mm之間,表明兩種數(shù)據(jù)有一定的偏離,即每月大約相差30~50 mm.
經(jīng)過(guò)500次迭代訓(xùn)練后,使用TensorBoard對(duì)訓(xùn)練過(guò)程可視化,得到損失函數(shù)的收斂曲線(xiàn)如圖6所示.

圖6 日徑流模擬模型500次迭代后得到的誤差收斂曲線(xiàn)Fig.6 The error convergence curve derived from daily runoff simulation model after 500 iterations
可以發(fā)現(xiàn)在圖6中紅圈的范圍內(nèi)測(cè)試集的誤差達(dá)到最小,因此分別將迭代次數(shù)為75、175和270的3個(gè)模型應(yīng)用于訓(xùn)練集、測(cè)試集和整個(gè)數(shù)據(jù)集,計(jì)算得到模型評(píng)價(jià)指標(biāo)(表3).可以發(fā)現(xiàn)無(wú)論在訓(xùn)練集還是測(cè)試集,徑流模擬值與實(shí)測(cè)值之間的相關(guān)性指標(biāo)(R2、NSE)均在0.92~0.96之間,百分比偏差均在±5%以?xún)?nèi),模型表現(xiàn)非常好,其中迭代75次和175次偏差為正,模擬值整體偏低,迭代270次偏差為負(fù),模擬值整體偏高.將訓(xùn)練175次的模型對(duì)數(shù)據(jù)集進(jìn)行預(yù)測(cè),將徑流實(shí)測(cè)值與計(jì)算得到的徑流模擬值按時(shí)間順序繪制成圖(圖7~8),整個(gè)數(shù)據(jù)集包含約18 000個(gè)數(shù)據(jù)點(diǎn),由于數(shù)據(jù)量較大時(shí)間序列圖并不能直觀(guān)的描述模型的模擬結(jié)果,而使用流量歷時(shí)曲線(xiàn)(Flow Duration Curve)可以更好的描述長(zhǎng)持續(xù)時(shí)間數(shù)據(jù)集(≥10 a的每日數(shù)據(jù)集)模型的性能.以日均徑流量為縱坐標(biāo),超過(guò)該徑流量的累計(jì)天數(shù)為橫坐標(biāo)繪制得到迭代175次模型的流量歷時(shí)曲線(xiàn)(圖9),圖中可以發(fā)現(xiàn)無(wú)論訓(xùn)練集還是測(cè)試集,在較低徑流量范圍內(nèi)(0~1 000 m3/s),模擬值數(shù)據(jù)點(diǎn)大部分在實(shí)測(cè)值數(shù)據(jù)點(diǎn)的左邊,說(shuō)明相同的日均徑流量,大于該值的模擬累計(jì)天數(shù)小于實(shí)際累計(jì)天數(shù),反過(guò)來(lái)說(shuō)也就是小于該值的模擬累計(jì)天數(shù)大于實(shí)際累積天數(shù),說(shuō)明徑流模擬值整體偏低,而計(jì)算得到的偏差Pbias為正值(訓(xùn)練集4.97%,測(cè)試集2.22%),同樣表明模擬值偏低,二者結(jié)論相符.總的來(lái)說(shuō)模擬值與實(shí)測(cè)值十分相近,模型模擬效果優(yōu)秀.

表3 模型迭代75、175、270次日徑流結(jié)果精度
通過(guò)依次將1998年—2009年中1 a的數(shù)據(jù)作為測(cè)試集,其余11 a數(shù)據(jù)作為訓(xùn)練集,共進(jìn)行了12次的訓(xùn)練與測(cè)試,通過(guò)對(duì)比12次的訓(xùn)練與測(cè)試得到的徑流實(shí)測(cè)值與預(yù)報(bào)值之間的精度評(píng)價(jià)指標(biāo),發(fā)現(xiàn)將2009年的數(shù)據(jù)作為測(cè)試集訓(xùn)練出來(lái)的模型表現(xiàn)最好,RMSE在訓(xùn)練集上為3 628.06 m3/s,是12種數(shù)據(jù)集劃分方法中次最小的;測(cè)試集達(dá)到2 693.77 m3/s、全部數(shù)據(jù)集達(dá)到3 559.58 m3/s,均是所有12個(gè)測(cè)試結(jié)果中最小的, 因此將該劃分方式的訓(xùn)練結(jié)果單獨(dú)取出,作為本實(shí)驗(yàn)的徑流預(yù)測(cè)結(jié)果.利用Tensorboard對(duì)訓(xùn)練過(guò)程可視化,得到誤

圖7 迭代175次訓(xùn)練集的日徑流模擬結(jié)果Fig.7 Comparison of simulated and observed runoff in training set derived from daily runoff model after 175 iterations

圖8 迭代175次測(cè)試集的日徑流模擬結(jié)果Fig.8 Comparison of simulated and observed runoff in test set derived from daily runoff model after 175 iterations
差收斂曲線(xiàn)(圖10),發(fā)現(xiàn)在迭代3 100次左右測(cè)試集誤差達(dá)到最小,將迭代3 100次訓(xùn)練出的模型應(yīng)用于訓(xùn)練集、測(cè)試集和整個(gè)數(shù)據(jù)集,得到的精度評(píng)價(jià)指標(biāo)及預(yù)報(bào)曲線(xiàn)如表4、圖11.從表4中可以看出,模型在訓(xùn)練集的相關(guān)性均在0.9以上,偏差在±5%以?xún)?nèi),模擬效果非常好;測(cè)試集R2和NSE分別為0.81和0.74,模擬效果良好;偏差大于±15%,模擬效果很差,原因可能有兩點(diǎn),一是因?yàn)門(mén)RMM降雨數(shù)據(jù)本身的精度較低,另一個(gè)是由于測(cè)試集樣本數(shù)非常少,僅有12個(gè)樣本點(diǎn),因此評(píng)價(jià)指標(biāo)的偶然性很大.從整個(gè)數(shù)據(jù)集來(lái)看,相關(guān)性大于0.9,偏差小于±5%,模型整體表現(xiàn)非常好.從圖11中可以看出,模型對(duì)于徑流峰值的模擬偏低,整體模擬值與實(shí)測(cè)值吻合的較好.

圖10 月徑流模擬模型4 000次迭代后得到的誤差收斂曲線(xiàn)Fig.10 The error convergence curve derived from monthly runoff simulation model after 4 000 iterations

評(píng)價(jià)指標(biāo)訓(xùn)練集測(cè)試集整個(gè)數(shù)據(jù)集R20.930.810.92NSE0.910.740.91Pbias/%1.3618.240.43

圖11 月徑流模擬模型迭代3 100次模擬結(jié)果Fig.11 Comparison of simulated and observed runoff derived from monthly runoff simulation model after 3 100 iterations
在模型精度評(píng)價(jià)方面,Moriasi等[23]在對(duì)大量水文預(yù)報(bào)模型研究的基礎(chǔ)上,針對(duì)模型評(píng)價(jià)指標(biāo)和模型表現(xiàn)性能評(píng)價(jià)提出了一個(gè)統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)(表5),本實(shí)驗(yàn)的日徑流模擬值與實(shí)測(cè)值之間的相關(guān)性指標(biāo)(R2、NSE)均在0.92~0.96之間,百分比偏差均在±5%以?xún)?nèi),模型表現(xiàn)非常好;月徑流模擬值與實(shí)測(cè)值從整個(gè)數(shù)據(jù)集來(lái)看,相關(guān)性大于0.9,偏差小于±5%,模型整體表現(xiàn)非常好.在與現(xiàn)有研究成果對(duì)比方面,李云良等[24]采用分布式水文模型WATLAC為模擬工具對(duì)鄱陽(yáng)湖各子流域進(jìn)行了徑流模擬.朱漫莉[25]等采用系統(tǒng)動(dòng)力學(xué)(SD)方法構(gòu)建了鄱陽(yáng)湖各流域系統(tǒng)中各要素的物理結(jié)構(gòu)和關(guān)系,從而對(duì)徑流進(jìn)行了模擬.表6匯總列出了近幾年研究中各模型在鄱陽(yáng)湖撫河流域的徑流模擬精度及其與本文LSTM的模型對(duì)比.由此可以看出本文利用長(zhǎng)時(shí)間序列數(shù)據(jù)訓(xùn)練出來(lái)的LSTM徑流模擬模型在鄱陽(yáng)湖撫河流域的模擬表現(xiàn)更好,總體精度更高.

表5 水文預(yù)報(bào)模型評(píng)價(jià)指標(biāo)取值范圍及其對(duì)應(yīng)的模型性能評(píng)價(jià)標(biāo)準(zhǔn)

表6 鄱陽(yáng)湖撫河流域各模型徑流模擬精度
長(zhǎng)時(shí)間尺度(如年、季、月)徑流預(yù)報(bào)對(duì)水庫(kù)調(diào)度、河流輸沙、水力發(fā)電和灌溉管理等具有重要的指導(dǎo)意義;實(shí)時(shí)(日、小時(shí))徑流預(yù)報(bào)則對(duì)于洪水預(yù)報(bào)、預(yù)警工作的進(jìn)行有著重要意義.本文基于LSTM長(zhǎng)短期記憶網(wǎng)絡(luò),以地面氣象站觀(guān)測(cè)的日尺度降雨數(shù)據(jù)和TRMM月尺度遙感降雨數(shù)據(jù)為驅(qū)動(dòng)數(shù)據(jù),對(duì)鄱陽(yáng)湖撫河流域的徑流量進(jìn)行了模擬預(yù)報(bào).以相關(guān)系數(shù)R2、納什系數(shù)NSE和百分比偏差Pbias作為精度評(píng)價(jià)指標(biāo)對(duì)模型性能進(jìn)行評(píng)價(jià),其中日、月兩種尺度的R2、NSE在整個(gè)數(shù)據(jù)集上均大于0.9,Pbias均小于±5%,根據(jù)Moriasi提出的評(píng)價(jià)標(biāo)準(zhǔn)來(lái)看均達(dá)到了非常好的程度.日徑流模擬模型樣本數(shù)充足,直接采用按比例的方法對(duì)數(shù)據(jù)集進(jìn)行劃分,結(jié)果顯示訓(xùn)練集和測(cè)試集的模型表現(xiàn)均非常好;月徑流模擬模型由于樣本數(shù)目較少,在測(cè)試集僅有12個(gè)樣本點(diǎn)的情況下模型表現(xiàn)較差,但模型在整個(gè)數(shù)據(jù)集上的表現(xiàn)依然非常好,因此在數(shù)據(jù)集樣本容量較小的情況下采用交叉驗(yàn)證法對(duì)數(shù)據(jù)集進(jìn)行劃分能夠提高模擬精度.上述實(shí)驗(yàn)說(shuō)明兩種尺度的LSTM模型與傳統(tǒng)分布式水文預(yù)報(bào)模型相比計(jì)算成本更低、計(jì)算量更小、精度更高.然而,本實(shí)驗(yàn)僅將降雨數(shù)據(jù)作為模型的影響因子而實(shí)際上徑流量的影響因素眾多,在后續(xù)的研究中可以將卷積神經(jīng)網(wǎng)絡(luò)與LSTM網(wǎng)絡(luò)相結(jié)合,考慮將流域內(nèi)的下墊面信息(如土地利用狀況、土壤特征、地形要素等)納入模型當(dāng)中進(jìn)行綜合評(píng)判,從而能夠充分發(fā)揮兩種網(wǎng)絡(luò)各自的特點(diǎn),實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ).
華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2020年1期