中圖分類號:TV148 文獻(xiàn)標(biāo)識碼:A 文章編號:1001-9235(2025)07-0001-10
Prediction and Analysis of Saltwater Intrusion in Pearl River Estuary Based on Machine Learning
Boheng, ZHANG Jingwen, KANG Zheng*, CHEN Yifan, HUANG Hanliang, LIN Kairong, XIAO Mingzhong (School ofCivil Engineering,Sun Yat-Sen University,Guangzhou51o275,China)
Abstract:Theaccelerationofurbanizationhas inducedasharpincreaseinurban waterconsumption,sothesaltwaterintrusionhas strongerinfluencesondomestic,industrialandagriculturalwateruseinestuarineareas.Toenhancethewatersupplysecurityof coastalcities,itisecssrytoanalyendpredictsaltwaterintrusionTisstudystofurthrinvesgatethifueceofrious factors,includingestuarytidelevel,winddirectionandspeed,andupsreamwaterflow,onthesaltwaterintrusion(chloritynthe estuary)inthePearlRiverestuary,providingscientificsupportforimproving watersuplysecurityincoastalcities.Thestudy determne thelagtimeofdiferentinfluencingfactorsonsaltwaterintrusiontroughcoelationcoeffcntsandconstuctsprdiction modelsforthechloridecontentattheestuariesoftheGuangchangand Pinggang waterpumpingstationsbasedonvarious machine learningmethods toanalyzethesaltwaterintrusioninthe ModaomenwaterwayofthePearlRiverestuary.Thestablishedmodelsshow agodperfomanceinpredictigsalinity.Accordingtotheanalsisofteimportanceofifueningfactors,itisfoundtatustram waterflow hasthegreatest influenceonsaltwater intrusion,followed byestuary tide leveland wind directionandsped.
Keywords: saltwater intrusion;machine learning;Pearl River estuary
磨刀門水道是西江的主要出海口門,其上游西江河段承擔(dān)多座城市的供水任務(wù),對珠江三角洲的區(qū)域水安全有著重要的意義[]。21世紀(jì)以來,隨著城市用水量的急劇上升以及其他多種因素的影響,磨刀門水道的咸潮入侵活動日趨頻繁。咸潮是一種在潮汐作用下的水文現(xiàn)象,這種現(xiàn)象通常由海洋大陸架上的高鹽度水體受到潮汐漲潮等外界影響因素的推動,沿著河道向上移動[2]。當(dāng)鹽水?dāng)U散并與淡水混合后,水團(tuán)便開始向上游推移。咸潮入侵以水體含氯度界定,其臨界值為 250mg/L ○
咸潮災(zāi)害極度影響河口地區(qū)的供水安全。在咸潮上溯時,受影響的地區(qū)難以獲取到可供飲用的水源,這可能導(dǎo)致供水中斷或飲用水質(zhì)量下降,威脅居民的飲水安全;同時也嚴(yán)重影響農(nóng)業(yè)灌溉,降低農(nóng)田的產(chǎn)量和品質(zhì);還會影響工業(yè)生產(chǎn)的用水質(zhì)量和供水穩(wěn)定性,造成生產(chǎn)中斷和經(jīng)濟(jì)損失;此外,咸潮所帶來的社會影響也不可小,咸潮引發(fā)的飲水危機(jī)、農(nóng)業(yè)受災(zāi)等問題會導(dǎo)致社會穩(wěn)定受到影響,同時增加政府的應(yīng)急處置壓力,給當(dāng)?shù)鼐用駧砩罾_和經(jīng)濟(jì)損失。
自20世紀(jì)30年代以來,國內(nèi)外學(xué)者就已經(jīng)開始了對咸潮入侵的研究,研究方法包含現(xiàn)場觀測資料法、物理模型等。以Pritchard、茅志昌等[3-8]為代表的國內(nèi)學(xué)者,就河口海水運(yùn)動的相關(guān)過程、咸潮上溯的時空變化趨勢等問題進(jìn)行了分析。吳門伍、陳榮力等[9-13]學(xué)者通過建立咸潮的物理模型,對影響咸潮的潮汐、徑流等影響因子進(jìn)行了規(guī)律性探究。
隨著計算機(jī)技術(shù)的發(fā)展,數(shù)值模擬的方法逐漸進(jìn)入了研究學(xué)者們的視野。靳高陽、OudeE等[14-19]學(xué)者使用數(shù)值模擬方法對咸潮入侵在地表水、地下水中的影響進(jìn)行了一系列研究。數(shù)值模擬的方法相較于物理模型而言,具有成本較低、能處理復(fù)雜問題、控制與重復(fù)性好等優(yōu)點(diǎn),至今仍是咸潮入侵研究的一種重要方法。
現(xiàn)如今,機(jī)器學(xué)習(xí)、衛(wèi)星遙感、無人機(jī)等新興技術(shù)逐漸涌現(xiàn),這些方法可使未來咸潮入侵研究的數(shù)據(jù)獲取與分析更加高效。劉玥、李昭旭等學(xué)者使用衛(wèi)星高光譜等技術(shù)對咸潮入侵進(jìn)行了鹽度反演研究[20-21];Nguyen等[22-24]學(xué)者利用多種機(jī)器學(xué)習(xí)算法對不同區(qū)域的咸潮入侵中含氯度等要素的變化規(guī)律進(jìn)行了研究。機(jī)器學(xué)習(xí)相比傳統(tǒng)的物理模型而言,不需要過多的先驗(yàn)假設(shè),更依賴于數(shù)據(jù)本身。并且,機(jī)器學(xué)習(xí)能捕捉復(fù)雜的非線性關(guān)系,處理和分析大量多維數(shù)據(jù),進(jìn)而幫助識別影響咸潮的關(guān)鍵因素。
本研究旨在利用機(jī)器學(xué)習(xí)算法對河流含氯度以及其影響因子進(jìn)行分析、建立咸潮預(yù)測模型,為保障枯水期濱海城市供水安全和咸潮入侵時的供水調(diào)度工作提供參考。此外,為提升模型預(yù)測效果,本研究在咸度值預(yù)測模型中加入了前1d咸潮發(fā)生情況作為特征變量,該預(yù)測方法為提升咸潮預(yù)測精準(zhǔn)度提供了思路。
1 研究區(qū)域概況
珠三角地區(qū)經(jīng)濟(jì)發(fā)展迅猛,工業(yè)發(fā)達(dá),在中國的經(jīng)濟(jì)發(fā)展中具有戰(zhàn)略性的重要地位[25]。珠江三角洲地區(qū)河道縱橫交錯,水流相互貫通,經(jīng)磨刀門等八大口門入注南海,形成了“三江匯流,八口出海”的格局。磨刀門年徑流量為923億 m3 ,年輸沙量2314萬t,在整個珠江水系的徑流量及輸沙量中處于舉足輕重的地位。其位于南海之濱,屬亞熱帶季風(fēng)氣候區(qū),在熱帶氣旋的影響下可能引發(fā)暴雨與風(fēng)暴潮,導(dǎo)致洪澇災(zāi)害發(fā)生。汛期的徑流量超過全年徑流量的 70% ,而在枯水期,由于西江上游來水減少,河道徑流量減小,海水上溯,導(dǎo)致境內(nèi)河道出現(xiàn)不同程度的咸度超標(biāo)(含氯度大于等于 250mg/L) ),各取水口均受到了不同程度的咸潮影響
磨刀門水道在2011—2012年枯水期遭遇了極為強(qiáng)烈的咸潮,廣昌泵站、聯(lián)石灣水閘、平崗泵站等5個取水口均出現(xiàn)了咸化現(xiàn)象,超標(biāo)天數(shù)較多。在2000一2023年期間,平崗泵站的咸潮大體呈現(xiàn)增強(qiáng)趨勢,尤其在2011—2012年枯季,平崗泵站連續(xù)22d含氯度超標(biāo),創(chuàng)下了該站有記錄以來最長時間的超標(biāo)記錄。同時,以磨刀門水道為代表的各大口門均出現(xiàn)了咸界的上移。在20世紀(jì)90年代,珠江河口磨刀門的咸潮上溯僅在燈籠山附近出現(xiàn),但現(xiàn)在咸潮線已逐漸擴(kuò)展至神灣(距離燈籠山上移13km, )、大涌口(距離燈籠山上移 16km )、竹銀(距離燈籠山上移 20km ),甚至越過了江門市新會區(qū)大鰲鎮(zhèn)島的北側(cè)頭部(距離燈籠山上移 35km 。枯水期咸水界的上移致使下游取水口受咸潮影響的時間明顯增加。
珠海市主力泵站位于受咸潮影響區(qū)域,再加上三角洲下游地區(qū)地勢平坦,調(diào)咸庫容及能力有限,咸潮入侵已經(jīng)對生產(chǎn)和生活供水造成了很大影響,嚴(yán)重威脅到了珠海、澳門及中山南部地區(qū)的飲用水安全。圖1為研究區(qū)域磨刀門水道以及獲取數(shù)據(jù)的站點(diǎn)位置示意。
圖1數(shù)據(jù)來源站點(diǎn)分布
Fig.1Distributionofdatasourcesites
2 數(shù)據(jù)及研究方法
2.1 數(shù)據(jù)來源
研究采用的影響因子為日平均潮位、日最高最低潮位及日潮差、平均風(fēng)速、最大與極大風(fēng)速及其風(fēng)向(16方位)、馬口及三水站流量、DOY(dayofyear,即指定日期在一年當(dāng)中的位置)。其中,最大風(fēng)速是指在一個既定的時間范圍內(nèi),所有 10min 平均風(fēng)速值中的最大值,即一段時間內(nèi)平均風(fēng)速的最大值;極大風(fēng)速則是指在同一個時間段內(nèi),瞬時風(fēng)速的最大值,即一段時間內(nèi)風(fēng)速的最大瞬間數(shù)值。風(fēng)向采用16方位風(fēng)向作為度量。
以上影響因子的數(shù)據(jù)來源如下:潮位因子數(shù)據(jù)來自燈籠山水文站,風(fēng)向風(fēng)速數(shù)據(jù)來自中山氣象站,上游來水?dāng)?shù)據(jù)取自馬口、三水水文站,河道含氯度數(shù)據(jù)為廣昌、平崗2處泵站數(shù)據(jù)。各站點(diǎn)位置見圖1。
由于磨刀門水道咸潮入侵的主要時段為枯水期(本年10月1日至次年3月31日),豐水期幾乎不存在咸潮問題,磨刀門水道含氯度也長期處于低值,影響因子在該時段對河流含氯度的影響微乎其微,在機(jī)器學(xué)習(xí)模型中可靠性較低,故將該時段數(shù)據(jù)摘除。本研究使用的數(shù)據(jù)為2006—2018年枯水期的日尺度數(shù)據(jù)。
2.2 研究方法
本研究以珠海市磨刀門水道為研究對象,將潮位、風(fēng)速風(fēng)向、上游來水作為咸潮上溯預(yù)測的影響因子探究其與河道含氯度的關(guān)系。同時為了更精確地預(yù)測咸潮,還加入了DOY以及前1d的咸潮上溯是否發(fā)生情況(零一變量)作為特征變量。
研究步驟如下: ① 將影響因子的時間序列進(jìn)行數(shù)據(jù)整合與插補(bǔ),分析含氯度數(shù)據(jù)的逐年趨勢并提取枯水期數(shù)據(jù); ② 通過計算影響因子時間序列在不同滯后階數(shù)下與含氯度時間序列的相關(guān)系數(shù)來判斷不同影響因子的滯后時間,并以所求結(jié)果對參與研究的時間序列進(jìn)行滯后時間的轉(zhuǎn)化; ③ 運(yùn)用多種機(jī)器學(xué)習(xí)算法探究以上影響因子與河口含氯度之間的關(guān)系,建立廣昌、平崗兩處泵站的預(yù)測模型,利用所建立的機(jī)器學(xué)習(xí)模型達(dá)到咸潮的實(shí)時預(yù)測效果; ④ 對所有影響因子進(jìn)行隨機(jī)森林重要性分析排序,分析特征變量添加帶來的重要性排序變化,并明確河口含氯度的主導(dǎo)影響因素。技術(shù)路線見圖2。
本研究主要使用隨機(jī)森林、支持向量機(jī)以及BP神經(jīng)網(wǎng)絡(luò)3種機(jī)器學(xué)習(xí)方法對咸潮發(fā)生情況及咸度水平進(jìn)行模型訓(xùn)練并預(yù)測,以上3種方法廣泛應(yīng)用于諸多領(lǐng)域,包括金融預(yù)測、自然語言處理、醫(yī)學(xué)診斷、圖像識別等,均具有完成分類與回歸任務(wù)的能力。
隨機(jī)森林算法是一種基于決策樹的集成學(xué)習(xí)技術(shù),它通過采用bagging(即有放回的隨機(jī)抽樣)策略來構(gòu)建多個決策樹模型。這些模型共同構(gòu)成了隨機(jī)森林,每個決策樹都映射了數(shù)據(jù)屬性與目標(biāo)值之間的關(guān)系。在訓(xùn)練過程中,每個決策樹都是在數(shù)據(jù)集的隨機(jī)子集上獨(dú)立訓(xùn)練的,這種訓(xùn)練方式增強(qiáng)了模型的泛化能力。決策樹的構(gòu)建目標(biāo)是基于信息熵的最小化,模擬人類決策過程。
圖2技術(shù)路線
Fig.2Technical route
隨機(jī)森林的訓(xùn)練步驟如下:首先,從含有 N 個樣本的訓(xùn)練集中有放回地抽取 M 個樣本,重復(fù)這一過程 K 次,形成 K 個不同的子數(shù)據(jù)集;接著,基于這些子數(shù)據(jù)集分別訓(xùn)練K個決策樹模型;在預(yù)測階段,這些模型會獨(dú)立進(jìn)行預(yù)測,并通過平均(回歸問題)或投票(分類問題)的方式綜合各模型的預(yù)測結(jié)果,得出最終預(yù)測。
支持向量機(jī)(SupportVectorMachine,SVM)是一種強(qiáng)大的監(jiān)督學(xué)習(xí)算法,適用于分類和回歸任務(wù)。SVM的核心在于尋找一個最優(yōu)的超平面,以最大間隔分隔不同類別的數(shù)據(jù)點(diǎn)。在處理線性可分?jǐn)?shù)據(jù)時,SVM旨在最大化數(shù)據(jù)點(diǎn)之間的間隔,確保分類邊界的穩(wěn)健性。對于非線性問題,SVM通過核技巧將數(shù)據(jù)映射到更高維的空間,以便于找到線性分隔的超平面。SVM的特點(diǎn)包括高效處理高維數(shù)據(jù)、通過核函數(shù)學(xué)習(xí)非線性決策邊界,以及通過最大化間隔實(shí)現(xiàn)良好的泛化能力。由于SVM的優(yōu)化目標(biāo)為凸優(yōu)化問題,它能保證找到全局最優(yōu)解。
BP(反向傳播)神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),由Rumelhart和McClelland等科學(xué)家于1986年提出。BP神經(jīng)網(wǎng)絡(luò)能夠處理復(fù)雜的非線性問題,但其訓(xùn)練過程可能耗時較長,且容易陷入局部最優(yōu)解。網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、一個或多個隱含層以及輸出層。網(wǎng)絡(luò)的學(xué)習(xí)過程依賴于前向傳播和反向傳播2個階段。在前向傳播階段,輸入數(shù)據(jù)通過網(wǎng)絡(luò)逐層傳遞,最終產(chǎn)生輸出;在反向傳播階段,BP神經(jīng)網(wǎng)絡(luò)將計算輸出誤差,并通過鏈?zhǔn)椒▌t將誤差分配到各層權(quán)重上,進(jìn)而調(diào)整權(quán)重以最小化誤差。
在咸潮入侵預(yù)測中,隨機(jī)森林和SVM在處理小樣本數(shù)據(jù)上表現(xiàn)穩(wěn)健,而BP神經(jīng)網(wǎng)絡(luò)則更依賴海量數(shù)據(jù)的輸人。另外,所獲取的數(shù)據(jù)通常具有非線性、不平衡的特點(diǎn)。3種算法均能較好地應(yīng)對非線性問題。而面對不平衡數(shù)據(jù)時,隨機(jī)森林使用過采樣或欠采樣的方法調(diào)整數(shù)據(jù)分布,或者通過調(diào)整決策樹的權(quán)重來增強(qiáng)對少數(shù)類的關(guān)注;SVM通過調(diào)整懲罰參數(shù)C,為少數(shù)類賦予更高的權(quán)重;BP神經(jīng)網(wǎng)絡(luò)則會使用數(shù)據(jù)預(yù)處理技術(shù)如SMOTE算法,或在網(wǎng)絡(luò)設(shè)計中引入類別權(quán)重。因而使用以上3種算法解決咸潮入侵預(yù)測的問題具有可行性。
3 結(jié)果與分析
3.1咸潮變化趨勢及影響因子相關(guān)性分析
對所得的含氯度數(shù)據(jù)(2006年1月至2022年12月)進(jìn)行統(tǒng)計分析,繪制2006一2022年超標(biāo)日數(shù)(一年當(dāng)中咸度超標(biāo)的日數(shù))、年平均咸度的變化見圖3。
由圖3可知,由于廣昌泵站地理位置相較平崗泵站更接近河口,故其含氯度水平以及咸度超標(biāo)日數(shù)均高于平崗泵站。2處泵站的超標(biāo)日數(shù)在2006—2022年均呈現(xiàn)先下降后增長的大體趨勢,由于2015—2016年枯水期來水量較大,故此時段磨刀門水道受咸潮影響最小。2015年以來,咸潮的影響又在逐步加大,年平均含氯度不斷攀升,這與日漸增長的需水量有著不可分割的聯(lián)系,同時超標(biāo)日數(shù)的增加也代表著咸水界的上移。
3.2咸潮與各驅(qū)動因子相關(guān)性分析
在研究咸潮與影響因子間關(guān)系時,由于獲取影響因子數(shù)據(jù)的站點(diǎn)所處地理位置存在差異,故需考慮各站點(diǎn)影響因子對河流含氯度影響存在的滯后時間。為了達(dá)到更好的模型訓(xùn)練效果,需要分析推求含氯度對影響因子的響應(yīng)時間,進(jìn)行時間序列的轉(zhuǎn)化。
圖32006一2022年廣昌、平崗泵站咸度超標(biāo)日數(shù)、年平均咸度變化
Fig.3 Changes in annual average salinity and number of days with excessive salinityat Guangchang andPinggangwaterpumpingstationsfrom2oo6to2022
斯皮爾曼相關(guān)系數(shù)(TheSpearman’srankcoefficientofcorrelation),是秩相關(guān)的一種非參數(shù)度量。其得名于英國統(tǒng)計學(xué)家Charles Spearman,而斯皮爾曼相關(guān)系數(shù)常用 ρ 來表示。斯皮爾曼相關(guān)系數(shù)的計算公式見式(1):
式中: di 為第 i 組對應(yīng)數(shù)據(jù)的位次值之差; n 為總觀測樣本數(shù)。
對于本研究所涉及的滯后時間計算,考慮到影響因子與含氯度數(shù)據(jù)之間的關(guān)系并不一定為線性關(guān)系,同時也存在一些由于極端天氣或測量誤差導(dǎo)致的異常值,因此選用Spearman相關(guān)系數(shù)對所有影響因子數(shù)據(jù)及含氯度數(shù)據(jù)進(jìn)行分析。對處理完成的各影響因子及咸潮數(shù)據(jù)進(jìn)行斯皮爾曼相關(guān)系數(shù)計算,當(dāng)影響因子與不同滯后時間的日均含氯度間Spearman相關(guān)系數(shù)絕對值達(dá)到最大時,即將此滯后時間作為該影響因子與日均含氯度的滯后時間[21]研究所使用的數(shù)據(jù)均為日尺度數(shù)據(jù),故滯后時間研究范圍設(shè)為日,計算范圍為 0~7d 。由于DOY不具有時間滯后性,故不考慮其滯后效應(yīng)。通過計算匯總得到廣昌、平崗泵站日均含氯度對各影響因子的
滯后響應(yīng)時間見表1。
分析影響因子滯后時間推算結(jié)果,考慮到潮位因子在咸潮上溯過程中的傳播方向會發(fā)生改變,在咸潮上溯時潮位因子可視為向上游傳播,在咸潮退去時潮位因子可視為向下游傳播,故所得結(jié)果應(yīng)為枯水期潮位因子滯后時間的平均水平,可認(rèn)為潮位因子滯后時間偏大的結(jié)果合理。對于滯時應(yīng)用后影響因子與泵站含氯度的相關(guān)系數(shù),潮位因子與徑流因子大多呈現(xiàn)出負(fù)相關(guān),與流量增大、潮位上漲后鹽分得以稀釋的原理相符;而風(fēng)因子與含氯度間相關(guān)性的正負(fù)則無明顯規(guī)律。
3.3咸潮預(yù)測及驗(yàn)證
根據(jù)所得滯后時間將其應(yīng)用于影響因子時間序列中,并以 250mg/L 為界限判斷咸潮上溯發(fā)生情況,建立零一變量列(其中1為發(fā)生咸潮,0為不發(fā)生)。以影響因子為特征變量,廣昌、平崗泵站日均含氯度為預(yù)測因子分別使用隨機(jī)森林、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)3種機(jī)器學(xué)習(xí)方法進(jìn)行分類模型訓(xùn)練,其中訓(xùn)練集占總數(shù)據(jù) 80% ,測試集占 20% ,在經(jīng)過網(wǎng)格搜索對參數(shù)進(jìn)行依次調(diào)優(yōu)后,所得最優(yōu)參數(shù)見表2,其中隨機(jī)森林分類模型的決策樹個數(shù)n_estimators ;支持向量機(jī)預(yù)測時選擇輸出概率而非類別;BP神經(jīng)網(wǎng)絡(luò)設(shè)置一個隱藏層,包含50個神經(jīng)元,激活函數(shù)使用ReLU,求解器使用adam,最大迭代次數(shù)設(shè)為500次。經(jīng)訓(xùn)練,所得廣昌、平崗泵站模型ROC曲線見圖4。
表1廣昌、平崗泵站影響因子滯后時間推算結(jié)果
Tab.1Calculationresultsof lag timeof influencingfactors inGuangchangandPinggangwaterpumpingstations
表2機(jī)器學(xué)習(xí)分類模型參數(shù)設(shè)置
Tab.2Parameter settings for machine learning
圖4廣昌、平崗泵站分類模型ROC曲線 Fig.4ROCcurvesofclassificationmodelsfor Guangchangand Pinggangwaterpumpingstations
通過分析廣昌、平崗泵站6個模型的ROC曲線可知,曲線均靠近左上方,且AUC值均達(dá)到了0.94以上,可認(rèn)為模型擬合效果良好,對咸潮入侵發(fā)生情況的預(yù)測準(zhǔn)確度較高。可認(rèn)為3種機(jī)器學(xué)習(xí)方法對咸潮入侵發(fā)生情況的預(yù)測均較好。
在使用分類模型訓(xùn)練得到咸潮人侵發(fā)生情況后,本研究通過隨機(jī)森林、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)建立回歸模型進(jìn)行了咸度水平的預(yù)測,其中訓(xùn)練集占總數(shù)據(jù) 80% ,測試集占比 20% 。在經(jīng)過網(wǎng)格搜索對參數(shù)進(jìn)行依次調(diào)優(yōu)后,所得最優(yōu)參數(shù)見表3,其中隨機(jī)森林分類模型的決策樹個數(shù)n_estimators=200,決策樹最大深度為15;支持向量機(jī)預(yù)測時選擇輸出概率而非類別,核函數(shù)使用rbf,核函數(shù)系數(shù)gamma設(shè)置為1,懲罰參數(shù)設(shè)置為10000;BP神經(jīng)網(wǎng)絡(luò)設(shè)置2個隱藏層,第一個包含100個神經(jīng)元,第二個包含50個神經(jīng)元,激活函數(shù)使用ReLU,求解器使用adam,最大迭代次數(shù)設(shè)為10000次。經(jīng)訓(xùn)練,繪制了自2016年12月13日至2019年3月31日間枯水期473d的廣昌、平崗泵站回歸模型咸度實(shí)際值vs預(yù)測值散點(diǎn)見圖5。
表3機(jī)器學(xué)習(xí)回歸模型參數(shù)設(shè)置
Tab.3Parametersettingsformachine learning regression
為提升預(yù)測效果,本研究將前1d咸潮的發(fā)生情況對應(yīng)當(dāng)前日的河流含氯度,將其作為影響因子加入模型訓(xùn)練當(dāng)中。經(jīng)訓(xùn)練,繪制了廣昌、平崗泵站回歸模型咸度實(shí)際值vs預(yù)測值散點(diǎn)及咸度預(yù)測值vs實(shí)際值時間序列散點(diǎn)見圖6、7。
圖5廣昌、平崗泵站咸度預(yù)測值vs實(shí)際值散點(diǎn) Fig.5Scatterplotof predictedandmeasured salinity valuesat Guangchang and Pinggangwaterpumping stations
在咸度實(shí)際值vs預(yù)測值的散點(diǎn)圖中,1:1直線(黑色實(shí)線)代表實(shí)際值與預(yù)測值相等,即預(yù)測精準(zhǔn)無誤差的情況。故在此散點(diǎn)圖中,點(diǎn)越接近1:1直線則代表模型預(yù)測效果越優(yōu)秀。由圖6、7可知,基于廣昌、平崗泵站含氯度數(shù)據(jù)所訓(xùn)練的回歸模型預(yù)測結(jié)果較好。對比圖5的訓(xùn)練結(jié)果,前1d咸潮發(fā)生情況的加入使得大部分模型的效果得到提升。另外,相較于平崗泵站結(jié)果圖,廣昌泵站的散點(diǎn)數(shù)據(jù)量級較大,其產(chǎn)生的bias值也相應(yīng)更大。對不同的機(jī)器學(xué)習(xí)算法而言,隨機(jī)森林算法訓(xùn)練結(jié)果為最優(yōu),支持向量機(jī)為次,而BP神經(jīng)網(wǎng)絡(luò)由于其算法特性,所需數(shù)據(jù)量較為龐大,在平崗泵站的模型訓(xùn)練中表現(xiàn)相較其他算法較差。總而言之,模型訓(xùn)練效果優(yōu)良,可認(rèn)為其具有一定的咸潮上溯預(yù)測能力。
圖7廣昌、平崗泵站咸度預(yù)測值vs實(shí)際值時間序列散點(diǎn)(包含咸潮發(fā)生情況)
3.4特征重要性分析
進(jìn)行以上模型訓(xùn)練后,對各參與訓(xùn)練的特征變量進(jìn)行了特征重要性分析。通過隨機(jī)森林特征重要性分析,輸出所建模型的特征重要性排序見圖8,其中紅色為非自然因素,黃色為流量因子,藍(lán)色為潮位因子,綠色為風(fēng)因子,GCbinary、PGbinary為廣昌、平崗泵站前1d咸潮發(fā)生情況的零一變量列。
本研究在計算滯后時間的步驟當(dāng)中,對影響因子與含氯度時間序列之間的相關(guān)系數(shù)進(jìn)行了計算。將相關(guān)系數(shù)按絕對值大小依次排序繪制得圖9,其中GCbinary、PGbinary含義同上。
由2種方法所得排序結(jié)果可知,2種方法重要性排序結(jié)果存在差異,這主要來源于重要性分析的原理不同。相關(guān)系數(shù)排序法主要衡量變量之間的線性或單調(diào)關(guān)系,對于非線性關(guān)系的捕捉能力有限;同時,其只考慮2個變量之間的關(guān)系,不能考慮多個變量之間的交互作用;而且計算相對簡單,結(jié)果易于解釋。而隨機(jī)森林重要性分析通常基于平均不純度減少(考察特征對不純度減少的貢獻(xiàn))和平均準(zhǔn)確率減少(考察特征對準(zhǔn)確率減少的貢獻(xiàn))2種方法,其能夠處理非線性關(guān)系和高維數(shù)據(jù),具有較好的泛化能力,同時也能考慮多個變量間的交互作用,捕捉復(fù)雜關(guān)系。
圖8廣昌、平崗泵站隨機(jī)森林特征重要性排序 Fig.8Feature importancerankinginrandomforest for Guangchang and Pinggang water pumping stations
圖9廣昌、平崗泵站影響因子相關(guān)系數(shù)排序 Fig.9Correlationcoefficientsof influencingfactors ranking for Guangchang and Pinggang water pumping stations
2種不同方法得出的重要性排序結(jié)果雖有所差異,但大致呈現(xiàn)了相似的結(jié)果。前1d咸潮入侵發(fā)生的情況對于模型的影響幾乎最大;刨除非自然因素,影響因子對河口含氯度的貢獻(xiàn)程度排序依次為徑流因子 gt; 潮位因子 gt; 風(fēng)因子。前1d咸潮入侵發(fā)生情況以及DOY的加入,使得隨機(jī)森林的重要性排序受到了一定影響。對所研究的自然影響因子而言,其對河口含氯度的影響程度的排序?yàn)閺搅鱣t;潮位gt;風(fēng)向風(fēng)速,可以認(rèn)為徑流是咸潮上溯的主導(dǎo)影響因素。
4結(jié)論
本研究基于統(tǒng)計學(xué)中的斯皮爾曼相關(guān)性分析,推求出珠江河口磨刀門水道區(qū)域廣昌、平崗泵站2處地點(diǎn)的河流含氯度與附近站點(diǎn)河流潮位、風(fēng)向風(fēng)速、上游來水流量之間的滯后時間,并使用隨機(jī)森林、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)3種機(jī)器學(xué)習(xí)方法建立了相應(yīng)的咸潮預(yù)測模型,得到了各影響因子與河口日均含氯度的關(guān)系。在咸潮發(fā)生情況的預(yù)測中,3種算法所得結(jié)果均良好,而在咸度水平的預(yù)測中,隨機(jī)森林算法表現(xiàn)了最高的精確度。同時,本研究對影響因子分別進(jìn)行了斯皮爾曼相關(guān)系數(shù)排序以及隨機(jī)森林重要性分析,得出影響河口含氯度的主導(dǎo)影響因素為上游來水流量。
此外,研究對咸潮的發(fā)生情況以及咸度值分別進(jìn)行了預(yù)測,將前1d咸潮入侵發(fā)生情況作為特征變量加入咸度值的預(yù)測模型當(dāng)中,提升了模型的預(yù)測效果。該方法同時考慮了取水口是否能取水的問題以及具體的咸度水平,通過建立機(jī)器學(xué)習(xí)分類和回歸模型,為咸潮上溯的預(yù)測提供了更全面的信息。運(yùn)用該預(yù)測方法,可以為枯水期的供水調(diào)度給予一定指引,為維護(hù)咸潮災(zāi)害影響區(qū)域的水安全作出貢獻(xiàn)。
參考文獻(xiàn):
[1]盧鵬宇,林凱榮,楊裕桂,等.基于多模型集成的月尺度磨刀門咸潮預(yù)測研究[J].人民珠江,2020,41(10):1-5,29.
[2] 梁靖習(xí),徐龔文,張蔚,等.西北江徑流量變化對感潮河口咸潮上溯的影響[J].科學(xué)技術(shù)與工程,2024,24(7):2893-2900.
[3] PRITCHARDD W.Salinity distribution and circulationin theChesapeake Bay Estuarine System[J]. Marine Research,1952(11):106-123.
[4] IPPENAT,HARLEMAN DRF.One-dimensional analysisofsalinityintrusioninestuariesM].WaterwaysExperimentStation,1961.
[5]SIMMONS H B,BROWN F R. Salinity effects on estuarinehydraulics and sedimentation[C]//kyoto: Intermational AssocationforHydro Environment,1969:311-325.
[6] DYERKR. Estuaries and estuarine sedimentation[J].EstuarineHydrographyand Sedimentation,1979:1-18.
[7] MOLLOWNEY B M. Physical oceanography of estuaries(andassociatedcoastalwater)[M].NewYork:Wiley,1976.
[8] 沈煥庭,茅志昌,朱建榮.長江河口鹽水入侵[M].北京:海洋出版社,2003.
[9] 吳門伍,盧陳,高時友,等.鹽水楔運(yùn)動水槽試驗(yàn)研究[J].人民珠江,2012,33(S1):49-51.
[10]劉志敏,黃國如,高時友.珠江河口壓咸補(bǔ)淡枯季調(diào)水的物理模型研究[J].人民珠江,2009,30(2):27-28,48.
[11]張朋.徑流和潮汐作用下的河口鹽水入侵機(jī)理實(shí)驗(yàn)研究[D].:華南理工大學(xué),2017.
[12]陳榮力,盧陳,蘇波,等.磨刀門咸潮物理模型試驗(yàn)-I模型設(shè)計與驗(yàn)證[J].人民珠江,2012,33(S1):28-32.
[13]林中源,黃鵬飛,呂超寅,等.珠江河口磨刀門水道枯季咸潮預(yù)報模型研究[J].中國防汛抗旱,2023,33(6):20-24.
[14]靳高陽,朱三華,曹一豪.西北江三角洲河床變化對咸潮上溯影響的數(shù)值模擬研究[J].人民珠江,2024,45(3):89-98.
[15]周榮香,季小梅,張蔚,等.珠江河口河網(wǎng)咸潮上溯機(jī)制的數(shù)值模擬[J].水運(yùn)工程,2021(6):33-41.
[16]欒華龍,柯科騰,葛建忠,等.長江口規(guī)劃工程影響下的咸潮入侵?jǐn)?shù)值模擬[J].海洋科學(xué)進(jìn)展,2018,36(4):525-539.
[17]LIFL,CHEN XQ,LIUCH,etal.Laboratory tests andnumerical simulationson the impact ofsubsurface barrierstosaltwaterintrusion[J].Natural Hazards,2018,91:1223-1235.
[18]CHANGYW,HUBX,XUZX,etal.Numerical simulation ofseawater intrusion to coastal aquifersand brine water/freshwaterinteraction insouth coast ofLaizhou Bay,China[J].Journal ofContaminantHydrology,2018,215:1-10.
[19]OUDE ESSINK G H P.Salt water intrusion in a three-dimensional groundwater systemin theNetherlands:anumericalstudy[J].Transport inPorousMedia,2001,43:137-158.
[20]劉玥,梁銘聰,梁穎珊,等,基于空-天-地高光譜的感潮河道水體鹽度監(jiān)測方法研究[J].水電與新能源,2023,37(12):35-39.
[21]李召旭,黃偉杰,王建國,等.“3S\"技術(shù)在生態(tài)環(huán)境監(jiān)測中的應(yīng)用研究[C]//中國水利學(xué)會.中國水利學(xué)會2021學(xué)術(shù)年會論文集第三分冊.
[22]NGUYENTG,TRANNA,VUPL,etal.Salinityintrusionprediction using remote sensing and machine learning in data-limited regions:A case study in Vietnam's Mekong Delta[J].Geoderma Regional,2021.DOI:10.1016/j.geodrs.2021.e00424.
[23]TRANTT,PHAMNH,PHAMQB,etal.Performancesofdifferent machine learning algorithms for predicting saltwaterintrusionin the vietnamese mekong delta using limited input data:astudy fromHamLuongRiver[J].WaterResources,2022,49(3):391-401.
[24]EL BILALIA,TALEBA,NAFII A,etal.Prediction of sodiumadsorption ratio and chloride concentration in a coastal aquiferunderseawater intrusion using machine learning models [J].Environmental Technologyamp;Innovation,2021,23.DOI:10.1016/j.eti.2021.10164.
[25]位帥,黃宇銘,林凱榮,等.磨刀門水道咸潮演變規(guī)律及咸界變化分析[J].中國農(nóng)村水利水電,2025(2):88-96
(責(zé)任編輯:李澤華)